·

Administração ·

Métodos Quantitativos Aplicados

Send your question to AI and receive an answer instantly

Ask Question

Preview text

17082015 1 Métodos Quantitativos em Processos Decisórios ANOVA 1 fator Prof André Wakamatsu UNIVERSIDADE PRESBITERIANA MACKENZIE CCSA Centro de Ciências Sociais e Aplicadas ANOVA 1 fator análise paramétrica Comparando 3 ou mais médias Condições necessárias para a ANOVA Exemplo Teste H de KruskalWallis não paramétrico ANOVA para 2 ou mais fatores ANOVA 17082015 2 O nível de significância é a probabilidade de cometermos um erro do Tipo I quando a hipótese nula é verdadeira ANOVA Erros e conclusões corretas no teste de hipóteses Situação da População Ho verdadeira H1 verdadeira Não Rejeitar Ho Conclusão correta Erro do Tipo II Rejeitar Ho Erro do tipo I Conclusão correta N de grupos 1 ou 2 2 Testet Normal Normal Testes não paramétricos ANOVA Testes não paramétricos Ho μ1 μ2 Ho μ1 μ2 μ3 sim sim não não 17082015 3 Analysis of Variance I Ou oneway ANOVA Há uma única variável Comparação entre 3 ou mais amostras de populações independentes ANOVA 1 fator A análise de variância de um fator é uma extensão do teste t Aplicase a análise de variância para determinar se há diferenças significativas entre duas ou mais populações Analysis of Variance Porque o nome ANOVA se a hipótese é sobre as médias ANOVA 17082015 4 De um modo geral Calculase a soma dos quadrados dos desvios total entre grupos fatores e dentro de cada fator SQT SQD SQE Calculase as variâncias SQ gl Calculase F Var E Var D Fcalculado Ftabelado rejeitase Fcalculado Ftabelado não rejeitase Por causa dos cálculos queas médias são diferentes concluindo se H rejeita F F se Tab cal 0 FTab 1 n k k F k nº de amostras n Tamanho de cada amostra Dentro Amostras Variância Entre as Amostras Variância O pressuposto de Igualdade da Variância das Populações é estimado pela razão entre a Variabilidade das Médias Amostrais QME e a Média das Variâncias Amostrais QMR H0 R E k n SQ k SQ cal QM QM F R E 1 2 R 2 E S S 17082015 5 N x x SQ k i n j ij k i n j ij T 1 1 2 1 1 2 N x n x SQ k i n j ij k i n j ij E 1 1 2 1 1 2 E T R SQ SQ SQ n1 SQT Total SQRgl nk SQR Dentro SQEgl k1 SQE Entre FCAL QM gl SQ Tabela ANOVA Uma corporação está interessada em possíveis diferenças nos dias trabalhados pelos empregados assalariados em três departamentos na área financeira Um levantamento com 23 empregados foi escolhido ao acaso Devido à metodologia de amostra casual desse levantamento os tamanhos de amostras são desiguais É possível afirmar que não há diferenças significativas entre os 3 departamentos Exemplo 17082015 6 Podemos fazer uma avaliação visual através do Boxplot No SPSS 13 GraphsBoxplotSimpleSummaries for Group of casesDefine No SPSS 15 GraphsLegacy DialogsBoxplot Selecionar Simple No SPSS 17 GraphsLegacy DialogsBoxplot Selecionar Simple Clicar em Define ANOVA 1 fator Estando desmarcado os casos extremos observação atípica ou outliers serão identificados pelo número linha Variável cuja média queremos comparar Variável que formará os grupos nominal ou ordinal 17082015 7 E onde entra a ANOVA Graficamente pudemos avaliar as diferenças entre os grupos mas devemos atribuir essas diferenças aos erros de amostragem ou são diferenças genuínas entre os grupos ANOVA 1 fator 17082015 8 Análise de Variância métrica não métrica As hipóteses que testaremos são Ho μ1 μ2 μn H1 pelo menos a média de uma das populações é diferente das demais Xn X X X Y 3 2 1 1 Condições necessárias para resultados confiáveis 1 Para cada população a variável de resposta está normalmente distribuída 2 A variância da variável de resposta é idêntica para todas as populações 3 As observações devem ser independentes ANOVA 1 fator 17082015 9 O teste KolmogorovSmirnov e o teste de Assimetria e Curtose avaliam se há um desvio significante da normalidade na distribuição da população AnalyzeDescriptive StatisticsExplore Normalidade Normalidade 17082015 10 Normalidade Não rejeitamos a Ho de que a distribuição seja normal Sig 005 Usado quando n 50 Normalidade 01250913 01369 11372000 05685 01100687 01601 08621334 06462 02610752 03471 11661481 07873 17082015 11 Ainda temos que verificar se essa condição é atendida Faremos junto com a ANOVA AnalyzeCompare MeansOneWay ANOVA Homogeneidade da variância 17082015 12 Homogeneidade da variância Não rejeitamos a Ho de que as variâncias sejam iguais ANOVA 1 fator Não rejeitamos a Ho de que Todas as médias sejam iguais Para 5 não rejeitamos que não há diferenças significativas mas é para 10 Pelo menos uma das médias é diferente 17082015 13 Mas μ1 μ2 Ou μ1 μ3 Ou μ2 μ3 ANOVA 1 fator Há vários testes posthoc que examinam quais médias são diferentes umas das outras O teste da Diferença honestamente significante de Tukey é o mais usado AnalyzeCompare MeansOneway ANOVAPost Hoc ANOVA 1 fator 17082015 14 ANOVA 1 fator 17082015 15 Tente com LAZERSAV A idade média varia de cidade para cidade ANOVA 1 fator 17082015 16 ANOVA 1 fator A variável cidade está definida como string e nem aparece na lista Precisamos codificála para poder fazer a análise Tente A transformação da variável alfanumérica string para uma variável codificada é feita da seguinte forma TransformAutomatic Recode ANOVA 1 fator 17082015 17 ANOVA 1 fator É criada uma nova variável Neste exemplo a variável cidade assumia os valores Brasilia Rio de Janeiro e São Paulo A variável CidadeNum assumirá os valores 1 2 e 3 Cuidado Rio de Janeiro RIO DE JANEIRO Serão gerados dois códigos A homogeneidade das variâncias pode ser avaliada junto com a ANOVA Voltando à aplicação da ANOVA AnalyzeCompare MeansOneWay ANOVA ANOVA 1 fator 17082015 18 Agora podemos usar a variável CidadeNum na ANOVA Selecionar o teste de homogeneidade da variância Primeiro devemos verificar a normalidade AnalyzeDescriptive StatisticsExplorePlots ANOVA 1 fator Tests of Normality 151 31 071 880 31 002 Idade dos Entrevistados Statistic df Sig Statistic df Sig KolmogorovSmirnova ShapiroWilk Lilliefors Significance Correction a Rejeitamos a Ho de que A suposição de normalidade não foi atendida isto é um problema que torna questionável o resultado da análise 17082015 19 ANOVA 1 fator ANOVA Idade dos Entrevistados 237844 2 118922 924 409 3602027 28 128644 3839871 30 Between Groups Within Groups Total Sum of Squares df Mean Square F Sig Test of Homogeneity of Variances Idade dos Entrevistados 2069 2 28 145 Levene Statistic df1 df2 Sig Não rejeito Não rejeito que as idades médias são iguais E o teste Post Hoc de Tukey ANOVA 1 fator Não rejeito igualdade das médias Zero está dentro do intervalo de confiança 17082015 20 ANOVA 1 fator Idade dos Entrevistados 7 2443 8 2813 16 3131 411 7 2443 8 2813 16 3131 444 Cidade dos Entrevistados Brasília Rio de Janeiro São Paulo Sig Brasília Rio de Janeiro São Paulo Sig Tukey HSDab Scheffeab N 1 Subset for alpha 05 Means for groups in homogeneous subsets are displayed Uses Harmonic Mean Sample Size 9081 a The group sizes are unequal The harmonic mean of the group sizes is used Type I error levels are not guaranteed b Um grupo homogêneo Remédios Quando a normalidade não é atendida HAIR Jr et al p 81 2005 indicam algumas transformações nos dados que podem nos ajudar p ex Achatamento usar a inversa 1X Assimetria usar raiz quadrada logaritmo ou a inversa ANOVA 1 fator Usar estatística nãoparamétrica Teste H de KruskalWallis 17082015 21 N de grupos 1 ou 2 2 Testet Normal Normal Testes não paramétricos ANOVA Testes não paramétricos Ho μ1 μ2 Ho μ1 μ2 μ3 sim sim não não Teste H de KruskalWallis Analyze Non parametric tests K Independent Samples 17082015 22 Teste H de KruskalWallis Rejeito a hipótese de igualdade das medianas Teste H de KruskalWallis Não rejeito a hipótese de igualdade das medianasmédias 17082015 23 Remédios Quando a homogeneidade da variância não é atendida podemos Usar as estatísticas de BrownForsythe ou Welch Escolher a análise PostHoc própria para estes casos ANOVA 1 fator ANOVA 1 fator Usados quando as variâncias entre os grupos não são iguais 17082015 24 ANOVA 1 fator Rejeito a hipótese de igualdade das médias Remédios Quando a homogeneidade da variância não é atendida podemos usar as estatísticas de BrownForsythe ou Welch e escolher a análise PostHoc própria para estes casos ANOVA 1 fator 17082015 25 N de grupos 1 ou 2 2 Testet Normal Normal Testes não paramétricos ANOVA Testes não paramétricos Ho μ1 μ2 Ho μ1 μ2 μ3 sim sim não não 17082015 26 Refazer a análise usando teste robusto Welch ou BrownForsythe Variância homogênea ANOVA Analisar tabela ANOVA sim não Sig Rejeitar Ho μ1 μ2 μ3 Testes posthoc Médias iguais não sim Variância homogênea Teste de Tamhane não Teste de Tukey sim Assimetria Curtose 0387 0761 2742 3724 Divisão Exercício 1 Com o objetivo de avaliar os melhores instrumentos de promoção 18 cursos de uma instituição de ensino foram divididos em dois grupos O primeiro deles foi divulgado por meio de folders e posters e o segundo por meio de maladireta Justifique se houve diferença significativa entre o volume de vendas para os dois grupos Descriptive Statistics 10 978000 1599861 266 687 1015 1334 8 1185000 3594440 2062 752 4968 1481 8 Grupo 1 Grupo 2 Valid N listwise Statistic Statistic Statistic Statistic Std Error Statistic Std Error N Mean Std Deviation Skewness Kurtosis O grupo 2 apresenta os valores fora do intervalo de 2 a 2 podese considerar que não segue uma distribuição normal O grupo 1 apresenta os valores dentro do intervalo de 2 a 2 podese considerar que segue uma distribuição normal Como uma das variáveis não é normal optase por usar um método não paramétrico 17082015 27 Independent Samples Test 1363 260 1639 16 121 20700 12632 6079 47479 1513 9215 164 20700 13678 10133 51533 Equal variances assumed Equal variances not assumed Vendas F Sig Levenes Test for Equality of Variances t df Sig 2tailed Mean Difference Std Error Difference Lower Upper 95 Confidence Interval of the Difference ttest for Equality of Means Ranks 8 1175 9400 10 770 7700 18 Grupo 1 2 Total Vendas N Mean Rank Sum of Ranks Test Statisticsb 22000 77000 1601 109 122 a MannWhitney U Wilcoxon W Z Asymp Sig 2tailed Exact Sig 21tailed Sig Vendas Not corrected for ties a Grouping Variable Grupo b Como as variáveis não seguem uma distribuição normal esta tabela não será utilizada O Sig do teste de MannWhitney 0109 é maior do que Sig0109 5 indicando que a as variáveis podem ser consideradas estatisticamente iguais Sendo assim não há diferenças significativas entre o volume de vendas para os dois grupos Exercício 2 Ao enfrentar o custo crescente do uso de fax uma empresa emitiu uma norma em que as transmissões de dez ou mais páginas devem ser enviadas por correio normal que leva dois dias para ser entregue São permitidas algumas exceções mas eles querem uma medida de tendência central média ou mediana de dez ou abaixo A empresa examinou 35 transmissões de faxes escolhidas ao acaso durante o ano Considerando um nível de significância de 5 justifique se se pode afirmar que a norma foi cumprida durante o ano Dica verifique qual o teste a ser utilizado e compare a medida de tendência central com o valor fornecido Tests of Normality 149 35 048 922 35 017 Fax Statistic df Sig Statistic df Sig KolmogorovSmirnova ShapiroWilk Lilliefors Significance Correction a Como n50 usase o teste de normalidade de SW e concluise que a variável não segue uma distribuição normal Sig 0017 005 17082015 28 OneSample Test 1590 34 121 543 39 147 Fax t df Sig 2tailed Mean Difference Lower Upper 99 Confidence Interval of the Difference Test Value 10 Binomial Test 10 19 54 50 736a 10 16 46 35 100 Group 1 Group 2 Total Fax Category N Observed Prop Test Prop Asymp Sig 2tailed Based on Z Approximation a Como as variáveis não seguem uma distribuição normal esta tabela não será utilizada O Sig do teste de Binomial 0736 é maior do que Sig0736 5 indicando que a as variáveis podem ser consideradas estatisticamente iguais Sendo assim concluise que a norma da empresa está sendo cumprida Tests of Normality 116 17 200 981 17 966 218 14 070 904 14 130 Bar 1 2 Gasto Statistic df Sig Statistic df Sig KolmogorovSmirnova ShapiroWilk This is a lower bound of the true significance Lilliefors Significance Correction a Exercício 3 Em um restaurante foi coletada uma amostra das compras de 17 clientes quando a música de fundo era lenta e uma amostra de 14 clientes quando a música de fundo era rápida Justifique se pode afirmar a um nível de confiança de 5 que a verdadeira medida de tendência central média ou mediana de compras quando a música de fundo é lenta é maior Dica verifique qual o teste a ser utilizado e compare a medida de tendência central Como n50 usase o teste de normalidade de SW e concluise que a variável segue uma distribuição normal Sig 005 17082015 29 Independent Samples Test 3780 062 2634 29 013 840824 319163 38912 1720560 2706 28852 011 840824 310753 16036 1697684 Equal variances assumed Equal variances not assumed Gasto F Sig Levenes Test for Equality of Variances t df Sig 2tailed Mean Difference Std Error Difference Lower Upper 99 Confidence Interval of the Difference ttest for Equality of Means Test Statisticsb 65000 170000 2143 032 032 a MannWhitney U Wilcoxon W Z Asymp Sig 2tailed Exact Sig 21tailed Sig Gasto Not corrected for ties a Grouping Variable Bar b Como as variáveis seguem uma distribuição normal esta tabela não será utilizada Group Statistics 17 360527 1303876 316236 14 202973 770048 205804 Bar 1 2 Gasto N Mean Std Deviation Std Error Mean De acordo com o teste de Levene para igualdade de variâncias temos que não se rejeita a hipótese de que as variâncias são iguais Sig0062 5 Utilizase a primeira linha da tabela De acordo com o teste de igualdade de médias verificase que rejeitase a hipótese de igualdade de médias Sig0013 5 Sendo assim concluise que o os gastos médios podem ser considerados estatisticamente diferentes Avaliandose as médias verificase que os gastos com música lenta 1 são maiores do que com música rápida 2 2 2 2 2 0 segunda linha H linha primeira H y x a y x y x a y x H H 0 Assimetria Curtose 0775 0441 0097 1202 Divisão Descriptive Statistics 8 5013 6334 583 752 653 1481 8 5750 6024 073 752 1780 1481 8 Entrada Saida Valid N listwise Statistic Statistic Statistic Statistic Std Error Statistic Std Error N Mean Std Deviation Skewness Kurtosis Exercício 4 Um sistema de cancela automático recentemente instalado foi testado para verificar se o número de falhas em 1000 entradas era o mesmo que o número de falhas em 1000 saídas Uma amostra aleatória de oito caminhões de entrega foi selecionada para a coleta dos dados Justifique se existem diferenças significativas entre o número de falhas na entrada e na saída a um nível de confiança de 1 Justifique se existe alguma evidência de que as falhas na entrada ou na saída são maiores Como todos os valores estão dentro do intervalo de 2 a 2 podese considerar que as variáveis seguem uma distribuição normal 17082015 30 Paired Samples Test 7375 4838 1711 13361 1389 4311 7 004 Entrada Saida Pair 1 Mean Std Deviation Std Error Mean Lower Upper 99 Confidence Interval of the Difference Paired Differences t df Sig 2tailed Paired Samples Correlations 8 694 006 Entrada Saida Pair 1 N Correlation Sig O Sig do teste de correlação 0000 é menor do que Sig0000 5 indicando que a correlação da amostra é diferente a zero e que as variáveis são pareadas Como se rejeita a hipótese nula de igualdade das médias na entrada e na saída Sig0004 1 concluise que há diferenças significativas entre as falhas na entrada e na saída Como a média das diferenças entre Entrada e Saída é negativa concluise que as falhas na saída são maiores do que as falhas na entrada Independent Samples Test 008 928 2386 14 032 7375 3091 16575 1825 2386 13965 032 7375 3091 16579 1829 Equal variances assumed Equal variances not assumed Falha F Sig Levenes Test for Equality of Variances t df Sig 2tailed Mean Difference Std Error Difference Lower Upper 99 Confidence Interval of the Difference ttest for Equality of Means Como as variáveis são pareadas esta tabela não será utilizada Ranks 0a 00 00 7b 400 2800 1c 8 Negative Ranks Positive Ranks Ties Total Saida Entrada N Mean Rank Sum of Ranks Saida Entrada a Saida Entrada b Saida Entrada c Test Statisticsb 2366a 018 Z Asymp Sig 2tailed Saida Entrada Based on negative ranks a Wilcoxon Signed Ranks Test b Ranks 8 613 4900 8 1088 8700 16 ESnum 1 2 Total Falha N Mean Rank Sum of Ranks Test Statisticsb 13000 49000 1998 046 050 a MannWhitney U Wilcoxon W Z Asymp Sig 2tailed Exact Sig 21tailed Sig Falha Not corrected for ties a Grouping Variable ESnum b Como as variáveis seguem uma distribuição normal estas tabelas não serão utilizadas