·

Cursos Gerais ·

Probabilidade e Estatística 1

Send your question to AI and receive an answer instantly

Ask Question

Preview text

S l i d e 1 Estatística ANOVA Testes não paramétricos Douglas Moura Miranda Slide 2 ANOVA Análise de variância Utilizado para comparar várias médias 3 Para isto devese analisarcomparar a variância entre os grupos com a variância dentro dos grupos 𝐻0 𝜇1 𝜇2 𝜇𝑁 𝐻1 𝑝𝑒𝑙𝑜 𝑚𝑒𝑛𝑜𝑠 𝑢𝑚 𝜇𝑖 é 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒 𝑑𝑜𝑠 𝑑𝑒𝑚𝑎𝑖𝑠 Ver Exemplo Excel Premissa as populações que deram origem às amostras são Normais e possuem a mesma variância Alternativa Teste de Welch requer apenas que seja próximo de uma Normal Caso contrário usar algum método não paramétrico como KruskalWallis Slide 3 Testes de Hipótese Não Paramétricos Vantagens Não assumem que a distribuição é normal Z ou próxima Student Dados podem ser categóricos ou ordenados Mais simples Desvantagens Tendem a ter menor potência para um mesmo tamanho de amostra no caso da população ser normal Teste não usa dados sumarizados média e desvio padrão não são suficientes Slide 4 Motivação e Contexto Teste Medianas Premissa Teste dos Sinais 1 Qualquer distribuição Wilcoxon 1 Distribuições simétricas MannWhitney 2 Distribuições e variâncias semelhantes KruskalWallis 2 Distribuições semelhantes Mood 2 Não sabe se distribuições semelhantes Friedman 2 3 Qualquer distribuição medidas repetidas no mesmo sujeito Premissa comum todos amostras independentes Métodos Posthoc Testes nãoparamétricos para comparar variâncias Levene Bonett Bonett tende a ter maior potência para n20 e caso não haja alguma amostra de dados com assimetria muita alta Slide 5 Teste de Sinais Testa se a mediana de uma amostra 𝜇 difere significativamente de um valor hipotetizado 𝜇0 Na mediana temos que 𝑃 𝑋 𝜇 05 𝑃 𝑋 𝜇 𝐻0 𝜇 𝜇0 𝐻1 𝜇 𝜇0 Como 𝑃 𝑋 𝜇 𝑃 𝑋 𝜇 05 esperase 𝑟 Τ 𝑛 2 𝑟 𝑖1 𝑛 𝑟𝑖 𝑟𝑖 ൞ 1 𝑠𝑒 𝑥𝑖 𝜇0 0 0 𝑠𝑒 𝑥𝑖 𝜇0 0 𝑠𝑒 𝑥𝑖 𝜇0 0 quantidade de diferenças positivas sinais positivos 𝐻0 𝑝 050 𝐻1 𝑝 050 Ex caso unilateral Slide 6 Teste de Sinais Exemplo x Dif 3667 467 3056 144 3079 121 3157 043 3498 298 3174 026 3811 611 2887 313 3496 296 3494 294 3141 059 3391 191 3728 528 3733 533 3141 059 3423 223 3398 198 3860 660 3169 031 3511 311 Sample size 20 r 12 𝐻0 𝜇 32 𝐻1 𝜇 32 𝛼 005 𝑛𝑝 5 𝑛 10 𝑛1 𝑝 5 𝑛 10 Aproximação por uma normal 𝑝0 05 𝑧𝑜𝑏𝑠 Ƹ𝑝 𝑝0 𝑝01 𝑝0 𝑛 OBS Caso aproximação por normal não seja possível pode usar Binomial e calcular pvalor Ex unilateral 𝑝 𝑣𝑎𝑙𝑜𝑟 𝑃 𝑋 𝑟 para p050 e n tam Amostra Excel pvalor 1 𝐷𝐼𝑆𝑇𝑅 𝐵𝐼𝑁𝑂𝑀𝑟 𝑛 05 1 Slide 7 Teste de Sinais Exemplo Aproximação por uma normal 𝑧𝑜𝑏𝑠 Ƹ𝑝 𝑝0 𝑝01 𝑝0 𝑛 Ƹ𝑝 𝑟 𝑛 12 20 06 𝑝005 Sample size 20 r 12 𝑧𝑜𝑏𝑠 06 05 051 05 20 0894 𝑧𝛼 1645 Rejeição de H0 𝑧𝑜𝑏𝑠 𝑓𝑜𝑟𝑎 𝑑𝑎 𝑟𝑒𝑔𝑖ã𝑜 𝑑𝑒 𝑟𝑒𝑗𝑒𝑖çã𝑜 𝑛ã𝑜 𝑟𝑒𝑗𝑒𝑖𝑡𝑎𝑟 𝐻0 𝐻0 𝑝0 05 𝐻1 𝑝0 05 𝛼 005 Slide 8 Teste de Wilcoxon Testa se a mediana de uma amostra 𝜇 difere significativamente de um valor especificado 𝜇0 Assume que a distribuição é continua e simétrica 𝜇 𝜇 Diferentemente do Teste de sinais o teste de Wilcoxon do posto com sinais leva em consideração a magnitude das diferenças entre os valores da amostra e a mediana hipotetizada Vantagem nos casos em que a amostra possui simetria o Teste de Wilcoxon tende a obter menor erro tipo II para o mesmo nível de significância 𝛼 quando comparado ao Teste de Sinais Slide 9 Teste de Wilcoxon Exemplo i xi xi32 i xi32 xi32 Posto 1 36665 4665 6 0265 0265 1 2 30559 1441 19 0309 0309 2 3 30793 1207 4 0429 0429 3 4 31572 0429 15 0591 0591 4 5 34976 2976 11 0595 0595 5 6 31735 0265 3 1207 1207 6 7 38111 6111 2 1441 1441 7 8 28866 3135 12 1910 1910 8 9 34958 2958 17 1980 1980 9 10 34939 2939 16 2232 2232 10 11 31405 0595 10 2939 2939 11 12 33910 1910 9 2958 2958 12 13 37280 5280 5 2976 2976 13 14 37328 5328 20 3114 3114 14 15 31409 0591 8 3135 3135 15 16 34232 2232 1 4665 4665 16 17 33980 1980 13 5280 5280 17 18 38598 6598 14 5328 5328 18 19 31691 0309 7 6111 6111 19 20 35114 3114 18 6598 6598 20 𝐻0 𝜇 32 𝐻1 𝜇 32 𝑤 167 𝑤 43 𝐻1 𝜇 𝜇0 𝑤 𝑤𝛼 𝐻1 𝜇 𝜇0 min𝑤 𝑤 𝑤𝛼 𝑟𝑒𝑗𝑒𝑖𝑡𝑎 𝐻0 𝑠𝑒 𝑤 𝑤𝛼 𝑤 60 𝑟𝑒𝑗𝑒𝑖𝑡𝑎 𝐻0 ordenar em ordem crescente pelo módulo da diferença Slide 10 Teste de KruskalWallis O teste de KruskalWallis é uma alternativa não paramétrica ao Teste F usado na ANOVA Testa se amostras se originam da mesma distribuição Testa se pelo menos uma amostra dentre um grupo de amostras possui mediana diferente das demais ou se as amostras possuem a mesma distribuição Dados podem ter escala ordinal ou numérica dados contínuos ou inteiros Cada grupo fator deve ter pelo menos tamanho 5 o número de grupos de no mínimo 3 Slide 11 Teste de KruskalWallis Exemplo Grupo Dados Posto Posto G1 Posto G2 Posto G3 2 0 1 0 1 0 2 1 2 0 2 0 1 2 3 3 0 0 1 3 4 4 0 0 1 4 5 5 0 0 3 5 6 0 0 6 3 6 7 0 0 7 1 7 8 8 0 0 3 8 9 0 0 9 2 9 10 0 10 0 3 10 11 0 0 11 2 12 12 0 12 0 2 14 13 0 13 0 1 17 14 14 0 0 1 20 155 155 0 0 3 20 155 0 0 155 2 21 17 0 17 0 3 22 18 0 0 18 Soma dos Postos 495 55 665 G1 G2 G3 20 12 8 4 21 22 7 9 10 2 0 5 17 14 6 3 1 20 𝐻𝑜𝑏𝑠 12 1818 1 4952 6 552 6 6652 6 3 18 1 088 Estatística de teste obs Valor crítico do teste 𝑁 18 𝑛𝑔 6 𝐺𝐿 2 ℎ𝑐𝑟𝑖𝑡 𝐼𝑁𝑉 𝑄𝑈𝐼𝑄𝑈𝐴 𝐶𝐷0052 ℎ𝑐𝑟𝑖𝑡 599 Como 𝐻𝑜𝑏𝑠 ℎ𝑐𝑟𝑖𝑡 não rejeitar 𝐻0 𝐻1 𝜇 de pelo menos 1 é dif ℎ𝑐𝑟𝑖𝑡 𝐼𝑁𝑉 𝑄𝑈𝐼𝑄𝑈𝐴 𝐶𝐷𝛼 𝐺𝐿 OBS 12 3 e 1 na equação são constantes Slide 12 Miranda D M Branke J Conceição S V 2018 Algorithms for the MultiObjective Vehicle Routing Problem with Hard Time Windows and Stochastic Travel Time and Service Time Applied Soft Computing Estudo de caso comparação em pares dentre 4 algoritmos Indeed the Wilcoxon test is suitable for pairwise comparison In the multi comparison studies appropriate tests such as the Friedman Test and some posthoc procedure should be employed I suggest checking the following paper for further details Testes pareados multi comparativos e posthoc Comentário do revisor Slide 13 Em análise pareada se tentarmos extrair uma conclusão envolvendo mais de uma comparação par a par obteremos um valor acumulado de erro vindo das combinações de cada par Ao comparar pares há um acumulo do erro tipo 1 seu nível de significância é maior pois existe uma variância entre pares que precisa ser considerada Conclusão não é suficiente usar testes de 2 amostras testandose todas as combinações 2 a 2 dos N grupos Testes pareados multi comparativos e posthoc Slide 14 Testes multicomparativos KruskalWallisMoodFriedman dizem se pelo menos 2 amostras dentre as 𝑘 amostras possuem medianas diferentes Métodos posthoc permitem comparar amostra de um grupo especifico com os demais grupos Procedimentos posthoc pósteste Como o 𝛼 diminui fica mais difícil rejeitar 𝐻0 ou seja reduz erro tipo I privilegiando o Nível de Confiança Ex Ajuste de Bonferroni 𝛼𝑎𝑗𝑢𝑠𝑡 𝛼 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑔𝑟𝑢𝑝𝑜𝑠 No exemplo dos 3 grupos do KruskalWallis se quero generalizar conclusões de um grupo em relação aos demais usaria 𝛼𝑎𝑗𝑢𝑠𝑡 005 3 00167 Fechamento Excel Icon Minitab 19 duna math wwwdunamathcom