· 2022/2
8
Estatística
UNESP
1
Estatística
UNESP
26
Estatística
UNESP
26
Estatística
UNESP
19
Estatística
UNESP
19
Estatística
UNESP
37
Estatística
UNESP
25
Estatística
UNESP
1
Estatística
UNESP
1
Estatística
UNESP
Texto de pré-visualização
ESTATISTICA E EXPERIMENTAC AO COMPARAC AO ENTRE DUAS OU MAIS MEDIAS POPULACIONAIS Parte 1 Dados independentes delineamento inteiramente aleatorizado Luzia A Trinca luziatrincaunespbr 1 25 Comparacao de duas ou mais medias de tratamentos Objetivos 1 Apresentar a tecnica ANOVA 2 Apresentar um teste de comparacoes multiplas 2 25 Comparacao de duas ou mais medias de tratamentos Nas aulas anteriores vimos como aplicar a tecnica de teste de hipoteses comparando medias de dois tratamentos Agora vamos estender a ideia para mais de dois tratamentos sob a condicao de homoscedasticidade Quando a variavel resposta e quantitativa e razoavelmente bem comportada simetrica e homoscedastica utilizamos uma tecnica chamada de analise de variˆancia ou ANOVA Relembrando os delineamentos experimentais mais simples sao inteiramente aleatorizado ou aleatorizado em blocos Na aula de hoje vamos nos concentrar no inteiramente aleatorizado DIA 3 25 Analise para experimento em delineamento inteiramente aleatorizado Exemplo Um experimento foi utilizado para comparar o crescimento de mudas de eucalipto sob trˆes condicoes de plantio usando fungos endomicorrızicos Os tratamentos foram A com inoculo selvagem B com inoculo G mosseae e C controle sem uso de fungo As sementes consideradas similares foram semeadas em condicoes homogˆeneas 18 vasos foram colocados em posicoes aleatorizadas dentro de uma estufa homogˆenea sendo 6 com solo inoculado com A 6 com B e 6 controle Apos germinacao as plˆantulas foram transplantadas nos vasos 4 25 Analise para experimento em delineamento inteiramente aleatorizado Resultados em cm aos 2 meses de idade Tratamento A B C 3012 3025 2618 2425 2825 2020 Peso 3042 3198 2500 yji 3108 3652 2725 2715 3332 2415 2592 3210 2243 Soma Ti 16894 19242 14521 Media yi 281567 320700 242017 Media Geral y 281428 s2 77603 78558 65997 s 27857 28028 25690 G G G G G G G G G G G G G G G G G G 20 25 30 35 40 Dieta Peso A B C y1 y2 y3 y Note que a variabilidade e homogˆenea dentro dos tratamentos estamos no caso de igualdade de variˆancias homoscedasticidade 5 25 Analise para experimento em condicoes homogˆeneas Na inexistˆencia de efeitos diferencas de tratamentos uma possıvel ilustracao o padrao de respostas seria G G G G G G G G G G G G G G G G G G 20 25 30 35 40 Dieta Peso A B C y1 y2 y3 A variabilidade das respostas sob o mesmo tratamento ocorre devido a variabilidade de indivıduo para indivıduo Chamamos essa variabilidade de erro experimental ou erro aleatorio Ela sempre esta presente nos dados experimentais pois a caracterıstica sendo estudada e uma variavel aleatoria 6 25 Analise para experimento em delineamento inteiramente aleatorizado Voltando aos resultados do experimento Tratamento A B C 3012 3025 2618 2425 2825 2020 Peso 3042 3198 2500 yji 3108 3652 2725 2715 3332 2415 2592 3210 2243 Soma Ti 16894 19242 14521 Media yi 281567 320700 242017 Media Geral y 281428 s2 77603 78558 65997 s 27857 28028 25690 G G G G G G G G G G G G G G G G G G 20 25 30 35 40 Dieta Peso A B C y1 y2 y3 y A variabilidade das respostas entre tratamentos se sobressai quando comparamos com a variabilidade devido ao erro experimental A analise se baseia na separacao da fonte de variacao explicada pelos tratamentos daquela explicada pelo erro experimental e na comparacao dessas duas fontes 7 25 Essas fontes de variabilidades sao calculadas e organizadas na Tabela de Analise de Variancia ou ANOVA Notacao 7 o numero total de unidades experimentais UE e kK 0 ntmero de tratamentos n 60 numero de UE que recebeu o tratamento 7 yji a resposta na jésima UE que recebeu o tratamento 7 j 12nj i 12 K e T 6 a soma das respostas sob o tratamento i JT an Yii y a média do tratamentoi y Tnj G a soma de todas as respostas do experimento todo geral G 8 Ty yi y 6a média geral do experimento todo y Gn 825 ANOVA A ANOVA é uma aplicac3o do teorema de Pitdgoras a b c baseada no modelo resposta efeito do tratamento erro experimental Ocorre que para qualquer conjunto de dados oriundos de experimentos inteiramente aleatorizados ou amostras independentes a seguinte igualdade é sempre valida kK nN K Kk nu 2 2 72 Yen 9 Yon O i HW il jl i1 i1 j1 Vamos entender essas quantidades no grafico a seguir 925 Analise para experimento em condicoes homogˆeneas G G G G G G G G G G G G G G G G G G 20 25 30 35 40 Dieta Peso A B C y1 y2 y3 y 10 25 ANOVA Entao temos kK nm K kK nN SoS wi Yorgi D 2 i1 jl i1 i1 jl Variab Total Variab entre Tratamentos Variab do Erro Essas quantidades sdo chamadas de Soma de Quadrados SQ SQTotal SQTrat SQ Residual Cada SQ esta associada ao seu nimero de graus de liberdade n1K 14nK 1125 ANOVA formulas alternativas As contas sdo facilitadas pelas formulas alternativas Seja 2 C entdo Kn 2 SQTotal S So ui C i1 jl K T2 S C QT rat nj il S Q Residual S QTotal S QrTrat Para experimentos balanceados ou seja 27 n2nK V SQtTrat é ms S T QT rat r 4 C il 1225 ANOVA Conforme vamos fazendo as contas vamos organizando os resultados numa tabela a ANOVA Causas de Variacao GL SQ QM Fobs Fcrit Tratamento K 1 SQT rat Residual n K SQResidual Total n 1 SQT otal 13 25 ANOVA Detalhes dos calculos Variedade A B Cc 3012 3025 2618 2425 2825 2020 Peso 3042 3198 2500 ya 3108 3652 2725 2715 3332 2415 2592 3210 2243 Soma T 16894 19242 14521 G50657 2 22432 2 C 3019424 254 2243 anes 20603 1048 142562869 SQrotal 3012 2425722437 142562869 145530991 142562869 2968122 SQrrat 16894 19242 145217 142562869 1857337 SQ Residual 2968122 1857337 1110785 wa ANOVA Conforme fazemos as contas colocamos os valores na tabela ANOVA Causas de Variacao GL SQ QM Fobs Fcrit Tratamento 2 1857337 Residual 15 1110785 Total 17 2968122 15 25 ANOVA As SQTrat e SQResidual divididas pelos respectivos graus de liberdade sao chamadas de Quadrados Medios e formam a base de comparacao dos resultados QMTrat SQTrat K 1 QMResidual SQResidual n K O QMResidual e uma extensao de S2 conj quando temos mais de dois tratamentos ou amostras Continuamos preenchendo a tabela Causas de Variacao GL SQ QM Fobs Fcrit Tratamento 2 1857337 928669 Residual 15 1110785 74952 Total 17 2968122 16 25 ANOVA A técnica é baseada no fato de que se os tratamentos nao produzem efeitos distintos ou seja se Ho for verdadeira Ho 1 p2pK trat tem efeitos iguais 4 pelo menos um par de médias difere entao QM7a deve ser préximo de QM Residual Para comparar ou testar Ho calculamos a razdo F QM rat Q MResidual que sob Ho segue a distribuicdo de SnedecorFisher chamada de F com Kk 1 e nK graus de liberdade 1725 ANOVA A distribuicao F assume apenas valores positivos e e assimetrica Valores altos de F trazem evidˆencia contra H0 e nos deparamos com a pergunta de sempre quanto e alto precisamos do ponto de corte K 18 25 ANOVA Para α fixo rejeitamos H0 se Fobs K no qual Fobs e o valor calculado com base nos resultados experimentais e K FK1nK α e o valor tabelado ou crıtico A ANOVA completa e Causas de Variacao GL SQ QM Fobs Fcrit Tratamento K 1 SQT rat QMT rat QMT rat QMResidual FK1nKα Residual n K SQResidual QMRes Total n 1 SQT otal 19 25 ANOVA Exemplo com K 3 3 tratamentos Para o exemplo temos Causas de Variacao GL SQ QM Fobs F215005 Tratamento 2 1857337 928669 125407 3682 Residual 15 1110784 74052 Total 17 2968121 Conclusao como Fobs Ftab 125407 3682 temos evidˆencia de que pelo menos dois dos tratamentos resultam em alturas medias distintas Uma forma de descrever o controle de heterogeneidade no experimento e atraves do coeficiente de variacao o CV CV 100 QMRes y 100 74052 281428 967 20 25 Detalhando as diferencas Para maior detalhamento a respeito das diferencas entre os tratamentos prosseguimos com outros testes estatısticos chamados de procedimentos de comparacoes multiplas Existem varias tecnicas que podem ser uteis Aqui vamos estudar uma unica o Teste de Tukey O teste de Tukey e utilizado quando se deseja comparar todos os pares de medias de todos os tratamentos 21 25 Teste de Tukey Por exemplo para 3 tratamentos temos 3 pares possiveis cujas hipdteses sao 1 Ho wa pp 0 versus Hy wa pp 0 2 Ho pa po 0 versus Hy wa co 0 3 Ho pp pc 0 versus Hy wp po 0 Para testar os trés conjuntos de hipdteses calculamos as diferencas estimadas e os pontos de corte 1 a Ypl e comparamos com Ayp Tey QMres 4 x 2 a Yc e comparamos com Ajo en QMres 4 x 3 e Yc e comparamos com Apo Tey QMres 4 i para q 9KGLp0 Obtido na tabela da distribuicdo de Tukey 22 25 Teste de Tukey A é andlogo ao ponto critico K que vimos nos outros testes e é conhecido como diferenca minima significativa Quando o experimento é balanceado A se simplifica para 1 1 q 2 QMres A QM 4QM 2 ox et Res V2 Q na 2 r V2 Q Res r qd r Para cada comparacao se a diferenca calculada for maior que A temos evidéncia para rejeitar Hp Note que Pies é 0 erro padrao da média estimada sob qualquer um dos tratamentos O teste de Tukey controla a probabilidade de erro tipo no experimento todo ou seja para o conjunto de hipdteses que no exemplo sao trés 23 25 Teste de Tukey No exemplo temos 74052 A 367 4077 YA YB 39138 A diferenca nao significativa Ya Yo 3955 A diferenca nao significativa e c 7868 A diferenga significativa Conclusao Em termos de altura média os resultados experimentais ordenam os tratamentos como C A B ordem crescente No entanto ao nivel de significdncia de 5 foi observado diferenca significativa apenas entre os tratamentos C e B 24 25 Teste de Tukey Em termos de apresentacao resumida dos resultados vamos destacar uma forma usada frequentemente nos artigos Costumase colocar os tratamentos e suas medias em uma tabela usando uma letra em sobreescrito para referir se a comparacao foi ou nao significativa Sob significˆancia as letras sao distintas Tabela 1 Altura media estimada dos tratamentos na formacao de mudas de eucaliptos ep 111 Tratamento Media Controle 2420a Selvagem 2816ab G mosseae 3207 b Medias seguidas de letras distintas diferem significativamente ao nıvel de 5 pelo teste de Tukey 25 25
8
Estatística
UNESP
1
Estatística
UNESP
26
Estatística
UNESP
26
Estatística
UNESP
19
Estatística
UNESP
19
Estatística
UNESP
37
Estatística
UNESP
25
Estatística
UNESP
1
Estatística
UNESP
1
Estatística
UNESP
Texto de pré-visualização
ESTATISTICA E EXPERIMENTAC AO COMPARAC AO ENTRE DUAS OU MAIS MEDIAS POPULACIONAIS Parte 1 Dados independentes delineamento inteiramente aleatorizado Luzia A Trinca luziatrincaunespbr 1 25 Comparacao de duas ou mais medias de tratamentos Objetivos 1 Apresentar a tecnica ANOVA 2 Apresentar um teste de comparacoes multiplas 2 25 Comparacao de duas ou mais medias de tratamentos Nas aulas anteriores vimos como aplicar a tecnica de teste de hipoteses comparando medias de dois tratamentos Agora vamos estender a ideia para mais de dois tratamentos sob a condicao de homoscedasticidade Quando a variavel resposta e quantitativa e razoavelmente bem comportada simetrica e homoscedastica utilizamos uma tecnica chamada de analise de variˆancia ou ANOVA Relembrando os delineamentos experimentais mais simples sao inteiramente aleatorizado ou aleatorizado em blocos Na aula de hoje vamos nos concentrar no inteiramente aleatorizado DIA 3 25 Analise para experimento em delineamento inteiramente aleatorizado Exemplo Um experimento foi utilizado para comparar o crescimento de mudas de eucalipto sob trˆes condicoes de plantio usando fungos endomicorrızicos Os tratamentos foram A com inoculo selvagem B com inoculo G mosseae e C controle sem uso de fungo As sementes consideradas similares foram semeadas em condicoes homogˆeneas 18 vasos foram colocados em posicoes aleatorizadas dentro de uma estufa homogˆenea sendo 6 com solo inoculado com A 6 com B e 6 controle Apos germinacao as plˆantulas foram transplantadas nos vasos 4 25 Analise para experimento em delineamento inteiramente aleatorizado Resultados em cm aos 2 meses de idade Tratamento A B C 3012 3025 2618 2425 2825 2020 Peso 3042 3198 2500 yji 3108 3652 2725 2715 3332 2415 2592 3210 2243 Soma Ti 16894 19242 14521 Media yi 281567 320700 242017 Media Geral y 281428 s2 77603 78558 65997 s 27857 28028 25690 G G G G G G G G G G G G G G G G G G 20 25 30 35 40 Dieta Peso A B C y1 y2 y3 y Note que a variabilidade e homogˆenea dentro dos tratamentos estamos no caso de igualdade de variˆancias homoscedasticidade 5 25 Analise para experimento em condicoes homogˆeneas Na inexistˆencia de efeitos diferencas de tratamentos uma possıvel ilustracao o padrao de respostas seria G G G G G G G G G G G G G G G G G G 20 25 30 35 40 Dieta Peso A B C y1 y2 y3 A variabilidade das respostas sob o mesmo tratamento ocorre devido a variabilidade de indivıduo para indivıduo Chamamos essa variabilidade de erro experimental ou erro aleatorio Ela sempre esta presente nos dados experimentais pois a caracterıstica sendo estudada e uma variavel aleatoria 6 25 Analise para experimento em delineamento inteiramente aleatorizado Voltando aos resultados do experimento Tratamento A B C 3012 3025 2618 2425 2825 2020 Peso 3042 3198 2500 yji 3108 3652 2725 2715 3332 2415 2592 3210 2243 Soma Ti 16894 19242 14521 Media yi 281567 320700 242017 Media Geral y 281428 s2 77603 78558 65997 s 27857 28028 25690 G G G G G G G G G G G G G G G G G G 20 25 30 35 40 Dieta Peso A B C y1 y2 y3 y A variabilidade das respostas entre tratamentos se sobressai quando comparamos com a variabilidade devido ao erro experimental A analise se baseia na separacao da fonte de variacao explicada pelos tratamentos daquela explicada pelo erro experimental e na comparacao dessas duas fontes 7 25 Essas fontes de variabilidades sao calculadas e organizadas na Tabela de Analise de Variancia ou ANOVA Notacao 7 o numero total de unidades experimentais UE e kK 0 ntmero de tratamentos n 60 numero de UE que recebeu o tratamento 7 yji a resposta na jésima UE que recebeu o tratamento 7 j 12nj i 12 K e T 6 a soma das respostas sob o tratamento i JT an Yii y a média do tratamentoi y Tnj G a soma de todas as respostas do experimento todo geral G 8 Ty yi y 6a média geral do experimento todo y Gn 825 ANOVA A ANOVA é uma aplicac3o do teorema de Pitdgoras a b c baseada no modelo resposta efeito do tratamento erro experimental Ocorre que para qualquer conjunto de dados oriundos de experimentos inteiramente aleatorizados ou amostras independentes a seguinte igualdade é sempre valida kK nN K Kk nu 2 2 72 Yen 9 Yon O i HW il jl i1 i1 j1 Vamos entender essas quantidades no grafico a seguir 925 Analise para experimento em condicoes homogˆeneas G G G G G G G G G G G G G G G G G G 20 25 30 35 40 Dieta Peso A B C y1 y2 y3 y 10 25 ANOVA Entao temos kK nm K kK nN SoS wi Yorgi D 2 i1 jl i1 i1 jl Variab Total Variab entre Tratamentos Variab do Erro Essas quantidades sdo chamadas de Soma de Quadrados SQ SQTotal SQTrat SQ Residual Cada SQ esta associada ao seu nimero de graus de liberdade n1K 14nK 1125 ANOVA formulas alternativas As contas sdo facilitadas pelas formulas alternativas Seja 2 C entdo Kn 2 SQTotal S So ui C i1 jl K T2 S C QT rat nj il S Q Residual S QTotal S QrTrat Para experimentos balanceados ou seja 27 n2nK V SQtTrat é ms S T QT rat r 4 C il 1225 ANOVA Conforme vamos fazendo as contas vamos organizando os resultados numa tabela a ANOVA Causas de Variacao GL SQ QM Fobs Fcrit Tratamento K 1 SQT rat Residual n K SQResidual Total n 1 SQT otal 13 25 ANOVA Detalhes dos calculos Variedade A B Cc 3012 3025 2618 2425 2825 2020 Peso 3042 3198 2500 ya 3108 3652 2725 2715 3332 2415 2592 3210 2243 Soma T 16894 19242 14521 G50657 2 22432 2 C 3019424 254 2243 anes 20603 1048 142562869 SQrotal 3012 2425722437 142562869 145530991 142562869 2968122 SQrrat 16894 19242 145217 142562869 1857337 SQ Residual 2968122 1857337 1110785 wa ANOVA Conforme fazemos as contas colocamos os valores na tabela ANOVA Causas de Variacao GL SQ QM Fobs Fcrit Tratamento 2 1857337 Residual 15 1110785 Total 17 2968122 15 25 ANOVA As SQTrat e SQResidual divididas pelos respectivos graus de liberdade sao chamadas de Quadrados Medios e formam a base de comparacao dos resultados QMTrat SQTrat K 1 QMResidual SQResidual n K O QMResidual e uma extensao de S2 conj quando temos mais de dois tratamentos ou amostras Continuamos preenchendo a tabela Causas de Variacao GL SQ QM Fobs Fcrit Tratamento 2 1857337 928669 Residual 15 1110785 74952 Total 17 2968122 16 25 ANOVA A técnica é baseada no fato de que se os tratamentos nao produzem efeitos distintos ou seja se Ho for verdadeira Ho 1 p2pK trat tem efeitos iguais 4 pelo menos um par de médias difere entao QM7a deve ser préximo de QM Residual Para comparar ou testar Ho calculamos a razdo F QM rat Q MResidual que sob Ho segue a distribuicdo de SnedecorFisher chamada de F com Kk 1 e nK graus de liberdade 1725 ANOVA A distribuicao F assume apenas valores positivos e e assimetrica Valores altos de F trazem evidˆencia contra H0 e nos deparamos com a pergunta de sempre quanto e alto precisamos do ponto de corte K 18 25 ANOVA Para α fixo rejeitamos H0 se Fobs K no qual Fobs e o valor calculado com base nos resultados experimentais e K FK1nK α e o valor tabelado ou crıtico A ANOVA completa e Causas de Variacao GL SQ QM Fobs Fcrit Tratamento K 1 SQT rat QMT rat QMT rat QMResidual FK1nKα Residual n K SQResidual QMRes Total n 1 SQT otal 19 25 ANOVA Exemplo com K 3 3 tratamentos Para o exemplo temos Causas de Variacao GL SQ QM Fobs F215005 Tratamento 2 1857337 928669 125407 3682 Residual 15 1110784 74052 Total 17 2968121 Conclusao como Fobs Ftab 125407 3682 temos evidˆencia de que pelo menos dois dos tratamentos resultam em alturas medias distintas Uma forma de descrever o controle de heterogeneidade no experimento e atraves do coeficiente de variacao o CV CV 100 QMRes y 100 74052 281428 967 20 25 Detalhando as diferencas Para maior detalhamento a respeito das diferencas entre os tratamentos prosseguimos com outros testes estatısticos chamados de procedimentos de comparacoes multiplas Existem varias tecnicas que podem ser uteis Aqui vamos estudar uma unica o Teste de Tukey O teste de Tukey e utilizado quando se deseja comparar todos os pares de medias de todos os tratamentos 21 25 Teste de Tukey Por exemplo para 3 tratamentos temos 3 pares possiveis cujas hipdteses sao 1 Ho wa pp 0 versus Hy wa pp 0 2 Ho pa po 0 versus Hy wa co 0 3 Ho pp pc 0 versus Hy wp po 0 Para testar os trés conjuntos de hipdteses calculamos as diferencas estimadas e os pontos de corte 1 a Ypl e comparamos com Ayp Tey QMres 4 x 2 a Yc e comparamos com Ajo en QMres 4 x 3 e Yc e comparamos com Apo Tey QMres 4 i para q 9KGLp0 Obtido na tabela da distribuicdo de Tukey 22 25 Teste de Tukey A é andlogo ao ponto critico K que vimos nos outros testes e é conhecido como diferenca minima significativa Quando o experimento é balanceado A se simplifica para 1 1 q 2 QMres A QM 4QM 2 ox et Res V2 Q na 2 r V2 Q Res r qd r Para cada comparacao se a diferenca calculada for maior que A temos evidéncia para rejeitar Hp Note que Pies é 0 erro padrao da média estimada sob qualquer um dos tratamentos O teste de Tukey controla a probabilidade de erro tipo no experimento todo ou seja para o conjunto de hipdteses que no exemplo sao trés 23 25 Teste de Tukey No exemplo temos 74052 A 367 4077 YA YB 39138 A diferenca nao significativa Ya Yo 3955 A diferenca nao significativa e c 7868 A diferenga significativa Conclusao Em termos de altura média os resultados experimentais ordenam os tratamentos como C A B ordem crescente No entanto ao nivel de significdncia de 5 foi observado diferenca significativa apenas entre os tratamentos C e B 24 25 Teste de Tukey Em termos de apresentacao resumida dos resultados vamos destacar uma forma usada frequentemente nos artigos Costumase colocar os tratamentos e suas medias em uma tabela usando uma letra em sobreescrito para referir se a comparacao foi ou nao significativa Sob significˆancia as letras sao distintas Tabela 1 Altura media estimada dos tratamentos na formacao de mudas de eucaliptos ep 111 Tratamento Media Controle 2420a Selvagem 2816ab G mosseae 3207 b Medias seguidas de letras distintas diferem significativamente ao nıvel de 5 pelo teste de Tukey 25 25