· 2022/2
27
Estatística
UNESP
2
Estatística
UNESP
4
Estatística
UNESP
8
Estatística
UNESP
2
Estatística
UNESP
1
Estatística
UNESP
1
Estatística
UNESP
1
Estatística
UNESP
23
Estatística
UNESP
5
Estatística
UNESP
Texto de pré-visualização
Atividades 1. Seja y_{ij} o número de frutos de uma determinada árvore da j-ésima fileira do campo (cada uma com oito metros quadrados) que recebe a i-ésima técnica de mistura (tratamento). Com a finalidade de verificar produtividade com relação as técnicas de cultivo foram observadas as quantidades e descritas na forma da tabela: \begin{tabular}{cccccc} & Técnica A & Técnica B & Técnica C & Técnica D & Total \\ 1 & 3129 & 3200 & 2800 & 2900 & \\ 2 & 3000 & 3000 & 2900 & 2700 & \\ 3 & 2865 & 2875 & 2985 & 2860 & \\ 4 & 2980 & 3150 & 3050 & 2765 & \\ & 11854 & 12225 & 11735 & 11225 & 46990 \\ \sum y_{ij} & \sum x. & \sum x^2 & \sum \check{x}. & \sum \check{x}^2 & \sum \check{x}_{\check{x}.} \\ & 33539696 & 39033125 & 34462275 & 28455225 & 138172041 \\ \end{tabular} a. Quem são as unidades experimentais? b. Identifique os tratamentos. c. Qual é o número de unidades experimentais utilizadas no experimento? d. Para a validação do experimento, como você utiliza o processo de casualização? e. Ao nível de 5% de significância, conclua se as técnicas de mistura afetam a quantidade de frutos de uma determinada árvore. 2. Um experimento para avaliar o efeito da substituição do milho por soja na ração, no ganho de peso dos animais, utilizou-se um DIC com 5 tratamentos (uma ração padrão com quatro níveis de substituição do milho por soja e um controle) e 6 repetições. Os resultados são apresentados a seguir. \begin{tabular}{lccccccc} P. Subst. & 1 & 2 & 3 & 4 & 5 & 6 \\ \hline Sub. 0\% & 57,3 & 20,7 & 13,7 & 17,4 & 16,8 & 23,3 & 10,6 \\ Sub. 2\% & 61,7 & 28,9 & 29,7 & 41,4 & 25,4 & 38,1 & 67,0 \\ Sub. 5\% & 148,1 & 92,1 & 154,8 & 99,0 & 130,7 & 295,9 \\ Sub. 10\% & 296,4 & 32,4 & 50,9 & 26,4 & 20,9 & 221,8 & 194,9 \\ Controle & 409,4 & 121,6 & 199,7 & 322,8 & 277,2 & 474,1 & 215,8 \\ \end{tabular} a) Faça a Análise de Variância com diagnóstico (\alpha = 5\%). b) Apresentar os resultados e concluir. 3. Um experimento para avaliar o efeito da ração (Ração 1 a 5) no ganho de peso animal, utilizou-se um DIC com 5 tratamentos e 4 repetições. Os resultado são apresentados a seguir. \begin{tabular}{cccccc} Ração & 1 & 2 & 3 & 4 \\ \hline 1 & 3,31 & 6,10 & 5,33 & 3,84 \\ 2 & 24,52 & 26,40 & 21,66 & 22,18 \\ 3 & 14,75 & 29,07 & 15,56 & 24,18 \\ 4 & 30,55 & 26,99 & 17,54 & 27,56 \\ 5 & 50,25 & 45,12 & 37,25 & 32,15 \\ \end{tabular} a) Faça a Análise de Variância com diagnóstico (\alpha = 5\%). b) Apresentar os resultados e concluir. 1) A) j-ésima árvore. B) Diferentes técnicas de mistura. C) 16 unidades experimentais. D) Escolhendo árvores de uma mesma cultivar de maneira aleatória (sorteio). E) Técnica A Técnica B Técnica C Técnica D Total 3129 3200 2800 2600 3000 3300 2900 2700 2865 2975 2985 2600 2890 3150 3050 2765 11884 12625 11735 10665 46909 3535096 6 3990312 5 3446272 5 2845522 5 13817204 1 SQTrat=35350966+39903125+34462725+28455225 4 −138172041 16 =25907257,69 SQTotal=3129 2+3200 2+2800 2+...+3150 2+3050 2+2765 2−138172041 16 =1004185,50 SQRes=25907257 ,69−129536288,4=103629030,8 FV GL SQ QM F calc F tab Tratament o 3 25907257,69 8635752,5 6 1 3,49 Resíduo 12 103629030,7 5 8635752,5 6 Total 15 129536288,4 4 Conclusão: F tab > F calc Pelo teste F, com α=5%, podemos concluir que não existem diferença significativa entre os tratamentos 2) A) P. Subst. 1 2 3 4 5 6 Total Sub. 0% 57,37 20,27 13,97 17,16 28,53 10,64 147,94 Sub. 2% 51,72 38,2 29,71 45,06 38,81 66,7 270,2 Sub. 5% 148,41 91,21 154,89 90,2 130,8 208,9 824,41 Sub. 10% 296,42 342,43 204,91 246,2 205,36 224,98 1520,3 Controle 490,95 407,46 518,16 476,19 580,36 598,14 3071,26 Total 5834,11 SQTrat=147,94 2+270,2 2+824 ,41 2+1520,3 2+3071,26 2 6 −5834 ,11 2 30 =951854 ,72 SQT otal=57,37 2+20,27 2+…+580,36 2+598,14 2−5834 ,11 2 30 =1004185,50 SQRes=1004185,50−951854 ,72=52330,78 FV GL SQ QM F calc F tab Tratament o 4 951854, 7 237963, 7 113,682 5 2,7 Resíduo 25 52330,7 8 2093,23 1 Total 29 1004186 Conclusão: F calc > F tab Pelo teste F, com α=5%, podemos concluir que existe ao menos um tratamento diferente dos demais. B) Teste Tukey DMS=4 ,17∗√ 2093,231 6 =77,89 Controle 511,88 A Sub. 10% 253,38 B Sub. 5% 137,40 C Sub. 2% 45,03 D Sub. 0% 24,66 D Conclusão: O tratamento controle foi o que obteve maior ganho de peso e diferiu-se dos demais. Os tratamentos Sub. 2% e Sub. 0% foram os que obtiveram menor ganho de peso e foram similares entre si e diferiram-se dos demais. 3) A) Repetições Ração 1 2 3 4 Total 1 3,31 6,1 8,53 3,84 21,78 2 23,62 26,94 20,16 22,18 92,9 3 14,75 25,2 17,56 24,8 82,31 4 30,58 30,69 18,54 27,56 107,37 5 50,25 45,12 37,25 52,15 184,77 Total 489,13 SQTrat=21,78 2+92,9 2+82,31 2+107,37 2+184 ,77 2 4 − 489,13 2 20 =3424 ,58 SQTotal=3,31 2+6,1 2+8,53 2+…+45,12 2+37,25 2+52,15 2− 489,13 2 20 =3779,66 SQRes=3779,66−3424 ,58=355,08 FV GL SQ QM F F tab Tratament o 4 3424,58 8 856,147 1 36,1672 6 3,06 Resíduo 15 355,078 2 23,6718 8 Total 19 3779,66 6 Conclusão: F calc > F tab Pelo teste F, com α=5%, podemos concluir que existe ao menos um tratamento diferente dos demais. B) Teste Tukey DMS=2,9∗√ 23,67 4 =7,055 5 46,19 A 4 26,84 B 2 23,23 B 3 20,58 B 1 5,45 C Conclusão: O tratamento 5 obteve maior ganho de peso e diferiu-se dos demais. O tratamento 1 foi o que obteve menor ganho de peso e diferiu-se dos demais. Disciplina Estatística e Experimentação (Engenharia Agronômica) Daisy Santana Ferreira Professora Dra. Miriam Harumi Tsunemi Universidade Estadual Paulista “Júlio de Mesquita Filho.” Campus de Botucatu - SP 04 janeiro 2023 Contents Introdução 2 Conceitos Básicos 4 O Processo de Aleatorização 7 Delineamento Inteiramente Casualizado (DIC) 8 Análise de Variância ou ANOVA do DIC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 Teste de Tukey . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 Teste de Dunnett . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 No Software R: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 Atividades 16 Referências 18 1 Introdução Figure 1: Como funciona o experimento • Teoria: “Os fertilizantes ou adubos são qualquer tipo de substância aplicada ao solo ou tecidos vegetais para fixar um ou mais nutrientes essenciais ao crescimento das plantas. Geralmente, são aplicados na agricultura com o objetivo de melhorar a produção do plantio e conservar os alimentos por mais tempo.” (Manuelle Meira 2020) • Formulação de hipóteses: Há diferença nas alturas das plantas de salsa quanto a quantidade de adubo? H0 : µ0% = µ25% = µ50% H1 : µi ̸= µj Pelo menos duas médias de tratamento diferem entre si. • Obtenção de observações: Table 1: Medidas, em centímetro, da maior altura de salsa dentro das parcelas A B C 1 NA 3.60 6.30 2 6.00 4.80 6.90 3 2.00 2.50 2.10 4 3.00 5.50 7.00 5 2.50 NA 4.00 6 2.30 5.50 2.00 7 4.00 2.30 2.80 8 4.90 1.40 6.20 9 NA 3.00 5.00 10 4.30 3.40 NA • Verificação das hipóteses (afirmação ou negação da teoria): (. . . ) 2 Figure 2: Alguns passos para a realização de um experimento 3 Conceitos Básicos HIPÓTESE: As hipóteses científicas são premissas assumidas pelo pesquisador como possíveis soluções para as relações causa-efeito entre características dos elementos envolvidos no problema em foco. • H0: é a hipótese inicial. Nela, assumimos que as variações ocorridas são de modo natural, ou que não há diferença entre os tratamentos. • H1: é a hipótese de contraponto. Nela, assumimos as variações ocorridas esperadas ou idealizadas pelo pesquisador. Exemplo: Estudar o efeito de dose do adubo no crescimento da planta de salsa. H0 : µ0% = µ25% = µ50% H1 : µi ̸= µj Pelo menos duas médias de tratamento diferem entre si. TRATAMENTO OU FATOR: São quantidades (controláveis ou não) de um processo ou experimento que podem afetar ou alterar seu desempenho. Exemplo: Quantidade de adubo na terra (níveis de nutrientes na terra): • Para o tratamento de 0% adubo (A), não utilizamos adubo; • Para o tratamento de 25% adubo (B), utilizamos 2 copos e meio de adubo; • Para o tratamento de 50% adubo (C), utilizamos 5 copos de adubo. UNIDADE EXPERIMENTAL: É a unidade que vai receber o tratamento e fornecer os dados que deverão refletir o seu efeito. Exemplo: Uma fileira de sacos de mudas Figure 3: Plantação de salsa codificada e aleatorizada • Em engenharia, as unidades experimental costumam ser corpos de prova, em medicina, são indivíduos (pessoas), em agronomia, são plantas e/ou animais. • É desejável fazer com que as unidades experimentais sejam tão homogêneas quanto possível. 4 ERRO EXPERIMENTAL: É o efeito de fatores que atuam de forma aleatória e que não são passíveis de controle pelo experimentador. • Temperatura, chuva e insetos. Figure 4: Solução para diminuir o erro experimental no experimento sobre o desenvolvimento da planta de salsa: estufa. BORDADURA: Quando existe a possibilidade de uma parcela ser influenciada pelos tratamentos aplicados nas parcelas vizinhas, cada parcela deverá conter uma quantidade de material a mais para servir de proteção contra esta interferência. Figure 5: Descrição da área utilizada VARIÁVEL RESPOSTA: É a variável mensurada usada para avaliar o efeito de tratamentos. Exemplo: Altura das plantas de salsa em centímetros. 5 DELINEAMENTO EXPERIMENTAL: É o plano utilizado na experimentação e implica na forma como os tratamentos serão atribuídos às unidades experimentais. Exemplos: a) Delineamento Inteiramente Casualizado (DIC) b) Delineamento em Blocos Casualizados (DBC) c) Delineamento em Quadrado Latino (DQL) PRINCÍPIO DA REPETIÇÃO: Em termos estatísticos, o uso do princípio da repetição tem por finali- dade obter uma estimativa do erro experimental. • A repetição consiste em aplicar o mesmo tratamento a várias unidades experimentais, ou seja, consiste na reprodução do experimento básico. • Quanto maior é o número de repetições, espera-se que seja maior a precisão do experimento. • É obrigatório em todo experimento! PRINCÍPIO DA CASUALIZAÇÃO: Consiste em distribuir ao acaso os tratamentos às unidades ex- perimentais, de forma que todos os tratamentos tenham a mesma chance de serem designados a qualquer uma das unidades experimentais. Figure 6: Posições numeradas para a aleatorização das parcelas em estudo. • É um procedimento que garante a validade de um estudo experimental. 6 • É obrigatório em todo experimento! PRINCÍPIO DO CONTROLE NA CASUALIZAÇÃO: O uso do princípio do controle na casualização só é recomendado quando as unidades experimentais não são ou não estão sob condições homogêneas devido a influência de um ou outro. • A finalidade, do uso do princípio do controle na casualização, é reduzir o efeito do erro experimental através do controle da variação existente entre as unidades experimentais. • Não é obrigatório em todo experimento! O Processo de Aleatorização Exemplo 1: Produtividade, em toneladas por hectare, de grãos de três cultivares de milho em experimento instalado em DIC. Figure 7: Croqui do experimento • Tratamentos: 3 cultivares de milho; • Unidade experimental ou parcela: área plantada; • Delineamento de experimento: Delineamento Inteiramente Casualizado (DIC). Repetição Amarelo Vermelho Roxo 1 6,0 5,3 5,1 2 4,6 3,8 2,5 3 5,4 4,5 3,8 4 5,2 4,1 3,7 Totais 21,2 17,7 15,1 7 Como saber se os cultivares diferem entre si quanto a produtividade média de grãos? Delineamento Inteiramente Casualizado (DIC) • Princípios Básicos da Experimentação: repetição e casualização; • O mais simples dos delineamentos para controle do erro experimental; • Utilização condicionada a disponibilidade de unidades experimentais homogêneas: casa-de-vegetação, laboratório, terreno sabiamente homogêneo. Suponha que temos a tratamentos ou diferentes níveis de um único fator que se queira comparar. A resposta observada de cada um dos a tratamentos é uma variável aleatória. Os dados seriam da forma: \begin{center} \begin{tabular}{llllll} Tratamentos & Observações & Totais & Médias \\ 1 & y_{11} & y_{12} & \ldots & y_{1b} & y_1. & \overline{y}_1. \\ 2 & y_{21} & y_{22} & \ldots & y_{2b} & y_2. & \overline{y}_2. \\ \vdots & \vdots & \vdots & \ldots & \vdots & \vdots & \vdots \\ a & y_{a1} & y_{a2} & \ldots & y_{ab} & y_a. & \overline{y}_a. \\ \end{tabular} \end{center} em que y_{ij} representa a b-ésima observação do a-ésimo tratamento; \begin{center} \[ y_i. = \sum_{j=1}^{b} y_{ij} \quad \overline{y}_i. = \frac{\sum_{j=1}^{b} y_{ij}}{b} \quad e \quad \overline{y}_{..} = \frac{\sum_{i=1}^{a} \sum_{j=1}^{b} y_{ij}}{ab} \] \end{center} O modelo estatístico para o delineamento inteiramente casualizado é: \begin{equation} y_{ij} = \mu + \tau_i + \epsilon_{ij}, \quad \left\{ \begin{array}{ll} i = 1, 2, \ldots, a \\ j = 1, 2, \ldots, b \end{array} \right. \end{equation} • y_{ij} = valor observado na unidade experimental que recebeu o tratamento i, repetição j; • \mu = efeito geral da média; • \tau_i = efeito do tratamento i; • \epsilon_{ij} = erro aleatório (resíduo). O objetivo é, em geral, verificar se existe diferença significativa entre pelo menos duas médias de tratamentos. As hipóteses testadas são: \begin{equation} H_0 : \mu_1 = \mu_2 = \ldots = \mu_a \end{equation} \begin{equation} H_1 : \mu_i \neq \mu_j \quad \text{Pelo menos duas médias de tratamento diferem entre si.} \end{equation} • Uma forma equivalente de descrever as hipóteses anteriores é em termos dos efeitos dos tratamentos \tau_i, que é: \begin{equation} H_0 : \tau_1 = \tau_2 = \ldots = \tau_a = 0 \end{equation} \begin{equation} H_1 : \tau_i \neq 0 \quad \text{Pelo menos um tratamento.} \end{equation} A análise de variância para testar essas hipóteses só é válida se forem satisfeitas as seguintes condições: (1) Aditividade: os efeitos devem se somar (não há interação); (2) Independência: os erros (ϵij) devem ser independentes; (3) Normalidade: os erros (ϵij) devem possuir uma distribuição normal; (4) Homocedasticidade ou homogeneidade de variâncias: os erros (ϵij) devem possuir uma variância comum σ2. Análise de Variância ou ANOVA do DIC Quadro da Análise de Variância: Causas de Variação g.l. S.Q. Q.M. Fcalc Ftab Tratamentos a − 1 SQTrat SQTrat a−1 QMTrat QMRes Fα;a−1,a(b−1) Resíduo a(b − 1) SQRes SQRes a(b−1) Total ab − 1 SQTotal Fazendo-se as suposição, a estatística apropriada para H0 : µ1 = µ2 = · · · = µa é Fcal = QMTrat QMRes Se Fcal > Fα;(a−1),a(b−1), rejeita-se H0. Exemplo 1: Produtividade, em toneladas por hectare, de grãos de três cultivares de milho em experimento instalado em DIC. Repetição Amarelo (A) Vermelho (V) Roxo (R) 1 6,0 5,3 5,1 2 4,6 3,8 2,5 3 5,4 4,5 3,8 4 5,2 4,1 3,7 Totais yA.= 21,2 yV .=17,7 yR.=15,1 Como saber se os cultivares diferem entre si quanto a produtividade média de grãos? a) Hipóteses H0 : µA = µV = µR H1 : µi ̸= µj Pelo menos duas médias de tratamento diferem entre si. b) Quadro da Análise de Variância ou ANOVA do DIC CV GL SQ QM Fcal. Ftab. variedades 3 - 1 = 2 4,685 2,343 3,728 4,256 resíduo 3(4-1) = 9 5,655 0,628 TOTAL 12 - 1 = 11 10,34 • a=3 e b=4 9 Soma dos quadrados: • Soma de quadrado totais: \[ SQ_{total} = \sum_{i=1}^{a} \sum_{j=1}^{b} y_{ij}^2 - \frac{\left( \sum_{i=1}^{a} \sum_{j=1}^{b} y_{ij} \right)^2}{ab} \] \[ = (6,0^2 + 5,3^2 + \ldots + 3,7^2) - \frac{(6,0 + 5,3 + \ldots + 3,7)^2}{12} = 253,34 - \frac{54^2}{12} = 10,34 \] • Soma de quadrado tratamentos: \[ SQ_{trat} = \frac{1}{b} \sum_{i=1}^{a} y_{i.}^2 - \frac{\left( \sum_{i=1}^{a} \sum_{j=1}^{b} y_{ij} \right)^2}{ab} \] \[ = \frac{21,2^2 + 17,7^2 + 15,1^2}{4} - \frac{(6,0 + 5,3 + \ldots + 3,7)^2}{12} = 247,685 - \frac{54^2}{12} = 4,685 \] • Soma de quadrado de resíduo ou erro: \[ SQ_{res} = SQ_{total} - SQ_{trat} = 10,34 - 4,685 = 5,655 \] Quadrados médios: • Quadrado médio de tratamento: \[ QM_{trat} = \frac{SQ_{trat}}{GL_{trat.}} = \frac{4,685 \,}{2} = 2,3425 \] • Quadrado médio de resíduo: \[ QM_{res.} = \frac{SQ_{res.}}{GL_{res.}} = \frac{5,655}{9} = 0,628 \] Estatística do teste e ponto crítico: \[ F_{cal} = \frac{QM_{trat}}{QM_{res.}} = \frac{2,3425}{0,628} = 3,7281 \] \begin{align*} F_{tab.} = F(\text{GL Trat; GL Res, 5\%}) = F_{2,9,5\%} = 4,26 \\ F_{cal} > F_{tab.} \quad (3,728 < 4,26) \rightarrow \text{Não rejeita-se } H_0 \end{align*} Ao nível de 5% de significância, podemos dizer que não há diferença nas demais médias de tratamentos. Antes de recorrer a ANOVA é necessário verificar os pressupostos que se resumo em: εi iid ∼ N(0, σ2) • Verificação dos pressupostos para Normalidade O teste de normalidade foi proposto em 1965 com o nome de teste Shapiro-Wilk em que suas hipóteses são: H0 : A amostra provém de uma população Normal H1 : A amostra não provém de uma população Normal • Verificação dos pressupostos para a homocedasticidade Para verificar se as variâncias dos tratamentos são iguais podemos realizar o teste de Bartlet onde as hipóteses testadas são: H0: Igualdade das variâncias H1: Não há igualdade das variâncias É importante ressaltar que o teste de Bartlett é sensível em relação à hipótese de normalidade dos dados. Se rejeitarmos a hipótese de normalidade, é melhor utilizarmos o teste proposto por Levene. Porém, se a hipótese de normalidade não for violada, o teste proposto por Bartlett tem um comportamento melhor que o teste proposto por Levene (Branco, n.d.). Exemplo 2: Para comparar a produtividade de quatro variedades de milho, um agrônomo tomou vinte parcelas similares e distribuiu, inteiramente ao acaso, cada uma das 4 variedades em 5 parcelas experimentais. A partir dos dados experimentais fornecidos abaixo, é possível concluir que existe diferença significativa entre as variedades com relação a produtividade, utilizando o nível de significância de 5%? Variedades A B C D 25 31 22 33 26 25 26 29 20 28 28 31 23 27 25 34 21 24 29 28 Totais yA. =115 yB. =135 yC. =130 yD. =155 Médias ¯ yA. = 23 ¯ yB. =27 ¯ yC. =26 ¯ yD. =31 • a=4 e b=5 a) Hipóteses H0 : µA = µB = µC = µD H1 : µi ̸= µj Pelo menos duas médias de tratamento diferem entre si. 11 b) Quadro da Análise de Variância ou ANOVA do DIC CV GL SQ QM Fcal. Ftab. variedades 3 163,75 54,58 7,80 3,24 resíduo 16 112,00 7,00 TOTAL 19 275,75 Fcal = 54, 58 7, 00 = 7, 80 Ftab. = F 3; 16; 0,05 = 3, 24 Fcal > Ftab. (7, 80 > 3, 24) → Rejeita-se H0 Ao nível de 5% de significância, podemos dizer que pelo menos uma média dos tratamentos é estatisticamente diferentes das demais médias de tratamentos. Teste de Tukey a) Hipóteses H0 : µi = µj H1 : µi ̸= µj b) Cálculo da diferença mínima significativa (DMS) do Tukey: ∆ = q · 2√ QMRes a em que q = qα (a, GLRes) é o valor tabelado da amplitude total estudentizada, que é obtido em função do nível α de significância do teste, número de níveis do fator em estudo (a) e número de graus de liberdade do resíduo (GLRes) da análise de variância (ANOVA). • q = q5% (4, 16) = 4, 05 (tabela para o teste de Tukey). – Na Tabela A4a: a=4 e f2=16. • ∆ = 4, 05 · √7,0 4 = 2, 14 (DMS) c) Classificação das médias em ordem decrescente ˆµD = 31 a ˆµB = 27 b ˆµC = 26 b ˆµA = 23 c d) Contrastes 2 a 2 12 C1 = ˆµD − ˆµB = 31 − 27 = 4 > ∆ ⇒ Rejeito H0 ∗ C2 = ˆµD − ˆµC = 31 − 26 = 5 > ∆ ⇒ Rejeito H0 ∗ C3 = ˆµD − ˆµA = 31 − 23 = 8 > ∆ ⇒ Rejeito H0 C2 = ˆµB − ˆµC = 27 − 26 = 1 < ∆ ⇒ Não rejeito H0 C3 = ˆµB − ˆµA = 27 − 23 = 4 > ∆ ⇒ Rejeito H0 C4 = ˆµC − ˆµA = 26 − 23 = 3 > ∆ ⇒ Rejeito H0 e) Conclusão: Médias seguidas de mesma letra, não diferem entre si pelo teste de Tukey a 5% de sig- nificância. Teste de Dunnett Exemplo 2: Para comparar a produtividade de quatro variedades de milho, um agrônomo tomou vinte parcelas similares e distribuiu, inteiramente ao acaso, cada uma das 4 variedades em 5 parcelas experimentais. A partir dos dados experimentais fornecidos abaixo, é possível concluir que existe diferença significativa entre as variedades com relação a produtividade, utilizando o nível de significância de 5%? Variedades A B C D 25 31 22 33 26 25 26 29 20 28 28 31 23 27 25 34 21 24 29 28 Totais 115 135 130 155 Médias 23 27 26 31 Considere o tratamento C como controle e o nível de 5% de probabilidade. Quais tratamentos são iguais ao grupo controle e quais são diferentes? • Quadro da Análise de Variância ou ANOVA do DIC CV GL SQ QM Fcal. Ftab. variedades 3 163,75 54,58 7,80 3,24 resíduo 16 112,00 7,00 TOTAL 19 275,75 a) Hipóteses H0 : µi = µc H1 : µi ̸= µc b) Cálculo da diferença mínima significativa (DMS) do Dunnett (D) 13 d = ( a, GLRes)α d = (4, 16)5% = 2, 77 D = d · √2 · QMRes b = 2, 77 · √2 × 7, 0 5 = 2, 77 · 3, 74 5 = 2, 0729 c) Classificacãa das médias: µA = 23∗ µB = 27ns µD = 31∗ d) Contrastes 2 a 2 com o grupo controle: C1 = |ˆµA − ˆµC| = |23 − 26| = | − 3| > D ⇒ Rejeito H0 C2 = |ˆµB − ˆµC| = |27 − 26| = |1| < D ⇒ Não rejeito H0 C3 = |ˆµD − ˆµC| = |31 − 26| = |5| > D ⇒ Rejeito H0 e) Conclusão: médias seguidas de asterisco diferem do grupo controle pelo teste de Dunnett a 5% de significância. No Software R: Exemplo 1: rm(list = ls(all=TRUE)) # Limpa a memória do R # Função que cola os dados selecionados e copiados do excel exemplo2 <- read.delim("clipboard"); exemplo2 attach(exemplo1) ## Análise exploratória dos dados MediaTrat <- tapply(Producao, Milho, mean) tapply(Producao, Milho, var) tapply(Producao, Milho, sd) boxplot(split(Producao, Milho), xlab = "Tratamentos", ylab = "Produção", col = "green") points(MediaTrat, col="red", pch="*", cex=1.5) ## Teste de homogeneidade de variâncias # H0: As variâncias são homogêneas bartlett.test(Producao ~ Milho) ## Modelo estatístico e ANOVA Modelo <- aov(Producao ~ Milho) anova(Modelo) 14 ## Verificar independência dos erros plot(residuals(Modelo),pch=19,ylab = "Resíduos", col= "blue") abline(h=0,col="red") ## Teste de normalidade dos resíduos (gráfico e p-valor) # H0: Os resíduos são normais shapiro.test(Modelo$residuals) ## Pacote do R install.packages(ExpDes.pt) library(ExpDes.pt) dic(Milho, Producao, # Tratamento, variável resposta quali = TRUE, # Tratamento é qualitativo mcomp = "tukey", # Teste Tukey nl = FALSE, # Realizar regressão hvar = 'bartlett', # Teste para homocedasticidade nas variâncias sigT = 0.05, # Nível de significância para o teste T sigF = 0.05 # Nível de significância para o teste F ) Exemplo 2: library(readxl) Exemplo2 <- read_excel("G:/Meu Drive/3 semestre/PAADES/Aula/Aula_04-01-2023/Exemplo2.xlsx") attach(Exemplo2) ## Modelo estatístico e ANOVA Modelo <- aov(Producao ~ Variedade) anova(Modelo) # ------- Testes de comparações múltiplas ------- ## - Teste de Tukey #TukeyHSD(Modelo,as.factor("Variedade"),ordered=TRUE) library(agricolae) library(gtools) HSD.test(Modelo,as.factor("Variedade"),console=TRUE) ## - Teste de Dunnett # Trat. C é a testemunha library(DescTools) DunnettTest(x=Producao, g=Variedade) require(asbio) with(Exemplo2, pairw.anova(y=Producao, x=Variedade, control="C", method="dunnett")) ## - Teste de Duncan #duncan.test(Modelo,"FTR",alpha=0.05) # Defina o alpha 15 ## -- Teste de Student-Newman-Keuls #SNK.test(Modelo, "TR", alpha=0.05) # Defina o alpha library(ExpDes.pt) dic(Variedade, Producao, # Tratamento, variável resposta quali = TRUE, # Tratamento é qualitativo mcomp = "tukey", # Teste Tukey nl = FALSE, # Realizar regressão hvar = 'bartlett', # Teste para homocedasticidade nas variâncias sigT = 0.05, # Nível de significância para o teste T sigF = 0.05 # Nível de significância para o teste F ) Atividades 1. Seja yij o número de frutos de uma determinada árvore da j-ésima fileira do campo (cada uma com oito metros quadrados) que recebeu a i-ésima técnica de mistura (tratamento). Com a finalidade de verificar produtividade com relação as técnicas de cultivo foram observadas as quantidades e descritas na forma da tabela: Técnica A Técnica B Técnica C Técnica D Total 3129 3200 2800 2600 3000 3300 2900 2700 2865 2975 2985 2600 2890 3150 3050 2765 yi. 11884 12625 11735 10665 46909 \(\sum_{i=1}^4 \sum_{j=1}^4 y_{ij}^2\) 35350966 39903125 34462725 28455225 138172041 a. Quem são as unidades experimentais? b. Identifique os tratamentos. c. Qual é o número de unidades experimentais utilizadas no experimento? d. Para a validação do experimento, como você utiliza o processo de casualização? e. Ao nível de 5% de significância, conclua se as técnicas de mistura afetam a quantidade de frutos de uma determinada árvore. 2. Um experimento para avaliar o efeito da substituição do milho por soja na ração, no ganho de peso dos animais, utilizou-se um DIC com 5 tratamentos (uma ração padrão com quatro níveis de substituição do milho por soja e um controle) e 6 repetições. Os resultados são apresentados a seguir. P. Subst. Repetições 1 2 3 4 5 6 Sub. 0% 57,37 20,27 13,97 17,16 28,53 10,64 Sub. 2% 51,72 38,20 29,71 45,06 38,81 66,70 Sub. 5% 148,41 91,21 154,89 90,20 130,80 208,90 Sub. 10% 296,42 342,43 204,91 246,20 205,36 224,98 Controle 490,95 407,46 518,16 476,19 580,36 598,14 a) Faça a Análise de Variância com diagnósticos (α = 5%). 16 b) Apresentar os resultados e concluir. 3. Um experimento para avaliar o efeito da ração (Ração 1 a 5) no ganho de peso animal, utilizou-se um DIC com 5 tratamentos e 4 repetições. Os resultados são apresentados a seguir. Repetições Ração 1 2 3 4 1 3,31 6,10 8,53 3,84 2 23,62 26,94 20,16 22,18 3 14,75 25,20 17,56 24,8 4 30,58 30,69 18,54 27,56 5 50,25 45,12 37,25 52,15 a) Faça a Análise de Variância com diagnósticos (α = 5%). b) Apresentar os resultados e concluir. 17 Referências Branco, H. Castello. n.d. “Portal Action.” http://www.portalaction.com.br/anova/161-teste-de-igualdade- das-variancias. Manuelle Meira, Julianna Caldeira e. 2020. “Você Sabe Para Que Servem Os Fertilizantes?” July 2020. https://iusnatura.com.br/fertilizantes/. 18
27
Estatística
UNESP
2
Estatística
UNESP
4
Estatística
UNESP
8
Estatística
UNESP
2
Estatística
UNESP
1
Estatística
UNESP
1
Estatística
UNESP
1
Estatística
UNESP
23
Estatística
UNESP
5
Estatística
UNESP
Texto de pré-visualização
Atividades 1. Seja y_{ij} o número de frutos de uma determinada árvore da j-ésima fileira do campo (cada uma com oito metros quadrados) que recebe a i-ésima técnica de mistura (tratamento). Com a finalidade de verificar produtividade com relação as técnicas de cultivo foram observadas as quantidades e descritas na forma da tabela: \begin{tabular}{cccccc} & Técnica A & Técnica B & Técnica C & Técnica D & Total \\ 1 & 3129 & 3200 & 2800 & 2900 & \\ 2 & 3000 & 3000 & 2900 & 2700 & \\ 3 & 2865 & 2875 & 2985 & 2860 & \\ 4 & 2980 & 3150 & 3050 & 2765 & \\ & 11854 & 12225 & 11735 & 11225 & 46990 \\ \sum y_{ij} & \sum x. & \sum x^2 & \sum \check{x}. & \sum \check{x}^2 & \sum \check{x}_{\check{x}.} \\ & 33539696 & 39033125 & 34462275 & 28455225 & 138172041 \\ \end{tabular} a. Quem são as unidades experimentais? b. Identifique os tratamentos. c. Qual é o número de unidades experimentais utilizadas no experimento? d. Para a validação do experimento, como você utiliza o processo de casualização? e. Ao nível de 5% de significância, conclua se as técnicas de mistura afetam a quantidade de frutos de uma determinada árvore. 2. Um experimento para avaliar o efeito da substituição do milho por soja na ração, no ganho de peso dos animais, utilizou-se um DIC com 5 tratamentos (uma ração padrão com quatro níveis de substituição do milho por soja e um controle) e 6 repetições. Os resultados são apresentados a seguir. \begin{tabular}{lccccccc} P. Subst. & 1 & 2 & 3 & 4 & 5 & 6 \\ \hline Sub. 0\% & 57,3 & 20,7 & 13,7 & 17,4 & 16,8 & 23,3 & 10,6 \\ Sub. 2\% & 61,7 & 28,9 & 29,7 & 41,4 & 25,4 & 38,1 & 67,0 \\ Sub. 5\% & 148,1 & 92,1 & 154,8 & 99,0 & 130,7 & 295,9 \\ Sub. 10\% & 296,4 & 32,4 & 50,9 & 26,4 & 20,9 & 221,8 & 194,9 \\ Controle & 409,4 & 121,6 & 199,7 & 322,8 & 277,2 & 474,1 & 215,8 \\ \end{tabular} a) Faça a Análise de Variância com diagnóstico (\alpha = 5\%). b) Apresentar os resultados e concluir. 3. Um experimento para avaliar o efeito da ração (Ração 1 a 5) no ganho de peso animal, utilizou-se um DIC com 5 tratamentos e 4 repetições. Os resultado são apresentados a seguir. \begin{tabular}{cccccc} Ração & 1 & 2 & 3 & 4 \\ \hline 1 & 3,31 & 6,10 & 5,33 & 3,84 \\ 2 & 24,52 & 26,40 & 21,66 & 22,18 \\ 3 & 14,75 & 29,07 & 15,56 & 24,18 \\ 4 & 30,55 & 26,99 & 17,54 & 27,56 \\ 5 & 50,25 & 45,12 & 37,25 & 32,15 \\ \end{tabular} a) Faça a Análise de Variância com diagnóstico (\alpha = 5\%). b) Apresentar os resultados e concluir. 1) A) j-ésima árvore. B) Diferentes técnicas de mistura. C) 16 unidades experimentais. D) Escolhendo árvores de uma mesma cultivar de maneira aleatória (sorteio). E) Técnica A Técnica B Técnica C Técnica D Total 3129 3200 2800 2600 3000 3300 2900 2700 2865 2975 2985 2600 2890 3150 3050 2765 11884 12625 11735 10665 46909 3535096 6 3990312 5 3446272 5 2845522 5 13817204 1 SQTrat=35350966+39903125+34462725+28455225 4 −138172041 16 =25907257,69 SQTotal=3129 2+3200 2+2800 2+...+3150 2+3050 2+2765 2−138172041 16 =1004185,50 SQRes=25907257 ,69−129536288,4=103629030,8 FV GL SQ QM F calc F tab Tratament o 3 25907257,69 8635752,5 6 1 3,49 Resíduo 12 103629030,7 5 8635752,5 6 Total 15 129536288,4 4 Conclusão: F tab > F calc Pelo teste F, com α=5%, podemos concluir que não existem diferença significativa entre os tratamentos 2) A) P. Subst. 1 2 3 4 5 6 Total Sub. 0% 57,37 20,27 13,97 17,16 28,53 10,64 147,94 Sub. 2% 51,72 38,2 29,71 45,06 38,81 66,7 270,2 Sub. 5% 148,41 91,21 154,89 90,2 130,8 208,9 824,41 Sub. 10% 296,42 342,43 204,91 246,2 205,36 224,98 1520,3 Controle 490,95 407,46 518,16 476,19 580,36 598,14 3071,26 Total 5834,11 SQTrat=147,94 2+270,2 2+824 ,41 2+1520,3 2+3071,26 2 6 −5834 ,11 2 30 =951854 ,72 SQT otal=57,37 2+20,27 2+…+580,36 2+598,14 2−5834 ,11 2 30 =1004185,50 SQRes=1004185,50−951854 ,72=52330,78 FV GL SQ QM F calc F tab Tratament o 4 951854, 7 237963, 7 113,682 5 2,7 Resíduo 25 52330,7 8 2093,23 1 Total 29 1004186 Conclusão: F calc > F tab Pelo teste F, com α=5%, podemos concluir que existe ao menos um tratamento diferente dos demais. B) Teste Tukey DMS=4 ,17∗√ 2093,231 6 =77,89 Controle 511,88 A Sub. 10% 253,38 B Sub. 5% 137,40 C Sub. 2% 45,03 D Sub. 0% 24,66 D Conclusão: O tratamento controle foi o que obteve maior ganho de peso e diferiu-se dos demais. Os tratamentos Sub. 2% e Sub. 0% foram os que obtiveram menor ganho de peso e foram similares entre si e diferiram-se dos demais. 3) A) Repetições Ração 1 2 3 4 Total 1 3,31 6,1 8,53 3,84 21,78 2 23,62 26,94 20,16 22,18 92,9 3 14,75 25,2 17,56 24,8 82,31 4 30,58 30,69 18,54 27,56 107,37 5 50,25 45,12 37,25 52,15 184,77 Total 489,13 SQTrat=21,78 2+92,9 2+82,31 2+107,37 2+184 ,77 2 4 − 489,13 2 20 =3424 ,58 SQTotal=3,31 2+6,1 2+8,53 2+…+45,12 2+37,25 2+52,15 2− 489,13 2 20 =3779,66 SQRes=3779,66−3424 ,58=355,08 FV GL SQ QM F F tab Tratament o 4 3424,58 8 856,147 1 36,1672 6 3,06 Resíduo 15 355,078 2 23,6718 8 Total 19 3779,66 6 Conclusão: F calc > F tab Pelo teste F, com α=5%, podemos concluir que existe ao menos um tratamento diferente dos demais. B) Teste Tukey DMS=2,9∗√ 23,67 4 =7,055 5 46,19 A 4 26,84 B 2 23,23 B 3 20,58 B 1 5,45 C Conclusão: O tratamento 5 obteve maior ganho de peso e diferiu-se dos demais. O tratamento 1 foi o que obteve menor ganho de peso e diferiu-se dos demais. Disciplina Estatística e Experimentação (Engenharia Agronômica) Daisy Santana Ferreira Professora Dra. Miriam Harumi Tsunemi Universidade Estadual Paulista “Júlio de Mesquita Filho.” Campus de Botucatu - SP 04 janeiro 2023 Contents Introdução 2 Conceitos Básicos 4 O Processo de Aleatorização 7 Delineamento Inteiramente Casualizado (DIC) 8 Análise de Variância ou ANOVA do DIC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 Teste de Tukey . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 Teste de Dunnett . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 No Software R: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 Atividades 16 Referências 18 1 Introdução Figure 1: Como funciona o experimento • Teoria: “Os fertilizantes ou adubos são qualquer tipo de substância aplicada ao solo ou tecidos vegetais para fixar um ou mais nutrientes essenciais ao crescimento das plantas. Geralmente, são aplicados na agricultura com o objetivo de melhorar a produção do plantio e conservar os alimentos por mais tempo.” (Manuelle Meira 2020) • Formulação de hipóteses: Há diferença nas alturas das plantas de salsa quanto a quantidade de adubo? H0 : µ0% = µ25% = µ50% H1 : µi ̸= µj Pelo menos duas médias de tratamento diferem entre si. • Obtenção de observações: Table 1: Medidas, em centímetro, da maior altura de salsa dentro das parcelas A B C 1 NA 3.60 6.30 2 6.00 4.80 6.90 3 2.00 2.50 2.10 4 3.00 5.50 7.00 5 2.50 NA 4.00 6 2.30 5.50 2.00 7 4.00 2.30 2.80 8 4.90 1.40 6.20 9 NA 3.00 5.00 10 4.30 3.40 NA • Verificação das hipóteses (afirmação ou negação da teoria): (. . . ) 2 Figure 2: Alguns passos para a realização de um experimento 3 Conceitos Básicos HIPÓTESE: As hipóteses científicas são premissas assumidas pelo pesquisador como possíveis soluções para as relações causa-efeito entre características dos elementos envolvidos no problema em foco. • H0: é a hipótese inicial. Nela, assumimos que as variações ocorridas são de modo natural, ou que não há diferença entre os tratamentos. • H1: é a hipótese de contraponto. Nela, assumimos as variações ocorridas esperadas ou idealizadas pelo pesquisador. Exemplo: Estudar o efeito de dose do adubo no crescimento da planta de salsa. H0 : µ0% = µ25% = µ50% H1 : µi ̸= µj Pelo menos duas médias de tratamento diferem entre si. TRATAMENTO OU FATOR: São quantidades (controláveis ou não) de um processo ou experimento que podem afetar ou alterar seu desempenho. Exemplo: Quantidade de adubo na terra (níveis de nutrientes na terra): • Para o tratamento de 0% adubo (A), não utilizamos adubo; • Para o tratamento de 25% adubo (B), utilizamos 2 copos e meio de adubo; • Para o tratamento de 50% adubo (C), utilizamos 5 copos de adubo. UNIDADE EXPERIMENTAL: É a unidade que vai receber o tratamento e fornecer os dados que deverão refletir o seu efeito. Exemplo: Uma fileira de sacos de mudas Figure 3: Plantação de salsa codificada e aleatorizada • Em engenharia, as unidades experimental costumam ser corpos de prova, em medicina, são indivíduos (pessoas), em agronomia, são plantas e/ou animais. • É desejável fazer com que as unidades experimentais sejam tão homogêneas quanto possível. 4 ERRO EXPERIMENTAL: É o efeito de fatores que atuam de forma aleatória e que não são passíveis de controle pelo experimentador. • Temperatura, chuva e insetos. Figure 4: Solução para diminuir o erro experimental no experimento sobre o desenvolvimento da planta de salsa: estufa. BORDADURA: Quando existe a possibilidade de uma parcela ser influenciada pelos tratamentos aplicados nas parcelas vizinhas, cada parcela deverá conter uma quantidade de material a mais para servir de proteção contra esta interferência. Figure 5: Descrição da área utilizada VARIÁVEL RESPOSTA: É a variável mensurada usada para avaliar o efeito de tratamentos. Exemplo: Altura das plantas de salsa em centímetros. 5 DELINEAMENTO EXPERIMENTAL: É o plano utilizado na experimentação e implica na forma como os tratamentos serão atribuídos às unidades experimentais. Exemplos: a) Delineamento Inteiramente Casualizado (DIC) b) Delineamento em Blocos Casualizados (DBC) c) Delineamento em Quadrado Latino (DQL) PRINCÍPIO DA REPETIÇÃO: Em termos estatísticos, o uso do princípio da repetição tem por finali- dade obter uma estimativa do erro experimental. • A repetição consiste em aplicar o mesmo tratamento a várias unidades experimentais, ou seja, consiste na reprodução do experimento básico. • Quanto maior é o número de repetições, espera-se que seja maior a precisão do experimento. • É obrigatório em todo experimento! PRINCÍPIO DA CASUALIZAÇÃO: Consiste em distribuir ao acaso os tratamentos às unidades ex- perimentais, de forma que todos os tratamentos tenham a mesma chance de serem designados a qualquer uma das unidades experimentais. Figure 6: Posições numeradas para a aleatorização das parcelas em estudo. • É um procedimento que garante a validade de um estudo experimental. 6 • É obrigatório em todo experimento! PRINCÍPIO DO CONTROLE NA CASUALIZAÇÃO: O uso do princípio do controle na casualização só é recomendado quando as unidades experimentais não são ou não estão sob condições homogêneas devido a influência de um ou outro. • A finalidade, do uso do princípio do controle na casualização, é reduzir o efeito do erro experimental através do controle da variação existente entre as unidades experimentais. • Não é obrigatório em todo experimento! O Processo de Aleatorização Exemplo 1: Produtividade, em toneladas por hectare, de grãos de três cultivares de milho em experimento instalado em DIC. Figure 7: Croqui do experimento • Tratamentos: 3 cultivares de milho; • Unidade experimental ou parcela: área plantada; • Delineamento de experimento: Delineamento Inteiramente Casualizado (DIC). Repetição Amarelo Vermelho Roxo 1 6,0 5,3 5,1 2 4,6 3,8 2,5 3 5,4 4,5 3,8 4 5,2 4,1 3,7 Totais 21,2 17,7 15,1 7 Como saber se os cultivares diferem entre si quanto a produtividade média de grãos? Delineamento Inteiramente Casualizado (DIC) • Princípios Básicos da Experimentação: repetição e casualização; • O mais simples dos delineamentos para controle do erro experimental; • Utilização condicionada a disponibilidade de unidades experimentais homogêneas: casa-de-vegetação, laboratório, terreno sabiamente homogêneo. Suponha que temos a tratamentos ou diferentes níveis de um único fator que se queira comparar. A resposta observada de cada um dos a tratamentos é uma variável aleatória. Os dados seriam da forma: \begin{center} \begin{tabular}{llllll} Tratamentos & Observações & Totais & Médias \\ 1 & y_{11} & y_{12} & \ldots & y_{1b} & y_1. & \overline{y}_1. \\ 2 & y_{21} & y_{22} & \ldots & y_{2b} & y_2. & \overline{y}_2. \\ \vdots & \vdots & \vdots & \ldots & \vdots & \vdots & \vdots \\ a & y_{a1} & y_{a2} & \ldots & y_{ab} & y_a. & \overline{y}_a. \\ \end{tabular} \end{center} em que y_{ij} representa a b-ésima observação do a-ésimo tratamento; \begin{center} \[ y_i. = \sum_{j=1}^{b} y_{ij} \quad \overline{y}_i. = \frac{\sum_{j=1}^{b} y_{ij}}{b} \quad e \quad \overline{y}_{..} = \frac{\sum_{i=1}^{a} \sum_{j=1}^{b} y_{ij}}{ab} \] \end{center} O modelo estatístico para o delineamento inteiramente casualizado é: \begin{equation} y_{ij} = \mu + \tau_i + \epsilon_{ij}, \quad \left\{ \begin{array}{ll} i = 1, 2, \ldots, a \\ j = 1, 2, \ldots, b \end{array} \right. \end{equation} • y_{ij} = valor observado na unidade experimental que recebeu o tratamento i, repetição j; • \mu = efeito geral da média; • \tau_i = efeito do tratamento i; • \epsilon_{ij} = erro aleatório (resíduo). O objetivo é, em geral, verificar se existe diferença significativa entre pelo menos duas médias de tratamentos. As hipóteses testadas são: \begin{equation} H_0 : \mu_1 = \mu_2 = \ldots = \mu_a \end{equation} \begin{equation} H_1 : \mu_i \neq \mu_j \quad \text{Pelo menos duas médias de tratamento diferem entre si.} \end{equation} • Uma forma equivalente de descrever as hipóteses anteriores é em termos dos efeitos dos tratamentos \tau_i, que é: \begin{equation} H_0 : \tau_1 = \tau_2 = \ldots = \tau_a = 0 \end{equation} \begin{equation} H_1 : \tau_i \neq 0 \quad \text{Pelo menos um tratamento.} \end{equation} A análise de variância para testar essas hipóteses só é válida se forem satisfeitas as seguintes condições: (1) Aditividade: os efeitos devem se somar (não há interação); (2) Independência: os erros (ϵij) devem ser independentes; (3) Normalidade: os erros (ϵij) devem possuir uma distribuição normal; (4) Homocedasticidade ou homogeneidade de variâncias: os erros (ϵij) devem possuir uma variância comum σ2. Análise de Variância ou ANOVA do DIC Quadro da Análise de Variância: Causas de Variação g.l. S.Q. Q.M. Fcalc Ftab Tratamentos a − 1 SQTrat SQTrat a−1 QMTrat QMRes Fα;a−1,a(b−1) Resíduo a(b − 1) SQRes SQRes a(b−1) Total ab − 1 SQTotal Fazendo-se as suposição, a estatística apropriada para H0 : µ1 = µ2 = · · · = µa é Fcal = QMTrat QMRes Se Fcal > Fα;(a−1),a(b−1), rejeita-se H0. Exemplo 1: Produtividade, em toneladas por hectare, de grãos de três cultivares de milho em experimento instalado em DIC. Repetição Amarelo (A) Vermelho (V) Roxo (R) 1 6,0 5,3 5,1 2 4,6 3,8 2,5 3 5,4 4,5 3,8 4 5,2 4,1 3,7 Totais yA.= 21,2 yV .=17,7 yR.=15,1 Como saber se os cultivares diferem entre si quanto a produtividade média de grãos? a) Hipóteses H0 : µA = µV = µR H1 : µi ̸= µj Pelo menos duas médias de tratamento diferem entre si. b) Quadro da Análise de Variância ou ANOVA do DIC CV GL SQ QM Fcal. Ftab. variedades 3 - 1 = 2 4,685 2,343 3,728 4,256 resíduo 3(4-1) = 9 5,655 0,628 TOTAL 12 - 1 = 11 10,34 • a=3 e b=4 9 Soma dos quadrados: • Soma de quadrado totais: \[ SQ_{total} = \sum_{i=1}^{a} \sum_{j=1}^{b} y_{ij}^2 - \frac{\left( \sum_{i=1}^{a} \sum_{j=1}^{b} y_{ij} \right)^2}{ab} \] \[ = (6,0^2 + 5,3^2 + \ldots + 3,7^2) - \frac{(6,0 + 5,3 + \ldots + 3,7)^2}{12} = 253,34 - \frac{54^2}{12} = 10,34 \] • Soma de quadrado tratamentos: \[ SQ_{trat} = \frac{1}{b} \sum_{i=1}^{a} y_{i.}^2 - \frac{\left( \sum_{i=1}^{a} \sum_{j=1}^{b} y_{ij} \right)^2}{ab} \] \[ = \frac{21,2^2 + 17,7^2 + 15,1^2}{4} - \frac{(6,0 + 5,3 + \ldots + 3,7)^2}{12} = 247,685 - \frac{54^2}{12} = 4,685 \] • Soma de quadrado de resíduo ou erro: \[ SQ_{res} = SQ_{total} - SQ_{trat} = 10,34 - 4,685 = 5,655 \] Quadrados médios: • Quadrado médio de tratamento: \[ QM_{trat} = \frac{SQ_{trat}}{GL_{trat.}} = \frac{4,685 \,}{2} = 2,3425 \] • Quadrado médio de resíduo: \[ QM_{res.} = \frac{SQ_{res.}}{GL_{res.}} = \frac{5,655}{9} = 0,628 \] Estatística do teste e ponto crítico: \[ F_{cal} = \frac{QM_{trat}}{QM_{res.}} = \frac{2,3425}{0,628} = 3,7281 \] \begin{align*} F_{tab.} = F(\text{GL Trat; GL Res, 5\%}) = F_{2,9,5\%} = 4,26 \\ F_{cal} > F_{tab.} \quad (3,728 < 4,26) \rightarrow \text{Não rejeita-se } H_0 \end{align*} Ao nível de 5% de significância, podemos dizer que não há diferença nas demais médias de tratamentos. Antes de recorrer a ANOVA é necessário verificar os pressupostos que se resumo em: εi iid ∼ N(0, σ2) • Verificação dos pressupostos para Normalidade O teste de normalidade foi proposto em 1965 com o nome de teste Shapiro-Wilk em que suas hipóteses são: H0 : A amostra provém de uma população Normal H1 : A amostra não provém de uma população Normal • Verificação dos pressupostos para a homocedasticidade Para verificar se as variâncias dos tratamentos são iguais podemos realizar o teste de Bartlet onde as hipóteses testadas são: H0: Igualdade das variâncias H1: Não há igualdade das variâncias É importante ressaltar que o teste de Bartlett é sensível em relação à hipótese de normalidade dos dados. Se rejeitarmos a hipótese de normalidade, é melhor utilizarmos o teste proposto por Levene. Porém, se a hipótese de normalidade não for violada, o teste proposto por Bartlett tem um comportamento melhor que o teste proposto por Levene (Branco, n.d.). Exemplo 2: Para comparar a produtividade de quatro variedades de milho, um agrônomo tomou vinte parcelas similares e distribuiu, inteiramente ao acaso, cada uma das 4 variedades em 5 parcelas experimentais. A partir dos dados experimentais fornecidos abaixo, é possível concluir que existe diferença significativa entre as variedades com relação a produtividade, utilizando o nível de significância de 5%? Variedades A B C D 25 31 22 33 26 25 26 29 20 28 28 31 23 27 25 34 21 24 29 28 Totais yA. =115 yB. =135 yC. =130 yD. =155 Médias ¯ yA. = 23 ¯ yB. =27 ¯ yC. =26 ¯ yD. =31 • a=4 e b=5 a) Hipóteses H0 : µA = µB = µC = µD H1 : µi ̸= µj Pelo menos duas médias de tratamento diferem entre si. 11 b) Quadro da Análise de Variância ou ANOVA do DIC CV GL SQ QM Fcal. Ftab. variedades 3 163,75 54,58 7,80 3,24 resíduo 16 112,00 7,00 TOTAL 19 275,75 Fcal = 54, 58 7, 00 = 7, 80 Ftab. = F 3; 16; 0,05 = 3, 24 Fcal > Ftab. (7, 80 > 3, 24) → Rejeita-se H0 Ao nível de 5% de significância, podemos dizer que pelo menos uma média dos tratamentos é estatisticamente diferentes das demais médias de tratamentos. Teste de Tukey a) Hipóteses H0 : µi = µj H1 : µi ̸= µj b) Cálculo da diferença mínima significativa (DMS) do Tukey: ∆ = q · 2√ QMRes a em que q = qα (a, GLRes) é o valor tabelado da amplitude total estudentizada, que é obtido em função do nível α de significância do teste, número de níveis do fator em estudo (a) e número de graus de liberdade do resíduo (GLRes) da análise de variância (ANOVA). • q = q5% (4, 16) = 4, 05 (tabela para o teste de Tukey). – Na Tabela A4a: a=4 e f2=16. • ∆ = 4, 05 · √7,0 4 = 2, 14 (DMS) c) Classificação das médias em ordem decrescente ˆµD = 31 a ˆµB = 27 b ˆµC = 26 b ˆµA = 23 c d) Contrastes 2 a 2 12 C1 = ˆµD − ˆµB = 31 − 27 = 4 > ∆ ⇒ Rejeito H0 ∗ C2 = ˆµD − ˆµC = 31 − 26 = 5 > ∆ ⇒ Rejeito H0 ∗ C3 = ˆµD − ˆµA = 31 − 23 = 8 > ∆ ⇒ Rejeito H0 C2 = ˆµB − ˆµC = 27 − 26 = 1 < ∆ ⇒ Não rejeito H0 C3 = ˆµB − ˆµA = 27 − 23 = 4 > ∆ ⇒ Rejeito H0 C4 = ˆµC − ˆµA = 26 − 23 = 3 > ∆ ⇒ Rejeito H0 e) Conclusão: Médias seguidas de mesma letra, não diferem entre si pelo teste de Tukey a 5% de sig- nificância. Teste de Dunnett Exemplo 2: Para comparar a produtividade de quatro variedades de milho, um agrônomo tomou vinte parcelas similares e distribuiu, inteiramente ao acaso, cada uma das 4 variedades em 5 parcelas experimentais. A partir dos dados experimentais fornecidos abaixo, é possível concluir que existe diferença significativa entre as variedades com relação a produtividade, utilizando o nível de significância de 5%? Variedades A B C D 25 31 22 33 26 25 26 29 20 28 28 31 23 27 25 34 21 24 29 28 Totais 115 135 130 155 Médias 23 27 26 31 Considere o tratamento C como controle e o nível de 5% de probabilidade. Quais tratamentos são iguais ao grupo controle e quais são diferentes? • Quadro da Análise de Variância ou ANOVA do DIC CV GL SQ QM Fcal. Ftab. variedades 3 163,75 54,58 7,80 3,24 resíduo 16 112,00 7,00 TOTAL 19 275,75 a) Hipóteses H0 : µi = µc H1 : µi ̸= µc b) Cálculo da diferença mínima significativa (DMS) do Dunnett (D) 13 d = ( a, GLRes)α d = (4, 16)5% = 2, 77 D = d · √2 · QMRes b = 2, 77 · √2 × 7, 0 5 = 2, 77 · 3, 74 5 = 2, 0729 c) Classificacãa das médias: µA = 23∗ µB = 27ns µD = 31∗ d) Contrastes 2 a 2 com o grupo controle: C1 = |ˆµA − ˆµC| = |23 − 26| = | − 3| > D ⇒ Rejeito H0 C2 = |ˆµB − ˆµC| = |27 − 26| = |1| < D ⇒ Não rejeito H0 C3 = |ˆµD − ˆµC| = |31 − 26| = |5| > D ⇒ Rejeito H0 e) Conclusão: médias seguidas de asterisco diferem do grupo controle pelo teste de Dunnett a 5% de significância. No Software R: Exemplo 1: rm(list = ls(all=TRUE)) # Limpa a memória do R # Função que cola os dados selecionados e copiados do excel exemplo2 <- read.delim("clipboard"); exemplo2 attach(exemplo1) ## Análise exploratória dos dados MediaTrat <- tapply(Producao, Milho, mean) tapply(Producao, Milho, var) tapply(Producao, Milho, sd) boxplot(split(Producao, Milho), xlab = "Tratamentos", ylab = "Produção", col = "green") points(MediaTrat, col="red", pch="*", cex=1.5) ## Teste de homogeneidade de variâncias # H0: As variâncias são homogêneas bartlett.test(Producao ~ Milho) ## Modelo estatístico e ANOVA Modelo <- aov(Producao ~ Milho) anova(Modelo) 14 ## Verificar independência dos erros plot(residuals(Modelo),pch=19,ylab = "Resíduos", col= "blue") abline(h=0,col="red") ## Teste de normalidade dos resíduos (gráfico e p-valor) # H0: Os resíduos são normais shapiro.test(Modelo$residuals) ## Pacote do R install.packages(ExpDes.pt) library(ExpDes.pt) dic(Milho, Producao, # Tratamento, variável resposta quali = TRUE, # Tratamento é qualitativo mcomp = "tukey", # Teste Tukey nl = FALSE, # Realizar regressão hvar = 'bartlett', # Teste para homocedasticidade nas variâncias sigT = 0.05, # Nível de significância para o teste T sigF = 0.05 # Nível de significância para o teste F ) Exemplo 2: library(readxl) Exemplo2 <- read_excel("G:/Meu Drive/3 semestre/PAADES/Aula/Aula_04-01-2023/Exemplo2.xlsx") attach(Exemplo2) ## Modelo estatístico e ANOVA Modelo <- aov(Producao ~ Variedade) anova(Modelo) # ------- Testes de comparações múltiplas ------- ## - Teste de Tukey #TukeyHSD(Modelo,as.factor("Variedade"),ordered=TRUE) library(agricolae) library(gtools) HSD.test(Modelo,as.factor("Variedade"),console=TRUE) ## - Teste de Dunnett # Trat. C é a testemunha library(DescTools) DunnettTest(x=Producao, g=Variedade) require(asbio) with(Exemplo2, pairw.anova(y=Producao, x=Variedade, control="C", method="dunnett")) ## - Teste de Duncan #duncan.test(Modelo,"FTR",alpha=0.05) # Defina o alpha 15 ## -- Teste de Student-Newman-Keuls #SNK.test(Modelo, "TR", alpha=0.05) # Defina o alpha library(ExpDes.pt) dic(Variedade, Producao, # Tratamento, variável resposta quali = TRUE, # Tratamento é qualitativo mcomp = "tukey", # Teste Tukey nl = FALSE, # Realizar regressão hvar = 'bartlett', # Teste para homocedasticidade nas variâncias sigT = 0.05, # Nível de significância para o teste T sigF = 0.05 # Nível de significância para o teste F ) Atividades 1. Seja yij o número de frutos de uma determinada árvore da j-ésima fileira do campo (cada uma com oito metros quadrados) que recebeu a i-ésima técnica de mistura (tratamento). Com a finalidade de verificar produtividade com relação as técnicas de cultivo foram observadas as quantidades e descritas na forma da tabela: Técnica A Técnica B Técnica C Técnica D Total 3129 3200 2800 2600 3000 3300 2900 2700 2865 2975 2985 2600 2890 3150 3050 2765 yi. 11884 12625 11735 10665 46909 \(\sum_{i=1}^4 \sum_{j=1}^4 y_{ij}^2\) 35350966 39903125 34462725 28455225 138172041 a. Quem são as unidades experimentais? b. Identifique os tratamentos. c. Qual é o número de unidades experimentais utilizadas no experimento? d. Para a validação do experimento, como você utiliza o processo de casualização? e. Ao nível de 5% de significância, conclua se as técnicas de mistura afetam a quantidade de frutos de uma determinada árvore. 2. Um experimento para avaliar o efeito da substituição do milho por soja na ração, no ganho de peso dos animais, utilizou-se um DIC com 5 tratamentos (uma ração padrão com quatro níveis de substituição do milho por soja e um controle) e 6 repetições. Os resultados são apresentados a seguir. P. Subst. Repetições 1 2 3 4 5 6 Sub. 0% 57,37 20,27 13,97 17,16 28,53 10,64 Sub. 2% 51,72 38,20 29,71 45,06 38,81 66,70 Sub. 5% 148,41 91,21 154,89 90,20 130,80 208,90 Sub. 10% 296,42 342,43 204,91 246,20 205,36 224,98 Controle 490,95 407,46 518,16 476,19 580,36 598,14 a) Faça a Análise de Variância com diagnósticos (α = 5%). 16 b) Apresentar os resultados e concluir. 3. Um experimento para avaliar o efeito da ração (Ração 1 a 5) no ganho de peso animal, utilizou-se um DIC com 5 tratamentos e 4 repetições. Os resultados são apresentados a seguir. Repetições Ração 1 2 3 4 1 3,31 6,10 8,53 3,84 2 23,62 26,94 20,16 22,18 3 14,75 25,20 17,56 24,8 4 30,58 30,69 18,54 27,56 5 50,25 45,12 37,25 52,15 a) Faça a Análise de Variância com diagnósticos (α = 5%). b) Apresentar os resultados e concluir. 17 Referências Branco, H. Castello. n.d. “Portal Action.” http://www.portalaction.com.br/anova/161-teste-de-igualdade- das-variancias. Manuelle Meira, Julianna Caldeira e. 2020. “Você Sabe Para Que Servem Os Fertilizantes?” July 2020. https://iusnatura.com.br/fertilizantes/. 18