·
Ciências Contábeis ·
Estatística 2
· 2022/1
Send your question to AI and receive an answer instantly
Recommended for you
31
Slide Análise de Variância-2021 2
Estatística 2
UFBA
5
Exercício de Fixação Regressão Linear Simples Unidade 3-2021 1
Estatística 2
UFBA
5
Lista 2-2021 2
Estatística 2
UFBA
63
Slide Análise de Regressão-2021 2
Estatística 2
UFBA
2
Lista 4 Teste de Aderencia e Teste de Independencia-2021 1
Estatística 2
UFBA
7
Lista 3-2021 1
Estatística 2
UFBA
1
Atividade Correlação e Regressão-2021 2
Estatística 2
UFBA
8
Atividade 2 Resolvida-2022 1
Estatística 2
UFBA
3
Lista de Exercícios 5 Análise de Variância-2021 1
Estatística 2
UFBA
9
Slide Teste de Aderencia-2021 2
Estatística 2
UFBA
Preview text
Comparação de Médias Populacionais Nos estudos anteriores sobre teste de hipóteses, foi levado em consideração apenas uma única média; No entanto, não é raro encontrar situações em que se deseja verificar se há diferenças significativas entre as médias de k populações distintas; A análise usada para comparação de k médias populacionais ou de tratamentos é comumente realizada por uma Análise de Variância (ANOVA). Conceitos Alguns termos técnicos utilizados na Análise de Variância: 1. Fator e Nível Fator é uma variável independente obtida quando é realizado um estudo de investigação e o nível é a forma particular deste fator. Por exemplo, em um estudo sobre os efeitos da presença de três tipos de diferentes soluções de açúcar (glicose, sacarose e frutose) no crescimento de bactérias, o fator é o açúcar e cada tipo de solução é um nível em estudo. Neste caso, o fator açúcar tem três níveis (glicose, sacarose e frutose) Conceitos 1. Fator e Nível Por exemplo, um fabricante de papel, usado para a confecção de sacolas de mercearia, realiza um experimento para investigar se a concentração de madeira de lei em polpa (5%, 10%, 15% e 20%) tem efeito sobre a resistência à tração das sacolas fabricadas da polpa. A concentração de madeira de lei é o fator sob estudo e os níveis são as diferentes aplicações, diz-se que o fator concentração de madeira de lei tem quatro níveis (5%, 10%, 15% e 20%). Conceitos 2. Tratamento É uma condição imposta que se deseja medir ou avaliar em um experimento; Em outras palavras, denomina-se de tratamento, o nível de um fator sob análise ou uma combinação de fatores e níveis em estudo com dois ou mais fatores. Por exemplo, se o interesse é estudar os efeitos de cinco diferentes marcas de gasolina na eficiência operacional (milhas/galão) de motores de automóvel, o fator é a marca e cada marca constitui um tratamento. Conceitos 2. Tratamento Por exemplo, um estudo para comparar duas diferentes marcas de canetas (A e B) e dois diferentes tipos de lavagem (1 e 2) em relação à capacidade de remover manchas em um determinado tipo de tecido, existem 4 combinações possíveis, a saber: marca A e lavagem 1, marca A e lavagem 2, marca B e lavagem 1 e, marca B e lavagem 2. Cada uma destas combinações é chamada de tratamento, de modo que há 4 tratamentos diferentes envolvidos. 3. Unidade experimental A aplicação do tratamento é feita na unidade experimental; Dependendo do experimento, a unidade experimental pode ser um motor, uma peça do motor, uma porção de algum alimento... Conceitos 2. Tratamento Por exemplo, um estudo para comparar duas diferentes marcas de canetas (A e B) e dois diferentes tipos de lavagem (1 e 2) em relação à capacidade de remover manchas em um determinado tipo de tecido, existem 4 combinações possíveis, a saber: marca A e lavagem 1, marca A e lavagem 2, marca B e lavagem 1 e, marca B e lavagem 2. Cada uma destas combinações é chamada de tratamento, de modo que há 4 tratamentos diferentes envolvidos. 3. Unidade experimental A aplicação do tratamento é feita na unidade experimental; Dependendo do experimento, a unidade experimental pode ser um motor, uma peça do motor, uma porção de algum alimento... Análise de Variância Suponha um procedimento experimental com k tratamentos (populações) ou diferentes níveis de um único fator; A variável resposta para cada k tratamento é uma variável aleatória; Na tabela a seguir, 𝑌𝑖𝑗 é a observação da j-ésima unidade experimental no i- ésimo tratamento ou fator; Existem n observações no i-ésimo tratamento. Análise de Variância Em que 𝒚𝒊. representa a soma total das observações do i-ésimo tratamento; ഥ𝒚𝒊. representa a média das observações do i-ésimo tratamento; 𝒚.. a soma de todas as observações e ത𝑦.. representa a média de todas as observações, denominada média global amostral. Análise de Variância em 𝑁 = 𝑛 × 𝑘, total de número observações Análise de Variância Assim, suponha k tratamentos, n observações e os valores numéricos das observações representados por 𝑦𝑖𝑗; 𝑌𝑖𝑗 = 𝜇𝑖 +𝜖𝑖𝑗, i = 1,2,...,k e j= 1,2,...,n • 𝑌𝑖𝑗 é a observação do i-ésimo tratamento na j-ésima unidade experimenta, 𝜇𝑖 é a média do i-ésimo nível do fator ou tratamento, sendo um valor fixo e desconhecido e 𝜖𝑖𝑗 é o erro aleatório associado ao i-ésimo tratamento na j-ésima unidade experimental assumido 𝜖𝑖𝑗~ N(0; 𝜎2 ), independentes e identicamente distribuído. • 𝑌𝑖𝑗 ~ 𝑁(𝜇𝑖 , 𝜎2) 𝜇𝑖 = 𝜇 + 𝜏𝑖 , i = 1,2,...,k Análise de Variância A equação anterior torna-se 𝑌𝑖𝑗 =𝜇 + 𝜏𝑖 + 𝜖𝑖𝑗, i = 1,2,...,k e j= 1,2,...,n 𝜇 é o parâmetro média comum a todos os tratamentos chamado de média global e 𝜏𝑖 é o parâmetro do i-ésimo tratamento, denominado efeito do tratamento; 𝜖𝑖𝑗 é o erro aleatório associado ao i-ésimo tratamento na j-ésima unidade experimental assumido como: 𝜖𝑖𝑗~ N(0; 𝜎2 ), independentes e identicamente distribuído. Análise de um modelo com efeitos fixos O objetivo será o de testar hipóteses sobre os efeitos dos tratamentos; as hipóteses apropriadas são: Assim, as hipóteses apropriadas são: Análise de um modelo com efeitos fixos O objetivo será o de testar hipóteses sobre os efeitos dos tratamentos; As hipóteses apropriadas são: A hipótese nula supõe que as observações amostrais dentro de cada tratamento podem ser vistas como provenientes de populações com médias iguais. Análise de um modelo com efeitos fixos Como 𝜇𝑖 = 𝜇 + 𝜏𝑖 , i = 1,2,...,k; É possível reescrever as hipóteses acima em termos dos efeitos dos tratamentos Testando se os efeitos dos tratamentos (𝜏𝑖) são iguais a zero. Análise de um modelo com efeitos fixos É necessário assumir que : Decomposição da soma total de quadrado Esta subdividida em duas partes da seguinte forma: : • O termo do lado esquerdo é a soma dos quadrados das observações em relação à média global e representa uma medida da variabilidade total dos dados, denotada por 𝑆𝑆𝑇; • O primeiro termo do lado direito é a soma dos quadrados das diferenças entre as médias de cada tratamento e a média global sendo denotada por 𝑆𝑆𝑇𝑟𝑎𝑡𝑎𝑚𝑒𝑛𝑡𝑜 (diferença entre os grupos de tratamento) ; • O segundo termo do lado direito é a soma de quadrados das diferenças de cada observação dentro dos tratamentos em relação à média do tratamento (variação dentro do grupo), sendo denotado por 𝑆𝑆𝐸. Decomposição da soma total de quadrado Em outras palavras A 𝑆𝑆𝑇 é a soma de quadrados devido ao tratamento 𝑆𝑆𝑇𝑟𝑎𝑡𝑎𝑚𝑒𝑛𝑡𝑜 (ou seja, entre tratamentos), e 𝑆𝑆𝐸 a soma de quadrados residual (ou seja, dentro dos tratamentos). Simbolicamente, podemos representar Decomposição da soma total de quadrado Decomposição da soma total de quadrado Consequentemente, quando utiliza o procedimento de ANOVA, rejeita-se a hipótese de nula 𝐻0 em favor de 𝐻1 , a um nível de significância 𝛼, se 𝐹 calculado > 𝐹[𝛼 ; 𝑘−1 ,(𝑁−𝑘)] , ou seja, existem evidências de diferença significativa entre pelo menos um par de médias de tratamentos; Ou se o p-valor < 𝛼, rejeitamos a hipótese 𝐻0. Teste de Tuckey O procedimento seguinte quando se rejeita a hipótese nula na análise de variância é o de comparar as médias de tratamentos utilizando algum teste de comparação de médias ou contrastes para identificar qual(is) tratamento(s) é (são) diferente(s); O teste de Tukey permite testar qualquer contraste, sempre, entre duas médias de tratamentos. para todo i ≠ j Teste de Tuckey O teste proposto por Tukey baseia-se na diferença significante HSD=Δ; q é o valor tabelado e MSE é o quadrado médio dos resíduos. O valor de q depende do número de tratamentos(K) e do número de graus de liberdade associada com a soma de quadrados dos resíduos( ). Amplitude q para os procedimentos de Tukey gl (f*) α 2 3 4 5 6 7 8 9 10 5 0,05 3,64 4,60 5,22 5,67 6,03 6,33 6,58 6,80 6,99 0,01 5,70 6,98 7,80 8,42 8,91 9,32 9,67 9,97 10,24 6 0,05 3,46 4,33 4,94 5,36 5,71 6,00 6,24 6,45 6,61 0,01 5,24 6,16 6,90 7,45 7,91 8,32 8,61 8,87 9,10 7 0,05 3,34 4,16 4,68 5,06 5,36 5,61 5,82 6,00 6,16 0,01 4,95 5,85 6,55 7,08 7,54 7,91 8,17 8,41 8,62 8 0,05 3,26 4,04 4,53 4,89 5,17 5,40 5,60 5,77 5,92 0,01 4,75 5,64 6,24 6,74 7,19 7,55 7,80 8,03 8,23 9 0,05 3,20 3,96 4,42 4,77 5,04 5,24 5,43 5,59 5,74 0,01 4,60 5,46 6,03 6,51 6,95 7,29 7,53 7,74 7,93 10 0,05 3,15 3,88 4,33 4,65 4,91 5,12 5,30 5,46 5,61 0,01 4,48 5,29 5,85 6,32 6,74 7,07 7,30 7,51 7,69 11 0,05 3,11 3,82 4,26 4,57 4,82 5,03 5,20 5,35 5,49 0,01 4,39 5,15 5,68 6,15 6,56 6,88 7,11 7,31 7,49 12 0,05 3,08 3,77 4,20 4,50 4,74 4,93 5,09 5,24 5,37 0,01 4,32 5,05 5,56 6,02 6,42 6,73 6,95 7,15 7,32 13 0,05 3,06 3,73 4,15 4,44 4,68 4,86 5,03 5,17 5,30 0,01 4,26 4,96 5,46 5,91 6,29 6,59 6,80 6,98 7,15 14 0,05 3,03 3,70 4,11 4,38 4,61 4,79 4,94 5,08 5,20 0,01 4,21 4,89 5,38 5,82 6,19 6,49 6,68 6,86 7,02 15 0,05 3,01 3,67 4,07 4,34 4,57 4,74 4,88 5,01 5,13 0,01 4,17 4,84 5,32 5,75 6,11 6,40 6,59 6,75 6,91 16 0,05 3,00 3,65 4,03 4,30 4,52 4,68 4,82 4,95 5,06 0,01 4,13 4,79 5,27 5,69 6,05 6,33 6,52 6,68 6,83 17 0,05 2,98 3,63 4,02 4,28 4,49 4,65 4,78 4,91 5,02 0,01 4,10 4,74 5,22 5,64 5,98 6,26 6,44 6,60 6,74 18 0,05 2,97 3,61 4,00 4,26 4,47 4,62 4,75 4,87 4,98 0,01 4,07 4,70 5,18 5,59 5,93 6,20 6,38 6,53 6,67 19 0,05 2,95 3,58 3,96 4,23 4,43 4,58 4,71 4,82 4,93 0,01 4,05 4,67 5,13 5,52 5,86 6,12 6,29 6,44 6,57 20 0,05 2,92 3,53 3,90 4,17 4,36 4,50 4,62 4,73 4,83 0,01 4,02 4,62 5,07 5,46 5,78 6,03 6,19 6,33 6,46 Teste de Tuckey Deve-se determinar um nível de significância 𝛼 para o teste; Teste de Tuckey • Exemplo: Um fabricante de papel usado para a confecção de sacolas de mercearia está interessado em melhorar a força de resistência do produto. Uma das engenheiras responsáveis pelo estudo decide investigar quatro níveis de concentração de madeira de lei: 5%, 10%, 15% e 20%. Ela decide, também, fazer seis repetições de teste de cada nível de concentração usando uma usina-piloto. Teste de Tuckey • O modelo de análise de variância adotado é dado por: 𝑌𝑖𝑗 =𝜇 + 𝜏𝑖 + 𝜖𝑖𝑗, i = 1,2,3,4 e j= 1,2,3,4,5,6 𝑌𝑖𝑗 = é a força de resistência do papel observada na j-ésima sacola para a i-ésima concentração de madeira de lei; µ = a média geral; 𝜏𝑖 é o efeito da i-ésima concentração de madeira de lei; 𝜖𝑖𝑗 é o efeito do erro experimental. Teste de Tuckey Para comparar se as médias das forças de resistências do papel, para fabricação de sacolas, são diferentes quando é usado diferentes tipos de concentrações de madeira de lei, será usado a análise de variância; As hipóteses estatísticas a serem testadas são: 𝐻0: 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4 (A força de resistência média do papel são as mesmas nas quatro concentrações de madeira de lei analisadas) 𝐻1 : Pelos menos uma das médias, da força de resistência do papel, é diferente das demais. Teste de Tuckey A soma de quadrados para compor a Tabela da Análise de Variância é calculada conforme as equações Uma vez calculadas as duas somas de quadrados, obtemos sem dificuldades a terceira soma de quadrados conforme apresenta adiante: Teste de Tuckey Os resultados estão resumidos na Tabela da Análise de Variância a seguir. Como α = 5%, 𝑔𝑟𝑎𝑢 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑎𝑑𝑒𝑑𝑒 = 3 𝑒 20, 𝑙𝑜𝑔𝑜 𝐹𝑡𝑎𝑏𝑒𝑙𝑎𝑑𝑜 = 3,10 ; Como 𝐹𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 19,61 > 𝐹𝑡𝑎𝑏𝑒𝑙𝑎𝑑𝑜 = 3,10 rejeitamos 𝐻0 e concluímos que a concentração da madeira de lei afeta a resistência do papel, ao nível de significância de 5%. α=0,05 gl Denominador 1 2 3 4 5 6 7 8 9 10 gl Numerador 1 161,45 199,50 215,71 224,58 230,16 233,99 236,77 238,88 240,54 241,88 2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 7 5,59 4,74 4,35 4,12 4,02 3,92 3,87 3,83 3,79 3,74 8 5,32 4,46 4,07 3,84 3,69 3,59 3,50 3,44 3,39 3,35 9 5,12 4,26 3,86 3,63 3,48 3,38 3,29 3,23 3,18 3,14 10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 12 4,75 3,89 3,49 3,26 3,11 2,99 2,91 2,85 2,80 2,75 13 4,67 3,81 3,41 3,18 3,03 2,91 2,83 2,77 2,71 2,67 14 4,60 3,74 3,34 3,11 2,96 2,86 2,76 2,70 2,65 2,60 15 4,54 3,68 3,29 3,06 2,90 2,81 2,71 2,64 2,59 2,54 16 4,49 3,63 3,23 3,01 2,85 2,75 2,66 2,59 2,54 2,49 17 4,45 3,59 3,19 2,98 2,81 2,72 2,61 2,55 2,49 2,45 18 4,41 3,55 3,15 2,94 2,77 2,69 2,58 2,53 2,47 2,42 19 4,38 3,52 3,13 2,92 2,74 2,66 2,55 2,49 2,44 2,39 20 4,35 3,49 3,10 2,87 2,71 2,60 2,50 2,44 2,38 2,34 21 4,32 3,47 3,07 2,84 2,68 2,57 2,46 2,40 2,35 2,32 Teste de Tuckey Portanto, pelo menos uma das médias de tratamento difere das demais; Como o teste acima rejeitou a hipótese nula será aplicado o teste de Tukey para realizar as comparações múltiplas de médias nos quatro tratamentos; Lembrando que k = 4, n = 6, MSE = 6,51 , 𝑓 = 20 e 𝛼 = 5%. Então: = 3,96 Amplitude q para os procedimentos de Tukey gl (f*) α k níveis 2 3 4 5 6 7 8 9 10 5 0.05 3.64 4.60 5.22 5.67 6.03 6.33 6.58 6.80 6.99 0.01 5.70 6.98 7.80 8.42 8.91 9.32 9.67 9.97 10.24 6 0.05 3.46 4.34 4.90 5.30 5.63 5.90 6.12 6.32 6.49 0.01 5.24 6.73 7.43 8.01 8.48 8.88 9.21 9.50 9.76 7 0.05 3.34 4.16 4.68 5.06 5.37 5.61 5.82 6.00 6.16 0.01 4.96 6.50 7.17 7.73 8.17 8.54 8.85 9.12 9.37 8 0.05 3.26 4.03 4.51 4.87 5.17 5.40 5.60 5.77 5.92 0.01 4.82 6.32 6.95 7.47 7.88 8.23 8.51 8.76 8.99 9 0.05 3.20 3.95 4.41 4.76 5.02 5.24 5.43 5.59 5.74 0.01 4.71 6.18 6.78 7.27 7.66 7.99 8.25 8.48 8.69 10 0.05 3.15 3.88 4.33 4.65 4.91 5.12 5.30 5.46 5.60 0.01 4.60 6.06 6.64 7.11 7.49 7.80 8.05 8.27 8.47 11 0.05 3.11 3.82 4.26 4.57 4.82 5.03 5.20 5.35 5.49 0.01 4.52 5.95 6.52 6.97 7.34 7.64 7.88 8.09 8.28 12 0.05 3.08 3.77 4.20 4.50 4.74 4.95 5.12 5.27 5.39 0.01 4.45 5.85 6.41 6.85 7.20 7.49 7.72 7.92 8.10 13 0.05 3.06 3.73 4.15 4.44 4.68 4.88 5.05 5.19 5.32 0.01 4.39 5.77 6.32 6.74 7.08 7.36 7.58 7.77 7.94 14 0.05 3.03 3.70 4.11 4.39 4.62 4.83 4.99 5.13 5.25 0.01 4.34 5.70 6.24 6.65 6.98 7.25 7.46 7.64 7.80 15 0.05 3.02 3.67 4.08 4.36 4.57 4.76 4.92 5.05 5.17 0.01 4.30 5.63 6.16 6.57 6.89 7.14 7.35 7.52 7.68 16 0.05 3.00 3.65 4.05 4.33 4.54 4.72 4.87 5.00 5.12 0.01 4.26 5.57 6.08 6.48 6.78 7.03 7.22 7.39 7.54 17 0.05 2.98 3.63 4.02 4.29 4.50 4.67 4.82 4.94 5.07 0.01 4.23 5.51 6.01 6.39 6.68 6.92 7.11 7.27 7.41 18 0.05 2.97 3.61 4.00 4.27 4.47 4.65 4.80 4.92 5.04 0.01 4.20 5.47 5.94 6.32 6.60 6.84 7.02 7.18 7.32 19 0.05 2.96 3.59 3.98 4.25 4.44 4.61 4.75 4.87 4.98 0.01 4.17 5.42 5.88 6.24 6.52 6.75 6.93 7.09 7.23 20 0.05 2.95 3.58 [3.96] 4.23 4.42 4.59 4.73 4.85 4.96 0.01 4.15 5.39 5.83 6.19 6.46 6.69 6.87 7.02 7.15 Teste de Tuckey As médias amostrais dos tratamentos são: Portanto, concluímos que as duas médias são significantemente diferentes se Teste de Tuckey Portanto, com base no conjunto de dados analisados, há evidência de diferenças significativas entre todos os pares de médias, exceto entre os tratamentos 2 e 3, ao nível de significância mínimo de 5%
Send your question to AI and receive an answer instantly
Recommended for you
31
Slide Análise de Variância-2021 2
Estatística 2
UFBA
5
Exercício de Fixação Regressão Linear Simples Unidade 3-2021 1
Estatística 2
UFBA
5
Lista 2-2021 2
Estatística 2
UFBA
63
Slide Análise de Regressão-2021 2
Estatística 2
UFBA
2
Lista 4 Teste de Aderencia e Teste de Independencia-2021 1
Estatística 2
UFBA
7
Lista 3-2021 1
Estatística 2
UFBA
1
Atividade Correlação e Regressão-2021 2
Estatística 2
UFBA
8
Atividade 2 Resolvida-2022 1
Estatística 2
UFBA
3
Lista de Exercícios 5 Análise de Variância-2021 1
Estatística 2
UFBA
9
Slide Teste de Aderencia-2021 2
Estatística 2
UFBA
Preview text
Comparação de Médias Populacionais Nos estudos anteriores sobre teste de hipóteses, foi levado em consideração apenas uma única média; No entanto, não é raro encontrar situações em que se deseja verificar se há diferenças significativas entre as médias de k populações distintas; A análise usada para comparação de k médias populacionais ou de tratamentos é comumente realizada por uma Análise de Variância (ANOVA). Conceitos Alguns termos técnicos utilizados na Análise de Variância: 1. Fator e Nível Fator é uma variável independente obtida quando é realizado um estudo de investigação e o nível é a forma particular deste fator. Por exemplo, em um estudo sobre os efeitos da presença de três tipos de diferentes soluções de açúcar (glicose, sacarose e frutose) no crescimento de bactérias, o fator é o açúcar e cada tipo de solução é um nível em estudo. Neste caso, o fator açúcar tem três níveis (glicose, sacarose e frutose) Conceitos 1. Fator e Nível Por exemplo, um fabricante de papel, usado para a confecção de sacolas de mercearia, realiza um experimento para investigar se a concentração de madeira de lei em polpa (5%, 10%, 15% e 20%) tem efeito sobre a resistência à tração das sacolas fabricadas da polpa. A concentração de madeira de lei é o fator sob estudo e os níveis são as diferentes aplicações, diz-se que o fator concentração de madeira de lei tem quatro níveis (5%, 10%, 15% e 20%). Conceitos 2. Tratamento É uma condição imposta que se deseja medir ou avaliar em um experimento; Em outras palavras, denomina-se de tratamento, o nível de um fator sob análise ou uma combinação de fatores e níveis em estudo com dois ou mais fatores. Por exemplo, se o interesse é estudar os efeitos de cinco diferentes marcas de gasolina na eficiência operacional (milhas/galão) de motores de automóvel, o fator é a marca e cada marca constitui um tratamento. Conceitos 2. Tratamento Por exemplo, um estudo para comparar duas diferentes marcas de canetas (A e B) e dois diferentes tipos de lavagem (1 e 2) em relação à capacidade de remover manchas em um determinado tipo de tecido, existem 4 combinações possíveis, a saber: marca A e lavagem 1, marca A e lavagem 2, marca B e lavagem 1 e, marca B e lavagem 2. Cada uma destas combinações é chamada de tratamento, de modo que há 4 tratamentos diferentes envolvidos. 3. Unidade experimental A aplicação do tratamento é feita na unidade experimental; Dependendo do experimento, a unidade experimental pode ser um motor, uma peça do motor, uma porção de algum alimento... Conceitos 2. Tratamento Por exemplo, um estudo para comparar duas diferentes marcas de canetas (A e B) e dois diferentes tipos de lavagem (1 e 2) em relação à capacidade de remover manchas em um determinado tipo de tecido, existem 4 combinações possíveis, a saber: marca A e lavagem 1, marca A e lavagem 2, marca B e lavagem 1 e, marca B e lavagem 2. Cada uma destas combinações é chamada de tratamento, de modo que há 4 tratamentos diferentes envolvidos. 3. Unidade experimental A aplicação do tratamento é feita na unidade experimental; Dependendo do experimento, a unidade experimental pode ser um motor, uma peça do motor, uma porção de algum alimento... Análise de Variância Suponha um procedimento experimental com k tratamentos (populações) ou diferentes níveis de um único fator; A variável resposta para cada k tratamento é uma variável aleatória; Na tabela a seguir, 𝑌𝑖𝑗 é a observação da j-ésima unidade experimental no i- ésimo tratamento ou fator; Existem n observações no i-ésimo tratamento. Análise de Variância Em que 𝒚𝒊. representa a soma total das observações do i-ésimo tratamento; ഥ𝒚𝒊. representa a média das observações do i-ésimo tratamento; 𝒚.. a soma de todas as observações e ത𝑦.. representa a média de todas as observações, denominada média global amostral. Análise de Variância em 𝑁 = 𝑛 × 𝑘, total de número observações Análise de Variância Assim, suponha k tratamentos, n observações e os valores numéricos das observações representados por 𝑦𝑖𝑗; 𝑌𝑖𝑗 = 𝜇𝑖 +𝜖𝑖𝑗, i = 1,2,...,k e j= 1,2,...,n • 𝑌𝑖𝑗 é a observação do i-ésimo tratamento na j-ésima unidade experimenta, 𝜇𝑖 é a média do i-ésimo nível do fator ou tratamento, sendo um valor fixo e desconhecido e 𝜖𝑖𝑗 é o erro aleatório associado ao i-ésimo tratamento na j-ésima unidade experimental assumido 𝜖𝑖𝑗~ N(0; 𝜎2 ), independentes e identicamente distribuído. • 𝑌𝑖𝑗 ~ 𝑁(𝜇𝑖 , 𝜎2) 𝜇𝑖 = 𝜇 + 𝜏𝑖 , i = 1,2,...,k Análise de Variância A equação anterior torna-se 𝑌𝑖𝑗 =𝜇 + 𝜏𝑖 + 𝜖𝑖𝑗, i = 1,2,...,k e j= 1,2,...,n 𝜇 é o parâmetro média comum a todos os tratamentos chamado de média global e 𝜏𝑖 é o parâmetro do i-ésimo tratamento, denominado efeito do tratamento; 𝜖𝑖𝑗 é o erro aleatório associado ao i-ésimo tratamento na j-ésima unidade experimental assumido como: 𝜖𝑖𝑗~ N(0; 𝜎2 ), independentes e identicamente distribuído. Análise de um modelo com efeitos fixos O objetivo será o de testar hipóteses sobre os efeitos dos tratamentos; as hipóteses apropriadas são: Assim, as hipóteses apropriadas são: Análise de um modelo com efeitos fixos O objetivo será o de testar hipóteses sobre os efeitos dos tratamentos; As hipóteses apropriadas são: A hipótese nula supõe que as observações amostrais dentro de cada tratamento podem ser vistas como provenientes de populações com médias iguais. Análise de um modelo com efeitos fixos Como 𝜇𝑖 = 𝜇 + 𝜏𝑖 , i = 1,2,...,k; É possível reescrever as hipóteses acima em termos dos efeitos dos tratamentos Testando se os efeitos dos tratamentos (𝜏𝑖) são iguais a zero. Análise de um modelo com efeitos fixos É necessário assumir que : Decomposição da soma total de quadrado Esta subdividida em duas partes da seguinte forma: : • O termo do lado esquerdo é a soma dos quadrados das observações em relação à média global e representa uma medida da variabilidade total dos dados, denotada por 𝑆𝑆𝑇; • O primeiro termo do lado direito é a soma dos quadrados das diferenças entre as médias de cada tratamento e a média global sendo denotada por 𝑆𝑆𝑇𝑟𝑎𝑡𝑎𝑚𝑒𝑛𝑡𝑜 (diferença entre os grupos de tratamento) ; • O segundo termo do lado direito é a soma de quadrados das diferenças de cada observação dentro dos tratamentos em relação à média do tratamento (variação dentro do grupo), sendo denotado por 𝑆𝑆𝐸. Decomposição da soma total de quadrado Em outras palavras A 𝑆𝑆𝑇 é a soma de quadrados devido ao tratamento 𝑆𝑆𝑇𝑟𝑎𝑡𝑎𝑚𝑒𝑛𝑡𝑜 (ou seja, entre tratamentos), e 𝑆𝑆𝐸 a soma de quadrados residual (ou seja, dentro dos tratamentos). Simbolicamente, podemos representar Decomposição da soma total de quadrado Decomposição da soma total de quadrado Consequentemente, quando utiliza o procedimento de ANOVA, rejeita-se a hipótese de nula 𝐻0 em favor de 𝐻1 , a um nível de significância 𝛼, se 𝐹 calculado > 𝐹[𝛼 ; 𝑘−1 ,(𝑁−𝑘)] , ou seja, existem evidências de diferença significativa entre pelo menos um par de médias de tratamentos; Ou se o p-valor < 𝛼, rejeitamos a hipótese 𝐻0. Teste de Tuckey O procedimento seguinte quando se rejeita a hipótese nula na análise de variância é o de comparar as médias de tratamentos utilizando algum teste de comparação de médias ou contrastes para identificar qual(is) tratamento(s) é (são) diferente(s); O teste de Tukey permite testar qualquer contraste, sempre, entre duas médias de tratamentos. para todo i ≠ j Teste de Tuckey O teste proposto por Tukey baseia-se na diferença significante HSD=Δ; q é o valor tabelado e MSE é o quadrado médio dos resíduos. O valor de q depende do número de tratamentos(K) e do número de graus de liberdade associada com a soma de quadrados dos resíduos( ). Amplitude q para os procedimentos de Tukey gl (f*) α 2 3 4 5 6 7 8 9 10 5 0,05 3,64 4,60 5,22 5,67 6,03 6,33 6,58 6,80 6,99 0,01 5,70 6,98 7,80 8,42 8,91 9,32 9,67 9,97 10,24 6 0,05 3,46 4,33 4,94 5,36 5,71 6,00 6,24 6,45 6,61 0,01 5,24 6,16 6,90 7,45 7,91 8,32 8,61 8,87 9,10 7 0,05 3,34 4,16 4,68 5,06 5,36 5,61 5,82 6,00 6,16 0,01 4,95 5,85 6,55 7,08 7,54 7,91 8,17 8,41 8,62 8 0,05 3,26 4,04 4,53 4,89 5,17 5,40 5,60 5,77 5,92 0,01 4,75 5,64 6,24 6,74 7,19 7,55 7,80 8,03 8,23 9 0,05 3,20 3,96 4,42 4,77 5,04 5,24 5,43 5,59 5,74 0,01 4,60 5,46 6,03 6,51 6,95 7,29 7,53 7,74 7,93 10 0,05 3,15 3,88 4,33 4,65 4,91 5,12 5,30 5,46 5,61 0,01 4,48 5,29 5,85 6,32 6,74 7,07 7,30 7,51 7,69 11 0,05 3,11 3,82 4,26 4,57 4,82 5,03 5,20 5,35 5,49 0,01 4,39 5,15 5,68 6,15 6,56 6,88 7,11 7,31 7,49 12 0,05 3,08 3,77 4,20 4,50 4,74 4,93 5,09 5,24 5,37 0,01 4,32 5,05 5,56 6,02 6,42 6,73 6,95 7,15 7,32 13 0,05 3,06 3,73 4,15 4,44 4,68 4,86 5,03 5,17 5,30 0,01 4,26 4,96 5,46 5,91 6,29 6,59 6,80 6,98 7,15 14 0,05 3,03 3,70 4,11 4,38 4,61 4,79 4,94 5,08 5,20 0,01 4,21 4,89 5,38 5,82 6,19 6,49 6,68 6,86 7,02 15 0,05 3,01 3,67 4,07 4,34 4,57 4,74 4,88 5,01 5,13 0,01 4,17 4,84 5,32 5,75 6,11 6,40 6,59 6,75 6,91 16 0,05 3,00 3,65 4,03 4,30 4,52 4,68 4,82 4,95 5,06 0,01 4,13 4,79 5,27 5,69 6,05 6,33 6,52 6,68 6,83 17 0,05 2,98 3,63 4,02 4,28 4,49 4,65 4,78 4,91 5,02 0,01 4,10 4,74 5,22 5,64 5,98 6,26 6,44 6,60 6,74 18 0,05 2,97 3,61 4,00 4,26 4,47 4,62 4,75 4,87 4,98 0,01 4,07 4,70 5,18 5,59 5,93 6,20 6,38 6,53 6,67 19 0,05 2,95 3,58 3,96 4,23 4,43 4,58 4,71 4,82 4,93 0,01 4,05 4,67 5,13 5,52 5,86 6,12 6,29 6,44 6,57 20 0,05 2,92 3,53 3,90 4,17 4,36 4,50 4,62 4,73 4,83 0,01 4,02 4,62 5,07 5,46 5,78 6,03 6,19 6,33 6,46 Teste de Tuckey Deve-se determinar um nível de significância 𝛼 para o teste; Teste de Tuckey • Exemplo: Um fabricante de papel usado para a confecção de sacolas de mercearia está interessado em melhorar a força de resistência do produto. Uma das engenheiras responsáveis pelo estudo decide investigar quatro níveis de concentração de madeira de lei: 5%, 10%, 15% e 20%. Ela decide, também, fazer seis repetições de teste de cada nível de concentração usando uma usina-piloto. Teste de Tuckey • O modelo de análise de variância adotado é dado por: 𝑌𝑖𝑗 =𝜇 + 𝜏𝑖 + 𝜖𝑖𝑗, i = 1,2,3,4 e j= 1,2,3,4,5,6 𝑌𝑖𝑗 = é a força de resistência do papel observada na j-ésima sacola para a i-ésima concentração de madeira de lei; µ = a média geral; 𝜏𝑖 é o efeito da i-ésima concentração de madeira de lei; 𝜖𝑖𝑗 é o efeito do erro experimental. Teste de Tuckey Para comparar se as médias das forças de resistências do papel, para fabricação de sacolas, são diferentes quando é usado diferentes tipos de concentrações de madeira de lei, será usado a análise de variância; As hipóteses estatísticas a serem testadas são: 𝐻0: 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4 (A força de resistência média do papel são as mesmas nas quatro concentrações de madeira de lei analisadas) 𝐻1 : Pelos menos uma das médias, da força de resistência do papel, é diferente das demais. Teste de Tuckey A soma de quadrados para compor a Tabela da Análise de Variância é calculada conforme as equações Uma vez calculadas as duas somas de quadrados, obtemos sem dificuldades a terceira soma de quadrados conforme apresenta adiante: Teste de Tuckey Os resultados estão resumidos na Tabela da Análise de Variância a seguir. Como α = 5%, 𝑔𝑟𝑎𝑢 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑎𝑑𝑒𝑑𝑒 = 3 𝑒 20, 𝑙𝑜𝑔𝑜 𝐹𝑡𝑎𝑏𝑒𝑙𝑎𝑑𝑜 = 3,10 ; Como 𝐹𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 19,61 > 𝐹𝑡𝑎𝑏𝑒𝑙𝑎𝑑𝑜 = 3,10 rejeitamos 𝐻0 e concluímos que a concentração da madeira de lei afeta a resistência do papel, ao nível de significância de 5%. α=0,05 gl Denominador 1 2 3 4 5 6 7 8 9 10 gl Numerador 1 161,45 199,50 215,71 224,58 230,16 233,99 236,77 238,88 240,54 241,88 2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 7 5,59 4,74 4,35 4,12 4,02 3,92 3,87 3,83 3,79 3,74 8 5,32 4,46 4,07 3,84 3,69 3,59 3,50 3,44 3,39 3,35 9 5,12 4,26 3,86 3,63 3,48 3,38 3,29 3,23 3,18 3,14 10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 12 4,75 3,89 3,49 3,26 3,11 2,99 2,91 2,85 2,80 2,75 13 4,67 3,81 3,41 3,18 3,03 2,91 2,83 2,77 2,71 2,67 14 4,60 3,74 3,34 3,11 2,96 2,86 2,76 2,70 2,65 2,60 15 4,54 3,68 3,29 3,06 2,90 2,81 2,71 2,64 2,59 2,54 16 4,49 3,63 3,23 3,01 2,85 2,75 2,66 2,59 2,54 2,49 17 4,45 3,59 3,19 2,98 2,81 2,72 2,61 2,55 2,49 2,45 18 4,41 3,55 3,15 2,94 2,77 2,69 2,58 2,53 2,47 2,42 19 4,38 3,52 3,13 2,92 2,74 2,66 2,55 2,49 2,44 2,39 20 4,35 3,49 3,10 2,87 2,71 2,60 2,50 2,44 2,38 2,34 21 4,32 3,47 3,07 2,84 2,68 2,57 2,46 2,40 2,35 2,32 Teste de Tuckey Portanto, pelo menos uma das médias de tratamento difere das demais; Como o teste acima rejeitou a hipótese nula será aplicado o teste de Tukey para realizar as comparações múltiplas de médias nos quatro tratamentos; Lembrando que k = 4, n = 6, MSE = 6,51 , 𝑓 = 20 e 𝛼 = 5%. Então: = 3,96 Amplitude q para os procedimentos de Tukey gl (f*) α k níveis 2 3 4 5 6 7 8 9 10 5 0.05 3.64 4.60 5.22 5.67 6.03 6.33 6.58 6.80 6.99 0.01 5.70 6.98 7.80 8.42 8.91 9.32 9.67 9.97 10.24 6 0.05 3.46 4.34 4.90 5.30 5.63 5.90 6.12 6.32 6.49 0.01 5.24 6.73 7.43 8.01 8.48 8.88 9.21 9.50 9.76 7 0.05 3.34 4.16 4.68 5.06 5.37 5.61 5.82 6.00 6.16 0.01 4.96 6.50 7.17 7.73 8.17 8.54 8.85 9.12 9.37 8 0.05 3.26 4.03 4.51 4.87 5.17 5.40 5.60 5.77 5.92 0.01 4.82 6.32 6.95 7.47 7.88 8.23 8.51 8.76 8.99 9 0.05 3.20 3.95 4.41 4.76 5.02 5.24 5.43 5.59 5.74 0.01 4.71 6.18 6.78 7.27 7.66 7.99 8.25 8.48 8.69 10 0.05 3.15 3.88 4.33 4.65 4.91 5.12 5.30 5.46 5.60 0.01 4.60 6.06 6.64 7.11 7.49 7.80 8.05 8.27 8.47 11 0.05 3.11 3.82 4.26 4.57 4.82 5.03 5.20 5.35 5.49 0.01 4.52 5.95 6.52 6.97 7.34 7.64 7.88 8.09 8.28 12 0.05 3.08 3.77 4.20 4.50 4.74 4.95 5.12 5.27 5.39 0.01 4.45 5.85 6.41 6.85 7.20 7.49 7.72 7.92 8.10 13 0.05 3.06 3.73 4.15 4.44 4.68 4.88 5.05 5.19 5.32 0.01 4.39 5.77 6.32 6.74 7.08 7.36 7.58 7.77 7.94 14 0.05 3.03 3.70 4.11 4.39 4.62 4.83 4.99 5.13 5.25 0.01 4.34 5.70 6.24 6.65 6.98 7.25 7.46 7.64 7.80 15 0.05 3.02 3.67 4.08 4.36 4.57 4.76 4.92 5.05 5.17 0.01 4.30 5.63 6.16 6.57 6.89 7.14 7.35 7.52 7.68 16 0.05 3.00 3.65 4.05 4.33 4.54 4.72 4.87 5.00 5.12 0.01 4.26 5.57 6.08 6.48 6.78 7.03 7.22 7.39 7.54 17 0.05 2.98 3.63 4.02 4.29 4.50 4.67 4.82 4.94 5.07 0.01 4.23 5.51 6.01 6.39 6.68 6.92 7.11 7.27 7.41 18 0.05 2.97 3.61 4.00 4.27 4.47 4.65 4.80 4.92 5.04 0.01 4.20 5.47 5.94 6.32 6.60 6.84 7.02 7.18 7.32 19 0.05 2.96 3.59 3.98 4.25 4.44 4.61 4.75 4.87 4.98 0.01 4.17 5.42 5.88 6.24 6.52 6.75 6.93 7.09 7.23 20 0.05 2.95 3.58 [3.96] 4.23 4.42 4.59 4.73 4.85 4.96 0.01 4.15 5.39 5.83 6.19 6.46 6.69 6.87 7.02 7.15 Teste de Tuckey As médias amostrais dos tratamentos são: Portanto, concluímos que as duas médias são significantemente diferentes se Teste de Tuckey Portanto, com base no conjunto de dados analisados, há evidência de diferenças significativas entre todos os pares de médias, exceto entre os tratamentos 2 e 3, ao nível de significância mínimo de 5%