·

Ciências Contábeis ·

Estatística 2

· 2022/1

Send your question to AI and receive an answer instantly

Ask Question

Preview text

Comparação de Médias Populacionais Nos estudos anteriores sobre teste de hipóteses, foi levado em consideração apenas uma única média;  No entanto, não é raro encontrar situações em que se deseja verificar se há diferenças significativas entre as médias de k populações distintas; A análise usada para comparação de k médias populacionais ou de tratamentos é comumente realizada por uma Análise de Variância (ANOVA). Conceitos Alguns termos técnicos utilizados na Análise de Variância: 1. Fator e Nível Fator é uma variável independente obtida quando é realizado um estudo de investigação e o nível é a forma particular deste fator. Por exemplo, em um estudo sobre os efeitos da presença de três tipos de diferentes soluções de açúcar (glicose, sacarose e frutose) no crescimento de bactérias, o fator é o açúcar e cada tipo de solução é um nível em estudo. Neste caso, o fator açúcar tem três níveis (glicose, sacarose e frutose) Conceitos 1. Fator e Nível Por exemplo, um fabricante de papel, usado para a confecção de sacolas de mercearia, realiza um experimento para investigar se a concentração de madeira de lei em polpa (5%, 10%, 15% e 20%) tem efeito sobre a resistência à tração das sacolas fabricadas da polpa. A concentração de madeira de lei é o fator sob estudo e os níveis são as diferentes aplicações, diz-se que o fator concentração de madeira de lei tem quatro níveis (5%, 10%, 15% e 20%). Conceitos 2. Tratamento É uma condição imposta que se deseja medir ou avaliar em um experimento; Em outras palavras, denomina-se de tratamento, o nível de um fator sob análise ou uma combinação de fatores e níveis em estudo com dois ou mais fatores. Por exemplo, se o interesse é estudar os efeitos de cinco diferentes marcas de gasolina na eficiência operacional (milhas/galão) de motores de automóvel, o fator é a marca e cada marca constitui um tratamento. Conceitos 2. Tratamento Por exemplo, um estudo para comparar duas diferentes marcas de canetas (A e B) e dois diferentes tipos de lavagem (1 e 2) em relação à capacidade de remover manchas em um determinado tipo de tecido, existem 4 combinações possíveis, a saber: marca A e lavagem 1, marca A e lavagem 2, marca B e lavagem 1 e, marca B e lavagem 2. Cada uma destas combinações é chamada de tratamento, de modo que há 4 tratamentos diferentes envolvidos. 3. Unidade experimental A aplicação do tratamento é feita na unidade experimental; Dependendo do experimento, a unidade experimental pode ser um motor, uma peça do motor, uma porção de algum alimento... Conceitos 2. Tratamento Por exemplo, um estudo para comparar duas diferentes marcas de canetas (A e B) e dois diferentes tipos de lavagem (1 e 2) em relação à capacidade de remover manchas em um determinado tipo de tecido, existem 4 combinações possíveis, a saber: marca A e lavagem 1, marca A e lavagem 2, marca B e lavagem 1 e, marca B e lavagem 2. Cada uma destas combinações é chamada de tratamento, de modo que há 4 tratamentos diferentes envolvidos. 3. Unidade experimental A aplicação do tratamento é feita na unidade experimental; Dependendo do experimento, a unidade experimental pode ser um motor, uma peça do motor, uma porção de algum alimento... Análise de Variância  Suponha um procedimento experimental com k tratamentos (populações) ou diferentes níveis de um único fator;  A variável resposta para cada k tratamento é uma variável aleatória;  Na tabela a seguir, 𝑌𝑖𝑗 é a observação da j-ésima unidade experimental no i- ésimo tratamento ou fator;  Existem n observações no i-ésimo tratamento. Análise de Variância Em que 𝒚𝒊. representa a soma total das observações do i-ésimo tratamento; ഥ𝒚𝒊. representa a média das observações do i-ésimo tratamento; 𝒚.. a soma de todas as observações e ത𝑦.. representa a média de todas as observações, denominada média global amostral. Análise de Variância em 𝑁 = 𝑛 × 𝑘, total de número observações Análise de Variância  Assim, suponha k tratamentos, n observações e os valores numéricos das observações representados por 𝑦𝑖𝑗; 𝑌𝑖𝑗 = 𝜇𝑖 +𝜖𝑖𝑗, i = 1,2,...,k e j= 1,2,...,n • 𝑌𝑖𝑗 é a observação do i-ésimo tratamento na j-ésima unidade experimenta, 𝜇𝑖 é a média do i-ésimo nível do fator ou tratamento, sendo um valor fixo e desconhecido e 𝜖𝑖𝑗 é o erro aleatório associado ao i-ésimo tratamento na j-ésima unidade experimental assumido 𝜖𝑖𝑗~ N(0; 𝜎2 ), independentes e identicamente distribuído. • 𝑌𝑖𝑗 ~ 𝑁(𝜇𝑖 , 𝜎2) 𝜇𝑖 = 𝜇 + 𝜏𝑖 , i = 1,2,...,k Análise de Variância  A equação anterior torna-se 𝑌𝑖𝑗 =𝜇 + 𝜏𝑖 + 𝜖𝑖𝑗, i = 1,2,...,k e j= 1,2,...,n  𝜇 é o parâmetro média comum a todos os tratamentos chamado de média global e 𝜏𝑖 é o parâmetro do i-ésimo tratamento, denominado efeito do tratamento;  𝜖𝑖𝑗 é o erro aleatório associado ao i-ésimo tratamento na j-ésima unidade experimental assumido como: 𝜖𝑖𝑗~ N(0; 𝜎2 ), independentes e identicamente distribuído. Análise de um modelo com efeitos fixos  O objetivo será o de testar hipóteses sobre os efeitos dos tratamentos;  as hipóteses apropriadas são:  Assim, as hipóteses apropriadas são: Análise de um modelo com efeitos fixos  O objetivo será o de testar hipóteses sobre os efeitos dos tratamentos;  As hipóteses apropriadas são: A hipótese nula supõe que as observações amostrais dentro de cada tratamento podem ser vistas como provenientes de populações com médias iguais. Análise de um modelo com efeitos fixos  Como 𝜇𝑖 = 𝜇 + 𝜏𝑖 , i = 1,2,...,k;  É possível reescrever as hipóteses acima em termos dos efeitos dos tratamentos  Testando se os efeitos dos tratamentos (𝜏𝑖) são iguais a zero. Análise de um modelo com efeitos fixos  É necessário assumir que : Decomposição da soma total de quadrado  Esta subdividida em duas partes da seguinte forma: : • O termo do lado esquerdo é a soma dos quadrados das observações em relação à média global e representa uma medida da variabilidade total dos dados, denotada por 𝑆𝑆𝑇; • O primeiro termo do lado direito é a soma dos quadrados das diferenças entre as médias de cada tratamento e a média global sendo denotada por 𝑆𝑆𝑇𝑟𝑎𝑡𝑎𝑚𝑒𝑛𝑡𝑜 (diferença entre os grupos de tratamento) ; • O segundo termo do lado direito é a soma de quadrados das diferenças de cada observação dentro dos tratamentos em relação à média do tratamento (variação dentro do grupo), sendo denotado por 𝑆𝑆𝐸. Decomposição da soma total de quadrado  Em outras palavras  A 𝑆𝑆𝑇 é a soma de quadrados devido ao tratamento 𝑆𝑆𝑇𝑟𝑎𝑡𝑎𝑚𝑒𝑛𝑡𝑜 (ou seja, entre tratamentos), e 𝑆𝑆𝐸 a soma de quadrados residual (ou seja, dentro dos tratamentos). Simbolicamente, podemos representar Decomposição da soma total de quadrado Decomposição da soma total de quadrado  Consequentemente, quando utiliza o procedimento de ANOVA, rejeita-se a hipótese de nula 𝐻0 em favor de 𝐻1 , a um nível de significância 𝛼, se  𝐹 calculado > 𝐹[𝛼 ; 𝑘−1 ,(𝑁−𝑘)] , ou seja, existem evidências de diferença significativa entre pelo menos um par de médias de tratamentos;  Ou se o p-valor < 𝛼, rejeitamos a hipótese 𝐻0. Teste de Tuckey  O procedimento seguinte quando se rejeita a hipótese nula na análise de variância é o de comparar as médias de tratamentos utilizando algum teste de comparação de médias ou contrastes para identificar qual(is) tratamento(s) é (são) diferente(s);  O teste de Tukey permite testar qualquer contraste, sempre, entre duas médias de tratamentos. para todo i ≠ j Teste de Tuckey  O teste proposto por Tukey baseia-se na diferença significante HSD=Δ; q é o valor tabelado e MSE é o quadrado médio dos resíduos. O valor de q depende do número de tratamentos(K) e do número de graus de liberdade associada com a soma de quadrados dos resíduos( ). Amplitude q para os procedimentos de Tukey gl (f*) α 2 3 4 5 6 7 8 9 10 5 0,05 3,64 4,60 5,22 5,67 6,03 6,33 6,58 6,80 6,99 0,01 5,70 6,98 7,80 8,42 8,91 9,32 9,67 9,97 10,24 6 0,05 3,46 4,33 4,94 5,36 5,71 6,00 6,24 6,45 6,61 0,01 5,24 6,16 6,90 7,45 7,91 8,32 8,61 8,87 9,10 7 0,05 3,34 4,16 4,68 5,06 5,36 5,61 5,82 6,00 6,16 0,01 4,95 5,85 6,55 7,08 7,54 7,91 8,17 8,41 8,62 8 0,05 3,26 4,04 4,53 4,89 5,17 5,40 5,60 5,77 5,92 0,01 4,75 5,64 6,24 6,74 7,19 7,55 7,80 8,03 8,23 9 0,05 3,20 3,96 4,42 4,77 5,04 5,24 5,43 5,59 5,74 0,01 4,60 5,46 6,03 6,51 6,95 7,29 7,53 7,74 7,93 10 0,05 3,15 3,88 4,33 4,65 4,91 5,12 5,30 5,46 5,61 0,01 4,48 5,29 5,85 6,32 6,74 7,07 7,30 7,51 7,69 11 0,05 3,11 3,82 4,26 4,57 4,82 5,03 5,20 5,35 5,49 0,01 4,39 5,15 5,68 6,15 6,56 6,88 7,11 7,31 7,49 12 0,05 3,08 3,77 4,20 4,50 4,74 4,93 5,09 5,24 5,37 0,01 4,32 5,05 5,56 6,02 6,42 6,73 6,95 7,15 7,32 13 0,05 3,06 3,73 4,15 4,44 4,68 4,86 5,03 5,17 5,30 0,01 4,26 4,96 5,46 5,91 6,29 6,59 6,80 6,98 7,15 14 0,05 3,03 3,70 4,11 4,38 4,61 4,79 4,94 5,08 5,20 0,01 4,21 4,89 5,38 5,82 6,19 6,49 6,68 6,86 7,02 15 0,05 3,01 3,67 4,07 4,34 4,57 4,74 4,88 5,01 5,13 0,01 4,17 4,84 5,32 5,75 6,11 6,40 6,59 6,75 6,91 16 0,05 3,00 3,65 4,03 4,30 4,52 4,68 4,82 4,95 5,06 0,01 4,13 4,79 5,27 5,69 6,05 6,33 6,52 6,68 6,83 17 0,05 2,98 3,63 4,02 4,28 4,49 4,65 4,78 4,91 5,02 0,01 4,10 4,74 5,22 5,64 5,98 6,26 6,44 6,60 6,74 18 0,05 2,97 3,61 4,00 4,26 4,47 4,62 4,75 4,87 4,98 0,01 4,07 4,70 5,18 5,59 5,93 6,20 6,38 6,53 6,67 19 0,05 2,95 3,58 3,96 4,23 4,43 4,58 4,71 4,82 4,93 0,01 4,05 4,67 5,13 5,52 5,86 6,12 6,29 6,44 6,57 20 0,05 2,92 3,53 3,90 4,17 4,36 4,50 4,62 4,73 4,83 0,01 4,02 4,62 5,07 5,46 5,78 6,03 6,19 6,33 6,46 Teste de Tuckey  Deve-se determinar um nível de significância 𝛼 para o teste; Teste de Tuckey • Exemplo: Um fabricante de papel usado para a confecção de sacolas de mercearia está interessado em melhorar a força de resistência do produto. Uma das engenheiras responsáveis pelo estudo decide investigar quatro níveis de concentração de madeira de lei: 5%, 10%, 15% e 20%. Ela decide, também, fazer seis repetições de teste de cada nível de concentração usando uma usina-piloto. Teste de Tuckey • O modelo de análise de variância adotado é dado por: 𝑌𝑖𝑗 =𝜇 + 𝜏𝑖 + 𝜖𝑖𝑗, i = 1,2,3,4 e j= 1,2,3,4,5,6 𝑌𝑖𝑗 = é a força de resistência do papel observada na j-ésima sacola para a i-ésima concentração de madeira de lei; µ = a média geral; 𝜏𝑖 é o efeito da i-ésima concentração de madeira de lei; 𝜖𝑖𝑗 é o efeito do erro experimental. Teste de Tuckey  Para comparar se as médias das forças de resistências do papel, para fabricação de sacolas, são diferentes quando é usado diferentes tipos de concentrações de madeira de lei, será usado a análise de variância;  As hipóteses estatísticas a serem testadas são: 𝐻0: 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4 (A força de resistência média do papel são as mesmas nas quatro concentrações de madeira de lei analisadas) 𝐻1 : Pelos menos uma das médias, da força de resistência do papel, é diferente das demais. Teste de Tuckey  A soma de quadrados para compor a Tabela da Análise de Variância é calculada conforme as equações  Uma vez calculadas as duas somas de quadrados, obtemos sem dificuldades a terceira soma de quadrados conforme apresenta adiante: Teste de Tuckey  Os resultados estão resumidos na Tabela da Análise de Variância a seguir.  Como α = 5%, 𝑔𝑟𝑎𝑢 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑎𝑑𝑒𝑑𝑒 = 3 𝑒 20, 𝑙𝑜𝑔𝑜 𝐹𝑡𝑎𝑏𝑒𝑙𝑎𝑑𝑜 = 3,10 ; Como 𝐹𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 19,61 > 𝐹𝑡𝑎𝑏𝑒𝑙𝑎𝑑𝑜 = 3,10 rejeitamos 𝐻0 e concluímos que a concentração da madeira de lei afeta a resistência do papel, ao nível de significância de 5%. α=0,05 gl Denominador 1 2 3 4 5 6 7 8 9 10 gl Numerador 1 161,45 199,50 215,71 224,58 230,16 233,99 236,77 238,88 240,54 241,88 2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 7 5,59 4,74 4,35 4,12 4,02 3,92 3,87 3,83 3,79 3,74 8 5,32 4,46 4,07 3,84 3,69 3,59 3,50 3,44 3,39 3,35 9 5,12 4,26 3,86 3,63 3,48 3,38 3,29 3,23 3,18 3,14 10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 12 4,75 3,89 3,49 3,26 3,11 2,99 2,91 2,85 2,80 2,75 13 4,67 3,81 3,41 3,18 3,03 2,91 2,83 2,77 2,71 2,67 14 4,60 3,74 3,34 3,11 2,96 2,86 2,76 2,70 2,65 2,60 15 4,54 3,68 3,29 3,06 2,90 2,81 2,71 2,64 2,59 2,54 16 4,49 3,63 3,23 3,01 2,85 2,75 2,66 2,59 2,54 2,49 17 4,45 3,59 3,19 2,98 2,81 2,72 2,61 2,55 2,49 2,45 18 4,41 3,55 3,15 2,94 2,77 2,69 2,58 2,53 2,47 2,42 19 4,38 3,52 3,13 2,92 2,74 2,66 2,55 2,49 2,44 2,39 20 4,35 3,49 3,10 2,87 2,71 2,60 2,50 2,44 2,38 2,34 21 4,32 3,47 3,07 2,84 2,68 2,57 2,46 2,40 2,35 2,32 Teste de Tuckey  Portanto, pelo menos uma das médias de tratamento difere das demais;  Como o teste acima rejeitou a hipótese nula será aplicado o teste de Tukey para realizar as comparações múltiplas de médias nos quatro tratamentos;  Lembrando que k = 4, n = 6, MSE = 6,51 , 𝑓 = 20 e 𝛼 = 5%. Então: = 3,96 Amplitude q para os procedimentos de Tukey gl (f*) α k níveis 2 3 4 5 6 7 8 9 10 5 0.05 3.64 4.60 5.22 5.67 6.03 6.33 6.58 6.80 6.99 0.01 5.70 6.98 7.80 8.42 8.91 9.32 9.67 9.97 10.24 6 0.05 3.46 4.34 4.90 5.30 5.63 5.90 6.12 6.32 6.49 0.01 5.24 6.73 7.43 8.01 8.48 8.88 9.21 9.50 9.76 7 0.05 3.34 4.16 4.68 5.06 5.37 5.61 5.82 6.00 6.16 0.01 4.96 6.50 7.17 7.73 8.17 8.54 8.85 9.12 9.37 8 0.05 3.26 4.03 4.51 4.87 5.17 5.40 5.60 5.77 5.92 0.01 4.82 6.32 6.95 7.47 7.88 8.23 8.51 8.76 8.99 9 0.05 3.20 3.95 4.41 4.76 5.02 5.24 5.43 5.59 5.74 0.01 4.71 6.18 6.78 7.27 7.66 7.99 8.25 8.48 8.69 10 0.05 3.15 3.88 4.33 4.65 4.91 5.12 5.30 5.46 5.60 0.01 4.60 6.06 6.64 7.11 7.49 7.80 8.05 8.27 8.47 11 0.05 3.11 3.82 4.26 4.57 4.82 5.03 5.20 5.35 5.49 0.01 4.52 5.95 6.52 6.97 7.34 7.64 7.88 8.09 8.28 12 0.05 3.08 3.77 4.20 4.50 4.74 4.95 5.12 5.27 5.39 0.01 4.45 5.85 6.41 6.85 7.20 7.49 7.72 7.92 8.10 13 0.05 3.06 3.73 4.15 4.44 4.68 4.88 5.05 5.19 5.32 0.01 4.39 5.77 6.32 6.74 7.08 7.36 7.58 7.77 7.94 14 0.05 3.03 3.70 4.11 4.39 4.62 4.83 4.99 5.13 5.25 0.01 4.34 5.70 6.24 6.65 6.98 7.25 7.46 7.64 7.80 15 0.05 3.02 3.67 4.08 4.36 4.57 4.76 4.92 5.05 5.17 0.01 4.30 5.63 6.16 6.57 6.89 7.14 7.35 7.52 7.68 16 0.05 3.00 3.65 4.05 4.33 4.54 4.72 4.87 5.00 5.12 0.01 4.26 5.57 6.08 6.48 6.78 7.03 7.22 7.39 7.54 17 0.05 2.98 3.63 4.02 4.29 4.50 4.67 4.82 4.94 5.07 0.01 4.23 5.51 6.01 6.39 6.68 6.92 7.11 7.27 7.41 18 0.05 2.97 3.61 4.00 4.27 4.47 4.65 4.80 4.92 5.04 0.01 4.20 5.47 5.94 6.32 6.60 6.84 7.02 7.18 7.32 19 0.05 2.96 3.59 3.98 4.25 4.44 4.61 4.75 4.87 4.98 0.01 4.17 5.42 5.88 6.24 6.52 6.75 6.93 7.09 7.23 20 0.05 2.95 3.58 [3.96] 4.23 4.42 4.59 4.73 4.85 4.96 0.01 4.15 5.39 5.83 6.19 6.46 6.69 6.87 7.02 7.15 Teste de Tuckey  As médias amostrais dos tratamentos são:  Portanto, concluímos que as duas médias são significantemente diferentes se Teste de Tuckey  Portanto, com base no conjunto de dados analisados, há evidência de diferenças significativas entre todos os pares de médias, exceto entre os tratamentos 2 e 3, ao nível de significância mínimo de 5%