2
Estatística 2
UNIOESTE
12
Estatística 2
UNIOESTE
2
Estatística 2
UFAL
4
Estatística 2
UFRPE
2
Estatística 2
UFAL
2
Estatística 2
UFAL
Texto de pré-visualização
c Verifique se a correlação apresente as hipóteses o valor tabelado o valor calculado a regra decisória e a conclusão do teste é significativa ou não a 005 para as seguintes variáveis Altura de garupa e perímetro torácico de potros MM Y10 x Y13 Grupo 1 Comprimento de cabeça e ângulo fêmurtibial de potros C Y14 x Y16 Grupo 2 Altura de cernelha e comprimento do corpo de potros C Y9 x Y11 Grupo 3 Perímetro de canela e perímetro do joelho de potros MM Y1 x Y2 Grupo 4 Altura de garupa e perímetro torácico de potros MM Y2 x Y5 Grupo 5 Comprimento de cabeça e ângulo fêmurtibial de potros MM Y6 x Y8 Grupo 6 Altura de cernelha e comprimento do corpo de potros MM Y1 x Y3 Grupo 7 Altura de cernelha e comprimento do corpo de potros A Y17 x Y19 Grupo 8 Comprimento de cabeça e ângulo fêmurtibial de potros A Y22 x Y24 Grupo 9 Altura de garupa e perímetro torácico de potros A Y18 x Y21 Grupo 10 Perímetro de canela e perímetro do joelho de potros A Y20 x Y23 Grupo 11 Comprimento de corpo e perímetro do joelho de potros MM Y3 x Y7 Grupo 12 Comprimento de corpo e perímetro do joelho de potros C Y11 x Y15 Grupo 13 Comprimento de corpo e perímetro do joelho de potros A Y19 x Y23 Grupo 14 Perímetro de canela e comprimento de cabeça de potros C Y12 x Y14 Grupo 15 Perímetro de canela e comprimento de cabeça de potros A Y20 x Y22 Grupo 16 Altura de garupa e perímetro torácico de potros C Y10 x Y13 Grupo 17 d Considere os dados apresentados na Tabela 1 referentes ao tamanho amostral para o teste de médias n1 ao tamanho amostral para o teste de variâncias n2 aos valores de média amostral MA média populacional MP desviopadrão amostral DPA desviopadrão populacional DPP ao tipo de hipótese alternativa Ha e à magnitude do nível de significância NS Tabela 1 Estatísticas descritivas de acordo com o grupo Grupo n1 n2 MA X MP μx DPA sx DPP sx Ha teste de médias Ha teste de variâncias NS 1 64 6 70 67 20 15 UD UD 005 2 49 7 65 64 26 20 BIL UD 001 3 36 8 54 51 30 25 UD UD 005 4 25 9 43 42 45 30 BIL UD 001 5 16 10 31 29 32 15 UD UD 005 6 9 6 25 27 33 20 BIL UD 001 7 64 7 16 17 41 25 UE UD 005 8 49 8 10 13 38 30 BIL UD 001 9 36 9 7 85 25 15 UE UD 005 10 25 10 45 55 29 20 BIL UD 001 11 16 6 2 15 31 25 UD UD 005 12 9 7 15 12 40 30 BIL UD 001 13 64 8 07 04 22 15 UD UD 005 14 49 9 45 48 38 20 BIL UD 001 15 36 10 59 615 35 25 UE UD 005 16 25 10 67 685 36 30 BIL U D 001 17 16 9 74 77 46 35 BIL UD 005 H0 bilateral BIL H1 unilateral à direita UD H1 unilateral à esquerda UE Perguntase d1 Aplique um teste adequado e confronte a média amostral com a respectiva média populacional utilizando os seis passos do protocolo proposto em sala de aula d2 Aplique um teste adequado e confronte a variância amostral com a respectiva variância populacional utilizando os seis passos do protocolo proposto em sala de aula Universidade Estadual do Oeste do Paraná Campus de Marechal Cândido Rondon Centro de Ciências Agrárias Curso de Zootecnia Disciplina Estatística Experimental Teste 2 semestre de 2023 Professor Newton Tavares Escocard de Oliveira LEIA ATENTAMENTE AS PERGUNTAS E AS OBSERVAÇÕES CONTIDAS NO FINAL DO TEXTO ANTES DA RESOLUÇÃO 1 Considere os três bancos de dados para potros das raças Mangalarga Marchador MM Campolina C e Árabe A de oito variáveis Y1 a Y8 Y9 a Y16 e Y17 a Y24 dados em anexo a Para a 005 e hipótese alternativa bilateral aplique o teste adequado apresente as hipóteses o valor tabelado o valor calculado a regra decisória e a conclusão do teste para confrontar médias entre Amostras de alturas de cernelha das raças MM x C Y1 x Y9 Grupo 1 Amostras de alturas de cernelha das raças C x A Y9 x Y17 Grupo 2 Amostras de alturas de garupa das raças MM x A Y2 x Y18 Grupo 3 Amostras de alturas de garupa das raças C x AY10 x Y18 Grupo 4 Amostras de comprimentos de corpo das raças MM x A Y3 x Y19 Grupo 5 Amostras de comprimentos de corpo das raças MM x C Y3 x Y11 Grupo 6 Amostras de perímetros de canela das raças MM x C Y4 x Y12 Grupo 7 Amostras de perímetros de canela das raças C x A Y12 x Y20 Grupo 8 Amostras de perímetros torácicos das raças MM x A Y5 x Y21 Grupo 9 Amostras de perímetros torácicos das raças C x A Y13 x Y21 Grupo 10 Amostras de comprimentos da cabeça das raças MM x A Y6 x Y22 Grupo 11 Amostras de comprimentos da cabeça das raças MM x C Y6 x Y14 Grupo 12 Amostras de perímetros do joelho das raças MM x C Y7 x Y15 Grupo 13 Amostras de perímetros do joelho das raças MM x A Y7 x Y23 Grupo 14 Amostras de ângulos fêmurtibial das raças C x A Y16 x Y24 Grupo 15 Amostras de ângulos fêmurtibial das raças MM x A Y8 x Y24 Grupo 16 Amostras de ângulos fêmurtibial das raças MM x C Y8 x Y16 Grupo 17 b Para a 005 e hipótese alternativa bilateral aplique o teste adequado apresente as hipóteses o valor tabelado o valor calculado a regra decisória e a conclusão do teste para confrontar médias entre Amostras de comprimento da cabeça e perímetro de joelho para potros A Y22 x Y23 Grupo 1 Amostras de perímetro de canela e perímetro de joelho para potros A Y20 x Y23 Grupo 2 Amostras de comprimento do corpo e perímetro torácico para potros A Y19 x Y21 Grupo 3 Amostras de altura de cernelha e altura de garupa para potros A Y17 x Y18 Grupo 4 Amostras de comprimento do corpo e perímetro torácico para potros C Y11 x Y13 Grupo 5 Amostras de perímetro de canela e perímetro de joelho para potros C Y12 x Y15 Grupo 6 Amostras de altura de cernelha e altura de garupa para potros C Y9 x Y10 Grupo 7 Amostras de perímetro torácico e ângulo fêmurtibial para potros MM Y5 x Y8 Grupo 8 Amostras de comprimento da cabeça e perímetro do joelho para potros MM Y6 x Y7 Grupo 9 Amostras de perímetro de canela e perímetro de joelho para potros MM Y4 x Y7 Grupo 10 Amostras de altura de cernelha e altura de garupa para potros MM Y1 x Y2 Grupo 11 Amostras de comprimento de corpo e comprimento de cabeça para potros MM Y3 x Y6 Grupo 12 Amostras de comprimento de cabeça e ângulo fêmurtibial para potros C Y14 x Y16 Grupo 13 Amostras de comprimento de corpo e ângulo fêmurtibial para potros C Y11 x Y16 Grupo 14 Amostras de perímetro torácico e ângulo fêmurtibial para potros A Y21 x Y24 Grupo 15 Amostras de altura de garupa e comprimento de corpo para potros A Y18 x Y19 Grupo 16 Amostras de altura de garupa e perímetro de canela para potros C Y10 x Y12 Grupo 17 UNIVERSIDADE ESTADUAL DO OESTE DO PARANÁ CAMPUS DE MARECHAL CÂNDIDO RONDON CENTRO DE CIÊNCIAS AGRÁRIAS Guia de aulas de Estatística Experimental Material de Apoio Marechal Cândido Rondon Paraná Fevereiro2024 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA Nota de esclarecimento Este roteiro de aulas foi elaborado com o intuito de ofertar conteúdos específicos para atender as demandas de ensino vinculadas à disciplina Estatística Experimental inclusa na grade curricular do curso de Graduação em Zootecnia da Unioeste Campus de Marechal Cândido Rondon PR Neste material foi buscado informar aos discentes da segunda série do curso de Graduação em Zootecnia a teoria e exemplos aplicados ao conjunto de conteúdos principalmente em relação aos tópicos testes de hipóteses princípios básicos da experimentação delineamentos experimentais testes de comparações múltiplas de médias de tratamentos e análise de regressão linear Os objetivos foram de proporcionar aos graduandos o entendimento da estatística como ferramenta para a tomada de decisões para que sejam capazes de entender as ideias teóricas e interpretar de modo coerente os resultados de experimentos zootécnicos No capítulo 1 venho destacar o vínculo entre estatística e método científico em que foi realçada a importância e o entendimento da contribuição estatística nas hipóteses relacionadas às pesquisas No capítulo 2 foi abordada a teoria dos testes de hipóteses TH com conceitos relacionados às hipóteses estatísticas distribuições regiões de aceitação e rejeição da hipótese de nulidade erros associados à aplicação de teste de hipótese além da proposição de um protocolo de aplicação padrão para qualquer TH Do 3º ao 7º capítulo foi realizada uma abordagem de testes de hipóteses aplicados a planos amostrais utilizados na área zootécnica com ênfase na aplicação do teste Z para uma amostra do teste F para comparar as variâncias de duas amostras independentes e na aplicação do teste t de student para amostras independentes e pareadas e na análise de significância do coeficiente de correlação populacional entre duas variáveis contínuas No capítulo 8 o uso da estatística t foi explicada e aplicada no contexto da estimação intervalar do parâmetro média e para dimensionamento do número de indivíduos em pesquisas por amostragem No capítulo 9 foi abordada a aplicabilidade da análise de independência de quiquadrado para dados expressos por frequência que têm grande utilidade para os imensos bancos de dados de empresas zootécnicas privadas Do 10º ao 12º capítulo foram realizadas considerações importantes sobre os princípios básicos da experimentação Em razão de que muitas pesquisas têm apresentado baixa precisão nos resultados devido a equívocos no planejamento experimental foi dado ênfase ao impacto do número de repetições na precisão e na sensibilidade dos testes a casualização dos tratamentos às parcelas para a validade dos resultados e ao controle de fontes sistemáticas de variação para maior controle da variância residual Na abordagem dos delineamentos experimentais frequentemente utilizados em Zootecnia foi dado Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA embasamento na aplicabilidade do teste F da análise de variância principalmente em relação às pressuposições para sua utilização Nos capítulos 13 e 14 foi realizada uma abordagem sobre peculiaridades dos testes de Tukey e de Duncan utilizados frequentemente após a análise de variância no contexto de comparação entre médias observadas dos tratamentos Foi tratado a respeito do rigor desses testes de comparações múltiplas e das condições individuais para uso com base no controle dos erros do tipo I e II E no capítulo 15 foram discutidas informações sobre o ajuste do modelo de regressão linear de 1º grau aos dados de uma variável dependente com ênfase no entendimento do método dos mínimos quadrados ordinários para estimação dos parâmetros do modelo dos testes realizados na análise de variância da regressão e no índice de avaliação da eficiência do modelo como o coeficiente de determinação para indicar a qualidade de ajuste Antecipadamente peço desculpas por possíveis erros ortográficos gramaticais e de digitação que possam ter ocorrido Encaminhamentos para o aperfeiçoamento deste material com críticas construtivas e sugestões oportunas serão bemvindas A ideia principal é deixar o presente material com identidade própria alinhado às atividades que vem sendo desenvolvidas no Centro de Ciências Agrárias da Unioeste e na região oeste do estado do Paraná Marechal Cândido Rondon 02 de fevereiro de 2024 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA Conteúdo Capítulo Página R e RStudio 1 1 Estatística e metodologia científica 2 2 Testes de hipóteses 4 3 Teste Z para uma amostra 8 4 Teste de variância para uma amostra proveniente da distribuição normal 13 5 Teste F para comparação de variâncias de duas amostras independentes 19 6 Teste t para duas amostras independentes 25 7 Teste t para dados emparelhados 33 8 Análise de correlação linear 37 9 Intervalo de confiança para a média populacional 44 10 Teste de aderência de quiquadrado 2 54 11 Teste de independência de quiquadrado 2 64 12 Conceitos e princípios básicos da experimentação 69 13 Delineamento inteiramente casualizado DIC 71 14 Delineamento em blocos casualizados completos DBC 81 15 Testes de comparações múltiplas TCM 89 16 Análise de regressão linear de 1º grau 101 17 Bibliografia consultada 117 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 1 R e RStudio TUTORIAL PARA INSTALAÇÃO DO R a wwwrprojectorg b CRAN c httpscranrc3slufprbr d Download R for Windows e base f Download R 432 for Windows g Ir na pasta Downloads e abrir o arquivo executável h Sim i Português Brasileiro j Próximo k Próximo l Core Files sim 64bit Files sim Message translations sim m Não aceitar padrão n Próximo o Criar um atalho na área de trabalho sim Criar um atalho na barra de inicialização rápida não Salvar número da versão no registro sim Associar arquivos RData ao R sim p Concluir TUTORIAL PARA INSTALAÇÃO DO RSTUDIO a httpsrstudiocomproductsrstudiodownload b DOWNLOAD RSTUDIO DESKTOP FOR WINDOWS sim c Ir na pasta Downloads e abrir o arquivo executável O RStudio é um software livre de ambiente de desenvolvimento integrado IDE ou interface com o R e Python e que contém um conjunto de ferramentas integradas para execução direta de códigos visando a plotagem visualização de histórico depuração e gerenciamento do espaço de trabalho realização de cálculos estatísticos O programa possui quatro janelas Editor Console Environment e History e Plots Packages e Help INSTALAÇÃO DE PACOTES installpackagesDescTools installpackagespsych installpackagesfBasics installpackagesTeachingDemos installpackagesPairedData installpackagesagricolae installpackagesmultcomp installpackageslaercio CARREGAMENTO REQUERIMENTO DE PACOTES E ALGUMAS FUNÇÕES ÚTEIS libraryDescTools PDFManualnome do pacote Manuais em pdf VarTest Teste F para variâncias de duas amostras e Teste de χ2 para uma variância amostral TTestA teste t para duas amostras independentes se as observações nas amostras não são dadas e para amostras pareadas teste da diferença para uma amostra se as observações amostrais são dadas librarypsych descritivas por grupo describeBy requirefBasics basicStatsx ci1α Intervalo de confiança para a média populacional librarystats vartest Teste F para variâncias de duas amostras independentes quando as amostras são coletadas ttest Teste t de Student para comparar duas médias amostrais independentes e pareadas cortest Teste t para análise de correlação funções de distribuições de probabilidade d p q r chisqtest Teste de aderência de χ2 para uma amostra libraryTeachingDemos ztest Teste Z para uma amostra normal libraryPairedData Vartest Teste de χ2 para comparação entre a variância de uma amostra normal e uma variância populacional teórica Vartest Teste F para comparação de variâncias de duas amostras independentes normais libraryagricolae HSDtest Teste de Tukey Teste de Duncan librarymultcomp glht general linear hypothesis and multiple comparisons contrastes librarylaercio Testes de Tukey Duncan SNK Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 2 Capítulo 1 Estatística e metodologia científica 11 Estatística Ciência que trata da coleta organização classificação análise apresentação e interpretação de dados observados Justificativa Possibilidade de se extrair as informações previstas nos objetivos do projeto contidas nos dados numéricos para melhor compreensão dos fenômenos estudados Aplicação da estatística na área zootécnica e agronômica A ferramenta indispensável para tomada de decisões relacionadas às pesquisas 12 Tipos de pesquisa 121 Estudo observacional Trabalho planejado por amostragem no qual se mensura variáveis sem introduzir fatores de influência sobre as respostas Sistema aberto Não há controle dos efeitos dos fatores Pode haver classificação dos fatores por categorias Não se aplica os princípios básicos da experimentação 122 Pesquisa por experimentação Estudo do planejamento execução análise dos dados e interpretação de resultados experimentais Há intenção de testar o efeito de um ou mais fatores sobre as respostas individuais de uma variável Controle de fontes de variação sistemática com uso de delineamentos apropriados Minimização do erro aleatório propiciando maior precisão Sistema fechado 13 Fluxograma simplificado do método científico Problema O pesquisador tem observado que a baixa dosagem contínua de HDL sanguíneo causa problemas circulatórios Então ele deduz que pode utilizar um medicamento para aumentar sua concentração no sangue Figura 11 Etapas do método científico e a contribuição da estatística SAMPAIO 2007 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 3 131 Contribuição da estatística durante a pesquisa Formulação de hipóteses Após observar o fenômeno normalmente feito na revisão de literatura formulase a hipótese nula H0 e a alternativa Ha o Exemplo O pesquisador constatou na literatura a dose de 600 mg de licopeno L100 kg de peso corporal PC têm sido indicada para aumentar o HDL no sangue Seu objetivo é verificar se uma dosagem inferior à recomendada 450 mg L100 kg PC também proporciona o mesmo resultado o H0 µ 600 mg L100 kg PC e Ha µ 600 mg L100 kg de PC Instalação do experimento Conhecer técnicas experimentais relativas à o Seleção de animais uniformes o Aplicação adequada e uniforme dos tratamentos a serem testados o Delineamentos apropriados às especificidades do experimento Coleta dos resultados o Mensurar dados por meio apropriado usando um protocolo para todas as unidades experimentais o Devese conhecer a natureza das respostas ou seja quais tipos de variável estão no projeto Compactação dos resultados Aplicação da estatística descritiva para cada grupo experimental Teste de hipótese Conhecimento de inferência estatística e cálculo de probabilidade Conclusão Exige conhecimentos estatísticos que permitam diferenciar ou não os grupos experimentais além do conhecimento específico sobre a pesquisa Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA Capítulo 2 Testes de Hipóteses É uma regra decisória que permite aceitar ou rejeitar uma hipótese estatística feita sobre parâmetros populacionais A realização do teste se baseia em informações amostrais H0 μ K H0 μ1 μ2 H0 μ1 μ2μ3μ4 H0 σ2A σ2B H0 β1 0 H0 β0 0 H0 ρXY0 H0 0 H0 s2A s2B H0 b1 0 H0 b0 0 H0 rXY0 H0 Os dados são provenientes de uma distribuição normal Parâmetros populacionais na distribuição normal média μ e variância σ2 21 Estimadores amostrais de parâmetros populacionais a O estimador da média μ m é dado por Xin com i variando de 1 a n b O estimador da variância σ2 é dado por s2 SQDxn1 Xi 2n1 Xi2 Xi2nn1 22 Estimativa É o valor numérico assumido pelo estimador Ex 1042 e s2 467 23 Hipótese estatística É uma suposição quanto ao valor de um parâmetro populacional a ser verificada por um teste paramétrico É uma afirmação quanto à natureza da população a ser verificada por um teste de aderência Devem ser formuladas de modo a minimizar os erros de decisão 231 Exemplos a A média populacional de produção de leite de um rebanho é 15 litrosdia isto é μ 15 ldia b A distribuição dos pesos de um plantel de codornas japonesas é normal c A proporção de indivíduos com a doença X é 3 ou seja P 003 p D d 24 Formulação de Hipóteses 241 Hipótese de Nulidade H0 É a hipótese estatística a ser testada e constitui uma igualdade Os testes são construídos sob a pressuposição de H0 ser verdadeira O teste consiste em verificar se um valor estimado a partir da amostra difere significativamente do seu resultado esperado sob H0 O resultado final do teste é enunciado em termos da hipótese de nulidade 4 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 5 2411 Exemplos a Um fabricante informa que a tensão média de ruptura de cabos é 50 kgf H0 50 b Uma indústria revela que a temperatura ideal para germinação de sementes de Panicum maximum é de 35 C H0 35 c Duas marcas de rações 1 e 2 propiciam o mesmo ganho de peso médio para leitões em fase de crescimento H0 1 2 OBS Tem que haver evidência amostral sugerindo que a H0 não é verdadeira 242 Hipótese Alternativa Ha É uma hipótese que contraria a H0 formulada com base no objetivo do pesquisador associada com desigualdades No caso das marcas de rações a Ha pode ser o Ha 1 2 Bilateral Figura 21 o Ha 1 2 ou Ha 2 1 Unilateral à esquerda Figura 22 o Ha 1 2 ou Ha 2 1 Unilateral à direita Figura 23 25 Regiões de um teste estatístico de hipóteses 251 Região de Aceitação de H0 RAH0 É a região sob a função densidade de probabilidade que engloba os valores da estatística que não rejeitam a H0 252 Região de Rejeição de H0 RRH0 ou Região Crítica É a faixa de valores da estatística do teste Z t χ2 F que causam a rejeição da hipótese H0 Figura 21 Regiões de um teste de hipóteses para uma Ha bilateral Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 6 Figura 22 Regiões de um teste de hipóteses para uma Ha unilateral à esquerda Figura 23 Regiões de um teste de hipóteses para uma Ha unilateral à direita 26 Erros associados aos testes estatísticos de hipóteses 261 Erro do tipo I ou erro É a probabilidade de se rejeitar a H0 quando esta é verdadeira ou seja o pesquisador deveria atribuir uma equivalência às médias mas atribuiu uma significância Tratase do resultado falso positivo Denominado de nível de significância do teste 262 Erro do tipo II ou erro É a probabilidade de se aceitar a H0 quando esta é falsa ou seja o pesquisador deveria atribuir uma significância às médias mas atribuiu uma equivalência Tratase do resultado falso negativo H0 1 2 Tabela 21 Resumo das probabilidades na aplicação de um teste de hipóteses Decisão Realidade H0 é verdadeira H0 é falsa Rejeitar H0 1 Aceitar H0 1 A ocorrência dos erros é simultânea mas o controle é antagônico Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 7 O erro representa a dimensão da região crítica área sob a curva que está sob controle do pesquisador A quantidade 1 representa a probabilidade de se rejeitar a H0 sendo esta falsa poder do teste A quantidade 1 representa a probabilidade de se aceitar H0 sendo esta verdadeira índice de confiança do teste 27 Protocolo para aplicação de um teste estatístico de hipóteses 1 passo Enunciar as hipóteses H0 e Ha 2 passo Fixar o nível de significância e identificar a estatística do teste 3 passo Determinar a região crítica e a região de aceitação de H0 valor da estatística tabelada 4 passo Calcular o valor da estatística do teste com base em informações amostrais 5 passo Aplicar a regra decisória do teste 6 passo Com o resultado da regra decisória observar a H0 e concluir interpretando o problema 28 Escolha da estatística do teste de hipóteses A estatística do teste de hipótese depende da distribuição da variável na população e das informações disponíveis Figura 24 Figura 24 Escolha da estatística de um teste de hipóteses de acordo com as informações disponíveis 29 Teorema do limite central Se tomadas grandes amostras de uma população as médias amostrais terão distribuição normal mesmo se os dados originais não tenham distribuição normal Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 8 Capítulo 3 Teste Z para uma amostra 31 Introdução Se x1 x2 x3 xn são observações independentes de uma amostra aleatória de uma população em que Xi é uma VAC com N Xi Nµ 2 então a média Z também terá N Z N µ 2n Assim para uma população com µ e conhecidos podese comparar a média de uma amostra Z e a média populacional µ por meio da estatística Z 32 Protocolo para aplicação do teste Z 1º Passo Enunciar as hipóteses H0 e Ha H0 µ k contra Ha µ k ou Ha µ k ou Ha µ k 2º Passo Fixar o nível de significância e identificar a estatística do teste 3º Passo Determinar a região crítica e a região de aceitação de H0 Figura 31 Curva de densidade de probabilidade de Z 00 01 02 03 04 x functionZ dnormZ 0 1 3 0 3 RAH0 1alfa RRH0alfa2 RRH0alfa2 Z 196 Z 196 Tabela 31 Tipo de hipótese alternativa do teste nível de significância e valor tabelado da estatística Z Teste Ha Nível de significância α Ztab Bilateral 5 1960 Bilateral 1 2576 Unilateral à direita 5 1645 Unilateral à direita 1 2326 Unilateral à esquerda 5 1645 Unilateral à esquerda 1 2326 4 passo Obter o valor calculado de Z com base em informações amostrais Zcal X μxσxn12 Em que Zcal valor da estatística calculada X média amostral da variável X μX média populacional de X σX desvio padrão populacional e n tamanho amostral ou o n de observações da amostra 5 passo Aplicar a regra decisória do teste a Teste bilateral se Zcal Ztab RH0 ou Zcal Ztab RH0 b Teste unilateral à esquerda se Zcal Ztab RH0 c Teste unilateral à direita se Zcal Ztab RH0 6 passo Com o resultado da regra decisória observar a H0 e concluir interpretando o problema Exemplo 31 Suspeitase que um medicamento vasodilatador para hipertensão arterial esteja aumentando a frequência cardíaca FC dos pacientes Para isso coletouse uma amostra aleatória de 50 pacientes que receberam o medicamento e mediuse a FC de cada um A FC na população de indivíduos sadios apresenta distribuição normal com média 698 batimentos por minuto e σ 186 batmin A amostra com 50 pacientes apresentou uma média de 705 batmin A média amostral é maior do que a média da população normal a 5 de probabilidade Resolução 1 passo H0 μ 698 e Ha μ 698 2 passo α 5 Teste Z 3 passo Gráfico região crítica Ztab Z5 1645 Verificação do valor de Ztab qnorm09501lowertailT 1 1644854 lowertailT PZz Figura 32 Curva de densidade de probabilidade da VAC Z 4passo Zcal X μxσxn12 705 6981865012 269 5 passo Zcal 269 Ztab 1645 RH0 6 passo Pelo teste Z ao nível de 5 de probabilidade há evidências de que a frequência cardíaca média no grupo de pacientes que tomam o remédio é maior que a da população normal requireTeachingDemos Outras libraries com o procedimento do teste Z DescTools BSDA ztestx705 mu698 sd186 alternative greater n50 conflevel 095 One Sample ztest data 705 z 26612 n 5000000 Std Dev 186000 Std Dev of the sample mean 026304 pvalue 0003894 alternative hypothesis true mean is greater than 698 95 percent confidence interval 7006733 Inf sample estimates mean of 705 705 Se pvalue α RH0 então o valor cal valor tab Se pvalue α AH0 valor cal valor tab Verificação do valor p conceito do valor p PZ Zcal pnorm2661201lowertailF 1 0003893135 lowertailF PZ z pqrd Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 11 Capítulo 3 Lista de exercícios sobre teste Z para uma amostra 1 Um rebanho leiteiro produz em média 125 kg de leite por dia com o desvio padrão 205 kgdia O responsável técnico resolve introduzir uma nova composição alimentar de menor custo objetivando o aumento da produção diária de leite Após determinado período com uma amostra de 65 animais verificouse que Xi 871kgdia i varia de 1 a 65 Teste a H0 para 5 H0 µ 125 e Ha µ 125 ztestx134 mu 125 sd205 alternative greater n65 conflevel 095 2 O índice de verminose de determinado rebanho é de 154 ud com desvio padrão igual a 145 ud O responsável técnico do rebanho resolve adotar medidas sanitárias objetivando a redução do índice de verminose Para testar a hipótese H0 5 seleciona ao acaso 54 animais representativos e obtém Xi 61020 ud54 animais ztestx113 mu 154 sd145 alternative less n54 conflevel 095 3 Uma ração é vendida para promover o ganho médio de 14 kganimaldia no período de crescimento Para testar o produto foram selecionados 64 animais na mesma fase de crescimento estabelecida pelo produtor da ração Se a 2 034 kg2animaldia e Xi 10368 kg64 animaisdia teste a hipótese H0 1 H0 µ 14 e Ha µ 14 qnorm099501lowertailT 1 2575829 qnorm000501lowertailT 1 2575829 ztestx162 mu 14 sd05831 alternative twosided n64 conflevel 099 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 12 4 Num país desenvolvido iniciase um programa dietético com o objetivo de incentivar uma população potencialmente propensa às diabetes a reduzir a dosagem de açúcar no sangue Sabese que a população mencionada tem média igual a 154 mg com desvio padrão igual a 30 mg e que o teor de açúcar é normalmente distribuído Após 200 dias de iniciado o programa uma amostra de 100 pessoas foi selecionada para testar a H0 contra a hipótese alternativa ao nível de 5 de probabilidade Se Xi 13500 i varia de 1 a 100 verifique a hipótese H0 5 O rendimento médio RM de um tipo de veículo tem distribuição normal com média 1283 kmhora e desvio padrão igual a 10 kmh Um novo tipo de regulagem foi introduzido com o objetivo de aumentar o RM Para testar a H0 foram amostrados 64 veículos semelhantes que regulados da nova maneira apresentaram média de rendimento igual a 1345 kmh Teste a H0 ao nível de 5 de probabilidade 6 Uma indústria de equipamentos de som afirma que determinado aparelho dispõe de uma potência de 1400 W Selecionada uma amostra de 85 aparelhos determinouse Xi 112200 W i varia de 1 a 85 Considerando que a potência tem distribuição normal com desvio padrão igual a 250 W teste a H0 ao nível de 5 de probabilidade 7 Em certa lavoura de milho as alturas dos pés da gramínea correspondem a uma variável X com distribuição aproximadamente normal e desvio padrão igual a 21 cm Selecionandose aleatoriamente uma amostra de 49 pés encontrouse uma altura média de 217 cm Fixando um nível de significância de 5 teste a H0 µ 214 cm contra a hipótese alternativa de µ 214 cm 8 Uma população de 3000 bezerros apresenta a média de peso igual a 58 kg com variância de 36 kg2 Para uma exposição agropecuária selecionaramse 100 animais que representarão a população O peso médio amostral foi de 50 kg Teste a hipótese que o peso médio é diferente de 58 kg ao nível de 1 de significância Respostas 1 Ztab 1645 e Zcal 035 2 Ztab 1645 e Zcal 208 3 Ztab 257 e Zcal 302 4 Ztab 1645 e Zcal 639 5 Ztab 1645 e Zcal 496 6 Ztab 196 e Zcal 295 7 Ztab 1645 e Zcal 100 8 Ztab 257 e Zcal 1333 Capítulo 4 Teste de variância para uma amostra proveniente da distribuição normal Se os dados amostrais da VAC X apresentam distribuição normal com σ2X conhecida é possível comparar a variância amostral observada s2x em relação a uma variância populacional teórica σ2X por meio da utilização da estatística de quiquadrado χ2 Utilizada para verificação da significância ou não do viés de desviopadrão DP quando se compara o DP de uma amostra X com a média dos DP estimados em n amostrasfilhas obtidas com reposição e por simulação da amostramãe X 1º Passo H0σ2Xσ20 contra Haσ2Xσ20 ou Haσ2Xσ20 ou Haσ2Xσ20 em que σ20 é igual ao valor hipotético da variância populacional constante 2º Passo Estatística de quiquadrado χ2 com α 3º Passo χ2tab χ2n1 α em que n tamanho amostral Obs No software R podese obter os valores tabelados da distribuição de quiquadrado por qchisqp df ncp 0 lowertail TRUE logp FALSE em que q quantis da distribuição de χ2 p vetor de probabilidades df graus de liberdade e lowertail parâmetro lógico se TRUE padrão as probabilidades são PX x senão PX x Tabela A Alguns valores críticos unilateral à direita de χ2 segundo os graus de liberdade e a probabilidade de erro do tipo I Graus de liberdade GL Erro do tipo I 010 005 002 001 1 271 384 541 664 2 460 599 782 921 3 625 782 984 1134 4 778 949 1167 1328 5 924 1107 1339 1509 6 1064 1259 1503 1681 7 1202 1407 1662 1848 8 1336 1551 1817 2009 9 1468 1692 1968 2167 10 1599 1831 2116 2321 11 1768 1968 2262 2472 12 1855 2103 2405 2622 13 1981 2236 2547 2769 14 2106 2368 2687 2914 15 2231 2500 2826 3058 Figura 41 Curva de densidade de probabilidade de χ2 com GL 5 para teste unilateral à direita qchisq095 5 lowertail TRUE 1 110705 4º Passo χ2cal n1s2σ02 em que n tamanho amostral nº de observações s2 variância amostral e σ02 valor hipotético da variância populacional 5º Passo Teste unilateral à direita Se χ2cal χ2tab à direita RH0 ao nível α de probabilidade P Teste unilateral à esquerda Se χ2cal χ2tab à esquerda RH0 ao nível α de probabilidade Teste bilateral Se χ2cal χ2tab à direita ou χ2cal χ2tab à esquerda RH0 ao nível α de P 6º Passo Pelo teste de quiquadrado ao nível de α de probabilidade a variância amostral se equivale ou não se equivale ao valor hipotético da variância populacional Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 15 Exemplo 41 Sejam as notas de 37 discentes do curso de Zootecnia que frequentaram as aulas da disciplina de Estatística Básica Xc88808092707488969874809070847688987684788476968274809678967490 889294808494 meanX 1 8437838 sdX 1 8443773 varX 1 712973 A média amostral da variável NOTA X distribuída normalmente foi de 8438 o valor de desviopadrão amostral foi de 844 e a variância amostral foi igual a 7130 Se a variância populacional teórica 2X preconizada para o aprendizado homogêneo da disciplina é de 80 do valor médio teste a H0 e verifique se a variabilidade das notas obtida nesta turma atende ao critério estabelecido 005 Resolução 1o Passo H0X 2 6750 contra HaX 2 6750 2o Passo 2 com 005 3o Passo χtab à direita 2 χn1 α 2 χ36 005 2 5444 qchisq0975 36 lowertail TRUE 1 5443729 χtab à esquerda 2 χn1 α 2 χ36 005 2 2134 qchisq0025 36 lowertail TRUE 1 2133588 4º Passo χ2cal n1s2σ02 3717129736750 2566706750 3803 5º Passo χ2tab à esquerda χ2cal χ2tab à direita AH0 6º Passo Pelo teste de quiquadrado ao nível de 5 de probabilidade a variância amostral se equivale ao valor hipotético da variância populacional O critério de variância igual a 80 da média da nota da disciplina especificação do docente da disciplina continua em vigor Análise pelo R requirePairedData VartestX ratio 6750 alternative ctwosided conflevel 095 Checagem do valor p 2pchisq38025 36 lowertail F 1 07545655 Quando não é informada a composição do vetor numérico o resultado do teste bilateral de χ2 para comparação da variância amostral com o valor hipotético da variância populacional pode ser obtido pela função a seguir varqqtestfunctions2nsigma2alpha1alpha2 gln1 qq1qchisqalpha1gl qq2qchisqalpha2gl qqcalgls2sigma2 p2pchisqqqcalgllowertailF returnp Em que s2 valor da variância amostral n número de observações sigma2 valor da variância populacional na H0 alpha1quantil α2 alpha2quantil α2 Assim para o exemplo anterior varqqtest71303767500250975 1 07544218 Obs Se o teste for unilateral à direita basta dividir o resultado do valorp por dois Exercícios 1 O desvio padrão de altura para alunos em uma escola é de 081 Uma amostra aleatória de 50 alunos é coletada e o desvio padrão das alturas da amostra é de 096 Um pesquisador responsável pelo estudo acredita que o desvio padrão de altura para a escola é superior a 081 Teste a H0 α 005 e conclua 2 Uma empresa embala maçãs em peso Uma das notas de peso é maçã classe A que têm um peso médio de 150 g com tolerância máxima de peso permitida de 5 acima ou abaixo da média para maçãs no mesmo pacote de consumo Um lote de maçãs é selecionado para ser incluído em um pacote de maçã classe A cujos pesos g das maçãs são 158 167 149 169 164 139 154 150 157 171 152 161 141 166 172 A fruta cumpre os requisitos de tolerância do peso classe A Aplique um teste de hipótese apropriado para α 005 Resolução 150 g x 005 75 g desviopadrão populacional especificação do fabricante ou da indústria ou do produtor Faixa de valores para maçã classe A 150751575 g 150751425 g 1425 Maçã A 1575 g σ2 σ x σ 75 x 75 5625 g2 X1c158 167 149 169 164 139 154 150 157 171 152 161 141 166 172 requirepsych describeX1 requirefBasics basicStatsX1 ci 095 varX1 1 1088571 1º Passo H0σX2 5625 contra HaσX2 5625 2º Passo χ2 com α 005 3º Passo χ2tab à direita χ2n1α χ2140975 2612 qchisq0975 14 lowertail TRUE 1 2611895 χ2tab à esquerda χ2n1α χ2140025 563 qchisq0025 14 lowertail TRUE 1 5628726 4º Passo χ2cal n1s2σ02 15110885715625 1524005625 2709 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 18 5o Passo χcal 2 χtab à direita 2 RH0 6o Passo Pelo teste de quiquadrado ao nível de 5 de prob a variância amostral difere do valor hipotético da variância populacional As maças não cumprem os requisitos de peso para a classe A Análise pelo R requirePairedData VartestX1 ratio5625 alternativectwosided conflevel 095 ratio valor da variância pop Ou requireDescTools VarTestX1 sigmasquared5625 alternativectwosided conflevel095 sigmasquared 2 Checagem do valor p pela função Vartest 2pchisq27093 14 lowertail F 1 003744902 pvalue utilizando a área da cauda à direita como padrão apchisq2612 14 lowertail F a 1 002499228 bpchisq563 14 lowertail T b 1 002502636 a b 1 005001864 Nível de significância utilizando as duas áreas Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 19 Capítulo 5 Teste F para comparação de variâncias de duas amostras independentes 51 Introdução Se os dados têm distribuição normal é possível comparar as variâncias de duas amostras independentes obtidas a partir de duas populações normais por meio da distribuição F assimétrica 52 Protocolo para aplicação do teste F unilateral à direita 1o Passo Enunciar as hipóteses H0 e Ha H0 2x 2y vs Ha 2x 2y ou H0 2x 2y vs Ha 2y 2x Equivalência H0 X 2 Y 2 1 vs Ha X 2 Y 2 1 ou H0 Y 2 X 2 1 vs Ha Y 2 X 2 1 2o Passo Fixar o nível de significância e identificar a estatística do teste 3o Passo Determinar a região crítica e a região de aceitação de H0 Figura 51 Curva de densidade de probabilidade da VAC F para um teste unilateral à direita Usase a tabela unilateral para o valor de F ser maior que 1 Ha unilateral à direita O valor de Ftab depende dos graus de liberdade n 1 da variável do numerador s2 e do denominador s2 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 20 Se s2X s2Y Ftab FnX 1 nY 1 em que se observa o GLX na parte superior da tabela F e o GLY na parte lateral da tabela F Se s2Y s2X Ftab FnY 1 nX 1 em que se observa o GLY na parte superior da tabela F e o GLX na parte lateral da tabela F Tabela F Limites unilaterais de F ao nível de 5 de probabilidade para o caso de F 1 n2 1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 20 1 1614 1995 2157 2246 2302 2340 2368 2389 2405 2419 2430 2439 2444 2450 2459 2460 2480 2 1851 1900 1916 1925 1930 1933 1935 1937 1938 1940 1940 1941 1942 1942 1943 1943 1945 3 1013 955 928 912 901 894 889 885 881 879 876 874 872 871 870 869 866 4 771 694 659 639 626 616 609 604 600 596 593 591 589 587 586 584 580 5 661 579 541 519 505 495 488 482 477 474 470 468 466 464 462 460 456 6 599 514 476 453 439 428 421 415 410 406 403 400 398 396 394 392 387 7 559 474 435 412 397 387 379 373 368 364 360 357 355 352 351 349 344 8 532 446 407 384 369 358 350 344 339 335 331 328 325 323 322 320 315 9 512 426 386 363 348 337 329 323 318 314 310 307 304 302 301 298 294 10 496 410 371 348 333 322 314 307 302 298 294 291 288 286 285 282 277 11 484 398 359 336 320 309 301 295 290 285 282 279 276 274 272 270 265 12 475 389 349 326 311 300 291 285 280 275 272 269 266 264 262 260 254 13 467 381 341 318 303 292 283 277 271 267 263 260 257 255 253 251 246 14 460 374 334 311 296 285 276 270 265 260 256 253 250 248 246 244 239 15 454 368 329 306 290 279 271 264 259 254 251 248 245 243 240 239 233 16 449 363 324 301 285 274 266 259 254 249 245 242 239 237 235 233 228 17 445 359 320 296 281 270 261 255 249 245 241 238 235 233 231 229 223 18 441 355 316 293 277 266 258 251 246 241 237 234 231 229 227 225 219 19 438 352 313 290 274 263 254 248 242 238 234 231 228 226 223 221 216 20 435 349 310 287 271 260 251 245 239 235 231 228 225 223 220 218 212 n1 número de graus de liberdade do numerador e n2 número de graus de liberdade do denominador Tabela F Limites unilaterais de F ao nível de 1 de probabilidade para o caso de F 1 n2 1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 20 1 4052 5000 5403 5625 5764 5859 5928 5982 6022 6056 6082 6106 6125 6142 6157 6169 6209 2 9850 9900 9917 9925 9930 9933 9936 9937 9939 9940 9941 9942 9942 9943 9943 9944 9945 3 3412 3082 2946 2871 2824 2791 2767 2749 2735 2723 2713 2705 2698 2692 2687 2683 2669 4 2120 1800 1669 1598 1552 1521 1498 1480 1466 1455 1445 1437 1430 1424 1420 1415 1402 5 1626 1327 1206 1139 1097 1067 1046 1029 1016 1005 996 989 983 977 972 968 955 6 1375 1092 978 915 875 847 826 810 798 787 779 772 766 760 756 752 740 7 1225 955 845 785 846 719 699 684 672 662 654 647 641 635 631 627 616 8 1126 865 759 701 663 637 618 603 591 581 574 567 561 556 552 548 536 9 1056 802 699 642 606 580 561 547 535 526 518 511 505 500 496 492 481 10 1004 756 655 599 564 539 520 506 494 485 478 471 465 460 456 452 441 11 965 721 622 567 532 507 489 474 463 454 446 440 434 429 425 421 410 12 933 693 595 541 506 482 464 450 439 430 422 416 410 405 401 398 386 13 907 670 574 521 486 462 444 430 419 410 402 396 390 385 382 378 366 14 886 651 556 504 469 446 428 414 403 394 386 380 375 370 366 362 351 15 868 636 542 489 456 432 414 400 389 380 373 367 361 356 352 348 337 16 853 623 529 477 444 420 403 389 378 369 361 355 350 345 341 337 326 17 840 611 518 467 434 410 393 379 368 359 352 346 340 335 331 327 316 18 829 601 509 458 425 401 384 371 360 351 344 337 332 327 323 319 308 19 818 593 501 450 417 394 377 363 352 343 336 330 324 319 315 312 300 20 810 585 494 443 410 387 370 356 346 337 330 323 318 313 309 305 294 n1 número de graus de liberdade do numerador e n2 número de graus de liberdade do denominador Obtenção do valor tabelado da distribuição F5 GL1 5 GL2 20 no R qf095 5 20lowertail TRUE 1 271089 4o passo Obter o valor calculado de F com base em informações amostrais o A maior variância fica no numerador Fcal 1 o Fcal s2s2 s2Xs2Y ou Fcal s2s2 s2Ys2X Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 21 5o passo Aplicar a regra decisória do teste o Teste unilateral à direita se Fcal Ftab RH0 ao nível de probabilidade 6o passo Com o resultado da regra decisória observar a H0 e concluir pela aceitação ou rejeição da hipótese nula fazendo uma interpretação do problema Exemplo 51 Teste a hipótese de igualdade das variâncias ao nível de 5 de probabilidade após a aplicação de dois métodos X e Y Método s2 n X 40 11 Y 16 19 Resolução 1o H0 2x 2y e Ha 2x 2y 2o 5 Teste F 3o Gráfico região crítica Ftab F5 10 18 241 Figura 42 Curva de densidade de probabilidade da VAC F qf095 10 18lowertail TRUE 1 2411702 4o Passo Fcal s2s2 s2Xs2Y 4016 25 5o Passo Fcal Ftab Rejeitase a H0 6o Passo Pelo teste F ao nível de 5 de probabilidade as variâncias pop não são iguais homogêneas Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 22 Análise pelo R vx40 vy16 fcalvxvy p pffcal 1119 lowertail F 1 a função de probabilidade acumulada Fx no ponto Fcal 250 p Probabilidade de significância 1 003837108 Regra decisória e conclusão Como o valor de probabilidade de significância p 005 então RH0 Pelo teste F 005 as variâncias não são homocedásticas equivalentes A variância da amostra X é maior que a variância da amostra Y Se forem dadas as amostras X e Y podese utilizar a função Vartest do pacote PairedData Exemplo 52 Sejam as observações contidas na amostra Xc4354648525558 e na amostra Yc8859841027968 helpVartest requirePairedData VartestYXratio 1 alternative cgreater conflevel 095 Regra decisória e conclusão Como o valor de probabilidade de significância pvalue 005 então AH0 Pelo teste F 005 as variâncias são homocedásticas equivalentes Do mesmo modo se as amostras Xc14155156158168176177149148135 e Yc121321141011811 forem coletadas podese utilizar a função vartest do pacote stats helpvartest vartestXYratio 1 alternative cgreater conflevel 095 ou vartestlmY 1 lmX 1 Obs Acesse VarTest no console do R do pacote DescTools Capítulo 5 Lista de exercícios sobre teste F 1 Um pesquisador deseja saber se a variabilidade de peso de ovos de poedeiras Leghorn é maior que a variação de peso de ovos de codornas As amostras de ovos de codornas n 15 e de ovos de galinhas n 15 apresentaram XOC 10g sOC 11 XOG 50g e sOG 65 Teste a H0 e conclua para α 5 2 Para verificar se a densidade de 600 peixesm3 aumenta a variação da produtividade kgm3 em um tanquerede 30 m3 de produção de tilápias sistema intensivo coletaramse duas amostras uma 15 dias antecedendo à despesca e a outra no dia da despesca A 1ª amostra 30 tilápias forneceu X1 27010 g e s 934 g Na 2ª amostra 24 tilápias a X2 foi de 28345 g e o s 2322 g Conclua α 1 se houve ou não variabilidade de produtividade nesse período 3 Uma empresa estrangeira deseja importar 1 tonelada de mel in natura de um apiário Brasileiro Para que possa ser armazenado adequadamente sem risco de fermentações a legislação internacional recomenda que o teor de umidade deve ser o menor possível e com um mínimo de variação Ao embalar o mel em potes de plástico o apiário recolheu amostras de mel de duas floradas para avaliar qual dos tipos se enquadrava melhor ao teor de umidade préestabelecido Os valores de umidade do mel da Florada laranjeira FL 10 potes amostrados e da Florada mista FM 12 potes amostrados cujas análises foram feitas em duplicata foram os seguintes MEL 1 2 3 4 5 6 7 8 9 10 11 12 FL 175 192 18 174 198 193 188 179 199 182 FM 181 222 203 22 180 202 165 171 212 204 195 243 Aplique o teste F e conclua a 5 de probabilidade se as variâncias são homogêneas Indique o mel que deverá ser exportado baseado no critério da homogeneidade utilizando o cálculo do coeficiente de variação para os 2 tipos de mel 4 A qualidade de rebites é tanto melhor quanto maior sua homogeneidade Seis rebites de duas marcas foram ensaiados ao cisalhamento conforme as cargas de ruptura Tabela X Os resultados ratificam a afirmação do produtor da marca B de que seus rebites são melhores α 5 Tabela X Cargas de ruptura de acordo com a marca do rebite Rebite 1 2 3 4 5 6 Marca A 349 355 388 392 337 376 Marca B 385 390 407 429 378 414 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 24 5 Um pesquisador quer investigar se os pesos médios kg de uma variedade mais rústica de abóbora A são mais homogêneos do que os pesos médios de outra variedade mais produtiva B Para isso foi realizada uma amostragem n 7 em que os fatores climáticos luz temperatura umidade e de solo adubação espaçamentos entre outros foram equivalentes Verifique 5 se há variação entre pesos para as duas variedades de abóbora a partir dos pesos médios na colheita de três abóboras por repetição Tabela X Tabela X Peso médio de abóboras de acordo com a variedade Variedade Repetição 1 2 3 4 5 6 7 A 2125 2155 2035 2240 2330 2110 1985 B 2750 2640 2510 2385 2460 2530 2675 6 Uma empresa avícola deseja manter em suas instalações frangos que apresentem homogeneidade de rendimento de carne de peito Para isso coletaramse aleatoriamente 10 frangos de 2 galpões cujas aves eram de linhagens diferentes Os resultados médios obtidos após abate foram Galpão A 302 320 313 298 334 312 334 315 295 340 Galpão B 323 300 283 276 264 315 302 265 278 313 Perguntase A variância da linhagem B é maior que a da linhagem A a 5 de significância Respostas 1 Ftab 248 e Fcal 3492 2 Ftab 249 e Fcal 618 3 Ftab 310 Fcal 615 CV 496 para exportação e CV 1145 4 Ftab 505 e Fcal 133 5 Ftab 428 e Fcal 121 6 Ftab 318 e Fcal 186 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 25 Capítulo 6 Teste t para duas amostras independentes 61 Introdução Se os dados das amostras X e Y apresentam distribuição normal com X e Y desconhecidos é possível comparar duas médias amostrais independentes por substituição das variâncias das populações 2 pelas variâncias amostrais s2 utilizandose a estatística t de Student 62 Protocolo para aplicação do teste t para duas amostras independentes 1o Passo Enunciar as hipóteses H0 e Ha do teste F para verificar a homogeneidade ou não das variâncias populacionais H0 2x 2y contra Ha 2x 2y ou Ha 2y 2x 2o Passo Identificar a estatística do teste e fixar o nível de significância 3o Passo Determinar a região crítica valor de Ftab e a região de aceitação de H0 Se s2X s2Y Ftab F nX 1 nY 1 em que se observa o GLX na parte superior da tabela F e o GLY na parte lateral da tabela F Se s2Y s2X Ftab F nY 1 nX 1 em que se observa o GLY na parte superior da tabela F e o GLX na parte lateral da tabela F 4o passo Obter o valor calculado de F com base em informações amostrais A maior variância fica no numerador Fcal 1 Fcal s2s2 s2X s2Y ou Fcal s2s2 s2Y s2X 5o passo Aplicar a regra decisória do teste o Teste unilateral à direita se Fcal Ftab RH0 ao nível de probabilidade 6o passo Com o resultado da regra decisória observar a H0 e concluir pela aceitação ou rejeição da H0 fazendo uma interpretação do problema Se H0 não for rejeitada ou seja se Fcal Ftab AH0 as variâncias serão homocedásticas Então admitese que as 2 são iguais e os valores assumidos por s2x e s2y são estimativas de um mesmo valor 2 que é a variância comum de ambas as populações Devese combinar sX2 e sY2 para se obter um melhor estimador da variância comum populacional σ2 a variância ponderada sp2 das amostras dada pela média ponderada das variâncias amostrais Se sX2 SQDXnX1 ΣXi2 ΣXi2nXnX1 e sY2 SQDYnY1 ΣYi2 ΣYi2nYnY1 então sp2 nX 1sX2 nY 1sY2nX nY 2 Se H0 for rejeitada ou seja se Fcal Ftab RH0 as variâncias serão heterocedásticas ou seja admitese que as σ2 não são iguais não se combina sX2 e sY2 Então devese calcular os graus de liberdade estimados por meio da equação de Satterthwaite n obtidos por n sX2nX sY2nY2sX2nX2nX 1 sY2nY2nY 1 7º Passo Enunciar as hipóteses H0 e Ha do teste t H0 μX μY contra Ha μX μY ou Ha μX μY ou Ha μX μY 8º Passo Fixar o nível de significância α e identificar a estatística do teste Obs Normalmente o α é o mesmo tanto no teste F quanto no teste t 9º Passo Determinar a região crítica e a região de aceitação de H0 ttab tαnx ny 2 para teste F homocedástico em que nx ny 2 GL ttab tαn para teste F heterocedástico em que n GL Pelo R acessar qtquantil GL lowertailT Ajuste de tabela t com a modalidade de Ha no teste t ttab em tabela bilateral e teste bilateral entrar com α ttab em tabela bilateral e teste unilateral entrar com 2α ttab em tabela unilateral e teste bilateral entrar com α2 ttab em tabela unilateral e teste unilateral entrar com α Tabela utilizada em nossa disciplina pág 31 10º passo Obter o valor calculado de t com base em informações amostrais Erro padrão das diferenças entre médias EPDM denominador do tcal Para σx2 σy2 EPDM sp2nX sp2nY12 e tcal X ȲEPDM Então tcal X Ȳsp2nX sp2nY12 Para σx2 σy2 EPDM sX2nX sY2nY12 e tcal X ȲEPDM Então tcal X ȲsX2nX sY2nY12 11º passo Aplicar a regra decisória do teste a Teste bilateral se tcal ttab RH0 ou tcal ttab RH0 b Teste unilateral à direita se tcal ttab RH0 c Teste unilateral à esquerda se tcal ttab RH0 12º passo Com o resultado da regra decisória observar a H0 e concluir pela aceitação ou rejeição da hipótese nula fazendo uma interpretação do problema Exemplo 61 Um pesquisador deseja comparar duas técnicas de memorização X e Y por meio do tempo exigido para decorar certo tipo de material O mesmo material foi apresentado a nX 18 e nY 13 pessoas as quais o decoraram utilizando as técnicas X e Y respectivamente Os resultados foram X 20 min sX2 12 min2 Ȳ 17 min e sY2 15 min2 Há diferença significativa α 005 entre os dois tempos para as duas técnicas de memorização Resolução 1º passo H0 σX2 σY2 e Ha σY2 σX2 2º passo Teste F e α 005 3º passo F005 1217 238 qf0951217lowertailT 1 2380654 4º passo Fcal sY2sX2 1512 125 5º passo Fcal Ftab Aceitase a H0 6º passo Pelo teste F ao nível de 5 de probabilidade as variâncias são homocedásticas 7º passo H0 μX μY e Ha μX μY 8º passo α 5 Teste t 9º passo ttab t5 29 204 Valor tabelado à esquerda da distribuição t no R ttabnegqt002529lowertailT ttabneg 1 204523 Valor tabelado à direita da distribuição t no R ttabposqt097529lowertailT ttabpos 1 204523 10º passo s²p nx 1s²x ny 1s²ynx ny 2 18112 1311518132 1324 tcal X Ȳs²pnx s²pny12 20 17132418 13241312 226 11º passo tcal ttab RH0 12º passo Pelo teste t ao nível de 5 de probabilidade existe diferença significativa entre as duas técnicas de memorização Análise pelo R mx20 my17 nx18 ny13 s2x12 s2y15 s2pnx1s2xny1s2ynxny2 tcalmxmysqrts2pnxs2pny p 2pttcal 29 lowertail F p 1 00311554 Conclusão Pelo teste t ao nível de 5 de probabilidade existe diferença significativa entre as duas técnicas de memorização Se as observações nas amostras não são dadas podese acessar TTestA no console do R para maiores informações sobre o teste t para duas amostras independentes no pacote DescTools requireDescTools TTestAmx sxsqrts2x nx mysysqrts2y ny alternative ctwosided varequal T conflevel 095 Exemplo 62 Um pesquisador investiga se a ração X causa maior média de peso em suínos do que a ração Y Em 11 animais sorteados ao acaso foi dada a ração X e a outros 19 a ração Y Os resultados foram X 66 kg s²X 40 kg² Ȳ 63 kg e s²Y 16 kg² Conclua α 5 por meio do teste t Resolução 1º passo H0 σ²X σ²Y e Ha σ²X σ²Y 2º passo α 5 Teste F 3º passo Ftab F5 10 18 241 4º passo Fcal s²Xs²Y 4016 25 5º passo Fcal Ftab Rejeitase a H0 6º passo Pelo teste F ao nível de 5 de probabilidade as variâncias são heterocedásticas 7º passo H0 µX µY e Ha µX µY 8º passo α 5 Teste t 9º passo n s²Xnx s²YnY²s²Xnx²nx 1 s²YnY²nY 1 n 4011 1619²4011²11 1 1619²19 1 1473 15 ttab t5 15 175 Utilizando a tabela t pág 31 Valor tabelado unilateral à direita da distribuição t no R ttabposqt0951473lowertailT ttabpos 1 1755163 10º passo tcal X Ȳs²Xnx s²YnY12 66 634011 161912 142 11º passo tcal ttab AH0 12º passo Pelo teste t ao nível de 5 de prob as duas rações garantem o mesmo peso médio dos suínos Análise pelo R mx66 my63 nx11 ny19 s2x40 s2y16 tcalmxmysqrts2xnxs2yny p pttcal 1473 lowertail F p 1 008855546 Conclusão Pelo teste t ao nível de 5 de probabilidade os pesos médios dos suínos são semelhantes Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 30 requireDescTools TTestAmx sxsqrts2x nx mysysqrts2y ny alternative cgreater varequal F conflevel 095 Conclusão Pelo teste t ao nível de 5 de probabilidade os pesos médios dos suínos são semelhantes Cálculo de n n de Satterthwaite no R nSAT s2Xnx s2Yny2s2Xnx2nx 1 s2Yny2ny 1 nSAT 1 1472903 Se as observações das amostras X e Y forem dadas podese utilizar a função ttest do pacote stats Antes devese verificar se as variâncias são homocedásticas ou não Exemplo 63 Sejam as observações contidas nas amostras X e Y Verifique se as médias são equivalentes para 5 Xc4354648525558332946 Yc8859841027968 vartestYXratio 1 alternative cgreater conflevel 095 library stats helpttest ttestXY alternative ctwosided varequal TRUE conflevel 095 library stats Regra decisória e conclusão Como o valor p 784x107 005 então RH0 Pelo teste t 005 as médias das amostras X e Y não são equivalentes diferem entre si Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 31 Tabela t Valores de t em níveis de 10 a 01 de probabilidade GL 10 5 2 1 05 01 1 631 1271 3182 6366 12732 63662 2 292 430 697 992 1409 3160 3 235 318 454 584 745 1294 4 213 278 375 460 560 861 5 202 257 337 403 477 686 6 194 245 314 371 432 596 7 190 236 310 350 403 541 8 186 231 290 336 383 504 9 183 226 282 325 369 478 10 181 223 276 317 358 459 11 180 220 272 311 350 444 12 178 218 268 306 343 432 13 177 216 265 301 337 422 14 176 214 262 298 333 414 15 175 213 260 295 329 407 16 175 212 258 292 325 402 17 174 211 257 290 322 397 18 173 210 255 288 320 392 19 173 209 254 286 317 388 20 173 209 253 284 315 385 21 172 208 252 283 314 382 22 172 207 251 282 312 379 23 171 207 250 281 310 377 24 171 206 249 280 309 375 25 171 206 249 279 308 373 26 171 206 248 278 307 371 27 170 205 247 277 306 369 28 170 205 247 276 305 367 29 170 204 246 276 304 366 30 170 204 246 275 303 365 40 168 202 242 270 297 355 60 167 200 239 266 292 346 120 165 198 236 262 286 337 165 196 233 258 281 329 Capítulo 6 Lista de exercícios sobre teste t para duas amostras independentes 1 Os dados que seguem referemse a cinco determinações da resistência de dois tipos de concreto Ao nível de 5 de significância há evidência de que o concreto 1 seja mais resistente que o concreto 2 Concreto 1 54 55 58 51 57 Concreto 2 50 54 56 52 53 2 Desejase saber se duas máquinas de empacotar café uma nova e outra velha estão fornecendo o mesmo peso médio por pacote As amostras contam de 6 pacotes produzidos pela máquina nova e 9 pela máquina velha Os pesos kg dos pacotes são máquina nova 082 083 079 081 081 080 máquina velha 079 082 073 074 080 077 075 084 078 Qual a conclusão ao nível de 5 de significância 3 Um estudo foi realizado para verificar o efeito da idade de castração no desenvolvimento e produção de suínos Os dados obtidos foram Castração aos 14 dias X1 37 kg s²1 4 kg² n1 16 Castração aos 56 dias X2 31 kg s²2 3 kg² n2 16 Verificar H0 µ1 µ2 vs Ha µ1 µ2 a α 5 4 Verifique α 1 se a diferença entre os pesos médios de aves submetidas a dois tipos de ração é significativa e considerando as hipóteses H0 µ1 µ2 e Ha µ1 µ2 Ração A com sorgo X1 22 kg s²1 24 kg² n1 21 Ração B sem sorgo X2 175 kg s²2 68 kg² n2 21 5 Os dados de ganho de peso para duas raças de suínos ao final de 90 dias de experimento foram os seguintes Raça Duroc X1 40 kg s²1 19 kg² e n1 15 Raça Pietrain X2 32 kg s²2 529 kg² e n2 16 Teste a H0 µ1 µ2 vs Ha µ1 µ2 com α 1 Respostas 1 ttab 186 e tcal 127 2 ttab 220 e tcal 231 3 ttab 170 e tcal 907 4 ttab 204 e tcal 682 5 ttab 249 e tcal 1183 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 33 Capítulo 7 Teste t para dados emparelhados 71 Introdução Dados emparelhados constituem observações de duas amostras cujos elementos estão relacionados dois a dois A cada elemento de uma amostra corresponde um elemento de outra Existe um critério que introduz uma influência marcante entre os pares caracterizando algum tipo de associação ou dependência Exemplo Sejam as medidas sobre o mesmo indivíduo antes e após a aplicação de alguma ração ou medicamento Tabela 61 Tabela 71 Codificação da variável X dado o animal i e as amostras antes e após o uso de um tratamento No do animal i X1i X2i di X2i X1i 1 X11 X21 d1 2 X12 X22 d2 n X1n X2n dn X1i peso do animal i antes 1ª amostra de receber uma ração X2i peso do mesmo animal i depois 2ª amostra que recebeu a ração A unidade de avaliação estatística é a diferença di entre as medidas realizadas no par antes e depois 72 Protocolo para aplicação do teste t pareado 1o passo Enunciar as hipóteses H0 e Ha H0 D k contra Ha D k ou Ha D k ou Ha D k em que D média de todas as diferenças entre pares na população e k constante que representa o valor da média D sob a suposição de H0 ser verdadeira Na maioria das vezes assume valor nulo k 0 2o passo Fixar o nível de significância e identificar a estatística do teste 3o passo Determinar a região crítica e a região de aceitação de H0 Na tabela bilateral Pág 31 o valor de ttab é obtido observandose o erro e n 1 graus de liberdade n número de pares ou seja ttab tα n 1 Ajuste de tabela t com a modalidade de Ha no teste t ttab em tabela bilateral e teste bilateral entrar com ttab em tabela bilateral e teste unilateral entrar com 2 ttab em tabela unilateral e teste bilateral entrar com 2 ttab em tabela unilateral e teste unilateral entrar com Tabela utilizada em nosso curso Pág 31 83 Coeficiente de correlação amostral de Pearson rXY Índice que mede o grau de associação entre X e Y Utilizado para variáveis contínuas Várias fórmulas podem ser usadas rXY sXYs2X s2Y12 rXY sXYsX sY rXY SPDXYn1SQDXn1 SQDYn112 rXY SPDXYSQDX SQDY12 Em que sXY covariância amostral entre X e Y s2X variância amostral de X sX desviopadrão amostral de X s2Y variância amostral de Y sY desviopadrão amostral de Y SPDXY soma dos produtos dos desvios em relação às médias de X e Y SQDX soma dos quadrados dos desvios em relação à média de X SQDY soma dos quadrados dos desvios em relação à média de Y e n número de pares de observações das variáveis X e Y O rXY utiliza a covariância amostral entre X e Y sXY em sua estrutura A sXY é uma medida estatística que mede o quanto duas variáveis variam juntas Esta associação pode ser positiva ou negativa e pode ser estimada por sXY SPDXYn1 Xi XYi Yn1 XiYi XYi XiY XYn1 sXY XiYi XiYin YiXin nXin Yinn1 sXY XiYi 2XiYin XiYinn1 sXY XiYi XiYinn1 Em que n número de pares de observações numerador SPDXY e numeradorn1 média da soma de produtos O sinal da covariância irá indicar a direção da associação entre X e Y Quanto maior o tamanho amostral n menor será o seu valor Se SQDX Xi2 Xi2n e SQDY Yi2 Yi2n então o desenvolvimento da fórmula rXY SPDXYSQDX SQDY 12 resulta em rXY XiYi Xi YinXi2 Xi2n Yi2 Yi2n12 O valor de rXY representa uma estimativa do coeficiente de correlação populacional ρXY 84 Análise de correlação 1º passo Enunciar as hipóteses H0 e Ha do teste t H0 ρXY 0 e Ha ρXY 0 O coeficiente de correlação populacional é nulo Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 35 Valor tabelado unilateral à esquerda da distribuição t no R ttabesqqt0016lowertailT ttabesq 1 3142668 4o passo tcal d n12sd 2507 712853 778 5o passo tcal ttab RH0 6o passo Pelo teste t ao nível de 1 de probabilidade o medicamento apresenta efeito significativo na redução da pressão Uso da library stats no R antesc1105131135155150145165 depoisc8011012012013512051305 ttestdepois antes mu0 alternativecless pairedTRUEconflevel099 Uso da library DescTools no R requireDescTools TTestAmxmeandepoisantes sxsddepoisantes nxlengthdepoisantes alternative cless conflevel 099 Uso do teste da diferença para uma amostra Obtenção do valor p no R pt77751 6 lowertailT 1 00001191321 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 36 Capítulo 7 Lista de exercícios sobre teste t para dados emparelhados 1 Para testar se um método de secagem rápida consegue retirar quantidade significativa de água de grãos de cereais uma porção de milho cevada trigo arroz e sorgo foi exposta ao método Dados os pesos g das porções amostradas o método de secagem é eficiente para secar os grãos 5 Milho Cevada Trigo Arroz Sorgo Sem a secagem 30 34 41 25 36 Com a secagem 21 28 33 21 31 2 Uma fábrica de cerâmica produz um tipo de peça usando o processo A de fabricação Para aumentar a resistência das peças quando submetidas a uma temperatura o processo B foi introduzido Com os dados amostrais de temperatura de rompimento das peças testar a hipótese H0 e concluir para 5 Processo A 903 934 968 914 926 1025 1034 Processo B 1014 985 1046 958 962 946 995 3 Um produto foi desenvolvido para reduzir a temperatura de funcionamento de qualquer tipo de motor Para testar o produto foram selecionados ao acaso oito motores diferentes e após 10 minutos de funcionamento em cada condição foram obtidos os dados C Teste a H0 e conclua 5 Motor 1 2 3 4 5 6 7 8 Sem produto 805 996 834 1002 815 846 850 1058 Com produto 758 988 776 999 742 805 836 1058 4 Um pesquisador deseja testar o efeito de certo fertilizante na produção de milho Das 12 UE disponíveis todas com áreas e condições de ambiente iguais sete receberam o fertilizante Para as produções kgUE obtidas teste a H0 e conclua se o fertilizante aumenta a produção 5 Com Fertilizante 25 35 45 30 20 25 30 Sem Fertilizante 35 25 20 15 30 5 Sejam os pesos g de ratos Wistar com 15 dias de idade segundo a condição normal e submetidos à extirpação do timo timectomização aos 4 dias de idade A cirurgia reduz o GP dos ratos 5 Condição Normal 403 400 396 352 320 Timectomizado 186 203 236 222 209 Uso da library stats no R cnc4034039635232 tc186203236222209 ttestt cn mu0 alternativecless pairedTRUE conflevel095 pt821494lowertailT Valor de probabilidade de significância pvalor 1 00005983872 qt0054lowertailT Valor de t tabelado 1 2131847 Respostas 1 s2d 43 s 207 ttab 5 4 278 e tcal 691 2 s2d 4362 s 660 ttab 5 6 194 e tcal 116 3 s2d 773 s 278 ttab 5 7 190 e tcal 310 4 s2d 24250 s 1557 ttab 5 4 213 e tcal 086 5 s2d 1968 s 444 ttab 5 4 213 e tcal 821 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 37 Capítulo 8 Análise de correlação linear 81 Introdução O coeficiente de correlação linear amostral rXY mede a intensidade de associação entre duas variáveis X e Y ou seja se a variação de uma variável acompanha diretamente ou inversamente a variação da outra Cada um dos pares de dados deve ser coletado de um mesmo animal planta ou outro elemento O rXY é um número adimensional que varia de 1 a 1 e que quantifica o grau de associação O rXY é usado para expressar o quanto os pontos se aproximam de uma reta imaginária 1 09 08 05 04 01 0 01 04 05 08 09 1 82 Estudo gráfico de duas variáveis 821 Ausência de associação Se X e Y não estão correlacionadas rXY 0 os valores de X variam independentemente de Y e viceversa Figura 71 Característica Os pontos estarão dispersos por todo o quadrante Figura 81 Diagrama de dispersão e a ausência de correlação entre X e Y Quanto mais próxima de zero for a estimativa de rXY mais fraco será o grau de associação entre X e Y 822 Associação máxima positiva Se X e Y apresentarem correlação alta e positiva rXY 10 os pontos estarão alinhados na direção ascendente Figura 72 Características Pontos concentrados sobre a reta Aos maiores valores de X correspondem os maiores valores de Y Grau de associação diretamente proporcional Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 38 Figura 82 Diagrama de dispersão e a correlação direta e perfeita entre X e Y Se 0 rXY 1 o grau de associação entre X e Y será diretamente proporcional Quanto mais próxima de 1 for a estimativa de rXY mais forte e direto será o grau de associação entre X e Y 823 Associação máxima negativa Se X e Y apresentarem correlação alta e negativa rXY 10 os pontos estarão alinhados na direção descendente Figura 73 Características Pontos concentrados sobre a reta Aos maiores valores de X correspondem os menores valores de Y Grau de associação inverso Figura 83 Diagrama de dispersão e a correlação inversa e perfeita entre X e Y Se 1 rXY 0 o grau de associação entre X e Y será inversamente proporcional Quanto mais próxima de 1 for a estimativa de rXY mais forte e inversa será o grau de associação entre X e Y Capítulo 9 Intervalo de confiança para a média populacional 91 Introdução Usado na estimação de parâmetros ramo da inferência estatística e relacionado com a distribuição t de Student Estimadores por intervalo são regras que definem o uso de valores amostrais para cálculo de dois números que formam os extremos de um intervalo dentro do qual esperase estar contido o real valor da média populacional 92 Propriedades desejáveis do IC da média populacional Esperase que o IC contenha o real valor da média elevada certeza Esperase que o IC tenha a menor amplitude possível entre os extremos 93 Estimador do IC para a média populacional com N e σ2 desconhecida Se X é uma VAC com N em uma população na qual a σ2 é desconhecida é possível realizar inferências sobre a média da população µ utilizando s no lugar de σ por meio da estatística t de Student com n 1 graus de liberdade dada por tn1 X µXsXn12 94 Curva de densidade de probabilidade da distribuição t Seja o gráfico da função de densidade de probabilidade fdp da distribuição t de Student com 30 graus de liberdade df 30 no intervalo de x entre 3 e 3 Figura 81 Figura 91 Função de distribuição de probabilidade da distribuição t de Student df 30 no intervalo de x entre 3 e 3 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 40 2o passo Fixar o nível de significância e identificar a estatística do teste Teste t e α de nível de significância 3o passo Determinar a região crítica e a região de aceitação de H0 ttab t n 2 o Perda de 2 GL pela estimativa das médias de X e Y 4o passo Obter o valor calculado de t com base em informações amostrais tcal rXY n 21 rXY212 5o passo Aplicar a regra decisória do teste a Teste bilateral se tcal ttab RH0 ou tcal ttab RH0 há correlação entre X e Y dada pelo valor de rXY b Teste bilateral se tcal ttab AH0 ou tcal ttab AH0 não existe correlação entre X e Y 6o passo Com o resultado da regra decisória observar a H0 e concluir pela aceitação ou rejeição da hipótese nula fazendo uma interpretação do problema Pelo teste t ao nível de de probabilidade existe ou não existe correlação entre X e Y Exemplo 81 Estime o coeficiente de correlação amostral para X e Y teste a H0 e conclua α 5 Tabela 81 Pares de observações entre as variáveis X e Y X 40 48 50 72 78 100 110 140 Y 25 22 20 28 30 32 35 29 XiYi 40 25 14 29 185220 Xi 40 14 6380 Xi2 402 142 59372 Xi2 6382 407044 Yi 25 29 22100 Yi2 252 292 628300 Yi2 221002 4884100 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 41 rXY XiYi XiYinXi2 Xi2n Yi2 Yi2n12 rXY 185220 6380 22100859372 4070448 628300 4884100812 rXY 185220 17624859372 50881 628300 61051312 rXY 89728491 1778712 897212289 073 Resolução 1o passo H0 ρXY 0 e Ha ρXY 0 2o passo Teste t 5 3o passo ttab t5 8 2 t5 6 245 4o passo tcal rXY n 21 rXY212 073 8 21 073212 073 60467112 073 358 261 5o passo tcal ttab RH0 6o passo Pelo teste t a 5 de probabilidade há correlação entre X e Y expressa pelo valor rXY 073 Análise de correlação e uso da library stats no R helpcortest Xc44857278101114 Yc2522202830323529 cortest XYalternativectwosidedmethodcpearsonconflevel095 corXY 1 07300688 Análise da nuvem de pontos e ajuste da reta de mínimos quadrados plotXY Plotando a nuvem de pontos m1lmYX Ajuste do modelo de regressão linear de 1º grau e armazenamento no objeto m1 ablinem1 Plotando o ajuste do modelo de 1º grau s1summarym1 Inferências e índices do modelo e armazenamento no objeto s1 strs1 Estrutura do objeto s1 lista com 11 componentes rsqs18 Seleção do coeficiente de determinação R2 do modelo e acúmulo no objeto rsq correlsqrtrsq1 A correlação é a raiz quadrada do coeficiente de determinação rXY R205 correl 1 07300688 Se n 9 pares e rXY 062 Verifique se a correlação é significativa 5 n9 r062 tcalrsqrtn 21 r2 pval2pttcaln2lowertailF lowertailF porque rXY é positivo pval 1 007489275 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 42 Capítulo 8 Lista de exercícios sobre análise de correlação linear 1 O coeficiente de correlação amostral rxy estimado a partir de 15 pares de observações das variáveis aleatórias contínuas X e Y que apresentam distribuição normal bivariada conjunta foi de 052 Aplique um teste adequado para verificar se há ou não correlação significativa entre as duas variáveis 5 2 Um modelo linear de 1º grau foi ajustado aos dados da variável dependente Y a partir dos níveis da variável regressora X por meio do método dos mínimos quadrados ordinários O modelo foi estimado a partir de 30 pares de observações sendo representado por Yi 051 131Xi e apresentou 88 de aderência aos dados de Y Verifique 1 se há uma associação significativa entre X e Y por meio de uma análise de correlação de Pearson 3 Um pesquisador avaliou algumas medidas biométricas de equinos da raça W Os dados de altura de cernelha AC altura de garupa AG comprimento de canela CC perímetro de canela PC e perímetro torácico PT dos animais encontramse na Tabela 72 Tabela 72 Pares de observações entre as variáveis AC AG CC PC e PT de equinos da raça W Equino AC AG CC PC PT 1 130 140 142 16 152 2 132 142 148 18 178 3 135 145 149 17 179 4 148 163 156 175 187 5 150 165 157 172 166 6 138 155 152 169 163 7 139 158 150 143 158 8 143 159 148 152 194 9 148 152 165 15 191 Escolha um par de variáveis e estime o coeficiente de correlação de Pearson rXY Em seguida aplique um teste adequado e faça a inferência para a correlação entre X e Y 5 5100 005 Respostas 1 tcal 219 ttab 5 13 216 2 tcal 1433 ttab 1 28 276 3 ACc130 132 135 148 150 138 139 143 148 AGc140 142 145 163 165 155 158 159 152 CCc142 148 149 156 157 152 150 148 165 PCc16 18 17 175 172 169 143 152 15 PTc152 178 179 187 166 163 158 194 191 matrizasdataframecbindACAGCCPCPT pairsmatriz librarygraphics cormatriz Estimativas dos rXY requiremetan corrcoefmatriz Estimativas dos rXY e valores de probabilidade Pvalues para os pares de variáveis ACxAG ACxCC ACxPC ACxPT AGxCC AGxPC AGxPT CCxPC CCxPT PCxPT rXY 08580 08277 01143 04747 05177 01271 02150 00745 04652 00424 tcal 44203 39023 03044 14269 16009 03391 05826 01978 13904 01121 Pbilat 00031 00059 07697 01967 01534 07446 05784 08488 02070 09138 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 43 PAGxPT 05784 005 AH0 PACxCC 00059 005 RH0 4º passo Obter o valor calculado de t com base em informações amostrais Para H0 D 0 e d din estimador de D tcal d Dsd ou tcal d 0sdn12 ou tcal d n12sd em que d média de todas as diferenças entre os pares na amostra das diferenças sd desvio padrão para as diferenças amostrais e n número de pares Vale notar que sd s2d12 ou sd s2dn12 ou sd sdn12 e que s2d SQDdnd 1 di2 di2ndnd 1 sd sdn 5º passo Aplicar a regra decisória do teste a Teste bilateral se tcal ttab RH0 ou tcal ttab RH0 b Teste unilateral à direita se tcal ttab RH0 c Teste unilateral à esquerda se tcal ttab RH0 6º passo Com o resultado da regra decisória observar a H0 e concluir pela aceitação ou rejeição da hipótese nula fazendo uma interpretação do problema Exemplo 71 Sejam os valores de pressão sistólica mmHg de sete indivíduos obtidos antes e após a aplicação de um medicamento para reduzir a pressão Tabela 61 Teste a H0 para α 1 e conclua Tabela 61 Valores individuais de pressão mensurados antes e após a aplicação de um medicamento Indivíduo 1 2 3 4 5 6 7 Antes 1105 1310 1350 1550 1500 1450 1650 Depois 800 1100 1200 1200 1350 1205 1305 Resolução Se depois X2i e antes X1i então di X2i X1i 305 210 150 350 150 245 e 345 d din 305 3457 17557 2507 di2 3052 3452 483675 s2ddi2 di2ndnd 1 483675 1755276 483675 4400046 436716 72785 sd 7278512 853 1º passo H0 D 0 Ha D 0 2º passo α 1 Teste t 3º passo ttab tαn 1 t16 314 Partindose da Figura 91 podese constatar que Ptα2 t tα2 1 α Ptα2 X μXsXn12 tα2 1 α Ptα2 sXn12 X μX tα2 sXn12 1 α PX tα2 sXn12 μX X tα2 sXn12 1 α 1 PX tα2 sXn12 μX X tα2 sXn12 1 α PX tα2 sXn12 μX X tα2 sXn12 1 α ou ICμ 1α X tα2 sXn12 em que 1 α índice de confiança do intervalo OBS1 se α 005 então tα2 204 e tα2 204 OBS2 O IC da média populacional expressa a dispersão da média amostral que é a estimativa pontual Exemplo 91 Construa os limites do IC para a média com 90 de probabilidade considerando que em quatro leituras de um comercial de 30 segundos um locutor levou em média 292 segundos com variância de 576 seg2 Resolução IC μ 1α X tα2 n1 sXn12 IC μ 090 292 t0102 3 57612412 IC μ 090 292 235 242 IC μ 090 292 282 ou IC μ 090 2638 μ 3202 Observações No exemplo acima há 90 de certeza que o IC contém o valor real de μ ou seja de 100 intervalos gerados 90 terão o valor de μ em seu interior As dimensões do IC serão ampliadas se ampliado o índice de confiança e reduzidas se ampliado o tamanho amostral O IC para a média populacional corresponde a um teste de hipóteses sobre μ sendo equivalente ao teste t para uma amostra sobre μ com hipótese alternativa bilateral 51 Script no R se as observações amostrais não são dadas alfa010 m292 v576 n4 ttabnegqtalfa2 n1 lowertail T ttabposqt1alfa2 n1 lowertail T lcimttabpossqrtvsqrtn lci limite de confiança inferior lcsmttabpossqrtvsqrtn lcs limite de confiança superior lci 1 2637596 lcs 1 3202404 Conclusão Pelo teste t bilateral com 90 de índice de confiança o valor real da média μ encontrase entre 2638 e 3202 Script no R se as observações amostrais são dadas Xc44857278101114 Yc2522202830323529 requirefBasics basicStatsX ci 095 basicStatsY ci 095 95 Cálculo do tamanho da amostra n A estimativa do número de elementos animais plantas necessários para um estudo por amostragem está relacionado ao IC da média dado por ICμ 1α X tα2 sXn12 Se tα2 sXn12 Δ então ICμ 1α X Δ A confiabilidade de X depende de sX e de n pois t a 5 depende de n e varia de 257 a 196 se n for 5 e infinito respectivamente Variáveis com maiores desvios têm menor confiabilidade em sua média a menos que se eleve n Variáveis com baixo valor de s não necessitam de um alto valor de n O pesquisador deve definir a amplitude do intervalo Δ em torno de X de modo a não comprometer a credibilidade da média em estudospiloto Em estudospiloto o pesquisador deve verificar se sua amostra representa ou não a população de origem Se o número de elementos n que ele trabalhou para estimar X e sX for maior ou igual à estimativa de n a amostra será representativa Caso contrário ele deve adicionar mais elementos à amostra até que se torne representativa 52 Exemplo 92 a Seja uma VAC X que apresentou X 40 sX 8 com n 16 1º Passo Definir a amplitude do intervalo Δ a critério do pesquisador Optandose pelo intervalo de 10 em torno de X ou seja Δ 10 X 01 40 40 2º Passo Cálculo do tamanho amostral n Se Δ t5 bilateraln1 sXn12 Então 4 t515sXn12 4 21380n12 n12 17044 n12 426 n 1815 18 animais São necessários 18 animais para que a amostra seja representativa da população considerando um Δ 10 X O pesquisador deve coletar mais duas observações e recalcular o n b Optandose pelo intervalo 40 6 15 da média 1º Passo Δ 015 X 015 40 60 2º Passo Se Δ t5 bilateraln1 sXn12 Então 6 t515 sXn12 6 213 80n12 n12 17046 n12 284 n 807 8 animais O pesquisador trabalhou com 16 animais e são necessários 8 animais para que a amostra seja representativa da população considerando um desvio de 15 em torno da média amostral c Seja uma VAC X que apresentou CV 45 X 100 s 45 e n 61 1º Passo Optandose por um desvio de 10 da média amostral Δ 01 X 01 100 100 2º Passo 10 t560 sn12 10 20 450n12 n12 9010 n12 9 n 81 animais O pesquisador trabalhou com 61 animais e são necessários 81 animais para que a amostra seja representativa da população considerando um desvio de 10 em torno da média amostral O pesquisador deve coletar mais 20 observações e recalcular o tamanho amostral n d Seja uma VAC X que apresentou CV 45 X 100 s 45 e n 61 1º Passo Optandose por um desvio de 15 da média amostral Δ 015 X 015 100 150 2º Passo 15 t sn12 15 20 450n12 n12 9015 n12 6 n 36 animais O pesquisador trabalhou com 61 animais e são necessários 36 animais para que a amostra seja representativa da população para Δ 015 X Não é necessário coletar mais observações 96 Intervalo de confiança para a diferença entre médias de duas populações normais com variâncias desconhecidas Se o IC de uma média é igual a ICμ 1α X tα2 sX n¹2 então o IC da diferença entre duas médias será ICμ1 μ2 1α X₁ X₂ tα2 sX₁ sX₂ No entanto se a variância da diferença entre médias é dada por s²X₁ X₂ s²X₁ s²X₂ s1²n1 s2²n2 então o desviopadrão da diferença entre médias será sX₁ X₂ s1²n1 s2²n2¹² Logo o intervalo de confiança da diferença entre médias será o ICμ1 μ2 1α X₁ X₂ tα2 s1²n1 s2²n2¹² ou o ICμ1μ2 1α X₁ X₂ tα2s1²n1 s2²n2¹² μ1μ2 X₁ X₂ tα2s1²n1 s2²n2¹² em que X₁ X₂ é o estimador pontual de μ1 μ2 O IC da diferença entre duas médias expressa a significância estatística do teste t referente à comparação de duas médias independentes Se o valor zero estiver contido no intervalo da diferença gerado as médias são equivalentes não existe diferença entre as médias O valor 1 α equivale ao índice de confiança do intervalo Exemplo 93 Verifique se as médias dos tratamentos A e B são significativas para as estatísticas descritivas amostrais dadas por XA 132 XB 160 s²A 25 s²B 30 nA 20 nB 25 e α 005 Resolução 1º passo H0 σ²A σ²B e Ha σ²B σ²A 2º passo α 5 Teste F 3º passo Ftab F5 24 19 211 4º passo Fcal s²Bs²A 3025 12 5º passo Fcal Ftab Aceitase a H0 6º passo Pelo teste F ao nível de 5 de probabilidade as variâncias são homocedásticas s²p nA 1s²A nB 1s²BnA nB 2 20 1 25 25 1 3020 25 2 278 ICμA μB 1α XA XB tα2 43 s²pnA s²pnB¹² ICμA μB 1α 132 160 202 27820 27825¹² ICμA μB 1α 28 101 ou ICμA μB 1α 381 μA μB 179 Conclusão Pelo intervalo de confiança da diferença entre médias com 95 de índice de confiança o valor zero não está incluído no IC ou seja as médias de A e B diferem entre si a média de B é maior que a de A OBS¹ O valor 101 é chamado de diferença mínima significativa dms Se o 1º valor diferença entre médias for maior ou igual à dms as médias são diferentes Caso contrário as médias são equivalentes Verificação da OBS¹ Se a regra decisória e o valor calculado do teste t são dados por tcal ttab RH0 e tcal XA XBs²pnA s²pnB¹² Então XA XBs²pnA s²pnB¹² ttab RH0 XA XB ttab s²pnA s²pnB¹² RH0 1º valor amarelo dms azul Capítulo 9 Lista de exercícios sobre intervalo de confiança da média populacional 1 Considere os dados de uma amostra de produtividade de milho em kgha Tabela 81 Tabela 81 Valores mensurados de produtividade de milho Observação 1 2 3 4 5 6 7 8 Produtividade 800 900 750 1050 1200 900 950 1000 a Estabeleça o IC a 95 de probabilidade para a produtividade média e interpreteo 2 Um pesquisador utilizou 38 indivíduos e mediu a altura X₁ e o teor de gordura X₂ Os resultados obtidos foram X₁ 239089 sX₁ 35150 X₂ 20976 e sX₂ 03341 Dimensione a amostra para as duas variáveis e diga se ela é representativa ou não Admita Δ₁ 5X₁ Δ₂ 5X₂ e α 005 3 Considere os valores da VAC peso g de frangos de corte aos 42 dias de idade Tabela 82 Tabela 82 Valores mensurados de peso de frangos de corte aos 42 dias de idade Observações 1 2 3 4 5 6 7 Peso 42 dias 3200 3300 3250 3120 3220 3360 3100 a Construa o IC da média populacional com 1 α 095 b Qual o tamanho ideal da amostra quantidade de frangos considerando um intervalo Δ de 10 5 e 1 em torno da média amostral Considere α 5 4 Considere uma VAC X com X 120 e sX 40 Além disso utilize ttab 200 α 5 e responda a Calcule o tamanho ideal da amostra com intervalos de 5 10 e 15 em torno da média b Interprete os resultados considerando a viabilidade econômica e técnica de realização desse experimento com bovinos 5 Sejam os valores de uma VAC X com distribuição normal de acordo com o grupo experimental Tabela 83 SAMPAIO 2007 Tabela 83 Valores de X de acordo com o grupo experimental Grupo X A 72 75 70 71 68 B 72 67 72 70 66 C 67 64 67 63 69 a Construa os IC da média populacional de cada grupo para índices de confiança de 95 e 99 b Sem a utilização da análise de variância verifique se as médias são equivalentes ou não baseadas na construção de intervalos de confiança das diferenças entre as médias α 5 e no teste t para amostras independentes Respostas 1 IC μ 095 94375 11892 kgha ou IC μ 095 82483 μ 106267 hgha Interpretação De um total de 100 IC estimados o valor real de μ estará contido no interior de 95 IC 2 nALT 593972 3528 35 indivíduos Como 38 nPiloto 35 nEstimativa a amostra é representativa para a altura nGOR 643362 4139 41 indivíduos Como 38 nPiloto 41 nEstimativa a amostra não é representativa para a gordura Três elementos devem ser adicionados à amostrapiloto com novas estimativas de Z sx e ttab para que a amostra se torne representativa 3a IC μ 095 322143 8594 g ou IC μ 095 313549 μ 330737 g 3b Se Δ 10 X n 050 frango 7 050 amostra representativa Se Δ 5 X n 199 frangos 7 199 amostra representativa Se Δ 1 X n 4984 50 frangos 7 50 amostra não representativa Coletar mais 42 obs 4a Se Δ 5 X n 178 animais 60 178 amostra não representativa Coletar mais 118 obs Se Δ 10 X n 44 animais 60 44 amostra representativa Se Δ 15 X n 1975 20 animais 60 20 amostra representativa 4b Se Δ 5 X a estimativa do nº de animais é 178 não representativa e inviável economicamente para grandes animais bovinos equinos no entanto possível para pequenos animais aves Se Δ 10 X o número estimado de 44 animais é representativo e mostrase mais adequado econômica e tecnicamente para a realização de estudos por amostragem do que o resultado anterior Entretanto para grandes animais a quantidade ainda pode ser considerada excessiva Entendese por adequação técnica a obtenção de animais homogêneos para sexo idade entre outros Se Δ 15 X a quantidade de 20 animais é representativa e viável para se trabalhar com grandes animais entretanto a confiabilidade precisão da média reduz causando aumento do seu IC A decisão fica por conta do pesquisador de acordo com as condições estruturais de trabalho 57 5a IC μA 095 7120 322 ou IC μA 095 6798 μ 7442 IC μB 095 6940 347 ou IC μB 095 6593 μ 7287 IC μC 095 6600 305 ou IC μC 095 6295 μ 6905 IC μA 099 7120 533 ou IC μA 099 6587 μ 7653 IC μB 099 6940 574 ou IC μB 099 6366 μ 7514 IC μC 099 6600 504 ou IC μC 099 6096 μ 7104 5b Considerando que as variâncias são homocedásticas uma premissa para o uso de testes paramétricos então devese calcular a variância ponderada s2p o s2p nA 1s2A nB 1s2B nC 1s2CnA nB nC 3 s2p 5 1 67 5 1 78 5 1 605 5 5 3 s2p 268 312 24012 82012 683 IC da diferença entre as médias de A e B ICμA μB 1α XA XB tα2 12 s2pnA s2pnB12 ICμA μB 1α 7120 6940 218 6835 683512 ICμA μB 1α 180 360 ou ICμA μB 1α 180 μA μB 540 Pelo IC da diferença entre médias ao nível de 95 de confiança o valor zero está contido no intervalo ou seja as médias de A e B são equivalentes OBS O nº de GL para a estatística t tabelada considerando um teste com Ha bilateral tα2 foi igual a 12 valor igual ao GLRes de uma análise de variância em DIC e que é o nº de GL usado para estimar a s2p Teste t para comparar a média de A contra a média de C considerando variâncias homocedásticas 1º passo H0 μA μC e Ha μA μC 2º passo α 5 Teste t 3º passo ttab t5 12 218 4º passo tcal XA XCs2pnA s2pnC12 7120 66006835 683512 315 5º passo tcal ttab RH0 6º passo Pelo teste t ao nível de 5 de probabilidade existe diferença significativa entre as duas médias ou seja a média de A é maior do que a média de C 58 IC da diferença entre as médias de B e C ICμB μC 1α XB XC tα2 12 s2pnB s2pnC12 ICμA μB 1α 6940 6600 218 6835 683512 ICμA μB 1α 340 360 ou ICμA μB 1α 020 μA μB 700 Pelo IC da diferença entre médias ao nível de 95 de confiança o valor zero está contido no intervalo ou seja as médias de B e C são equivalentes OBS O IC da diferença entre duas médias corresponde a um teste t para duas amostras independentes com Ha bilateral Resultados e conclusão mA 7120 a mB 6940 ab mC 6600 b Pelo IC da diferença entre médias ao nível de 5 de probabilidade médias seguidas por uma mesma letra não diferem entre si Os grupos A e B apresentam maiores médias Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 54 Capítulo 10 Teste de aderência de quiquadrado 2 101 Testes de aderência para uma amostra o Úteis para verificar se determinada amostra é proveniente de uma população específica ou seja se os dados amostrais são ajustados por uma distribuição de probabilidade o Usualmente conhecidos como testes de bondade de ajuste Neste caso retirase uma amostra aleatória e comparase a distribuição amostral observada com a distribuição teórica de interesse 102 Teste de quiquadrado 2 o Teste amplamente utilizado em estudos de genética básica o Para variáveis qualitativas nominais é a única técnica adequada de verificação da bondade do ajuste o Para variáveis qualitativas ordinais o teste de 2 não é sensível ao efeito da ordem e deixa de ser a melhor opção quando a hipótese levar em conta a ordenação o Os dados são categorizados e organizados como frequências notadamente sob a forma de tabela de dupla entrada tabela de contingência com uma linha e s colunas 1 x s Tabela 101 Frequências observadas Os e esperadas Es apresentadas em tabela de contingência 1 x s Classe k1 k2 ks Total Frequência O1 E1 O2 E2 Os Es n o Há o interesse de se observar frequências em pelo menos duas categorias classes o O teste de aderência de 2 é útil para se verificar se a frequência observada na amostra difere ou não da frequência esperada especificada por uma distribuição de probabilidade pressupõese que a H0 é verdadeira ao nível de significância 1021 O método o A hipótese nula é formulada como o conjunto de frequências simples ou frequências relativas proporções esperadas definidas pela distribuição de probabilidade em estudo o Podese testar se a as frequências amostrais observadas diferem ou não das frequências esperadas ou seja se os dados amostrais vêm de uma dada distribuição de probabilidade ou ainda se os desvios são significativos ou não Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 55 1 Passo Enunciar as hipóteses H0 As proporções populacionais Pk de cada classe k são iguais a um valor P0 ou seja P1 P0 da classe 1 P2 P0 da classe 2 Pk P0 da classe k Ha Não H0 ou seja Ha Pk P0k para pelo menos um k Obs1 Os diferentes valores de proporção de cada classe k P0k são os valores especificados pela hipótese nula ou seja são as probabilidades conhecidas que determinam P0 Obs2 No teste de quiquadrado normalmente a Ha será unilateral à direita mas pode ser bilateral 2 Passo Fixar o erro 3 Passo Definir o número de graus de liberdade v e com o auxílio da tabela da distribuição de qui quadrado a região de aceitação de H0 RAH0 e a região de rejeição de H0 RRH0 ou seja determinar o valor da estatística tabelada de quiquadrado 2tab Ver Tabela A na pág 13 Fórmulas para cálculo do número de graus de liberdade o v k 1 se as frequências esperadas puderem ser calculadas sem precisar estimar os parâmetros distribucionais o v k m 1 se as frequências esperadas só puderem ser calculadas após a estimação dos m parâmetros populacionais o k número de classes amostrais da variável aleatória X Curva de densidade de probabilidade de 2 000 005 010 015 Gráfico da Distribuição quiquadrado para gl 5 functionx dchisqx 5 RAH0 1alfa 095 RRH0alfa 1107 x 4 Passo Determinar o valor da estatística calculada de quiquadrado χ²cal que se baseia na diferença entre frequência observada e frequência esperada χ²cal i1 k foi fei² fei fo1 fe1² fe1 fo2 fe2² fe2 fok fek² fek o foi frequência observada ou amostral na iésima classe o fei frequência esperada na iésima classe sob a pressuposição de H0 verdadeira o k número de classes 5 Passo Aplicar a regra decisória o Se χ²cal χ²tab Rejeitase a H0 o Se χ²cal χ²tab Aceitase a H0 6 Passo Concluir o teste com base na hipótese de nulidade ao nível α de probabilidade 1022 Exigências do Teste o Se o número de categorias é igual a 2 k 2 as frequências esperadas devem ser superiores a 5 o Se k 2 não deve haver mais de 20 das frequências esperadas abaixo de 5 e nenhuma frequência esperada igual a zero o Para evitar frequências esperadas pequenas devese combinar as categorias juntar até que as exigências sejam atendidas o Caso as categorias sejam combinadas em apenas duas e mesmo assim as exigências não tenham sido atendidas devese utilizar o Teste Binomial o As observações devem ser independentes Exemplo 101 Um modelo genético especifica que animais de certa população estão classificados em quatro categorias com probabilidades P1 0656 P2 0093 P3 0093 e P4 0158 Dentre 197 animais obtivemos as seguintes frequências observadas O1 125 O2 18 O3 20 e O4 34 Aplique um teste adequado com α 001 para verificar se os dados estão de acordo com o modelo genético postulado Fonte Bussab e Morettin 2006 Resolução Teste bilateral 1 Passo H0 P1 0656 P2 0093 P3 0093 e P4 0158 ou os desvios não são significativos Ha Não H0 ou seja Ha Pk P0k para pelo menos uma categoria ou os desvios são significativos 2 Passo α 001 3 Passo v k 1 4 1 3 χ²tab à direita χ²n1 1α2 χ²3 0995 1284 qchisq09953lowertailT 1 1283816 χ²tab à esquerda χ²n1 α χ²36 0005 007 qchisq0005 3 lowertail TRUE 1 007172177 4 Passo Tabela 1 Frequências observadas fo e esperadas fe Classe k1 k2 k3 k4 Total fofe 125 12923 18 1832 20 1832 34 3113 197 fe1 0656 x 197 12923 fe2 0093 x 197 1832 fe3 0093 x 197 1832 fe4 0158 x 197 3113 χ²cal fo1 fe1² fe1 fo2 fe2² fe2 fo3 fe3² fe3 fo4 fe4² fe4 125 12923² 12923 18 1832² 1832 20 1832² 1832 34 3113² 3113 01385 00056 01541 02646 05628 5 Passo 5 Passo χ²tab à esquerda χ²cal χ²tab à direita AH0 6 Passo Pelo teste quiquadrado ao nível de 1 de probabilidade os dados seguem o modelo genético postulado ou seja as proporções populacionais são aquelas informadas na H0 ou ainda os desvios entre frequências observadas e esperadas não são significativos Script no R helpchisqtest library stats oc125182034 ec12923183218323113 chisqtestope rescalep TRUE uso da função rescalep porque o vetor e não está em ou oc125182034 ec06561009310093101581 chisqtestope Verificação do valorp pchisq0562713lowertailF 1 09049134 O valorp é obtido considerando um teste unilateral à direita Obs1 Devese agrupar algumas categorias de respostas pois mais de 20 das frequências observadas apresentaram valores inferiores a 5 Tabela Junção das categorias com frequências observadas menores que o valor 5 Frequência 0 e 1 2 3 4 5 Total f0 6 8 11 7 8 400 fe 68 83 89 71 88 399 Fonte Siegel e Castellan Júnior 2006 Resolução 1 Passo H0 As falhas se ajustam à distribuição de Poisson com λ 32 ou H0 fe01 68 fe2 83 fe3 89 fe4 71 e fe5 88 Ha As falhas não se ajustam à distribuição de Poisson com λ 32 ou Ha Não H0 ou seja Ha fek fok para pelo menos uma categoria 2 Passo α 005 3 Passo v k 1 5 1 4 Então χ2tab χ20054 949 qchisq0954lowertailT 1 9487729 4 Passo χ²cal 6 68²68 8 83²83 11 89²89 7 71²71 8 88²88 00941 00108 04955 000141 00727 06745 5 Passo χ2cal χ2tab Aceitase a H0 6 Passo Pelo teste de quiquadrado ao nível de 5 de probabilidade a distribuição das falhas mecânicas se ajusta à distribuição de Poisson com média de 32 falhas por hora Script no R oc681178 ec6839983399893997139988399 chisqtestope Verificação do valorp pchisq0672674lowertailF 1 0954656 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 62 Exemplo 104 Seja X uma VAC e x1 x2 x20 os valores de X obtidos em uma amostra que caracteriza a população P Verifique se os dados amostrais n 20 são oriundos de uma distribuição Normal com µ 30 e 2 100 Os dados foram Xc159169171183190195218230238245261269323350361365372385409442 Representação gráfica da distribuição normal Gauss A gx possui um ponto de máximo para x µ A média µX a moda e a mediana são coincidentes Q1 ou Quartil 1 25 dos dados são inferiores e 75 são superiores Q3 ou Quartil 3 25 dos dados são superiores e 75 são superiores Princípio básico Dividir a variação dos dados em intervalos baseado nas medidas de posicionamento Q1 Q2 e Q3 e construir a distribuição de frequências correspondente sob a pressuposição de H0 verdadeira P Nµ2 Resolução Se Z X µ então X Z µ em que µ 30 2 100 e 10 x1 Q1 06745 x 10 30 23255 qnorm02501lowertailT 1 06744898 x2 Q2 0 x 10 30 3000 qnorm05001lowertailT 1 0 x3 Q3 06745 x 10 30 36745 qnorm07501lowertailT 1 06744898 Tabela Dados observados e esperados de X sob suposição de normalidade Classe fo fe 23255 8 5 232553000 4 5 300036745 4 5 36745 4 5 Total 20 20 Q1 Q2Md Q3 25 25 25 25 gx Obs Cada intervalo deve conter 14 das observações ou PX 23255 P 23255 X 3000 3000 X 36745 X 36745 025 1º Passo H0 P N 30100 e Ha Não H0 2º Passo Teste de χ² α 005 3º Passo χ² tab χ²5 3 7815 qchisq0953lowertailT 1 7814728 4º Passo χ² cal Σ foifei² fei 85² 5 45² 5 45² 5 45² 5 18 02 02 02 24 5º Passo Regra decisória χ² cal χ² tab AH0 6º Passo Pelo teste de χ² a 5 de probabilidade a amostra coletada pertence a uma população com distribuição normal com µ 30 e σ² 100 Script no R oc8444 ec520520520520 chisqtestope Verificação do valorp pchisq243lowertailF 1 04936346 Exercício 1 Verifique se os dados amostrais ordenados a seguir procedem de uma N 10 25 Xc104 173 393 444 637 651 761 764 818 848 857 865 971 987 995 1001 1052 1069 1172 1217 1261 1298 1303 1316 1411 1460 1464 1475 1668 2214 q1 qnorm02501lowertailT q2 qnorm05001lowertailT q3 qnorm07501lowertailT pc1 q1510 pc2 q2510 pc3 q3510 oc6996 ec7530753075307530 chisqtestope Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 64 Capítulo 11 Teste de independência de quiquadrado 2 111 Introdução É um teste nãoparamétrico utilizado comumente em estudos de patologia e reprodução animal Se os dados são categorizados e organizados em frequências sob a forma de tabela de dupla entrada com i linhas e j colunas i x j podese verificar a presença ou a ausência de associação dependência entre um fator linhas e a variável resposta colunas por meio do teste de 2 As classes do fator alocado nas linhas da tabela pode representar grupos experimentais definidos pelo pesquisador As classes da variável resposta alocadas nas colunas da tabela podem ser representadas por respostas experimentais distintas de variáveis aleatórias qualitativas nominais e ordinais 112 Protocolo para aplicação do teste de independência de 2 1o Passo Enunciar as hipóteses H0 e Ha do teste de 2 para verificar se há ou não uma associação entre grupo e resposta H0 Grupo e variável resposta são independentes ou os desvios não são significativos Ha Grupo e variável resposta não são independentes ou os desvios são significativos 2o Passo Fixar o nível de significância e identificar a estatística do teste 3o Passo Determinar a região crítica e a região de aceitação de H0 Definir o erro e o número de graus de liberdade GL o GL I 1J 1 o I número linhas da tabela de contingência ou nº de grupos experimentais o J número de colunas da tabela de contingência ou nº de classes de respostas experimentais Figura 111 Curva de densidade de probabilidade da VAC de x2 para GL 5 000 005 010 015 Gráfico da Distribuição quiquadrado para gl 5 functionx dchisqx 5 RAH0 1alfa 095 RRH0alfa 1107 x Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 65 4 passo Obter o valor calculado de 2 com base em informações amostrais Se baseia na diferença entre frequência observada e frequência esperada sob a pressuposição de H0 verdadeira 2cal foij feij2feij com i variando de 1 a I e j variando de 1 a J ou seja 2cal fo11 fe112fe11 fo12 fe122fe12 foij feij2feij o foij frequência observada na iésima linha e na jésima coluna o feij frequência esperada na linha i e na coluna j sob a pressuposição de H0 verdadeira Cálculo das frequências esperadas Tem base na pressuposição de H0 ser verdadeira Realizado de acordo com os totais marginais das observações de grupos e classes de respostas feij total da iésima linha total da jésima coluna total geral 5 passo Aplicar a regra decisória do teste Teste unilateral à direita se x2cal x2tab RH0 6 passo Com o resultado da regra decisória observar a H0 e concluir interpretando o problema Exemplo 111 Verifique a existência de associação entre grupo genético de fêmeas bovinas e fertilidade em condições tropicais com 5 a partir dos dados de frequência Tabela 111 Tabela 111 Frequências observadas para diagnóstico de gestação de acordo com o grupo genético Grupo genético Diagnóstico de gestação Total A 60 60 120 B 60 40 100 C 20 90 110 Total 140 190 330 Resolução 1 Passo H0 As variáveis grupo genético e fertilidade são independentes e Ha As variáveis grupo genético e fertilidade não são independentes 2 Passo Teste de 2 5 3 Passo GL I 1 J 1 3 1 2 1 2 Então 2tab 2 5 2 599 4 Passo feA Total do grupo A Total da classe Total geral 120 140 330 509 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 66 Tabela 112 Frequências observadas e esperadas entre parênteses para diagnóstico de gestação de acordo com o grupo genético Grupo genético Diagnóstico de gestação Total A 60 509 60 691 120 B 60 424 40 576 100 C 20 467 90 633 110 Total 140 190 330 2cal fo11 fe112fe11 fo12 fe122fe12 fo32 fe322fe32 60 5092509 60 6912691 90 6332633 16269 11984 112621 4204 5 Passo x2cal x2tab RH0 6 Passo Pelo teste de quiquadrado ao nível de 5 de probabilidade a fertilidade das fêmeas bovinas é dependente do grupo genético 113 Limitações do teste de 2 Frequências esperadas 5 tendem a superestimar o valor calculado de 2 elevando a chance de rejeição de H0 sendo esta verdadeira erro do tipo I Frequências observadas muito baixas não permitem um estudo adequado da dispersão o Recomendase o número mínimo de 15 observações para cada classe j em cada grupo i o Para o exemplo dado o nº mínimo de observações por casela é de 15 3 2 90 Não se devem analisar frequências observadas nulas o Causa Número de observações baixo ou número de classes de respostas alto o Solução Estabelecer no planejamento experimental um número adequado mínimo de observações Agrupar classes de respostas experimentais Tabela 113 Valores críticos de 2 segundo os graus de liberdade e a probabilidade de erro do tipo I Graus de liberdade Erro do tipo I 010 005 002 001 1 271 384 541 664 2 460 599 782 921 3 625 782 984 1134 4 778 949 1167 1328 5 924 1107 1339 1509 6 1064 1259 1503 1681 7 1202 1407 1662 1848 8 1336 1551 1817 2009 9 1468 1692 1968 2167 10 1599 1831 2116 2321 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 67 Capítulo 11 Lista de exercícios sobre teste de independência de quiquadrado 1 Os resultados de dois métodos cirúrgicos aplicados a lesões ósseas da coluna vertebral foram avaliados em coelhos Tabela 94 Ao nível de 5 de significância o comportamento ósseo pós operatório é dependente do método empregado Tabela 94 Respostas de soldadura vertebral de acordo com o método cirúrgico Método Soldadura vertebral Ausente Parcial Completa A 78 15 8 B 81 25 14 2 Desejase saber se há diferença quanto à preferência dos consumidores em relação ao tipo de carne consumido em três regiões da cidade de Marechal Cândido Rondon 5 Tabela 95 Frequências observadas da preferência de consumo de carne de acordo com a região Região Carne Bovina Suína Aves Porto Mendes 20 32 69 Centro 51 66 63 Iguiporã 50 34 23 3 Sejam os resultados de um experimento no qual se objetivou avaliar o desempenho reprodutivo de fêmeas bovinas manejadas em pastagens em região de cerrado durante estação de monta conduzida entre dezembro de 2003 e março de 2004 Tabela 96 A fertilidade está associada ao grupo genético da fêmea 1 Tabela 96 Frequências observadas do diagnóstico de gestação de acordo com o grupo genético Grupo genético Diagnóstico de Gestação Europeu 61 89 Europeu x Zebuíno 196 41 Zebuíno 129 59 4 Sejam os resultados de aceitabilidade pelo público de um teste de avaliação de três diferentes proporções de soro de leite em uma nova bebida láctea Tabela 97 Tabela 97 Frequências observadas de aceitabilidade sabor de acordo com a proporção de soro Proporção Classe Muito Ruim Ruim Regular Bom Ótimo A 1 9 20 9 1 B 0 5 18 20 2 C 1 30 10 9 0 a Você observa algum inconveniente na realização de teste de hipótese neste caso Existe alguma sugestão ou alteração que possa ser realizada Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 68 b De acordo com a resposta no item a faça o teste de hipótese apropriado a esta situação 5 c No contexto dos dados e auxiliado pela conclusão obtida no item b qual seria a sua recomendação quanto à proporção de soro de leite a ser utilizada 5 Sejam os dados de um experimento que objetivou avaliar a influência do diluidor do sêmen no desenvolvimento in vitro de ovócitos bovinos após maturação e fecundação in vitro Tabela 98 O desenvolvimento in vitro é dependente do diluidor 5 Tabela 98 Frequências observadas de desenvolvimento in vitro de acordo com o diluidor do sêmen Diluidor Desenvolvimento in vitro Lactose gema de ovo 231 33 Citrato gema de ovo 271 40 Tris gema de ovo 99 22 Respostas 1 2tab 599 e 2cal 257 2 2tab 949 e 2cal 3964 3 2tab 921 e 2cal 7385 4 2tab 949 e 2cal 3335 5 2tab 599 e 2cal 288 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 69 Capítulo 12 Conceitos e princípios básicos da experimentação 121 Conceitos em estatística experimental a Experimento ou ensaio trabalho previamente planejado que segue princípios básicos e no qual se faz a comparação dos efeitos dos tratamentos b Tratamento método elemento ou material cujo efeito desejase medir ou comparar em um ensaio Exemplo variedades de milho níveis de proteína na ração linhagens temperaturas de estocagem entre outros NCII12 em que NC número de contrastes comparações entre duas médias c Unidade experimental UE ou parcela é a unidade que vai receber o tratamento e fornecer os dados que devem refletir o seu efeito Ela pode ser Um animal bovino em ensaios de animais de grande porte Um leitão ou poedeira ou um grupo de leitões ou de frangos de corte em experimentos de alimentação de animais de médio a pequeno porte Uma única linha de 10 m de comprimento ou 2 a 4 linhas de mesmo tamanho em ensaios de competição de forrageiras Um vaso em ensaios feitos em casa de vegetação Uma placa de Petri com um meio de cultura em laboratório d Delineamento experimental é o plano usado na experimentação e constitui a forma como os tratamentos são designados às parcelas Visa a garantir que a estimativa da variação individual não teve influência de outros fatores durante a condução do experimento Ex Delineamento inteiramente casualizado DIC delineamento em blocos casualizados DBC delineamento em quadrado latino DQL 122 Princípios básicos da experimentação 1221 Repetição de unidades experimentais É a aplicação do mesmo tratamento a várias parcelas num mesmo ensaio Finalidade Permite a obtenção de uma estimativa do erro experimental QMRes o Erro ou resíduo variação dos valores medidos nas UE dentro de cada tratamento A definição do número de repetições de um ensaio depende o Do tipo de resposta média e desvio padrão da variável o Recomendação prática os experimentos devem apresentar pelo menos 20 parcelas e 10 graus de liberdade GL para o resíduo na análise de variância ANOVA Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 70 o Quanto maior o número de repetições maior a precisão do experimento o Além de determinado número de repetições o incremento na precisão não é significativo 1222 Casualização dos tratamentos às unidades experimentais Consiste em dar a todos os tratamentos a mesma chance por sorteio de serem designados a qualquer parcela evitando que algum tratamento seja favorecido ou desfavorecido por fatores externos Finalidades Permite a validação da estimativa dos erros experimentais tornandoos independentes Cov εijεij 0 uma das pressuposições para uso de testes de significância teste F na ANOVA 1223 Princípio do Controle Local Consiste na divisão de um ambiente heterogêneo em subambientes homogêneos blocos ou seja todos os tratamentos devem ser casualizados às parcelas de cada bloco restrição Finalidade Redução do erro experimental pelo controle da fonte de variação sistemática Vantagem Redução na soma de quadrados do resíduo na ANOVA em comparação ao DIC Desvantagem Redução no número de GL do resíduo na ANOVA em comparação ao DIC Deve haver variação de um bloco para os outros variação entre blocos 123 Fontes de variação FV de um experimento 1231 Premeditada Introduzida pelo pesquisador para fazer comparações Exemplos tratamentos rações adubos embalagens medicamentos tempo de estocagem entre outros 1232 Sistemática Variações não intencionais mas de natureza conhecida Variação inerente ao material experimental Podem ser controladas pelo pesquisador Exemplos idade heterogeneidade do solo tamanho de semente entre outras 1233 Aleatória Variações de origem desconhecida não podendo ser controladas Constituem o erro experimental Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 71 Capítulo 13 Delineamento inteiramente casualizado DIC 131 Introdução A distribuição dos tratamentos às parcelas é feita ao acaso ou seja não é feita nenhuma restrição na casualização Ocorre a utilização de dois princípios básicos da experimentação repetição e casualização Indicado quando as condições experimentais ambiente e material experimental são homogêneas 132 Vantagens Podese utilizar qualquer quantidade de tratamentos e repetições O número de repetições pode variar de um tratamento para outro porém no planejamento experimental devese usar o mesmo número de repetições No DIC há maior número de GL associado ao resíduo do que em outros delineamentos 133 Desvantagens Exige homogeneidade total das condições experimentais A estimativa de variância residual pode ser alta pois não se usa o controle local 134 Modelo estatístico Seu uso visa a identificar os fatores que estão influenciando a variável em estudo Yij m ti εij o Yij valor referente ao iésimo tratamento na jésima repetição o m média de todas as unidades experimentais média geral o ti efeito de tratamento ti ȳi ȳ o εij erro associado a cada observação εij Yij ȳi o O erro experimental deve ser minimizado não há controle pois é um efeito aleatório o Variações observadas entre as repetições do mesmo tratamento 135 Quadro de tabulação dos dados Seja um experimento planejado no DIC com I tratamentos e J repetições Tabela 131 Tabela 131 Dados da variável Y de acordo com o número de tratamentos e de repetições Tratamento Repetição 1 2 J Totais 1 Y11 Y12 Y1J Y1 2 Y21 Y22 Y2J Y2 I YI1 YI2 YIJ YI Totais Y1 Y2 YJ Y G Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 72 Total para o tratamento 1 T1 Y1 Y1j Total para o tratamento i Ti Yi Yij Média para o tratamento i ȳi TiJ YiJ Total geral G Yij Ti Y no de unidades experimentais n I x J Média geral ȳ GIJ Yijn Tin 136 Análise de variância ANOVA Técnica que permite a decomposição da variação existente entre todas as observações variação total na variação devido à diferença entre os efeitos dos tratamentos e na variação devido ao acaso erro experimental ou resíduo Total10 Trat7 Res3 1361 Pressuposições Os erros experimentais devem ser normalmente distribuídos independentes com média zero e variância comum homogeneidade de variâncias de tratamentos εij NID 2 Aditividade dos efeitos incluídos no modelo estatístico 1362 Decomposição da variação total Partindose do modelo estatístico Yij m ti εij devese seguir os seguintes passos o 1º Passo Substituição do efeito de tratamento ti mi m no modelo e passando a média geral para à esquerda da igualdade com sinal trocado o Yij m mi m εij o 2º Passo Substituição de m e mi por seus estimadores o Yij ȳ ȳi ȳ εij o 3º Passo Elevação de ambos os termos ao quadrado o Yij ȳ2 ȳi ȳ εij2 o 4º Passo Aplicação de somatório duplo em ambos os lados da igualdade o Yij ȳ2 ȳi ȳ εij2 o 5º Passo Desenvolvimento do produto notável quadrado da soma de dois termos e aplicação da distributiva do somatório o Yij ȳ2 ȳi ȳ2 εij2 duplos produtos o Mas duplos produtos 0 efeito da casualização em tornar os erros independentes o Desse modo obtémse SQTot SQTrat SQRes 1363 Fórmulas práticas para experimentos balanceados mesmo número de repetições por tratamento SQTot Yij ȳ2 Yij2 Yij2IJ Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 73 SQTrat ȳi ȳ2 Ti2J Yij2IJ SQRes SQTot SQTrat 1364 Fórmulas para experimentos desbalanceados número diferente de repetições por tratamento SQTot Yij ȳ2 Yij2 Yij2n SQTrat Ti2ri Yij2n em que n é o número de UE ri e ir é o nº de UE do tratamento i SQRes SQTot SQTrat 1365 Tabela da ANOVA DIC balanceado Tabela 132 Graus de liberdade GL somas de quadrados SQ quadrados médios QM e estatística calculada F das fontes de variação de um experimento em DIC FV GL SQ QM F Tratamentos I 1 SQTrat SQTratI 1 QMTratQMRes Resíduo IJ 1 SQRes SQResIJ 1 Total IJ 1 SQTot QM divisão da SQ pelo respectivo número de GL Fcal divisão do QMTrat pelo QMRes Valor da estatística F tabelada Ftab observar o GLTrat na coluna da tabela de F e o GLRes na linha da tabela de F Deste modo temse Ftab FGLTrat GLRes 1366 Hipóteses para o teste F da ANOVA para tratamentos H0 m1 m2 mI m ou H0 2Trat 0 o Todos os possíveis contrastes entre médias de tratamentos são estatisticamente nulos ao nível de probabilidade que foi executado o teste Ha Não H0 o Existe pelo menos um contraste entre médias de tratamentos estatisticamente diferente de zero ao nível de probabilidade que foi realizado o teste C1 mt1 mt2 0 C1 mt1 mt2 1367 Regra decisória para o teste F e conclusão Se Fcal Ftab rejeitase H0 Há diferença entre tratamentos para pelo menos um contraste ao nível de significância em que foi realizado o teste Se Fcal Ftab não se rejeita H0 Os tratamentos têm efeitos iguais ao nível de significância em que foi realizado o teste Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 74 1368 Coeficiente de variação CV QMRes12ȳ 100 em que QMRes quadrado médio do resíduo obtido na ANOVA e ȳ média geral do experimento O CV é utilizado para avaliar a precisão de experimentos Quanto menor seu valor mais precisão será obtida na avaliação de variáveis de um experimento Tabela 133 Tabela 133 Sugestão empírica para classificação e avaliação da precisão de uma variável experimental CV Classificação Precisão 10 Baixo Alta 10 a 20 Médio Média 20 a 30 Alto Baixa 30 Muito Alto Muito Baixa Exemplo 131 Sejam as produções tha em um experimento de competição de cultivares de canade açúcar conduzido em DIC com seis repetições 005 Tabela 134 Tabela 134 Produção de canadeaçúcar de acordo com o cultivar e repetição Repetição Cultivar A B C D 1 54 60 59 45 2 40 55 47 33 3 51 66 44 34 4 36 61 49 48 5 50 54 62 42 6 48 61 60 44 Total 279 357 321 246 Resolução GLTot IJ 1 4 x 6 1 23 GLTrat I 1 4 1 3 GLRes IJ 1 4 x 6 1 20 SQTot Yij2 Yij2IJ 542 442 54 44246 62301 1203224 62301 6030038 200062 C6030038 SQTrat Ti2J Yij2IJ 2792 24626 1203224 614745 6030038 117412 SQRes SQTot SQTrat 200062 117412 82650 QMTrat SQTratGLTrat 1174123 39137 QMRes SQResGLRes 8265020 4132 Teste F 1º Passo H0 m1 m2 m3 m4 m Ha Não H0 2º Passo Ftab F5 3 20 310 qf095320lowertailT 1 3098391 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 75 3º Passo Fcal QMTratQMRes 391374132 947 4º Passo Fcal Ftab rejeitase a H0 pf947320lowertailF 1 00004233971 pvalor 000042 alfa005 então RH0 5º Passo Pelo teste F ao nível de 5 de probabilidade existe pelo menos um contraste entre médias de cultivares que é estatisticamente diferente de zero Ou ainda pelo teste F ao nível de 5 de probabilidade há efeito de cultivar sobre a produção Tabela da ANOVA FV GL SQ QM F Tratamentos 3 117412 39137 947 Resíduo 20 82650 4132 Total 23 200062 Significativo ao nível de 5 de probabilidade Precisão do experimento ȳ Yijn 12030024 50125 CV QMRes12ȳ 100 41321250125 100 1282 Tabela F Limites unilaterais de F ao nível de 5 de probabilidade para o caso de F 1 n2 1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 20 1 1614 1995 2157 2246 2302 2340 2368 2389 2405 2419 2430 2439 2444 2450 2459 2460 2480 2 1851 1900 1916 1925 1930 1933 1935 1937 1938 1940 1940 1941 1942 1942 1943 1943 1945 3 1013 955 928 912 901 894 889 885 881 879 876 874 872 871 870 869 866 4 771 694 659 639 626 616 609 604 600 596 593 591 589 587 586 584 580 5 661 579 541 519 505 495 488 482 477 474 470 468 466 464 462 460 456 6 599 514 476 453 439 428 421 415 410 406 403 400 398 396 394 392 387 7 559 474 435 412 397 387 379 373 368 364 360 357 355 352 351 349 344 8 532 446 407 384 369 358 350 344 339 335 331 328 325 323 322 320 315 9 512 426 386 363 348 337 329 323 318 314 310 307 304 302 301 298 294 10 496 410 371 348 333 322 314 307 302 298 294 291 288 286 285 282 277 11 484 398 359 336 320 309 301 295 290 285 282 279 276 274 272 270 265 12 475 389 349 326 311 300 291 285 280 275 272 269 266 264 262 260 254 13 467 381 341 318 303 292 283 277 271 267 263 260 257 255 253 251 246 14 460 374 334 311 296 285 276 270 265 260 256 253 250 248 246 244 239 15 454 368 329 306 290 279 271 264 259 254 251 248 245 243 240 239 233 16 449 363 324 301 285 274 266 259 254 249 245 242 239 237 235 233 228 17 445 359 320 296 281 270 261 255 249 245 241 238 235 233 231 229 223 18 441 355 316 293 277 266 258 251 246 241 237 234 231 229 227 225 219 19 438 352 313 290 274 263 254 248 242 238 234 231 228 226 223 221 216 20 435 349 310 287 271 260 251 245 239 235 231 228 225 223 220 218 212 n1 número de graus de liberdade do numerador e n2 número de graus de liberdade do denominador Tabela F Limites unilaterais de F ao nível de 1 de probabilidade para o caso de F 1 n2 1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 20 1 4052 5000 5403 5625 5764 5859 5928 5982 6022 6056 6082 6106 6125 6142 6157 6169 6209 2 9850 9900 9917 9925 9930 9933 9936 9937 9939 9940 9941 9942 9942 9943 9943 9944 9945 3 3412 3082 2946 2871 2824 2791 2767 2749 2735 2723 2713 2705 2698 2692 2687 2683 2669 4 2120 1800 1669 1598 1552 1521 1498 1480 1466 1455 1445 1437 1430 1424 1420 1415 1402 5 1626 1327 1206 1139 1097 1067 1046 1029 1016 1005 996 989 983 977 972 968 955 6 1375 1092 978 915 875 847 826 810 798 787 779 772 766 760 756 752 740 7 1225 955 845 785 846 719 699 684 672 662 654 647 641 635 631 627 616 8 1126 865 759 701 663 637 618 603 591 581 574 567 561 556 552 548 536 9 1056 802 699 642 606 580 561 547 535 526 518 511 505 500 496 492 481 10 1004 756 655 599 564 539 520 506 494 485 478 471 465 460 456 452 441 11 965 721 622 567 532 507 489 474 463 454 446 440 434 429 425 421 410 12 933 693 595 541 506 482 464 450 439 430 422 416 410 405 401 398 386 13 907 670 574 521 486 462 444 430 419 410 402 396 390 385 382 378 366 14 886 651 556 504 469 446 428 414 403 394 386 380 375 370 366 362 351 15 868 636 542 489 456 432 414 400 389 380 373 367 361 356 352 348 337 16 853 623 529 477 444 420 403 389 378 369 361 355 350 345 341 337 326 17 840 611 518 467 434 410 393 379 368 359 352 346 340 335 331 327 316 18 829 601 509 458 425 401 384 371 360 351 344 337 332 327 323 319 308 19 818 593 501 450 417 394 377 363 352 343 336 330 324 319 315 312 300 20 810 585 494 443 410 387 370 356 346 337 330 323 318 313 309 305 294 n1 número de graus de liberdade do numerador e n2 número de graus de liberdade do denominador Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 76 Script no R tratrepc14 each6 trat reprepc164 rep y1c544051365048605566615461594744496260453334484244 y1 diccbindtratrepy1 dic classdic T1sumdic163 T1 m1T16 m1 T2sumdic7123 T2 m2T26 m2 T3sumdic13183 T3 m3T36 m3 T4sumdic19243 T4 m4T46 m4 totsumdic3 tot meantotlengthy1 mean Csumy12lengthy1 C sqtotsumy12C sqtot sqtratsumT12T22T32T426C sqtrat sqressqtotsqtrat sqres Resolução pelo R Estatísticas descritivas gerais requirepsych describey1 requirefBasics basicStatsy1 ci 095 Estatísticas descritivas por tratamento describeByy1trat basicStatsy1trat ci 095 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 77 Análise de variância ANOVA y1c544051365048605566615461594744496260453334484244 tratrepc14 each6 ou tratfactorrepc1234 each6 reprepc164 ou repfactorrep164 diccbindtratrepy1 classdic dicdataframetratrepy1 tratasfactordictrat repasfactordicrep classtrat classrep headdic aovdic aovy1 trat Armazenando a ANOVA do TIPO I no objeto aovdic summaryaovdic Obtendo a ANOVA anovaaovdic Verificação dos pressupostos para realização de ANOVA residualsaovdicObtenção dos resíduos Testes de ShapiroWilk SW para verificação da normalidade dos resíduos H0 Os resíduos se aderem à distribuição normal shapirotestaovdicresiduals Análise de resíduos análise gráfica fittedvaluesaovdic residualsaovdic residuos residaovdic preditos fittedaovdic plotpreditos residuos Obtenção dos resíduos padronizados s2 sumresiduos2 aovdicdfres respad residuossqrts2 respad Boxplot dos resíduos padronizados boxplotrespad Gráfico de quantis teóricos da normal 0 1 para as probabilidades dos resíduos qqnormrespad ylabResíduos padronizados mainNULL qqlinerespad Teste de Bartlett para verificação da homogeneidade de variâncias nos resíduos H0 Variâncias iguais homogêneas librarystats bartletttestaovdicresiduals trat ou bartletttesty1 trat Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 78 Capítulo 13 Lista de exercícios sobre DICANOVA 1 Para comparar a produtividade de quatro variedades de milho um agrônomo tomou vinte parcelas similares e distribuiu inteiramente ao acaso cada uma das quatro variedades em cinco parcelas experimentais A partir dos dados experimentais obtidos Tabela 135 é possível concluir que existe diferença significativa entre as variedades com relação a produtividade utilizando o nível de significância de 5 Calcule o CV do experimento Tabela 135 Produtividade de variedades de milho em cada unidade experimental Variedades A B C D 25 31 22 33 26 25 26 29 20 28 28 31 23 27 25 34 21 24 29 28 Totais 115 135 130 155 Médias 23 27 26 31 Resolução pelo R x1filechoose dic1 readcsv2x1 Leitura dos dados da planilha ex1DIC e atribuição ao objeto dic1 strdic1 headdic1 Obtenção das seis primeiras linhas da planilha dic1 tratasfactordic1trat Conversão de tratamento em um fator repasfactordic1rep Conversão de repetição em um fator aovdic1 aovdic1y trat ANOVA contida no objeto aovdic1 anovaaovdic1 Obtenção da ANOVA 2 Um treinador de corrida rústica objetivando melhorar o desempenho de seus atletas testou três novas técnicas de preparação com um grupo de 15 atletas completamente homogêneos para as características essenciais A designação das técnicas de preparação aos atletas foi feita totalmente ao acaso e o número de atletas avaliados em cada uma das técnicas foi o mesmo Após um dado período de tempo de aprendizado da técnica pelos atletas os resultados foram obtidos Tabela 136 Tabela 136 Produtividade de variedades de milho em cada unidade experimental Repetições Técnicas de Preparação 1 2 3 1 130 125 127 2 129 131 129 3 128 130 131 4 126 129 128 5 130 127 130 Totais 643 642 645 De acordo com os resultados obtidos pedese a Quais os princípios básicos da experimentação utilizados pelo pesquisador neste experimento b Qual foi a unidade experimental nesta pesquisa c É possível concluir que existe diferença entre as técnicas de preparação com 1 d Qual seria a técnica a ser recomendada Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 79 3 Com o objetivo de diminuir o consumo dos motores à gasolina uma indústria petroquímica testou quatro novas formulações de gasolina as quais se diferenciavam pelo tipo de aditivo que foi acrescentado à mesma durante o seu processo de fabricação Para efetuar o teste a indústria utilizou carros completamente homogêneos para todas as características e a designação das formulações aos carros foi feita inteiramente ao acaso Após os testes de rodagem os resultados kml foram obtidos Tabela 137 Existe diferença entre os quatro tipos de formulações 5 e SQRes 60264 Tabela 137 Estatísticas descritivas do consumo de combustível dos carros de acordo o tipo de aditivo Estatísticas Tipo de aditivo Ácido Forte Ácido Fraco Base Forte Base Fraca Médias 1481 656 1006 1009 Número de carros 10 10 10 10 Resolução pelo R m11481 m2656 m31006 m41009 medrbindm1m2m3m4 mmeanmed rep10 T1m1rep T2m2rep T3m3rep T4m4rep totrbindT1T2T3T4 Csumtot24rep C sqtratsumT12T22T32T42repC sqtrat gltrat3 qmtratsqtratgltrat qmtrat sqres60264 glres393 qmressqresglres qmres fcalqmtratqmres fcal ftabqf095336lowertailT ftab pvalpffcal336lowertailF pval cvsqrtqmresm100 cv Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 80 4 Com o objetivo de verificar se a parótida tem influência na taxa de glicose no sangue de ratos um experimento em DIC foi realizado Vinte e quatro ratos machos da raça Wistar com 60 dias de idade foram escolhidos aleatoriamente e separados em três grupos Os dados de glicose mg100 ml de sangue segundo o grupo encontramse na Tabela 138 Para 5 teste a H0 e conclua Tabela 138 Valores de glicose sanguínea de ratos de acordo com o tratamento e repetição Parotidectomizado 960 950 1000 1080 1200 1105 970 925 Pseudoparotidectomizado 900 930 890 880 870 925 875 850 Normal 860 850 1050 1050 900 1000 950 950 5 Considere um experimento instalado em DIC objetivando verificar se há efeito significativo de linhagens sobre o peso médio g de frangos de corte aos 42 dias de idade Tabela 139 Ao nível de 5 de probabilidade faça a ANOVA teste a H0 e conclua Calcule o CV do experimento Tabela 139 Pesos médios de frangos aos 42 dias de idade de acordo com as linhagens e as repetições Linhagens A B C 3450 2980 3150 3260 2975 3200 3330 3050 3300 Respostas 1 Fcal 780 Ftab 324 CV 989 2a Repetição e Casualização b Cada atleta c Fcal 0126 Ftab 693 d Qualquer técnica pode ser recomendada 3 Fcal 68507 Ftab 287 4 Fcal 673 Ftab 347 5 Fcal 2303 Ftab 514 CV 202 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 81 Capítulo 14 Delineamento em blocos casualizados completos DBC 141 Introdução Recomendado quando as condições experimentais não são homogêneas 142 Princípios básicos da experimentação utilizados Repetição Existe pelo menos uma repetição de cada tratamento distribuída inteiramente ao acaso dentro de cada bloco Casualização Os tratamentos são distribuídos ao acaso às parcelas dentro de cada bloco Aplicação do controle local o Divisão da área ou do material experimental heterogêneo em subdivisões homogêneas blocos Dentro de cada bloco deve haver homogeneidade do material experimental o Finalidade Redução do erro experimental pelo controle de uma FV sistemática o Uma parte da SQ e do QM do resíduo será incorporada na SQ e QM de blocos respectivamente que corresponde à variação entre os blocos 143 Vantagens e desvantagens analíticas em relação ao DIC Vantagem Redução na SQRes na ANOVA Desvantagem Redução no número de GLRes na ANOVA 144 Fontes de variação sistemáticas comumente utilizadas Em experimentos de campo subdivisão da área em blocos homogêneos por declividade fertilidade incidência de luz solar entre outras Em experimentos zootécnicos subdivisão dos animais em subgrupos homogêneos com relação à idade peso inicial raça entre outras 145 Modelo estatístico Yij m ti bj εij o Yij valor da variável em estudo referente ao tratamento i no bloco j o m média de todas as unidades experimentais média geral o ti efeito do tratamento i ti ȳi ȳ o bj efeito do bloco j bj ȳj ȳ o εij erro associado à observação Yij εij Yij ȳi ȳj ȳ o O erro experimental deve ser minimizado não há controle pois é um efeito aleatório o Variações observadas entre as repetições do mesmo tratamento Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 82 146 Quadro de tabulação dos dados Seja um ensaio planejado no DBC com I tratamentos e J repetições blocos Tabela 141 Tabela 141 Dados da variável Y de acordo com o número de tratamentos e de blocos Tratamento Bloco 1 2 J Total 1 Y11 Y12 Y1J Y1 2 Y21 Y22 Y2J Y2 I YI1 YI2 YIJ YI Total Y1 Y2 YJ Y G Assim podese extrair as seguintes quantidades o Total para o tratamento 1 T1 Y1 Y1j Total para o tratamento i Ti Yi Yij o Média para o tratamento i ȳi TiJ YiJ Total para o bloco 1 B1 Y1 Yi1 o Total para o bloco j Bj Yj Yij Média para o bloco j ȳj BjI YjI o Total geral G Yij Ti Bj Y número de unidades experimentais n I J o Média geral do experimento ȳ GIJ Yijn Tin Bjn 147 Análise de variância ANOVA Técnica que permite a decomposição da variação total que existe entre todas as observações na variação devido às diferenças entre os efeitos de tratamentos na variação devido às diferenças entre os efeitos de blocos e na variação devido ao acaso resíduo 1471 Pressuposições Os erros experimentais devem ser normalmente distribuídos independentes com média zero e variância comum homogeneidade de variâncias de tratamentos εij NID 0 2 Aditividade dos efeitos incluídos no modelo estatístico 1472 Decomposição da variação total Partindose do modelo estatístico Yij m ti bj εij devese seguir os seguintes passos o 1º Passo Substituição dos efeitos de tratamento ti mi m e de bloco bj mj m no modelo e passando a média geral para à esquerda da igualdade com sinal trocado o Yij m mi m mj m εij o 2º Passo Substituição de m mi e mj por seus estimadores o Yij ȳ ȳi ȳ ȳj ȳ εij o 3º Passo Elevação de ambos os termos ao quadrado Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 83 o Yij ȳ2 ȳi ȳ ȳj ȳ εij2 o 4º Passo Aplicação de somatório duplo em ambos os lados da igualdade o Yij ȳ2 ȳi ȳ ȳj ȳ εij2 o 5º Passo Desenvolvimento do produto notável quadrado da soma de três termos e aplicação da distributiva do somatório o Yij ȳ2 ȳi ȳ2 ȳj ȳ2 εij2 duplos produtos o Mas duplos produtos 0 efeito da casualização em tornar os erros independentes o Desse modo obtémse SQTot SQTrat SQBlo SQRes 1473 Fórmulas práticas para experimentos balanceados SQTot Yij ȳ2 Yij2 Yij2IJ SQTrat ȳi ȳ2 Ti2J Yij2IJ SQBlo ȳj ȳ2 Bj2I Yij2IJ SQRes SQTot SQTrat SQBlo 1474 Tabela da ANOVA DBC completo Tabela 142 Graus de liberdade GL somas de quadrados SQ quadrados médios QM e estatística calculada F das fontes de variação de um experimento em DBC FV GL SQ QM F Tratamentos I 1 SQTrat SQTratI1 QMTratQMRes Blocos J 1 SQBlo Resíduo I 1J 1 SQRes SQResI1J1 Total IJ 1 SQTot QM divisão da SQ pelo respectivo número de GL Fcal para tratamentos divisão do QMTrat pelo QMRes Ftab observar o GLTrat e o GLRes ou seja Ftab FGLTrat GLRes 1475 Hipóteses para o teste F da ANOVA para tratamentos idem DIC H0 m1 m2 mI m ou H0 2Trat 0 o Todos os possíveis contrastes entre médias de tratamentos são estatisticamente nulos ao nível de probabilidade que foi executado o teste Ha Não H0 o Existe pelo menos um contraste entre médias de tratamentos estatisticamente diferente de zero ao nível de significância que foi realizado o teste Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 84 1476 Regra decisória e conclusão para o teste F idem DIC Se Fcal Ftab rejeitase H0 e concluise que os tratamentos têm efeito diferenciado ao nível de significância em que foi realizado o teste ou seja há efeito de tratamento sobre a variável Y Se Fcal Ftab não se rejeita H0 e concluise que os tratamentos têm efeitos iguais ao nível de significância em que foi realizado o teste 1477 Coeficiente de variação CV QMRes12ȳ 100 em que QMRes quadrado médio do resíduo obtido na ANOVA realizada em DBC e ȳ média geral do experimento Exemplo 141 Sejam as produções kgparcela de 60 m2 em um experimento de competição de variedades de milho conduzido em DBC com cinco repetições blocos e 001 Tabela 143 Tabela 143 Produção de milho de acordo com a variedade e repetição Variedade Bloco Total B1 B2 B3 B4 B5 V1 354 306 287 362 292 1601 V2 428 354 292 351 348 1773 V3 163 162 135 203 194 857 V4 158 145 104 216 183 806 V5 215 187 158 254 252 1066 V6 193 232 142 217 288 1072 Total 1511 1386 1118 1603 1557 7175 Resolução GLTot IJ 1 6 5 1 29 GLTrat I 1 6 1 5 GLBlo J 1 5 1 4 GLRes I 1J 1 6 1 5 1 5 4 20 ou 29 5 4 20 SQTot Yij2 Yij2IJ 3542 2882 354 288265 1917979 7175230 1917979 1716021 201958 SQTrat Ti2J Yij2IJ 16012 107225 C 1875271 1716021 159250 SQBlo Bj2I Yij2IJ 15112 155726 C 1741317 1716021 25296 SQRes SQTot SQTrat SQBlo 201958 159250 25296 17412 QMTrat SQTratGLTrat 1592505 31850 QMRes SQResGLRes 1741220 871 Teste F 1º Passo H0 m1 m2 m3 m4 m5 m6 m Ha Não H0 2º Passo Ftab F1 5 20 410 qf099520lowertailT 1 4102685 3º Passo Fcal QMTratQMRes 31850871 3657 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 85 4º Passo Fcal Ftab rejeitase a H0 5º Passo Pelo teste F ao nível de 1 de probabilidade existe pelo menos um contraste entre médias de variedades que é estatisticamente diferente de zero Tabela da ANOVA FV GL SQ QM F Tratamentos 5 159250 31850 3657 Blocos 4 25296 Resíduo 20 17412 871 Total 29 201958 Significativo ao nível de 1 de probabilidade pvalor pf3657520lowertailF 1 2139011e09 Precisão do experimento ȳ Yijn 7175030 2392 CV QMRes12ȳ 100 871122392 100 1234 Script do R y1c35430628736229242835429235134816316213520319415814510421618 3215187158254252193232142217288 tratrepc16 each5 reprepc156 dbccbindtratrepy1 dbc classdbc dbcdataframetratrepy1 tratasfactordbctrat repasfactordbcrep headdbc aovdbc aovy1 tratrep Armazenamento da ANOVA do TIPO I no objeto aovdbc anovaaovdbc Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 86 Capítulo 14 Lista de exercícios sobre DBCANOVA 1 Um pesquisador instalou um experimento em DBC para verificar o efeito de cinco produtos comerciais para suprir a deficiência de micronutriente ppmml de sangue em caprinos os quais foram separados em três grupos segundo a idade Faça a ANOVA para os resultados obtidos Tabela 144 Tabela 144 Valores de micronutriente sanguíneo de acordo com os tratamentos e os blocos Blocos Produtos comerciais Totais 1 2 3 4 5 1 83 86 103 116 132 520 2 63 69 79 81 98 390 3 55 61 79 79 91 365 Totais 201 216 261 276 321 1275 Resolução x1filechoose dbc1 readcsv2x1 strdbc1 headdbc1 Obtenção das seis primeiras linhas da planilha dbc1 tratasfactordbc1trat Conversão de tratamento em um fator repasfactordbc1rep Conversão de repetição em um fator aovdbc1 aovdbc1y tratrep ANOVA contida no objeto aovdbc1 anovaaovdbc1 Obtenção da Tabela de ANOVA libraryagricolae dfdfresidualaovdbc1 MSerrordevianceaovdbc1df tk1dbcHSDtestdbc1ytratdfMSerrorconsoleTRUEalpha005 plottk1dbc las1main HSDtestdbc1ytratdfMSerrorconsoleTRUEgroupFalpha005ValoresP e ICdif 1a 1354 mt5 10700 a mt4 9200 b mt3 8700 b mt2 7200 c mt1 6700 c Médias seguidas por pelo menos uma mesma letra não diferem entre si pelo teste de Tukey com 5 2 Para aumentar a produção de lã por meio de uma alimentação mais apropriada um criador separou 28 ovelhas de sua criação e dividiuas em sete grupos de idades distintas Dentro de cada grupo havia quatro ovelhas de mesma idade homogêneas para as demais características Dentro de cada grupo foi realizado um sorteio para distribuir inteiramente ao acaso os quatro tipos de alimentação TA às parcelas Cada parcela foi composta por uma ovelha O experimento se iniciou logo após as ovelhas terem sido submetidas a uma tosquia e se encerrou em momento apropriado com uma nova tosquia As amostras de lã foram lavadas para obtenção dos pesos de velo limpo kg Tabela 145 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 87 Tabela 145 Valores de peso de velo limpo de acordo com os tratamentos e os blocos TA Grupos Totais 1 2 3 4 5 6 7 1 30 32 33 34 29 30 33 221 2 29 31 34 31 33 33 29 220 3 43 47 46 47 48 44 47 322 4 23 25 21 19 20 21 22 151 Totais 125 135 134 131 130 128 131 914 a Qual o tipo de delineamento experimental que o criador utilizou Justifique sua resposta b Existe diferença 1 entre os tipos de alimentação fornecidos às ovelhas x2filechoose dbc2 readcsv2x2 strdbc2 dbc2 tratasfactordbc2trat Conversão de tratamento em um fator repasfactordbc2rep Conversão de repetição em um fator aovdbc2 aovdbc2y tratrep ANOVA contida no objeto aovdbc2 anovaaovdbc2 Obtenção da Tabela de ANOVA tapplydbc2ytratmean Médias 3 Proceda a ANOVA 5 aos dados de um experimento instalado no DBC com cinco tratamentos e quatro repetições Tabela 146 Tabela 146 Resultados de um experimento em DBC segundo os tratamentos e blocos Tratamentos Blocos Total 1 2 3 4 1 14236 14478 14519 13888 57121 2 13928 13777 14444 13061 55210 3 14073 13406 13607 14411 55497 4 15088 13583 13697 13636 56004 5 15349 16502 15175 15022 62048 Total 72674 71746 71442 70018 285880 4 Um pesquisador deseja verificar qual tipo de pneu que proporciona menor consumo de combustível em litroshora trabalhada Tabela 147 Para trabalhar em terrenos encharcados ele testou quatro diferentes tipos de pneus A área que dispunha para realizar o experimento era heterogênea com relação a declividade sendo subdividida em três subáreas de tal forma que dentro de cada uma delas existia uniformidade com relação à declividade Após isto dentro de cada subárea realizou um sorteio ao acaso dos tipos de pneus às unidades experimentais Para 5 perguntase Tabela 147 Valores de consumo de combustível de acordo com os tratamentos e os blocos Subáreas Pneus Tipo 1 Tipo 2 Tipo 3 Tipo 4 1 30 32 33 35 2 29 30 31 33 3 25 26 30 31 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 88 a Quais os princípios básicos da experimentação utilizados neste experimento Justifique b Qual foi o tipo de delineamento experimental utilizado Justifique sua resposta c Em termos do consumo conclua com relação aos tipos de pneus por meio de uma ANOVA 5 Proceda a análise de variância aos dados de um ensaio instalado em DBC T1 1306 T2 1834 T3 1526 T4 1856 T5 1432 Bj2 15930692 j varia de 1 a 4 Yij2 3288970 e 1 6 Sejam alguns dados da ANOVA de um ensaio em DBC e os totais dos cinco tratamentos cujos efeitos foram avaliados na produção de cerveja GLBlo 3 QMRes 4895 T1 120 T2 352 T3 220 T4 240 e T5 456 Há efeito dos tipos de levedura 5 na produção de cerveja Respostas 1 Fcal 3359 Ftab 384 2a DBC O criador casualizou os quatro tratamentos dentro de cada bloco homogêneo representado pela idade Entre blocos existiam diferenças com relação à idade sendo controladas na ANOVA 2b Fcal 17700 Ftab 509 Fcal Ftab RH0 Pelo teste F com 1 há diferença entre os tipos de alimentação fornecidos às ovelhas 3 Fcal 587 Ftab 326 Fcal Ftab RH0 Pelo teste F 5 há efeito dos tratamentos sobre Y 4a Repetição casualização e controle local 4b DBC Houve casualização dos pneus dentro de cada subárea bloco homogênea As três subáreas eram heterogêneas quanto à declividade 4c Fcal 2097 Ftab 476RH0 Pelo teste F 5 há efeito dos tipos de pneus sobre o consumo 5 Fcal 420 Ftab 541 AH0 Pelo teste F 1 as médias dos tratamentos não diferem entre si 6 Fcal 911 Ftab 326 Fcal Ftab RH0 Pelo teste F 5 há efeito dos tipos de leveduras na produção de cerveja Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 89 Capítulo 15 Testes de comparações múltiplas TCM 151 Introdução Os modelos de análise de variância são usados para analisar os efeitos de um ou mais fatores sobre a variável dependente Na ANOVA o Fator é uma variável independente a ser estudada o Classes de um fator são as particularidades do fator no experimento Ex Em estudo de comparação da produção de várias variedades de trigo o Fator sob investigação variedade o Classes do fator cada variedade o Variável dependente produção dessas variedades Em experimentos com um fator um tratamento corresponde a uma das classes do fator Quando há mais de um fator um tratamento corresponde a uma combinação de classes dos fatores envolvidos no estudo O teste F da ANOVA é um teste preliminar que estabelece se é necessária uma análise detalhada dos efeitos das classes do fator o Teste F não significativo AH0 os efeitos das classes do fator são iguais não há relação entre o fator e a variável dependente o Teste F significativo RH0 nem todos as classes do fator têm efeitos iguais existe relação entre o fator e a variável dependente o Em experimentos com mais de duas classes do fator e quando o teste F leva à RH0 como discriminar as médias de tratamentos o Aplicandose um teste de médias ou seja estimandose os contrastes entre as médias das classes do fator e as variâncias dessas estimativas POSTHOC Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 90 152 Teste de Tukey ou Teste da Diferença Honestamente Significativa DHS Usado para comparar a totalidade dos contrastes entre duas médias após a ANOVA com teste F significativo ou seja para os n1n112 contrastes do tipo C mi mj em que n1 é o número de classes do fator em estudo O teste pode ser usado para dados balanceados número igual de repetições para todos os tratamentos e desbalanceados número diferente de repetições TukeyKramer Baseiase na diferença mínima significativa dms representada por dada por o Tukey DHS qn1 n2 QMRes2 1ri 1rj12 para experimentos desbalanceados número diferente de repetições o Ou Tukey qn1 n2 QMResr12 para experimentos balanceados mesmo número de repetições o q qn1 n2 é o valor tabelado da amplitude total studentizada obtido em função do nível de significância do nº de classes do fator em estudo n1 e dos GLRes n2 da ANOVA 1521 Protocolo para aplicação do teste de Tukey 1 passo Enunciar as hipóteses H0 mi mj e Ha mi mj ij 2 passo Indicar o teste de comparação de médias e o nível de significância 3 passo Ordenação decrescente das médias dos tratamentos 4 passo Cálculo do dms 5 passo Obter as estimativas dos contrastes Ĉ ȳi ȳj com base nos valores amostrais 6 passo Concluir sobre a significância dos n1n112 contrastes em teste Se Ĉ rejeitase a H0 caso contrário aceitase a H0 7 passo Resultados do teste referentes às médias populacionais 8 passo Conclusão do teste Médias seguidas por pelo menos uma mesma letra não diferem entre si pelo teste de Tukey ao nível de probabilidade Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 91 Exemplo 151 Sejam as produções kgparcela de 60 m2 de variedades de milho em experimento instalado em DBC com seis tratamentos e cinco blocos Tabela 151 MESMO EX DO DBC Tabela 151 Valores de produção de acordo com as variedades e os blocos Variedades Blocos B1 B2 B3 B4 B5 Totais V1 354 306 287 362 292 1601 V2 428 354 292 351 348 1773 V3 163 162 135 203 194 857 V4 158 145 104 216 183 806 V5 215 187 158 254 252 1066 V6 193 232 142 217 288 1072 Totais 1511 1386 1118 1603 1557 7175 Para esses dados há rejeição da H0 pois Fcal 3657 Ftab 410 páginas 8384 Concluise que há efeito das variedades sobre a produção ou seja pelo teste F ao nível de 1 de probabilidade existe pelo menos um contraste entre médias de variedades que é estatisticamente diferente de zero Resolução 1 Passo H0 mi mj e Ha mi mj ij 2 Passo Teste de Tukey 001 3 Passo ȳv2 17735 3546a ȳv1 16015 3202a ȳv6 10725 2144b ȳv5 10665 2132b ȳv3 8575 1714b e ȳv4 8065 1612b 4 Passo Tukey q1 6 20 871512 551 13198 727 5 e 6 Passos Estimativas e conclusão sobre a significância dos contrastes Ĉ1 ȳv2 ȳv1 3546 3202 344 AH0 permanecer com ȳv2 Ĉ2 ȳv2 ȳv6 3546 2144 1402 RH0 abandonar ȳv2 Ĉ3 ȳv1 ȳv6 3202 2144 1058 RH0 abandonar ȳv1 Ĉ4 ȳv6 ȳv5 2144 2132 012 AH0 permanecer com ȳv6 Ĉ5 ȳv6 ȳv3 2144 1714 430 AH0 permanecer com ȳv6 Ĉ6 ȳv6 ȳv4 2144 1612 532 AH0 final do teste 7 Passo Resultados do teste referentes às médias populacionais mv2 3546 a mv1 3202 a mv6 2144 b mv5 2132 b mv3 1714 b mv4 1612 b 8 Passo Médias seguidas por pelo menos uma mesma letra não diferem entre si ao nível de 1 de probabilidade pelo teste de Tukey As variedades de milho V2 e V1 apresentam maiores produções Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 92 Tabela Tukey Valores de amplitude total studentizada q ao nível de 5 de probabilidade n2 1 2 3 4 5 6 7 8 9 10 11 12 1 1797 2698 3282 3708 4041 4312 4540 4736 4907 5059 5196 2 609 833 980 1088 1174 1244 1303 1354 1399 1439 1475 3 450 591 683 750 804 848 885 918 946 972 995 4 393 504 576 629 671 705 735 760 783 803 821 5 364 460 522 567 603 633 658 680 700 717 732 6 346 434 490 531 563 590 612 632 649 665 679 7 334 417 468 506 536 561 582 600 616 630 643 8 326 404 453 489 517 540 560 577 592 605 618 9 320 395 442 476 502 524 543 560 574 587 598 10 315 388 433 465 491 512 531 546 560 572 583 11 311 382 426 457 482 503 520 535 549 561 571 12 308 377 420 451 475 495 512 527 540 551 562 13 306 374 415 445 469 489 505 519 532 543 553 14 303 370 411 441 464 483 499 513 525 536 546 15 301 367 408 437 460 478 494 508 520 531 540 16 300 365 405 433 456 474 490 503 515 526 535 17 298 363 402 430 452 471 486 499 511 521 531 18 297 361 400 428 450 467 482 496 507 517 527 19 296 359 398 425 447 465 479 492 504 514 523 20 295 358 396 423 445 462 477 490 501 511 520 24 292 353 390 417 437 454 468 481 492 501 510 30 289 349 385 410 430 446 460 472 482 492 500 40 286 344 379 404 423 439 452 464 474 482 490 60 283 340 374 398 416 431 444 455 465 473 481 120 280 336 369 392 410 424 436 447 456 464 471 277 331 363 386 403 417 429 439 447 455 462 n1 número de tratamentos n2 número de graus de liberdade do resíduo Tabela Tukey Valores de amplitude total studentizada q ao nível de 1 de probabilidade n2 1 2 3 4 5 6 7 8 9 10 11 12 1 9003 1350 1643 1856 2022 2158 2272 2370 2456 2532 2600 2 1404 1902 2229 2472 2663 2820 2953 3068 3169 3259 3340 3 826 1062 1217 1333 1424 1500 1564 1620 1669 1713 1753 4 651 812 917 996 1058 1110 1155 1193 1227 1257 1284 5 570 698 780 842 891 932 970 997 1024 1048 1070 6 524 633 703 756 797 832 861 887 910 930 948 7 495 592 654 700 737 768 794 817 837 855 871 8 475 564 620 662 696 724 747 768 786 803 818 9 460 543 596 635 666 692 713 732 750 765 778 10 448 527 577 614 643 667 688 706 721 736 748 11 439 515 562 597 625 648 667 684 699 713 725 12 432 505 550 584 610 632 651 667 681 694 706 13 426 496 540 573 598 619 637 653 667 679 690 14 421 490 532 563 588 608 626 641 654 666 677 15 417 484 525 556 580 599 616 631 644 656 666 16 413 479 519 549 572 592 608 622 635 646 656 17 410 474 514 543 566 585 601 615 627 638 648 18 407 470 509 538 560 579 594 608 620 631 641 19 405 467 505 533 555 574 589 602 614 625 634 20 402 464 502 529 551 569 584 597 609 619 628 24 396 455 491 517 537 554 568 581 592 602 611 30 389 446 480 505 524 540 554 565 576 585 593 40 382 437 470 493 511 526 539 550 560 569 576 60 376 428 460 482 499 513 525 536 545 553 560 120 370 420 450 471 487 500 512 521 530 538 544 364 412 440 460 476 488 499 508 516 523 529 n1 número de tratamentos n2 número de graus de liberdade do resíduo Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 93 Obtenção dos valores tabelados de Tukey A tabela de Tukey é unilateral à direita qtukey099620lowertailT quantil de Tukey para n1 6 e n2 20 1 5509542 ou qtukey001620lowertailF 1 5509542 Resolução pelo R y1c35430628736229242835429235134816316213520319415814510421618 3215187158254252193232142217288 tratrepc16 each5 reprepc156 dbccbinddataframetratrepy1 tratasfactordbctrat repasfactordbcrep headdbc aovdbc aovy1 tratrep Armazenamento da ANOVA do TIPO I no objeto aovdbc anovaaovdbc Estatísticas descritivas gerais requirepsych describey1 requirefBasics basicStatsy1 ci 095 Estatísticas descritivas por tratamento describeByy1trat basicStatsy115 ci 095 Descritivas do tratamento 1 basicStatsdbc6103 ci 095 Descritivas do tratamento 2 Teste de Tukey pela library stats aplicado ao objeto da ANOVA helpTukeyHSD argsTukeyHSD tk1TukeyHSDaovdbcconflevel099whichtrat plottk1cexaxis04 plottk1 las1cexaxis04 Teste de Tukey pela library agricolae aplicado ao objeto da ANOVA libraryagricolae dfdfresidualaovdbc MSerrordevianceaovdbcdf tk2HSDtesty1tratdfMSerrorconsoleTRUEalpha001 consolecomando lógico imprime saída ou não plottk2 variationrangelas1main HSDtesty1tratdfMSerrorconsoleTRUEgroupFalpha001 ValoresP e ICdif dos contrastes de Tukey Teste de Tukey pela library multcomp aplicado ao objeto da ANOVA requiremultcomp tk3summaryglhtaovdbc linfctmcptratTukey ValorP dos contrastes de Tukey linfctespecificação da hipótese linear a ser testada tk3 plottk3las1cexaxis04 confintglhtaovdbc alpha001 linfctmcptratTukey IC para a hipótese linear geral glht Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 94 153 Teste Novo de Amplitudes Múltiplas de Duncan Duncans New Multiple Range Test É um procedimento sequencial usado para comparar a totalidade dos contrastes entre duas médias do tipo C mi mj após a ANOVA com teste F significativo Usado para a condição de balanceamento número igual de repetições para todos os tratamentos e desbalanceamento número de repetições diferentes Baseiase na amplitude mínima significante Di o Di zn1 n2 QMRes2 1ri 1rj12 para experimentos desbalanceados o Ou Di zn1 n2 QMResr12 para experimentos balanceados mesmo nº de repetições zi zn1 n2 é o valor tabelado da amplitude mínima studentizada significante least significant studentized range obtido em função do nível de significância do teste n de médias ordenadas abrangidas pelo contraste entre as classes do fator em estudo n1 e n de GL do resíduo n2 da ANOVA 1531 Protocolo para aplicação do teste de Duncan 1 passo Enunciar as hipóteses H0 mi mj e Ha mi mj ij 2 passo Indicar o teste de comparação de médias e o nível de significância 3 passo Ordenação decrescente das médias dos tratamentos 4 passo Cálculo do Di amplitude mínima significante com base no n de médias ordenadas abrangidas pelo contraste n1 i 5 passo Obter o valor da estimativa do contraste entre a maior e a menor média Ĉ ȳi ȳj com base nos valores amostrais 6 passo Concluir sobre a significância dos n1n1 12 contrastes em teste a Se Di Ĉ AH0 e as médias são ligadas por um traço indicando que não há diferença entre elas b Caso contrário reduzir de uma unidade o valor de n1 Calculase um novo valor de Di e para todos os pares de médias que não estejam ligadas por um mesmo traço e que envolvem n1 médias repetir os procedimentos do 5 e 6 passos c Repetir os procedimentos do 5 e 6 passos até que n1 2 7 passo Resultados do teste referentes às médias populacionais 8 passo Conclusão do teste Médias seguidas por pelo menos uma mesma barra não diferem entre si pelo teste de Duncan ao nível de probabilidade Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 95 Exemplo 152 Sejam as produções kgparcela de 60 m2 de um ensaio de competição de variedades de milho instalado em DBC com seis tratamentos e cinco blocos Tabela 152 MESMO EX DO DBC Tabela 152 Valores de produção de acordo com as variedades e os blocos Variedades Blocos Totais B1 B2 B3 B4 B5 V1 354 306 287 362 292 1601 V2 428 354 292 351 348 1773 V3 163 162 135 203 194 857 V4 158 145 104 216 183 806 V5 215 187 158 254 252 1066 V6 193 232 142 217 288 1072 Totais 1511 1386 1118 1603 1557 7175 Para esses dados há rejeição da H0 pois Fcal 3657 Ftab 410 páginas 8384 Concluise que há efeito das variedades sobre a produção ou seja pelo teste F ao nível de 1 de probabilidade existe pelo menos um contraste entre médias de variedades que é estatisticamente diferente de zero Resolução 1 Passo H0 mi mj e Ha mi mj ij 2 Passo Teste de Duncan 001 3 Passo ȳv2 17735 3546 ȳv1 16015 3202 ȳv6 10725 2144 ȳv5 10665 2132 ȳv3 8575 1714 ȳv4 8065 1612 4 5 e 6 passos Cálculo do Di com base no n de médias ordenadas abrangidas pelo contraste n1 i obtenção do valor da estimativa dos contrastes e conclusão sobre suas significâncias Di zn1 n2 QMResr12 D6 z16 20 871512 447 13198 58995 Ĉ1 ȳv2 ȳv4 3546 1612 1934 D6 RH0 Calcular Di para a distância entre 5 médias Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 96 D5 z15 20 871512 440 13198 58071 Ĉ2 ȳv2 ȳv3 3546 1714 1832 D5 RH0 Ĉ3 ȳv1 ȳv4 3202 1612 1590 D5 RH0 Calcular Di para a distância entre 4 médias D4 z14 20 871512 433 13198 57147 Ĉ4 ȳv2 ȳv5 3546 2132 1414 D4 RH0 Ĉ5 ȳv1 ȳv3 3202 1714 1488 D4 RH0 Ĉ6 ȳv6 ȳv4 2144 1612 532 D4 AH0 traço entre ȳv6 e ȳv4 mas calcular Di para a distância entre 3 médias D3 z13 20 871512 422 13198 55696 Ĉ7 ȳv2 ȳv6 3546 2144 1402 D3 RH0 Ĉ8 ȳv1 ȳv5 3202 2132 1070 D3 RH0 Calcular Di para a distância entre 2 médias D2 z12 20 871512 402 13198 53056 Ĉ9 ȳv2 ȳv1 3546 3202 344 D2 AH0 traço entre ȳv2 e ȳv1 Ĉ10 ȳv1 ȳv6 3202 2144 1058 D2 RH0 Fim do teste 7 passo Resultados do teste referentes às médias populacionais mv2 3546 mv1 3202 mv6 2144 mv5 2132 mv3 1714 mv4 1612 8 passo Médias seguidas por pelo menos uma mesma barra não diferem entre si pelo teste de Duncan ao nível de 1 probabilidade As variedades de milho V2 e V1 apresentam maiores produções Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 97 Tabela Duncan Valores de amplitude mínima studentizada significante z a 5 de probabilidade n2 1 2 3 4 5 6 7 8 9 10 12 1 180 180 180 180 180 180 180 180 180 180 2 609 609 609 609 609 609 609 609 609 609 3 450 450 450 450 450 450 450 450 450 450 4 393 401 402 402 402 402 402 402 402 402 5 364 374 379 383 383 383 383 383 383 383 6 346 358 364 368 368 368 368 368 368 368 7 335 347 354 358 360 361 361 361 361 361 8 326 339 347 352 355 356 356 356 356 356 9 320 334 341 347 350 352 352 352 352 352 10 315 330 337 343 346 347 347 347 347 347 11 311 327 335 339 343 344 345 346 346 346 12 308 323 333 336 340 342 344 344 346 346 13 306 321 330 335 338 341 342 344 345 345 14 303 318 327 333 337 339 341 342 344 345 15 301 316 325 331 336 338 340 342 343 344 16 300 315 323 330 334 337 339 341 343 344 17 298 313 322 328 333 336 338 340 342 344 18 297 312 321 327 332 335 337 339 341 343 19 296 311 319 326 331 335 337 339 341 343 20 295 310 318 325 330 334 336 338 340 343 22 293 308 317 324 329 332 335 337 339 342 24 292 307 315 322 328 331 334 337 338 341 26 291 306 314 321 327 330 334 336 338 341 28 290 304 313 320 326 330 333 335 337 340 30 289 304 312 320 325 329 332 335 337 340 40 286 301 310 317 322 327 330 333 335 339 60 283 298 308 314 320 324 328 331 333 337 n1 nº de médias abrangidas pelo contraste e n2 nº de graus de liberdade do resíduo Tabela Duncan Valores de amplitude mínima studentizada significante z a 1 de probabilidade n2 1 2 3 4 5 6 7 8 9 10 12 1 9000 9000 9000 9000 9000 9000 9000 9000 9000 9000 2 1400 1400 1400 1400 1400 1400 1400 1400 1400 1400 3 826 850 860 870 880 890 890 900 900 900 4 651 680 690 700 710 710 720 720 730 730 5 570 596 611 618 626 633 640 644 650 660 6 524 551 565 573 581 588 595 600 600 610 7 495 522 537 545 553 561 569 573 580 580 8 474 500 514 523 532 540 547 551 550 560 9 460 486 499 508 517 525 532 536 540 550 10 448 473 488 496 506 513 520 524 528 536 11 439 463 477 486 494 501 506 512 515 524 12 432 455 468 476 484 492 496 502 507 513 13 426 448 462 469 474 484 488 494 498 504 14 421 442 455 463 470 478 483 487 491 496 15 417 437 450 458 464 472 477 481 484 490 16 413 434 445 454 460 467 472 476 479 484 17 410 430 441 450 456 463 468 472 475 480 18 407 427 438 446 453 459 464 468 471 476 19 405 424 435 443 450 456 461 464 467 472 20 402 422 433 440 447 453 458 461 465 469 22 399 417 428 436 442 448 453 457 460 465 24 396 414 424 433 439 444 449 453 457 462 26 393 411 421 430 436 441 446 450 453 458 28 391 408 418 428 434 439 443 447 451 456 30 389 406 416 422 432 436 441 445 448 454 40 382 399 410 417 424 430 434 437 441 446 60 376 392 403 412 417 423 427 431 434 439 n1 nº de médias abrangidas pelo contraste e n2 nº de graus de liberdade do resíduo Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 98 Resolução pelo R y1c35430628736229242835429235134816316213520319415814510421618 3215187158254252193232142217288 tratrepc16 each5 reprepc156 dbccbinddataframetratrepy1 tratasfactordbctrat repasfactordbcrep headdbc aovdbc aovy1 tratrep Armazenamento da ANOVA do TIPO I no objeto aovdbc anovaaovdbc Estatísticas descritivas por tratamento requirefields statsy1 bytrat Teste de Duncan versão nova pela library agricolae aplicado ao objeto da ANOVA libraryagricolae dfdfresidualaovdbc MSerrordevianceaovdbcdf dc1duncantesty1tratdfMSerror alpha001groupTconsoleTRUE dc1 y1 groups 2 3546 a 1 3202 a 6 2144 b 5 2132 b 3 1714 b 4 1612 b plotdc1 variationIQRlas1main duncantesty1tratdfMSerroralpha001consoleTgroupFP e ICdif dos contrastes de Duncan Teste de Duncan versão velha pela library laercio aplicado ao objeto da ANOVA requirelaercio dc2LDuncanaovdbc which trat conflevel 099 Independent Variable trat Factors Means 2 3546 a 1 3202 a 6 2144 b 5 2132 bc 3 1714 bc 4 1612 c Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 99 Capítulo 15 Lista de exercícios sobre testes de Tukey e Duncan Considere os exercícios contidos na lista de exercícios sobre DBCANOVA páginas 82 e 83 1 Para o exercício 1 a Aplique o teste de Tukey 5 b Aplique o teste de Duncan 5 2 Para o exercício 2 Aplique o teste de Tukey 1 e conclua sobre quais os tipos de alimentação são recomendados às ovelhas 3 Para os dados do exercício 3 5 a Aplique o teste de Tukey b Aplique o teste de Duncan Resolução ANOVA x3filechoose Escolha do diretório dbc3 readcsv2x3 Leitura dos dados da planilha strdbc3 headdbc3 Obtenção das seis primeiras linhas da planilha dbc3 tratasfactordbc3trat Conversão de tratamento em um fator repasfactordbc3rep Conversão de repetição em um fator aovdbc3aovdbc3y tratrep ANOVA contida no objeto aovdbc3 anovaaovdbc3 Obtenção da Tabela de ANOVA Teste de Tukey libraryagricolae dfdfresidualaovdbc3 MSerrordevianceaovdbc3df tk3dbcHSDtestdbc3ytratdfMSerrorconsoleTRUEalpha005 plottk3dbc las1main HSDtestdbc3ytratdfMSerrorconsoleTRUEgroupFalpha005ValoresP e ICdif Teste de Duncan dc3dbcduncantestdbc3ytratdfMSerrorconsoleTRUEalpha005 plotdc3dbc las1main duncantestdbc3ytratdfMSerrorconsoleTRUEgroupFalpha005ValoresP e ICdif 4 Em relação ao exercício 4 Qual tipo de pneu que proporciona o pior consumo Use o teste Duncan se necessário 5 Para o exercício 5 1 Aplique os testes de Tukey e Duncan se necessários e conclua 6 Em relação ao exercício 6 5 a Qualis os tipos de levedura que apresentam maior produção por meio do teste Tukey b Pelo teste Duncan qualis os tipos de levedura que apresentouaram menor produção Respostas 1a 1354 mt5 10700 a mt4 9200 b mt3 8700 b mt2 7200 c mt1 6700 c Médias seguidas por pelo menos uma mesma letra não diferem entre si pelo teste de Tukey com 5 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 100 1b D5 975 D4 961 D3 939 e D2 903 mt5 10700 mt4 9200 mt3 8700 mt2 7200 mt1 6700 Médias seguidas por pelo menos uma mesma barra não diferem entre si pelo teste de Duncan com 5 2 384 mTA3 4600 a mTA1 3157 b mTA2 3143 b mTA4 2157 c Pelo teste de Tukey com 1 ovelhas alimentadas com o TA3 produzem mais lã 3a 1312 mt5 15512 a mt1 14280 a b mt4 14001 b mt3 13874 b mt2 13802 b Pelo teste de Tukey com 5 os tratamentos t5 e t1 apresentam médias mais elevadas 3b D5 978 D4 969 D3 940 e D2 896 mt5 15512 mt1 14280 mt4 14001 mt3 13874 mt2 13802 Pelo teste de Duncan com 5 o tratamento t5 apresenta média mais elevada do que os demais 4 D4 175 D3 172 e D2 166 mt4 3300 mt3 3133 mt2 2933 mt1 2800 Pelo teste de Duncan com 5 o pneu que proporciona o pior consumo é o tipo 4 t4 5 Fcal 420 Ftab 541 AH0 Pelo teste F 1 as médias dos tratamentos não diferem entre si Não é necessária a aplicação dos testes de Tukey e de Duncan 6a 499 mt5 114 a mt2 88 a b mt4 60 b c mt3 55 b c mt1 30 c Pelo teste de Tukey com 5 as leveduras do tipo 5 e 2 apresentam maior produção de cerveja 6b D5 372 D4 368 D3 357 e D2 341 mt5 114 mt2 88 mt4 60 mt3 55 mt1 30 Pelo teste de Duncan com 5 as leveduras do tipo 1 3 e 4 apresentam menor produção de cerveja Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 101 Capítulo 16 Análise de regressão linear de 1º grau 161 Utilização Em situações que exista relação funcional entre uma variável dependente Yi e uma variável independente Xi com i 1 2 n Usada para predição da variável resposta ou dependente Yi a partir do estudo da variável regressora ou independente Xi 162 Contexto experimental O pesquisador dispõe de mais de um valor observado yi para um mesmo valor xi caracterizando o princípio básico da repetição A variável independente X será constituída por níveis quantitativos prédefinidos ex níveis dos tratamentos em DIC com um único fator Na ANOVA inicial podese obter a estimativa da variância residual QMRes que corresponde ao erro puro obtido a partir de um modelo estatístico e sob a regência dos princípios básicos da experimentação Na ANOVA da regressão é obtida a estimativa da variância residual QMRes INDEPENDENTE DA REGRESSÃO que representa a soma do erro puro com a falta de ajustamento do modelo de regressão aos dados de Y 163 Relação funcional entre X e Y A posição dos n pares de valores xi yi em um diagrama de dispersão determina a relação funcional A reta modelo de 1º grau pode não se ajustar perfeitamente aos valores observados de Y o Há na maior parte dos pontos uma distância entre os valores estimados pelo modelo e os valores observados no ensaio Relação funcional entre X e Y 0 5 10 15 20 25 2 3 4 5 6 7 8 X Y Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 102 O ponto x ȳ está sobre a reta estimada pois a média dos erros é nula Eεi 0 Se Eεi εin e εi 0 então Eεi 0 e Eyi b0 b1xi o O valor esperado ou médio de y é igual ao valor estimado 164 Objetivo da análise de regressão de 1º grau O ajuste de um modelo estatístico aos valores observados de Y em função dos níveis de X de modo que as distâncias sejam minimizadas e se permita a explicação biológica do fenômeno 165 Modelo linear de 1º grau Seja o modelo estatístico dado por yi b0 b1xi εi para i 1 2 n Para n pares de observações podese escrever as seguintes equações y1 b0 b1x1 ε1 y2 b0 b1x2 ε2 yn b0 b1xn εn 1651 Significado dos termos do modelo b0 Intercepto ou constante da regressão que corresponde ao valor de intercepto da reta com o eixo de ordenadas b1 Coeficiente de regressão linear ou inclinação da reta que indica o valor de tangente do ângulo que a reta faz com o eixo de abscissas εi Erros aleatórios ou distâncias entre valores observados e os respectivos valores estimados 1652 Pressuposições para ajuste do modelo linear A variância dos erros é igual a 2 Vεi 2 ou seja os erros em Y para todos os valores de X são homocedásticos O erro de uma observação é independente do erro em outra observação Cov εi εi 0 i i o Podemse utilizar as estatísticas t e F para testar hipóteses e para estabelecer intervalos de confiança sobre os parâmetros da regressão Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 103 o A independência dos erros pode ser garantida quando amostramos aleatoriamente de uma população infinita os n pares de valores xi yi Os erros devem seguir a distribuição normal de probabilidades 1653 Notação Os erros devem ser normais independentes e homocedásticos εi NID 0 2 166 Método dos mínimos quadrados ordinários MMQO Finalidade A obtenção das estimativas dos parâmetros β0 e β1 O MMQO consiste na estimação de parâmetros de uma equação de modo que as distâncias entre os valores observados e estimados pela equação no todo sejam os menores possíveis minimização da SQ dos erros 1661 Minimização da soma de quadrados dos erros Erros ordinários εi o Se yi b0 b1xi εi εi yi b0 b1xi o Assim ŷi b0 b1xi e εi yi ŷi 1662 Função soma de quadrados dos erros Z Se εi yi b0 b1xi então Z εi2 yi b0 b1xi2 1663 Ponto de mínimo da função Z As derivadas parciais de Z em relação a b0 e b1 devem ser nulas 1664 Aplicação da regra da cadeia fu fu u em que u yi b0 b1xi o Z b0 2yi b0 b1xi 1 o Z b1 2yi b0 b1xi xi 1665 Igualdade das derivadas parciais a zero 2 yi b0 b1xi 0 Equação de b0 2 yi b0 b1xi xi 0 Equação de b1 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 104 1666 Sistema de equações normais com solução única nb0 b1xi yi Equação de b0 b0xi b1xi2 xiyi Equação de b1 1667 Esquema prático para estimar b0 e b1 1º passo Aplicar a cada termo do modelo yi b0 b1xi o nb0 b1xi yi Equação de b0 2º passo Aplicar xi a cada termo do modelo yi b0 b1xi o b0xi b1xi2 xiyi Equação de b1 167 Análise de variância da regressão É a técnica que permite decompor a variação total entre as observações de Y em variações devido à equação de regressão e ao acaso Trat Reg Res Res Total Total 1671 Finalidade Verificar a significância do coeficiente de regressão linear ao nível de α de probabilidade pré definido ou seja se existe inclinação da reta com o eixo de abscissas Verificar a não significância da falta de ajustamento do modelo de regressão aos valores de Y indicando adequação do modelo 1672 Fórmulas práticas GLTot n 1 GLReg p 1 2 1 1 GLIR n p n 2 GLTrat I 1 GLFA I 2 GLTrat GLReg ou GLFA I p GLEP n I GLTot GLTrat ou GLEP n I J GLTot GLTrat GLBlo SQTot yi ȳ2 yi2 yi2n em que n nº de pares de observações xiyi e yi2n C correção para a média geral SQReg ŷi ȳ2 b0yi b1xiyi C SQIR yi ŷi2 SQTot SQReg A SQIR é a parte da variação que não é explicada pela regressão SQTrat Ti2J yij2IJ SQEP SQRes SQFA SQTrat SQReg Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 105 1673 Tabela de análise de variância da regressão de 1º grau Tabela 161 Graus de liberdade GL somas de quadrados SQ quadrados médios QM e estatística calculada F das fontes de variação de uma ANOVA da regressão linear de 1º grau realizada após a ANOVA principal de um experimento FV GL SQ QM Fcal Regressão 1 SQReg QMReg QMRegQMEP Falta Ajuste FA I 2 SQTrat SQReg QMFA QMFAQMEP Tratamento I 1 SQTrat Resíduo Erro puro EP GLEP SQRes SQEP QMEP Independente da regressão IR n 2 SQIR QMIR Total n 1 SQTot Ftab observar GLReg ou GLFA na coluna da tabela F e GLEP GLRes na linha da tabela F o Ftab Reg F GLReg GLEP e Ftab FA F GLFA GLEP Na análise de regressão de 1º grau o nº mínimo de níveis do fator quantitativo é três quantidade maior que dois o nº de parâmetros do modelo sob pena de não sobrarem GL para teste da FA Se a análise for feita pelos totais de tratamento a SQReg deve ser corrigida pela divisão pelo número de repetições Se a análise for feita pelas médias de tratamento a SQReg deve ser corrigida pela multiplicação pelo número de repetições Se a análise for feita pelas observações individuais de tratamento não se corrige a SQReg 1674 Hipóteses Para a equação de regressão o H0 1 0 O coeficiente de regressão linear populacional é nulo o Ha 1 0 O coeficiente de regressão linear populacional não é nulo Para a falta de ajustamento FA o H0 FA 0 A falta de ajustamento na população é nula o Ha FA 0 A falta de ajustamento na população não é nula Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 106 1675 Regra decisória e conclusão Para a equação de regressão o Fcal Reg Ftab Reg rejeitase H0 O coeficiente de regressão linear não é nulo ou existe inclinação da reta com o eixo de abscissas ao nível de α de significância o Fcal Reg Ftab Reg não se rejeita H0 O coeficiente de regressão linear é nulo ou não existe inclinação da reta com o eixo de abscissas ao nível de α de significância Para a falta de ajustamento FA o Fcal FA Ftab FA rejeitase H0 A FA é significativa ou o modelo de regressão não é adequado para explicar a variação em Y p α o Fcal FA Ftab FA não se rejeita H0 A FA não é significativa ou o modelo de regressão é adequado para explicar a variação em Y p α 1676 Qualidade de ajuste do modelo de 1º grau R2 SQRegSQTot 100 e R2 1 SQIRSQTot 100 ou R2 SQRegSQTrat 100 O R2 mede o quanto da variação em Y pode ser explicado pela equação de regressão Seu valor varia de 0 a 1 Quanto mais próximo de 1 o valor de R2 melhor a aderência do modelo aos valores observados de Y ou seja a soma das distâncias entre os valores observados e estimados será menor Baixos valores de R2 indicam a necessidade de explicar melhor a variação em Y por o Aumento do grau do polinômio no modelo ajustado o Inclusão de outras regressoras no modelo ajustado o Ajuste com outros modelos de regressão 1677 Critérios para escolha da equação linear de 1º grau aos dados de Y A significância de b1 pelo teste F na ANOVA da regressão Nãosignificância da FA do modelo de regressão na ANOVA da regressão Valores de R2 Significado biológico do fenômeno estudado Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 107 Exemplo 161 Seja um experimento instalado em DIC com o objetivo de verificar o efeito de temperatura de estocagem na altura de albume AA de ovos de poedeiras comerciais com 56 semanas de idade da linhagem X Utilizaramse 180 ovos com cinco tratamentos 10 12 14 16 e 18ºC seis repetições e seis ovos por UE recipiente com seis ovos Os ovos foram selecionados pelo seu peso inicial que variou entre 55 e 60g O experimento foi realizado em cinco refrigeradores durante 14 dias No 14º dia a AA foi mensurada em três ovos sendo o valor médio apresentado na Tabela 162 Tabela 162 Valores observados de altura de albume mm por tratamento Temperatura Repetição Total 1 2 3 4 5 6 10 66 72 68 69 74 78 427 12 64 66 65 67 66 61 389 14 60 57 56 56 58 55 342 16 53 49 47 48 51 50 298 18 38 39 40 36 38 37 228 Perguntase a Verifique se há efeito de temperatura de refrigeração na AA 005 b Estime a equação de regressão de 1º grau para predizer a AA em função dos níveis de temperatura a partir dos valores médios de temperatura c Faça a ANOVA da regressão todas as observações teste as H0 equação e FA e conclua 005 Resolução a ANOVA em DIC GLTot n 1 30 1 29 GLTrat I 1 5 1 4 GLRes I J 1 5 6 1 25 SQTot yi2 yi2n 98736 1684230 98736 94529 4207 SQTrat Y12 Y22 Y32 Y42 Y526 Y230 4272 3892 3422 2982 22826 1684230 98567 94529 4038 SQRes ou SQEP SQTot SQTrat 4207 4038 169 QMTrat SQTratGLTrat 40384 100950 QMRes SQResGLRes 16925 00676 1º Passo H0 mt1 mt2 mt3 mt4 mt5 e Ha Não H0 2º Passo Teste F 005 3º Passo Ftab FGL Trat GL Res F0054 25 276 4º Passo Fcal QMTrat QMRes 1009500676 14933 5º Passo Fcal Ftab RH0 6º Passo Pelo teste F 005 existe pelo menos um contraste entre médias de tratamento que é diferente de zero Há efeito de temperatura de refrigeração na AA Tabela de análise de variância FV GL SQ QM Fcal Tratamentos 4 4038 100950 14933 Resíduo ou erro puro 25 169 00676 Total 29 4207 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 108 b Estimativa dos parâmetros da equação de 1º grau Modelo ȳi b0 b1 ix iε Sistema de equações normais nb0 ix b1 ȳi ix b0 ix 2b1 ix ȳi Pares de valores médios de X e Y ix 10 12 14 16 e 18 ȳi 712 648 570 497 e 380 n 5 ix 10 18 70 ix 2 102 182 1020 ȳi 712 380 2807 ix ȳi 10 712 18 380 37668 Sistema de equações normais A 5b0 70b1 2807 B 70b0 1020b1 37668 A e B A 5b0 70b1 2807 14 sendo x 14 B 70b0 1020b1 37668 A 70b0 980b1 39298 B A 40b1 1630 b1 04075 sendo SQDX 40 e SPDXY 1630 Substituindo b1 em A 5b0 70 04075 2807 5b0 2807 28525 b0 565955 11319 ou b0 ȳ b1x 5614 04075 14 5614 5705 11319 Então iyˆ 11319 04075 ix OBS À medida que se aumenta X em uma unidade o valor médio de Y reduz em 04075 unidade Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 109 c ANOVA da regressão GLTot n 1 301 29 GLRC p1 2 1 1 GLFA I2 5 2 3 GLIR np 30 2 28 SQTot yi2 yi2n 98736 1684230 98736 94529 4207 SQRes ou SQEP SQTot SQTrat SQBlo 4207 4038 169 SQReg b0ȳi b1x iȳi ȳi2n 11319 2807 04075 37668 280725 3177243 1534971 15758498 664222 SQRC 664222 6 3985332 SQFA SQTrat SQRC 4038 3985332 052668 SQIR SQTot SQRC 4207 3985332 221668 QMRC SQRCGLRC 39853221 3985322 QMFA SQFAGLFA 0526683 017556 QMIR SQIRGLIR 22166828 0079167 Teste da equação da reta 1º Passo H0 1 0 e Ha 1 0 2º Passo Teste F 005 3º Passo Ftab FGL Reg GL Res F005125 424 4º Passo Fcal QMRCQMRes 398533200676 58955 5º Passo Fcal RC Ftab RC RH0 6º Passo Pelo teste F 005 o coeficiente de regressão linear não é nulo ou existe inclinação da reta com o eixo de abscissas Teste da falta de ajustamento da equação da reta 1º Passo H0 FA 0 e Ha FA 0 2º Passo Teste F 005 3º Passo Ftab FGL FA GL Res F0053 25 299 4º Passo Fcal QMFA QMRES 01755600676 25970 5º Passo Fcal FA Ftab FA AH0 6º Passo Pelo teste F 005 a FA do modelo não é significativa ou o modelo de regressão é adequado para explicar a variação em Y Tabela de análise de variância da regressão de 1º grau FV GL SQ QM Fcal RC p 1 1 3985332 3985332 58955 FA I 2 3 052668 017556 25970ns Tratamento 4 4038 10095 14933 Resíduo ou erro puro nI 25 169 00676 IR n p 28 221668 0079167 Total n 1 29 4207 Qualidade de ajuste do modelo de regressão aos dados de Y R2 SQRC SQTrat 100 3985332 4038 100 9870 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 110 Resolução pelo R a ANOVA Yc6672686974786466656766616575656585553494748515383943 63837 tratrepc1012141618 each6 reprepc165 diccbinddataframetratrepY tratasfactordictrat repasfactordicrep headdic aov1 anovaaovY trat Armazenamento da ANOVA do TIPO I no objeto aov1 aov1 Analysis of Variance Table Response Y Df Sum Sq Mean Sq F value PrF trat 4 40385 100962 14935 22e16 Residuals 25 1690 00676 Obtenção dos valores médios de Y por tratamento requirefields statsY bytrat Estatísticas descritivas por tratamento 10 12 14 16 18 N 60000000 60000000 60000000 60000000 60000000 mean 71166667 64833333 57000000 49666667 38000000 StdDev 04400758 02136976 01788854 02160247 01414214 b Ajuste do modelo linear de 1º grau de Y AA em função dos dados médios dos tratamentos tratmed tratmedc1012141618 Ymedc71166667 64833333 57000000 49666667 38000000 lm1summarylmYmedtratmed lm1 Coefficients Estimate Std Error t value Prt Intercept 1131833 038794 2918 884e05 tratmed 040750 002716 1500 0000643 Residual standard error 01718 on 3 degrees of freedom Multiple Rsquared 09868 Adjusted Rsquared 09825 Fstatistic 2251 on 1 and 3 DF pvalue 00006427 OBS1 A equação de regressão é iyˆ 11319 04075 ix OBS2 Os valores de Std Error tcal t value e Prt estão equivocados OBS3 Correção de tcal e pvalor para b0 e b1 se a regressão foi ajustada pelas médias dos tratamentos tcalcortcal da análise x QMINDREGQMRESJ05 em que J nº de repetições pvalcorb02pttcalcorb0 GLRES lowertailF pvalcorb0 pvalcorb12pttcalcorb1 GLRES lowertailT pvalcorb1 OBS4 O modelo é significativo e explica 9868 R2 da variação de Y Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 111 Gráfico do modelo ajustado plottratmedYmed ablinelm1 c ANOVA da regressão todas as observações teste das H0 equação e FA e conclusões 005 tratasnumerictrat lm2lmYtrat avreg1anovalm2 avreg1 Analysis of Variance Table Response Y Df Sum Sq Mean Sq F value PrF trat 1 39853 39853 50239 22e16 Residuals 28 2221 0079 OBS ANOVA da regressão quando se executa em um programa O teste F para tratamento está equivocado pois o F calculado foi obtido com o QMIR no denominador Obtenção da ordem dos tratamentos aov1aaovY orderedtrat saov1asummaryaov1a coefaov1a Intercept orderedtratL orderedtratQ orderedtratC orderedtrat4 561333333 257725629 027171560 008959787 008167395 Anova da regressão com desdobramento dos GL de tratamento e teste da equação e da falta de ajuste avreg2summaryaov1asplitlistorderedtratlisttratL1tratFAc24 avreg2 Df Sum Sq Mean Sq F value PrF orderedtrat 4 4038 1010 149352 2e16 orderedtrat tratL 1 3985 3985 589549 2e16 orderedtrat tratFA 3 053 018 2619 00731 Residuals 25 169 007 OBS1 A ANOVA da regressão agora está correta pois os testes F para regressão e falta de ajustamento estão com o QMRES no denominador Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 112 Capítulo 16 Lista de exercícios sobre análise de regressão linear de 1º grau 1 Considere o banco de dados a seguir e responda ao que se pede Tratamento Repetição Y 0 1 226 0 2 224 0 3 210 0 4 214 05 1 285 05 2 286 05 3 286 05 4 279 1 1 368 1 2 364 1 3 366 1 4 360 15 1 456 15 2 445 15 3 452 15 4 451 2 1 552 2 2 546 2 3 541 2 4 543 25 1 592 25 2 584 25 3 583 25 4 577 3 1 664 3 2 681 3 3 658 3 4 667 Dados Ensaio em DBC Tratamento fator quantitativo Y variável dependente a Verifique se há efeito dos tratamentos sobre Y ou seja faça o quadro de ANOVA inicial teste a hipótese de nulidade e conclua para α 5 Calcule também o CV do experimento b Use o MMQO e ajuste o modelo linear de 1º grau estimativa dos parâmetros aos dados de Y em função dos níveis quantitativos dos tratamentos utilizando todas as observações do banco de dados c Faça o quadro de ANOVA da regressão teste as hipóteses de nulidade e conclua para α 5 d Estime a qualidade de ajuste R2 do modelo aos dados de Y Obs Explicite todos os cálculos necessários Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 113 Resolução a ANOVA em DBC Yc22622421214285286286279368364366364564454524515525465415435 92584583577664681658667 tratrepc0051152253 each4 reprepc147 dbccbinddataframetratrepY tratasfactordbctrat repasfactordbcrep headdbc aov0 anovaaovY tratrep Armazenamento da ANOVA do TIPO I no objeto aov0 aov0 Analysis of Variance Table Response Y Df Sum Sq Mean Sq F value PrF trat 6 65067 108445 3904008 2e16 rep 3 28 093 3336 00427 Residuals 18 50 028 b Ajuste do modelo linear de 1º grau de Y em função de trat considerando todas as observações tratasnumerictrat lm1lmYtrat slm1summarylm1 slm1 Coefficients Estimate Std Error t value Prt Intercept 141000 05580 2527 2e16 trat 76000 01248 6091 2e16 Residual standard error 1321 on 26 degrees of freedom Multiple Rsquared 0993 Adjusted Rsquared 09928 Fstatistic 3710 on 1 and 26 DF pvalue 22e16 OBS1 A equação de regressão é y 1410 760x OBS2 Os valores de Std Error tcal t value e Prt estão equivocados OBS3 Correção de tcal e pvalor para b0 e b1 se a regressão foi ajustada por todas as observações tcalcortcal da análise x QMINDREGQMRES05 em que J nº de repetições pvalcorb02pttcalcorb0 GLRES lowertailF pvalcorb0 pvalcorb12pttcalcorb1 GLRES lowertailT pvalcorb1 OBS4 O modelo de 1º grau é significativo e explica 9930 R2 da variação dos dados de Y R2 6469165145 100 9930 Gráfico do modelo ajustado plottratY ablinelm1 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 114 c ANOVA da regressão teste das H0 equação e FA e conclusões 005 avr1anovalm1 ou avr1summaryaovYtrat avr1 Analysis of Variance Table Response Y Df Sum Sq Mean Sq F value PrF trat 1 64691 64691 37097 22e16 Residuals 26 453 17 OBS ANOVA da regressão quando se executa em um programa estatístico O teste F para tratamento está equivocado pois o F calculado foi obtido com o QMIR no denominador Obtenção da ordem dos tratamentos m2aovY orderedtratrep coefm2 Intercept orderedtratL orderedtratQ orderedtratC orderedtrat4 449000000 402154199 11347330 13063945 15955295 orderedtrat5 orderedtrat6 rep2 rep3 rep4 16802778 10132456 01857143 06714286 07428571 Anova da regressão com desdobramento dos GL de tratamento e teste da equação e da falta de ajuste avr2summarym2splitlistorderedtratlisttratL1tratFAc26 avr2 Df Sum Sq Mean Sq F value PrF orderedtrat 6 6507 1084 3904008 2e16 orderedtrat tratL 1 6469 6469 23288832 2e16 orderedtrat tratFA 5 38 8 27043 889e08 rep 3 3 1 3336 00427 Residuals 18 5 0 Ajuste do modelo de 2º grau tratasnumerictrat lm2lmYtratItrat2 slm2summarylm2 slm2 Coefficients Estimate Std Error t value Prt Intercept 1261429 098794 1277 188e12 trat 859048 056618 1517 405e14 Itrat2 012381 006917 179 00856 Residual standard error 1268 on 25 degrees of freedom Multiple Rsquared 09938 Adjusted Rsquared 09933 Fstatistic 2014 on 2 and 25 DF pvalue 22e16 Anova da regressão avr2anovalm2 avr2 Analysis of Variance Table Response Y Df Sum Sq Mean Sq F value PrF trat 1 64691 64691 40241333 2e16 Itrat2 1 52 52 32039 008559 Residuals 25 402 16 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 115 OBS Fazer correções do tcal e pvalor para b0 b1 e b2 Correção para b2 tcalcor coefslm29sqrtavr233aov033 tcalcor 1 4306009 pvalcor2pttcalcor aov031lowertailT pvalcor 1 00004253924 2 Sejam os dados a seguir referentes aos valores médios do exemplo anterior X 0 05 1 15 2 25 3 Y 2185 2840 3645 4510 5455 5840 6675 a Ajuste o modelo linear de 1 grau obter a equação de regressão estimada a esses dados a partir do sistema de equações normais b O modelo de regressão foi o mesmo ou não em relação à questão 1 Explique c Qual o significado do coeficiente de regressão b1 aplicado ao exemplo em questão d Faça a análise de variância da regressão e conclua 5 sobre a significância da equação de regressão e sobre a nãosignificância da falta de ajustamento e Estime o coeficiente de determinação R2 Este valor foi o mesmo ou não em relação ao apresentado na questão 1 Explique f Se fosse ajustado o modelo linear de 2º grau modelo quadrático aos dados acima quantos graus de liberdade seriam atribuídos à regressão g Use um software estatístico e faça o gráfico da função incluindo os valores médios observados 3 Ainda em relação aos dados da questão número 1 faça o que se pede a Apresente os pares de valores totais x y b Ajuste o modelo linear de 1 grau aos totais de Y Esse modelo é o mesmo dos anteriores ou não c Verifique teste F 5 a significância de b1 e a nãosignificância da falta de ajustamento d Use um software estatístico e faça o gráfico da função com inclusão dos valores totais observados Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 116 4 Seja outro experimento instalado em DIC com quatro tratamentos ou níveis de temperatura de armazenamento ºC e quatro repetições A variável resposta avaliada foi a altura da gema AG mm mensurada após duas semanas de armazenamento Tabela 163 Admitindose que há efeito dos tratamentos sobre a AG 005 responda ao que se pede Tabela 163 Valores observados de altura de gema mm de acordo com os tratamentos e repetições Tratamentos Repetições Totais 1 2 3 4 10 75 70 68 80 293 12 72 70 66 64 272 14 62 64 60 58 244 18 55 50 55 50 210 a Apresente os pares de valores médios x y b Apresente os pares de valores totais x y c Ajuste o modelo linear de 1 grau aos dados médios a partir do sistema de equações normais d Ajuste o modelo linear de 1 grau aos dados totais a partir do sistema de equações normais e Faça a análise de variância da regressão e conclua 5 para as hipóteses de nulidade relacionadas à existência da equação de regressão e à falta de ajustamento Respostas Em sala Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 117 Capítulo 17 Bibliografia consultada BANZATTO DA KRONKA SN Experimentação agrícola 4ª ed Jaboticabal FUNEP 2006 237p BUSSAB WO MORETTIN PA Estatística Básica 7ª ed São Paulo Saraiva 2012 540p DETMANN E Estatística e Experimentação Agropecuária Campos dos Goytacazes RJ LEAG CCTAUENF 2004 169p Apostila TécnicaDidática FERREIRA DF Sisvar A computer statistical analysis sistem Ciência e Agrotecnologia v35 n6 p10391042 2011 PIMENTELGOMES F Curso de estatística experimental 15ª ed Piracicaba FEALQ 2022 451p HARTER HL Critical Values for Duncans New Multiple Range Test Biometrics v16 n4 p671 685 1960 R Core Team 2023 R A language and environment for statistical computing R Foundation for Statistical Computing Vienna Austria ISBN 3900051070 Disponível em httpwwwR projectorg Acesso em 02022024 SAMPAIO IBM Estatística aplicada à Experimentação Animal 3ª ed Belo Horizonte FEPMVZ 2007 264p RAÇA MANGALARGA MARCHADOR POTRO Y1 Y2 Y3 Y4 Y5 Y6 Y7 Y8 1 1222 1183 601 150 1203 270 250 951 2 1266 1397 783 169 1331 280 298 994 3 1249 1405 672 249 1215 310 281 998 4 1340 1347 627 161 1243 369 298 1042 5 1341 1275 631 269 1210 355 265 969 6 1396 1295 710 169 1363 336 289 1032 7 1372 1287 791 232 1344 360 319 981 8 1236 1282 725 227 1258 333 333 1005 9 1363 1359 711 255 1373 372 351 971 10 1228 1363 735 164 1292 366 277 962 11 1333 1329 782 163 1340 348 1058 12 1224 1184 788 255 352 974 13 1303 1354 714 320 1058 14 1330 1316 311 15 1265 Y1 ALTURA DE CERNELHA cm Y2 ALTURA DE GARUPA cm Y3 COMPRIMENTO DO CORPO cm Y4 PERÍMETRO DE CANELA cm Y5 PERÍMETRO TORÁCICO cm Y6 COMPRIMENTO DA CABEÇA cm Y7 PERÍMETRO DO JOELHO cm Y8 ÂNGULO FÊMURTIBIAL RAÇA CAMPOLINA POTRO Y9 Y10 Y11 Y12 Y13 Y14 Y15 Y16 1 1432 1452 1392 150 1705 351 210 961 2 1447 1562 1473 169 1970 457 220 1040 3 1503 1548 1433 249 1788 459 218 1068 4 1440 1528 1405 161 1947 467 250 1023 5 1464 1578 1392 269 1911 393 280 1055 6 1490 1553 1392 169 1898 433 280 1001 7 1531 1454 1436 232 1809 437 230 1005 8 1455 1454 1447 227 1916 479 219 1005 9 1475 1504 1426 255 1965 493 282 1036 10 1442 1552 1475 164 1710 405 290 1061 11 1494 1523 1445 163 1811 353 217 1042 12 1436 1457 1394 255 1723 486 281 13 1450 1485 170 1941 452 14 1410 220 1930 15 244 Y9 ALTURA DE CERNELHA cm Y10 ALTURA DE GARUPA cm Y11 COMPRIMENTO DO CORPO cm Y12 PERÍMETRO DE CANELA cm Y13 PERÍMETRO TORÁCICO cm Y14 COMPRIMENTO DA CABEÇA cm Y15 PERÍMETRO DO JOELHO cm Y16 ÂNGULO FÊMURTIBIAL RAÇA ÁRABE POTRO Y17 Y18 Y19 Y20 Y21 Y22 Y23 Y24 1 1502 1482 1613 220 1341 320 210 921 2 1544 1597 1618 238 1357 364 225 953 3 1542 1530 1682 246 1403 326 222 984 4 1523 1594 1662 229 1383 354 269 971 5 1549 1609 1771 228 1381 341 316 938 6 1534 1494 1721 260 1378 332 315 951 7 1550 1527 1703 234 1428 338 240 1000 8 1559 1595 1712 221 1341 328 223 981 9 1590 1614 1686 236 1416 347 318 974 10 1579 1505 1734 252 1411 376 329 974 11 1550 1557 1687 223 1392 322 220 12 1506 1488 1623 255 1343 316 13 1538 256 297 14 1591 284 15 1555 Y17 ALTURA DE CERNELHA cm Y18 ALTURA DE GARUPA cm Y19 COMPRIMENTO DO CORPO cm Y20 PERÍMETRO DE CANELA cm Y21 PERÍMETRO TORÁCICO cm Y22 COMPRIMENTO DA CABEÇA cm Y23 PERÍMETRO DO JOELHO cm Y24 ÂNGULO FÊMURTIBIAL Obs1 Para obtenção do valor tabelado correto para o teste de médias utilize a informação contida na Tabela 31 Página 9 do Guia de aulas Obs2 Para obtenção do valor tabelado correto para o teste de variâncias utilize a informação contida na Tabela A Página 13 do Guia de aulas Obs3 Apresente todos os cálculos necessários para execução das cinco perguntas Utilize o protocolo de aplicação dos testes para facilitar a organização das respostas Obs4 Cada grupo será constituído por no máximo três 3a alunoas Obs5 Cada grupo deverá responder a cinco perguntas a b c d1 d2 que estão discriminadas acima Não pode haver escolha da mesma pergunta para dois ou mais grupos Obs4 A entrega do trabalho deve ocorrer IMPRETERIVELMENTE no período matutino da 6ª feira dia 22032024 ANTECENDENDO A AVALIAÇÃO AV1 Não será considerada a entrega do trabalho em data e horário posterior à realização da AV1
2
Estatística 2
UNIOESTE
12
Estatística 2
UNIOESTE
2
Estatística 2
UFAL
4
Estatística 2
UFRPE
2
Estatística 2
UFAL
2
Estatística 2
UFAL
Texto de pré-visualização
c Verifique se a correlação apresente as hipóteses o valor tabelado o valor calculado a regra decisória e a conclusão do teste é significativa ou não a 005 para as seguintes variáveis Altura de garupa e perímetro torácico de potros MM Y10 x Y13 Grupo 1 Comprimento de cabeça e ângulo fêmurtibial de potros C Y14 x Y16 Grupo 2 Altura de cernelha e comprimento do corpo de potros C Y9 x Y11 Grupo 3 Perímetro de canela e perímetro do joelho de potros MM Y1 x Y2 Grupo 4 Altura de garupa e perímetro torácico de potros MM Y2 x Y5 Grupo 5 Comprimento de cabeça e ângulo fêmurtibial de potros MM Y6 x Y8 Grupo 6 Altura de cernelha e comprimento do corpo de potros MM Y1 x Y3 Grupo 7 Altura de cernelha e comprimento do corpo de potros A Y17 x Y19 Grupo 8 Comprimento de cabeça e ângulo fêmurtibial de potros A Y22 x Y24 Grupo 9 Altura de garupa e perímetro torácico de potros A Y18 x Y21 Grupo 10 Perímetro de canela e perímetro do joelho de potros A Y20 x Y23 Grupo 11 Comprimento de corpo e perímetro do joelho de potros MM Y3 x Y7 Grupo 12 Comprimento de corpo e perímetro do joelho de potros C Y11 x Y15 Grupo 13 Comprimento de corpo e perímetro do joelho de potros A Y19 x Y23 Grupo 14 Perímetro de canela e comprimento de cabeça de potros C Y12 x Y14 Grupo 15 Perímetro de canela e comprimento de cabeça de potros A Y20 x Y22 Grupo 16 Altura de garupa e perímetro torácico de potros C Y10 x Y13 Grupo 17 d Considere os dados apresentados na Tabela 1 referentes ao tamanho amostral para o teste de médias n1 ao tamanho amostral para o teste de variâncias n2 aos valores de média amostral MA média populacional MP desviopadrão amostral DPA desviopadrão populacional DPP ao tipo de hipótese alternativa Ha e à magnitude do nível de significância NS Tabela 1 Estatísticas descritivas de acordo com o grupo Grupo n1 n2 MA X MP μx DPA sx DPP sx Ha teste de médias Ha teste de variâncias NS 1 64 6 70 67 20 15 UD UD 005 2 49 7 65 64 26 20 BIL UD 001 3 36 8 54 51 30 25 UD UD 005 4 25 9 43 42 45 30 BIL UD 001 5 16 10 31 29 32 15 UD UD 005 6 9 6 25 27 33 20 BIL UD 001 7 64 7 16 17 41 25 UE UD 005 8 49 8 10 13 38 30 BIL UD 001 9 36 9 7 85 25 15 UE UD 005 10 25 10 45 55 29 20 BIL UD 001 11 16 6 2 15 31 25 UD UD 005 12 9 7 15 12 40 30 BIL UD 001 13 64 8 07 04 22 15 UD UD 005 14 49 9 45 48 38 20 BIL UD 001 15 36 10 59 615 35 25 UE UD 005 16 25 10 67 685 36 30 BIL U D 001 17 16 9 74 77 46 35 BIL UD 005 H0 bilateral BIL H1 unilateral à direita UD H1 unilateral à esquerda UE Perguntase d1 Aplique um teste adequado e confronte a média amostral com a respectiva média populacional utilizando os seis passos do protocolo proposto em sala de aula d2 Aplique um teste adequado e confronte a variância amostral com a respectiva variância populacional utilizando os seis passos do protocolo proposto em sala de aula Universidade Estadual do Oeste do Paraná Campus de Marechal Cândido Rondon Centro de Ciências Agrárias Curso de Zootecnia Disciplina Estatística Experimental Teste 2 semestre de 2023 Professor Newton Tavares Escocard de Oliveira LEIA ATENTAMENTE AS PERGUNTAS E AS OBSERVAÇÕES CONTIDAS NO FINAL DO TEXTO ANTES DA RESOLUÇÃO 1 Considere os três bancos de dados para potros das raças Mangalarga Marchador MM Campolina C e Árabe A de oito variáveis Y1 a Y8 Y9 a Y16 e Y17 a Y24 dados em anexo a Para a 005 e hipótese alternativa bilateral aplique o teste adequado apresente as hipóteses o valor tabelado o valor calculado a regra decisória e a conclusão do teste para confrontar médias entre Amostras de alturas de cernelha das raças MM x C Y1 x Y9 Grupo 1 Amostras de alturas de cernelha das raças C x A Y9 x Y17 Grupo 2 Amostras de alturas de garupa das raças MM x A Y2 x Y18 Grupo 3 Amostras de alturas de garupa das raças C x AY10 x Y18 Grupo 4 Amostras de comprimentos de corpo das raças MM x A Y3 x Y19 Grupo 5 Amostras de comprimentos de corpo das raças MM x C Y3 x Y11 Grupo 6 Amostras de perímetros de canela das raças MM x C Y4 x Y12 Grupo 7 Amostras de perímetros de canela das raças C x A Y12 x Y20 Grupo 8 Amostras de perímetros torácicos das raças MM x A Y5 x Y21 Grupo 9 Amostras de perímetros torácicos das raças C x A Y13 x Y21 Grupo 10 Amostras de comprimentos da cabeça das raças MM x A Y6 x Y22 Grupo 11 Amostras de comprimentos da cabeça das raças MM x C Y6 x Y14 Grupo 12 Amostras de perímetros do joelho das raças MM x C Y7 x Y15 Grupo 13 Amostras de perímetros do joelho das raças MM x A Y7 x Y23 Grupo 14 Amostras de ângulos fêmurtibial das raças C x A Y16 x Y24 Grupo 15 Amostras de ângulos fêmurtibial das raças MM x A Y8 x Y24 Grupo 16 Amostras de ângulos fêmurtibial das raças MM x C Y8 x Y16 Grupo 17 b Para a 005 e hipótese alternativa bilateral aplique o teste adequado apresente as hipóteses o valor tabelado o valor calculado a regra decisória e a conclusão do teste para confrontar médias entre Amostras de comprimento da cabeça e perímetro de joelho para potros A Y22 x Y23 Grupo 1 Amostras de perímetro de canela e perímetro de joelho para potros A Y20 x Y23 Grupo 2 Amostras de comprimento do corpo e perímetro torácico para potros A Y19 x Y21 Grupo 3 Amostras de altura de cernelha e altura de garupa para potros A Y17 x Y18 Grupo 4 Amostras de comprimento do corpo e perímetro torácico para potros C Y11 x Y13 Grupo 5 Amostras de perímetro de canela e perímetro de joelho para potros C Y12 x Y15 Grupo 6 Amostras de altura de cernelha e altura de garupa para potros C Y9 x Y10 Grupo 7 Amostras de perímetro torácico e ângulo fêmurtibial para potros MM Y5 x Y8 Grupo 8 Amostras de comprimento da cabeça e perímetro do joelho para potros MM Y6 x Y7 Grupo 9 Amostras de perímetro de canela e perímetro de joelho para potros MM Y4 x Y7 Grupo 10 Amostras de altura de cernelha e altura de garupa para potros MM Y1 x Y2 Grupo 11 Amostras de comprimento de corpo e comprimento de cabeça para potros MM Y3 x Y6 Grupo 12 Amostras de comprimento de cabeça e ângulo fêmurtibial para potros C Y14 x Y16 Grupo 13 Amostras de comprimento de corpo e ângulo fêmurtibial para potros C Y11 x Y16 Grupo 14 Amostras de perímetro torácico e ângulo fêmurtibial para potros A Y21 x Y24 Grupo 15 Amostras de altura de garupa e comprimento de corpo para potros A Y18 x Y19 Grupo 16 Amostras de altura de garupa e perímetro de canela para potros C Y10 x Y12 Grupo 17 UNIVERSIDADE ESTADUAL DO OESTE DO PARANÁ CAMPUS DE MARECHAL CÂNDIDO RONDON CENTRO DE CIÊNCIAS AGRÁRIAS Guia de aulas de Estatística Experimental Material de Apoio Marechal Cândido Rondon Paraná Fevereiro2024 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA Nota de esclarecimento Este roteiro de aulas foi elaborado com o intuito de ofertar conteúdos específicos para atender as demandas de ensino vinculadas à disciplina Estatística Experimental inclusa na grade curricular do curso de Graduação em Zootecnia da Unioeste Campus de Marechal Cândido Rondon PR Neste material foi buscado informar aos discentes da segunda série do curso de Graduação em Zootecnia a teoria e exemplos aplicados ao conjunto de conteúdos principalmente em relação aos tópicos testes de hipóteses princípios básicos da experimentação delineamentos experimentais testes de comparações múltiplas de médias de tratamentos e análise de regressão linear Os objetivos foram de proporcionar aos graduandos o entendimento da estatística como ferramenta para a tomada de decisões para que sejam capazes de entender as ideias teóricas e interpretar de modo coerente os resultados de experimentos zootécnicos No capítulo 1 venho destacar o vínculo entre estatística e método científico em que foi realçada a importância e o entendimento da contribuição estatística nas hipóteses relacionadas às pesquisas No capítulo 2 foi abordada a teoria dos testes de hipóteses TH com conceitos relacionados às hipóteses estatísticas distribuições regiões de aceitação e rejeição da hipótese de nulidade erros associados à aplicação de teste de hipótese além da proposição de um protocolo de aplicação padrão para qualquer TH Do 3º ao 7º capítulo foi realizada uma abordagem de testes de hipóteses aplicados a planos amostrais utilizados na área zootécnica com ênfase na aplicação do teste Z para uma amostra do teste F para comparar as variâncias de duas amostras independentes e na aplicação do teste t de student para amostras independentes e pareadas e na análise de significância do coeficiente de correlação populacional entre duas variáveis contínuas No capítulo 8 o uso da estatística t foi explicada e aplicada no contexto da estimação intervalar do parâmetro média e para dimensionamento do número de indivíduos em pesquisas por amostragem No capítulo 9 foi abordada a aplicabilidade da análise de independência de quiquadrado para dados expressos por frequência que têm grande utilidade para os imensos bancos de dados de empresas zootécnicas privadas Do 10º ao 12º capítulo foram realizadas considerações importantes sobre os princípios básicos da experimentação Em razão de que muitas pesquisas têm apresentado baixa precisão nos resultados devido a equívocos no planejamento experimental foi dado ênfase ao impacto do número de repetições na precisão e na sensibilidade dos testes a casualização dos tratamentos às parcelas para a validade dos resultados e ao controle de fontes sistemáticas de variação para maior controle da variância residual Na abordagem dos delineamentos experimentais frequentemente utilizados em Zootecnia foi dado Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA embasamento na aplicabilidade do teste F da análise de variância principalmente em relação às pressuposições para sua utilização Nos capítulos 13 e 14 foi realizada uma abordagem sobre peculiaridades dos testes de Tukey e de Duncan utilizados frequentemente após a análise de variância no contexto de comparação entre médias observadas dos tratamentos Foi tratado a respeito do rigor desses testes de comparações múltiplas e das condições individuais para uso com base no controle dos erros do tipo I e II E no capítulo 15 foram discutidas informações sobre o ajuste do modelo de regressão linear de 1º grau aos dados de uma variável dependente com ênfase no entendimento do método dos mínimos quadrados ordinários para estimação dos parâmetros do modelo dos testes realizados na análise de variância da regressão e no índice de avaliação da eficiência do modelo como o coeficiente de determinação para indicar a qualidade de ajuste Antecipadamente peço desculpas por possíveis erros ortográficos gramaticais e de digitação que possam ter ocorrido Encaminhamentos para o aperfeiçoamento deste material com críticas construtivas e sugestões oportunas serão bemvindas A ideia principal é deixar o presente material com identidade própria alinhado às atividades que vem sendo desenvolvidas no Centro de Ciências Agrárias da Unioeste e na região oeste do estado do Paraná Marechal Cândido Rondon 02 de fevereiro de 2024 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA Conteúdo Capítulo Página R e RStudio 1 1 Estatística e metodologia científica 2 2 Testes de hipóteses 4 3 Teste Z para uma amostra 8 4 Teste de variância para uma amostra proveniente da distribuição normal 13 5 Teste F para comparação de variâncias de duas amostras independentes 19 6 Teste t para duas amostras independentes 25 7 Teste t para dados emparelhados 33 8 Análise de correlação linear 37 9 Intervalo de confiança para a média populacional 44 10 Teste de aderência de quiquadrado 2 54 11 Teste de independência de quiquadrado 2 64 12 Conceitos e princípios básicos da experimentação 69 13 Delineamento inteiramente casualizado DIC 71 14 Delineamento em blocos casualizados completos DBC 81 15 Testes de comparações múltiplas TCM 89 16 Análise de regressão linear de 1º grau 101 17 Bibliografia consultada 117 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 1 R e RStudio TUTORIAL PARA INSTALAÇÃO DO R a wwwrprojectorg b CRAN c httpscranrc3slufprbr d Download R for Windows e base f Download R 432 for Windows g Ir na pasta Downloads e abrir o arquivo executável h Sim i Português Brasileiro j Próximo k Próximo l Core Files sim 64bit Files sim Message translations sim m Não aceitar padrão n Próximo o Criar um atalho na área de trabalho sim Criar um atalho na barra de inicialização rápida não Salvar número da versão no registro sim Associar arquivos RData ao R sim p Concluir TUTORIAL PARA INSTALAÇÃO DO RSTUDIO a httpsrstudiocomproductsrstudiodownload b DOWNLOAD RSTUDIO DESKTOP FOR WINDOWS sim c Ir na pasta Downloads e abrir o arquivo executável O RStudio é um software livre de ambiente de desenvolvimento integrado IDE ou interface com o R e Python e que contém um conjunto de ferramentas integradas para execução direta de códigos visando a plotagem visualização de histórico depuração e gerenciamento do espaço de trabalho realização de cálculos estatísticos O programa possui quatro janelas Editor Console Environment e History e Plots Packages e Help INSTALAÇÃO DE PACOTES installpackagesDescTools installpackagespsych installpackagesfBasics installpackagesTeachingDemos installpackagesPairedData installpackagesagricolae installpackagesmultcomp installpackageslaercio CARREGAMENTO REQUERIMENTO DE PACOTES E ALGUMAS FUNÇÕES ÚTEIS libraryDescTools PDFManualnome do pacote Manuais em pdf VarTest Teste F para variâncias de duas amostras e Teste de χ2 para uma variância amostral TTestA teste t para duas amostras independentes se as observações nas amostras não são dadas e para amostras pareadas teste da diferença para uma amostra se as observações amostrais são dadas librarypsych descritivas por grupo describeBy requirefBasics basicStatsx ci1α Intervalo de confiança para a média populacional librarystats vartest Teste F para variâncias de duas amostras independentes quando as amostras são coletadas ttest Teste t de Student para comparar duas médias amostrais independentes e pareadas cortest Teste t para análise de correlação funções de distribuições de probabilidade d p q r chisqtest Teste de aderência de χ2 para uma amostra libraryTeachingDemos ztest Teste Z para uma amostra normal libraryPairedData Vartest Teste de χ2 para comparação entre a variância de uma amostra normal e uma variância populacional teórica Vartest Teste F para comparação de variâncias de duas amostras independentes normais libraryagricolae HSDtest Teste de Tukey Teste de Duncan librarymultcomp glht general linear hypothesis and multiple comparisons contrastes librarylaercio Testes de Tukey Duncan SNK Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 2 Capítulo 1 Estatística e metodologia científica 11 Estatística Ciência que trata da coleta organização classificação análise apresentação e interpretação de dados observados Justificativa Possibilidade de se extrair as informações previstas nos objetivos do projeto contidas nos dados numéricos para melhor compreensão dos fenômenos estudados Aplicação da estatística na área zootécnica e agronômica A ferramenta indispensável para tomada de decisões relacionadas às pesquisas 12 Tipos de pesquisa 121 Estudo observacional Trabalho planejado por amostragem no qual se mensura variáveis sem introduzir fatores de influência sobre as respostas Sistema aberto Não há controle dos efeitos dos fatores Pode haver classificação dos fatores por categorias Não se aplica os princípios básicos da experimentação 122 Pesquisa por experimentação Estudo do planejamento execução análise dos dados e interpretação de resultados experimentais Há intenção de testar o efeito de um ou mais fatores sobre as respostas individuais de uma variável Controle de fontes de variação sistemática com uso de delineamentos apropriados Minimização do erro aleatório propiciando maior precisão Sistema fechado 13 Fluxograma simplificado do método científico Problema O pesquisador tem observado que a baixa dosagem contínua de HDL sanguíneo causa problemas circulatórios Então ele deduz que pode utilizar um medicamento para aumentar sua concentração no sangue Figura 11 Etapas do método científico e a contribuição da estatística SAMPAIO 2007 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 3 131 Contribuição da estatística durante a pesquisa Formulação de hipóteses Após observar o fenômeno normalmente feito na revisão de literatura formulase a hipótese nula H0 e a alternativa Ha o Exemplo O pesquisador constatou na literatura a dose de 600 mg de licopeno L100 kg de peso corporal PC têm sido indicada para aumentar o HDL no sangue Seu objetivo é verificar se uma dosagem inferior à recomendada 450 mg L100 kg PC também proporciona o mesmo resultado o H0 µ 600 mg L100 kg PC e Ha µ 600 mg L100 kg de PC Instalação do experimento Conhecer técnicas experimentais relativas à o Seleção de animais uniformes o Aplicação adequada e uniforme dos tratamentos a serem testados o Delineamentos apropriados às especificidades do experimento Coleta dos resultados o Mensurar dados por meio apropriado usando um protocolo para todas as unidades experimentais o Devese conhecer a natureza das respostas ou seja quais tipos de variável estão no projeto Compactação dos resultados Aplicação da estatística descritiva para cada grupo experimental Teste de hipótese Conhecimento de inferência estatística e cálculo de probabilidade Conclusão Exige conhecimentos estatísticos que permitam diferenciar ou não os grupos experimentais além do conhecimento específico sobre a pesquisa Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA Capítulo 2 Testes de Hipóteses É uma regra decisória que permite aceitar ou rejeitar uma hipótese estatística feita sobre parâmetros populacionais A realização do teste se baseia em informações amostrais H0 μ K H0 μ1 μ2 H0 μ1 μ2μ3μ4 H0 σ2A σ2B H0 β1 0 H0 β0 0 H0 ρXY0 H0 0 H0 s2A s2B H0 b1 0 H0 b0 0 H0 rXY0 H0 Os dados são provenientes de uma distribuição normal Parâmetros populacionais na distribuição normal média μ e variância σ2 21 Estimadores amostrais de parâmetros populacionais a O estimador da média μ m é dado por Xin com i variando de 1 a n b O estimador da variância σ2 é dado por s2 SQDxn1 Xi 2n1 Xi2 Xi2nn1 22 Estimativa É o valor numérico assumido pelo estimador Ex 1042 e s2 467 23 Hipótese estatística É uma suposição quanto ao valor de um parâmetro populacional a ser verificada por um teste paramétrico É uma afirmação quanto à natureza da população a ser verificada por um teste de aderência Devem ser formuladas de modo a minimizar os erros de decisão 231 Exemplos a A média populacional de produção de leite de um rebanho é 15 litrosdia isto é μ 15 ldia b A distribuição dos pesos de um plantel de codornas japonesas é normal c A proporção de indivíduos com a doença X é 3 ou seja P 003 p D d 24 Formulação de Hipóteses 241 Hipótese de Nulidade H0 É a hipótese estatística a ser testada e constitui uma igualdade Os testes são construídos sob a pressuposição de H0 ser verdadeira O teste consiste em verificar se um valor estimado a partir da amostra difere significativamente do seu resultado esperado sob H0 O resultado final do teste é enunciado em termos da hipótese de nulidade 4 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 5 2411 Exemplos a Um fabricante informa que a tensão média de ruptura de cabos é 50 kgf H0 50 b Uma indústria revela que a temperatura ideal para germinação de sementes de Panicum maximum é de 35 C H0 35 c Duas marcas de rações 1 e 2 propiciam o mesmo ganho de peso médio para leitões em fase de crescimento H0 1 2 OBS Tem que haver evidência amostral sugerindo que a H0 não é verdadeira 242 Hipótese Alternativa Ha É uma hipótese que contraria a H0 formulada com base no objetivo do pesquisador associada com desigualdades No caso das marcas de rações a Ha pode ser o Ha 1 2 Bilateral Figura 21 o Ha 1 2 ou Ha 2 1 Unilateral à esquerda Figura 22 o Ha 1 2 ou Ha 2 1 Unilateral à direita Figura 23 25 Regiões de um teste estatístico de hipóteses 251 Região de Aceitação de H0 RAH0 É a região sob a função densidade de probabilidade que engloba os valores da estatística que não rejeitam a H0 252 Região de Rejeição de H0 RRH0 ou Região Crítica É a faixa de valores da estatística do teste Z t χ2 F que causam a rejeição da hipótese H0 Figura 21 Regiões de um teste de hipóteses para uma Ha bilateral Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 6 Figura 22 Regiões de um teste de hipóteses para uma Ha unilateral à esquerda Figura 23 Regiões de um teste de hipóteses para uma Ha unilateral à direita 26 Erros associados aos testes estatísticos de hipóteses 261 Erro do tipo I ou erro É a probabilidade de se rejeitar a H0 quando esta é verdadeira ou seja o pesquisador deveria atribuir uma equivalência às médias mas atribuiu uma significância Tratase do resultado falso positivo Denominado de nível de significância do teste 262 Erro do tipo II ou erro É a probabilidade de se aceitar a H0 quando esta é falsa ou seja o pesquisador deveria atribuir uma significância às médias mas atribuiu uma equivalência Tratase do resultado falso negativo H0 1 2 Tabela 21 Resumo das probabilidades na aplicação de um teste de hipóteses Decisão Realidade H0 é verdadeira H0 é falsa Rejeitar H0 1 Aceitar H0 1 A ocorrência dos erros é simultânea mas o controle é antagônico Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 7 O erro representa a dimensão da região crítica área sob a curva que está sob controle do pesquisador A quantidade 1 representa a probabilidade de se rejeitar a H0 sendo esta falsa poder do teste A quantidade 1 representa a probabilidade de se aceitar H0 sendo esta verdadeira índice de confiança do teste 27 Protocolo para aplicação de um teste estatístico de hipóteses 1 passo Enunciar as hipóteses H0 e Ha 2 passo Fixar o nível de significância e identificar a estatística do teste 3 passo Determinar a região crítica e a região de aceitação de H0 valor da estatística tabelada 4 passo Calcular o valor da estatística do teste com base em informações amostrais 5 passo Aplicar a regra decisória do teste 6 passo Com o resultado da regra decisória observar a H0 e concluir interpretando o problema 28 Escolha da estatística do teste de hipóteses A estatística do teste de hipótese depende da distribuição da variável na população e das informações disponíveis Figura 24 Figura 24 Escolha da estatística de um teste de hipóteses de acordo com as informações disponíveis 29 Teorema do limite central Se tomadas grandes amostras de uma população as médias amostrais terão distribuição normal mesmo se os dados originais não tenham distribuição normal Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 8 Capítulo 3 Teste Z para uma amostra 31 Introdução Se x1 x2 x3 xn são observações independentes de uma amostra aleatória de uma população em que Xi é uma VAC com N Xi Nµ 2 então a média Z também terá N Z N µ 2n Assim para uma população com µ e conhecidos podese comparar a média de uma amostra Z e a média populacional µ por meio da estatística Z 32 Protocolo para aplicação do teste Z 1º Passo Enunciar as hipóteses H0 e Ha H0 µ k contra Ha µ k ou Ha µ k ou Ha µ k 2º Passo Fixar o nível de significância e identificar a estatística do teste 3º Passo Determinar a região crítica e a região de aceitação de H0 Figura 31 Curva de densidade de probabilidade de Z 00 01 02 03 04 x functionZ dnormZ 0 1 3 0 3 RAH0 1alfa RRH0alfa2 RRH0alfa2 Z 196 Z 196 Tabela 31 Tipo de hipótese alternativa do teste nível de significância e valor tabelado da estatística Z Teste Ha Nível de significância α Ztab Bilateral 5 1960 Bilateral 1 2576 Unilateral à direita 5 1645 Unilateral à direita 1 2326 Unilateral à esquerda 5 1645 Unilateral à esquerda 1 2326 4 passo Obter o valor calculado de Z com base em informações amostrais Zcal X μxσxn12 Em que Zcal valor da estatística calculada X média amostral da variável X μX média populacional de X σX desvio padrão populacional e n tamanho amostral ou o n de observações da amostra 5 passo Aplicar a regra decisória do teste a Teste bilateral se Zcal Ztab RH0 ou Zcal Ztab RH0 b Teste unilateral à esquerda se Zcal Ztab RH0 c Teste unilateral à direita se Zcal Ztab RH0 6 passo Com o resultado da regra decisória observar a H0 e concluir interpretando o problema Exemplo 31 Suspeitase que um medicamento vasodilatador para hipertensão arterial esteja aumentando a frequência cardíaca FC dos pacientes Para isso coletouse uma amostra aleatória de 50 pacientes que receberam o medicamento e mediuse a FC de cada um A FC na população de indivíduos sadios apresenta distribuição normal com média 698 batimentos por minuto e σ 186 batmin A amostra com 50 pacientes apresentou uma média de 705 batmin A média amostral é maior do que a média da população normal a 5 de probabilidade Resolução 1 passo H0 μ 698 e Ha μ 698 2 passo α 5 Teste Z 3 passo Gráfico região crítica Ztab Z5 1645 Verificação do valor de Ztab qnorm09501lowertailT 1 1644854 lowertailT PZz Figura 32 Curva de densidade de probabilidade da VAC Z 4passo Zcal X μxσxn12 705 6981865012 269 5 passo Zcal 269 Ztab 1645 RH0 6 passo Pelo teste Z ao nível de 5 de probabilidade há evidências de que a frequência cardíaca média no grupo de pacientes que tomam o remédio é maior que a da população normal requireTeachingDemos Outras libraries com o procedimento do teste Z DescTools BSDA ztestx705 mu698 sd186 alternative greater n50 conflevel 095 One Sample ztest data 705 z 26612 n 5000000 Std Dev 186000 Std Dev of the sample mean 026304 pvalue 0003894 alternative hypothesis true mean is greater than 698 95 percent confidence interval 7006733 Inf sample estimates mean of 705 705 Se pvalue α RH0 então o valor cal valor tab Se pvalue α AH0 valor cal valor tab Verificação do valor p conceito do valor p PZ Zcal pnorm2661201lowertailF 1 0003893135 lowertailF PZ z pqrd Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 11 Capítulo 3 Lista de exercícios sobre teste Z para uma amostra 1 Um rebanho leiteiro produz em média 125 kg de leite por dia com o desvio padrão 205 kgdia O responsável técnico resolve introduzir uma nova composição alimentar de menor custo objetivando o aumento da produção diária de leite Após determinado período com uma amostra de 65 animais verificouse que Xi 871kgdia i varia de 1 a 65 Teste a H0 para 5 H0 µ 125 e Ha µ 125 ztestx134 mu 125 sd205 alternative greater n65 conflevel 095 2 O índice de verminose de determinado rebanho é de 154 ud com desvio padrão igual a 145 ud O responsável técnico do rebanho resolve adotar medidas sanitárias objetivando a redução do índice de verminose Para testar a hipótese H0 5 seleciona ao acaso 54 animais representativos e obtém Xi 61020 ud54 animais ztestx113 mu 154 sd145 alternative less n54 conflevel 095 3 Uma ração é vendida para promover o ganho médio de 14 kganimaldia no período de crescimento Para testar o produto foram selecionados 64 animais na mesma fase de crescimento estabelecida pelo produtor da ração Se a 2 034 kg2animaldia e Xi 10368 kg64 animaisdia teste a hipótese H0 1 H0 µ 14 e Ha µ 14 qnorm099501lowertailT 1 2575829 qnorm000501lowertailT 1 2575829 ztestx162 mu 14 sd05831 alternative twosided n64 conflevel 099 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 12 4 Num país desenvolvido iniciase um programa dietético com o objetivo de incentivar uma população potencialmente propensa às diabetes a reduzir a dosagem de açúcar no sangue Sabese que a população mencionada tem média igual a 154 mg com desvio padrão igual a 30 mg e que o teor de açúcar é normalmente distribuído Após 200 dias de iniciado o programa uma amostra de 100 pessoas foi selecionada para testar a H0 contra a hipótese alternativa ao nível de 5 de probabilidade Se Xi 13500 i varia de 1 a 100 verifique a hipótese H0 5 O rendimento médio RM de um tipo de veículo tem distribuição normal com média 1283 kmhora e desvio padrão igual a 10 kmh Um novo tipo de regulagem foi introduzido com o objetivo de aumentar o RM Para testar a H0 foram amostrados 64 veículos semelhantes que regulados da nova maneira apresentaram média de rendimento igual a 1345 kmh Teste a H0 ao nível de 5 de probabilidade 6 Uma indústria de equipamentos de som afirma que determinado aparelho dispõe de uma potência de 1400 W Selecionada uma amostra de 85 aparelhos determinouse Xi 112200 W i varia de 1 a 85 Considerando que a potência tem distribuição normal com desvio padrão igual a 250 W teste a H0 ao nível de 5 de probabilidade 7 Em certa lavoura de milho as alturas dos pés da gramínea correspondem a uma variável X com distribuição aproximadamente normal e desvio padrão igual a 21 cm Selecionandose aleatoriamente uma amostra de 49 pés encontrouse uma altura média de 217 cm Fixando um nível de significância de 5 teste a H0 µ 214 cm contra a hipótese alternativa de µ 214 cm 8 Uma população de 3000 bezerros apresenta a média de peso igual a 58 kg com variância de 36 kg2 Para uma exposição agropecuária selecionaramse 100 animais que representarão a população O peso médio amostral foi de 50 kg Teste a hipótese que o peso médio é diferente de 58 kg ao nível de 1 de significância Respostas 1 Ztab 1645 e Zcal 035 2 Ztab 1645 e Zcal 208 3 Ztab 257 e Zcal 302 4 Ztab 1645 e Zcal 639 5 Ztab 1645 e Zcal 496 6 Ztab 196 e Zcal 295 7 Ztab 1645 e Zcal 100 8 Ztab 257 e Zcal 1333 Capítulo 4 Teste de variância para uma amostra proveniente da distribuição normal Se os dados amostrais da VAC X apresentam distribuição normal com σ2X conhecida é possível comparar a variância amostral observada s2x em relação a uma variância populacional teórica σ2X por meio da utilização da estatística de quiquadrado χ2 Utilizada para verificação da significância ou não do viés de desviopadrão DP quando se compara o DP de uma amostra X com a média dos DP estimados em n amostrasfilhas obtidas com reposição e por simulação da amostramãe X 1º Passo H0σ2Xσ20 contra Haσ2Xσ20 ou Haσ2Xσ20 ou Haσ2Xσ20 em que σ20 é igual ao valor hipotético da variância populacional constante 2º Passo Estatística de quiquadrado χ2 com α 3º Passo χ2tab χ2n1 α em que n tamanho amostral Obs No software R podese obter os valores tabelados da distribuição de quiquadrado por qchisqp df ncp 0 lowertail TRUE logp FALSE em que q quantis da distribuição de χ2 p vetor de probabilidades df graus de liberdade e lowertail parâmetro lógico se TRUE padrão as probabilidades são PX x senão PX x Tabela A Alguns valores críticos unilateral à direita de χ2 segundo os graus de liberdade e a probabilidade de erro do tipo I Graus de liberdade GL Erro do tipo I 010 005 002 001 1 271 384 541 664 2 460 599 782 921 3 625 782 984 1134 4 778 949 1167 1328 5 924 1107 1339 1509 6 1064 1259 1503 1681 7 1202 1407 1662 1848 8 1336 1551 1817 2009 9 1468 1692 1968 2167 10 1599 1831 2116 2321 11 1768 1968 2262 2472 12 1855 2103 2405 2622 13 1981 2236 2547 2769 14 2106 2368 2687 2914 15 2231 2500 2826 3058 Figura 41 Curva de densidade de probabilidade de χ2 com GL 5 para teste unilateral à direita qchisq095 5 lowertail TRUE 1 110705 4º Passo χ2cal n1s2σ02 em que n tamanho amostral nº de observações s2 variância amostral e σ02 valor hipotético da variância populacional 5º Passo Teste unilateral à direita Se χ2cal χ2tab à direita RH0 ao nível α de probabilidade P Teste unilateral à esquerda Se χ2cal χ2tab à esquerda RH0 ao nível α de probabilidade Teste bilateral Se χ2cal χ2tab à direita ou χ2cal χ2tab à esquerda RH0 ao nível α de P 6º Passo Pelo teste de quiquadrado ao nível de α de probabilidade a variância amostral se equivale ou não se equivale ao valor hipotético da variância populacional Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 15 Exemplo 41 Sejam as notas de 37 discentes do curso de Zootecnia que frequentaram as aulas da disciplina de Estatística Básica Xc88808092707488969874809070847688987684788476968274809678967490 889294808494 meanX 1 8437838 sdX 1 8443773 varX 1 712973 A média amostral da variável NOTA X distribuída normalmente foi de 8438 o valor de desviopadrão amostral foi de 844 e a variância amostral foi igual a 7130 Se a variância populacional teórica 2X preconizada para o aprendizado homogêneo da disciplina é de 80 do valor médio teste a H0 e verifique se a variabilidade das notas obtida nesta turma atende ao critério estabelecido 005 Resolução 1o Passo H0X 2 6750 contra HaX 2 6750 2o Passo 2 com 005 3o Passo χtab à direita 2 χn1 α 2 χ36 005 2 5444 qchisq0975 36 lowertail TRUE 1 5443729 χtab à esquerda 2 χn1 α 2 χ36 005 2 2134 qchisq0025 36 lowertail TRUE 1 2133588 4º Passo χ2cal n1s2σ02 3717129736750 2566706750 3803 5º Passo χ2tab à esquerda χ2cal χ2tab à direita AH0 6º Passo Pelo teste de quiquadrado ao nível de 5 de probabilidade a variância amostral se equivale ao valor hipotético da variância populacional O critério de variância igual a 80 da média da nota da disciplina especificação do docente da disciplina continua em vigor Análise pelo R requirePairedData VartestX ratio 6750 alternative ctwosided conflevel 095 Checagem do valor p 2pchisq38025 36 lowertail F 1 07545655 Quando não é informada a composição do vetor numérico o resultado do teste bilateral de χ2 para comparação da variância amostral com o valor hipotético da variância populacional pode ser obtido pela função a seguir varqqtestfunctions2nsigma2alpha1alpha2 gln1 qq1qchisqalpha1gl qq2qchisqalpha2gl qqcalgls2sigma2 p2pchisqqqcalgllowertailF returnp Em que s2 valor da variância amostral n número de observações sigma2 valor da variância populacional na H0 alpha1quantil α2 alpha2quantil α2 Assim para o exemplo anterior varqqtest71303767500250975 1 07544218 Obs Se o teste for unilateral à direita basta dividir o resultado do valorp por dois Exercícios 1 O desvio padrão de altura para alunos em uma escola é de 081 Uma amostra aleatória de 50 alunos é coletada e o desvio padrão das alturas da amostra é de 096 Um pesquisador responsável pelo estudo acredita que o desvio padrão de altura para a escola é superior a 081 Teste a H0 α 005 e conclua 2 Uma empresa embala maçãs em peso Uma das notas de peso é maçã classe A que têm um peso médio de 150 g com tolerância máxima de peso permitida de 5 acima ou abaixo da média para maçãs no mesmo pacote de consumo Um lote de maçãs é selecionado para ser incluído em um pacote de maçã classe A cujos pesos g das maçãs são 158 167 149 169 164 139 154 150 157 171 152 161 141 166 172 A fruta cumpre os requisitos de tolerância do peso classe A Aplique um teste de hipótese apropriado para α 005 Resolução 150 g x 005 75 g desviopadrão populacional especificação do fabricante ou da indústria ou do produtor Faixa de valores para maçã classe A 150751575 g 150751425 g 1425 Maçã A 1575 g σ2 σ x σ 75 x 75 5625 g2 X1c158 167 149 169 164 139 154 150 157 171 152 161 141 166 172 requirepsych describeX1 requirefBasics basicStatsX1 ci 095 varX1 1 1088571 1º Passo H0σX2 5625 contra HaσX2 5625 2º Passo χ2 com α 005 3º Passo χ2tab à direita χ2n1α χ2140975 2612 qchisq0975 14 lowertail TRUE 1 2611895 χ2tab à esquerda χ2n1α χ2140025 563 qchisq0025 14 lowertail TRUE 1 5628726 4º Passo χ2cal n1s2σ02 15110885715625 1524005625 2709 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 18 5o Passo χcal 2 χtab à direita 2 RH0 6o Passo Pelo teste de quiquadrado ao nível de 5 de prob a variância amostral difere do valor hipotético da variância populacional As maças não cumprem os requisitos de peso para a classe A Análise pelo R requirePairedData VartestX1 ratio5625 alternativectwosided conflevel 095 ratio valor da variância pop Ou requireDescTools VarTestX1 sigmasquared5625 alternativectwosided conflevel095 sigmasquared 2 Checagem do valor p pela função Vartest 2pchisq27093 14 lowertail F 1 003744902 pvalue utilizando a área da cauda à direita como padrão apchisq2612 14 lowertail F a 1 002499228 bpchisq563 14 lowertail T b 1 002502636 a b 1 005001864 Nível de significância utilizando as duas áreas Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 19 Capítulo 5 Teste F para comparação de variâncias de duas amostras independentes 51 Introdução Se os dados têm distribuição normal é possível comparar as variâncias de duas amostras independentes obtidas a partir de duas populações normais por meio da distribuição F assimétrica 52 Protocolo para aplicação do teste F unilateral à direita 1o Passo Enunciar as hipóteses H0 e Ha H0 2x 2y vs Ha 2x 2y ou H0 2x 2y vs Ha 2y 2x Equivalência H0 X 2 Y 2 1 vs Ha X 2 Y 2 1 ou H0 Y 2 X 2 1 vs Ha Y 2 X 2 1 2o Passo Fixar o nível de significância e identificar a estatística do teste 3o Passo Determinar a região crítica e a região de aceitação de H0 Figura 51 Curva de densidade de probabilidade da VAC F para um teste unilateral à direita Usase a tabela unilateral para o valor de F ser maior que 1 Ha unilateral à direita O valor de Ftab depende dos graus de liberdade n 1 da variável do numerador s2 e do denominador s2 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 20 Se s2X s2Y Ftab FnX 1 nY 1 em que se observa o GLX na parte superior da tabela F e o GLY na parte lateral da tabela F Se s2Y s2X Ftab FnY 1 nX 1 em que se observa o GLY na parte superior da tabela F e o GLX na parte lateral da tabela F Tabela F Limites unilaterais de F ao nível de 5 de probabilidade para o caso de F 1 n2 1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 20 1 1614 1995 2157 2246 2302 2340 2368 2389 2405 2419 2430 2439 2444 2450 2459 2460 2480 2 1851 1900 1916 1925 1930 1933 1935 1937 1938 1940 1940 1941 1942 1942 1943 1943 1945 3 1013 955 928 912 901 894 889 885 881 879 876 874 872 871 870 869 866 4 771 694 659 639 626 616 609 604 600 596 593 591 589 587 586 584 580 5 661 579 541 519 505 495 488 482 477 474 470 468 466 464 462 460 456 6 599 514 476 453 439 428 421 415 410 406 403 400 398 396 394 392 387 7 559 474 435 412 397 387 379 373 368 364 360 357 355 352 351 349 344 8 532 446 407 384 369 358 350 344 339 335 331 328 325 323 322 320 315 9 512 426 386 363 348 337 329 323 318 314 310 307 304 302 301 298 294 10 496 410 371 348 333 322 314 307 302 298 294 291 288 286 285 282 277 11 484 398 359 336 320 309 301 295 290 285 282 279 276 274 272 270 265 12 475 389 349 326 311 300 291 285 280 275 272 269 266 264 262 260 254 13 467 381 341 318 303 292 283 277 271 267 263 260 257 255 253 251 246 14 460 374 334 311 296 285 276 270 265 260 256 253 250 248 246 244 239 15 454 368 329 306 290 279 271 264 259 254 251 248 245 243 240 239 233 16 449 363 324 301 285 274 266 259 254 249 245 242 239 237 235 233 228 17 445 359 320 296 281 270 261 255 249 245 241 238 235 233 231 229 223 18 441 355 316 293 277 266 258 251 246 241 237 234 231 229 227 225 219 19 438 352 313 290 274 263 254 248 242 238 234 231 228 226 223 221 216 20 435 349 310 287 271 260 251 245 239 235 231 228 225 223 220 218 212 n1 número de graus de liberdade do numerador e n2 número de graus de liberdade do denominador Tabela F Limites unilaterais de F ao nível de 1 de probabilidade para o caso de F 1 n2 1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 20 1 4052 5000 5403 5625 5764 5859 5928 5982 6022 6056 6082 6106 6125 6142 6157 6169 6209 2 9850 9900 9917 9925 9930 9933 9936 9937 9939 9940 9941 9942 9942 9943 9943 9944 9945 3 3412 3082 2946 2871 2824 2791 2767 2749 2735 2723 2713 2705 2698 2692 2687 2683 2669 4 2120 1800 1669 1598 1552 1521 1498 1480 1466 1455 1445 1437 1430 1424 1420 1415 1402 5 1626 1327 1206 1139 1097 1067 1046 1029 1016 1005 996 989 983 977 972 968 955 6 1375 1092 978 915 875 847 826 810 798 787 779 772 766 760 756 752 740 7 1225 955 845 785 846 719 699 684 672 662 654 647 641 635 631 627 616 8 1126 865 759 701 663 637 618 603 591 581 574 567 561 556 552 548 536 9 1056 802 699 642 606 580 561 547 535 526 518 511 505 500 496 492 481 10 1004 756 655 599 564 539 520 506 494 485 478 471 465 460 456 452 441 11 965 721 622 567 532 507 489 474 463 454 446 440 434 429 425 421 410 12 933 693 595 541 506 482 464 450 439 430 422 416 410 405 401 398 386 13 907 670 574 521 486 462 444 430 419 410 402 396 390 385 382 378 366 14 886 651 556 504 469 446 428 414 403 394 386 380 375 370 366 362 351 15 868 636 542 489 456 432 414 400 389 380 373 367 361 356 352 348 337 16 853 623 529 477 444 420 403 389 378 369 361 355 350 345 341 337 326 17 840 611 518 467 434 410 393 379 368 359 352 346 340 335 331 327 316 18 829 601 509 458 425 401 384 371 360 351 344 337 332 327 323 319 308 19 818 593 501 450 417 394 377 363 352 343 336 330 324 319 315 312 300 20 810 585 494 443 410 387 370 356 346 337 330 323 318 313 309 305 294 n1 número de graus de liberdade do numerador e n2 número de graus de liberdade do denominador Obtenção do valor tabelado da distribuição F5 GL1 5 GL2 20 no R qf095 5 20lowertail TRUE 1 271089 4o passo Obter o valor calculado de F com base em informações amostrais o A maior variância fica no numerador Fcal 1 o Fcal s2s2 s2Xs2Y ou Fcal s2s2 s2Ys2X Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 21 5o passo Aplicar a regra decisória do teste o Teste unilateral à direita se Fcal Ftab RH0 ao nível de probabilidade 6o passo Com o resultado da regra decisória observar a H0 e concluir pela aceitação ou rejeição da hipótese nula fazendo uma interpretação do problema Exemplo 51 Teste a hipótese de igualdade das variâncias ao nível de 5 de probabilidade após a aplicação de dois métodos X e Y Método s2 n X 40 11 Y 16 19 Resolução 1o H0 2x 2y e Ha 2x 2y 2o 5 Teste F 3o Gráfico região crítica Ftab F5 10 18 241 Figura 42 Curva de densidade de probabilidade da VAC F qf095 10 18lowertail TRUE 1 2411702 4o Passo Fcal s2s2 s2Xs2Y 4016 25 5o Passo Fcal Ftab Rejeitase a H0 6o Passo Pelo teste F ao nível de 5 de probabilidade as variâncias pop não são iguais homogêneas Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 22 Análise pelo R vx40 vy16 fcalvxvy p pffcal 1119 lowertail F 1 a função de probabilidade acumulada Fx no ponto Fcal 250 p Probabilidade de significância 1 003837108 Regra decisória e conclusão Como o valor de probabilidade de significância p 005 então RH0 Pelo teste F 005 as variâncias não são homocedásticas equivalentes A variância da amostra X é maior que a variância da amostra Y Se forem dadas as amostras X e Y podese utilizar a função Vartest do pacote PairedData Exemplo 52 Sejam as observações contidas na amostra Xc4354648525558 e na amostra Yc8859841027968 helpVartest requirePairedData VartestYXratio 1 alternative cgreater conflevel 095 Regra decisória e conclusão Como o valor de probabilidade de significância pvalue 005 então AH0 Pelo teste F 005 as variâncias são homocedásticas equivalentes Do mesmo modo se as amostras Xc14155156158168176177149148135 e Yc121321141011811 forem coletadas podese utilizar a função vartest do pacote stats helpvartest vartestXYratio 1 alternative cgreater conflevel 095 ou vartestlmY 1 lmX 1 Obs Acesse VarTest no console do R do pacote DescTools Capítulo 5 Lista de exercícios sobre teste F 1 Um pesquisador deseja saber se a variabilidade de peso de ovos de poedeiras Leghorn é maior que a variação de peso de ovos de codornas As amostras de ovos de codornas n 15 e de ovos de galinhas n 15 apresentaram XOC 10g sOC 11 XOG 50g e sOG 65 Teste a H0 e conclua para α 5 2 Para verificar se a densidade de 600 peixesm3 aumenta a variação da produtividade kgm3 em um tanquerede 30 m3 de produção de tilápias sistema intensivo coletaramse duas amostras uma 15 dias antecedendo à despesca e a outra no dia da despesca A 1ª amostra 30 tilápias forneceu X1 27010 g e s 934 g Na 2ª amostra 24 tilápias a X2 foi de 28345 g e o s 2322 g Conclua α 1 se houve ou não variabilidade de produtividade nesse período 3 Uma empresa estrangeira deseja importar 1 tonelada de mel in natura de um apiário Brasileiro Para que possa ser armazenado adequadamente sem risco de fermentações a legislação internacional recomenda que o teor de umidade deve ser o menor possível e com um mínimo de variação Ao embalar o mel em potes de plástico o apiário recolheu amostras de mel de duas floradas para avaliar qual dos tipos se enquadrava melhor ao teor de umidade préestabelecido Os valores de umidade do mel da Florada laranjeira FL 10 potes amostrados e da Florada mista FM 12 potes amostrados cujas análises foram feitas em duplicata foram os seguintes MEL 1 2 3 4 5 6 7 8 9 10 11 12 FL 175 192 18 174 198 193 188 179 199 182 FM 181 222 203 22 180 202 165 171 212 204 195 243 Aplique o teste F e conclua a 5 de probabilidade se as variâncias são homogêneas Indique o mel que deverá ser exportado baseado no critério da homogeneidade utilizando o cálculo do coeficiente de variação para os 2 tipos de mel 4 A qualidade de rebites é tanto melhor quanto maior sua homogeneidade Seis rebites de duas marcas foram ensaiados ao cisalhamento conforme as cargas de ruptura Tabela X Os resultados ratificam a afirmação do produtor da marca B de que seus rebites são melhores α 5 Tabela X Cargas de ruptura de acordo com a marca do rebite Rebite 1 2 3 4 5 6 Marca A 349 355 388 392 337 376 Marca B 385 390 407 429 378 414 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 24 5 Um pesquisador quer investigar se os pesos médios kg de uma variedade mais rústica de abóbora A são mais homogêneos do que os pesos médios de outra variedade mais produtiva B Para isso foi realizada uma amostragem n 7 em que os fatores climáticos luz temperatura umidade e de solo adubação espaçamentos entre outros foram equivalentes Verifique 5 se há variação entre pesos para as duas variedades de abóbora a partir dos pesos médios na colheita de três abóboras por repetição Tabela X Tabela X Peso médio de abóboras de acordo com a variedade Variedade Repetição 1 2 3 4 5 6 7 A 2125 2155 2035 2240 2330 2110 1985 B 2750 2640 2510 2385 2460 2530 2675 6 Uma empresa avícola deseja manter em suas instalações frangos que apresentem homogeneidade de rendimento de carne de peito Para isso coletaramse aleatoriamente 10 frangos de 2 galpões cujas aves eram de linhagens diferentes Os resultados médios obtidos após abate foram Galpão A 302 320 313 298 334 312 334 315 295 340 Galpão B 323 300 283 276 264 315 302 265 278 313 Perguntase A variância da linhagem B é maior que a da linhagem A a 5 de significância Respostas 1 Ftab 248 e Fcal 3492 2 Ftab 249 e Fcal 618 3 Ftab 310 Fcal 615 CV 496 para exportação e CV 1145 4 Ftab 505 e Fcal 133 5 Ftab 428 e Fcal 121 6 Ftab 318 e Fcal 186 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 25 Capítulo 6 Teste t para duas amostras independentes 61 Introdução Se os dados das amostras X e Y apresentam distribuição normal com X e Y desconhecidos é possível comparar duas médias amostrais independentes por substituição das variâncias das populações 2 pelas variâncias amostrais s2 utilizandose a estatística t de Student 62 Protocolo para aplicação do teste t para duas amostras independentes 1o Passo Enunciar as hipóteses H0 e Ha do teste F para verificar a homogeneidade ou não das variâncias populacionais H0 2x 2y contra Ha 2x 2y ou Ha 2y 2x 2o Passo Identificar a estatística do teste e fixar o nível de significância 3o Passo Determinar a região crítica valor de Ftab e a região de aceitação de H0 Se s2X s2Y Ftab F nX 1 nY 1 em que se observa o GLX na parte superior da tabela F e o GLY na parte lateral da tabela F Se s2Y s2X Ftab F nY 1 nX 1 em que se observa o GLY na parte superior da tabela F e o GLX na parte lateral da tabela F 4o passo Obter o valor calculado de F com base em informações amostrais A maior variância fica no numerador Fcal 1 Fcal s2s2 s2X s2Y ou Fcal s2s2 s2Y s2X 5o passo Aplicar a regra decisória do teste o Teste unilateral à direita se Fcal Ftab RH0 ao nível de probabilidade 6o passo Com o resultado da regra decisória observar a H0 e concluir pela aceitação ou rejeição da H0 fazendo uma interpretação do problema Se H0 não for rejeitada ou seja se Fcal Ftab AH0 as variâncias serão homocedásticas Então admitese que as 2 são iguais e os valores assumidos por s2x e s2y são estimativas de um mesmo valor 2 que é a variância comum de ambas as populações Devese combinar sX2 e sY2 para se obter um melhor estimador da variância comum populacional σ2 a variância ponderada sp2 das amostras dada pela média ponderada das variâncias amostrais Se sX2 SQDXnX1 ΣXi2 ΣXi2nXnX1 e sY2 SQDYnY1 ΣYi2 ΣYi2nYnY1 então sp2 nX 1sX2 nY 1sY2nX nY 2 Se H0 for rejeitada ou seja se Fcal Ftab RH0 as variâncias serão heterocedásticas ou seja admitese que as σ2 não são iguais não se combina sX2 e sY2 Então devese calcular os graus de liberdade estimados por meio da equação de Satterthwaite n obtidos por n sX2nX sY2nY2sX2nX2nX 1 sY2nY2nY 1 7º Passo Enunciar as hipóteses H0 e Ha do teste t H0 μX μY contra Ha μX μY ou Ha μX μY ou Ha μX μY 8º Passo Fixar o nível de significância α e identificar a estatística do teste Obs Normalmente o α é o mesmo tanto no teste F quanto no teste t 9º Passo Determinar a região crítica e a região de aceitação de H0 ttab tαnx ny 2 para teste F homocedástico em que nx ny 2 GL ttab tαn para teste F heterocedástico em que n GL Pelo R acessar qtquantil GL lowertailT Ajuste de tabela t com a modalidade de Ha no teste t ttab em tabela bilateral e teste bilateral entrar com α ttab em tabela bilateral e teste unilateral entrar com 2α ttab em tabela unilateral e teste bilateral entrar com α2 ttab em tabela unilateral e teste unilateral entrar com α Tabela utilizada em nossa disciplina pág 31 10º passo Obter o valor calculado de t com base em informações amostrais Erro padrão das diferenças entre médias EPDM denominador do tcal Para σx2 σy2 EPDM sp2nX sp2nY12 e tcal X ȲEPDM Então tcal X Ȳsp2nX sp2nY12 Para σx2 σy2 EPDM sX2nX sY2nY12 e tcal X ȲEPDM Então tcal X ȲsX2nX sY2nY12 11º passo Aplicar a regra decisória do teste a Teste bilateral se tcal ttab RH0 ou tcal ttab RH0 b Teste unilateral à direita se tcal ttab RH0 c Teste unilateral à esquerda se tcal ttab RH0 12º passo Com o resultado da regra decisória observar a H0 e concluir pela aceitação ou rejeição da hipótese nula fazendo uma interpretação do problema Exemplo 61 Um pesquisador deseja comparar duas técnicas de memorização X e Y por meio do tempo exigido para decorar certo tipo de material O mesmo material foi apresentado a nX 18 e nY 13 pessoas as quais o decoraram utilizando as técnicas X e Y respectivamente Os resultados foram X 20 min sX2 12 min2 Ȳ 17 min e sY2 15 min2 Há diferença significativa α 005 entre os dois tempos para as duas técnicas de memorização Resolução 1º passo H0 σX2 σY2 e Ha σY2 σX2 2º passo Teste F e α 005 3º passo F005 1217 238 qf0951217lowertailT 1 2380654 4º passo Fcal sY2sX2 1512 125 5º passo Fcal Ftab Aceitase a H0 6º passo Pelo teste F ao nível de 5 de probabilidade as variâncias são homocedásticas 7º passo H0 μX μY e Ha μX μY 8º passo α 5 Teste t 9º passo ttab t5 29 204 Valor tabelado à esquerda da distribuição t no R ttabnegqt002529lowertailT ttabneg 1 204523 Valor tabelado à direita da distribuição t no R ttabposqt097529lowertailT ttabpos 1 204523 10º passo s²p nx 1s²x ny 1s²ynx ny 2 18112 1311518132 1324 tcal X Ȳs²pnx s²pny12 20 17132418 13241312 226 11º passo tcal ttab RH0 12º passo Pelo teste t ao nível de 5 de probabilidade existe diferença significativa entre as duas técnicas de memorização Análise pelo R mx20 my17 nx18 ny13 s2x12 s2y15 s2pnx1s2xny1s2ynxny2 tcalmxmysqrts2pnxs2pny p 2pttcal 29 lowertail F p 1 00311554 Conclusão Pelo teste t ao nível de 5 de probabilidade existe diferença significativa entre as duas técnicas de memorização Se as observações nas amostras não são dadas podese acessar TTestA no console do R para maiores informações sobre o teste t para duas amostras independentes no pacote DescTools requireDescTools TTestAmx sxsqrts2x nx mysysqrts2y ny alternative ctwosided varequal T conflevel 095 Exemplo 62 Um pesquisador investiga se a ração X causa maior média de peso em suínos do que a ração Y Em 11 animais sorteados ao acaso foi dada a ração X e a outros 19 a ração Y Os resultados foram X 66 kg s²X 40 kg² Ȳ 63 kg e s²Y 16 kg² Conclua α 5 por meio do teste t Resolução 1º passo H0 σ²X σ²Y e Ha σ²X σ²Y 2º passo α 5 Teste F 3º passo Ftab F5 10 18 241 4º passo Fcal s²Xs²Y 4016 25 5º passo Fcal Ftab Rejeitase a H0 6º passo Pelo teste F ao nível de 5 de probabilidade as variâncias são heterocedásticas 7º passo H0 µX µY e Ha µX µY 8º passo α 5 Teste t 9º passo n s²Xnx s²YnY²s²Xnx²nx 1 s²YnY²nY 1 n 4011 1619²4011²11 1 1619²19 1 1473 15 ttab t5 15 175 Utilizando a tabela t pág 31 Valor tabelado unilateral à direita da distribuição t no R ttabposqt0951473lowertailT ttabpos 1 1755163 10º passo tcal X Ȳs²Xnx s²YnY12 66 634011 161912 142 11º passo tcal ttab AH0 12º passo Pelo teste t ao nível de 5 de prob as duas rações garantem o mesmo peso médio dos suínos Análise pelo R mx66 my63 nx11 ny19 s2x40 s2y16 tcalmxmysqrts2xnxs2yny p pttcal 1473 lowertail F p 1 008855546 Conclusão Pelo teste t ao nível de 5 de probabilidade os pesos médios dos suínos são semelhantes Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 30 requireDescTools TTestAmx sxsqrts2x nx mysysqrts2y ny alternative cgreater varequal F conflevel 095 Conclusão Pelo teste t ao nível de 5 de probabilidade os pesos médios dos suínos são semelhantes Cálculo de n n de Satterthwaite no R nSAT s2Xnx s2Yny2s2Xnx2nx 1 s2Yny2ny 1 nSAT 1 1472903 Se as observações das amostras X e Y forem dadas podese utilizar a função ttest do pacote stats Antes devese verificar se as variâncias são homocedásticas ou não Exemplo 63 Sejam as observações contidas nas amostras X e Y Verifique se as médias são equivalentes para 5 Xc4354648525558332946 Yc8859841027968 vartestYXratio 1 alternative cgreater conflevel 095 library stats helpttest ttestXY alternative ctwosided varequal TRUE conflevel 095 library stats Regra decisória e conclusão Como o valor p 784x107 005 então RH0 Pelo teste t 005 as médias das amostras X e Y não são equivalentes diferem entre si Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 31 Tabela t Valores de t em níveis de 10 a 01 de probabilidade GL 10 5 2 1 05 01 1 631 1271 3182 6366 12732 63662 2 292 430 697 992 1409 3160 3 235 318 454 584 745 1294 4 213 278 375 460 560 861 5 202 257 337 403 477 686 6 194 245 314 371 432 596 7 190 236 310 350 403 541 8 186 231 290 336 383 504 9 183 226 282 325 369 478 10 181 223 276 317 358 459 11 180 220 272 311 350 444 12 178 218 268 306 343 432 13 177 216 265 301 337 422 14 176 214 262 298 333 414 15 175 213 260 295 329 407 16 175 212 258 292 325 402 17 174 211 257 290 322 397 18 173 210 255 288 320 392 19 173 209 254 286 317 388 20 173 209 253 284 315 385 21 172 208 252 283 314 382 22 172 207 251 282 312 379 23 171 207 250 281 310 377 24 171 206 249 280 309 375 25 171 206 249 279 308 373 26 171 206 248 278 307 371 27 170 205 247 277 306 369 28 170 205 247 276 305 367 29 170 204 246 276 304 366 30 170 204 246 275 303 365 40 168 202 242 270 297 355 60 167 200 239 266 292 346 120 165 198 236 262 286 337 165 196 233 258 281 329 Capítulo 6 Lista de exercícios sobre teste t para duas amostras independentes 1 Os dados que seguem referemse a cinco determinações da resistência de dois tipos de concreto Ao nível de 5 de significância há evidência de que o concreto 1 seja mais resistente que o concreto 2 Concreto 1 54 55 58 51 57 Concreto 2 50 54 56 52 53 2 Desejase saber se duas máquinas de empacotar café uma nova e outra velha estão fornecendo o mesmo peso médio por pacote As amostras contam de 6 pacotes produzidos pela máquina nova e 9 pela máquina velha Os pesos kg dos pacotes são máquina nova 082 083 079 081 081 080 máquina velha 079 082 073 074 080 077 075 084 078 Qual a conclusão ao nível de 5 de significância 3 Um estudo foi realizado para verificar o efeito da idade de castração no desenvolvimento e produção de suínos Os dados obtidos foram Castração aos 14 dias X1 37 kg s²1 4 kg² n1 16 Castração aos 56 dias X2 31 kg s²2 3 kg² n2 16 Verificar H0 µ1 µ2 vs Ha µ1 µ2 a α 5 4 Verifique α 1 se a diferença entre os pesos médios de aves submetidas a dois tipos de ração é significativa e considerando as hipóteses H0 µ1 µ2 e Ha µ1 µ2 Ração A com sorgo X1 22 kg s²1 24 kg² n1 21 Ração B sem sorgo X2 175 kg s²2 68 kg² n2 21 5 Os dados de ganho de peso para duas raças de suínos ao final de 90 dias de experimento foram os seguintes Raça Duroc X1 40 kg s²1 19 kg² e n1 15 Raça Pietrain X2 32 kg s²2 529 kg² e n2 16 Teste a H0 µ1 µ2 vs Ha µ1 µ2 com α 1 Respostas 1 ttab 186 e tcal 127 2 ttab 220 e tcal 231 3 ttab 170 e tcal 907 4 ttab 204 e tcal 682 5 ttab 249 e tcal 1183 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 33 Capítulo 7 Teste t para dados emparelhados 71 Introdução Dados emparelhados constituem observações de duas amostras cujos elementos estão relacionados dois a dois A cada elemento de uma amostra corresponde um elemento de outra Existe um critério que introduz uma influência marcante entre os pares caracterizando algum tipo de associação ou dependência Exemplo Sejam as medidas sobre o mesmo indivíduo antes e após a aplicação de alguma ração ou medicamento Tabela 61 Tabela 71 Codificação da variável X dado o animal i e as amostras antes e após o uso de um tratamento No do animal i X1i X2i di X2i X1i 1 X11 X21 d1 2 X12 X22 d2 n X1n X2n dn X1i peso do animal i antes 1ª amostra de receber uma ração X2i peso do mesmo animal i depois 2ª amostra que recebeu a ração A unidade de avaliação estatística é a diferença di entre as medidas realizadas no par antes e depois 72 Protocolo para aplicação do teste t pareado 1o passo Enunciar as hipóteses H0 e Ha H0 D k contra Ha D k ou Ha D k ou Ha D k em que D média de todas as diferenças entre pares na população e k constante que representa o valor da média D sob a suposição de H0 ser verdadeira Na maioria das vezes assume valor nulo k 0 2o passo Fixar o nível de significância e identificar a estatística do teste 3o passo Determinar a região crítica e a região de aceitação de H0 Na tabela bilateral Pág 31 o valor de ttab é obtido observandose o erro e n 1 graus de liberdade n número de pares ou seja ttab tα n 1 Ajuste de tabela t com a modalidade de Ha no teste t ttab em tabela bilateral e teste bilateral entrar com ttab em tabela bilateral e teste unilateral entrar com 2 ttab em tabela unilateral e teste bilateral entrar com 2 ttab em tabela unilateral e teste unilateral entrar com Tabela utilizada em nosso curso Pág 31 83 Coeficiente de correlação amostral de Pearson rXY Índice que mede o grau de associação entre X e Y Utilizado para variáveis contínuas Várias fórmulas podem ser usadas rXY sXYs2X s2Y12 rXY sXYsX sY rXY SPDXYn1SQDXn1 SQDYn112 rXY SPDXYSQDX SQDY12 Em que sXY covariância amostral entre X e Y s2X variância amostral de X sX desviopadrão amostral de X s2Y variância amostral de Y sY desviopadrão amostral de Y SPDXY soma dos produtos dos desvios em relação às médias de X e Y SQDX soma dos quadrados dos desvios em relação à média de X SQDY soma dos quadrados dos desvios em relação à média de Y e n número de pares de observações das variáveis X e Y O rXY utiliza a covariância amostral entre X e Y sXY em sua estrutura A sXY é uma medida estatística que mede o quanto duas variáveis variam juntas Esta associação pode ser positiva ou negativa e pode ser estimada por sXY SPDXYn1 Xi XYi Yn1 XiYi XYi XiY XYn1 sXY XiYi XiYin YiXin nXin Yinn1 sXY XiYi 2XiYin XiYinn1 sXY XiYi XiYinn1 Em que n número de pares de observações numerador SPDXY e numeradorn1 média da soma de produtos O sinal da covariância irá indicar a direção da associação entre X e Y Quanto maior o tamanho amostral n menor será o seu valor Se SQDX Xi2 Xi2n e SQDY Yi2 Yi2n então o desenvolvimento da fórmula rXY SPDXYSQDX SQDY 12 resulta em rXY XiYi Xi YinXi2 Xi2n Yi2 Yi2n12 O valor de rXY representa uma estimativa do coeficiente de correlação populacional ρXY 84 Análise de correlação 1º passo Enunciar as hipóteses H0 e Ha do teste t H0 ρXY 0 e Ha ρXY 0 O coeficiente de correlação populacional é nulo Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 35 Valor tabelado unilateral à esquerda da distribuição t no R ttabesqqt0016lowertailT ttabesq 1 3142668 4o passo tcal d n12sd 2507 712853 778 5o passo tcal ttab RH0 6o passo Pelo teste t ao nível de 1 de probabilidade o medicamento apresenta efeito significativo na redução da pressão Uso da library stats no R antesc1105131135155150145165 depoisc8011012012013512051305 ttestdepois antes mu0 alternativecless pairedTRUEconflevel099 Uso da library DescTools no R requireDescTools TTestAmxmeandepoisantes sxsddepoisantes nxlengthdepoisantes alternative cless conflevel 099 Uso do teste da diferença para uma amostra Obtenção do valor p no R pt77751 6 lowertailT 1 00001191321 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 36 Capítulo 7 Lista de exercícios sobre teste t para dados emparelhados 1 Para testar se um método de secagem rápida consegue retirar quantidade significativa de água de grãos de cereais uma porção de milho cevada trigo arroz e sorgo foi exposta ao método Dados os pesos g das porções amostradas o método de secagem é eficiente para secar os grãos 5 Milho Cevada Trigo Arroz Sorgo Sem a secagem 30 34 41 25 36 Com a secagem 21 28 33 21 31 2 Uma fábrica de cerâmica produz um tipo de peça usando o processo A de fabricação Para aumentar a resistência das peças quando submetidas a uma temperatura o processo B foi introduzido Com os dados amostrais de temperatura de rompimento das peças testar a hipótese H0 e concluir para 5 Processo A 903 934 968 914 926 1025 1034 Processo B 1014 985 1046 958 962 946 995 3 Um produto foi desenvolvido para reduzir a temperatura de funcionamento de qualquer tipo de motor Para testar o produto foram selecionados ao acaso oito motores diferentes e após 10 minutos de funcionamento em cada condição foram obtidos os dados C Teste a H0 e conclua 5 Motor 1 2 3 4 5 6 7 8 Sem produto 805 996 834 1002 815 846 850 1058 Com produto 758 988 776 999 742 805 836 1058 4 Um pesquisador deseja testar o efeito de certo fertilizante na produção de milho Das 12 UE disponíveis todas com áreas e condições de ambiente iguais sete receberam o fertilizante Para as produções kgUE obtidas teste a H0 e conclua se o fertilizante aumenta a produção 5 Com Fertilizante 25 35 45 30 20 25 30 Sem Fertilizante 35 25 20 15 30 5 Sejam os pesos g de ratos Wistar com 15 dias de idade segundo a condição normal e submetidos à extirpação do timo timectomização aos 4 dias de idade A cirurgia reduz o GP dos ratos 5 Condição Normal 403 400 396 352 320 Timectomizado 186 203 236 222 209 Uso da library stats no R cnc4034039635232 tc186203236222209 ttestt cn mu0 alternativecless pairedTRUE conflevel095 pt821494lowertailT Valor de probabilidade de significância pvalor 1 00005983872 qt0054lowertailT Valor de t tabelado 1 2131847 Respostas 1 s2d 43 s 207 ttab 5 4 278 e tcal 691 2 s2d 4362 s 660 ttab 5 6 194 e tcal 116 3 s2d 773 s 278 ttab 5 7 190 e tcal 310 4 s2d 24250 s 1557 ttab 5 4 213 e tcal 086 5 s2d 1968 s 444 ttab 5 4 213 e tcal 821 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 37 Capítulo 8 Análise de correlação linear 81 Introdução O coeficiente de correlação linear amostral rXY mede a intensidade de associação entre duas variáveis X e Y ou seja se a variação de uma variável acompanha diretamente ou inversamente a variação da outra Cada um dos pares de dados deve ser coletado de um mesmo animal planta ou outro elemento O rXY é um número adimensional que varia de 1 a 1 e que quantifica o grau de associação O rXY é usado para expressar o quanto os pontos se aproximam de uma reta imaginária 1 09 08 05 04 01 0 01 04 05 08 09 1 82 Estudo gráfico de duas variáveis 821 Ausência de associação Se X e Y não estão correlacionadas rXY 0 os valores de X variam independentemente de Y e viceversa Figura 71 Característica Os pontos estarão dispersos por todo o quadrante Figura 81 Diagrama de dispersão e a ausência de correlação entre X e Y Quanto mais próxima de zero for a estimativa de rXY mais fraco será o grau de associação entre X e Y 822 Associação máxima positiva Se X e Y apresentarem correlação alta e positiva rXY 10 os pontos estarão alinhados na direção ascendente Figura 72 Características Pontos concentrados sobre a reta Aos maiores valores de X correspondem os maiores valores de Y Grau de associação diretamente proporcional Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 38 Figura 82 Diagrama de dispersão e a correlação direta e perfeita entre X e Y Se 0 rXY 1 o grau de associação entre X e Y será diretamente proporcional Quanto mais próxima de 1 for a estimativa de rXY mais forte e direto será o grau de associação entre X e Y 823 Associação máxima negativa Se X e Y apresentarem correlação alta e negativa rXY 10 os pontos estarão alinhados na direção descendente Figura 73 Características Pontos concentrados sobre a reta Aos maiores valores de X correspondem os menores valores de Y Grau de associação inverso Figura 83 Diagrama de dispersão e a correlação inversa e perfeita entre X e Y Se 1 rXY 0 o grau de associação entre X e Y será inversamente proporcional Quanto mais próxima de 1 for a estimativa de rXY mais forte e inversa será o grau de associação entre X e Y Capítulo 9 Intervalo de confiança para a média populacional 91 Introdução Usado na estimação de parâmetros ramo da inferência estatística e relacionado com a distribuição t de Student Estimadores por intervalo são regras que definem o uso de valores amostrais para cálculo de dois números que formam os extremos de um intervalo dentro do qual esperase estar contido o real valor da média populacional 92 Propriedades desejáveis do IC da média populacional Esperase que o IC contenha o real valor da média elevada certeza Esperase que o IC tenha a menor amplitude possível entre os extremos 93 Estimador do IC para a média populacional com N e σ2 desconhecida Se X é uma VAC com N em uma população na qual a σ2 é desconhecida é possível realizar inferências sobre a média da população µ utilizando s no lugar de σ por meio da estatística t de Student com n 1 graus de liberdade dada por tn1 X µXsXn12 94 Curva de densidade de probabilidade da distribuição t Seja o gráfico da função de densidade de probabilidade fdp da distribuição t de Student com 30 graus de liberdade df 30 no intervalo de x entre 3 e 3 Figura 81 Figura 91 Função de distribuição de probabilidade da distribuição t de Student df 30 no intervalo de x entre 3 e 3 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 40 2o passo Fixar o nível de significância e identificar a estatística do teste Teste t e α de nível de significância 3o passo Determinar a região crítica e a região de aceitação de H0 ttab t n 2 o Perda de 2 GL pela estimativa das médias de X e Y 4o passo Obter o valor calculado de t com base em informações amostrais tcal rXY n 21 rXY212 5o passo Aplicar a regra decisória do teste a Teste bilateral se tcal ttab RH0 ou tcal ttab RH0 há correlação entre X e Y dada pelo valor de rXY b Teste bilateral se tcal ttab AH0 ou tcal ttab AH0 não existe correlação entre X e Y 6o passo Com o resultado da regra decisória observar a H0 e concluir pela aceitação ou rejeição da hipótese nula fazendo uma interpretação do problema Pelo teste t ao nível de de probabilidade existe ou não existe correlação entre X e Y Exemplo 81 Estime o coeficiente de correlação amostral para X e Y teste a H0 e conclua α 5 Tabela 81 Pares de observações entre as variáveis X e Y X 40 48 50 72 78 100 110 140 Y 25 22 20 28 30 32 35 29 XiYi 40 25 14 29 185220 Xi 40 14 6380 Xi2 402 142 59372 Xi2 6382 407044 Yi 25 29 22100 Yi2 252 292 628300 Yi2 221002 4884100 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 41 rXY XiYi XiYinXi2 Xi2n Yi2 Yi2n12 rXY 185220 6380 22100859372 4070448 628300 4884100812 rXY 185220 17624859372 50881 628300 61051312 rXY 89728491 1778712 897212289 073 Resolução 1o passo H0 ρXY 0 e Ha ρXY 0 2o passo Teste t 5 3o passo ttab t5 8 2 t5 6 245 4o passo tcal rXY n 21 rXY212 073 8 21 073212 073 60467112 073 358 261 5o passo tcal ttab RH0 6o passo Pelo teste t a 5 de probabilidade há correlação entre X e Y expressa pelo valor rXY 073 Análise de correlação e uso da library stats no R helpcortest Xc44857278101114 Yc2522202830323529 cortest XYalternativectwosidedmethodcpearsonconflevel095 corXY 1 07300688 Análise da nuvem de pontos e ajuste da reta de mínimos quadrados plotXY Plotando a nuvem de pontos m1lmYX Ajuste do modelo de regressão linear de 1º grau e armazenamento no objeto m1 ablinem1 Plotando o ajuste do modelo de 1º grau s1summarym1 Inferências e índices do modelo e armazenamento no objeto s1 strs1 Estrutura do objeto s1 lista com 11 componentes rsqs18 Seleção do coeficiente de determinação R2 do modelo e acúmulo no objeto rsq correlsqrtrsq1 A correlação é a raiz quadrada do coeficiente de determinação rXY R205 correl 1 07300688 Se n 9 pares e rXY 062 Verifique se a correlação é significativa 5 n9 r062 tcalrsqrtn 21 r2 pval2pttcaln2lowertailF lowertailF porque rXY é positivo pval 1 007489275 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 42 Capítulo 8 Lista de exercícios sobre análise de correlação linear 1 O coeficiente de correlação amostral rxy estimado a partir de 15 pares de observações das variáveis aleatórias contínuas X e Y que apresentam distribuição normal bivariada conjunta foi de 052 Aplique um teste adequado para verificar se há ou não correlação significativa entre as duas variáveis 5 2 Um modelo linear de 1º grau foi ajustado aos dados da variável dependente Y a partir dos níveis da variável regressora X por meio do método dos mínimos quadrados ordinários O modelo foi estimado a partir de 30 pares de observações sendo representado por Yi 051 131Xi e apresentou 88 de aderência aos dados de Y Verifique 1 se há uma associação significativa entre X e Y por meio de uma análise de correlação de Pearson 3 Um pesquisador avaliou algumas medidas biométricas de equinos da raça W Os dados de altura de cernelha AC altura de garupa AG comprimento de canela CC perímetro de canela PC e perímetro torácico PT dos animais encontramse na Tabela 72 Tabela 72 Pares de observações entre as variáveis AC AG CC PC e PT de equinos da raça W Equino AC AG CC PC PT 1 130 140 142 16 152 2 132 142 148 18 178 3 135 145 149 17 179 4 148 163 156 175 187 5 150 165 157 172 166 6 138 155 152 169 163 7 139 158 150 143 158 8 143 159 148 152 194 9 148 152 165 15 191 Escolha um par de variáveis e estime o coeficiente de correlação de Pearson rXY Em seguida aplique um teste adequado e faça a inferência para a correlação entre X e Y 5 5100 005 Respostas 1 tcal 219 ttab 5 13 216 2 tcal 1433 ttab 1 28 276 3 ACc130 132 135 148 150 138 139 143 148 AGc140 142 145 163 165 155 158 159 152 CCc142 148 149 156 157 152 150 148 165 PCc16 18 17 175 172 169 143 152 15 PTc152 178 179 187 166 163 158 194 191 matrizasdataframecbindACAGCCPCPT pairsmatriz librarygraphics cormatriz Estimativas dos rXY requiremetan corrcoefmatriz Estimativas dos rXY e valores de probabilidade Pvalues para os pares de variáveis ACxAG ACxCC ACxPC ACxPT AGxCC AGxPC AGxPT CCxPC CCxPT PCxPT rXY 08580 08277 01143 04747 05177 01271 02150 00745 04652 00424 tcal 44203 39023 03044 14269 16009 03391 05826 01978 13904 01121 Pbilat 00031 00059 07697 01967 01534 07446 05784 08488 02070 09138 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 43 PAGxPT 05784 005 AH0 PACxCC 00059 005 RH0 4º passo Obter o valor calculado de t com base em informações amostrais Para H0 D 0 e d din estimador de D tcal d Dsd ou tcal d 0sdn12 ou tcal d n12sd em que d média de todas as diferenças entre os pares na amostra das diferenças sd desvio padrão para as diferenças amostrais e n número de pares Vale notar que sd s2d12 ou sd s2dn12 ou sd sdn12 e que s2d SQDdnd 1 di2 di2ndnd 1 sd sdn 5º passo Aplicar a regra decisória do teste a Teste bilateral se tcal ttab RH0 ou tcal ttab RH0 b Teste unilateral à direita se tcal ttab RH0 c Teste unilateral à esquerda se tcal ttab RH0 6º passo Com o resultado da regra decisória observar a H0 e concluir pela aceitação ou rejeição da hipótese nula fazendo uma interpretação do problema Exemplo 71 Sejam os valores de pressão sistólica mmHg de sete indivíduos obtidos antes e após a aplicação de um medicamento para reduzir a pressão Tabela 61 Teste a H0 para α 1 e conclua Tabela 61 Valores individuais de pressão mensurados antes e após a aplicação de um medicamento Indivíduo 1 2 3 4 5 6 7 Antes 1105 1310 1350 1550 1500 1450 1650 Depois 800 1100 1200 1200 1350 1205 1305 Resolução Se depois X2i e antes X1i então di X2i X1i 305 210 150 350 150 245 e 345 d din 305 3457 17557 2507 di2 3052 3452 483675 s2ddi2 di2ndnd 1 483675 1755276 483675 4400046 436716 72785 sd 7278512 853 1º passo H0 D 0 Ha D 0 2º passo α 1 Teste t 3º passo ttab tαn 1 t16 314 Partindose da Figura 91 podese constatar que Ptα2 t tα2 1 α Ptα2 X μXsXn12 tα2 1 α Ptα2 sXn12 X μX tα2 sXn12 1 α PX tα2 sXn12 μX X tα2 sXn12 1 α 1 PX tα2 sXn12 μX X tα2 sXn12 1 α PX tα2 sXn12 μX X tα2 sXn12 1 α ou ICμ 1α X tα2 sXn12 em que 1 α índice de confiança do intervalo OBS1 se α 005 então tα2 204 e tα2 204 OBS2 O IC da média populacional expressa a dispersão da média amostral que é a estimativa pontual Exemplo 91 Construa os limites do IC para a média com 90 de probabilidade considerando que em quatro leituras de um comercial de 30 segundos um locutor levou em média 292 segundos com variância de 576 seg2 Resolução IC μ 1α X tα2 n1 sXn12 IC μ 090 292 t0102 3 57612412 IC μ 090 292 235 242 IC μ 090 292 282 ou IC μ 090 2638 μ 3202 Observações No exemplo acima há 90 de certeza que o IC contém o valor real de μ ou seja de 100 intervalos gerados 90 terão o valor de μ em seu interior As dimensões do IC serão ampliadas se ampliado o índice de confiança e reduzidas se ampliado o tamanho amostral O IC para a média populacional corresponde a um teste de hipóteses sobre μ sendo equivalente ao teste t para uma amostra sobre μ com hipótese alternativa bilateral 51 Script no R se as observações amostrais não são dadas alfa010 m292 v576 n4 ttabnegqtalfa2 n1 lowertail T ttabposqt1alfa2 n1 lowertail T lcimttabpossqrtvsqrtn lci limite de confiança inferior lcsmttabpossqrtvsqrtn lcs limite de confiança superior lci 1 2637596 lcs 1 3202404 Conclusão Pelo teste t bilateral com 90 de índice de confiança o valor real da média μ encontrase entre 2638 e 3202 Script no R se as observações amostrais são dadas Xc44857278101114 Yc2522202830323529 requirefBasics basicStatsX ci 095 basicStatsY ci 095 95 Cálculo do tamanho da amostra n A estimativa do número de elementos animais plantas necessários para um estudo por amostragem está relacionado ao IC da média dado por ICμ 1α X tα2 sXn12 Se tα2 sXn12 Δ então ICμ 1α X Δ A confiabilidade de X depende de sX e de n pois t a 5 depende de n e varia de 257 a 196 se n for 5 e infinito respectivamente Variáveis com maiores desvios têm menor confiabilidade em sua média a menos que se eleve n Variáveis com baixo valor de s não necessitam de um alto valor de n O pesquisador deve definir a amplitude do intervalo Δ em torno de X de modo a não comprometer a credibilidade da média em estudospiloto Em estudospiloto o pesquisador deve verificar se sua amostra representa ou não a população de origem Se o número de elementos n que ele trabalhou para estimar X e sX for maior ou igual à estimativa de n a amostra será representativa Caso contrário ele deve adicionar mais elementos à amostra até que se torne representativa 52 Exemplo 92 a Seja uma VAC X que apresentou X 40 sX 8 com n 16 1º Passo Definir a amplitude do intervalo Δ a critério do pesquisador Optandose pelo intervalo de 10 em torno de X ou seja Δ 10 X 01 40 40 2º Passo Cálculo do tamanho amostral n Se Δ t5 bilateraln1 sXn12 Então 4 t515sXn12 4 21380n12 n12 17044 n12 426 n 1815 18 animais São necessários 18 animais para que a amostra seja representativa da população considerando um Δ 10 X O pesquisador deve coletar mais duas observações e recalcular o n b Optandose pelo intervalo 40 6 15 da média 1º Passo Δ 015 X 015 40 60 2º Passo Se Δ t5 bilateraln1 sXn12 Então 6 t515 sXn12 6 213 80n12 n12 17046 n12 284 n 807 8 animais O pesquisador trabalhou com 16 animais e são necessários 8 animais para que a amostra seja representativa da população considerando um desvio de 15 em torno da média amostral c Seja uma VAC X que apresentou CV 45 X 100 s 45 e n 61 1º Passo Optandose por um desvio de 10 da média amostral Δ 01 X 01 100 100 2º Passo 10 t560 sn12 10 20 450n12 n12 9010 n12 9 n 81 animais O pesquisador trabalhou com 61 animais e são necessários 81 animais para que a amostra seja representativa da população considerando um desvio de 10 em torno da média amostral O pesquisador deve coletar mais 20 observações e recalcular o tamanho amostral n d Seja uma VAC X que apresentou CV 45 X 100 s 45 e n 61 1º Passo Optandose por um desvio de 15 da média amostral Δ 015 X 015 100 150 2º Passo 15 t sn12 15 20 450n12 n12 9015 n12 6 n 36 animais O pesquisador trabalhou com 61 animais e são necessários 36 animais para que a amostra seja representativa da população para Δ 015 X Não é necessário coletar mais observações 96 Intervalo de confiança para a diferença entre médias de duas populações normais com variâncias desconhecidas Se o IC de uma média é igual a ICμ 1α X tα2 sX n¹2 então o IC da diferença entre duas médias será ICμ1 μ2 1α X₁ X₂ tα2 sX₁ sX₂ No entanto se a variância da diferença entre médias é dada por s²X₁ X₂ s²X₁ s²X₂ s1²n1 s2²n2 então o desviopadrão da diferença entre médias será sX₁ X₂ s1²n1 s2²n2¹² Logo o intervalo de confiança da diferença entre médias será o ICμ1 μ2 1α X₁ X₂ tα2 s1²n1 s2²n2¹² ou o ICμ1μ2 1α X₁ X₂ tα2s1²n1 s2²n2¹² μ1μ2 X₁ X₂ tα2s1²n1 s2²n2¹² em que X₁ X₂ é o estimador pontual de μ1 μ2 O IC da diferença entre duas médias expressa a significância estatística do teste t referente à comparação de duas médias independentes Se o valor zero estiver contido no intervalo da diferença gerado as médias são equivalentes não existe diferença entre as médias O valor 1 α equivale ao índice de confiança do intervalo Exemplo 93 Verifique se as médias dos tratamentos A e B são significativas para as estatísticas descritivas amostrais dadas por XA 132 XB 160 s²A 25 s²B 30 nA 20 nB 25 e α 005 Resolução 1º passo H0 σ²A σ²B e Ha σ²B σ²A 2º passo α 5 Teste F 3º passo Ftab F5 24 19 211 4º passo Fcal s²Bs²A 3025 12 5º passo Fcal Ftab Aceitase a H0 6º passo Pelo teste F ao nível de 5 de probabilidade as variâncias são homocedásticas s²p nA 1s²A nB 1s²BnA nB 2 20 1 25 25 1 3020 25 2 278 ICμA μB 1α XA XB tα2 43 s²pnA s²pnB¹² ICμA μB 1α 132 160 202 27820 27825¹² ICμA μB 1α 28 101 ou ICμA μB 1α 381 μA μB 179 Conclusão Pelo intervalo de confiança da diferença entre médias com 95 de índice de confiança o valor zero não está incluído no IC ou seja as médias de A e B diferem entre si a média de B é maior que a de A OBS¹ O valor 101 é chamado de diferença mínima significativa dms Se o 1º valor diferença entre médias for maior ou igual à dms as médias são diferentes Caso contrário as médias são equivalentes Verificação da OBS¹ Se a regra decisória e o valor calculado do teste t são dados por tcal ttab RH0 e tcal XA XBs²pnA s²pnB¹² Então XA XBs²pnA s²pnB¹² ttab RH0 XA XB ttab s²pnA s²pnB¹² RH0 1º valor amarelo dms azul Capítulo 9 Lista de exercícios sobre intervalo de confiança da média populacional 1 Considere os dados de uma amostra de produtividade de milho em kgha Tabela 81 Tabela 81 Valores mensurados de produtividade de milho Observação 1 2 3 4 5 6 7 8 Produtividade 800 900 750 1050 1200 900 950 1000 a Estabeleça o IC a 95 de probabilidade para a produtividade média e interpreteo 2 Um pesquisador utilizou 38 indivíduos e mediu a altura X₁ e o teor de gordura X₂ Os resultados obtidos foram X₁ 239089 sX₁ 35150 X₂ 20976 e sX₂ 03341 Dimensione a amostra para as duas variáveis e diga se ela é representativa ou não Admita Δ₁ 5X₁ Δ₂ 5X₂ e α 005 3 Considere os valores da VAC peso g de frangos de corte aos 42 dias de idade Tabela 82 Tabela 82 Valores mensurados de peso de frangos de corte aos 42 dias de idade Observações 1 2 3 4 5 6 7 Peso 42 dias 3200 3300 3250 3120 3220 3360 3100 a Construa o IC da média populacional com 1 α 095 b Qual o tamanho ideal da amostra quantidade de frangos considerando um intervalo Δ de 10 5 e 1 em torno da média amostral Considere α 5 4 Considere uma VAC X com X 120 e sX 40 Além disso utilize ttab 200 α 5 e responda a Calcule o tamanho ideal da amostra com intervalos de 5 10 e 15 em torno da média b Interprete os resultados considerando a viabilidade econômica e técnica de realização desse experimento com bovinos 5 Sejam os valores de uma VAC X com distribuição normal de acordo com o grupo experimental Tabela 83 SAMPAIO 2007 Tabela 83 Valores de X de acordo com o grupo experimental Grupo X A 72 75 70 71 68 B 72 67 72 70 66 C 67 64 67 63 69 a Construa os IC da média populacional de cada grupo para índices de confiança de 95 e 99 b Sem a utilização da análise de variância verifique se as médias são equivalentes ou não baseadas na construção de intervalos de confiança das diferenças entre as médias α 5 e no teste t para amostras independentes Respostas 1 IC μ 095 94375 11892 kgha ou IC μ 095 82483 μ 106267 hgha Interpretação De um total de 100 IC estimados o valor real de μ estará contido no interior de 95 IC 2 nALT 593972 3528 35 indivíduos Como 38 nPiloto 35 nEstimativa a amostra é representativa para a altura nGOR 643362 4139 41 indivíduos Como 38 nPiloto 41 nEstimativa a amostra não é representativa para a gordura Três elementos devem ser adicionados à amostrapiloto com novas estimativas de Z sx e ttab para que a amostra se torne representativa 3a IC μ 095 322143 8594 g ou IC μ 095 313549 μ 330737 g 3b Se Δ 10 X n 050 frango 7 050 amostra representativa Se Δ 5 X n 199 frangos 7 199 amostra representativa Se Δ 1 X n 4984 50 frangos 7 50 amostra não representativa Coletar mais 42 obs 4a Se Δ 5 X n 178 animais 60 178 amostra não representativa Coletar mais 118 obs Se Δ 10 X n 44 animais 60 44 amostra representativa Se Δ 15 X n 1975 20 animais 60 20 amostra representativa 4b Se Δ 5 X a estimativa do nº de animais é 178 não representativa e inviável economicamente para grandes animais bovinos equinos no entanto possível para pequenos animais aves Se Δ 10 X o número estimado de 44 animais é representativo e mostrase mais adequado econômica e tecnicamente para a realização de estudos por amostragem do que o resultado anterior Entretanto para grandes animais a quantidade ainda pode ser considerada excessiva Entendese por adequação técnica a obtenção de animais homogêneos para sexo idade entre outros Se Δ 15 X a quantidade de 20 animais é representativa e viável para se trabalhar com grandes animais entretanto a confiabilidade precisão da média reduz causando aumento do seu IC A decisão fica por conta do pesquisador de acordo com as condições estruturais de trabalho 57 5a IC μA 095 7120 322 ou IC μA 095 6798 μ 7442 IC μB 095 6940 347 ou IC μB 095 6593 μ 7287 IC μC 095 6600 305 ou IC μC 095 6295 μ 6905 IC μA 099 7120 533 ou IC μA 099 6587 μ 7653 IC μB 099 6940 574 ou IC μB 099 6366 μ 7514 IC μC 099 6600 504 ou IC μC 099 6096 μ 7104 5b Considerando que as variâncias são homocedásticas uma premissa para o uso de testes paramétricos então devese calcular a variância ponderada s2p o s2p nA 1s2A nB 1s2B nC 1s2CnA nB nC 3 s2p 5 1 67 5 1 78 5 1 605 5 5 3 s2p 268 312 24012 82012 683 IC da diferença entre as médias de A e B ICμA μB 1α XA XB tα2 12 s2pnA s2pnB12 ICμA μB 1α 7120 6940 218 6835 683512 ICμA μB 1α 180 360 ou ICμA μB 1α 180 μA μB 540 Pelo IC da diferença entre médias ao nível de 95 de confiança o valor zero está contido no intervalo ou seja as médias de A e B são equivalentes OBS O nº de GL para a estatística t tabelada considerando um teste com Ha bilateral tα2 foi igual a 12 valor igual ao GLRes de uma análise de variância em DIC e que é o nº de GL usado para estimar a s2p Teste t para comparar a média de A contra a média de C considerando variâncias homocedásticas 1º passo H0 μA μC e Ha μA μC 2º passo α 5 Teste t 3º passo ttab t5 12 218 4º passo tcal XA XCs2pnA s2pnC12 7120 66006835 683512 315 5º passo tcal ttab RH0 6º passo Pelo teste t ao nível de 5 de probabilidade existe diferença significativa entre as duas médias ou seja a média de A é maior do que a média de C 58 IC da diferença entre as médias de B e C ICμB μC 1α XB XC tα2 12 s2pnB s2pnC12 ICμA μB 1α 6940 6600 218 6835 683512 ICμA μB 1α 340 360 ou ICμA μB 1α 020 μA μB 700 Pelo IC da diferença entre médias ao nível de 95 de confiança o valor zero está contido no intervalo ou seja as médias de B e C são equivalentes OBS O IC da diferença entre duas médias corresponde a um teste t para duas amostras independentes com Ha bilateral Resultados e conclusão mA 7120 a mB 6940 ab mC 6600 b Pelo IC da diferença entre médias ao nível de 5 de probabilidade médias seguidas por uma mesma letra não diferem entre si Os grupos A e B apresentam maiores médias Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 54 Capítulo 10 Teste de aderência de quiquadrado 2 101 Testes de aderência para uma amostra o Úteis para verificar se determinada amostra é proveniente de uma população específica ou seja se os dados amostrais são ajustados por uma distribuição de probabilidade o Usualmente conhecidos como testes de bondade de ajuste Neste caso retirase uma amostra aleatória e comparase a distribuição amostral observada com a distribuição teórica de interesse 102 Teste de quiquadrado 2 o Teste amplamente utilizado em estudos de genética básica o Para variáveis qualitativas nominais é a única técnica adequada de verificação da bondade do ajuste o Para variáveis qualitativas ordinais o teste de 2 não é sensível ao efeito da ordem e deixa de ser a melhor opção quando a hipótese levar em conta a ordenação o Os dados são categorizados e organizados como frequências notadamente sob a forma de tabela de dupla entrada tabela de contingência com uma linha e s colunas 1 x s Tabela 101 Frequências observadas Os e esperadas Es apresentadas em tabela de contingência 1 x s Classe k1 k2 ks Total Frequência O1 E1 O2 E2 Os Es n o Há o interesse de se observar frequências em pelo menos duas categorias classes o O teste de aderência de 2 é útil para se verificar se a frequência observada na amostra difere ou não da frequência esperada especificada por uma distribuição de probabilidade pressupõese que a H0 é verdadeira ao nível de significância 1021 O método o A hipótese nula é formulada como o conjunto de frequências simples ou frequências relativas proporções esperadas definidas pela distribuição de probabilidade em estudo o Podese testar se a as frequências amostrais observadas diferem ou não das frequências esperadas ou seja se os dados amostrais vêm de uma dada distribuição de probabilidade ou ainda se os desvios são significativos ou não Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 55 1 Passo Enunciar as hipóteses H0 As proporções populacionais Pk de cada classe k são iguais a um valor P0 ou seja P1 P0 da classe 1 P2 P0 da classe 2 Pk P0 da classe k Ha Não H0 ou seja Ha Pk P0k para pelo menos um k Obs1 Os diferentes valores de proporção de cada classe k P0k são os valores especificados pela hipótese nula ou seja são as probabilidades conhecidas que determinam P0 Obs2 No teste de quiquadrado normalmente a Ha será unilateral à direita mas pode ser bilateral 2 Passo Fixar o erro 3 Passo Definir o número de graus de liberdade v e com o auxílio da tabela da distribuição de qui quadrado a região de aceitação de H0 RAH0 e a região de rejeição de H0 RRH0 ou seja determinar o valor da estatística tabelada de quiquadrado 2tab Ver Tabela A na pág 13 Fórmulas para cálculo do número de graus de liberdade o v k 1 se as frequências esperadas puderem ser calculadas sem precisar estimar os parâmetros distribucionais o v k m 1 se as frequências esperadas só puderem ser calculadas após a estimação dos m parâmetros populacionais o k número de classes amostrais da variável aleatória X Curva de densidade de probabilidade de 2 000 005 010 015 Gráfico da Distribuição quiquadrado para gl 5 functionx dchisqx 5 RAH0 1alfa 095 RRH0alfa 1107 x 4 Passo Determinar o valor da estatística calculada de quiquadrado χ²cal que se baseia na diferença entre frequência observada e frequência esperada χ²cal i1 k foi fei² fei fo1 fe1² fe1 fo2 fe2² fe2 fok fek² fek o foi frequência observada ou amostral na iésima classe o fei frequência esperada na iésima classe sob a pressuposição de H0 verdadeira o k número de classes 5 Passo Aplicar a regra decisória o Se χ²cal χ²tab Rejeitase a H0 o Se χ²cal χ²tab Aceitase a H0 6 Passo Concluir o teste com base na hipótese de nulidade ao nível α de probabilidade 1022 Exigências do Teste o Se o número de categorias é igual a 2 k 2 as frequências esperadas devem ser superiores a 5 o Se k 2 não deve haver mais de 20 das frequências esperadas abaixo de 5 e nenhuma frequência esperada igual a zero o Para evitar frequências esperadas pequenas devese combinar as categorias juntar até que as exigências sejam atendidas o Caso as categorias sejam combinadas em apenas duas e mesmo assim as exigências não tenham sido atendidas devese utilizar o Teste Binomial o As observações devem ser independentes Exemplo 101 Um modelo genético especifica que animais de certa população estão classificados em quatro categorias com probabilidades P1 0656 P2 0093 P3 0093 e P4 0158 Dentre 197 animais obtivemos as seguintes frequências observadas O1 125 O2 18 O3 20 e O4 34 Aplique um teste adequado com α 001 para verificar se os dados estão de acordo com o modelo genético postulado Fonte Bussab e Morettin 2006 Resolução Teste bilateral 1 Passo H0 P1 0656 P2 0093 P3 0093 e P4 0158 ou os desvios não são significativos Ha Não H0 ou seja Ha Pk P0k para pelo menos uma categoria ou os desvios são significativos 2 Passo α 001 3 Passo v k 1 4 1 3 χ²tab à direita χ²n1 1α2 χ²3 0995 1284 qchisq09953lowertailT 1 1283816 χ²tab à esquerda χ²n1 α χ²36 0005 007 qchisq0005 3 lowertail TRUE 1 007172177 4 Passo Tabela 1 Frequências observadas fo e esperadas fe Classe k1 k2 k3 k4 Total fofe 125 12923 18 1832 20 1832 34 3113 197 fe1 0656 x 197 12923 fe2 0093 x 197 1832 fe3 0093 x 197 1832 fe4 0158 x 197 3113 χ²cal fo1 fe1² fe1 fo2 fe2² fe2 fo3 fe3² fe3 fo4 fe4² fe4 125 12923² 12923 18 1832² 1832 20 1832² 1832 34 3113² 3113 01385 00056 01541 02646 05628 5 Passo 5 Passo χ²tab à esquerda χ²cal χ²tab à direita AH0 6 Passo Pelo teste quiquadrado ao nível de 1 de probabilidade os dados seguem o modelo genético postulado ou seja as proporções populacionais são aquelas informadas na H0 ou ainda os desvios entre frequências observadas e esperadas não são significativos Script no R helpchisqtest library stats oc125182034 ec12923183218323113 chisqtestope rescalep TRUE uso da função rescalep porque o vetor e não está em ou oc125182034 ec06561009310093101581 chisqtestope Verificação do valorp pchisq0562713lowertailF 1 09049134 O valorp é obtido considerando um teste unilateral à direita Obs1 Devese agrupar algumas categorias de respostas pois mais de 20 das frequências observadas apresentaram valores inferiores a 5 Tabela Junção das categorias com frequências observadas menores que o valor 5 Frequência 0 e 1 2 3 4 5 Total f0 6 8 11 7 8 400 fe 68 83 89 71 88 399 Fonte Siegel e Castellan Júnior 2006 Resolução 1 Passo H0 As falhas se ajustam à distribuição de Poisson com λ 32 ou H0 fe01 68 fe2 83 fe3 89 fe4 71 e fe5 88 Ha As falhas não se ajustam à distribuição de Poisson com λ 32 ou Ha Não H0 ou seja Ha fek fok para pelo menos uma categoria 2 Passo α 005 3 Passo v k 1 5 1 4 Então χ2tab χ20054 949 qchisq0954lowertailT 1 9487729 4 Passo χ²cal 6 68²68 8 83²83 11 89²89 7 71²71 8 88²88 00941 00108 04955 000141 00727 06745 5 Passo χ2cal χ2tab Aceitase a H0 6 Passo Pelo teste de quiquadrado ao nível de 5 de probabilidade a distribuição das falhas mecânicas se ajusta à distribuição de Poisson com média de 32 falhas por hora Script no R oc681178 ec6839983399893997139988399 chisqtestope Verificação do valorp pchisq0672674lowertailF 1 0954656 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 62 Exemplo 104 Seja X uma VAC e x1 x2 x20 os valores de X obtidos em uma amostra que caracteriza a população P Verifique se os dados amostrais n 20 são oriundos de uma distribuição Normal com µ 30 e 2 100 Os dados foram Xc159169171183190195218230238245261269323350361365372385409442 Representação gráfica da distribuição normal Gauss A gx possui um ponto de máximo para x µ A média µX a moda e a mediana são coincidentes Q1 ou Quartil 1 25 dos dados são inferiores e 75 são superiores Q3 ou Quartil 3 25 dos dados são superiores e 75 são superiores Princípio básico Dividir a variação dos dados em intervalos baseado nas medidas de posicionamento Q1 Q2 e Q3 e construir a distribuição de frequências correspondente sob a pressuposição de H0 verdadeira P Nµ2 Resolução Se Z X µ então X Z µ em que µ 30 2 100 e 10 x1 Q1 06745 x 10 30 23255 qnorm02501lowertailT 1 06744898 x2 Q2 0 x 10 30 3000 qnorm05001lowertailT 1 0 x3 Q3 06745 x 10 30 36745 qnorm07501lowertailT 1 06744898 Tabela Dados observados e esperados de X sob suposição de normalidade Classe fo fe 23255 8 5 232553000 4 5 300036745 4 5 36745 4 5 Total 20 20 Q1 Q2Md Q3 25 25 25 25 gx Obs Cada intervalo deve conter 14 das observações ou PX 23255 P 23255 X 3000 3000 X 36745 X 36745 025 1º Passo H0 P N 30100 e Ha Não H0 2º Passo Teste de χ² α 005 3º Passo χ² tab χ²5 3 7815 qchisq0953lowertailT 1 7814728 4º Passo χ² cal Σ foifei² fei 85² 5 45² 5 45² 5 45² 5 18 02 02 02 24 5º Passo Regra decisória χ² cal χ² tab AH0 6º Passo Pelo teste de χ² a 5 de probabilidade a amostra coletada pertence a uma população com distribuição normal com µ 30 e σ² 100 Script no R oc8444 ec520520520520 chisqtestope Verificação do valorp pchisq243lowertailF 1 04936346 Exercício 1 Verifique se os dados amostrais ordenados a seguir procedem de uma N 10 25 Xc104 173 393 444 637 651 761 764 818 848 857 865 971 987 995 1001 1052 1069 1172 1217 1261 1298 1303 1316 1411 1460 1464 1475 1668 2214 q1 qnorm02501lowertailT q2 qnorm05001lowertailT q3 qnorm07501lowertailT pc1 q1510 pc2 q2510 pc3 q3510 oc6996 ec7530753075307530 chisqtestope Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 64 Capítulo 11 Teste de independência de quiquadrado 2 111 Introdução É um teste nãoparamétrico utilizado comumente em estudos de patologia e reprodução animal Se os dados são categorizados e organizados em frequências sob a forma de tabela de dupla entrada com i linhas e j colunas i x j podese verificar a presença ou a ausência de associação dependência entre um fator linhas e a variável resposta colunas por meio do teste de 2 As classes do fator alocado nas linhas da tabela pode representar grupos experimentais definidos pelo pesquisador As classes da variável resposta alocadas nas colunas da tabela podem ser representadas por respostas experimentais distintas de variáveis aleatórias qualitativas nominais e ordinais 112 Protocolo para aplicação do teste de independência de 2 1o Passo Enunciar as hipóteses H0 e Ha do teste de 2 para verificar se há ou não uma associação entre grupo e resposta H0 Grupo e variável resposta são independentes ou os desvios não são significativos Ha Grupo e variável resposta não são independentes ou os desvios são significativos 2o Passo Fixar o nível de significância e identificar a estatística do teste 3o Passo Determinar a região crítica e a região de aceitação de H0 Definir o erro e o número de graus de liberdade GL o GL I 1J 1 o I número linhas da tabela de contingência ou nº de grupos experimentais o J número de colunas da tabela de contingência ou nº de classes de respostas experimentais Figura 111 Curva de densidade de probabilidade da VAC de x2 para GL 5 000 005 010 015 Gráfico da Distribuição quiquadrado para gl 5 functionx dchisqx 5 RAH0 1alfa 095 RRH0alfa 1107 x Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 65 4 passo Obter o valor calculado de 2 com base em informações amostrais Se baseia na diferença entre frequência observada e frequência esperada sob a pressuposição de H0 verdadeira 2cal foij feij2feij com i variando de 1 a I e j variando de 1 a J ou seja 2cal fo11 fe112fe11 fo12 fe122fe12 foij feij2feij o foij frequência observada na iésima linha e na jésima coluna o feij frequência esperada na linha i e na coluna j sob a pressuposição de H0 verdadeira Cálculo das frequências esperadas Tem base na pressuposição de H0 ser verdadeira Realizado de acordo com os totais marginais das observações de grupos e classes de respostas feij total da iésima linha total da jésima coluna total geral 5 passo Aplicar a regra decisória do teste Teste unilateral à direita se x2cal x2tab RH0 6 passo Com o resultado da regra decisória observar a H0 e concluir interpretando o problema Exemplo 111 Verifique a existência de associação entre grupo genético de fêmeas bovinas e fertilidade em condições tropicais com 5 a partir dos dados de frequência Tabela 111 Tabela 111 Frequências observadas para diagnóstico de gestação de acordo com o grupo genético Grupo genético Diagnóstico de gestação Total A 60 60 120 B 60 40 100 C 20 90 110 Total 140 190 330 Resolução 1 Passo H0 As variáveis grupo genético e fertilidade são independentes e Ha As variáveis grupo genético e fertilidade não são independentes 2 Passo Teste de 2 5 3 Passo GL I 1 J 1 3 1 2 1 2 Então 2tab 2 5 2 599 4 Passo feA Total do grupo A Total da classe Total geral 120 140 330 509 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 66 Tabela 112 Frequências observadas e esperadas entre parênteses para diagnóstico de gestação de acordo com o grupo genético Grupo genético Diagnóstico de gestação Total A 60 509 60 691 120 B 60 424 40 576 100 C 20 467 90 633 110 Total 140 190 330 2cal fo11 fe112fe11 fo12 fe122fe12 fo32 fe322fe32 60 5092509 60 6912691 90 6332633 16269 11984 112621 4204 5 Passo x2cal x2tab RH0 6 Passo Pelo teste de quiquadrado ao nível de 5 de probabilidade a fertilidade das fêmeas bovinas é dependente do grupo genético 113 Limitações do teste de 2 Frequências esperadas 5 tendem a superestimar o valor calculado de 2 elevando a chance de rejeição de H0 sendo esta verdadeira erro do tipo I Frequências observadas muito baixas não permitem um estudo adequado da dispersão o Recomendase o número mínimo de 15 observações para cada classe j em cada grupo i o Para o exemplo dado o nº mínimo de observações por casela é de 15 3 2 90 Não se devem analisar frequências observadas nulas o Causa Número de observações baixo ou número de classes de respostas alto o Solução Estabelecer no planejamento experimental um número adequado mínimo de observações Agrupar classes de respostas experimentais Tabela 113 Valores críticos de 2 segundo os graus de liberdade e a probabilidade de erro do tipo I Graus de liberdade Erro do tipo I 010 005 002 001 1 271 384 541 664 2 460 599 782 921 3 625 782 984 1134 4 778 949 1167 1328 5 924 1107 1339 1509 6 1064 1259 1503 1681 7 1202 1407 1662 1848 8 1336 1551 1817 2009 9 1468 1692 1968 2167 10 1599 1831 2116 2321 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 67 Capítulo 11 Lista de exercícios sobre teste de independência de quiquadrado 1 Os resultados de dois métodos cirúrgicos aplicados a lesões ósseas da coluna vertebral foram avaliados em coelhos Tabela 94 Ao nível de 5 de significância o comportamento ósseo pós operatório é dependente do método empregado Tabela 94 Respostas de soldadura vertebral de acordo com o método cirúrgico Método Soldadura vertebral Ausente Parcial Completa A 78 15 8 B 81 25 14 2 Desejase saber se há diferença quanto à preferência dos consumidores em relação ao tipo de carne consumido em três regiões da cidade de Marechal Cândido Rondon 5 Tabela 95 Frequências observadas da preferência de consumo de carne de acordo com a região Região Carne Bovina Suína Aves Porto Mendes 20 32 69 Centro 51 66 63 Iguiporã 50 34 23 3 Sejam os resultados de um experimento no qual se objetivou avaliar o desempenho reprodutivo de fêmeas bovinas manejadas em pastagens em região de cerrado durante estação de monta conduzida entre dezembro de 2003 e março de 2004 Tabela 96 A fertilidade está associada ao grupo genético da fêmea 1 Tabela 96 Frequências observadas do diagnóstico de gestação de acordo com o grupo genético Grupo genético Diagnóstico de Gestação Europeu 61 89 Europeu x Zebuíno 196 41 Zebuíno 129 59 4 Sejam os resultados de aceitabilidade pelo público de um teste de avaliação de três diferentes proporções de soro de leite em uma nova bebida láctea Tabela 97 Tabela 97 Frequências observadas de aceitabilidade sabor de acordo com a proporção de soro Proporção Classe Muito Ruim Ruim Regular Bom Ótimo A 1 9 20 9 1 B 0 5 18 20 2 C 1 30 10 9 0 a Você observa algum inconveniente na realização de teste de hipótese neste caso Existe alguma sugestão ou alteração que possa ser realizada Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 68 b De acordo com a resposta no item a faça o teste de hipótese apropriado a esta situação 5 c No contexto dos dados e auxiliado pela conclusão obtida no item b qual seria a sua recomendação quanto à proporção de soro de leite a ser utilizada 5 Sejam os dados de um experimento que objetivou avaliar a influência do diluidor do sêmen no desenvolvimento in vitro de ovócitos bovinos após maturação e fecundação in vitro Tabela 98 O desenvolvimento in vitro é dependente do diluidor 5 Tabela 98 Frequências observadas de desenvolvimento in vitro de acordo com o diluidor do sêmen Diluidor Desenvolvimento in vitro Lactose gema de ovo 231 33 Citrato gema de ovo 271 40 Tris gema de ovo 99 22 Respostas 1 2tab 599 e 2cal 257 2 2tab 949 e 2cal 3964 3 2tab 921 e 2cal 7385 4 2tab 949 e 2cal 3335 5 2tab 599 e 2cal 288 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 69 Capítulo 12 Conceitos e princípios básicos da experimentação 121 Conceitos em estatística experimental a Experimento ou ensaio trabalho previamente planejado que segue princípios básicos e no qual se faz a comparação dos efeitos dos tratamentos b Tratamento método elemento ou material cujo efeito desejase medir ou comparar em um ensaio Exemplo variedades de milho níveis de proteína na ração linhagens temperaturas de estocagem entre outros NCII12 em que NC número de contrastes comparações entre duas médias c Unidade experimental UE ou parcela é a unidade que vai receber o tratamento e fornecer os dados que devem refletir o seu efeito Ela pode ser Um animal bovino em ensaios de animais de grande porte Um leitão ou poedeira ou um grupo de leitões ou de frangos de corte em experimentos de alimentação de animais de médio a pequeno porte Uma única linha de 10 m de comprimento ou 2 a 4 linhas de mesmo tamanho em ensaios de competição de forrageiras Um vaso em ensaios feitos em casa de vegetação Uma placa de Petri com um meio de cultura em laboratório d Delineamento experimental é o plano usado na experimentação e constitui a forma como os tratamentos são designados às parcelas Visa a garantir que a estimativa da variação individual não teve influência de outros fatores durante a condução do experimento Ex Delineamento inteiramente casualizado DIC delineamento em blocos casualizados DBC delineamento em quadrado latino DQL 122 Princípios básicos da experimentação 1221 Repetição de unidades experimentais É a aplicação do mesmo tratamento a várias parcelas num mesmo ensaio Finalidade Permite a obtenção de uma estimativa do erro experimental QMRes o Erro ou resíduo variação dos valores medidos nas UE dentro de cada tratamento A definição do número de repetições de um ensaio depende o Do tipo de resposta média e desvio padrão da variável o Recomendação prática os experimentos devem apresentar pelo menos 20 parcelas e 10 graus de liberdade GL para o resíduo na análise de variância ANOVA Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 70 o Quanto maior o número de repetições maior a precisão do experimento o Além de determinado número de repetições o incremento na precisão não é significativo 1222 Casualização dos tratamentos às unidades experimentais Consiste em dar a todos os tratamentos a mesma chance por sorteio de serem designados a qualquer parcela evitando que algum tratamento seja favorecido ou desfavorecido por fatores externos Finalidades Permite a validação da estimativa dos erros experimentais tornandoos independentes Cov εijεij 0 uma das pressuposições para uso de testes de significância teste F na ANOVA 1223 Princípio do Controle Local Consiste na divisão de um ambiente heterogêneo em subambientes homogêneos blocos ou seja todos os tratamentos devem ser casualizados às parcelas de cada bloco restrição Finalidade Redução do erro experimental pelo controle da fonte de variação sistemática Vantagem Redução na soma de quadrados do resíduo na ANOVA em comparação ao DIC Desvantagem Redução no número de GL do resíduo na ANOVA em comparação ao DIC Deve haver variação de um bloco para os outros variação entre blocos 123 Fontes de variação FV de um experimento 1231 Premeditada Introduzida pelo pesquisador para fazer comparações Exemplos tratamentos rações adubos embalagens medicamentos tempo de estocagem entre outros 1232 Sistemática Variações não intencionais mas de natureza conhecida Variação inerente ao material experimental Podem ser controladas pelo pesquisador Exemplos idade heterogeneidade do solo tamanho de semente entre outras 1233 Aleatória Variações de origem desconhecida não podendo ser controladas Constituem o erro experimental Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 71 Capítulo 13 Delineamento inteiramente casualizado DIC 131 Introdução A distribuição dos tratamentos às parcelas é feita ao acaso ou seja não é feita nenhuma restrição na casualização Ocorre a utilização de dois princípios básicos da experimentação repetição e casualização Indicado quando as condições experimentais ambiente e material experimental são homogêneas 132 Vantagens Podese utilizar qualquer quantidade de tratamentos e repetições O número de repetições pode variar de um tratamento para outro porém no planejamento experimental devese usar o mesmo número de repetições No DIC há maior número de GL associado ao resíduo do que em outros delineamentos 133 Desvantagens Exige homogeneidade total das condições experimentais A estimativa de variância residual pode ser alta pois não se usa o controle local 134 Modelo estatístico Seu uso visa a identificar os fatores que estão influenciando a variável em estudo Yij m ti εij o Yij valor referente ao iésimo tratamento na jésima repetição o m média de todas as unidades experimentais média geral o ti efeito de tratamento ti ȳi ȳ o εij erro associado a cada observação εij Yij ȳi o O erro experimental deve ser minimizado não há controle pois é um efeito aleatório o Variações observadas entre as repetições do mesmo tratamento 135 Quadro de tabulação dos dados Seja um experimento planejado no DIC com I tratamentos e J repetições Tabela 131 Tabela 131 Dados da variável Y de acordo com o número de tratamentos e de repetições Tratamento Repetição 1 2 J Totais 1 Y11 Y12 Y1J Y1 2 Y21 Y22 Y2J Y2 I YI1 YI2 YIJ YI Totais Y1 Y2 YJ Y G Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 72 Total para o tratamento 1 T1 Y1 Y1j Total para o tratamento i Ti Yi Yij Média para o tratamento i ȳi TiJ YiJ Total geral G Yij Ti Y no de unidades experimentais n I x J Média geral ȳ GIJ Yijn Tin 136 Análise de variância ANOVA Técnica que permite a decomposição da variação existente entre todas as observações variação total na variação devido à diferença entre os efeitos dos tratamentos e na variação devido ao acaso erro experimental ou resíduo Total10 Trat7 Res3 1361 Pressuposições Os erros experimentais devem ser normalmente distribuídos independentes com média zero e variância comum homogeneidade de variâncias de tratamentos εij NID 2 Aditividade dos efeitos incluídos no modelo estatístico 1362 Decomposição da variação total Partindose do modelo estatístico Yij m ti εij devese seguir os seguintes passos o 1º Passo Substituição do efeito de tratamento ti mi m no modelo e passando a média geral para à esquerda da igualdade com sinal trocado o Yij m mi m εij o 2º Passo Substituição de m e mi por seus estimadores o Yij ȳ ȳi ȳ εij o 3º Passo Elevação de ambos os termos ao quadrado o Yij ȳ2 ȳi ȳ εij2 o 4º Passo Aplicação de somatório duplo em ambos os lados da igualdade o Yij ȳ2 ȳi ȳ εij2 o 5º Passo Desenvolvimento do produto notável quadrado da soma de dois termos e aplicação da distributiva do somatório o Yij ȳ2 ȳi ȳ2 εij2 duplos produtos o Mas duplos produtos 0 efeito da casualização em tornar os erros independentes o Desse modo obtémse SQTot SQTrat SQRes 1363 Fórmulas práticas para experimentos balanceados mesmo número de repetições por tratamento SQTot Yij ȳ2 Yij2 Yij2IJ Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 73 SQTrat ȳi ȳ2 Ti2J Yij2IJ SQRes SQTot SQTrat 1364 Fórmulas para experimentos desbalanceados número diferente de repetições por tratamento SQTot Yij ȳ2 Yij2 Yij2n SQTrat Ti2ri Yij2n em que n é o número de UE ri e ir é o nº de UE do tratamento i SQRes SQTot SQTrat 1365 Tabela da ANOVA DIC balanceado Tabela 132 Graus de liberdade GL somas de quadrados SQ quadrados médios QM e estatística calculada F das fontes de variação de um experimento em DIC FV GL SQ QM F Tratamentos I 1 SQTrat SQTratI 1 QMTratQMRes Resíduo IJ 1 SQRes SQResIJ 1 Total IJ 1 SQTot QM divisão da SQ pelo respectivo número de GL Fcal divisão do QMTrat pelo QMRes Valor da estatística F tabelada Ftab observar o GLTrat na coluna da tabela de F e o GLRes na linha da tabela de F Deste modo temse Ftab FGLTrat GLRes 1366 Hipóteses para o teste F da ANOVA para tratamentos H0 m1 m2 mI m ou H0 2Trat 0 o Todos os possíveis contrastes entre médias de tratamentos são estatisticamente nulos ao nível de probabilidade que foi executado o teste Ha Não H0 o Existe pelo menos um contraste entre médias de tratamentos estatisticamente diferente de zero ao nível de probabilidade que foi realizado o teste C1 mt1 mt2 0 C1 mt1 mt2 1367 Regra decisória para o teste F e conclusão Se Fcal Ftab rejeitase H0 Há diferença entre tratamentos para pelo menos um contraste ao nível de significância em que foi realizado o teste Se Fcal Ftab não se rejeita H0 Os tratamentos têm efeitos iguais ao nível de significância em que foi realizado o teste Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 74 1368 Coeficiente de variação CV QMRes12ȳ 100 em que QMRes quadrado médio do resíduo obtido na ANOVA e ȳ média geral do experimento O CV é utilizado para avaliar a precisão de experimentos Quanto menor seu valor mais precisão será obtida na avaliação de variáveis de um experimento Tabela 133 Tabela 133 Sugestão empírica para classificação e avaliação da precisão de uma variável experimental CV Classificação Precisão 10 Baixo Alta 10 a 20 Médio Média 20 a 30 Alto Baixa 30 Muito Alto Muito Baixa Exemplo 131 Sejam as produções tha em um experimento de competição de cultivares de canade açúcar conduzido em DIC com seis repetições 005 Tabela 134 Tabela 134 Produção de canadeaçúcar de acordo com o cultivar e repetição Repetição Cultivar A B C D 1 54 60 59 45 2 40 55 47 33 3 51 66 44 34 4 36 61 49 48 5 50 54 62 42 6 48 61 60 44 Total 279 357 321 246 Resolução GLTot IJ 1 4 x 6 1 23 GLTrat I 1 4 1 3 GLRes IJ 1 4 x 6 1 20 SQTot Yij2 Yij2IJ 542 442 54 44246 62301 1203224 62301 6030038 200062 C6030038 SQTrat Ti2J Yij2IJ 2792 24626 1203224 614745 6030038 117412 SQRes SQTot SQTrat 200062 117412 82650 QMTrat SQTratGLTrat 1174123 39137 QMRes SQResGLRes 8265020 4132 Teste F 1º Passo H0 m1 m2 m3 m4 m Ha Não H0 2º Passo Ftab F5 3 20 310 qf095320lowertailT 1 3098391 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 75 3º Passo Fcal QMTratQMRes 391374132 947 4º Passo Fcal Ftab rejeitase a H0 pf947320lowertailF 1 00004233971 pvalor 000042 alfa005 então RH0 5º Passo Pelo teste F ao nível de 5 de probabilidade existe pelo menos um contraste entre médias de cultivares que é estatisticamente diferente de zero Ou ainda pelo teste F ao nível de 5 de probabilidade há efeito de cultivar sobre a produção Tabela da ANOVA FV GL SQ QM F Tratamentos 3 117412 39137 947 Resíduo 20 82650 4132 Total 23 200062 Significativo ao nível de 5 de probabilidade Precisão do experimento ȳ Yijn 12030024 50125 CV QMRes12ȳ 100 41321250125 100 1282 Tabela F Limites unilaterais de F ao nível de 5 de probabilidade para o caso de F 1 n2 1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 20 1 1614 1995 2157 2246 2302 2340 2368 2389 2405 2419 2430 2439 2444 2450 2459 2460 2480 2 1851 1900 1916 1925 1930 1933 1935 1937 1938 1940 1940 1941 1942 1942 1943 1943 1945 3 1013 955 928 912 901 894 889 885 881 879 876 874 872 871 870 869 866 4 771 694 659 639 626 616 609 604 600 596 593 591 589 587 586 584 580 5 661 579 541 519 505 495 488 482 477 474 470 468 466 464 462 460 456 6 599 514 476 453 439 428 421 415 410 406 403 400 398 396 394 392 387 7 559 474 435 412 397 387 379 373 368 364 360 357 355 352 351 349 344 8 532 446 407 384 369 358 350 344 339 335 331 328 325 323 322 320 315 9 512 426 386 363 348 337 329 323 318 314 310 307 304 302 301 298 294 10 496 410 371 348 333 322 314 307 302 298 294 291 288 286 285 282 277 11 484 398 359 336 320 309 301 295 290 285 282 279 276 274 272 270 265 12 475 389 349 326 311 300 291 285 280 275 272 269 266 264 262 260 254 13 467 381 341 318 303 292 283 277 271 267 263 260 257 255 253 251 246 14 460 374 334 311 296 285 276 270 265 260 256 253 250 248 246 244 239 15 454 368 329 306 290 279 271 264 259 254 251 248 245 243 240 239 233 16 449 363 324 301 285 274 266 259 254 249 245 242 239 237 235 233 228 17 445 359 320 296 281 270 261 255 249 245 241 238 235 233 231 229 223 18 441 355 316 293 277 266 258 251 246 241 237 234 231 229 227 225 219 19 438 352 313 290 274 263 254 248 242 238 234 231 228 226 223 221 216 20 435 349 310 287 271 260 251 245 239 235 231 228 225 223 220 218 212 n1 número de graus de liberdade do numerador e n2 número de graus de liberdade do denominador Tabela F Limites unilaterais de F ao nível de 1 de probabilidade para o caso de F 1 n2 1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 20 1 4052 5000 5403 5625 5764 5859 5928 5982 6022 6056 6082 6106 6125 6142 6157 6169 6209 2 9850 9900 9917 9925 9930 9933 9936 9937 9939 9940 9941 9942 9942 9943 9943 9944 9945 3 3412 3082 2946 2871 2824 2791 2767 2749 2735 2723 2713 2705 2698 2692 2687 2683 2669 4 2120 1800 1669 1598 1552 1521 1498 1480 1466 1455 1445 1437 1430 1424 1420 1415 1402 5 1626 1327 1206 1139 1097 1067 1046 1029 1016 1005 996 989 983 977 972 968 955 6 1375 1092 978 915 875 847 826 810 798 787 779 772 766 760 756 752 740 7 1225 955 845 785 846 719 699 684 672 662 654 647 641 635 631 627 616 8 1126 865 759 701 663 637 618 603 591 581 574 567 561 556 552 548 536 9 1056 802 699 642 606 580 561 547 535 526 518 511 505 500 496 492 481 10 1004 756 655 599 564 539 520 506 494 485 478 471 465 460 456 452 441 11 965 721 622 567 532 507 489 474 463 454 446 440 434 429 425 421 410 12 933 693 595 541 506 482 464 450 439 430 422 416 410 405 401 398 386 13 907 670 574 521 486 462 444 430 419 410 402 396 390 385 382 378 366 14 886 651 556 504 469 446 428 414 403 394 386 380 375 370 366 362 351 15 868 636 542 489 456 432 414 400 389 380 373 367 361 356 352 348 337 16 853 623 529 477 444 420 403 389 378 369 361 355 350 345 341 337 326 17 840 611 518 467 434 410 393 379 368 359 352 346 340 335 331 327 316 18 829 601 509 458 425 401 384 371 360 351 344 337 332 327 323 319 308 19 818 593 501 450 417 394 377 363 352 343 336 330 324 319 315 312 300 20 810 585 494 443 410 387 370 356 346 337 330 323 318 313 309 305 294 n1 número de graus de liberdade do numerador e n2 número de graus de liberdade do denominador Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 76 Script no R tratrepc14 each6 trat reprepc164 rep y1c544051365048605566615461594744496260453334484244 y1 diccbindtratrepy1 dic classdic T1sumdic163 T1 m1T16 m1 T2sumdic7123 T2 m2T26 m2 T3sumdic13183 T3 m3T36 m3 T4sumdic19243 T4 m4T46 m4 totsumdic3 tot meantotlengthy1 mean Csumy12lengthy1 C sqtotsumy12C sqtot sqtratsumT12T22T32T426C sqtrat sqressqtotsqtrat sqres Resolução pelo R Estatísticas descritivas gerais requirepsych describey1 requirefBasics basicStatsy1 ci 095 Estatísticas descritivas por tratamento describeByy1trat basicStatsy1trat ci 095 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 77 Análise de variância ANOVA y1c544051365048605566615461594744496260453334484244 tratrepc14 each6 ou tratfactorrepc1234 each6 reprepc164 ou repfactorrep164 diccbindtratrepy1 classdic dicdataframetratrepy1 tratasfactordictrat repasfactordicrep classtrat classrep headdic aovdic aovy1 trat Armazenando a ANOVA do TIPO I no objeto aovdic summaryaovdic Obtendo a ANOVA anovaaovdic Verificação dos pressupostos para realização de ANOVA residualsaovdicObtenção dos resíduos Testes de ShapiroWilk SW para verificação da normalidade dos resíduos H0 Os resíduos se aderem à distribuição normal shapirotestaovdicresiduals Análise de resíduos análise gráfica fittedvaluesaovdic residualsaovdic residuos residaovdic preditos fittedaovdic plotpreditos residuos Obtenção dos resíduos padronizados s2 sumresiduos2 aovdicdfres respad residuossqrts2 respad Boxplot dos resíduos padronizados boxplotrespad Gráfico de quantis teóricos da normal 0 1 para as probabilidades dos resíduos qqnormrespad ylabResíduos padronizados mainNULL qqlinerespad Teste de Bartlett para verificação da homogeneidade de variâncias nos resíduos H0 Variâncias iguais homogêneas librarystats bartletttestaovdicresiduals trat ou bartletttesty1 trat Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 78 Capítulo 13 Lista de exercícios sobre DICANOVA 1 Para comparar a produtividade de quatro variedades de milho um agrônomo tomou vinte parcelas similares e distribuiu inteiramente ao acaso cada uma das quatro variedades em cinco parcelas experimentais A partir dos dados experimentais obtidos Tabela 135 é possível concluir que existe diferença significativa entre as variedades com relação a produtividade utilizando o nível de significância de 5 Calcule o CV do experimento Tabela 135 Produtividade de variedades de milho em cada unidade experimental Variedades A B C D 25 31 22 33 26 25 26 29 20 28 28 31 23 27 25 34 21 24 29 28 Totais 115 135 130 155 Médias 23 27 26 31 Resolução pelo R x1filechoose dic1 readcsv2x1 Leitura dos dados da planilha ex1DIC e atribuição ao objeto dic1 strdic1 headdic1 Obtenção das seis primeiras linhas da planilha dic1 tratasfactordic1trat Conversão de tratamento em um fator repasfactordic1rep Conversão de repetição em um fator aovdic1 aovdic1y trat ANOVA contida no objeto aovdic1 anovaaovdic1 Obtenção da ANOVA 2 Um treinador de corrida rústica objetivando melhorar o desempenho de seus atletas testou três novas técnicas de preparação com um grupo de 15 atletas completamente homogêneos para as características essenciais A designação das técnicas de preparação aos atletas foi feita totalmente ao acaso e o número de atletas avaliados em cada uma das técnicas foi o mesmo Após um dado período de tempo de aprendizado da técnica pelos atletas os resultados foram obtidos Tabela 136 Tabela 136 Produtividade de variedades de milho em cada unidade experimental Repetições Técnicas de Preparação 1 2 3 1 130 125 127 2 129 131 129 3 128 130 131 4 126 129 128 5 130 127 130 Totais 643 642 645 De acordo com os resultados obtidos pedese a Quais os princípios básicos da experimentação utilizados pelo pesquisador neste experimento b Qual foi a unidade experimental nesta pesquisa c É possível concluir que existe diferença entre as técnicas de preparação com 1 d Qual seria a técnica a ser recomendada Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 79 3 Com o objetivo de diminuir o consumo dos motores à gasolina uma indústria petroquímica testou quatro novas formulações de gasolina as quais se diferenciavam pelo tipo de aditivo que foi acrescentado à mesma durante o seu processo de fabricação Para efetuar o teste a indústria utilizou carros completamente homogêneos para todas as características e a designação das formulações aos carros foi feita inteiramente ao acaso Após os testes de rodagem os resultados kml foram obtidos Tabela 137 Existe diferença entre os quatro tipos de formulações 5 e SQRes 60264 Tabela 137 Estatísticas descritivas do consumo de combustível dos carros de acordo o tipo de aditivo Estatísticas Tipo de aditivo Ácido Forte Ácido Fraco Base Forte Base Fraca Médias 1481 656 1006 1009 Número de carros 10 10 10 10 Resolução pelo R m11481 m2656 m31006 m41009 medrbindm1m2m3m4 mmeanmed rep10 T1m1rep T2m2rep T3m3rep T4m4rep totrbindT1T2T3T4 Csumtot24rep C sqtratsumT12T22T32T42repC sqtrat gltrat3 qmtratsqtratgltrat qmtrat sqres60264 glres393 qmressqresglres qmres fcalqmtratqmres fcal ftabqf095336lowertailT ftab pvalpffcal336lowertailF pval cvsqrtqmresm100 cv Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 80 4 Com o objetivo de verificar se a parótida tem influência na taxa de glicose no sangue de ratos um experimento em DIC foi realizado Vinte e quatro ratos machos da raça Wistar com 60 dias de idade foram escolhidos aleatoriamente e separados em três grupos Os dados de glicose mg100 ml de sangue segundo o grupo encontramse na Tabela 138 Para 5 teste a H0 e conclua Tabela 138 Valores de glicose sanguínea de ratos de acordo com o tratamento e repetição Parotidectomizado 960 950 1000 1080 1200 1105 970 925 Pseudoparotidectomizado 900 930 890 880 870 925 875 850 Normal 860 850 1050 1050 900 1000 950 950 5 Considere um experimento instalado em DIC objetivando verificar se há efeito significativo de linhagens sobre o peso médio g de frangos de corte aos 42 dias de idade Tabela 139 Ao nível de 5 de probabilidade faça a ANOVA teste a H0 e conclua Calcule o CV do experimento Tabela 139 Pesos médios de frangos aos 42 dias de idade de acordo com as linhagens e as repetições Linhagens A B C 3450 2980 3150 3260 2975 3200 3330 3050 3300 Respostas 1 Fcal 780 Ftab 324 CV 989 2a Repetição e Casualização b Cada atleta c Fcal 0126 Ftab 693 d Qualquer técnica pode ser recomendada 3 Fcal 68507 Ftab 287 4 Fcal 673 Ftab 347 5 Fcal 2303 Ftab 514 CV 202 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 81 Capítulo 14 Delineamento em blocos casualizados completos DBC 141 Introdução Recomendado quando as condições experimentais não são homogêneas 142 Princípios básicos da experimentação utilizados Repetição Existe pelo menos uma repetição de cada tratamento distribuída inteiramente ao acaso dentro de cada bloco Casualização Os tratamentos são distribuídos ao acaso às parcelas dentro de cada bloco Aplicação do controle local o Divisão da área ou do material experimental heterogêneo em subdivisões homogêneas blocos Dentro de cada bloco deve haver homogeneidade do material experimental o Finalidade Redução do erro experimental pelo controle de uma FV sistemática o Uma parte da SQ e do QM do resíduo será incorporada na SQ e QM de blocos respectivamente que corresponde à variação entre os blocos 143 Vantagens e desvantagens analíticas em relação ao DIC Vantagem Redução na SQRes na ANOVA Desvantagem Redução no número de GLRes na ANOVA 144 Fontes de variação sistemáticas comumente utilizadas Em experimentos de campo subdivisão da área em blocos homogêneos por declividade fertilidade incidência de luz solar entre outras Em experimentos zootécnicos subdivisão dos animais em subgrupos homogêneos com relação à idade peso inicial raça entre outras 145 Modelo estatístico Yij m ti bj εij o Yij valor da variável em estudo referente ao tratamento i no bloco j o m média de todas as unidades experimentais média geral o ti efeito do tratamento i ti ȳi ȳ o bj efeito do bloco j bj ȳj ȳ o εij erro associado à observação Yij εij Yij ȳi ȳj ȳ o O erro experimental deve ser minimizado não há controle pois é um efeito aleatório o Variações observadas entre as repetições do mesmo tratamento Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 82 146 Quadro de tabulação dos dados Seja um ensaio planejado no DBC com I tratamentos e J repetições blocos Tabela 141 Tabela 141 Dados da variável Y de acordo com o número de tratamentos e de blocos Tratamento Bloco 1 2 J Total 1 Y11 Y12 Y1J Y1 2 Y21 Y22 Y2J Y2 I YI1 YI2 YIJ YI Total Y1 Y2 YJ Y G Assim podese extrair as seguintes quantidades o Total para o tratamento 1 T1 Y1 Y1j Total para o tratamento i Ti Yi Yij o Média para o tratamento i ȳi TiJ YiJ Total para o bloco 1 B1 Y1 Yi1 o Total para o bloco j Bj Yj Yij Média para o bloco j ȳj BjI YjI o Total geral G Yij Ti Bj Y número de unidades experimentais n I J o Média geral do experimento ȳ GIJ Yijn Tin Bjn 147 Análise de variância ANOVA Técnica que permite a decomposição da variação total que existe entre todas as observações na variação devido às diferenças entre os efeitos de tratamentos na variação devido às diferenças entre os efeitos de blocos e na variação devido ao acaso resíduo 1471 Pressuposições Os erros experimentais devem ser normalmente distribuídos independentes com média zero e variância comum homogeneidade de variâncias de tratamentos εij NID 0 2 Aditividade dos efeitos incluídos no modelo estatístico 1472 Decomposição da variação total Partindose do modelo estatístico Yij m ti bj εij devese seguir os seguintes passos o 1º Passo Substituição dos efeitos de tratamento ti mi m e de bloco bj mj m no modelo e passando a média geral para à esquerda da igualdade com sinal trocado o Yij m mi m mj m εij o 2º Passo Substituição de m mi e mj por seus estimadores o Yij ȳ ȳi ȳ ȳj ȳ εij o 3º Passo Elevação de ambos os termos ao quadrado Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 83 o Yij ȳ2 ȳi ȳ ȳj ȳ εij2 o 4º Passo Aplicação de somatório duplo em ambos os lados da igualdade o Yij ȳ2 ȳi ȳ ȳj ȳ εij2 o 5º Passo Desenvolvimento do produto notável quadrado da soma de três termos e aplicação da distributiva do somatório o Yij ȳ2 ȳi ȳ2 ȳj ȳ2 εij2 duplos produtos o Mas duplos produtos 0 efeito da casualização em tornar os erros independentes o Desse modo obtémse SQTot SQTrat SQBlo SQRes 1473 Fórmulas práticas para experimentos balanceados SQTot Yij ȳ2 Yij2 Yij2IJ SQTrat ȳi ȳ2 Ti2J Yij2IJ SQBlo ȳj ȳ2 Bj2I Yij2IJ SQRes SQTot SQTrat SQBlo 1474 Tabela da ANOVA DBC completo Tabela 142 Graus de liberdade GL somas de quadrados SQ quadrados médios QM e estatística calculada F das fontes de variação de um experimento em DBC FV GL SQ QM F Tratamentos I 1 SQTrat SQTratI1 QMTratQMRes Blocos J 1 SQBlo Resíduo I 1J 1 SQRes SQResI1J1 Total IJ 1 SQTot QM divisão da SQ pelo respectivo número de GL Fcal para tratamentos divisão do QMTrat pelo QMRes Ftab observar o GLTrat e o GLRes ou seja Ftab FGLTrat GLRes 1475 Hipóteses para o teste F da ANOVA para tratamentos idem DIC H0 m1 m2 mI m ou H0 2Trat 0 o Todos os possíveis contrastes entre médias de tratamentos são estatisticamente nulos ao nível de probabilidade que foi executado o teste Ha Não H0 o Existe pelo menos um contraste entre médias de tratamentos estatisticamente diferente de zero ao nível de significância que foi realizado o teste Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 84 1476 Regra decisória e conclusão para o teste F idem DIC Se Fcal Ftab rejeitase H0 e concluise que os tratamentos têm efeito diferenciado ao nível de significância em que foi realizado o teste ou seja há efeito de tratamento sobre a variável Y Se Fcal Ftab não se rejeita H0 e concluise que os tratamentos têm efeitos iguais ao nível de significância em que foi realizado o teste 1477 Coeficiente de variação CV QMRes12ȳ 100 em que QMRes quadrado médio do resíduo obtido na ANOVA realizada em DBC e ȳ média geral do experimento Exemplo 141 Sejam as produções kgparcela de 60 m2 em um experimento de competição de variedades de milho conduzido em DBC com cinco repetições blocos e 001 Tabela 143 Tabela 143 Produção de milho de acordo com a variedade e repetição Variedade Bloco Total B1 B2 B3 B4 B5 V1 354 306 287 362 292 1601 V2 428 354 292 351 348 1773 V3 163 162 135 203 194 857 V4 158 145 104 216 183 806 V5 215 187 158 254 252 1066 V6 193 232 142 217 288 1072 Total 1511 1386 1118 1603 1557 7175 Resolução GLTot IJ 1 6 5 1 29 GLTrat I 1 6 1 5 GLBlo J 1 5 1 4 GLRes I 1J 1 6 1 5 1 5 4 20 ou 29 5 4 20 SQTot Yij2 Yij2IJ 3542 2882 354 288265 1917979 7175230 1917979 1716021 201958 SQTrat Ti2J Yij2IJ 16012 107225 C 1875271 1716021 159250 SQBlo Bj2I Yij2IJ 15112 155726 C 1741317 1716021 25296 SQRes SQTot SQTrat SQBlo 201958 159250 25296 17412 QMTrat SQTratGLTrat 1592505 31850 QMRes SQResGLRes 1741220 871 Teste F 1º Passo H0 m1 m2 m3 m4 m5 m6 m Ha Não H0 2º Passo Ftab F1 5 20 410 qf099520lowertailT 1 4102685 3º Passo Fcal QMTratQMRes 31850871 3657 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 85 4º Passo Fcal Ftab rejeitase a H0 5º Passo Pelo teste F ao nível de 1 de probabilidade existe pelo menos um contraste entre médias de variedades que é estatisticamente diferente de zero Tabela da ANOVA FV GL SQ QM F Tratamentos 5 159250 31850 3657 Blocos 4 25296 Resíduo 20 17412 871 Total 29 201958 Significativo ao nível de 1 de probabilidade pvalor pf3657520lowertailF 1 2139011e09 Precisão do experimento ȳ Yijn 7175030 2392 CV QMRes12ȳ 100 871122392 100 1234 Script do R y1c35430628736229242835429235134816316213520319415814510421618 3215187158254252193232142217288 tratrepc16 each5 reprepc156 dbccbindtratrepy1 dbc classdbc dbcdataframetratrepy1 tratasfactordbctrat repasfactordbcrep headdbc aovdbc aovy1 tratrep Armazenamento da ANOVA do TIPO I no objeto aovdbc anovaaovdbc Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 86 Capítulo 14 Lista de exercícios sobre DBCANOVA 1 Um pesquisador instalou um experimento em DBC para verificar o efeito de cinco produtos comerciais para suprir a deficiência de micronutriente ppmml de sangue em caprinos os quais foram separados em três grupos segundo a idade Faça a ANOVA para os resultados obtidos Tabela 144 Tabela 144 Valores de micronutriente sanguíneo de acordo com os tratamentos e os blocos Blocos Produtos comerciais Totais 1 2 3 4 5 1 83 86 103 116 132 520 2 63 69 79 81 98 390 3 55 61 79 79 91 365 Totais 201 216 261 276 321 1275 Resolução x1filechoose dbc1 readcsv2x1 strdbc1 headdbc1 Obtenção das seis primeiras linhas da planilha dbc1 tratasfactordbc1trat Conversão de tratamento em um fator repasfactordbc1rep Conversão de repetição em um fator aovdbc1 aovdbc1y tratrep ANOVA contida no objeto aovdbc1 anovaaovdbc1 Obtenção da Tabela de ANOVA libraryagricolae dfdfresidualaovdbc1 MSerrordevianceaovdbc1df tk1dbcHSDtestdbc1ytratdfMSerrorconsoleTRUEalpha005 plottk1dbc las1main HSDtestdbc1ytratdfMSerrorconsoleTRUEgroupFalpha005ValoresP e ICdif 1a 1354 mt5 10700 a mt4 9200 b mt3 8700 b mt2 7200 c mt1 6700 c Médias seguidas por pelo menos uma mesma letra não diferem entre si pelo teste de Tukey com 5 2 Para aumentar a produção de lã por meio de uma alimentação mais apropriada um criador separou 28 ovelhas de sua criação e dividiuas em sete grupos de idades distintas Dentro de cada grupo havia quatro ovelhas de mesma idade homogêneas para as demais características Dentro de cada grupo foi realizado um sorteio para distribuir inteiramente ao acaso os quatro tipos de alimentação TA às parcelas Cada parcela foi composta por uma ovelha O experimento se iniciou logo após as ovelhas terem sido submetidas a uma tosquia e se encerrou em momento apropriado com uma nova tosquia As amostras de lã foram lavadas para obtenção dos pesos de velo limpo kg Tabela 145 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 87 Tabela 145 Valores de peso de velo limpo de acordo com os tratamentos e os blocos TA Grupos Totais 1 2 3 4 5 6 7 1 30 32 33 34 29 30 33 221 2 29 31 34 31 33 33 29 220 3 43 47 46 47 48 44 47 322 4 23 25 21 19 20 21 22 151 Totais 125 135 134 131 130 128 131 914 a Qual o tipo de delineamento experimental que o criador utilizou Justifique sua resposta b Existe diferença 1 entre os tipos de alimentação fornecidos às ovelhas x2filechoose dbc2 readcsv2x2 strdbc2 dbc2 tratasfactordbc2trat Conversão de tratamento em um fator repasfactordbc2rep Conversão de repetição em um fator aovdbc2 aovdbc2y tratrep ANOVA contida no objeto aovdbc2 anovaaovdbc2 Obtenção da Tabela de ANOVA tapplydbc2ytratmean Médias 3 Proceda a ANOVA 5 aos dados de um experimento instalado no DBC com cinco tratamentos e quatro repetições Tabela 146 Tabela 146 Resultados de um experimento em DBC segundo os tratamentos e blocos Tratamentos Blocos Total 1 2 3 4 1 14236 14478 14519 13888 57121 2 13928 13777 14444 13061 55210 3 14073 13406 13607 14411 55497 4 15088 13583 13697 13636 56004 5 15349 16502 15175 15022 62048 Total 72674 71746 71442 70018 285880 4 Um pesquisador deseja verificar qual tipo de pneu que proporciona menor consumo de combustível em litroshora trabalhada Tabela 147 Para trabalhar em terrenos encharcados ele testou quatro diferentes tipos de pneus A área que dispunha para realizar o experimento era heterogênea com relação a declividade sendo subdividida em três subáreas de tal forma que dentro de cada uma delas existia uniformidade com relação à declividade Após isto dentro de cada subárea realizou um sorteio ao acaso dos tipos de pneus às unidades experimentais Para 5 perguntase Tabela 147 Valores de consumo de combustível de acordo com os tratamentos e os blocos Subáreas Pneus Tipo 1 Tipo 2 Tipo 3 Tipo 4 1 30 32 33 35 2 29 30 31 33 3 25 26 30 31 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 88 a Quais os princípios básicos da experimentação utilizados neste experimento Justifique b Qual foi o tipo de delineamento experimental utilizado Justifique sua resposta c Em termos do consumo conclua com relação aos tipos de pneus por meio de uma ANOVA 5 Proceda a análise de variância aos dados de um ensaio instalado em DBC T1 1306 T2 1834 T3 1526 T4 1856 T5 1432 Bj2 15930692 j varia de 1 a 4 Yij2 3288970 e 1 6 Sejam alguns dados da ANOVA de um ensaio em DBC e os totais dos cinco tratamentos cujos efeitos foram avaliados na produção de cerveja GLBlo 3 QMRes 4895 T1 120 T2 352 T3 220 T4 240 e T5 456 Há efeito dos tipos de levedura 5 na produção de cerveja Respostas 1 Fcal 3359 Ftab 384 2a DBC O criador casualizou os quatro tratamentos dentro de cada bloco homogêneo representado pela idade Entre blocos existiam diferenças com relação à idade sendo controladas na ANOVA 2b Fcal 17700 Ftab 509 Fcal Ftab RH0 Pelo teste F com 1 há diferença entre os tipos de alimentação fornecidos às ovelhas 3 Fcal 587 Ftab 326 Fcal Ftab RH0 Pelo teste F 5 há efeito dos tratamentos sobre Y 4a Repetição casualização e controle local 4b DBC Houve casualização dos pneus dentro de cada subárea bloco homogênea As três subáreas eram heterogêneas quanto à declividade 4c Fcal 2097 Ftab 476RH0 Pelo teste F 5 há efeito dos tipos de pneus sobre o consumo 5 Fcal 420 Ftab 541 AH0 Pelo teste F 1 as médias dos tratamentos não diferem entre si 6 Fcal 911 Ftab 326 Fcal Ftab RH0 Pelo teste F 5 há efeito dos tipos de leveduras na produção de cerveja Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 89 Capítulo 15 Testes de comparações múltiplas TCM 151 Introdução Os modelos de análise de variância são usados para analisar os efeitos de um ou mais fatores sobre a variável dependente Na ANOVA o Fator é uma variável independente a ser estudada o Classes de um fator são as particularidades do fator no experimento Ex Em estudo de comparação da produção de várias variedades de trigo o Fator sob investigação variedade o Classes do fator cada variedade o Variável dependente produção dessas variedades Em experimentos com um fator um tratamento corresponde a uma das classes do fator Quando há mais de um fator um tratamento corresponde a uma combinação de classes dos fatores envolvidos no estudo O teste F da ANOVA é um teste preliminar que estabelece se é necessária uma análise detalhada dos efeitos das classes do fator o Teste F não significativo AH0 os efeitos das classes do fator são iguais não há relação entre o fator e a variável dependente o Teste F significativo RH0 nem todos as classes do fator têm efeitos iguais existe relação entre o fator e a variável dependente o Em experimentos com mais de duas classes do fator e quando o teste F leva à RH0 como discriminar as médias de tratamentos o Aplicandose um teste de médias ou seja estimandose os contrastes entre as médias das classes do fator e as variâncias dessas estimativas POSTHOC Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 90 152 Teste de Tukey ou Teste da Diferença Honestamente Significativa DHS Usado para comparar a totalidade dos contrastes entre duas médias após a ANOVA com teste F significativo ou seja para os n1n112 contrastes do tipo C mi mj em que n1 é o número de classes do fator em estudo O teste pode ser usado para dados balanceados número igual de repetições para todos os tratamentos e desbalanceados número diferente de repetições TukeyKramer Baseiase na diferença mínima significativa dms representada por dada por o Tukey DHS qn1 n2 QMRes2 1ri 1rj12 para experimentos desbalanceados número diferente de repetições o Ou Tukey qn1 n2 QMResr12 para experimentos balanceados mesmo número de repetições o q qn1 n2 é o valor tabelado da amplitude total studentizada obtido em função do nível de significância do nº de classes do fator em estudo n1 e dos GLRes n2 da ANOVA 1521 Protocolo para aplicação do teste de Tukey 1 passo Enunciar as hipóteses H0 mi mj e Ha mi mj ij 2 passo Indicar o teste de comparação de médias e o nível de significância 3 passo Ordenação decrescente das médias dos tratamentos 4 passo Cálculo do dms 5 passo Obter as estimativas dos contrastes Ĉ ȳi ȳj com base nos valores amostrais 6 passo Concluir sobre a significância dos n1n112 contrastes em teste Se Ĉ rejeitase a H0 caso contrário aceitase a H0 7 passo Resultados do teste referentes às médias populacionais 8 passo Conclusão do teste Médias seguidas por pelo menos uma mesma letra não diferem entre si pelo teste de Tukey ao nível de probabilidade Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 91 Exemplo 151 Sejam as produções kgparcela de 60 m2 de variedades de milho em experimento instalado em DBC com seis tratamentos e cinco blocos Tabela 151 MESMO EX DO DBC Tabela 151 Valores de produção de acordo com as variedades e os blocos Variedades Blocos B1 B2 B3 B4 B5 Totais V1 354 306 287 362 292 1601 V2 428 354 292 351 348 1773 V3 163 162 135 203 194 857 V4 158 145 104 216 183 806 V5 215 187 158 254 252 1066 V6 193 232 142 217 288 1072 Totais 1511 1386 1118 1603 1557 7175 Para esses dados há rejeição da H0 pois Fcal 3657 Ftab 410 páginas 8384 Concluise que há efeito das variedades sobre a produção ou seja pelo teste F ao nível de 1 de probabilidade existe pelo menos um contraste entre médias de variedades que é estatisticamente diferente de zero Resolução 1 Passo H0 mi mj e Ha mi mj ij 2 Passo Teste de Tukey 001 3 Passo ȳv2 17735 3546a ȳv1 16015 3202a ȳv6 10725 2144b ȳv5 10665 2132b ȳv3 8575 1714b e ȳv4 8065 1612b 4 Passo Tukey q1 6 20 871512 551 13198 727 5 e 6 Passos Estimativas e conclusão sobre a significância dos contrastes Ĉ1 ȳv2 ȳv1 3546 3202 344 AH0 permanecer com ȳv2 Ĉ2 ȳv2 ȳv6 3546 2144 1402 RH0 abandonar ȳv2 Ĉ3 ȳv1 ȳv6 3202 2144 1058 RH0 abandonar ȳv1 Ĉ4 ȳv6 ȳv5 2144 2132 012 AH0 permanecer com ȳv6 Ĉ5 ȳv6 ȳv3 2144 1714 430 AH0 permanecer com ȳv6 Ĉ6 ȳv6 ȳv4 2144 1612 532 AH0 final do teste 7 Passo Resultados do teste referentes às médias populacionais mv2 3546 a mv1 3202 a mv6 2144 b mv5 2132 b mv3 1714 b mv4 1612 b 8 Passo Médias seguidas por pelo menos uma mesma letra não diferem entre si ao nível de 1 de probabilidade pelo teste de Tukey As variedades de milho V2 e V1 apresentam maiores produções Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 92 Tabela Tukey Valores de amplitude total studentizada q ao nível de 5 de probabilidade n2 1 2 3 4 5 6 7 8 9 10 11 12 1 1797 2698 3282 3708 4041 4312 4540 4736 4907 5059 5196 2 609 833 980 1088 1174 1244 1303 1354 1399 1439 1475 3 450 591 683 750 804 848 885 918 946 972 995 4 393 504 576 629 671 705 735 760 783 803 821 5 364 460 522 567 603 633 658 680 700 717 732 6 346 434 490 531 563 590 612 632 649 665 679 7 334 417 468 506 536 561 582 600 616 630 643 8 326 404 453 489 517 540 560 577 592 605 618 9 320 395 442 476 502 524 543 560 574 587 598 10 315 388 433 465 491 512 531 546 560 572 583 11 311 382 426 457 482 503 520 535 549 561 571 12 308 377 420 451 475 495 512 527 540 551 562 13 306 374 415 445 469 489 505 519 532 543 553 14 303 370 411 441 464 483 499 513 525 536 546 15 301 367 408 437 460 478 494 508 520 531 540 16 300 365 405 433 456 474 490 503 515 526 535 17 298 363 402 430 452 471 486 499 511 521 531 18 297 361 400 428 450 467 482 496 507 517 527 19 296 359 398 425 447 465 479 492 504 514 523 20 295 358 396 423 445 462 477 490 501 511 520 24 292 353 390 417 437 454 468 481 492 501 510 30 289 349 385 410 430 446 460 472 482 492 500 40 286 344 379 404 423 439 452 464 474 482 490 60 283 340 374 398 416 431 444 455 465 473 481 120 280 336 369 392 410 424 436 447 456 464 471 277 331 363 386 403 417 429 439 447 455 462 n1 número de tratamentos n2 número de graus de liberdade do resíduo Tabela Tukey Valores de amplitude total studentizada q ao nível de 1 de probabilidade n2 1 2 3 4 5 6 7 8 9 10 11 12 1 9003 1350 1643 1856 2022 2158 2272 2370 2456 2532 2600 2 1404 1902 2229 2472 2663 2820 2953 3068 3169 3259 3340 3 826 1062 1217 1333 1424 1500 1564 1620 1669 1713 1753 4 651 812 917 996 1058 1110 1155 1193 1227 1257 1284 5 570 698 780 842 891 932 970 997 1024 1048 1070 6 524 633 703 756 797 832 861 887 910 930 948 7 495 592 654 700 737 768 794 817 837 855 871 8 475 564 620 662 696 724 747 768 786 803 818 9 460 543 596 635 666 692 713 732 750 765 778 10 448 527 577 614 643 667 688 706 721 736 748 11 439 515 562 597 625 648 667 684 699 713 725 12 432 505 550 584 610 632 651 667 681 694 706 13 426 496 540 573 598 619 637 653 667 679 690 14 421 490 532 563 588 608 626 641 654 666 677 15 417 484 525 556 580 599 616 631 644 656 666 16 413 479 519 549 572 592 608 622 635 646 656 17 410 474 514 543 566 585 601 615 627 638 648 18 407 470 509 538 560 579 594 608 620 631 641 19 405 467 505 533 555 574 589 602 614 625 634 20 402 464 502 529 551 569 584 597 609 619 628 24 396 455 491 517 537 554 568 581 592 602 611 30 389 446 480 505 524 540 554 565 576 585 593 40 382 437 470 493 511 526 539 550 560 569 576 60 376 428 460 482 499 513 525 536 545 553 560 120 370 420 450 471 487 500 512 521 530 538 544 364 412 440 460 476 488 499 508 516 523 529 n1 número de tratamentos n2 número de graus de liberdade do resíduo Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 93 Obtenção dos valores tabelados de Tukey A tabela de Tukey é unilateral à direita qtukey099620lowertailT quantil de Tukey para n1 6 e n2 20 1 5509542 ou qtukey001620lowertailF 1 5509542 Resolução pelo R y1c35430628736229242835429235134816316213520319415814510421618 3215187158254252193232142217288 tratrepc16 each5 reprepc156 dbccbinddataframetratrepy1 tratasfactordbctrat repasfactordbcrep headdbc aovdbc aovy1 tratrep Armazenamento da ANOVA do TIPO I no objeto aovdbc anovaaovdbc Estatísticas descritivas gerais requirepsych describey1 requirefBasics basicStatsy1 ci 095 Estatísticas descritivas por tratamento describeByy1trat basicStatsy115 ci 095 Descritivas do tratamento 1 basicStatsdbc6103 ci 095 Descritivas do tratamento 2 Teste de Tukey pela library stats aplicado ao objeto da ANOVA helpTukeyHSD argsTukeyHSD tk1TukeyHSDaovdbcconflevel099whichtrat plottk1cexaxis04 plottk1 las1cexaxis04 Teste de Tukey pela library agricolae aplicado ao objeto da ANOVA libraryagricolae dfdfresidualaovdbc MSerrordevianceaovdbcdf tk2HSDtesty1tratdfMSerrorconsoleTRUEalpha001 consolecomando lógico imprime saída ou não plottk2 variationrangelas1main HSDtesty1tratdfMSerrorconsoleTRUEgroupFalpha001 ValoresP e ICdif dos contrastes de Tukey Teste de Tukey pela library multcomp aplicado ao objeto da ANOVA requiremultcomp tk3summaryglhtaovdbc linfctmcptratTukey ValorP dos contrastes de Tukey linfctespecificação da hipótese linear a ser testada tk3 plottk3las1cexaxis04 confintglhtaovdbc alpha001 linfctmcptratTukey IC para a hipótese linear geral glht Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 94 153 Teste Novo de Amplitudes Múltiplas de Duncan Duncans New Multiple Range Test É um procedimento sequencial usado para comparar a totalidade dos contrastes entre duas médias do tipo C mi mj após a ANOVA com teste F significativo Usado para a condição de balanceamento número igual de repetições para todos os tratamentos e desbalanceamento número de repetições diferentes Baseiase na amplitude mínima significante Di o Di zn1 n2 QMRes2 1ri 1rj12 para experimentos desbalanceados o Ou Di zn1 n2 QMResr12 para experimentos balanceados mesmo nº de repetições zi zn1 n2 é o valor tabelado da amplitude mínima studentizada significante least significant studentized range obtido em função do nível de significância do teste n de médias ordenadas abrangidas pelo contraste entre as classes do fator em estudo n1 e n de GL do resíduo n2 da ANOVA 1531 Protocolo para aplicação do teste de Duncan 1 passo Enunciar as hipóteses H0 mi mj e Ha mi mj ij 2 passo Indicar o teste de comparação de médias e o nível de significância 3 passo Ordenação decrescente das médias dos tratamentos 4 passo Cálculo do Di amplitude mínima significante com base no n de médias ordenadas abrangidas pelo contraste n1 i 5 passo Obter o valor da estimativa do contraste entre a maior e a menor média Ĉ ȳi ȳj com base nos valores amostrais 6 passo Concluir sobre a significância dos n1n1 12 contrastes em teste a Se Di Ĉ AH0 e as médias são ligadas por um traço indicando que não há diferença entre elas b Caso contrário reduzir de uma unidade o valor de n1 Calculase um novo valor de Di e para todos os pares de médias que não estejam ligadas por um mesmo traço e que envolvem n1 médias repetir os procedimentos do 5 e 6 passos c Repetir os procedimentos do 5 e 6 passos até que n1 2 7 passo Resultados do teste referentes às médias populacionais 8 passo Conclusão do teste Médias seguidas por pelo menos uma mesma barra não diferem entre si pelo teste de Duncan ao nível de probabilidade Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 95 Exemplo 152 Sejam as produções kgparcela de 60 m2 de um ensaio de competição de variedades de milho instalado em DBC com seis tratamentos e cinco blocos Tabela 152 MESMO EX DO DBC Tabela 152 Valores de produção de acordo com as variedades e os blocos Variedades Blocos Totais B1 B2 B3 B4 B5 V1 354 306 287 362 292 1601 V2 428 354 292 351 348 1773 V3 163 162 135 203 194 857 V4 158 145 104 216 183 806 V5 215 187 158 254 252 1066 V6 193 232 142 217 288 1072 Totais 1511 1386 1118 1603 1557 7175 Para esses dados há rejeição da H0 pois Fcal 3657 Ftab 410 páginas 8384 Concluise que há efeito das variedades sobre a produção ou seja pelo teste F ao nível de 1 de probabilidade existe pelo menos um contraste entre médias de variedades que é estatisticamente diferente de zero Resolução 1 Passo H0 mi mj e Ha mi mj ij 2 Passo Teste de Duncan 001 3 Passo ȳv2 17735 3546 ȳv1 16015 3202 ȳv6 10725 2144 ȳv5 10665 2132 ȳv3 8575 1714 ȳv4 8065 1612 4 5 e 6 passos Cálculo do Di com base no n de médias ordenadas abrangidas pelo contraste n1 i obtenção do valor da estimativa dos contrastes e conclusão sobre suas significâncias Di zn1 n2 QMResr12 D6 z16 20 871512 447 13198 58995 Ĉ1 ȳv2 ȳv4 3546 1612 1934 D6 RH0 Calcular Di para a distância entre 5 médias Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 96 D5 z15 20 871512 440 13198 58071 Ĉ2 ȳv2 ȳv3 3546 1714 1832 D5 RH0 Ĉ3 ȳv1 ȳv4 3202 1612 1590 D5 RH0 Calcular Di para a distância entre 4 médias D4 z14 20 871512 433 13198 57147 Ĉ4 ȳv2 ȳv5 3546 2132 1414 D4 RH0 Ĉ5 ȳv1 ȳv3 3202 1714 1488 D4 RH0 Ĉ6 ȳv6 ȳv4 2144 1612 532 D4 AH0 traço entre ȳv6 e ȳv4 mas calcular Di para a distância entre 3 médias D3 z13 20 871512 422 13198 55696 Ĉ7 ȳv2 ȳv6 3546 2144 1402 D3 RH0 Ĉ8 ȳv1 ȳv5 3202 2132 1070 D3 RH0 Calcular Di para a distância entre 2 médias D2 z12 20 871512 402 13198 53056 Ĉ9 ȳv2 ȳv1 3546 3202 344 D2 AH0 traço entre ȳv2 e ȳv1 Ĉ10 ȳv1 ȳv6 3202 2144 1058 D2 RH0 Fim do teste 7 passo Resultados do teste referentes às médias populacionais mv2 3546 mv1 3202 mv6 2144 mv5 2132 mv3 1714 mv4 1612 8 passo Médias seguidas por pelo menos uma mesma barra não diferem entre si pelo teste de Duncan ao nível de 1 probabilidade As variedades de milho V2 e V1 apresentam maiores produções Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 97 Tabela Duncan Valores de amplitude mínima studentizada significante z a 5 de probabilidade n2 1 2 3 4 5 6 7 8 9 10 12 1 180 180 180 180 180 180 180 180 180 180 2 609 609 609 609 609 609 609 609 609 609 3 450 450 450 450 450 450 450 450 450 450 4 393 401 402 402 402 402 402 402 402 402 5 364 374 379 383 383 383 383 383 383 383 6 346 358 364 368 368 368 368 368 368 368 7 335 347 354 358 360 361 361 361 361 361 8 326 339 347 352 355 356 356 356 356 356 9 320 334 341 347 350 352 352 352 352 352 10 315 330 337 343 346 347 347 347 347 347 11 311 327 335 339 343 344 345 346 346 346 12 308 323 333 336 340 342 344 344 346 346 13 306 321 330 335 338 341 342 344 345 345 14 303 318 327 333 337 339 341 342 344 345 15 301 316 325 331 336 338 340 342 343 344 16 300 315 323 330 334 337 339 341 343 344 17 298 313 322 328 333 336 338 340 342 344 18 297 312 321 327 332 335 337 339 341 343 19 296 311 319 326 331 335 337 339 341 343 20 295 310 318 325 330 334 336 338 340 343 22 293 308 317 324 329 332 335 337 339 342 24 292 307 315 322 328 331 334 337 338 341 26 291 306 314 321 327 330 334 336 338 341 28 290 304 313 320 326 330 333 335 337 340 30 289 304 312 320 325 329 332 335 337 340 40 286 301 310 317 322 327 330 333 335 339 60 283 298 308 314 320 324 328 331 333 337 n1 nº de médias abrangidas pelo contraste e n2 nº de graus de liberdade do resíduo Tabela Duncan Valores de amplitude mínima studentizada significante z a 1 de probabilidade n2 1 2 3 4 5 6 7 8 9 10 12 1 9000 9000 9000 9000 9000 9000 9000 9000 9000 9000 2 1400 1400 1400 1400 1400 1400 1400 1400 1400 1400 3 826 850 860 870 880 890 890 900 900 900 4 651 680 690 700 710 710 720 720 730 730 5 570 596 611 618 626 633 640 644 650 660 6 524 551 565 573 581 588 595 600 600 610 7 495 522 537 545 553 561 569 573 580 580 8 474 500 514 523 532 540 547 551 550 560 9 460 486 499 508 517 525 532 536 540 550 10 448 473 488 496 506 513 520 524 528 536 11 439 463 477 486 494 501 506 512 515 524 12 432 455 468 476 484 492 496 502 507 513 13 426 448 462 469 474 484 488 494 498 504 14 421 442 455 463 470 478 483 487 491 496 15 417 437 450 458 464 472 477 481 484 490 16 413 434 445 454 460 467 472 476 479 484 17 410 430 441 450 456 463 468 472 475 480 18 407 427 438 446 453 459 464 468 471 476 19 405 424 435 443 450 456 461 464 467 472 20 402 422 433 440 447 453 458 461 465 469 22 399 417 428 436 442 448 453 457 460 465 24 396 414 424 433 439 444 449 453 457 462 26 393 411 421 430 436 441 446 450 453 458 28 391 408 418 428 434 439 443 447 451 456 30 389 406 416 422 432 436 441 445 448 454 40 382 399 410 417 424 430 434 437 441 446 60 376 392 403 412 417 423 427 431 434 439 n1 nº de médias abrangidas pelo contraste e n2 nº de graus de liberdade do resíduo Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 98 Resolução pelo R y1c35430628736229242835429235134816316213520319415814510421618 3215187158254252193232142217288 tratrepc16 each5 reprepc156 dbccbinddataframetratrepy1 tratasfactordbctrat repasfactordbcrep headdbc aovdbc aovy1 tratrep Armazenamento da ANOVA do TIPO I no objeto aovdbc anovaaovdbc Estatísticas descritivas por tratamento requirefields statsy1 bytrat Teste de Duncan versão nova pela library agricolae aplicado ao objeto da ANOVA libraryagricolae dfdfresidualaovdbc MSerrordevianceaovdbcdf dc1duncantesty1tratdfMSerror alpha001groupTconsoleTRUE dc1 y1 groups 2 3546 a 1 3202 a 6 2144 b 5 2132 b 3 1714 b 4 1612 b plotdc1 variationIQRlas1main duncantesty1tratdfMSerroralpha001consoleTgroupFP e ICdif dos contrastes de Duncan Teste de Duncan versão velha pela library laercio aplicado ao objeto da ANOVA requirelaercio dc2LDuncanaovdbc which trat conflevel 099 Independent Variable trat Factors Means 2 3546 a 1 3202 a 6 2144 b 5 2132 bc 3 1714 bc 4 1612 c Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 99 Capítulo 15 Lista de exercícios sobre testes de Tukey e Duncan Considere os exercícios contidos na lista de exercícios sobre DBCANOVA páginas 82 e 83 1 Para o exercício 1 a Aplique o teste de Tukey 5 b Aplique o teste de Duncan 5 2 Para o exercício 2 Aplique o teste de Tukey 1 e conclua sobre quais os tipos de alimentação são recomendados às ovelhas 3 Para os dados do exercício 3 5 a Aplique o teste de Tukey b Aplique o teste de Duncan Resolução ANOVA x3filechoose Escolha do diretório dbc3 readcsv2x3 Leitura dos dados da planilha strdbc3 headdbc3 Obtenção das seis primeiras linhas da planilha dbc3 tratasfactordbc3trat Conversão de tratamento em um fator repasfactordbc3rep Conversão de repetição em um fator aovdbc3aovdbc3y tratrep ANOVA contida no objeto aovdbc3 anovaaovdbc3 Obtenção da Tabela de ANOVA Teste de Tukey libraryagricolae dfdfresidualaovdbc3 MSerrordevianceaovdbc3df tk3dbcHSDtestdbc3ytratdfMSerrorconsoleTRUEalpha005 plottk3dbc las1main HSDtestdbc3ytratdfMSerrorconsoleTRUEgroupFalpha005ValoresP e ICdif Teste de Duncan dc3dbcduncantestdbc3ytratdfMSerrorconsoleTRUEalpha005 plotdc3dbc las1main duncantestdbc3ytratdfMSerrorconsoleTRUEgroupFalpha005ValoresP e ICdif 4 Em relação ao exercício 4 Qual tipo de pneu que proporciona o pior consumo Use o teste Duncan se necessário 5 Para o exercício 5 1 Aplique os testes de Tukey e Duncan se necessários e conclua 6 Em relação ao exercício 6 5 a Qualis os tipos de levedura que apresentam maior produção por meio do teste Tukey b Pelo teste Duncan qualis os tipos de levedura que apresentouaram menor produção Respostas 1a 1354 mt5 10700 a mt4 9200 b mt3 8700 b mt2 7200 c mt1 6700 c Médias seguidas por pelo menos uma mesma letra não diferem entre si pelo teste de Tukey com 5 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 100 1b D5 975 D4 961 D3 939 e D2 903 mt5 10700 mt4 9200 mt3 8700 mt2 7200 mt1 6700 Médias seguidas por pelo menos uma mesma barra não diferem entre si pelo teste de Duncan com 5 2 384 mTA3 4600 a mTA1 3157 b mTA2 3143 b mTA4 2157 c Pelo teste de Tukey com 1 ovelhas alimentadas com o TA3 produzem mais lã 3a 1312 mt5 15512 a mt1 14280 a b mt4 14001 b mt3 13874 b mt2 13802 b Pelo teste de Tukey com 5 os tratamentos t5 e t1 apresentam médias mais elevadas 3b D5 978 D4 969 D3 940 e D2 896 mt5 15512 mt1 14280 mt4 14001 mt3 13874 mt2 13802 Pelo teste de Duncan com 5 o tratamento t5 apresenta média mais elevada do que os demais 4 D4 175 D3 172 e D2 166 mt4 3300 mt3 3133 mt2 2933 mt1 2800 Pelo teste de Duncan com 5 o pneu que proporciona o pior consumo é o tipo 4 t4 5 Fcal 420 Ftab 541 AH0 Pelo teste F 1 as médias dos tratamentos não diferem entre si Não é necessária a aplicação dos testes de Tukey e de Duncan 6a 499 mt5 114 a mt2 88 a b mt4 60 b c mt3 55 b c mt1 30 c Pelo teste de Tukey com 5 as leveduras do tipo 5 e 2 apresentam maior produção de cerveja 6b D5 372 D4 368 D3 357 e D2 341 mt5 114 mt2 88 mt4 60 mt3 55 mt1 30 Pelo teste de Duncan com 5 as leveduras do tipo 1 3 e 4 apresentam menor produção de cerveja Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 101 Capítulo 16 Análise de regressão linear de 1º grau 161 Utilização Em situações que exista relação funcional entre uma variável dependente Yi e uma variável independente Xi com i 1 2 n Usada para predição da variável resposta ou dependente Yi a partir do estudo da variável regressora ou independente Xi 162 Contexto experimental O pesquisador dispõe de mais de um valor observado yi para um mesmo valor xi caracterizando o princípio básico da repetição A variável independente X será constituída por níveis quantitativos prédefinidos ex níveis dos tratamentos em DIC com um único fator Na ANOVA inicial podese obter a estimativa da variância residual QMRes que corresponde ao erro puro obtido a partir de um modelo estatístico e sob a regência dos princípios básicos da experimentação Na ANOVA da regressão é obtida a estimativa da variância residual QMRes INDEPENDENTE DA REGRESSÃO que representa a soma do erro puro com a falta de ajustamento do modelo de regressão aos dados de Y 163 Relação funcional entre X e Y A posição dos n pares de valores xi yi em um diagrama de dispersão determina a relação funcional A reta modelo de 1º grau pode não se ajustar perfeitamente aos valores observados de Y o Há na maior parte dos pontos uma distância entre os valores estimados pelo modelo e os valores observados no ensaio Relação funcional entre X e Y 0 5 10 15 20 25 2 3 4 5 6 7 8 X Y Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 102 O ponto x ȳ está sobre a reta estimada pois a média dos erros é nula Eεi 0 Se Eεi εin e εi 0 então Eεi 0 e Eyi b0 b1xi o O valor esperado ou médio de y é igual ao valor estimado 164 Objetivo da análise de regressão de 1º grau O ajuste de um modelo estatístico aos valores observados de Y em função dos níveis de X de modo que as distâncias sejam minimizadas e se permita a explicação biológica do fenômeno 165 Modelo linear de 1º grau Seja o modelo estatístico dado por yi b0 b1xi εi para i 1 2 n Para n pares de observações podese escrever as seguintes equações y1 b0 b1x1 ε1 y2 b0 b1x2 ε2 yn b0 b1xn εn 1651 Significado dos termos do modelo b0 Intercepto ou constante da regressão que corresponde ao valor de intercepto da reta com o eixo de ordenadas b1 Coeficiente de regressão linear ou inclinação da reta que indica o valor de tangente do ângulo que a reta faz com o eixo de abscissas εi Erros aleatórios ou distâncias entre valores observados e os respectivos valores estimados 1652 Pressuposições para ajuste do modelo linear A variância dos erros é igual a 2 Vεi 2 ou seja os erros em Y para todos os valores de X são homocedásticos O erro de uma observação é independente do erro em outra observação Cov εi εi 0 i i o Podemse utilizar as estatísticas t e F para testar hipóteses e para estabelecer intervalos de confiança sobre os parâmetros da regressão Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 103 o A independência dos erros pode ser garantida quando amostramos aleatoriamente de uma população infinita os n pares de valores xi yi Os erros devem seguir a distribuição normal de probabilidades 1653 Notação Os erros devem ser normais independentes e homocedásticos εi NID 0 2 166 Método dos mínimos quadrados ordinários MMQO Finalidade A obtenção das estimativas dos parâmetros β0 e β1 O MMQO consiste na estimação de parâmetros de uma equação de modo que as distâncias entre os valores observados e estimados pela equação no todo sejam os menores possíveis minimização da SQ dos erros 1661 Minimização da soma de quadrados dos erros Erros ordinários εi o Se yi b0 b1xi εi εi yi b0 b1xi o Assim ŷi b0 b1xi e εi yi ŷi 1662 Função soma de quadrados dos erros Z Se εi yi b0 b1xi então Z εi2 yi b0 b1xi2 1663 Ponto de mínimo da função Z As derivadas parciais de Z em relação a b0 e b1 devem ser nulas 1664 Aplicação da regra da cadeia fu fu u em que u yi b0 b1xi o Z b0 2yi b0 b1xi 1 o Z b1 2yi b0 b1xi xi 1665 Igualdade das derivadas parciais a zero 2 yi b0 b1xi 0 Equação de b0 2 yi b0 b1xi xi 0 Equação de b1 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 104 1666 Sistema de equações normais com solução única nb0 b1xi yi Equação de b0 b0xi b1xi2 xiyi Equação de b1 1667 Esquema prático para estimar b0 e b1 1º passo Aplicar a cada termo do modelo yi b0 b1xi o nb0 b1xi yi Equação de b0 2º passo Aplicar xi a cada termo do modelo yi b0 b1xi o b0xi b1xi2 xiyi Equação de b1 167 Análise de variância da regressão É a técnica que permite decompor a variação total entre as observações de Y em variações devido à equação de regressão e ao acaso Trat Reg Res Res Total Total 1671 Finalidade Verificar a significância do coeficiente de regressão linear ao nível de α de probabilidade pré definido ou seja se existe inclinação da reta com o eixo de abscissas Verificar a não significância da falta de ajustamento do modelo de regressão aos valores de Y indicando adequação do modelo 1672 Fórmulas práticas GLTot n 1 GLReg p 1 2 1 1 GLIR n p n 2 GLTrat I 1 GLFA I 2 GLTrat GLReg ou GLFA I p GLEP n I GLTot GLTrat ou GLEP n I J GLTot GLTrat GLBlo SQTot yi ȳ2 yi2 yi2n em que n nº de pares de observações xiyi e yi2n C correção para a média geral SQReg ŷi ȳ2 b0yi b1xiyi C SQIR yi ŷi2 SQTot SQReg A SQIR é a parte da variação que não é explicada pela regressão SQTrat Ti2J yij2IJ SQEP SQRes SQFA SQTrat SQReg Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 105 1673 Tabela de análise de variância da regressão de 1º grau Tabela 161 Graus de liberdade GL somas de quadrados SQ quadrados médios QM e estatística calculada F das fontes de variação de uma ANOVA da regressão linear de 1º grau realizada após a ANOVA principal de um experimento FV GL SQ QM Fcal Regressão 1 SQReg QMReg QMRegQMEP Falta Ajuste FA I 2 SQTrat SQReg QMFA QMFAQMEP Tratamento I 1 SQTrat Resíduo Erro puro EP GLEP SQRes SQEP QMEP Independente da regressão IR n 2 SQIR QMIR Total n 1 SQTot Ftab observar GLReg ou GLFA na coluna da tabela F e GLEP GLRes na linha da tabela F o Ftab Reg F GLReg GLEP e Ftab FA F GLFA GLEP Na análise de regressão de 1º grau o nº mínimo de níveis do fator quantitativo é três quantidade maior que dois o nº de parâmetros do modelo sob pena de não sobrarem GL para teste da FA Se a análise for feita pelos totais de tratamento a SQReg deve ser corrigida pela divisão pelo número de repetições Se a análise for feita pelas médias de tratamento a SQReg deve ser corrigida pela multiplicação pelo número de repetições Se a análise for feita pelas observações individuais de tratamento não se corrige a SQReg 1674 Hipóteses Para a equação de regressão o H0 1 0 O coeficiente de regressão linear populacional é nulo o Ha 1 0 O coeficiente de regressão linear populacional não é nulo Para a falta de ajustamento FA o H0 FA 0 A falta de ajustamento na população é nula o Ha FA 0 A falta de ajustamento na população não é nula Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 106 1675 Regra decisória e conclusão Para a equação de regressão o Fcal Reg Ftab Reg rejeitase H0 O coeficiente de regressão linear não é nulo ou existe inclinação da reta com o eixo de abscissas ao nível de α de significância o Fcal Reg Ftab Reg não se rejeita H0 O coeficiente de regressão linear é nulo ou não existe inclinação da reta com o eixo de abscissas ao nível de α de significância Para a falta de ajustamento FA o Fcal FA Ftab FA rejeitase H0 A FA é significativa ou o modelo de regressão não é adequado para explicar a variação em Y p α o Fcal FA Ftab FA não se rejeita H0 A FA não é significativa ou o modelo de regressão é adequado para explicar a variação em Y p α 1676 Qualidade de ajuste do modelo de 1º grau R2 SQRegSQTot 100 e R2 1 SQIRSQTot 100 ou R2 SQRegSQTrat 100 O R2 mede o quanto da variação em Y pode ser explicado pela equação de regressão Seu valor varia de 0 a 1 Quanto mais próximo de 1 o valor de R2 melhor a aderência do modelo aos valores observados de Y ou seja a soma das distâncias entre os valores observados e estimados será menor Baixos valores de R2 indicam a necessidade de explicar melhor a variação em Y por o Aumento do grau do polinômio no modelo ajustado o Inclusão de outras regressoras no modelo ajustado o Ajuste com outros modelos de regressão 1677 Critérios para escolha da equação linear de 1º grau aos dados de Y A significância de b1 pelo teste F na ANOVA da regressão Nãosignificância da FA do modelo de regressão na ANOVA da regressão Valores de R2 Significado biológico do fenômeno estudado Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 107 Exemplo 161 Seja um experimento instalado em DIC com o objetivo de verificar o efeito de temperatura de estocagem na altura de albume AA de ovos de poedeiras comerciais com 56 semanas de idade da linhagem X Utilizaramse 180 ovos com cinco tratamentos 10 12 14 16 e 18ºC seis repetições e seis ovos por UE recipiente com seis ovos Os ovos foram selecionados pelo seu peso inicial que variou entre 55 e 60g O experimento foi realizado em cinco refrigeradores durante 14 dias No 14º dia a AA foi mensurada em três ovos sendo o valor médio apresentado na Tabela 162 Tabela 162 Valores observados de altura de albume mm por tratamento Temperatura Repetição Total 1 2 3 4 5 6 10 66 72 68 69 74 78 427 12 64 66 65 67 66 61 389 14 60 57 56 56 58 55 342 16 53 49 47 48 51 50 298 18 38 39 40 36 38 37 228 Perguntase a Verifique se há efeito de temperatura de refrigeração na AA 005 b Estime a equação de regressão de 1º grau para predizer a AA em função dos níveis de temperatura a partir dos valores médios de temperatura c Faça a ANOVA da regressão todas as observações teste as H0 equação e FA e conclua 005 Resolução a ANOVA em DIC GLTot n 1 30 1 29 GLTrat I 1 5 1 4 GLRes I J 1 5 6 1 25 SQTot yi2 yi2n 98736 1684230 98736 94529 4207 SQTrat Y12 Y22 Y32 Y42 Y526 Y230 4272 3892 3422 2982 22826 1684230 98567 94529 4038 SQRes ou SQEP SQTot SQTrat 4207 4038 169 QMTrat SQTratGLTrat 40384 100950 QMRes SQResGLRes 16925 00676 1º Passo H0 mt1 mt2 mt3 mt4 mt5 e Ha Não H0 2º Passo Teste F 005 3º Passo Ftab FGL Trat GL Res F0054 25 276 4º Passo Fcal QMTrat QMRes 1009500676 14933 5º Passo Fcal Ftab RH0 6º Passo Pelo teste F 005 existe pelo menos um contraste entre médias de tratamento que é diferente de zero Há efeito de temperatura de refrigeração na AA Tabela de análise de variância FV GL SQ QM Fcal Tratamentos 4 4038 100950 14933 Resíduo ou erro puro 25 169 00676 Total 29 4207 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 108 b Estimativa dos parâmetros da equação de 1º grau Modelo ȳi b0 b1 ix iε Sistema de equações normais nb0 ix b1 ȳi ix b0 ix 2b1 ix ȳi Pares de valores médios de X e Y ix 10 12 14 16 e 18 ȳi 712 648 570 497 e 380 n 5 ix 10 18 70 ix 2 102 182 1020 ȳi 712 380 2807 ix ȳi 10 712 18 380 37668 Sistema de equações normais A 5b0 70b1 2807 B 70b0 1020b1 37668 A e B A 5b0 70b1 2807 14 sendo x 14 B 70b0 1020b1 37668 A 70b0 980b1 39298 B A 40b1 1630 b1 04075 sendo SQDX 40 e SPDXY 1630 Substituindo b1 em A 5b0 70 04075 2807 5b0 2807 28525 b0 565955 11319 ou b0 ȳ b1x 5614 04075 14 5614 5705 11319 Então iyˆ 11319 04075 ix OBS À medida que se aumenta X em uma unidade o valor médio de Y reduz em 04075 unidade Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 109 c ANOVA da regressão GLTot n 1 301 29 GLRC p1 2 1 1 GLFA I2 5 2 3 GLIR np 30 2 28 SQTot yi2 yi2n 98736 1684230 98736 94529 4207 SQRes ou SQEP SQTot SQTrat SQBlo 4207 4038 169 SQReg b0ȳi b1x iȳi ȳi2n 11319 2807 04075 37668 280725 3177243 1534971 15758498 664222 SQRC 664222 6 3985332 SQFA SQTrat SQRC 4038 3985332 052668 SQIR SQTot SQRC 4207 3985332 221668 QMRC SQRCGLRC 39853221 3985322 QMFA SQFAGLFA 0526683 017556 QMIR SQIRGLIR 22166828 0079167 Teste da equação da reta 1º Passo H0 1 0 e Ha 1 0 2º Passo Teste F 005 3º Passo Ftab FGL Reg GL Res F005125 424 4º Passo Fcal QMRCQMRes 398533200676 58955 5º Passo Fcal RC Ftab RC RH0 6º Passo Pelo teste F 005 o coeficiente de regressão linear não é nulo ou existe inclinação da reta com o eixo de abscissas Teste da falta de ajustamento da equação da reta 1º Passo H0 FA 0 e Ha FA 0 2º Passo Teste F 005 3º Passo Ftab FGL FA GL Res F0053 25 299 4º Passo Fcal QMFA QMRES 01755600676 25970 5º Passo Fcal FA Ftab FA AH0 6º Passo Pelo teste F 005 a FA do modelo não é significativa ou o modelo de regressão é adequado para explicar a variação em Y Tabela de análise de variância da regressão de 1º grau FV GL SQ QM Fcal RC p 1 1 3985332 3985332 58955 FA I 2 3 052668 017556 25970ns Tratamento 4 4038 10095 14933 Resíduo ou erro puro nI 25 169 00676 IR n p 28 221668 0079167 Total n 1 29 4207 Qualidade de ajuste do modelo de regressão aos dados de Y R2 SQRC SQTrat 100 3985332 4038 100 9870 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 110 Resolução pelo R a ANOVA Yc6672686974786466656766616575656585553494748515383943 63837 tratrepc1012141618 each6 reprepc165 diccbinddataframetratrepY tratasfactordictrat repasfactordicrep headdic aov1 anovaaovY trat Armazenamento da ANOVA do TIPO I no objeto aov1 aov1 Analysis of Variance Table Response Y Df Sum Sq Mean Sq F value PrF trat 4 40385 100962 14935 22e16 Residuals 25 1690 00676 Obtenção dos valores médios de Y por tratamento requirefields statsY bytrat Estatísticas descritivas por tratamento 10 12 14 16 18 N 60000000 60000000 60000000 60000000 60000000 mean 71166667 64833333 57000000 49666667 38000000 StdDev 04400758 02136976 01788854 02160247 01414214 b Ajuste do modelo linear de 1º grau de Y AA em função dos dados médios dos tratamentos tratmed tratmedc1012141618 Ymedc71166667 64833333 57000000 49666667 38000000 lm1summarylmYmedtratmed lm1 Coefficients Estimate Std Error t value Prt Intercept 1131833 038794 2918 884e05 tratmed 040750 002716 1500 0000643 Residual standard error 01718 on 3 degrees of freedom Multiple Rsquared 09868 Adjusted Rsquared 09825 Fstatistic 2251 on 1 and 3 DF pvalue 00006427 OBS1 A equação de regressão é iyˆ 11319 04075 ix OBS2 Os valores de Std Error tcal t value e Prt estão equivocados OBS3 Correção de tcal e pvalor para b0 e b1 se a regressão foi ajustada pelas médias dos tratamentos tcalcortcal da análise x QMINDREGQMRESJ05 em que J nº de repetições pvalcorb02pttcalcorb0 GLRES lowertailF pvalcorb0 pvalcorb12pttcalcorb1 GLRES lowertailT pvalcorb1 OBS4 O modelo é significativo e explica 9868 R2 da variação de Y Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 111 Gráfico do modelo ajustado plottratmedYmed ablinelm1 c ANOVA da regressão todas as observações teste das H0 equação e FA e conclusões 005 tratasnumerictrat lm2lmYtrat avreg1anovalm2 avreg1 Analysis of Variance Table Response Y Df Sum Sq Mean Sq F value PrF trat 1 39853 39853 50239 22e16 Residuals 28 2221 0079 OBS ANOVA da regressão quando se executa em um programa O teste F para tratamento está equivocado pois o F calculado foi obtido com o QMIR no denominador Obtenção da ordem dos tratamentos aov1aaovY orderedtrat saov1asummaryaov1a coefaov1a Intercept orderedtratL orderedtratQ orderedtratC orderedtrat4 561333333 257725629 027171560 008959787 008167395 Anova da regressão com desdobramento dos GL de tratamento e teste da equação e da falta de ajuste avreg2summaryaov1asplitlistorderedtratlisttratL1tratFAc24 avreg2 Df Sum Sq Mean Sq F value PrF orderedtrat 4 4038 1010 149352 2e16 orderedtrat tratL 1 3985 3985 589549 2e16 orderedtrat tratFA 3 053 018 2619 00731 Residuals 25 169 007 OBS1 A ANOVA da regressão agora está correta pois os testes F para regressão e falta de ajustamento estão com o QMRES no denominador Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 112 Capítulo 16 Lista de exercícios sobre análise de regressão linear de 1º grau 1 Considere o banco de dados a seguir e responda ao que se pede Tratamento Repetição Y 0 1 226 0 2 224 0 3 210 0 4 214 05 1 285 05 2 286 05 3 286 05 4 279 1 1 368 1 2 364 1 3 366 1 4 360 15 1 456 15 2 445 15 3 452 15 4 451 2 1 552 2 2 546 2 3 541 2 4 543 25 1 592 25 2 584 25 3 583 25 4 577 3 1 664 3 2 681 3 3 658 3 4 667 Dados Ensaio em DBC Tratamento fator quantitativo Y variável dependente a Verifique se há efeito dos tratamentos sobre Y ou seja faça o quadro de ANOVA inicial teste a hipótese de nulidade e conclua para α 5 Calcule também o CV do experimento b Use o MMQO e ajuste o modelo linear de 1º grau estimativa dos parâmetros aos dados de Y em função dos níveis quantitativos dos tratamentos utilizando todas as observações do banco de dados c Faça o quadro de ANOVA da regressão teste as hipóteses de nulidade e conclua para α 5 d Estime a qualidade de ajuste R2 do modelo aos dados de Y Obs Explicite todos os cálculos necessários Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 113 Resolução a ANOVA em DBC Yc22622421214285286286279368364366364564454524515525465415435 92584583577664681658667 tratrepc0051152253 each4 reprepc147 dbccbinddataframetratrepY tratasfactordbctrat repasfactordbcrep headdbc aov0 anovaaovY tratrep Armazenamento da ANOVA do TIPO I no objeto aov0 aov0 Analysis of Variance Table Response Y Df Sum Sq Mean Sq F value PrF trat 6 65067 108445 3904008 2e16 rep 3 28 093 3336 00427 Residuals 18 50 028 b Ajuste do modelo linear de 1º grau de Y em função de trat considerando todas as observações tratasnumerictrat lm1lmYtrat slm1summarylm1 slm1 Coefficients Estimate Std Error t value Prt Intercept 141000 05580 2527 2e16 trat 76000 01248 6091 2e16 Residual standard error 1321 on 26 degrees of freedom Multiple Rsquared 0993 Adjusted Rsquared 09928 Fstatistic 3710 on 1 and 26 DF pvalue 22e16 OBS1 A equação de regressão é y 1410 760x OBS2 Os valores de Std Error tcal t value e Prt estão equivocados OBS3 Correção de tcal e pvalor para b0 e b1 se a regressão foi ajustada por todas as observações tcalcortcal da análise x QMINDREGQMRES05 em que J nº de repetições pvalcorb02pttcalcorb0 GLRES lowertailF pvalcorb0 pvalcorb12pttcalcorb1 GLRES lowertailT pvalcorb1 OBS4 O modelo de 1º grau é significativo e explica 9930 R2 da variação dos dados de Y R2 6469165145 100 9930 Gráfico do modelo ajustado plottratY ablinelm1 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 114 c ANOVA da regressão teste das H0 equação e FA e conclusões 005 avr1anovalm1 ou avr1summaryaovYtrat avr1 Analysis of Variance Table Response Y Df Sum Sq Mean Sq F value PrF trat 1 64691 64691 37097 22e16 Residuals 26 453 17 OBS ANOVA da regressão quando se executa em um programa estatístico O teste F para tratamento está equivocado pois o F calculado foi obtido com o QMIR no denominador Obtenção da ordem dos tratamentos m2aovY orderedtratrep coefm2 Intercept orderedtratL orderedtratQ orderedtratC orderedtrat4 449000000 402154199 11347330 13063945 15955295 orderedtrat5 orderedtrat6 rep2 rep3 rep4 16802778 10132456 01857143 06714286 07428571 Anova da regressão com desdobramento dos GL de tratamento e teste da equação e da falta de ajuste avr2summarym2splitlistorderedtratlisttratL1tratFAc26 avr2 Df Sum Sq Mean Sq F value PrF orderedtrat 6 6507 1084 3904008 2e16 orderedtrat tratL 1 6469 6469 23288832 2e16 orderedtrat tratFA 5 38 8 27043 889e08 rep 3 3 1 3336 00427 Residuals 18 5 0 Ajuste do modelo de 2º grau tratasnumerictrat lm2lmYtratItrat2 slm2summarylm2 slm2 Coefficients Estimate Std Error t value Prt Intercept 1261429 098794 1277 188e12 trat 859048 056618 1517 405e14 Itrat2 012381 006917 179 00856 Residual standard error 1268 on 25 degrees of freedom Multiple Rsquared 09938 Adjusted Rsquared 09933 Fstatistic 2014 on 2 and 25 DF pvalue 22e16 Anova da regressão avr2anovalm2 avr2 Analysis of Variance Table Response Y Df Sum Sq Mean Sq F value PrF trat 1 64691 64691 40241333 2e16 Itrat2 1 52 52 32039 008559 Residuals 25 402 16 Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 115 OBS Fazer correções do tcal e pvalor para b0 b1 e b2 Correção para b2 tcalcor coefslm29sqrtavr233aov033 tcalcor 1 4306009 pvalcor2pttcalcor aov031lowertailT pvalcor 1 00004253924 2 Sejam os dados a seguir referentes aos valores médios do exemplo anterior X 0 05 1 15 2 25 3 Y 2185 2840 3645 4510 5455 5840 6675 a Ajuste o modelo linear de 1 grau obter a equação de regressão estimada a esses dados a partir do sistema de equações normais b O modelo de regressão foi o mesmo ou não em relação à questão 1 Explique c Qual o significado do coeficiente de regressão b1 aplicado ao exemplo em questão d Faça a análise de variância da regressão e conclua 5 sobre a significância da equação de regressão e sobre a nãosignificância da falta de ajustamento e Estime o coeficiente de determinação R2 Este valor foi o mesmo ou não em relação ao apresentado na questão 1 Explique f Se fosse ajustado o modelo linear de 2º grau modelo quadrático aos dados acima quantos graus de liberdade seriam atribuídos à regressão g Use um software estatístico e faça o gráfico da função incluindo os valores médios observados 3 Ainda em relação aos dados da questão número 1 faça o que se pede a Apresente os pares de valores totais x y b Ajuste o modelo linear de 1 grau aos totais de Y Esse modelo é o mesmo dos anteriores ou não c Verifique teste F 5 a significância de b1 e a nãosignificância da falta de ajustamento d Use um software estatístico e faça o gráfico da função com inclusão dos valores totais observados Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 116 4 Seja outro experimento instalado em DIC com quatro tratamentos ou níveis de temperatura de armazenamento ºC e quatro repetições A variável resposta avaliada foi a altura da gema AG mm mensurada após duas semanas de armazenamento Tabela 163 Admitindose que há efeito dos tratamentos sobre a AG 005 responda ao que se pede Tabela 163 Valores observados de altura de gema mm de acordo com os tratamentos e repetições Tratamentos Repetições Totais 1 2 3 4 10 75 70 68 80 293 12 72 70 66 64 272 14 62 64 60 58 244 18 55 50 55 50 210 a Apresente os pares de valores médios x y b Apresente os pares de valores totais x y c Ajuste o modelo linear de 1 grau aos dados médios a partir do sistema de equações normais d Ajuste o modelo linear de 1 grau aos dados totais a partir do sistema de equações normais e Faça a análise de variância da regressão e conclua 5 para as hipóteses de nulidade relacionadas à existência da equação de regressão e à falta de ajustamento Respostas Em sala Estatística Experimental Prof Newton Tavares Escocard de Oliveira UnioesteCCA 117 Capítulo 17 Bibliografia consultada BANZATTO DA KRONKA SN Experimentação agrícola 4ª ed Jaboticabal FUNEP 2006 237p BUSSAB WO MORETTIN PA Estatística Básica 7ª ed São Paulo Saraiva 2012 540p DETMANN E Estatística e Experimentação Agropecuária Campos dos Goytacazes RJ LEAG CCTAUENF 2004 169p Apostila TécnicaDidática FERREIRA DF Sisvar A computer statistical analysis sistem Ciência e Agrotecnologia v35 n6 p10391042 2011 PIMENTELGOMES F Curso de estatística experimental 15ª ed Piracicaba FEALQ 2022 451p HARTER HL Critical Values for Duncans New Multiple Range Test Biometrics v16 n4 p671 685 1960 R Core Team 2023 R A language and environment for statistical computing R Foundation for Statistical Computing Vienna Austria ISBN 3900051070 Disponível em httpwwwR projectorg Acesso em 02022024 SAMPAIO IBM Estatística aplicada à Experimentação Animal 3ª ed Belo Horizonte FEPMVZ 2007 264p RAÇA MANGALARGA MARCHADOR POTRO Y1 Y2 Y3 Y4 Y5 Y6 Y7 Y8 1 1222 1183 601 150 1203 270 250 951 2 1266 1397 783 169 1331 280 298 994 3 1249 1405 672 249 1215 310 281 998 4 1340 1347 627 161 1243 369 298 1042 5 1341 1275 631 269 1210 355 265 969 6 1396 1295 710 169 1363 336 289 1032 7 1372 1287 791 232 1344 360 319 981 8 1236 1282 725 227 1258 333 333 1005 9 1363 1359 711 255 1373 372 351 971 10 1228 1363 735 164 1292 366 277 962 11 1333 1329 782 163 1340 348 1058 12 1224 1184 788 255 352 974 13 1303 1354 714 320 1058 14 1330 1316 311 15 1265 Y1 ALTURA DE CERNELHA cm Y2 ALTURA DE GARUPA cm Y3 COMPRIMENTO DO CORPO cm Y4 PERÍMETRO DE CANELA cm Y5 PERÍMETRO TORÁCICO cm Y6 COMPRIMENTO DA CABEÇA cm Y7 PERÍMETRO DO JOELHO cm Y8 ÂNGULO FÊMURTIBIAL RAÇA CAMPOLINA POTRO Y9 Y10 Y11 Y12 Y13 Y14 Y15 Y16 1 1432 1452 1392 150 1705 351 210 961 2 1447 1562 1473 169 1970 457 220 1040 3 1503 1548 1433 249 1788 459 218 1068 4 1440 1528 1405 161 1947 467 250 1023 5 1464 1578 1392 269 1911 393 280 1055 6 1490 1553 1392 169 1898 433 280 1001 7 1531 1454 1436 232 1809 437 230 1005 8 1455 1454 1447 227 1916 479 219 1005 9 1475 1504 1426 255 1965 493 282 1036 10 1442 1552 1475 164 1710 405 290 1061 11 1494 1523 1445 163 1811 353 217 1042 12 1436 1457 1394 255 1723 486 281 13 1450 1485 170 1941 452 14 1410 220 1930 15 244 Y9 ALTURA DE CERNELHA cm Y10 ALTURA DE GARUPA cm Y11 COMPRIMENTO DO CORPO cm Y12 PERÍMETRO DE CANELA cm Y13 PERÍMETRO TORÁCICO cm Y14 COMPRIMENTO DA CABEÇA cm Y15 PERÍMETRO DO JOELHO cm Y16 ÂNGULO FÊMURTIBIAL RAÇA ÁRABE POTRO Y17 Y18 Y19 Y20 Y21 Y22 Y23 Y24 1 1502 1482 1613 220 1341 320 210 921 2 1544 1597 1618 238 1357 364 225 953 3 1542 1530 1682 246 1403 326 222 984 4 1523 1594 1662 229 1383 354 269 971 5 1549 1609 1771 228 1381 341 316 938 6 1534 1494 1721 260 1378 332 315 951 7 1550 1527 1703 234 1428 338 240 1000 8 1559 1595 1712 221 1341 328 223 981 9 1590 1614 1686 236 1416 347 318 974 10 1579 1505 1734 252 1411 376 329 974 11 1550 1557 1687 223 1392 322 220 12 1506 1488 1623 255 1343 316 13 1538 256 297 14 1591 284 15 1555 Y17 ALTURA DE CERNELHA cm Y18 ALTURA DE GARUPA cm Y19 COMPRIMENTO DO CORPO cm Y20 PERÍMETRO DE CANELA cm Y21 PERÍMETRO TORÁCICO cm Y22 COMPRIMENTO DA CABEÇA cm Y23 PERÍMETRO DO JOELHO cm Y24 ÂNGULO FÊMURTIBIAL Obs1 Para obtenção do valor tabelado correto para o teste de médias utilize a informação contida na Tabela 31 Página 9 do Guia de aulas Obs2 Para obtenção do valor tabelado correto para o teste de variâncias utilize a informação contida na Tabela A Página 13 do Guia de aulas Obs3 Apresente todos os cálculos necessários para execução das cinco perguntas Utilize o protocolo de aplicação dos testes para facilitar a organização das respostas Obs4 Cada grupo será constituído por no máximo três 3a alunoas Obs5 Cada grupo deverá responder a cinco perguntas a b c d1 d2 que estão discriminadas acima Não pode haver escolha da mesma pergunta para dois ou mais grupos Obs4 A entrega do trabalho deve ocorrer IMPRETERIVELMENTE no período matutino da 6ª feira dia 22032024 ANTECENDENDO A AVALIAÇÃO AV1 Não será considerada a entrega do trabalho em data e horário posterior à realização da AV1