·
Bioengenharia ·
Bioestatística
Send your question to AI and receive an answer instantly
Recommended for you
304
Dados Categóricos: Delineamentos Amostrais e Modelos
Bioestatística
UEL
4
Lista de Exercícios - Análise de Variância (ANOVA) e Teste de Tukey em Experimentos com Poedeiras e Ratos
Bioestatística
UEL
5
Análise Estatística - Ensaio Clínico Randomizado Duplo Cego - Eficácia de Antidepressivo Tricíclico vs Placebo
Bioestatística
UEL
5
Lista de Exercícios Simples
Bioestatística
UEL
1
Lista de Exercícios
Bioestatística
UEL
3
Lista de Exercícios - Estatística e Análise de Dados Categóricos
Bioestatística
UEL
Preview text
Profa Dra Vanderli Marino Melem ANOVA pg 1 FORMAS DE OBTENÇÃO DOS DADOS Introdução Mais importante que analisar os dados é o planejamento adequado da forma com que estes dados serão obtidos A essência de um bom planejamento consiste em projetar uma forma de coleta que seja capaz de fornecer exatamente o tipo de informação que procuramos Para isto é preciso saber exatamente o que se procura Existem na literatura os chamados ESTUDOS OBSERVACIONAIS e os ESTUDOS EXPERIMENTAIS ensaio clínico aleatório Arango 2012 os define Os estudos observacionais caracterizamse pela não intervenção do pesquisador no ambiente da pesquisa Neles as situações ocorrem normalmente e o pesquisador observa as características dos pesquisados e faz comparações e descrições Já os estudos experimentais o pesquisador produz uma situação artificial na qual ele aloca aleatoriamente os elementos pesquisados a grupos de modo a serem submetidos ou não a uma vacina um medicamento ou outro procedimento a fim de terem os efeitos avaliados em condições controladas de observação Nos estudos observacionais encontramos Arango 2012 RETROSPECTIVO OU DE CASOS E CONTROLES estes são iniciados após os indivíduos terem desenvolvido a condição patológica ou não investigada Esses estudos regridem no tempo para determinar as características que os indivíduos apresentavam antes do início da condição Os casos são os indivíduos que desenvolveram a condição e os controles os que não desenvolveram COORTE é um grupo de indivíduos que compartem uma experiência Exemplo pode ser indivíduos que apresentaram um episódio de hipertensão em um período determinado PREVALÊNCIA OU TRANSVERSAL este consiste em estudar determinada população ou uma amostra representativa dela em função de apresentar características que possibilitem a investigação exposiçãodoença Estas informações são medidas simultaneamente em um curto período de tempo O estudo transversal fornece um retrato de como as variáveis estavam relacionadas no momento da pesquisa Nos estudos experimentais devese planejar a coleta das informações e seguir algumas condições para que se defina previamente o tipo de análise estatística que será feita O Planejamento de Experimentos objetiva determinar com antecedência como será o experimento e como serão analisados os dados STORCK et al 2006 pg 91 Planejar o experimento é um método que visa auxiliar o pesquisador na execução de um projeto de pesquisa no qual se faz necessário a realização de experimentos O projeto de pesquisa é um documento composto geralmente de título autores introdução colocação de problema sua importância e objetivos da pesquisa revisão bibliográfica material e métodos contém todas as informações de como será a pesquisa para alcançar os objetivos propostos cronograma físico de atividades orçamento e bibliografia consultada STORCK et al 2006 pg 103 A parte de material e métodos e cronograma de atividades deve ser o mais detalhado possível Profa Dra Vanderli Marino Melem ANOVA pg 2 O plano experimental deve conter alguns itens como descreve Storck et al 2006 pgs 104 a 109 Alguns destes itens são utilizados nos estudos observacionais também a TÍTULO deve indicar com precisão a natureza do experimento ser claro e conciso facilitando a comunicação entre os pesquisadores técnicos e demais participantes Pode ser do tipo que reflete a natureza dos tratamentos b VINCULAÇÃO COM A PESQUISA relacionar o experimento ao nome do projeto de pesquisa a que está vinculado c OBJETIVOS DO EXPERIMENTO devem ser claros e estarem em ordem de prioridade Devem ser suficientemente completos para que a parir deles seja possível determinar adequadamente os tratamentos que deverão compor o experimento d RELAÇÃO DOS TRATAMENTOS é decorrente dos objetivos Devese evitar incluir tratamentos sem a devida justificativa Quando possível devemos incluir um tratamento testemunha ou padrão o qual deverá servir de referência para as conclusões No caso de tratamentos quantitativos devemos de preferência usar valores eqüidistantes cuja amplitude de variação reflita a realidade Os tratamentos podem ser decorrentes das alternativas de um fator ou da combinação entre os níveis de dois ou mais fatores no caso de experimentos fatoriais e CROQUI DO EXPERIMENTO é um desenho planta baixa do experimento identificando o local as dimensões as unidades experimentais UEs determinar o tamanho e a forma das UEs e verificar a homogeneidade entre elas e a ordem aleatória de aplicação dos tratamentos sobre as UEs obtidas por sorteio de acordo com o delineamento escolher o delineamento experimental mais adequado em função da homogeneidade entre as UEs e a natureza dos tratamentos Calcular o número de repetições necessárias para uma dada precisão f VARIÁVEIS A SEREM OBSERVADAS descrever as variáveis que serão analisadas assim como a época e o modo de realização da coleta de informações As variáveis devem refletir o efeito dos tratamentos que estão sendo comparados g MODELO DE CADERNO DE CAMPO é uma ficha elaborada com base no croqui do experimento cuja finalidade é anotar os dados sobre os efeitos dos tratamentos Os efeitos ou respostas dos tratamentos são avaliados por meio das variáveis medidas no experimento também chamadas de variáveis respostas que na análise estatística constituem as variáveis dependentes enquanto os tratamentos constituem as variáveis independentes h CRONOGRAMA DE ATIVIDADES devese fazer uma lista com as principais atividades etapas da execução do experimento com as respectivas datas i CONDIÇÕES GERAIS DO EXPERIMENTO descrever todas as particularidades não citadas nos itens anteriores de tal forma que seja possível uma repetição do experimento nas mesmas condições gerais Profa Dra Vanderli Marino Melem ANOVA pg 3 j ANÁLISE DOS RESULTADOS devese descrever o modelo matemático identificando os seus componentes e pressuposições com o respectivo esquema geral de análise quadro de análise de variância com causas de variação e graus de liberdade e a análise complementar contrastes ou comparações de médias análise de regressão e estimativas sempre de acordo com o delineamento experimental e os tipos de tratamentos Storck et al 2006 pg 109 salienta ainda que o planejamento do experimento sendo um dos componentes do projeto de pesquisa necessita de uma previsão de recursos financeiros materiais humanos e espaço físico Após a execução do experimento e da sua análise estatística devemos organizar um relatório ANÁLISE DE VARIÂNCIA ANOVA DE 1 FATOR 1 Introdução Que análise devemos utilizar para comparar em média mais de duas populações Por exemplo comparar a eficácia de 4 medicamentos Poderseia pensar em aplicar o teste t para amostras independentes e analisarmos todos os pares de médias Há 6 possíveis pares 4 combinados 2 a 2 e se a probabilidade de corretamente aceitar a hipótese nula para cada par testado é de 1 alpha 095 então a probabilidade de corretamente aceitar a hipótese nula para todos os 6 pares é 095607351 se os testes forem independentes Assim para não reduzir esta probabilidade devemos usar um método que compare todos os grupos medicamentos ao mesmo tempo em uma só análise O procedimento apropriado para testar a igualdade de várias médias é a análise de variância Fisher desenvolveu a técnica denominada análise de variância Analysis of variance ANOVA que consiste em decompor o número de graus de liberdade da variância total dos dados em partes atribuídas a causas conhecidas e independentes fatores controlados e a uma parte residual de origem desconhecida e de natureza aleatória fatores não controlados 2 Princípios Básicos da Experimentação Unidade Experimental ou Parcela Quando se realiza um experimento é preciso escolher uma unidade para o experimento onde será observada a resposta os dados que refletirão os efeitos dos tratamentos Ex um indivíduo um animal etc As unidades amostrais devem ser homogêneas ou seja semelhantes em suas características Repetição É necessário que haja repetição em cada amostra para que se possa detectar como a variável resposta varia dentro de cada amostra Isto tem a finalidade de proporcionar a obtenção de uma estimativa do erro experimental Casualização Este princípio tem a finalidade de proporcionar a todos os tratamentos a mesma probabilidade de serem designados a qualquer das unidades experimentais homogêneas Seu propósito é garantir que um tratamento não seja continuamente favorecido ou desfavorecido nas sucessivas repetições por alguma fonte de variação estranha Profa Dra Vanderli Marino Melem ANOVA pg 4 Ao fazer um experimento considerando apenas esses princípios temos o delineamento inteiramente casualizado DIC ou com um fator As parcelas unidades amostrais que receberão cada um dos tratamentos são determinadas de forma inteiramente casual sem qualquer restrição no critério de casualização Controle local Sua finalidade é dividir um ambiente heterogêneo em subambientes homogêneos e tornar o delineamento experimental mais eficiente 3 Delineamento Inteiramente Casualizado DIC com um único fator Estudaremos como a análise de variância poderá ser usada para comparar médias quando houver um único fator com mais de dois níveis Os níveis do fator são comumente chamados de tratamentos herança da área agronômica Feito o experimento e selecionado o modelo adequado no caso o inteiramente ao acaso a idéia é analisar a quantidade de variação devida aos efeitos dos tratamentos utilizados e a variação devida ao acaso resíduo Portanto a hipótese sendo testada na análise de variância é a de que não existe efeito dos tratamentos H0 0 τ τ τ a 2 1 H1 τi 0 para no mínimo um i Logo se a hipótese nula for verdadeira cada observação consistirá na média global μ mais um componente do erro aleatório ij ε Podemos dizer que a mudança nos níveis do fator tratamentos não tem efeito na resposta média Podemos escrever o modelo descrito como ij i ij ε μ y sendo i i τ μ μ a média do tratamento i Assim é comum escrever as hipóteses de forma equivalente H0 a 2 1 μ μ μ H1 i i μ μ para no mínimo um i existe diferença entre pelo menos duas médias Ou ainda podese escrever as HIPÓTESES DA ANOVA da forma H0 ou seja em média as a populações são iguais H1 Existe pelo menos uma diferença entre duas médias populacionais Algumas vantagens deste delineamento são a Pode ter número diferente de repetições por tratamento e qualquer número de tratamento no entanto é preferível o mesmo número de repetições por tratamento b O número de graus de liberdade do resíduo é o maior possível c Se ocorrer a perda de alguma parcela isto não acarretará dificuldade na análise Este delineamento será eficiente somente quando existir homogeneidade entre as unidades experimentais Por não utilizar o princípio do controle local todas as variações exceto as devidas aos efeitos dos tratamentos são consideradas como variações do acaso elevando a estimativa da variância residual Para o delineamento inteiramente ao acaso o modelo matemático é ij i ij ε τ μ y i 1 2 a j 1 2 n onde yij é o valor observado na parcela que recebeu o tratamento i na repetição j Profa Dra Vanderli Marino Melem ANOVA pg 5 iτ é um parâmetro associado ao tratamento i chamado efeito do tratamento i μ é um parâmetro comum a todos os tratamentos chamado média global ij ε é o componente do erro aleatório Tabela 1 Dados típicos para um experimento com um único fator Tratamento Observações Totais Médias 1 y11 y12 y1n y1 1 y 2 y21 y22 y2n y2 2 y a ya1 ya2 yan ya a y y y n 1 j ij i y y n y y i i i 1 2 a a 1 i n 1 j ij y y N y y sendo N an A análise de variância desenvolvida aqui é para o modelo com efeitos fixos neste caso os efeitos dos tratamentos iτ são geralmente definidos como desvios da média global μ de modo que a 1 i i 0 τ A análise de variância divide a variabilidade total dos dados da amostra em dois componentes Então o teste de hipóteses é baseado na comparação das duas estimativas independentes da variância da população a média quadrática do tratamento e a média quadrática do resíduo Verifique que ij y y ij y y iy iy iy y ij y iy agora some em todos os elementos e eleve ao quadrado para obter a identidade da soma quadrática A variabilidade total dos dados é dada por 2 a 1 i n 1 j ij y y SQTo 2 a 1 i i y y SQTr n 2 a 1 i n 1 j i ij y y SQR OBS Nesta análise de um fator Delineamento Inteiramente Casualizado o que chamamos de a i 1 2 a quantidade de tratamentos é a quantidade de níveis do fator As fórmulas de cálculo das somas quadráticas para análise de variância com tamanhos iguais de amostra em cada tratamento são a 1 i n 1 j 2 2 ij N y y SQTo a 1 i 2 2 i N y n y SQTr e SQR SQTo SQTr Profa Dra Vanderli Marino Melem ANOVA pg 6 Quando temos tamanhos diferentes ni com i 1 2 a de amostra em cada tratamento usamos as fórmulas a 1 i n 1 j 2 2 ij i N y y SQTo a 1 i 2 i 2 i N y n y SQTr e SQR SQTo SQTr Fontes de Variação Graus de Liberdade Soma Quadrática Média Quadrática Médios Fcal Ftab Tratamento Tr a 1 SQTr MQTr MQTrMQR 1 n 1 a a Resíduo R a n 1 SQR MQR Total To na 1 SQTo OBS Para número diferente de repetições por tratamentos o grau de liberdade do resíduo fica E o grau de liberdade total é ESTATÍSTICA DO TESTE Fcal A estatística do teste F de Snedecor é obtida no quadro de ANOVA pela divisão MQR MQTr 1 n a SQR 1 a SQTr Fcal que sob H0 tem distribuição F de Snedecor com a1 e an1 graus de liberdade Observe que os resíduos amostrais são dados por i ij y y onde iy é a média do iésimo tratamento A razão MQTrMQR que é a Estatística do teste no quadro de análise de variância é insensível a leves desvios da suposição de variâncias homogêneas para as a populações quando as amostras são de tamanhos iguais A MQR é um estimador não tendencioso de 2 σ independente da hipótese nula ser ou não verdadeira O erro aleatório ou erro experimental é a variação entre as unidades experimentais após subtrair os efeitos controlados no experimento efeitos dos tratamentos blocos etc Este erro não pode ser eliminado completamente mas sim reduzido e é representado no modelo matemático do delineamento experimental por ij ε e é responsável pela magnitude do MQR CRITÉRIO DE DECISÃO utilizando a tabela F de Snedecor AQUI A REGIÃO CRÍTICA É SEMPRE UNILATERAL SUPERIOR Portanto procure na tabela F de Snedecor o valor de Ftabelado correspondente ao nível de significância alfa desejado Para encontrar o valor de Ftabelado é preciso considerar a coluna correspondente ao grau de liberdade 1 a1 e a linha correspondente ao grau de liberdade 2 an1 Profa Dra Vanderli Marino Melem ANOVA pg 7 Se Fcal Ftabelado Aceitase a hipótese nula H0 e concluise que não podemos desconsiderar a igualdade das médias populacionais Ou seja pvalor alfa Se Fcal Ftabelado Rejeitase a hipótese nula H0 logo existe pelo menos uma diferença entre as médias populacionais Ou seja pvalor alfa Exemplo tendo 4 tratamentos com 6 repetições cada ou seja 3 graus de liberdade para tratamentos e 20 graus de liberdade para o resíduo e nível de significância de 5 no R obtemos o quantil crítico com qf1alfadf1a1df2an1 qf095 320 faça no R e veja o resultado e compare com o resultado da tabela F TABELA 2 Distribuição F de Snedecor 5 1 2 1 2 3 4 5 6 7 8 9 10 20 30 120 1 1614 1995 2157 2246 2302 2340 2368 2389 2405 2419 2480 2501 2533 2543 2 1851 1900 1916 1925 1930 1933 1935 1937 1938 1940 1945 1946 1949 1950 3 1013 955 928 912 901 894 889 885 881 879 866 862 855 853 4 771 694 659 639 626 616 609 604 600 596 580 575 566 563 5 661 579 541 519 505 495 488 482 477 474 456 450 440 436 6 599 514 476 453 439 428 421 415 410 406 387 381 370 367 7 559 474 435 412 397 387 379 373 368 364 344 338 327 223 8 532 446 407 384 369 358 350 344 339 335 315 308 297 292 9 512 426 386 363 348 337 329 323 318 314 294 286 275 271 10 496 410 371 348 333 322 314 407 302 298 277 270 258 254 11 484 398 359 336 320 309 301 295 290 285 265 257 245 240 12 475 389 349 326 311 300 290 285 280 275 254 247 234 230 13 467 381 341 318 303 292 283 277 271 267 246 238 225 221 14 460 374 334 311 296 285 276 270 265 260 239 331 218 213 15 454 368 329 306 290 279 271 264 259 254 233 225 211 207 16 449 363 324 301 285 274 266 259 254 249 228 219 206 201 17 445 359 320 296 281 270 261 255 249 245 223 215 201 196 18 441 355 316 293 277 266 258 251 246 241 219 211 197 192 19 438 352 313 290 274 263 254 248 242 238 216 207 193 188 20 435 349 310 287 271 260 251 245 239 235 212 204 190 184 21 432 347 307 284 268 257 249 242 237 232 210 201 187 181 22 430 344 405 282 266 255 246 240 234 230 207 198 184 178 23 428 342 303 280 264 253 244 237 232 227 205 196 181 176 24 426 340 301 278 262 251 242 236 230 225 203 194 179 173 30 417 332 292 269 253 242 233 227 221 216 193 184 168 162 40 408 323 284 261 245 234 221 218 212 208 184 174 158 151 60 400 315 276 253 237 225 217 210 204 199 175 165 147 139 120 392 307 268 245 229 217 209 202 196 191 166 155 135 125 384 300 260 237 221 210 201 194 188 183 157 146 122 100 1 É O GRAU DE LIBERDADE DO NUMERADOR GRAU DE LIBERDADE DO TRATAMENTO 2 É O GRAU DE LIBERDADE DO DENOMINADOR GRAU DE LIBERDADE DO RESÍDUO Profa Dra Vanderli Marino Melem ANOVA pg 8 CRITÉRIO DE DECISÃO pelo pvalor O pvalor é a área acima da ESTATÍSTICA DO TESTE Fcal na distribuição F de Snedecor Desta forma rejeite a hipótese nula quando pvalor for menor que o nível de significância desejado CONCLUSÃO A conclusão do teste é a interpretação da decisão tomada na etapa anterior O que significa para o pesquisador não poder rejeitar H0 ou poder rejeitar H0 No caso de rejeição de H0 a análise de variância está indicando que existe pelo menos uma diferença significativa entre as médias das populações de onde foram retiradas as amostras Onde estão estas diferenças significativas Isto só poderá ser respondido após fazer um teste de comparações múltiplas Em geral estes testes comparam as médias populacionais duas a duas e assim verificamos onde estão as diferenças significativas Temse muitos testes de comparações múltiplas Teste Tukey usado quando temos níveis qualitativos dos tratamentos Teste de Dunnett usado para comparar cada tratamento com o controle Teste de StudentNewmanKeuls SNK e outros SUPOSIÇÕES devem ser verificadas PARA A VALIDADE DA ANÁLISE DE VARIÂNCIA SNEDECOR e COCHRAN 1972 ADITIVIDADE a aditividade dos efeitos dos fatores que ocorrem no modelo isto é existe uma soma de efeitos e esses efeitos são independentes Verificado pelo teste de Aditividade de Tukey Steel e Torrie 1960 INDEPENDÊNCIA independência dos erros desvios até certo ponto garantida pelo princípio da casualização NORMALIDADE eij N0 2 σ consequentemente cada tratamento pode ser pensado como uma população normal de média iμ e variância 2 σ A normalidade dos erros pode ser verificada por um teste de normalidade como o de Lilliefors ou ainda o de Shapiro Wilk Ou ainda graficamente com o uso dos gráficos de probabilidade normal HOMOCEDASTICIA homogeneidade de variâncias que pode ser verificada por meio dos testes Fmáx ou teste de Hartley ou da razão máxima Isto é cada Yij com i 1 2 a normalmente distribuído com EYij i e VYij 2 Os desvios padrão da amostra s para os a tratamentos geralmente serão diferentes mesmo quando os desvios populacionais correspondentes forem idênticos Uma regra prática simples é que se o maior s não for maior do que duas vezes o menor é razoável supor 2 iguais ou seja variâncias populacionais iguais DEVORE 2006 pg360 Em Walpole et al 2006 pg330 encontramos dois testes que verificam a homogeneidade de variâncias Teste de Bartlett e Teste de Cochran O de Bartlett é sensível à falta de normalidade uma outra opção é usar o teste de Levene que usa os resíduos i ij y y e faz uma nova análise de variância sendo esta não significante as variâncias podem ser consideradas homogêneas Profa Dra Vanderli Marino Melem ANOVA pg 9 Se a suposição de normalidade ou a de homogeneidade de variâncias forem consideradas implausíveis devese empregar um método de análise diferente do usual teste F por exemplo um teste não paramétrico ou buscar uma transformação dos dados de forma que as suposições para o teste F sejam satisfeitas o uso da transformação BoxCox é uma alternativa para encontrar a melhor transformação possível O Coeficiente de Variação CV A magnitude do erro experimental pode ser avaliada pelo coeficiente de variação dado por 100 y MQR CV a média geral do experimento é N y y Storck et al 2006 pg93 acentua que o CV somente deve ser usado para comparar a precisão de experimentos semelhantes inclusive quanto ao nível tecnológico mesmas variáveis tratamentos delineamento número de repetições procedimentos etc O CV dá então uma estimativa da variação total do experimento ou seja descreve pontualmente a variabilidade relativa dos dados Sendo que quanto maior o CV menor é a precisão do experimento e menor é a qualidade do experimento Para orientação siga o proposto por Gomes 1990 Valor do CV Classificação Precisão 10 Baixos Alta 10 a 20 Médios Média 20 a 30 Altos Baixa 30 Muito Altos Muito Baixa No R o pacote agicolae calcula o coeficiente de variação com o comando cvmodel Exemplo 1 Suponha que para testar as 4 drogas para a redução de colesterol 20 indivíduos foram aleatoriamente selecionados para participar do experimento Qual a droga que cada indivíduo deverá tomar De que forma essa atribuição deve ser feita Considere os 20 indivíduos e as 4 drogas que serão comparadas A B C e D Para se definir o tipo de droga que será dado a cada indivíduo realizase um sorteio enumerando cada um dos 20 indivíduos parcelas que participarão do estudo 1 a 20 e em seguida colocamse as drogas tratamentos em uma sequência como a dada a seguirA1 A2 A3 A4 A5 B1 B2 B3 B4 B5 C1 C2 C3 C4 C5 D1 D2 D3 D4 D5 A partir daí utilizando uma tabela de números aleatórios fazse a alocação do tipo de droga a cada indivíduo Suponha a seguinte sequência de números aleatórios 12 6 16 15 10 14 1 20 8 13 18 2 4 9 17 19 3 5 11 7 que está associado com a sequência das drogas A1 A2 A3 A4 A5 B1 B2 B3 B4 B5 C1 C2 C3 C4 C5 D1 D2 D3 D4 D5 Esta sequência de números aleatórios pode ser obtida no R Vejamos Para obter a sequência de números aleatórios e alocálas a cada tratamento usando o R bastam os seguintes comandos Droga factorrepLETTERS14 each5 Individuo sample120 dataframeDroga Individuo Profa Dra Vanderli Marino Melem ANOVA pg 10 Droga factorrepLETTERS14 each5 Individuo sample120 dataframeDroga Individuo Droga Individuo 1 A 12 2 A 6 3 A 16 4 A 15 5 A 10 6 B 14 7 B 1 8 B 20 9 B 8 10 B 13 11 C 18 12 C 2 13 C 4 14 C 9 15 C 17 16 D 19 17 D 3 18 D 5 19 D 11 20 D 7 Assim terseia a seguinte configuração do experimento indivíduo droga reduções de colesterol mgdL 1 B2 101 2 C2 712 3 D2 98 4 C3 922 5 D3 871 6 A2 487 7 D5 899 8 B4 841 9 C4 1067 10 A5 895 11 D4 904 12 A1 438 13 B5 675 14 B1 937 15 A4 842 16 A3 722 17 C5 689 18 C1 917 19 D1 805 20 B3 494 Profa Dra Vanderli Marino Melem ANOVA pg 11 Seja yij o valor da redução do colesterol do jésimo indivíduo que recebeu a iésima droga tratamento Dados os valores das reduções de colesterol mgdL Ao nível de 5 de significância concluir a respeito das drogas quanto à redução do colesterol Drogas A B C D 438 937 917 805 487 101 712 98 722 494 922 871 842 841 1067 904 895 675 689 899 Totais 3384 3957 4307 4459 Médias 6768 7914 8614 8918 Para obter os resultados da análise de variância utilizando o R e considerando as hipóteses H0 D C B A H1 i i μ μ para no mínimo um i existe diferença entre pelo menos duas médias fazemos Script ANOVA no R dadosc438937917805 48710171298 722494922871 8428411067904 895675689899 drogasfactorrepcABCD5 resultadoaovdadosdrogas summaryresultado aparece o quadro de ANOVA boxplotdadosdrogas xlabDrogas ylabReduções de colesterol mgdL namescABCD parmfrowc22 divide a janela gráfica plotresultado faz gráficos para a análise de resíduo dadosc438937917805 48710171298 722494922871 8428411067904 895675689899 drogasfactorrepcABCD5 resultadoaovdadosdrogas summaryresultado aparece o quadro de ANOVA Df Sum Sq Mean Sq F value PrF drogas 3 1367 4556 1583 0233 Residuals 16 4605 2878 boxplotdadosdrogas xlabDrogas ylabReduções de colesterol mgdL namescABCD parmfrowc22 divide a janela gráfica plotresultado faz gráficos para a análise de resíduo Profa Dra Vanderli Marino Melem ANOVA pg 12 A B C D 5 6 7 8 9 10 Drogas Reduções de colesterol mgdL 70 75 80 85 90 3 1 0 1 2 Fitted values Residuals Residuals vs Fitted 10 1 6 2 1 0 1 2 2 1 0 1 Theoretical Quantiles Standardized residuals Normal QQ 10 1 6 70 75 80 85 90 00 04 08 12 Fitted values Standardized residuals ScaleLocation 10 1 6 2 1 0 1 Factor Level Combinations Standardized residuals tr 1 tr 2 tr 3 tr 4 drogas Constant Leverage Residuals vs Factor Levels 10 1 6 Profa Dra Vanderli Marino Melem ANOVA pg 13 O diagrama de caixas ou boxplot é uma representação gráfica para os conceitos de separatrizes Tratase de um retângulo que representa o desvio interquartílico Esse retângulo representa portanto a faixa dos 50 dos valores mais típicos da distribuição O retângulo é dividido no valor correspondente a mediana assim ele indica o quartil inferior a mediana e o quartil superior Entre os quartis e os extremos são traçadas linhas Caso existam valores discrepantes a linha é traçada até o último valor não discrepante e os valores discrepantes são indicados por pontos OUTRA OPÇÃO PARA LEITURA DOS DADOS e ANOVA 1 FATOR Digitando todos de cada tratamento por vez rmlistls para apagar memória anterior dadosc4384877228428959371014948416759177129221067689 80598871904899 drogasfactorrepcABCDeach5 Compare que na folha anterior foi digitado um de cada tratamento por vez desta forma drogasfactorrepcABCD5 resultadoaovdadosdrogas summaryresultado plotdadosdrogas xlabDrogas ylabRedução de Colesterol em mgdL namescABCD parmfrowc22 divide a janela gráfica plotresultado faz gráficos para a análise de resíduo TESTANDO A SUPOSIÇÃO DE NORMALIDADE H0 Os erros têm distribuição normal H1 Os erros não têm distribuição normal shapirotestresultadores shapirotestresultadores ShapiroWilk normality test data resultadores W 095304 pvalue 04156 TESTANDO A SUPOSIÇÃO DE HOMOCEDASTICIDADE H0 As variâncias são homogêneas H1 As variâncias não são homogêneas bartletttestdadosdrogas bartletttestdadosdrogas Bartlett test of homogeneity of variances data dados by drogas Bartletts Ksquared 47347 df 3 pvalue 01923 Profa Dra Vanderli Marino Melem ANOVA pg 14 OBS Estudos indicam que o teste de Bartlett é muito sensível à falta de normalidade e não deve ser aplicado quando houver dúvida sobre a suposição de normalidade Neste caso devese utilizar o teste de Levene Para aplicar o teste de Levene usando o R é preciso instalar o pacote car carregálo e executálo TESTE DE LEVENE para homogeneidade de variâncias requirecar ou usa librarycar Teste de Levene verifica se variâncias são homogêneas leveneTestdadosdrogas centermean librarycar leveneTestdadosdrogas centermean Levenes Test for Homogeneity of Variance center mean Df F value PrF group 3 33205 004662 16 Signif codes 0 0001 001 005 01 1 Neste exemplo das drogas a análise de variância forneceu um pvalor de 0233 Portanto não se pode dizer que o efeito médio das drogas não sejam iguais Nos casos em que a análise de variância for significativa ou seja poder se rejeitar a hipótese nula concluise que existe pelo menos uma diferença significativa entre as médias populacionais Para saber entre quais médias estão estas diferenças significativas é necessário se fazer outros testes chamados testes de comparações múltiplas Profa Dra Vanderli Marino Melem ANOVA pg 15 COMPARAÇÕES ENTRE MÉDIAS DOS VÁRIOS TRATAMENTOS Resende Fonseca e Silva e Azevedo 2014 citam alguns testes de comparações múltiplas e destacam que estes testes foram derivados na suposição de tratamentos de efeitos fixos e portanto não se justifica a sua aplicação quando os efeitos de tratamentos são considerados aleatórios Os testes t ou LSD de Fisher ou forma F protegida de Fisher quando aplicado somente se o teste F é significativo Tukey ou HSD Duncan Scheffé Dunnett adequado especificamente para comparação das médias dos tratamentos com as médias das testemunhas NewmanKeuls ou StudentNewmanKeulsSNK Bonferroni ou LSDB ScottKnott Citado por Resende Fonseca e Silva e Azevedo 2014 pg 106 uma avaliação via simulação de vários testes quanto às taxas de erro tipo I e poder foi realizada por Perecin e Barbosa 1988 e revelou os seguintes resultados Os testes t e Duncan não apresentam taxas favoráveis de erro tipo I ou seja não conservam adequadamente os níveis nominais de significância O teste Tukey possui um poder muito reduzido especialmente quando há grande número de tratamentos O teste t bayesiano concilia de certa forma as características de alto poder e baixas taxas de erro tipo I entretanto as taxas de erro tipo I não podem ser previstas com exatidão e dependem do número de tratamentos e de suas magnitudes requerendo portanto aplicação cuidadosa O teste de NewmanKeuls possui poder muito superior e taxas de erro tipo I similares ao teste de Tukey De acordo com Conagin et al estes testes são aplicados no caso de tratamentos qualitativos e são realizados considerando Contrastes ortogonais teste t teste F e teste de Scheffé Médias duas a duas teste de Tukey teste de Duncan teste de Bonferroni e teste de NewmanKeuls teste de ScottKnott Comparação entre o controle e as demais médias teste de Dunnett Já para os casos de tratamentos quantitativos devese aplicar a análise de regressão TESTE DE TUKEY O teste de Tukey baseado na amplitude total estudentizada studentized range pode ser utilizado para comparar todo e qualquer contraste entre duas médias de tratamentos O teste é exato e muito simples quando se tem o mesmo número de repetições em todos os tratamentos Profa Dra Vanderli Marino Melem ANOVA pg 16 Consiste em comparar as médias duas a duas por meio da sua diferença em valor absoluto com a diferença mínima significativa d m s que é dada por yˆ Vˆ 2 1 Δ q onde q amplitude total estudentizada obtida em tabelas ao nível de 5 e 1 ver tabela pg final deste material considerandose número de tratamentos e graus de liberdade do resíduo ou seja o valor da tabela q com a an1 Por exemplo y y yˆ 2 1 então Vˆ y Vˆ y y Vˆ y yˆ Vˆ 2 1 2 1 pois os tratamentos são independentes Como 2 2 2 1 2 1 n s Vˆ y e n s Vˆ y pois admitese que os tratamentos tenham variâncias iguais então n n n se n 1 n s 1 yˆ Vˆ 2 1 2 1 2 n 2s yˆ Vˆ 2 logo n s q n 2 2s 1 q Δ 2 2 mas s2MQResíduo n MQR Δ q para tratamentos com o mesmo número de repetições MQR n 1 n 2 1 1 q Δ 2 1 para tratamentos com número diferentes de repetições Obtidas todas as diferenças entre médias duas a duas as que forem superiores ou iguais a Δ serão consideradas significativas Procedimento para aplicação do teste de TUKEY Dispor as médias em ordem crescente de valores isto é i i y y para todo i i Montar o quadro de diferenças entre todas as médias duas a duas Sendo a 2 1 y y y diferenças 1 y 2 y 3 y y a 1 a y 1 y X 1 2 y y 1 3 y y 1 a 1 y y 1 a y y 2 y X X 2 3 y y 2 a 1 y y 2 a y y 3 y X X X 3 a 1 y y 3 a y y y a 1 X X X X X a 1 a y y Comparar todas as diferenças encontradas no quadro acima com a diferença mínima significativa DMS de TUKEY maior valor aceitável para que duas médias sejam consideradas iguais Nos exemplos veremos como fazer o teste Tukey no R Profa Dra Vanderli Marino Melem ANOVA pg 17 TESTE DE STUDENTNEWMANKEULS SNK O teste de SNK é derivado do teste de Tukey sendo menos conservador ou seja encontra mais diferenças O teste Tukey controla o erro para todas as comparações já o SNK controla apenas para as comparações em consideração Dispor as médias em ordem crescente de valores isto é i i y y para todo i i O teste baseiase na quantidade n MQR SNK qi para tratamentos com o mesmo número de repetições 2 1 i SNK n 1 n 1 2 MQR q para tratamentos com número diferentes de repetições Onde qi é obtido da tabela Tukey ver pg final deste material para um nível alpha de significância correspondente a i distâncias entre as médias comparadas e graus de liberdade do resíduo Obtidas todas as diferenças entre médias duas a duas as que forem superiores ou iguais a SNK serão consideradas significativas Nos exemplos veremos como fazer o teste SNK no R TESTE DUNNETT Esse teste é quando as únicas comparações que interessam ao experimentador são aquelas entre um determinado tratamento padrão testemunha ou controle e cada um dos demais I tratamentos Inicialmente calcular as estimativas de cada contraste dada por ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ 2 2 1 1 Padrão ou Testemunha m m m Y m m Y m m Y P P I I P P Calcular o valor do teste d dado por onde td é o obtido na tabela de Dunnett 5 e 1 ver pg final deste material em função do número de graus de liberdade de tratamentos e do número de graus de liberdade do resíduo Comparar cada estimativa de contraste em valor absoluto com o valor d Se o módulo de Yˆ d Rejeitase Ho isto é a média da testemunha e a média do tratamento com ela comparado difere significativamente ao nível de significância α Se o módulo de Yˆ dNão rejeita Ho isto é a média da testemunha e a média do tratamento com ela comparado não difere significativamente ao nível de significância α Nos exemplos veremos como fazer o teste Dunnett no R Profa Dra Vanderli Marino Melem ANOVA pg 18 Exemplo 2 Um experimento foi conduzido no delineamento inteiramente casualizado com cinco repetições para avaliar o efeito de cinco medicamentos na diminuição da pressão arterial de animais experimentais Para isso o pesquisador escolheu ao acaso 30 animais do mesmo tipo e dividiu ao acaso em seis grupos sendo que em cada grupo os animais receberam o mesmo medicamento Exceto pelos medicamentos identificados por A B C D E e T todos os animais tiveram o mesmo cuidado e mesma alimentação sendo criados na mesma área experimental Após o período de avaliação os animais sorteados na área experimental bem como os tratamentos e os valores da pressão arterial foram A 21 B 8 B 10 D 29 C 11 C 10 A 23 E 12 A 26 T 2 E 13 T 4 D 25 E 15 D 31 C 14 A 21 B 6 C 14 B 10 T 0 D 33 C 12 A 22 E 11 D 30 E 15 T 2 T 1 B 9 Fazer a análise de variância completa e aplicar os testes de comparações múltiplas adequados e interpretar os resultados obtidos Organizando os dados T A B C D E 0 21 8 10 30 13 4 23 10 14 33 15 2 21 6 12 25 12 1 26 10 14 29 15 2 22 9 11 31 11 Os tratamentos estão na ordem T A B C D E Dadosc021810301342310143315221612251212610142915222911 3111 pressãofactorrepc1TABCDE5 Foi colocado 1T acima para ser considerado T como primeiro tratamento no Dunnett resultaovDadospressão summaryresult aparece o quadro de ANOVA plotDadospressão xlabMedicamentos ylabDiminuição da pressão arterial parmfrowc22 divide a janela gráfica plotresult faz gráficos para a análise de resíduo Os tratamentos estão na ordem T A B C D E Dadosc021810301342310143315221612251212610142915222911 3111 pressãofactorrepc1TABCDE5 resultaovDadospressão summaryresult aparece o quadro de ANOVA Df Sum Sq MeanSq F value PrF pressão 5 2483 4965 1216 309e16 Residuals 24 98 41 Signif codes 0 0001 001 005 01 1 plotDadospressãoxlabMedicamentosylabDiminuição da pressão arterial Profa Dra Vanderli Marino Melem ANOVA pg 19 parmfrowc22 divide a janela gráfica plotresult faz gráficos para a análise de resíduo 1T A B C D E 0 5 10 15 20 25 30 Medicamentos Diminuição da pressão arterial 5 10 15 20 25 30 4 2 0 2 4 Fitted values Residuals Residuals vs Fitted 16 19 10 2 1 0 1 2 2 1 0 1 2 Theoretical Quantiles Standardized residuals Normal QQ 16 19 10 5 10 15 20 25 30 00 05 10 15 Fitted values Standardized residuals ScaleLocation 16 19 10 3 2 1 0 1 2 Factor Level Combinations Standardized residuals tr 1 tr 3 tr 5 pressão Constant Leverage Residuals vs Factor Levels 16 19 10 Profa Dra Vanderli Marino Melem ANOVA pg 20 TESTANDO A SUPOSIÇÃO DE NORMALIDADE H0 Os erros têm distribuição normal H1 Os erros não têm distribuição normal shapirotestresultres shapirotestresultres ShapiroWilk normality test data resultres W 097704 pvalue 07426 TESTANDO A SUPOSIÇÃO DE HOMOCEDASTICIDADE H0 As variâncias são homogêneas H1 As variâncias não são homogêneas bartletttestDadospressão bartletttestDadospressão Bartlett test of homogeneity of variances data Dados by pressão Bartletts Ksquared 24197 df 5 pvalue 07885 Nos resultados da ANOVA no final da página 18 o pvalor é de 309e16 verificase que o pvalor é bem pequeno indicando que existem diferenças significativas Assim faremos os testes de comparações múltiplas para conhecer as diferenças existentes Como temos a testemunha aqui devemos fazer o teste de Dunnett este compara todos com a testemunha A testemunha deve ser o primeiro tratamento para que o programa a identifique TESTE DE DUNNETT requiremultcomp Teste de Dunnett compara os grupos com a testemunha contraglhtresult linfct mcppressão Dunnet summarycontra confintcontra level095 requiremultcomp Teste de Dunnett compara os grupos com a testemunha contraglhtresult linfct mcppressão Dunnet summarycontra Simultaneous Tests for General Linear Hypotheses Multiple Comparisons of Means Dunnett Contrasts Profa Dra Vanderli Marino Melem ANOVA pg 21 Fit aovformula dados pressão Linear Hypotheses Estimate Std Error t value Prt tr 2 tr 1 0 20800 1278 16275 1e04 tr 3 tr 1 0 6800 1278 5321 1e04 tr 4 tr 1 0 10400 1278 8138 1e04 tr 5 tr 1 0 27800 1278 21752 1e04 tr 6 tr 1 0 11400 1278 8920 1e04 Signif codes 0 0001 001 005 01 1 Adjusted p values reported singlestep method confintcontra level095 Simultaneous Confidence Intervals Multiple Comparisons of Means Dunnett Contrasts Fit aovformula dados pressão Quantile 26936 95 familywise confidence level Linear Hypotheses Estimate lwr upr tr 2 tr 1 0 208000 173575 242425 tr 3 tr 1 0 68000 33575 102425 tr 4 tr 1 0 104000 69575 138425 tr 5 tr 1 0 278000 243575 312425 tr 6 tr 1 0 114000 79575 148425 TESTE STUDENTNEWMANKEULS SNK requireagricolae testeSNKSNKtestresultpressão testeSNK TESTE STUDENTNEWMANKEULS SNK requireagricolae Loading required package agricolae testeSNKSNKtestresultpressão testeSNK statistics Mean CV MSerror 1466667 1377768 4083333 parameters Df ntr alpha test namet 24 6 005 SNK pressão SNK Table CriticalRange Profa Dra Vanderli Marino Melem ANOVA pg 22 2 2918793 2637702 3 3531697 3191581 4 3901262 3525555 5 4166314 3765082 6 4372651 3951548 means dados std r Min Max 1T 18 1483240 5 0 4 A 226 2073644 5 21 26 B 86 1673320 5 6 10 C 122 1788854 5 10 14 D 296 2966479 5 25 33 E 132 1788854 5 11 15 comparison NULL groups trt means M 1 D 296 a 2 A 226 b 3 E 132 c 4 C 122 c 5 B 86 d 6 1T 18 e Profa Dra Vanderli Marino Melem ANOVA pg 23 Exemplo 3 Um estudo avaliou o efeito terapêutico de três métodos de administração Grupo I II e III de uma droga flebotrópica O efeito desejado é a diminuição de edema do membro inferior Os dados experimentais de avaliação têm como variável resposta a diminuição da circunferência do tornozelo do membro mais afetado O esquema terapêutico selecionado será o que apresentar a maior diminuição da circunferência do tornozelo Adote o nível de significância de 5 GI 2 comprimidos de placebo pela manhã e dois comprimidos de Toflex 500 mg à noite GII 2 comprimidos de Toflex 500mg pela manhã e um comprimido de placebo à noite GIII 1 comprimidos de Toflex 500mg pela manhã e dois comprimidos de placebo à noite Tabela 11 Diminuição da circunferência do tornozelo cm após 60 dias de tratamento Tratamentos Repetições GI GII GIII 1 72 78 63 2 93 82 60 3 87 71 53 4 89 86 51 5 76 87 62 6 72 82 52 7 88 71 72 8 80 78 68 Soma 657 635 481 Média 821 794 601 a Realize uma análise exploratória dos dados b Verifique se há diferença significativa entre os resultados obtidos na forma em que foi administrado ao paciente ANOVA c Os pressupostos do modelo foram violados Gerar anova no R para verificar os pressupostos d Caso identifique diferença entre os tratamentos aplique o teste Tukey e Com esta análise poderíamos indicar um tratamento mais eficaz Qual Ou quais Justifique sua resposta Discuta qual melhor conduta medicamentosa f Apresente o coeficiente de variação do experimento e classifiqueo EXEMPLO variável resposta diminuição da circunferência do tornozelo em cm rmlistls para apagar memória anterior Os tratamentos estão na ordem GI GII GIII circunf c7293878976728880 7882718687827178 6360535162527268 metodofactorrepcGIGIIGIIIeach8 metodo Obtendo as medidas descritivas Titapplycircunf metodo sumTi Totais dos tratamentos Medias tapplycircunf metodo mean Medias Médias dos tratamentos Variancias tapplycircunf metodo var Variancias Variâncias dos tratamentos Gsumcircunf G Soma total dos dados ANOVAcircunfaovcircunfmetodo summaryANOVAcircunf aparece o quadro de ANOVA Profa Dra Vanderli Marino Melem ANOVA pg 24 requireagricolae cvmodelANOVAcircunf BOX PLOT mediat tapplycircunf metodo mean mediat parmaic1122 boxplotcircunf metodo ylabDiminuição da circunferencia do tornozelo xlabMétodos de administração da droga las1 colLightYellowmainFigura 1 Box Plot Tornozelo pointsmediat pch col2 cex15 TESTANDO A SUPOSIÇÃO DE NORMALIDADE shapirotestANOVAcircunfres TESTANDO A SUPOSIÇÃO DE HOMOCEDASTICIDADE bartletttestcircunfmetodo TESTE TUKEY anavatukey TukeyHSDANOVAcircunf metodo ordT anavatukey Para visualização rápida das diferenças no gráfico plotanavatukey las1 colblue TESTE STUDENTNEWMANKEULS SNK requireagricolae testeSNKSNKtestANOVAcircunfmetodo testeSNK ATENÇÃO PACOTE COMPLETO requireExpDespt dicmetodo circunf Escreva aqui as conclusões baseandose nos resultados do exemplo 3 Profa Dra Vanderli Marino Melem ANOVA pg 25 EXERCÍCIOS 1 Num estudo conduzido e publicado pela Universidade Estadual da Virginia pesquisadores observaram a imobilização por drogas em elefantes selvagem e testaram o tempo que os animais demoram em serem anestesiados usando quatro drogas diferentes em cinco animais por tratamento repetições num Experimento Inteiramente Casualizado A variável resposta observada foi o tempo minutos de demora para anestesia realizar o efeito desejado Tratamento A100 miligramas de cloreto de succinilcolina Tratamento B 50 miligramas de cloreto de succinilcolina Tratamento C 25 miligramas de cloreto de succinilcolina Tratamento D 10 miligramas de cloreto de succinilcolina Tabela 12 Tempo que os animais demoram a serem anestesiados a Verifique ao nível de 5 de significância se há diferença no tempo médio devido às drogas b Os pressupostos do modelo foram atendidos c Aplique o teste de Tukey para detectar qual medicamento anestesia mais rápido d Discuta os resultados e apresente a conclusão prática e Apresente o coeficiente de variação Ex1 variável resposta tempo que os animais demoram a serem anestesiados rmlistls para apagar memória anterior tempo c161514315146 1571481391515 151481511213 1821611617218 tratamentofactorrepcTATBTCTDeach5 tratamento ANOVAtempoaovtempotratamento summaryANOVAtempo aparece o quadro de ANOVA Coefieciente de variação requireagricolae cvmodelANOVAtempo BOX PLOT mediatrat tapplytempotratamento mean mediatrat parmaic1122 boxplottempotratamento ylabTempo para serem anestesiados xlabMétodos de administração da droga las1 colLightYellow pointsmediatrat pch col2 cex15 TA TB TC TD 160 157 150 182 150 148 148 161 143 139 151 160 150 150 120 172 146 150 130 180 Profa Dra Vanderli Marino Melem ANOVA pg 26 TESTANDO A SUPOSIÇÃO DE NORMALIDADE shapirotestANOVAtempores TESTANDO A SUPOSIÇÕES DE HOMOCEDASTICIDADE bartletttesttempotratamento O teste de homogeneidade de Bartlett é sensível a falta de normalidade Como Shapiro deu pvalor 01048 vamos fazer Levene requirecar Teste de Levene verifica se variâncias são homogêneas leveneTesttempotratamento centermean TESTE TUKEY anavatukey TukeyHSDANOVAtempo tratamento ordT anavatukey Para visualização rápida das diferenças no gráfico plotanavatukey las1 colblue TESTE STUDENTNEWMANKEULS SNK requireagricolae testeSNKSNKtestANOVAtempotratamento testeSNK Devido ao teste de homogeneidade de Levene ser significativo e o Box Plot mostrar outliers vamos fazer a ANOVA não paramétrica de KruskalWallis neste exercício tempo c161514315146 1571481391515 151481511213 1821611617218 tratamentofactorrepcTATBTCTDeach5 kruskaltesttempotratamento Onde tempo é numérico e tratamento um fator boxplottempotratamento ylabTempo para serem anestesiados xlabMétodos de administração da droga las1 colLightYellow Fazendo testes de comparações múltiplas não paramétrico requirePMCMRplus kwAllPairsDunnTesttempotratamentopadjustmethodbonferroni sem colocar padjustmethod vai ajustar pelo método de holm kwAllPairsDunnTesttempotratamento Profa Dra Vanderli Marino Melem ANOVA pg 27 2 Três estratos de origem vegetal foram introduzidos em cães por via oral com a finalidade de testar a diminuição na pressão arterial sistólica desses animais Os cães foram divididos em grupos de 5 animais recebendo cada grupo um tipo de estrato A B C via oral A tabela abaixo apresenta os resultados da pesquisa Tabela 13 Pressão arterial sistólica após a ingestão dos estratos vegetal A B C 94 105 136 83 112 157 86 105 127 86 145 126 93 116 102 a Verifique a eficiência dos 3 estratos de origem vegetal por meio da análise de variância com nível de significância de 5 b Os pressupostos de normalidade e homogeneidade do modelo foram atendidos c Aplicar o teste de comparações múltiplas Teste Tukey d Com esta análise poderíamos indicar o estrato vegetal mais eficaz Qual Ou quais Justifique sua resposta com uma conclusão prática e Apresente o coeficiente de variação Exercicio 2 Experimento Inteiramente Casualizado Três estratos de origem vegetal para baixar pressao arterial em cães por via oral rmlistls resp c9483868693 105112105145116 136157127126102 TratfactorrepcABCeach5 ANOVArespaovrespTrat summaryANOVAresp aparece o quadro de ANOVA Coefieciente de variação requireagricolae cvmodelANOVAresp ATENÇÃO este comando dic faz tudo direto requireExpDespt dicTratresp O teste de homogeneidade de Bartlett é sensível a falta de normalidade Como Shapiro deu pvalor 008816825 vamos fazer teste de homogeneidade de Levene requirecar Teste de Levene verifica se variâncias são homogêneas leveneTestrespTrat centermean Profa Dra Vanderli Marino Melem ANOVA pg 28 FAZENDO O TESTE DE LILLIEFOURS para normalidade librarynortest lillietestANOVArespres Teste de comparações múltiplas de SNK TESTE STUDENTNEWMANKEULS SNK requireagricolae testeSNKSNKtestANOVArespTrat testeSNK 3 adaptado de LARSON e FARBER 2010 pg 471 Suponha que um médico pesquisador deseja determinar se há diferença na média de tempo em que três tipos de analgésicos levam para aliviar a dor de cabeça Várias pessoas que sofrem de dor de cabeça são selecionadas aleatoriamente e tomam um dos três medicamentos Cada uma diz o tempo em minutos que o medicamento começou a fazer efeito Você pode concluir que as médias de tempo são diferentes Considere que cada população de tempo de alívio seja normalmente distribuída e as três com variâncias populacionais iguais Medicamento 1 Medicamento 2 Medicamento 3 12 16 14 15 14 17 17 21 20 12 15 15 16 19 18 As hipóteses ficam H0 3 2 1 H1 Existe pelo menos uma diferença entre duas médias 3 medicamentos para aliviar a dor resposta tempo em minutos rmlistls Resp c121517121616142115191417201518 tratfactorrepcMedicamento1Medicamento2Medicamento3each5 trat requireExpDespt dictratResp Profa Dra Vanderli Marino Melem ANOVA pg 29 4 Elaborado pelos alunos Jéssica e Antônio do projeto de Estatística na Psicologia maio 2017 Considerando as respostas para a avaliação da escala de autoestima de Rosemberg de 13 estudantes de 10 a 12 anos 15 estudantes de 13 a 15 anos 17 estudantes de 16 a 19 anos e 13 estudantes de 20 a 30 anos Verifique se existem diferenças significativas entre os grupos de idades GRUPOS DE IDADES 1012 anos 1315 anos 1619 anos 2030 anos NÍVEL DE AUTOESTIMA 19 20 16 10 20 21 18 11 21 22 20 13 24 24 21 15 25 25 22 16 26 26 23 17 27 27 24 18 29 29 25 21 30 30 27 22 31 31 28 23 32 32 29 25 33 33 30 28 34 35 33 33 36 34 37 35 36 37 ReferênciaExercício adaptado do artigo HUTZ Cláudio S ZANON Cristian Revisão da Adaptação validação e normatização da escala de autoestima de Rosenberg Avaliação Psicológica Porto alegre 2011 n 10 v 1 p 4149 4 grupos de idades resposta é índice de autoestima rmlistls nivelAutoestima c19202124252627293031323334202122242526272930 3132333536371618202122232425272829303334353637 10111315161718212223252833 Profa Dra Vanderli Marino Melem ANOVA pg 30 gruposIdadescrep10a12 anos13rep13a15 anos15rep16a19 anos17rep20a30 anos13 IdadeAutoestimadataframenivelAutoestimagruposIdades datframe junta os dois IdadeAutoestima mostra os dados para conferir resanova4aovnivelAutoestimagruposIdades dataIdadeAutoestima summaryresanova4 shapirotestresanova4res bartletttestnivelAutoestimagruposIdades boxplotnivelAutoestimagruposIdades ylabÍndice de Autoestima xlabGrupos de Idades las1 colLightYellow Coefieciente de variação requireagricolae cvmodelresanova4 TESTE DE COMPARÇÕES MÚLTIPLAS TUKEY anavatukey TukeyHSDresanova4 gruposIdades ordT anavatukey mediasIdades tapplynivelAutoestimagruposIdades mean mediasIdades requireExpDespt dicgruposIdadesnivelAutoestima Profa Dra Vanderli Marino Melem ANOVA pg 31 5 Apostila Prof Dr Silvano Cesar da Costa Foi realizado um estudo para comparar a concentração de cálcio em várias misturas denominadas M0M1M4 e D0 sendo que M0M1 e M4 têm composições similares de dextrose fosfato de sódio aminoácidos gluconato de cálcio e hidróxido de sódio com diferentes quantidades de água liposina e fosfolipídio 5 As amostras D0 não contêm aminoácidos e contêm mais água Seis amostras de M0M1M4 e D0 foram preparadas para o experimento e a concentração de cálcio em microgramas por mililitro de cada amostra foi determinada Os resultados para as misturas foram M0 4006 3872 3996 3978 3954 4014 M1 3907 4083 3961 3982 3936 3892 M4 4204 4028 4199 3948 4101 3947 D0 3485 3454 3678 3578 3570 3621 a Verifique se os pressupostos para a análise de variância são atendidos b Uma vez atendidos os pressupostos construa o quadro da análise de variância e interprete c O objetivo é comparar os tratamentos que possuem aminoácidos e os que não possuem aminoácidos 6 O objetivo do estudo foi investigar se o aumento de cálcio na dieta como um tratamento nãofarmacológico da pressão arterial elevada poderia influenciar beneficamente a função endotelial em mineralocorticoideNaCl Os pesquisadores dividiram os ratos machos WistarKyoto de sete semanas de idade em quatro grupos com igual pressão arterial sistólica média ratos não tratados a Normal WKY e dieta com alto teor de cálcio WKYCa ratos tratados com dieta de deoxicorticosterona NaCl a Normal DOC e dietas de alto teor de cálcio DOCCa Verificar se as dietas têm efeitos diferentes sobre os pesos medios g de ratos machos Tabela Pesos g de ratos submetidos à dietas de cálcio DOC WKY DOCCA WKYCA 336 328 304 342 346 315 292 284 269 343 299 334 346 368 293 348 323 353 277 315 309 374 303 313 322 356 303 301 316 339 320 354 300 343 324 346 309 343 340 319 276 334 299 289 306 333 279 322 310 313 305 308 302 333 290 325 269 372 300 321 311 343 312 322 Faça a análise de variância e verifique os pressupostos construa e interprete os gráficos aprendidos Se necessário faça os testes de comparações múltiplas adequados e os interprete Profa Dra Vanderli Marino Melem ANOVA pg 32 7 Com base nos dados apresentados na tabela abaixo verifique se existe diferença significativa entre os grupos No grupo operado foi feita a remoção das glândulas salivares maiores e no grupo pseudooperado foram executados todos os tempos cirúrgicos mas nenhuma glândula foi removida Os dados são de taxa de glicose em miligramas por 100ml de sangue em ratos Wistar machos de 60 dias São 24 ratos no total Grupo Operado PseudoOperado Normal 960 900 860 950 930 850 1000 890 1050 1080 880 1050 1200 870 900 1105 925 1000 970 875 950 925 850 950 EX7 variável é taxa de glicose fator é grupos com 3 níveis rmlistls apagar a memória listanova7c9690869593851008910510888105120879011092510097875 959258595 gruposfactorrepcOperadoPseudoOperadoNormal8 resanova7aovlistanova7grupos summaryresanova7 shapirotestresanova7res bartletttestlistanova7grupos requirecar leveneTestlistanova7grupos centermean plotlistanova7grupos xlabGrupos ylabTaxa de glicose miligramas100 ml sangue TESTE NÃOPARAMÉTRICO Teste de KruskalWallis kruskaltestlistanova7grupos Teste de Comparações Múltiplas NãoParamétrico requirePMCMRplus kwAllPairsDunnTestlistanova7grupospadjustmethodbonferroni Profa Dra Vanderli Marino Melem ANOVA pg 33 TABELA Studentizada q Tukey 5 a 2 2 3 4 5 6 7 8 9 10 11 1 1797 2698 3282 3708 4041 4312 4540 4736 4907 5059 2 609 833 980 1088 1174 1244 1303 1354 1399 1439 3 450 591 683 750 804 848 885 918 946 972 4 393 504 576 629 671 705 735 760 783 803 5 364 460 522 567 603 633 658 680 700 717 6 346 434 490 531 563 590 612 632 649 665 7 334 417 468 506 536 561 582 600 616 630 8 326 404 453 489 517 540 560 577 592 605 9 320 395 442 476 502 524 543 560 574 587 10 315 388 433 465 491 512 531 546 560 572 11 311 382 426 457 482 503 520 536 549 561 12 308 377 420 451 475 495 512 527 540 551 13 306 374 415 445 469 489 505 519 532 543 14 303 370 411 441 464 483 499 513 525 536 15 301 367 408 437 460 478 494 508 520 531 16 300 365 405 433 456 474 490 503 515 526 17 298 363 402 430 452 471 486 499 511 521 18 297 361 400 428 450 467 482 496 507 517 19 296 359 398 425 447 465 479 492 504 514 20 295 358 396 423 445 462 477 490 501 511 24 292 353 390 417 437 454 468 481 492 501 30 289 349 385 410 430 446 460 472 482 492 40 286 344 379 404 423 439 452 464 474 482 60 283 340 374 398 416 431 444 455 465 473 120 280 336 369 392 410 424 436 447 456 464 277 331 363 386 403 417 429 439 447 455 a 2 12 13 14 15 16 17 18 19 20 1 5196 5320 5433 5536 4632 5722 5804 5883 5956 2 1475 1508 1538 1505 1591 1614 1637 1657 1677 3 995 1015 1035 1053 1069 1084 1098 1111 1124 4 821 837 853 866 879 891 903 913 923 5 732 747 760 772 783 793 803 812 821 6 679 692 703 714 724 734 743 751 759 7 643 655 666 676 685 694 702 710 717 8 618 629 639 648 657 665 673 680 687 9 598 609 619 628 636 644 651 658 664 10 583 594 603 611 619 627 634 641 647 24 510 518 525 532 538 544 549 555 559 30 500 508 515 521 527 533 538 543 548 40 490 498 504 511 516 522 527 531 536 60 481 488 494 500 506 511 515 520 524 120 471 478 484 490 495 500 504 509 513 462 469 474 480 485 489 493 497 501 a É A QUANTIDADE DE TRATAMENTOS GRUPOS SENDO COMPARADOS 2 É O GRAU DE LIBERDADE DO DENOMINADOR GRAU DE LIBERDADE DO RESÍDUO Profa Dra Vanderli Marino Melem ANOVA pg 1
Send your question to AI and receive an answer instantly
Recommended for you
304
Dados Categóricos: Delineamentos Amostrais e Modelos
Bioestatística
UEL
4
Lista de Exercícios - Análise de Variância (ANOVA) e Teste de Tukey em Experimentos com Poedeiras e Ratos
Bioestatística
UEL
5
Análise Estatística - Ensaio Clínico Randomizado Duplo Cego - Eficácia de Antidepressivo Tricíclico vs Placebo
Bioestatística
UEL
5
Lista de Exercícios Simples
Bioestatística
UEL
1
Lista de Exercícios
Bioestatística
UEL
3
Lista de Exercícios - Estatística e Análise de Dados Categóricos
Bioestatística
UEL
Preview text
Profa Dra Vanderli Marino Melem ANOVA pg 1 FORMAS DE OBTENÇÃO DOS DADOS Introdução Mais importante que analisar os dados é o planejamento adequado da forma com que estes dados serão obtidos A essência de um bom planejamento consiste em projetar uma forma de coleta que seja capaz de fornecer exatamente o tipo de informação que procuramos Para isto é preciso saber exatamente o que se procura Existem na literatura os chamados ESTUDOS OBSERVACIONAIS e os ESTUDOS EXPERIMENTAIS ensaio clínico aleatório Arango 2012 os define Os estudos observacionais caracterizamse pela não intervenção do pesquisador no ambiente da pesquisa Neles as situações ocorrem normalmente e o pesquisador observa as características dos pesquisados e faz comparações e descrições Já os estudos experimentais o pesquisador produz uma situação artificial na qual ele aloca aleatoriamente os elementos pesquisados a grupos de modo a serem submetidos ou não a uma vacina um medicamento ou outro procedimento a fim de terem os efeitos avaliados em condições controladas de observação Nos estudos observacionais encontramos Arango 2012 RETROSPECTIVO OU DE CASOS E CONTROLES estes são iniciados após os indivíduos terem desenvolvido a condição patológica ou não investigada Esses estudos regridem no tempo para determinar as características que os indivíduos apresentavam antes do início da condição Os casos são os indivíduos que desenvolveram a condição e os controles os que não desenvolveram COORTE é um grupo de indivíduos que compartem uma experiência Exemplo pode ser indivíduos que apresentaram um episódio de hipertensão em um período determinado PREVALÊNCIA OU TRANSVERSAL este consiste em estudar determinada população ou uma amostra representativa dela em função de apresentar características que possibilitem a investigação exposiçãodoença Estas informações são medidas simultaneamente em um curto período de tempo O estudo transversal fornece um retrato de como as variáveis estavam relacionadas no momento da pesquisa Nos estudos experimentais devese planejar a coleta das informações e seguir algumas condições para que se defina previamente o tipo de análise estatística que será feita O Planejamento de Experimentos objetiva determinar com antecedência como será o experimento e como serão analisados os dados STORCK et al 2006 pg 91 Planejar o experimento é um método que visa auxiliar o pesquisador na execução de um projeto de pesquisa no qual se faz necessário a realização de experimentos O projeto de pesquisa é um documento composto geralmente de título autores introdução colocação de problema sua importância e objetivos da pesquisa revisão bibliográfica material e métodos contém todas as informações de como será a pesquisa para alcançar os objetivos propostos cronograma físico de atividades orçamento e bibliografia consultada STORCK et al 2006 pg 103 A parte de material e métodos e cronograma de atividades deve ser o mais detalhado possível Profa Dra Vanderli Marino Melem ANOVA pg 2 O plano experimental deve conter alguns itens como descreve Storck et al 2006 pgs 104 a 109 Alguns destes itens são utilizados nos estudos observacionais também a TÍTULO deve indicar com precisão a natureza do experimento ser claro e conciso facilitando a comunicação entre os pesquisadores técnicos e demais participantes Pode ser do tipo que reflete a natureza dos tratamentos b VINCULAÇÃO COM A PESQUISA relacionar o experimento ao nome do projeto de pesquisa a que está vinculado c OBJETIVOS DO EXPERIMENTO devem ser claros e estarem em ordem de prioridade Devem ser suficientemente completos para que a parir deles seja possível determinar adequadamente os tratamentos que deverão compor o experimento d RELAÇÃO DOS TRATAMENTOS é decorrente dos objetivos Devese evitar incluir tratamentos sem a devida justificativa Quando possível devemos incluir um tratamento testemunha ou padrão o qual deverá servir de referência para as conclusões No caso de tratamentos quantitativos devemos de preferência usar valores eqüidistantes cuja amplitude de variação reflita a realidade Os tratamentos podem ser decorrentes das alternativas de um fator ou da combinação entre os níveis de dois ou mais fatores no caso de experimentos fatoriais e CROQUI DO EXPERIMENTO é um desenho planta baixa do experimento identificando o local as dimensões as unidades experimentais UEs determinar o tamanho e a forma das UEs e verificar a homogeneidade entre elas e a ordem aleatória de aplicação dos tratamentos sobre as UEs obtidas por sorteio de acordo com o delineamento escolher o delineamento experimental mais adequado em função da homogeneidade entre as UEs e a natureza dos tratamentos Calcular o número de repetições necessárias para uma dada precisão f VARIÁVEIS A SEREM OBSERVADAS descrever as variáveis que serão analisadas assim como a época e o modo de realização da coleta de informações As variáveis devem refletir o efeito dos tratamentos que estão sendo comparados g MODELO DE CADERNO DE CAMPO é uma ficha elaborada com base no croqui do experimento cuja finalidade é anotar os dados sobre os efeitos dos tratamentos Os efeitos ou respostas dos tratamentos são avaliados por meio das variáveis medidas no experimento também chamadas de variáveis respostas que na análise estatística constituem as variáveis dependentes enquanto os tratamentos constituem as variáveis independentes h CRONOGRAMA DE ATIVIDADES devese fazer uma lista com as principais atividades etapas da execução do experimento com as respectivas datas i CONDIÇÕES GERAIS DO EXPERIMENTO descrever todas as particularidades não citadas nos itens anteriores de tal forma que seja possível uma repetição do experimento nas mesmas condições gerais Profa Dra Vanderli Marino Melem ANOVA pg 3 j ANÁLISE DOS RESULTADOS devese descrever o modelo matemático identificando os seus componentes e pressuposições com o respectivo esquema geral de análise quadro de análise de variância com causas de variação e graus de liberdade e a análise complementar contrastes ou comparações de médias análise de regressão e estimativas sempre de acordo com o delineamento experimental e os tipos de tratamentos Storck et al 2006 pg 109 salienta ainda que o planejamento do experimento sendo um dos componentes do projeto de pesquisa necessita de uma previsão de recursos financeiros materiais humanos e espaço físico Após a execução do experimento e da sua análise estatística devemos organizar um relatório ANÁLISE DE VARIÂNCIA ANOVA DE 1 FATOR 1 Introdução Que análise devemos utilizar para comparar em média mais de duas populações Por exemplo comparar a eficácia de 4 medicamentos Poderseia pensar em aplicar o teste t para amostras independentes e analisarmos todos os pares de médias Há 6 possíveis pares 4 combinados 2 a 2 e se a probabilidade de corretamente aceitar a hipótese nula para cada par testado é de 1 alpha 095 então a probabilidade de corretamente aceitar a hipótese nula para todos os 6 pares é 095607351 se os testes forem independentes Assim para não reduzir esta probabilidade devemos usar um método que compare todos os grupos medicamentos ao mesmo tempo em uma só análise O procedimento apropriado para testar a igualdade de várias médias é a análise de variância Fisher desenvolveu a técnica denominada análise de variância Analysis of variance ANOVA que consiste em decompor o número de graus de liberdade da variância total dos dados em partes atribuídas a causas conhecidas e independentes fatores controlados e a uma parte residual de origem desconhecida e de natureza aleatória fatores não controlados 2 Princípios Básicos da Experimentação Unidade Experimental ou Parcela Quando se realiza um experimento é preciso escolher uma unidade para o experimento onde será observada a resposta os dados que refletirão os efeitos dos tratamentos Ex um indivíduo um animal etc As unidades amostrais devem ser homogêneas ou seja semelhantes em suas características Repetição É necessário que haja repetição em cada amostra para que se possa detectar como a variável resposta varia dentro de cada amostra Isto tem a finalidade de proporcionar a obtenção de uma estimativa do erro experimental Casualização Este princípio tem a finalidade de proporcionar a todos os tratamentos a mesma probabilidade de serem designados a qualquer das unidades experimentais homogêneas Seu propósito é garantir que um tratamento não seja continuamente favorecido ou desfavorecido nas sucessivas repetições por alguma fonte de variação estranha Profa Dra Vanderli Marino Melem ANOVA pg 4 Ao fazer um experimento considerando apenas esses princípios temos o delineamento inteiramente casualizado DIC ou com um fator As parcelas unidades amostrais que receberão cada um dos tratamentos são determinadas de forma inteiramente casual sem qualquer restrição no critério de casualização Controle local Sua finalidade é dividir um ambiente heterogêneo em subambientes homogêneos e tornar o delineamento experimental mais eficiente 3 Delineamento Inteiramente Casualizado DIC com um único fator Estudaremos como a análise de variância poderá ser usada para comparar médias quando houver um único fator com mais de dois níveis Os níveis do fator são comumente chamados de tratamentos herança da área agronômica Feito o experimento e selecionado o modelo adequado no caso o inteiramente ao acaso a idéia é analisar a quantidade de variação devida aos efeitos dos tratamentos utilizados e a variação devida ao acaso resíduo Portanto a hipótese sendo testada na análise de variância é a de que não existe efeito dos tratamentos H0 0 τ τ τ a 2 1 H1 τi 0 para no mínimo um i Logo se a hipótese nula for verdadeira cada observação consistirá na média global μ mais um componente do erro aleatório ij ε Podemos dizer que a mudança nos níveis do fator tratamentos não tem efeito na resposta média Podemos escrever o modelo descrito como ij i ij ε μ y sendo i i τ μ μ a média do tratamento i Assim é comum escrever as hipóteses de forma equivalente H0 a 2 1 μ μ μ H1 i i μ μ para no mínimo um i existe diferença entre pelo menos duas médias Ou ainda podese escrever as HIPÓTESES DA ANOVA da forma H0 ou seja em média as a populações são iguais H1 Existe pelo menos uma diferença entre duas médias populacionais Algumas vantagens deste delineamento são a Pode ter número diferente de repetições por tratamento e qualquer número de tratamento no entanto é preferível o mesmo número de repetições por tratamento b O número de graus de liberdade do resíduo é o maior possível c Se ocorrer a perda de alguma parcela isto não acarretará dificuldade na análise Este delineamento será eficiente somente quando existir homogeneidade entre as unidades experimentais Por não utilizar o princípio do controle local todas as variações exceto as devidas aos efeitos dos tratamentos são consideradas como variações do acaso elevando a estimativa da variância residual Para o delineamento inteiramente ao acaso o modelo matemático é ij i ij ε τ μ y i 1 2 a j 1 2 n onde yij é o valor observado na parcela que recebeu o tratamento i na repetição j Profa Dra Vanderli Marino Melem ANOVA pg 5 iτ é um parâmetro associado ao tratamento i chamado efeito do tratamento i μ é um parâmetro comum a todos os tratamentos chamado média global ij ε é o componente do erro aleatório Tabela 1 Dados típicos para um experimento com um único fator Tratamento Observações Totais Médias 1 y11 y12 y1n y1 1 y 2 y21 y22 y2n y2 2 y a ya1 ya2 yan ya a y y y n 1 j ij i y y n y y i i i 1 2 a a 1 i n 1 j ij y y N y y sendo N an A análise de variância desenvolvida aqui é para o modelo com efeitos fixos neste caso os efeitos dos tratamentos iτ são geralmente definidos como desvios da média global μ de modo que a 1 i i 0 τ A análise de variância divide a variabilidade total dos dados da amostra em dois componentes Então o teste de hipóteses é baseado na comparação das duas estimativas independentes da variância da população a média quadrática do tratamento e a média quadrática do resíduo Verifique que ij y y ij y y iy iy iy y ij y iy agora some em todos os elementos e eleve ao quadrado para obter a identidade da soma quadrática A variabilidade total dos dados é dada por 2 a 1 i n 1 j ij y y SQTo 2 a 1 i i y y SQTr n 2 a 1 i n 1 j i ij y y SQR OBS Nesta análise de um fator Delineamento Inteiramente Casualizado o que chamamos de a i 1 2 a quantidade de tratamentos é a quantidade de níveis do fator As fórmulas de cálculo das somas quadráticas para análise de variância com tamanhos iguais de amostra em cada tratamento são a 1 i n 1 j 2 2 ij N y y SQTo a 1 i 2 2 i N y n y SQTr e SQR SQTo SQTr Profa Dra Vanderli Marino Melem ANOVA pg 6 Quando temos tamanhos diferentes ni com i 1 2 a de amostra em cada tratamento usamos as fórmulas a 1 i n 1 j 2 2 ij i N y y SQTo a 1 i 2 i 2 i N y n y SQTr e SQR SQTo SQTr Fontes de Variação Graus de Liberdade Soma Quadrática Média Quadrática Médios Fcal Ftab Tratamento Tr a 1 SQTr MQTr MQTrMQR 1 n 1 a a Resíduo R a n 1 SQR MQR Total To na 1 SQTo OBS Para número diferente de repetições por tratamentos o grau de liberdade do resíduo fica E o grau de liberdade total é ESTATÍSTICA DO TESTE Fcal A estatística do teste F de Snedecor é obtida no quadro de ANOVA pela divisão MQR MQTr 1 n a SQR 1 a SQTr Fcal que sob H0 tem distribuição F de Snedecor com a1 e an1 graus de liberdade Observe que os resíduos amostrais são dados por i ij y y onde iy é a média do iésimo tratamento A razão MQTrMQR que é a Estatística do teste no quadro de análise de variância é insensível a leves desvios da suposição de variâncias homogêneas para as a populações quando as amostras são de tamanhos iguais A MQR é um estimador não tendencioso de 2 σ independente da hipótese nula ser ou não verdadeira O erro aleatório ou erro experimental é a variação entre as unidades experimentais após subtrair os efeitos controlados no experimento efeitos dos tratamentos blocos etc Este erro não pode ser eliminado completamente mas sim reduzido e é representado no modelo matemático do delineamento experimental por ij ε e é responsável pela magnitude do MQR CRITÉRIO DE DECISÃO utilizando a tabela F de Snedecor AQUI A REGIÃO CRÍTICA É SEMPRE UNILATERAL SUPERIOR Portanto procure na tabela F de Snedecor o valor de Ftabelado correspondente ao nível de significância alfa desejado Para encontrar o valor de Ftabelado é preciso considerar a coluna correspondente ao grau de liberdade 1 a1 e a linha correspondente ao grau de liberdade 2 an1 Profa Dra Vanderli Marino Melem ANOVA pg 7 Se Fcal Ftabelado Aceitase a hipótese nula H0 e concluise que não podemos desconsiderar a igualdade das médias populacionais Ou seja pvalor alfa Se Fcal Ftabelado Rejeitase a hipótese nula H0 logo existe pelo menos uma diferença entre as médias populacionais Ou seja pvalor alfa Exemplo tendo 4 tratamentos com 6 repetições cada ou seja 3 graus de liberdade para tratamentos e 20 graus de liberdade para o resíduo e nível de significância de 5 no R obtemos o quantil crítico com qf1alfadf1a1df2an1 qf095 320 faça no R e veja o resultado e compare com o resultado da tabela F TABELA 2 Distribuição F de Snedecor 5 1 2 1 2 3 4 5 6 7 8 9 10 20 30 120 1 1614 1995 2157 2246 2302 2340 2368 2389 2405 2419 2480 2501 2533 2543 2 1851 1900 1916 1925 1930 1933 1935 1937 1938 1940 1945 1946 1949 1950 3 1013 955 928 912 901 894 889 885 881 879 866 862 855 853 4 771 694 659 639 626 616 609 604 600 596 580 575 566 563 5 661 579 541 519 505 495 488 482 477 474 456 450 440 436 6 599 514 476 453 439 428 421 415 410 406 387 381 370 367 7 559 474 435 412 397 387 379 373 368 364 344 338 327 223 8 532 446 407 384 369 358 350 344 339 335 315 308 297 292 9 512 426 386 363 348 337 329 323 318 314 294 286 275 271 10 496 410 371 348 333 322 314 407 302 298 277 270 258 254 11 484 398 359 336 320 309 301 295 290 285 265 257 245 240 12 475 389 349 326 311 300 290 285 280 275 254 247 234 230 13 467 381 341 318 303 292 283 277 271 267 246 238 225 221 14 460 374 334 311 296 285 276 270 265 260 239 331 218 213 15 454 368 329 306 290 279 271 264 259 254 233 225 211 207 16 449 363 324 301 285 274 266 259 254 249 228 219 206 201 17 445 359 320 296 281 270 261 255 249 245 223 215 201 196 18 441 355 316 293 277 266 258 251 246 241 219 211 197 192 19 438 352 313 290 274 263 254 248 242 238 216 207 193 188 20 435 349 310 287 271 260 251 245 239 235 212 204 190 184 21 432 347 307 284 268 257 249 242 237 232 210 201 187 181 22 430 344 405 282 266 255 246 240 234 230 207 198 184 178 23 428 342 303 280 264 253 244 237 232 227 205 196 181 176 24 426 340 301 278 262 251 242 236 230 225 203 194 179 173 30 417 332 292 269 253 242 233 227 221 216 193 184 168 162 40 408 323 284 261 245 234 221 218 212 208 184 174 158 151 60 400 315 276 253 237 225 217 210 204 199 175 165 147 139 120 392 307 268 245 229 217 209 202 196 191 166 155 135 125 384 300 260 237 221 210 201 194 188 183 157 146 122 100 1 É O GRAU DE LIBERDADE DO NUMERADOR GRAU DE LIBERDADE DO TRATAMENTO 2 É O GRAU DE LIBERDADE DO DENOMINADOR GRAU DE LIBERDADE DO RESÍDUO Profa Dra Vanderli Marino Melem ANOVA pg 8 CRITÉRIO DE DECISÃO pelo pvalor O pvalor é a área acima da ESTATÍSTICA DO TESTE Fcal na distribuição F de Snedecor Desta forma rejeite a hipótese nula quando pvalor for menor que o nível de significância desejado CONCLUSÃO A conclusão do teste é a interpretação da decisão tomada na etapa anterior O que significa para o pesquisador não poder rejeitar H0 ou poder rejeitar H0 No caso de rejeição de H0 a análise de variância está indicando que existe pelo menos uma diferença significativa entre as médias das populações de onde foram retiradas as amostras Onde estão estas diferenças significativas Isto só poderá ser respondido após fazer um teste de comparações múltiplas Em geral estes testes comparam as médias populacionais duas a duas e assim verificamos onde estão as diferenças significativas Temse muitos testes de comparações múltiplas Teste Tukey usado quando temos níveis qualitativos dos tratamentos Teste de Dunnett usado para comparar cada tratamento com o controle Teste de StudentNewmanKeuls SNK e outros SUPOSIÇÕES devem ser verificadas PARA A VALIDADE DA ANÁLISE DE VARIÂNCIA SNEDECOR e COCHRAN 1972 ADITIVIDADE a aditividade dos efeitos dos fatores que ocorrem no modelo isto é existe uma soma de efeitos e esses efeitos são independentes Verificado pelo teste de Aditividade de Tukey Steel e Torrie 1960 INDEPENDÊNCIA independência dos erros desvios até certo ponto garantida pelo princípio da casualização NORMALIDADE eij N0 2 σ consequentemente cada tratamento pode ser pensado como uma população normal de média iμ e variância 2 σ A normalidade dos erros pode ser verificada por um teste de normalidade como o de Lilliefors ou ainda o de Shapiro Wilk Ou ainda graficamente com o uso dos gráficos de probabilidade normal HOMOCEDASTICIA homogeneidade de variâncias que pode ser verificada por meio dos testes Fmáx ou teste de Hartley ou da razão máxima Isto é cada Yij com i 1 2 a normalmente distribuído com EYij i e VYij 2 Os desvios padrão da amostra s para os a tratamentos geralmente serão diferentes mesmo quando os desvios populacionais correspondentes forem idênticos Uma regra prática simples é que se o maior s não for maior do que duas vezes o menor é razoável supor 2 iguais ou seja variâncias populacionais iguais DEVORE 2006 pg360 Em Walpole et al 2006 pg330 encontramos dois testes que verificam a homogeneidade de variâncias Teste de Bartlett e Teste de Cochran O de Bartlett é sensível à falta de normalidade uma outra opção é usar o teste de Levene que usa os resíduos i ij y y e faz uma nova análise de variância sendo esta não significante as variâncias podem ser consideradas homogêneas Profa Dra Vanderli Marino Melem ANOVA pg 9 Se a suposição de normalidade ou a de homogeneidade de variâncias forem consideradas implausíveis devese empregar um método de análise diferente do usual teste F por exemplo um teste não paramétrico ou buscar uma transformação dos dados de forma que as suposições para o teste F sejam satisfeitas o uso da transformação BoxCox é uma alternativa para encontrar a melhor transformação possível O Coeficiente de Variação CV A magnitude do erro experimental pode ser avaliada pelo coeficiente de variação dado por 100 y MQR CV a média geral do experimento é N y y Storck et al 2006 pg93 acentua que o CV somente deve ser usado para comparar a precisão de experimentos semelhantes inclusive quanto ao nível tecnológico mesmas variáveis tratamentos delineamento número de repetições procedimentos etc O CV dá então uma estimativa da variação total do experimento ou seja descreve pontualmente a variabilidade relativa dos dados Sendo que quanto maior o CV menor é a precisão do experimento e menor é a qualidade do experimento Para orientação siga o proposto por Gomes 1990 Valor do CV Classificação Precisão 10 Baixos Alta 10 a 20 Médios Média 20 a 30 Altos Baixa 30 Muito Altos Muito Baixa No R o pacote agicolae calcula o coeficiente de variação com o comando cvmodel Exemplo 1 Suponha que para testar as 4 drogas para a redução de colesterol 20 indivíduos foram aleatoriamente selecionados para participar do experimento Qual a droga que cada indivíduo deverá tomar De que forma essa atribuição deve ser feita Considere os 20 indivíduos e as 4 drogas que serão comparadas A B C e D Para se definir o tipo de droga que será dado a cada indivíduo realizase um sorteio enumerando cada um dos 20 indivíduos parcelas que participarão do estudo 1 a 20 e em seguida colocamse as drogas tratamentos em uma sequência como a dada a seguirA1 A2 A3 A4 A5 B1 B2 B3 B4 B5 C1 C2 C3 C4 C5 D1 D2 D3 D4 D5 A partir daí utilizando uma tabela de números aleatórios fazse a alocação do tipo de droga a cada indivíduo Suponha a seguinte sequência de números aleatórios 12 6 16 15 10 14 1 20 8 13 18 2 4 9 17 19 3 5 11 7 que está associado com a sequência das drogas A1 A2 A3 A4 A5 B1 B2 B3 B4 B5 C1 C2 C3 C4 C5 D1 D2 D3 D4 D5 Esta sequência de números aleatórios pode ser obtida no R Vejamos Para obter a sequência de números aleatórios e alocálas a cada tratamento usando o R bastam os seguintes comandos Droga factorrepLETTERS14 each5 Individuo sample120 dataframeDroga Individuo Profa Dra Vanderli Marino Melem ANOVA pg 10 Droga factorrepLETTERS14 each5 Individuo sample120 dataframeDroga Individuo Droga Individuo 1 A 12 2 A 6 3 A 16 4 A 15 5 A 10 6 B 14 7 B 1 8 B 20 9 B 8 10 B 13 11 C 18 12 C 2 13 C 4 14 C 9 15 C 17 16 D 19 17 D 3 18 D 5 19 D 11 20 D 7 Assim terseia a seguinte configuração do experimento indivíduo droga reduções de colesterol mgdL 1 B2 101 2 C2 712 3 D2 98 4 C3 922 5 D3 871 6 A2 487 7 D5 899 8 B4 841 9 C4 1067 10 A5 895 11 D4 904 12 A1 438 13 B5 675 14 B1 937 15 A4 842 16 A3 722 17 C5 689 18 C1 917 19 D1 805 20 B3 494 Profa Dra Vanderli Marino Melem ANOVA pg 11 Seja yij o valor da redução do colesterol do jésimo indivíduo que recebeu a iésima droga tratamento Dados os valores das reduções de colesterol mgdL Ao nível de 5 de significância concluir a respeito das drogas quanto à redução do colesterol Drogas A B C D 438 937 917 805 487 101 712 98 722 494 922 871 842 841 1067 904 895 675 689 899 Totais 3384 3957 4307 4459 Médias 6768 7914 8614 8918 Para obter os resultados da análise de variância utilizando o R e considerando as hipóteses H0 D C B A H1 i i μ μ para no mínimo um i existe diferença entre pelo menos duas médias fazemos Script ANOVA no R dadosc438937917805 48710171298 722494922871 8428411067904 895675689899 drogasfactorrepcABCD5 resultadoaovdadosdrogas summaryresultado aparece o quadro de ANOVA boxplotdadosdrogas xlabDrogas ylabReduções de colesterol mgdL namescABCD parmfrowc22 divide a janela gráfica plotresultado faz gráficos para a análise de resíduo dadosc438937917805 48710171298 722494922871 8428411067904 895675689899 drogasfactorrepcABCD5 resultadoaovdadosdrogas summaryresultado aparece o quadro de ANOVA Df Sum Sq Mean Sq F value PrF drogas 3 1367 4556 1583 0233 Residuals 16 4605 2878 boxplotdadosdrogas xlabDrogas ylabReduções de colesterol mgdL namescABCD parmfrowc22 divide a janela gráfica plotresultado faz gráficos para a análise de resíduo Profa Dra Vanderli Marino Melem ANOVA pg 12 A B C D 5 6 7 8 9 10 Drogas Reduções de colesterol mgdL 70 75 80 85 90 3 1 0 1 2 Fitted values Residuals Residuals vs Fitted 10 1 6 2 1 0 1 2 2 1 0 1 Theoretical Quantiles Standardized residuals Normal QQ 10 1 6 70 75 80 85 90 00 04 08 12 Fitted values Standardized residuals ScaleLocation 10 1 6 2 1 0 1 Factor Level Combinations Standardized residuals tr 1 tr 2 tr 3 tr 4 drogas Constant Leverage Residuals vs Factor Levels 10 1 6 Profa Dra Vanderli Marino Melem ANOVA pg 13 O diagrama de caixas ou boxplot é uma representação gráfica para os conceitos de separatrizes Tratase de um retângulo que representa o desvio interquartílico Esse retângulo representa portanto a faixa dos 50 dos valores mais típicos da distribuição O retângulo é dividido no valor correspondente a mediana assim ele indica o quartil inferior a mediana e o quartil superior Entre os quartis e os extremos são traçadas linhas Caso existam valores discrepantes a linha é traçada até o último valor não discrepante e os valores discrepantes são indicados por pontos OUTRA OPÇÃO PARA LEITURA DOS DADOS e ANOVA 1 FATOR Digitando todos de cada tratamento por vez rmlistls para apagar memória anterior dadosc4384877228428959371014948416759177129221067689 80598871904899 drogasfactorrepcABCDeach5 Compare que na folha anterior foi digitado um de cada tratamento por vez desta forma drogasfactorrepcABCD5 resultadoaovdadosdrogas summaryresultado plotdadosdrogas xlabDrogas ylabRedução de Colesterol em mgdL namescABCD parmfrowc22 divide a janela gráfica plotresultado faz gráficos para a análise de resíduo TESTANDO A SUPOSIÇÃO DE NORMALIDADE H0 Os erros têm distribuição normal H1 Os erros não têm distribuição normal shapirotestresultadores shapirotestresultadores ShapiroWilk normality test data resultadores W 095304 pvalue 04156 TESTANDO A SUPOSIÇÃO DE HOMOCEDASTICIDADE H0 As variâncias são homogêneas H1 As variâncias não são homogêneas bartletttestdadosdrogas bartletttestdadosdrogas Bartlett test of homogeneity of variances data dados by drogas Bartletts Ksquared 47347 df 3 pvalue 01923 Profa Dra Vanderli Marino Melem ANOVA pg 14 OBS Estudos indicam que o teste de Bartlett é muito sensível à falta de normalidade e não deve ser aplicado quando houver dúvida sobre a suposição de normalidade Neste caso devese utilizar o teste de Levene Para aplicar o teste de Levene usando o R é preciso instalar o pacote car carregálo e executálo TESTE DE LEVENE para homogeneidade de variâncias requirecar ou usa librarycar Teste de Levene verifica se variâncias são homogêneas leveneTestdadosdrogas centermean librarycar leveneTestdadosdrogas centermean Levenes Test for Homogeneity of Variance center mean Df F value PrF group 3 33205 004662 16 Signif codes 0 0001 001 005 01 1 Neste exemplo das drogas a análise de variância forneceu um pvalor de 0233 Portanto não se pode dizer que o efeito médio das drogas não sejam iguais Nos casos em que a análise de variância for significativa ou seja poder se rejeitar a hipótese nula concluise que existe pelo menos uma diferença significativa entre as médias populacionais Para saber entre quais médias estão estas diferenças significativas é necessário se fazer outros testes chamados testes de comparações múltiplas Profa Dra Vanderli Marino Melem ANOVA pg 15 COMPARAÇÕES ENTRE MÉDIAS DOS VÁRIOS TRATAMENTOS Resende Fonseca e Silva e Azevedo 2014 citam alguns testes de comparações múltiplas e destacam que estes testes foram derivados na suposição de tratamentos de efeitos fixos e portanto não se justifica a sua aplicação quando os efeitos de tratamentos são considerados aleatórios Os testes t ou LSD de Fisher ou forma F protegida de Fisher quando aplicado somente se o teste F é significativo Tukey ou HSD Duncan Scheffé Dunnett adequado especificamente para comparação das médias dos tratamentos com as médias das testemunhas NewmanKeuls ou StudentNewmanKeulsSNK Bonferroni ou LSDB ScottKnott Citado por Resende Fonseca e Silva e Azevedo 2014 pg 106 uma avaliação via simulação de vários testes quanto às taxas de erro tipo I e poder foi realizada por Perecin e Barbosa 1988 e revelou os seguintes resultados Os testes t e Duncan não apresentam taxas favoráveis de erro tipo I ou seja não conservam adequadamente os níveis nominais de significância O teste Tukey possui um poder muito reduzido especialmente quando há grande número de tratamentos O teste t bayesiano concilia de certa forma as características de alto poder e baixas taxas de erro tipo I entretanto as taxas de erro tipo I não podem ser previstas com exatidão e dependem do número de tratamentos e de suas magnitudes requerendo portanto aplicação cuidadosa O teste de NewmanKeuls possui poder muito superior e taxas de erro tipo I similares ao teste de Tukey De acordo com Conagin et al estes testes são aplicados no caso de tratamentos qualitativos e são realizados considerando Contrastes ortogonais teste t teste F e teste de Scheffé Médias duas a duas teste de Tukey teste de Duncan teste de Bonferroni e teste de NewmanKeuls teste de ScottKnott Comparação entre o controle e as demais médias teste de Dunnett Já para os casos de tratamentos quantitativos devese aplicar a análise de regressão TESTE DE TUKEY O teste de Tukey baseado na amplitude total estudentizada studentized range pode ser utilizado para comparar todo e qualquer contraste entre duas médias de tratamentos O teste é exato e muito simples quando se tem o mesmo número de repetições em todos os tratamentos Profa Dra Vanderli Marino Melem ANOVA pg 16 Consiste em comparar as médias duas a duas por meio da sua diferença em valor absoluto com a diferença mínima significativa d m s que é dada por yˆ Vˆ 2 1 Δ q onde q amplitude total estudentizada obtida em tabelas ao nível de 5 e 1 ver tabela pg final deste material considerandose número de tratamentos e graus de liberdade do resíduo ou seja o valor da tabela q com a an1 Por exemplo y y yˆ 2 1 então Vˆ y Vˆ y y Vˆ y yˆ Vˆ 2 1 2 1 pois os tratamentos são independentes Como 2 2 2 1 2 1 n s Vˆ y e n s Vˆ y pois admitese que os tratamentos tenham variâncias iguais então n n n se n 1 n s 1 yˆ Vˆ 2 1 2 1 2 n 2s yˆ Vˆ 2 logo n s q n 2 2s 1 q Δ 2 2 mas s2MQResíduo n MQR Δ q para tratamentos com o mesmo número de repetições MQR n 1 n 2 1 1 q Δ 2 1 para tratamentos com número diferentes de repetições Obtidas todas as diferenças entre médias duas a duas as que forem superiores ou iguais a Δ serão consideradas significativas Procedimento para aplicação do teste de TUKEY Dispor as médias em ordem crescente de valores isto é i i y y para todo i i Montar o quadro de diferenças entre todas as médias duas a duas Sendo a 2 1 y y y diferenças 1 y 2 y 3 y y a 1 a y 1 y X 1 2 y y 1 3 y y 1 a 1 y y 1 a y y 2 y X X 2 3 y y 2 a 1 y y 2 a y y 3 y X X X 3 a 1 y y 3 a y y y a 1 X X X X X a 1 a y y Comparar todas as diferenças encontradas no quadro acima com a diferença mínima significativa DMS de TUKEY maior valor aceitável para que duas médias sejam consideradas iguais Nos exemplos veremos como fazer o teste Tukey no R Profa Dra Vanderli Marino Melem ANOVA pg 17 TESTE DE STUDENTNEWMANKEULS SNK O teste de SNK é derivado do teste de Tukey sendo menos conservador ou seja encontra mais diferenças O teste Tukey controla o erro para todas as comparações já o SNK controla apenas para as comparações em consideração Dispor as médias em ordem crescente de valores isto é i i y y para todo i i O teste baseiase na quantidade n MQR SNK qi para tratamentos com o mesmo número de repetições 2 1 i SNK n 1 n 1 2 MQR q para tratamentos com número diferentes de repetições Onde qi é obtido da tabela Tukey ver pg final deste material para um nível alpha de significância correspondente a i distâncias entre as médias comparadas e graus de liberdade do resíduo Obtidas todas as diferenças entre médias duas a duas as que forem superiores ou iguais a SNK serão consideradas significativas Nos exemplos veremos como fazer o teste SNK no R TESTE DUNNETT Esse teste é quando as únicas comparações que interessam ao experimentador são aquelas entre um determinado tratamento padrão testemunha ou controle e cada um dos demais I tratamentos Inicialmente calcular as estimativas de cada contraste dada por ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ 2 2 1 1 Padrão ou Testemunha m m m Y m m Y m m Y P P I I P P Calcular o valor do teste d dado por onde td é o obtido na tabela de Dunnett 5 e 1 ver pg final deste material em função do número de graus de liberdade de tratamentos e do número de graus de liberdade do resíduo Comparar cada estimativa de contraste em valor absoluto com o valor d Se o módulo de Yˆ d Rejeitase Ho isto é a média da testemunha e a média do tratamento com ela comparado difere significativamente ao nível de significância α Se o módulo de Yˆ dNão rejeita Ho isto é a média da testemunha e a média do tratamento com ela comparado não difere significativamente ao nível de significância α Nos exemplos veremos como fazer o teste Dunnett no R Profa Dra Vanderli Marino Melem ANOVA pg 18 Exemplo 2 Um experimento foi conduzido no delineamento inteiramente casualizado com cinco repetições para avaliar o efeito de cinco medicamentos na diminuição da pressão arterial de animais experimentais Para isso o pesquisador escolheu ao acaso 30 animais do mesmo tipo e dividiu ao acaso em seis grupos sendo que em cada grupo os animais receberam o mesmo medicamento Exceto pelos medicamentos identificados por A B C D E e T todos os animais tiveram o mesmo cuidado e mesma alimentação sendo criados na mesma área experimental Após o período de avaliação os animais sorteados na área experimental bem como os tratamentos e os valores da pressão arterial foram A 21 B 8 B 10 D 29 C 11 C 10 A 23 E 12 A 26 T 2 E 13 T 4 D 25 E 15 D 31 C 14 A 21 B 6 C 14 B 10 T 0 D 33 C 12 A 22 E 11 D 30 E 15 T 2 T 1 B 9 Fazer a análise de variância completa e aplicar os testes de comparações múltiplas adequados e interpretar os resultados obtidos Organizando os dados T A B C D E 0 21 8 10 30 13 4 23 10 14 33 15 2 21 6 12 25 12 1 26 10 14 29 15 2 22 9 11 31 11 Os tratamentos estão na ordem T A B C D E Dadosc021810301342310143315221612251212610142915222911 3111 pressãofactorrepc1TABCDE5 Foi colocado 1T acima para ser considerado T como primeiro tratamento no Dunnett resultaovDadospressão summaryresult aparece o quadro de ANOVA plotDadospressão xlabMedicamentos ylabDiminuição da pressão arterial parmfrowc22 divide a janela gráfica plotresult faz gráficos para a análise de resíduo Os tratamentos estão na ordem T A B C D E Dadosc021810301342310143315221612251212610142915222911 3111 pressãofactorrepc1TABCDE5 resultaovDadospressão summaryresult aparece o quadro de ANOVA Df Sum Sq MeanSq F value PrF pressão 5 2483 4965 1216 309e16 Residuals 24 98 41 Signif codes 0 0001 001 005 01 1 plotDadospressãoxlabMedicamentosylabDiminuição da pressão arterial Profa Dra Vanderli Marino Melem ANOVA pg 19 parmfrowc22 divide a janela gráfica plotresult faz gráficos para a análise de resíduo 1T A B C D E 0 5 10 15 20 25 30 Medicamentos Diminuição da pressão arterial 5 10 15 20 25 30 4 2 0 2 4 Fitted values Residuals Residuals vs Fitted 16 19 10 2 1 0 1 2 2 1 0 1 2 Theoretical Quantiles Standardized residuals Normal QQ 16 19 10 5 10 15 20 25 30 00 05 10 15 Fitted values Standardized residuals ScaleLocation 16 19 10 3 2 1 0 1 2 Factor Level Combinations Standardized residuals tr 1 tr 3 tr 5 pressão Constant Leverage Residuals vs Factor Levels 16 19 10 Profa Dra Vanderli Marino Melem ANOVA pg 20 TESTANDO A SUPOSIÇÃO DE NORMALIDADE H0 Os erros têm distribuição normal H1 Os erros não têm distribuição normal shapirotestresultres shapirotestresultres ShapiroWilk normality test data resultres W 097704 pvalue 07426 TESTANDO A SUPOSIÇÃO DE HOMOCEDASTICIDADE H0 As variâncias são homogêneas H1 As variâncias não são homogêneas bartletttestDadospressão bartletttestDadospressão Bartlett test of homogeneity of variances data Dados by pressão Bartletts Ksquared 24197 df 5 pvalue 07885 Nos resultados da ANOVA no final da página 18 o pvalor é de 309e16 verificase que o pvalor é bem pequeno indicando que existem diferenças significativas Assim faremos os testes de comparações múltiplas para conhecer as diferenças existentes Como temos a testemunha aqui devemos fazer o teste de Dunnett este compara todos com a testemunha A testemunha deve ser o primeiro tratamento para que o programa a identifique TESTE DE DUNNETT requiremultcomp Teste de Dunnett compara os grupos com a testemunha contraglhtresult linfct mcppressão Dunnet summarycontra confintcontra level095 requiremultcomp Teste de Dunnett compara os grupos com a testemunha contraglhtresult linfct mcppressão Dunnet summarycontra Simultaneous Tests for General Linear Hypotheses Multiple Comparisons of Means Dunnett Contrasts Profa Dra Vanderli Marino Melem ANOVA pg 21 Fit aovformula dados pressão Linear Hypotheses Estimate Std Error t value Prt tr 2 tr 1 0 20800 1278 16275 1e04 tr 3 tr 1 0 6800 1278 5321 1e04 tr 4 tr 1 0 10400 1278 8138 1e04 tr 5 tr 1 0 27800 1278 21752 1e04 tr 6 tr 1 0 11400 1278 8920 1e04 Signif codes 0 0001 001 005 01 1 Adjusted p values reported singlestep method confintcontra level095 Simultaneous Confidence Intervals Multiple Comparisons of Means Dunnett Contrasts Fit aovformula dados pressão Quantile 26936 95 familywise confidence level Linear Hypotheses Estimate lwr upr tr 2 tr 1 0 208000 173575 242425 tr 3 tr 1 0 68000 33575 102425 tr 4 tr 1 0 104000 69575 138425 tr 5 tr 1 0 278000 243575 312425 tr 6 tr 1 0 114000 79575 148425 TESTE STUDENTNEWMANKEULS SNK requireagricolae testeSNKSNKtestresultpressão testeSNK TESTE STUDENTNEWMANKEULS SNK requireagricolae Loading required package agricolae testeSNKSNKtestresultpressão testeSNK statistics Mean CV MSerror 1466667 1377768 4083333 parameters Df ntr alpha test namet 24 6 005 SNK pressão SNK Table CriticalRange Profa Dra Vanderli Marino Melem ANOVA pg 22 2 2918793 2637702 3 3531697 3191581 4 3901262 3525555 5 4166314 3765082 6 4372651 3951548 means dados std r Min Max 1T 18 1483240 5 0 4 A 226 2073644 5 21 26 B 86 1673320 5 6 10 C 122 1788854 5 10 14 D 296 2966479 5 25 33 E 132 1788854 5 11 15 comparison NULL groups trt means M 1 D 296 a 2 A 226 b 3 E 132 c 4 C 122 c 5 B 86 d 6 1T 18 e Profa Dra Vanderli Marino Melem ANOVA pg 23 Exemplo 3 Um estudo avaliou o efeito terapêutico de três métodos de administração Grupo I II e III de uma droga flebotrópica O efeito desejado é a diminuição de edema do membro inferior Os dados experimentais de avaliação têm como variável resposta a diminuição da circunferência do tornozelo do membro mais afetado O esquema terapêutico selecionado será o que apresentar a maior diminuição da circunferência do tornozelo Adote o nível de significância de 5 GI 2 comprimidos de placebo pela manhã e dois comprimidos de Toflex 500 mg à noite GII 2 comprimidos de Toflex 500mg pela manhã e um comprimido de placebo à noite GIII 1 comprimidos de Toflex 500mg pela manhã e dois comprimidos de placebo à noite Tabela 11 Diminuição da circunferência do tornozelo cm após 60 dias de tratamento Tratamentos Repetições GI GII GIII 1 72 78 63 2 93 82 60 3 87 71 53 4 89 86 51 5 76 87 62 6 72 82 52 7 88 71 72 8 80 78 68 Soma 657 635 481 Média 821 794 601 a Realize uma análise exploratória dos dados b Verifique se há diferença significativa entre os resultados obtidos na forma em que foi administrado ao paciente ANOVA c Os pressupostos do modelo foram violados Gerar anova no R para verificar os pressupostos d Caso identifique diferença entre os tratamentos aplique o teste Tukey e Com esta análise poderíamos indicar um tratamento mais eficaz Qual Ou quais Justifique sua resposta Discuta qual melhor conduta medicamentosa f Apresente o coeficiente de variação do experimento e classifiqueo EXEMPLO variável resposta diminuição da circunferência do tornozelo em cm rmlistls para apagar memória anterior Os tratamentos estão na ordem GI GII GIII circunf c7293878976728880 7882718687827178 6360535162527268 metodofactorrepcGIGIIGIIIeach8 metodo Obtendo as medidas descritivas Titapplycircunf metodo sumTi Totais dos tratamentos Medias tapplycircunf metodo mean Medias Médias dos tratamentos Variancias tapplycircunf metodo var Variancias Variâncias dos tratamentos Gsumcircunf G Soma total dos dados ANOVAcircunfaovcircunfmetodo summaryANOVAcircunf aparece o quadro de ANOVA Profa Dra Vanderli Marino Melem ANOVA pg 24 requireagricolae cvmodelANOVAcircunf BOX PLOT mediat tapplycircunf metodo mean mediat parmaic1122 boxplotcircunf metodo ylabDiminuição da circunferencia do tornozelo xlabMétodos de administração da droga las1 colLightYellowmainFigura 1 Box Plot Tornozelo pointsmediat pch col2 cex15 TESTANDO A SUPOSIÇÃO DE NORMALIDADE shapirotestANOVAcircunfres TESTANDO A SUPOSIÇÃO DE HOMOCEDASTICIDADE bartletttestcircunfmetodo TESTE TUKEY anavatukey TukeyHSDANOVAcircunf metodo ordT anavatukey Para visualização rápida das diferenças no gráfico plotanavatukey las1 colblue TESTE STUDENTNEWMANKEULS SNK requireagricolae testeSNKSNKtestANOVAcircunfmetodo testeSNK ATENÇÃO PACOTE COMPLETO requireExpDespt dicmetodo circunf Escreva aqui as conclusões baseandose nos resultados do exemplo 3 Profa Dra Vanderli Marino Melem ANOVA pg 25 EXERCÍCIOS 1 Num estudo conduzido e publicado pela Universidade Estadual da Virginia pesquisadores observaram a imobilização por drogas em elefantes selvagem e testaram o tempo que os animais demoram em serem anestesiados usando quatro drogas diferentes em cinco animais por tratamento repetições num Experimento Inteiramente Casualizado A variável resposta observada foi o tempo minutos de demora para anestesia realizar o efeito desejado Tratamento A100 miligramas de cloreto de succinilcolina Tratamento B 50 miligramas de cloreto de succinilcolina Tratamento C 25 miligramas de cloreto de succinilcolina Tratamento D 10 miligramas de cloreto de succinilcolina Tabela 12 Tempo que os animais demoram a serem anestesiados a Verifique ao nível de 5 de significância se há diferença no tempo médio devido às drogas b Os pressupostos do modelo foram atendidos c Aplique o teste de Tukey para detectar qual medicamento anestesia mais rápido d Discuta os resultados e apresente a conclusão prática e Apresente o coeficiente de variação Ex1 variável resposta tempo que os animais demoram a serem anestesiados rmlistls para apagar memória anterior tempo c161514315146 1571481391515 151481511213 1821611617218 tratamentofactorrepcTATBTCTDeach5 tratamento ANOVAtempoaovtempotratamento summaryANOVAtempo aparece o quadro de ANOVA Coefieciente de variação requireagricolae cvmodelANOVAtempo BOX PLOT mediatrat tapplytempotratamento mean mediatrat parmaic1122 boxplottempotratamento ylabTempo para serem anestesiados xlabMétodos de administração da droga las1 colLightYellow pointsmediatrat pch col2 cex15 TA TB TC TD 160 157 150 182 150 148 148 161 143 139 151 160 150 150 120 172 146 150 130 180 Profa Dra Vanderli Marino Melem ANOVA pg 26 TESTANDO A SUPOSIÇÃO DE NORMALIDADE shapirotestANOVAtempores TESTANDO A SUPOSIÇÕES DE HOMOCEDASTICIDADE bartletttesttempotratamento O teste de homogeneidade de Bartlett é sensível a falta de normalidade Como Shapiro deu pvalor 01048 vamos fazer Levene requirecar Teste de Levene verifica se variâncias são homogêneas leveneTesttempotratamento centermean TESTE TUKEY anavatukey TukeyHSDANOVAtempo tratamento ordT anavatukey Para visualização rápida das diferenças no gráfico plotanavatukey las1 colblue TESTE STUDENTNEWMANKEULS SNK requireagricolae testeSNKSNKtestANOVAtempotratamento testeSNK Devido ao teste de homogeneidade de Levene ser significativo e o Box Plot mostrar outliers vamos fazer a ANOVA não paramétrica de KruskalWallis neste exercício tempo c161514315146 1571481391515 151481511213 1821611617218 tratamentofactorrepcTATBTCTDeach5 kruskaltesttempotratamento Onde tempo é numérico e tratamento um fator boxplottempotratamento ylabTempo para serem anestesiados xlabMétodos de administração da droga las1 colLightYellow Fazendo testes de comparações múltiplas não paramétrico requirePMCMRplus kwAllPairsDunnTesttempotratamentopadjustmethodbonferroni sem colocar padjustmethod vai ajustar pelo método de holm kwAllPairsDunnTesttempotratamento Profa Dra Vanderli Marino Melem ANOVA pg 27 2 Três estratos de origem vegetal foram introduzidos em cães por via oral com a finalidade de testar a diminuição na pressão arterial sistólica desses animais Os cães foram divididos em grupos de 5 animais recebendo cada grupo um tipo de estrato A B C via oral A tabela abaixo apresenta os resultados da pesquisa Tabela 13 Pressão arterial sistólica após a ingestão dos estratos vegetal A B C 94 105 136 83 112 157 86 105 127 86 145 126 93 116 102 a Verifique a eficiência dos 3 estratos de origem vegetal por meio da análise de variância com nível de significância de 5 b Os pressupostos de normalidade e homogeneidade do modelo foram atendidos c Aplicar o teste de comparações múltiplas Teste Tukey d Com esta análise poderíamos indicar o estrato vegetal mais eficaz Qual Ou quais Justifique sua resposta com uma conclusão prática e Apresente o coeficiente de variação Exercicio 2 Experimento Inteiramente Casualizado Três estratos de origem vegetal para baixar pressao arterial em cães por via oral rmlistls resp c9483868693 105112105145116 136157127126102 TratfactorrepcABCeach5 ANOVArespaovrespTrat summaryANOVAresp aparece o quadro de ANOVA Coefieciente de variação requireagricolae cvmodelANOVAresp ATENÇÃO este comando dic faz tudo direto requireExpDespt dicTratresp O teste de homogeneidade de Bartlett é sensível a falta de normalidade Como Shapiro deu pvalor 008816825 vamos fazer teste de homogeneidade de Levene requirecar Teste de Levene verifica se variâncias são homogêneas leveneTestrespTrat centermean Profa Dra Vanderli Marino Melem ANOVA pg 28 FAZENDO O TESTE DE LILLIEFOURS para normalidade librarynortest lillietestANOVArespres Teste de comparações múltiplas de SNK TESTE STUDENTNEWMANKEULS SNK requireagricolae testeSNKSNKtestANOVArespTrat testeSNK 3 adaptado de LARSON e FARBER 2010 pg 471 Suponha que um médico pesquisador deseja determinar se há diferença na média de tempo em que três tipos de analgésicos levam para aliviar a dor de cabeça Várias pessoas que sofrem de dor de cabeça são selecionadas aleatoriamente e tomam um dos três medicamentos Cada uma diz o tempo em minutos que o medicamento começou a fazer efeito Você pode concluir que as médias de tempo são diferentes Considere que cada população de tempo de alívio seja normalmente distribuída e as três com variâncias populacionais iguais Medicamento 1 Medicamento 2 Medicamento 3 12 16 14 15 14 17 17 21 20 12 15 15 16 19 18 As hipóteses ficam H0 3 2 1 H1 Existe pelo menos uma diferença entre duas médias 3 medicamentos para aliviar a dor resposta tempo em minutos rmlistls Resp c121517121616142115191417201518 tratfactorrepcMedicamento1Medicamento2Medicamento3each5 trat requireExpDespt dictratResp Profa Dra Vanderli Marino Melem ANOVA pg 29 4 Elaborado pelos alunos Jéssica e Antônio do projeto de Estatística na Psicologia maio 2017 Considerando as respostas para a avaliação da escala de autoestima de Rosemberg de 13 estudantes de 10 a 12 anos 15 estudantes de 13 a 15 anos 17 estudantes de 16 a 19 anos e 13 estudantes de 20 a 30 anos Verifique se existem diferenças significativas entre os grupos de idades GRUPOS DE IDADES 1012 anos 1315 anos 1619 anos 2030 anos NÍVEL DE AUTOESTIMA 19 20 16 10 20 21 18 11 21 22 20 13 24 24 21 15 25 25 22 16 26 26 23 17 27 27 24 18 29 29 25 21 30 30 27 22 31 31 28 23 32 32 29 25 33 33 30 28 34 35 33 33 36 34 37 35 36 37 ReferênciaExercício adaptado do artigo HUTZ Cláudio S ZANON Cristian Revisão da Adaptação validação e normatização da escala de autoestima de Rosenberg Avaliação Psicológica Porto alegre 2011 n 10 v 1 p 4149 4 grupos de idades resposta é índice de autoestima rmlistls nivelAutoestima c19202124252627293031323334202122242526272930 3132333536371618202122232425272829303334353637 10111315161718212223252833 Profa Dra Vanderli Marino Melem ANOVA pg 30 gruposIdadescrep10a12 anos13rep13a15 anos15rep16a19 anos17rep20a30 anos13 IdadeAutoestimadataframenivelAutoestimagruposIdades datframe junta os dois IdadeAutoestima mostra os dados para conferir resanova4aovnivelAutoestimagruposIdades dataIdadeAutoestima summaryresanova4 shapirotestresanova4res bartletttestnivelAutoestimagruposIdades boxplotnivelAutoestimagruposIdades ylabÍndice de Autoestima xlabGrupos de Idades las1 colLightYellow Coefieciente de variação requireagricolae cvmodelresanova4 TESTE DE COMPARÇÕES MÚLTIPLAS TUKEY anavatukey TukeyHSDresanova4 gruposIdades ordT anavatukey mediasIdades tapplynivelAutoestimagruposIdades mean mediasIdades requireExpDespt dicgruposIdadesnivelAutoestima Profa Dra Vanderli Marino Melem ANOVA pg 31 5 Apostila Prof Dr Silvano Cesar da Costa Foi realizado um estudo para comparar a concentração de cálcio em várias misturas denominadas M0M1M4 e D0 sendo que M0M1 e M4 têm composições similares de dextrose fosfato de sódio aminoácidos gluconato de cálcio e hidróxido de sódio com diferentes quantidades de água liposina e fosfolipídio 5 As amostras D0 não contêm aminoácidos e contêm mais água Seis amostras de M0M1M4 e D0 foram preparadas para o experimento e a concentração de cálcio em microgramas por mililitro de cada amostra foi determinada Os resultados para as misturas foram M0 4006 3872 3996 3978 3954 4014 M1 3907 4083 3961 3982 3936 3892 M4 4204 4028 4199 3948 4101 3947 D0 3485 3454 3678 3578 3570 3621 a Verifique se os pressupostos para a análise de variância são atendidos b Uma vez atendidos os pressupostos construa o quadro da análise de variância e interprete c O objetivo é comparar os tratamentos que possuem aminoácidos e os que não possuem aminoácidos 6 O objetivo do estudo foi investigar se o aumento de cálcio na dieta como um tratamento nãofarmacológico da pressão arterial elevada poderia influenciar beneficamente a função endotelial em mineralocorticoideNaCl Os pesquisadores dividiram os ratos machos WistarKyoto de sete semanas de idade em quatro grupos com igual pressão arterial sistólica média ratos não tratados a Normal WKY e dieta com alto teor de cálcio WKYCa ratos tratados com dieta de deoxicorticosterona NaCl a Normal DOC e dietas de alto teor de cálcio DOCCa Verificar se as dietas têm efeitos diferentes sobre os pesos medios g de ratos machos Tabela Pesos g de ratos submetidos à dietas de cálcio DOC WKY DOCCA WKYCA 336 328 304 342 346 315 292 284 269 343 299 334 346 368 293 348 323 353 277 315 309 374 303 313 322 356 303 301 316 339 320 354 300 343 324 346 309 343 340 319 276 334 299 289 306 333 279 322 310 313 305 308 302 333 290 325 269 372 300 321 311 343 312 322 Faça a análise de variância e verifique os pressupostos construa e interprete os gráficos aprendidos Se necessário faça os testes de comparações múltiplas adequados e os interprete Profa Dra Vanderli Marino Melem ANOVA pg 32 7 Com base nos dados apresentados na tabela abaixo verifique se existe diferença significativa entre os grupos No grupo operado foi feita a remoção das glândulas salivares maiores e no grupo pseudooperado foram executados todos os tempos cirúrgicos mas nenhuma glândula foi removida Os dados são de taxa de glicose em miligramas por 100ml de sangue em ratos Wistar machos de 60 dias São 24 ratos no total Grupo Operado PseudoOperado Normal 960 900 860 950 930 850 1000 890 1050 1080 880 1050 1200 870 900 1105 925 1000 970 875 950 925 850 950 EX7 variável é taxa de glicose fator é grupos com 3 níveis rmlistls apagar a memória listanova7c9690869593851008910510888105120879011092510097875 959258595 gruposfactorrepcOperadoPseudoOperadoNormal8 resanova7aovlistanova7grupos summaryresanova7 shapirotestresanova7res bartletttestlistanova7grupos requirecar leveneTestlistanova7grupos centermean plotlistanova7grupos xlabGrupos ylabTaxa de glicose miligramas100 ml sangue TESTE NÃOPARAMÉTRICO Teste de KruskalWallis kruskaltestlistanova7grupos Teste de Comparações Múltiplas NãoParamétrico requirePMCMRplus kwAllPairsDunnTestlistanova7grupospadjustmethodbonferroni Profa Dra Vanderli Marino Melem ANOVA pg 33 TABELA Studentizada q Tukey 5 a 2 2 3 4 5 6 7 8 9 10 11 1 1797 2698 3282 3708 4041 4312 4540 4736 4907 5059 2 609 833 980 1088 1174 1244 1303 1354 1399 1439 3 450 591 683 750 804 848 885 918 946 972 4 393 504 576 629 671 705 735 760 783 803 5 364 460 522 567 603 633 658 680 700 717 6 346 434 490 531 563 590 612 632 649 665 7 334 417 468 506 536 561 582 600 616 630 8 326 404 453 489 517 540 560 577 592 605 9 320 395 442 476 502 524 543 560 574 587 10 315 388 433 465 491 512 531 546 560 572 11 311 382 426 457 482 503 520 536 549 561 12 308 377 420 451 475 495 512 527 540 551 13 306 374 415 445 469 489 505 519 532 543 14 303 370 411 441 464 483 499 513 525 536 15 301 367 408 437 460 478 494 508 520 531 16 300 365 405 433 456 474 490 503 515 526 17 298 363 402 430 452 471 486 499 511 521 18 297 361 400 428 450 467 482 496 507 517 19 296 359 398 425 447 465 479 492 504 514 20 295 358 396 423 445 462 477 490 501 511 24 292 353 390 417 437 454 468 481 492 501 30 289 349 385 410 430 446 460 472 482 492 40 286 344 379 404 423 439 452 464 474 482 60 283 340 374 398 416 431 444 455 465 473 120 280 336 369 392 410 424 436 447 456 464 277 331 363 386 403 417 429 439 447 455 a 2 12 13 14 15 16 17 18 19 20 1 5196 5320 5433 5536 4632 5722 5804 5883 5956 2 1475 1508 1538 1505 1591 1614 1637 1657 1677 3 995 1015 1035 1053 1069 1084 1098 1111 1124 4 821 837 853 866 879 891 903 913 923 5 732 747 760 772 783 793 803 812 821 6 679 692 703 714 724 734 743 751 759 7 643 655 666 676 685 694 702 710 717 8 618 629 639 648 657 665 673 680 687 9 598 609 619 628 636 644 651 658 664 10 583 594 603 611 619 627 634 641 647 24 510 518 525 532 538 544 549 555 559 30 500 508 515 521 527 533 538 543 548 40 490 498 504 511 516 522 527 531 536 60 481 488 494 500 506 511 515 520 524 120 471 478 484 490 495 500 504 509 513 462 469 474 480 485 489 493 497 501 a É A QUANTIDADE DE TRATAMENTOS GRUPOS SENDO COMPARADOS 2 É O GRAU DE LIBERDADE DO DENOMINADOR GRAU DE LIBERDADE DO RESÍDUO Profa Dra Vanderli Marino Melem ANOVA pg 1