·
Medicina Veterinária ·
Estatística Aplicada à Medicina Veterinária
Send your question to AI and receive an answer instantly
Recommended for you
2
Questão - Estatística Aplicada à Medicina Veterinária 2021 2
Estatística Aplicada à Medicina Veterinária
UFU
9
Slide - Teoria da Estimação - 2023-1
Estatística Aplicada à Medicina Veterinária
UFU
9
Slide - Distribuições de Probabilidade - 2023-2
Estatística Aplicada à Medicina Veterinária
UFU
2
Lista 4 - Intervalo de Confiança - 2023-1
Estatística Aplicada à Medicina Veterinária
UFU
5
Questionário Avaliativo 2 - 2023-2
Estatística Aplicada à Medicina Veterinária
UFU
4
Avaliativo 1 - Estatística Aplicada à Medicina Veterinária 2021 2
Estatística Aplicada à Medicina Veterinária
UFU
4
Lista 5 - Teste Qui-quadrado - 2023-1
Estatística Aplicada à Medicina Veterinária
UFU
3
Lista 3 - Intervalo de Confiança - 2023-1
Estatística Aplicada à Medicina Veterinária
UFU
Preview text
1 Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães ANÁLISE DE VARIÂNCIA - ANOVA É a metodologia da estatística paramétrica utilizada para verificar a hipótese de igualdade de mais de dois tratamentos. É o processo desenvolvido por Fisher para dividir a variância de uma variável aleatória em partes ortogonais (independentes) correspondentes a tratamentos e erro experimental. Conceitos gerais da experimentação Experimento ou ensaio - procedimento planejado para obter novos fatos, negar ou confirmar hipóteses ou resultados obtidos anteriormente. Tratamento – É o processo cujo efeito deseja-se medir ou comparar em um experimento. Ex.: doses do adubo X, tipos de confinamento de animais, variedades de milho, etc.. Parcela ou unidade experimental – É a porção do material experimental a que se aplica um tratamento. Ex.: uma placa de petri; uma baia com 3 animais; um boi; etc. Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Delineamento experimental – É a maneira de dispor as parcelas no experimento. Como exemplos de delineamentos temos: delineamento de um único critério ou delineamento inteiramente ao acaso (DIC); delineamento de dois critérios ou delineamento em blocos casualizados (DBC); delineamento em quadrado latino (DQL). Variações de acaso (erros) – São variações que ocorrem nos experimentos atribuídas a efeitos de fatores não controlados, conhecidos ou não, que afetam os resultados experimentais. Ex.: diferenças genéticas em seres vivos; variações em condições ambientais; erros de medições; variações na qualidade do material; etc.. Bordadura – são procedimentos utilizados para evitar a influência de uma parcela experimental sobre a outra. Ex.: em experimento de campo pode-se deixar uma faixa de segurança em relação à área de coleta de dados; em um ensaio de análise sensorial o provador de alimentos pode tomar um copo de água entre uma prova e outra. Croqui - desenho esquemático, indicando a alocação dos tratamentos às unidades experimentais, se necessário com a bordadura e a área útil. Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Princípios básicos da experimentação a) Repetição – é o número de vezes que um tratamento ocorre no experimento b) Casualização - evitar que determinado tratamento seja “favorecido”. Pela casualização cada tratamento tem a mesma probabilidade de ser destinado a qualquer parcela, seja ela favorável ou não. c) Controle local - É um princípio muito usado, mas não é obrigatório. Ele consiste em distribuir os tratamentos sempre em condições mais homogêneas possíveis. Considerando o controle local temos: DIC - sem controle local; DBC - com controle feito em uma direção e DQL - com controle feito em duas direções. Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Ex.1: Experimento com 3 tratamentos, sem repetições e sem casualização Ex.2: Experimento com 3 tratamentos, com 5 repetições e sem casualização Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Ex.3: Experimento com 3 tratamentos, 5 repetições e com casualização Ex.4: Experimento com 3 tratamentos, 5 blocos, casualização e controle local Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Variações que ocorrem no experimento A variação total de um experimento pode ser desmembrada em variação devido ao tratamento (variação entre tratamentos) e variação residual (variação dentro do tratamento). A variação total é a variação de cada observação em relação à média geral. A variação entre tratamento é aquela atribuída estritamente à variabilidade das médias dos tratamentos em relação à média geral. A variação dentro de tratamentos é a variação de cada observação em relação à média do tratamento. São as variações devido a fontes não controladas no experimento. SQTotal = SQTrat + SQErro 2 1 1 ) ( t i r j ij Y Y SQTotal VT 2 1 ) ( . Y Y r SQTrat SQEntre Trat VE t i i 2 1 1 ) ( Re . t i r j i ij Y Y siduo SQ SQErro SQDentro de trat VD 2 Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães 7 Desenvolvendo as fórmulas de SQ, podemos reescreve-las como: r t Y fator de correção C total do trat i T que em C r T SQTrat ij i t i j i . ) ( : 2 1 2 C Y SQTotal ij 2 SQResiduo = SQTotal - SQTrat Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Pressupostos do modelo de análise de variância Aditividade - Os efeitos do modelo matemático que rege o experimento devem ser aditivos ( efeito da média geral, do tratamento, do bloco (caso exista), e do erro experimental). Existem testes para verificar aditividade (Ex.: Teste de não aditividade de Tukey), mas são pouco utilizados na prática Na prática, verificar comportamento dos resíduos (Histograma dos resíduos não devem apresentar assimetria acentuada). Normalidade – Os erros experimentais (resíduos) devem seguir a distribuição normal de probabilidade fazer teste de normalidade de resíduos (Ex.: Shapiro-Wilk, Anderson-Darling,etc..) Homocedasticidade de variâncias- as variâncias de tratamentos devem ser homogêneas fazer teste de homocedasticidade (Ex.: Teste de Levene) Independência de erros - os efeitos aleatórios (erros experimentais) devem ser independentes, ou seja, não pode ocorrer correlação entre os resíduos. Verificação visual dos resíduos (não devem apresentar tendência). Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães TRANSFORMAÇÃO DE DADOS Utilizada quando se tem variáveis quantitativa e pretende-se utilizar testes de hipóteses paramétricos mas não se atende os pressupostos do teste. Nem sempre funciona pois, para ter resultados satisfatórios, necessita ter associação entre valores de médias e variâncias dos tratamentos. Se a transformação não funciona pode-se utilizar outras técnicas estatísticas de análise, por exemplo, os testes não paramétricos. A transformação de dados adequada para uma determinada variável pode ser obtida por: a) Tentativa e erro usar algumas transformações e verificar se os dados transformados atendem os pressupostos do teste b) Usando a transformação Box-Cox (ver literatura) Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Certos tipos de dados de contagem ou de proporções tem relação entre média e variância já conhecida e, portanto, alguns tipos de transformações podem ser sugeridas: a) Dados de contagem pode seguir a distribuição de Poisson transformações recomendadas: a) Dados percentuais transformações recomendadas: a) Dados com proporcionalidade entre média e desvio padrão (distribuição assimétrica) transformação recomendada: 5,0 Y ou Y ( ) 5,0 ou arcsen Y Y ou Y 1 log log( ) Y ou Y Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães DELINEAMENTO DE UM CRITÉRIO- DELINEAMENTO INTEIRAMENTE AO ACASO – ONE-WAY ANOVA Mais simples de todos os delineamentos experimentais, sendo recomendado quando todas as condições experimentais são homogêneas Modelo matemático: Yij é o valor da parcela que recebeu o tratamento i na repetição j; é a média geral do experimento; ti é o efeito do tratamento i; e ij é o erro da parcela que recebeu o tratamento i na repetição j. Procedimentos para a Análise de Variância (ANOVA): Estabelecer as hipóteses na análise de variância são: Ho: t1= t2 = ... = tt H1: ti tj ( no mínimo para um par) Calcular as somas de quadrados (SQ) de cada fonte de variação do modelo estatístico Determinar os graus de liberdade (GL) de cada fonte de variação. ij i ij t Y Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Calcular os Quadrados Médios (QM) por meio das fórmulas: • Calcular o F de tratamento: • Obter o valor de F na tabela com GL de trat e GL do Resíduo • Montar o Quadro de ANOVA Tirar a conclusõa: Se Ftrat > Ftab rejeita-se Ho, portanto, existe diferença significativa entre tratamentos. FonteVariação G. L. S. Q. Q. M. F F tab. Tratamento Resíduo t-1 t(r-1) SQTrat SQResíduo QMTrat QMResíduo F trat F0,05 Total tr-1 SQTotal síduo QM QMTrat Ftrat Re síduo GL síduo SQ QMErro GLtrat SQtrat QMtrat Re Re 3 Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Comparação múltipla de médias A análise de variância significativa, nos informa que pelo menos um tratamento aplicado no experimento é significativamente diferente dos demais, entretanto esta análise não nos informa onde está esta diferença. Para verificar as diferenças são usados os testes de comparação entre médias. Alguns desses testes são: Teste t (DMS ou LSD); Teste de Tukey; Teste de Duncan; Teste de Dunnet; Teste de Bonferroni; Teste de Student- Newman-Keuls (SNK); Teste de Scheffé; Teste Scott-Knott, etc Algumas especificidades: Tukey (muito utilizado na literatura compara médias com um único valor de diferença mínima significativa (DMS) e é considerado rigoroso); Duncan (compara médias com diferentes valores de DMS); Dunnet (compara controle com demais tratamentos); Scott-Knott (separa médias em grupos, muito utilizado quando se tem elevado número de comparações por não apresentar ambiguidade) Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Os procedimentos dos testes se baseiam na comparação da diferenças entre médias com o valor de teste que é chamado de diferença mínima significativa (DMS) e que é obtido por meio de valores padronizados associados com informações da análise de variância, por exemplo, no teste de Tukey: r é o número de repetições dos tratamentos, ou seja, r é o número de dados a partir do qual foi obtido o valor da média. q(t,v) é o valor da amplitude total estudentizada, em um nível de significância. Este valor é obtido na tabela de Tukey em função do número de tratamentos envolvidos no experimento (t) e do número de graus de liberdade da fonte de variação Resíduo (GLResíduo), da análise de variância. r síduo QM t v q DMS Re ( , ). Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Amplitude Total Studentizada (q) para uso no teste de Tukey ( = 0,05) K V 2 3 4 5 6 7 8 9 10 12 15 20 1 18,00 27,00 32,80 37,10 40,40 43,10 45,40 47,40 49,10 52,00 55,40 59,60 2 6,09 8,30 9,80 10,90 11,70 12,40 13,00 13,50 14,00 14,70 15,70 16,80 3 4,50 5,91 6,82 7,50 8,04 8,48 8,85 9,18 9,46 9,95 10,50 11,20 4 3,93 5,04 5,76 6,29 6,71 7,05 7,35 7,60 7,83 8,21 8,66 9,23 5 3,64 4,60 5,22 5,67 6,03 6,33 6,58 6,80 6,99 7,32 7,72 8,21 6 3,46 4,34 4,90 5,31 5,63 5,89 6,12 6,32 6,49 6,79 7,14 7,59 7 3,34 4,16 4,68 5,06 5,36 5,61 5,82 6,00 6,16 6,43 6,76 7,17 8 3,26 4,04 4,53 4,89 5,17 5,40 5,60 5,77 5,92 6,18 6,48 6.87 9 3,20 3,95 4,42 4,76 5,02 5,24 5,43 5,60 5,74 5,98 6,28 6,64 10 3,15 3,88 4,33 4,65 4,91 5,12 5,30 5,46 5,60 5,83 6,11 6,47 11 3,11 3,82 4,26 4,57 4,82 5,03 5,20 5,35 5,49 5,71 5,99 6,33 12 3,08 3,77 4,20 4,51 4,75 4,95 5,12 5,27 5,40 5,62 5,88 6,21 13 3,06 3,73 4,15 4,45 4,69 4,88 5,05 5,19 5,32 5,53 5,79 6,11 14 3,03 3,70 4,11 4,41 4,64 4,83 4,99 5,13 5,25 5,46 5,72 6,03 15 3,01 3,67 4,08 4,37 4,60 4,78 4,94 5,08 5,20 5,40 5,65 5,96 16 3,00 3,65 4,05 4,33 4,56 4,74 4,90 5,03 5,15 5,35 5,59 5,90 17 2,98 3,63 4,02 4,30 4,52 4,71 4,86 4,99 5,11 5,31 5,55 5,84 18 2,97 3,61 4,00 4,28 4,49 4,67 4,82 4,96 5,07 5,27 5,50 5,79 19 2,96 3,59 3,98 4,25 4,47 4,65 4,79 4,92 5,04 5,23 5,46 5,75 20 2,95 3,58 3,96 4,23 4,45 4,62 4,77 4,90 5,01 5,20 5,43 5,71 24 2,92 3,53 3,90 4,17 4,37 4,54 4,68 4,81 4,92 5,10 5,32 5,59 30 2,89 3,49 3,84 4,10 4,30 4,46 4,60 4,72 4,83 5,00 5,21 5,48 60 2,83 3,40 3,74 3,98 4,16 4,31 4,44 4,55 4,65 4,81 5,00 5,24 120 2,80 3,36 3,69 3,92 4,10 4,24 4,36 4,48 4,56 4,72 4,90 5,13 K = Número de tratamentos v = Graus de liberdade do resíduo Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Procedimento adotado para verificar se existem diferenças significativas entre os tratamentos: • Calcula-se as médias dos tratamento; • Ordena-se estas médias (ordem crescente ou decrescente de valores); • Verifica-se se a diferença entre duas médias é inferior a DMS (), em caso afirmativo, conclui-se que não há diferença estatística entre os tratamento. • Se a diferença entre duas médias for superior a DMS então existe diferença estatística entre os tratamentos. • Geralmente, adota-se letras na frente das médias para diferencia-las, ou seja, médias com letras iguais indicam que não existe diferença significativa entre os tratamentos, para o nível de significância adotado e, consequentemente, médias com letras diferentes indicam a existência de diferença significativa entre os tratamentos. Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães EXEMPLO 1: Um experimento em DIC, foi conduzido com o objetivo de verificar o efeito de 5 tratamentos (T1, T2, T3, T4, T5), sobre a área de cicatrização (mm2) de animais submetido a cirurgia. Foram utilizadas 3 repetições (animais) para cada tratamento. Os dados obtidos no experimento são apresentados a seguir: Repetições Tratamento 1 2 3 T1 21 22 22 T2 17 22 19 T3 22 22 20 T4 15 13 16 T5 28 25 24 Verificar se existe diferença significativa para a área de cicatrização dos tratamentos. Use significância de 5%. Caso exista a diferença, utilize o teste de Tukey para mostrar essas diferenças. Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães EXEMPLO 2. Em um experimento composto por 5 tratamentos e 6 repetições, cuja montagem seguiu um DIC, obteve-se análise de variância significativa, conforme mostra o quadro abaixo: FV GL SQ QM F Ftab TRAT 4 1,4220 0,3555 21,68 2,759 RESÍDUO 25 0,4100 0,0164 TOTAL 29 1,8320 As médias dos tratamentos foram: Y 1 = 1,65; Y 2 = 1,30; Y 3 = 1,00; Y 4 = 1,15; Y 5 = 1,20 Utilize o teste de Tukey para verificar a ocorrência das diferenças significativas entre as médias de tratamentos. 4 Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães EXPERIMENTO DE DOIS CRITÉRIO - DELINEAMENTO EM BLOCOS CASUALIZADO • São considerados os princípios básicos de repetição, casualização e um controle local (linha ou coluna do experimento) • Próprio para as situações onde existe heterogeneidade do material experimental ou do ambiente onde se realiza o ensaio • exemplo: diferença de temperatura; diferença em fertilidade; diferença genética; diferença entre idades; diferença social, etc.. • Podemos associar este experimento com a ideia de amostras estratificadas, vista na estatística básica. Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães O modelo matemático ij j i ij b t Y Yij é o valor da parcela que recebeu o tratamento i no bloco j; é a média geral do experimento; ti é o efeito do tratamento i; bj é o efeito do bloco j e ij é o erro da parcela que recebeu o tratamento i no bloco j. O objetivo da blocagem é manter a variabilidade entre parcelas, dentro dos blocos, tão pequena quanto possível, contribuindo para a redução da fonte de variação residual. Estamos introduzindo mais uma fonte de variação na análise de variância, a fonte bloco. Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães O planejamento Experimental Suponha um DBC com 5 tratamentos (A, B, C, D, E) e 4 blocos (I, II, III, IV). Como exemplo da disposição das parcelas no experimento, temos: Bloco I B A D C E Bloco II E D A B C Bloco III A C B E D Bloco IV B D C A E Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Calculo das somas de quadrados (SQ) b t Y C C b T SQTrat ij i . ) ( 2 2 C Y SQTotal ij 2 C t B SQBlo j 2 cos SQResíduo = SQTotal – SQTrat – SQBlocos Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Quadro de análise de variância FV GL SQ QM F Bloco b-1 SQBloco QMBloco FBloco Trat t-1 SQTrat QMTrat FTrat Resíduo (t-1).(b-1) SQRes QMRes Total tb-1 SQTotal Lembre-se de que os quadrados médios são obtidos dividindo-se cada soma de quadrados por seu respectivo grau de liberdade; e que os F são obtidos dividindo-se os quadrados médios da fonte de variação pelo quadrado médio do resíduo. Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães As hipóteses na análise de variância são: Ho: t1= t2 = ... = tt H1: ti tj ( no mínimo para um par) Ho : não existe efeito de blocos H1 : pelo um dos blocos apresenta-se de forma diferenciada sobre a variável resposta 5 Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães EXEMPLO 3: Um experimento foi realizado com o objetivo de estudar o efeito 4 tipos de dietas alimentar de um determinado animal na conversão alimentar. O delineamento experimental foi em blocos casualizados com 4 tratamentos (dietas) e 5 blocos (repetições). TRATAMENTOS Blocos A B C D I 2,20 1,90 2,50 2,10 II 2,50 2,30 2,90 2,40 III 2,30 1,70 2,50 1,90 IV 2,20 1,60 2,40 2,20 V 2,10 1,60 2,30 2,10 Verifique se existe diferença entre tratamentos. Use nível de significância de 5%. Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães EXPERIMENTOS EM ESQUEMA FATORIAL • Nas experiências científicas, podemos estar interessados no estudo da influência de dois ou mais fatores sobre uma mesma variável resposta. • Podemos estar interessado também em verificar se dois ou mais fatores controlados pelo pesquisador estão exercendo, conjuntamente, algum tipo de influência sobre a variável resposta. • Uma forma de análise dessas interações é o esquema de análise conhecido como fatorial. • A grande vantagem da utilização do esquema fatorial é a possibilidade de analisar isoladamente os fatores e também simultânea desses fatores, reduzindo o número de análises. Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães • Nos experimentos em esquema fatorial pode-se utilizar os delineamentos inteiramente ao acaso (DIC), os delineamentos em blocos casualizados (DBC) e os quadrados latinos (DQL) • Vale ressaltar que o esquema fatorial e o esquema em parcela subdividida (que não será abordado neste curso) são apenas esquemas de análise, não se constituindo em delineamentos experimentais. • O modelo matemático de análise de variância no esquema fatorial, para um experimento com 2 fatores (A, B) em DIC é dado por: ijk ij j i ijk ab b a Y . ) ( em que: ai é o efeito do fator A; bj é o efeito do fator B; (ab)ij é o efeito da interação entre os fatores A e B Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães • As somas de quadrados são dadas por: número de repetições r número de níveis do fator que a número de níveis do fator A b em abr Y C C Y SQTotal ijk ijk ; ; : ) ( 2 2 B é o total do fator A no nível i que : T em C br T SQA i A Ai 2 Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães é o total do fator B no nível j que: T em C ar T SQB j B Bi 2 C r Y SQTrat SQB SQA SQTrat SQAxB ij 2 Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães SQResíduo = SQTotal – SQA – SQB - SQAxB • A utilização de quadros auxiliares, tornam mais simples os cálculos das somas de quadrados. • O esquema do quadro de análise de variância para um fatorial com dois fatores é apresentado a seguir: FV GL SQ QM F A a-1 SQA QMA FA B b-1 SQB QMB FB AxB (a-1).(b-1) SQAxB QMAxB FAxB Resíduo ab(r-1) SQResiduo QMResiduo TOTAL Abr-1 SQTotal 6 Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães OBSERVAÇÕES: • Se as interações apresentarem significância, deve-se proceder ao desdobramento das interações e posterior aplicação dos testes de médias. Este procedimento será mostrado no desenvolvimento do exemplo. • Se a interação for não significativa, mas os fatores são significativos, aplica-se os testes de médias para cada fator isoladamente • Se toda a análise mostrar-se não significativa, conclui-se que não existe diferença entre os tratamentos aplicados no experimento e a análise termina neste ponto • Note que o grau de complexidade da análise será cada vez maior com a adição de novos fatores na análise Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães EXEMPLO 4. Um experimento foi conduzido em DIC fatorial, para verificar o tempo de recuperação (dias) de 4 raças de animais submetidos a 3 tipos medicamentos. Os resultados foram: Y Y Y Y Y ij j i ij b t Y b t Y C C b T SQTrat ij i . ) ( 2 2 C Y SQTotal ij 2 C t B SQBlo j 2 cos - r é o número de repetições dos tratamentos, ou seja, r é o número de dados a partir do qual foi obtido o valor da média. - q(t,v) é o valor da amplitude total estudentizada, em um nível de significância. Este valor é obtido na tabela de Tukey em função do número de tratamentos envolvidos no experimento e do número de graus de liberdade (v) da fonte de variação Resíd Amplitude Total Studentizada (q) para uso no teste de Tukey ( = 0,05) K = Número de tratamentos v = Graus de liberdade do resíduo O procedimento adotado para a verificação de diferenças significativas é semelhante àquele descrito no TESTE t. EXEMPLO 3. Para os dados do EXEMPLO 1, aplique o Teste de Tukey e faça as conclusões. Use significância de 5%. EXEMPLO 4. Em um experimento composto por 5 tratamentos e 6 repetições, cuja montagem seguiu um DIC, obteve-se análise de variância significativa, conforme mostra FV GL SQ QM F TRAT 4 1,4220 0,3555 21,68 RESÍDUO 25 0,4100 0,0164 TOTAL 29 1,8320 As médias dos tratamentos foram: 1 = 1,65; 2 = 1,30; 3 = 1,00; 4 = 1,15; 5 = 1,20 Utilize o teste de Tukey para verificar a ocorrência das diferenças significativas entre as médias de tratamentos. OBS: Se as médias foram obtidas a partir de tratamentos com diferentes números de repetições, deve-se calcular um para cada par de comparação com diferentes números de BLOCOS AO ACASO (DBC) Neste tipo de delineamento são considerados os princípios básicos de repetição, casualização e controle local em um sentido ( linha ou coluna do experimento). É um delineamento próprio O objetivo da blocagem é manter a variabilidade entre parcelas, dentro dos blocos, tão pequena quanto possível, contribuindo para a redução da fonte de variação residual. O modelo matemático para este tipo de delineamento é dado por: em que: bj é o efeito do bloco j. Verifica-se pelo modelo matemático que estamos introduzindo mais uma fonte de variação na análise de variância, a fonte bloco. -O planejamento Experimental Suponha um DBC com 5 tratamentos (A, B, C, D, E) e 4 blocos (I, II, III, IV). Como exemplo da disposição das parcelas no experimento, temos: Bloco I B A D C E Bloco II E D A B C Bloco III A C B E D Bloco IV B D C A E -Calculo das somas de quadrados (SQ) a)Soma de quadrados de tratamentos (SQTrat) a)Soma de quadrados total (SQTotal) a)Soma de quadrados de Blocos (SQBlocos) a)Soma de quadrados de resíduo (SQResíduo) SQResíduo = SQTotal – SQTrat – SQBlocos -Quadro de análise de variância FV GL SQ QM F Bloco b-1 SQBloco QMBloco FBloco Trat t-1 SQTrat QMTrat F REPETIÇÃO MEDIC RAÇA 1 2 3 Total M1 A 54 52 50 156 B 46 47 49 142 C 55 54 54 163 D 51 55 48 154 M2 A 59 61 57 177 B 61 55 58 174 C 59 60 62 181 D 52 51 52 155 M3 A 59 62 64 185 B 63 58 59 180 C 63 61 58 182 D 59 59 60 178 Proceder à analise de variância e aos testes de médias, com significância de 5% Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães A resolução desse exemplo será feita em um programa computacional. Discutiremos os resultados da análise. O quadro anova mostra que ocorre uma interação significativa entre medicamento e raça, ou seja, um fator interfere nos resultados de outro fator. Fazer o desdobramento das interações e aplicar o teste de Tukey para esse desdobramento Não vamos analisar os fatores isoladamente. Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Para a raça A existe diferença significativa entre os medicamentos Para a raça B existe diferença significativa entre os medicamentos Para a raça C existe diferença significativa entre os medicamentos Para a raça D existe diferença significativa entre os medicamentos Aplicar o teste de Tukey para analisar, dentro de cada raça, onde estão as diferenças de tratamentos Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Diferença entre raças para M1 Diferença entre raças para M2 Não tem diferença entre raças para M3 7 Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Quadro resumo do teste de Tukey Raça Medicamento Média M1 M2 M3 A 52,00aAB 59,00bB 61,67bA 57,55 B 47,33aA 58,00bB 60,00bA 55,11 C 54,00aB 60,33bB 60,67bA 58,44 D 51,33aAB 51,66aA 59,33bA 54,11 Média 51,25 57,25 60,42 Médias seguidas por letras minúsculas iguais nas linhas e maiúsculas iguais nas colunas não diferem entre si, pelo teste de Tukey com 5% de significância Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães ANÁLISE DE CORRELAÇÃO Interesse em mensurar a “força” da associação entre as variáveis (geralmente através do cálculo de algum coeficiente). ANÁLISE DE REGRESSÃO Interesse em realizar previsões sobre os valores da variável dependente (resposta) a partir dos valores das variáveis independentes (preditoras). Construir um modelo estatístico (modelo de regressão): uma equação que mostre o relacionamento entre as variáveis. CORRELAÇÃO E REGRESSÃO LINEAR Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Classificação dos modelos Análise de Correlação Análise de Regressão Regressão Linear Simples Regressão Linear Múltipla Regressão Não Linear Exponencial Logística Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Duas variáveis quantitativas • temos duas variáveis quantitativas • Como medir a associação entre essas variáveis? • O coeficiente utilizado é o coeficiente de correlação de Pearson (r) COEFICIENTES DE CORRELAÇÃO Obs: Existem outros coeficientes na estatística para medir a força de associação entre duas variáveis, como Coeficiente de Correlação de Spearman, Coeficiente de Contingência, etc.. Não abordaremos estes coeficientes neste curso. Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Correlação Linear Positiva Correlação Linear Negativa SEM correlação Não linear Correlação linear simples Diagrama de dispersão indica a possibilidade de correlação linear. 8 Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Coeficiente de correlação linear de Pearson mede a força e a direção do relacionamento LINEAR entre as duas variáveis: -1,00 < r < 1,00 Quanto mais próximo de -1 ou de +1 maior será a associação ou a relação linear entre as variáveis analisadas n y y n x x n y x y x i i i i i i i i r 2 2 2 2 ) ( ) ( Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães r = -1 correlação inversa (negativa) perfeita, r = +1 correlação direta perfeita (positiva) r = 0 não existe relação linear entre X e Y. valor positivo de r aumento X Y também aumentará valor negativo de r aumento X Y decrescerá. Pode-se, de uma forma geral, dizer que se: -1,00 < r < -0,90 ou 0,90 < r < 1,00 a relação entre X e Y é forte -0,90 < r < -0,70 ou 0,70 < r < 0,90 a relação entre X e Y é moderada -0,70 < r < 0,70 a relação entre X e Y é fraca r = 0 relação linear inexistente Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães • Para verificar a significância do r ( testar a hipótese que, na população, o coeficiente de correlação é zero) a distribuição utilizada é a distribuição t – Student com (n–2) graus de liberdade 2 1 2 r n r t Obs: Se pretendemos verificar se o coeficiente de correlação é estatisticamente diferente de uma constante, com essa constante diferente de zero, devemos aplicar outro teste (Spiegel (1993) ou Freund & Simon (2000)) Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Exemplo 1. Verificar se existe correlação entre peso do animal (kg) e percentagem de gordura (%). Os resultados foram: PESO 40 45 50 55 60 GORD 6,0 7,7 7,5 8,0 9,3 Exemplo 2. Verificar se existe relação entre idade de cães (meses) e reação ao estimulo (miléssimo de segundos) idade 2 4 5 6 8 11 reação 18 12 10 8 7 5 Exemplo 3. Verificar se existe relação entre idade de pessoas adultas (anos) e renda familiar (s.m) X(idade) 25 30 35 40 45 50 Y (renda) 5 3 8 4 4 7 Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães REGRESSÃO LINEAR SIMPLES • Objetivo: obter uma equação matemática que expresse o relacionamento entre a variável dependente (resposta) e as independentes (explicativas, preditoras). • Possibilita a realização de previsões: – Como as mudanças nos valores das variáveis independente influenciam a variável dependente. – Tomada de decisões. • Análise de regressão simples: apenas duas variáveis. • Análise de regressão múltipla: uma dependente e mais de uma independente. Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães O modelo geral de regressão linear simples i i i e X Y • Melhor reta passar o “mais perto possível” dos pontos experimentais • Minimizar a distância global dos pontos em relação a reta • A equação estimada será dada por: i i i e bx a Y ^ • ei são os “erros” ou residuos (yi - ) ^ iy 9 Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães • Geralmente se utiliza o Método dos Mínimos Quadrados (MMQ) para a obtenção das estimativas dos parâmetros da equação • MMQ determinar a e b para o menor ei 2 • Para minimizar a ei 2 temos: a) Derivadas parciais em relação a a e b se anulam b) Determinante da matriz de derivadas parciais seja maior que zero. Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães • Então as estimativas de a e b serão: 2 2 [( )( )] ( ) ( ) i i i i i i i i i X Y X Y X X Y Y SPXY n b SQX X X X X n 1[ ] i i a Y b X Y bX n 2 Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Coeficiente de determinação • É um coeficiente que usamos em associação a reta de regressão para qualifica-la, ou seja, para informar o quanto os valores de Y (variável dependente) podem ser explicados por meio de X (varável independente) utilizando a equação ajustada • Esse coeficiente quanto da variação total que pode ser explicada pela reta ajustada total Variação licada Variação R r exp 2 2 Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães • Pode-se obter o coeficiente de determinação elevando-se o valor do coeficiente de correlação ao quadrado • O coeficiente de determinação pode ser expresso em % • 0 < r2 < 1 ou 0% < r2 < 100% • no caso da regressão linear simples: se r é significativo, então r2 também é significativo e o modelo é, portanto, adequado para se realizar estimativas. n y y n x x n y x y x r R r i i i i i i i i 2 2 2 2 2 2 2 2 . Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Obs: outras inferências podem ser feitas a partir dos modelos de regressão, entretanto não abordaremos estas inferências neste curso. Pode-se fazer inferências como: a) Análise de Variâncias para o modelo verificar significância do modelo; b) Cálculo o coeficiente de variação indicador da qualidade do ajuste c) Intervalos de confiança para os parâmetros do modelo estimar os limites inferiores e superiores de a e b do modelo com determinada confiança d) Teste de hipóteses para a e b verficar se são diferentes de 0 e) Análise dos resíduos verificar se o modelo atende as pressuposições para ser utilizado. Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Exemplo 1. Ajustar o modelo de regressão linear para a % de gordura (Y) em função do Peso (X). Peso 40 45 50 55 60 Gordura 6,0 7,7 7,5 8,0 9,3 Exemplo 2. Ajustar o modelo de regressão linear para o Tempo de reação (Y) em função Idade (X). idade 2 4 5 6 8 11 reação 18 12 10 8 7 5
Send your question to AI and receive an answer instantly
Recommended for you
2
Questão - Estatística Aplicada à Medicina Veterinária 2021 2
Estatística Aplicada à Medicina Veterinária
UFU
9
Slide - Teoria da Estimação - 2023-1
Estatística Aplicada à Medicina Veterinária
UFU
9
Slide - Distribuições de Probabilidade - 2023-2
Estatística Aplicada à Medicina Veterinária
UFU
2
Lista 4 - Intervalo de Confiança - 2023-1
Estatística Aplicada à Medicina Veterinária
UFU
5
Questionário Avaliativo 2 - 2023-2
Estatística Aplicada à Medicina Veterinária
UFU
4
Avaliativo 1 - Estatística Aplicada à Medicina Veterinária 2021 2
Estatística Aplicada à Medicina Veterinária
UFU
4
Lista 5 - Teste Qui-quadrado - 2023-1
Estatística Aplicada à Medicina Veterinária
UFU
3
Lista 3 - Intervalo de Confiança - 2023-1
Estatística Aplicada à Medicina Veterinária
UFU
Preview text
1 Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães ANÁLISE DE VARIÂNCIA - ANOVA É a metodologia da estatística paramétrica utilizada para verificar a hipótese de igualdade de mais de dois tratamentos. É o processo desenvolvido por Fisher para dividir a variância de uma variável aleatória em partes ortogonais (independentes) correspondentes a tratamentos e erro experimental. Conceitos gerais da experimentação Experimento ou ensaio - procedimento planejado para obter novos fatos, negar ou confirmar hipóteses ou resultados obtidos anteriormente. Tratamento – É o processo cujo efeito deseja-se medir ou comparar em um experimento. Ex.: doses do adubo X, tipos de confinamento de animais, variedades de milho, etc.. Parcela ou unidade experimental – É a porção do material experimental a que se aplica um tratamento. Ex.: uma placa de petri; uma baia com 3 animais; um boi; etc. Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Delineamento experimental – É a maneira de dispor as parcelas no experimento. Como exemplos de delineamentos temos: delineamento de um único critério ou delineamento inteiramente ao acaso (DIC); delineamento de dois critérios ou delineamento em blocos casualizados (DBC); delineamento em quadrado latino (DQL). Variações de acaso (erros) – São variações que ocorrem nos experimentos atribuídas a efeitos de fatores não controlados, conhecidos ou não, que afetam os resultados experimentais. Ex.: diferenças genéticas em seres vivos; variações em condições ambientais; erros de medições; variações na qualidade do material; etc.. Bordadura – são procedimentos utilizados para evitar a influência de uma parcela experimental sobre a outra. Ex.: em experimento de campo pode-se deixar uma faixa de segurança em relação à área de coleta de dados; em um ensaio de análise sensorial o provador de alimentos pode tomar um copo de água entre uma prova e outra. Croqui - desenho esquemático, indicando a alocação dos tratamentos às unidades experimentais, se necessário com a bordadura e a área útil. Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Princípios básicos da experimentação a) Repetição – é o número de vezes que um tratamento ocorre no experimento b) Casualização - evitar que determinado tratamento seja “favorecido”. Pela casualização cada tratamento tem a mesma probabilidade de ser destinado a qualquer parcela, seja ela favorável ou não. c) Controle local - É um princípio muito usado, mas não é obrigatório. Ele consiste em distribuir os tratamentos sempre em condições mais homogêneas possíveis. Considerando o controle local temos: DIC - sem controle local; DBC - com controle feito em uma direção e DQL - com controle feito em duas direções. Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Ex.1: Experimento com 3 tratamentos, sem repetições e sem casualização Ex.2: Experimento com 3 tratamentos, com 5 repetições e sem casualização Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Ex.3: Experimento com 3 tratamentos, 5 repetições e com casualização Ex.4: Experimento com 3 tratamentos, 5 blocos, casualização e controle local Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Variações que ocorrem no experimento A variação total de um experimento pode ser desmembrada em variação devido ao tratamento (variação entre tratamentos) e variação residual (variação dentro do tratamento). A variação total é a variação de cada observação em relação à média geral. A variação entre tratamento é aquela atribuída estritamente à variabilidade das médias dos tratamentos em relação à média geral. A variação dentro de tratamentos é a variação de cada observação em relação à média do tratamento. São as variações devido a fontes não controladas no experimento. SQTotal = SQTrat + SQErro 2 1 1 ) ( t i r j ij Y Y SQTotal VT 2 1 ) ( . Y Y r SQTrat SQEntre Trat VE t i i 2 1 1 ) ( Re . t i r j i ij Y Y siduo SQ SQErro SQDentro de trat VD 2 Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães 7 Desenvolvendo as fórmulas de SQ, podemos reescreve-las como: r t Y fator de correção C total do trat i T que em C r T SQTrat ij i t i j i . ) ( : 2 1 2 C Y SQTotal ij 2 SQResiduo = SQTotal - SQTrat Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Pressupostos do modelo de análise de variância Aditividade - Os efeitos do modelo matemático que rege o experimento devem ser aditivos ( efeito da média geral, do tratamento, do bloco (caso exista), e do erro experimental). Existem testes para verificar aditividade (Ex.: Teste de não aditividade de Tukey), mas são pouco utilizados na prática Na prática, verificar comportamento dos resíduos (Histograma dos resíduos não devem apresentar assimetria acentuada). Normalidade – Os erros experimentais (resíduos) devem seguir a distribuição normal de probabilidade fazer teste de normalidade de resíduos (Ex.: Shapiro-Wilk, Anderson-Darling,etc..) Homocedasticidade de variâncias- as variâncias de tratamentos devem ser homogêneas fazer teste de homocedasticidade (Ex.: Teste de Levene) Independência de erros - os efeitos aleatórios (erros experimentais) devem ser independentes, ou seja, não pode ocorrer correlação entre os resíduos. Verificação visual dos resíduos (não devem apresentar tendência). Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães TRANSFORMAÇÃO DE DADOS Utilizada quando se tem variáveis quantitativa e pretende-se utilizar testes de hipóteses paramétricos mas não se atende os pressupostos do teste. Nem sempre funciona pois, para ter resultados satisfatórios, necessita ter associação entre valores de médias e variâncias dos tratamentos. Se a transformação não funciona pode-se utilizar outras técnicas estatísticas de análise, por exemplo, os testes não paramétricos. A transformação de dados adequada para uma determinada variável pode ser obtida por: a) Tentativa e erro usar algumas transformações e verificar se os dados transformados atendem os pressupostos do teste b) Usando a transformação Box-Cox (ver literatura) Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Certos tipos de dados de contagem ou de proporções tem relação entre média e variância já conhecida e, portanto, alguns tipos de transformações podem ser sugeridas: a) Dados de contagem pode seguir a distribuição de Poisson transformações recomendadas: a) Dados percentuais transformações recomendadas: a) Dados com proporcionalidade entre média e desvio padrão (distribuição assimétrica) transformação recomendada: 5,0 Y ou Y ( ) 5,0 ou arcsen Y Y ou Y 1 log log( ) Y ou Y Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães DELINEAMENTO DE UM CRITÉRIO- DELINEAMENTO INTEIRAMENTE AO ACASO – ONE-WAY ANOVA Mais simples de todos os delineamentos experimentais, sendo recomendado quando todas as condições experimentais são homogêneas Modelo matemático: Yij é o valor da parcela que recebeu o tratamento i na repetição j; é a média geral do experimento; ti é o efeito do tratamento i; e ij é o erro da parcela que recebeu o tratamento i na repetição j. Procedimentos para a Análise de Variância (ANOVA): Estabelecer as hipóteses na análise de variância são: Ho: t1= t2 = ... = tt H1: ti tj ( no mínimo para um par) Calcular as somas de quadrados (SQ) de cada fonte de variação do modelo estatístico Determinar os graus de liberdade (GL) de cada fonte de variação. ij i ij t Y Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Calcular os Quadrados Médios (QM) por meio das fórmulas: • Calcular o F de tratamento: • Obter o valor de F na tabela com GL de trat e GL do Resíduo • Montar o Quadro de ANOVA Tirar a conclusõa: Se Ftrat > Ftab rejeita-se Ho, portanto, existe diferença significativa entre tratamentos. FonteVariação G. L. S. Q. Q. M. F F tab. Tratamento Resíduo t-1 t(r-1) SQTrat SQResíduo QMTrat QMResíduo F trat F0,05 Total tr-1 SQTotal síduo QM QMTrat Ftrat Re síduo GL síduo SQ QMErro GLtrat SQtrat QMtrat Re Re 3 Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Comparação múltipla de médias A análise de variância significativa, nos informa que pelo menos um tratamento aplicado no experimento é significativamente diferente dos demais, entretanto esta análise não nos informa onde está esta diferença. Para verificar as diferenças são usados os testes de comparação entre médias. Alguns desses testes são: Teste t (DMS ou LSD); Teste de Tukey; Teste de Duncan; Teste de Dunnet; Teste de Bonferroni; Teste de Student- Newman-Keuls (SNK); Teste de Scheffé; Teste Scott-Knott, etc Algumas especificidades: Tukey (muito utilizado na literatura compara médias com um único valor de diferença mínima significativa (DMS) e é considerado rigoroso); Duncan (compara médias com diferentes valores de DMS); Dunnet (compara controle com demais tratamentos); Scott-Knott (separa médias em grupos, muito utilizado quando se tem elevado número de comparações por não apresentar ambiguidade) Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Os procedimentos dos testes se baseiam na comparação da diferenças entre médias com o valor de teste que é chamado de diferença mínima significativa (DMS) e que é obtido por meio de valores padronizados associados com informações da análise de variância, por exemplo, no teste de Tukey: r é o número de repetições dos tratamentos, ou seja, r é o número de dados a partir do qual foi obtido o valor da média. q(t,v) é o valor da amplitude total estudentizada, em um nível de significância. Este valor é obtido na tabela de Tukey em função do número de tratamentos envolvidos no experimento (t) e do número de graus de liberdade da fonte de variação Resíduo (GLResíduo), da análise de variância. r síduo QM t v q DMS Re ( , ). Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Amplitude Total Studentizada (q) para uso no teste de Tukey ( = 0,05) K V 2 3 4 5 6 7 8 9 10 12 15 20 1 18,00 27,00 32,80 37,10 40,40 43,10 45,40 47,40 49,10 52,00 55,40 59,60 2 6,09 8,30 9,80 10,90 11,70 12,40 13,00 13,50 14,00 14,70 15,70 16,80 3 4,50 5,91 6,82 7,50 8,04 8,48 8,85 9,18 9,46 9,95 10,50 11,20 4 3,93 5,04 5,76 6,29 6,71 7,05 7,35 7,60 7,83 8,21 8,66 9,23 5 3,64 4,60 5,22 5,67 6,03 6,33 6,58 6,80 6,99 7,32 7,72 8,21 6 3,46 4,34 4,90 5,31 5,63 5,89 6,12 6,32 6,49 6,79 7,14 7,59 7 3,34 4,16 4,68 5,06 5,36 5,61 5,82 6,00 6,16 6,43 6,76 7,17 8 3,26 4,04 4,53 4,89 5,17 5,40 5,60 5,77 5,92 6,18 6,48 6.87 9 3,20 3,95 4,42 4,76 5,02 5,24 5,43 5,60 5,74 5,98 6,28 6,64 10 3,15 3,88 4,33 4,65 4,91 5,12 5,30 5,46 5,60 5,83 6,11 6,47 11 3,11 3,82 4,26 4,57 4,82 5,03 5,20 5,35 5,49 5,71 5,99 6,33 12 3,08 3,77 4,20 4,51 4,75 4,95 5,12 5,27 5,40 5,62 5,88 6,21 13 3,06 3,73 4,15 4,45 4,69 4,88 5,05 5,19 5,32 5,53 5,79 6,11 14 3,03 3,70 4,11 4,41 4,64 4,83 4,99 5,13 5,25 5,46 5,72 6,03 15 3,01 3,67 4,08 4,37 4,60 4,78 4,94 5,08 5,20 5,40 5,65 5,96 16 3,00 3,65 4,05 4,33 4,56 4,74 4,90 5,03 5,15 5,35 5,59 5,90 17 2,98 3,63 4,02 4,30 4,52 4,71 4,86 4,99 5,11 5,31 5,55 5,84 18 2,97 3,61 4,00 4,28 4,49 4,67 4,82 4,96 5,07 5,27 5,50 5,79 19 2,96 3,59 3,98 4,25 4,47 4,65 4,79 4,92 5,04 5,23 5,46 5,75 20 2,95 3,58 3,96 4,23 4,45 4,62 4,77 4,90 5,01 5,20 5,43 5,71 24 2,92 3,53 3,90 4,17 4,37 4,54 4,68 4,81 4,92 5,10 5,32 5,59 30 2,89 3,49 3,84 4,10 4,30 4,46 4,60 4,72 4,83 5,00 5,21 5,48 60 2,83 3,40 3,74 3,98 4,16 4,31 4,44 4,55 4,65 4,81 5,00 5,24 120 2,80 3,36 3,69 3,92 4,10 4,24 4,36 4,48 4,56 4,72 4,90 5,13 K = Número de tratamentos v = Graus de liberdade do resíduo Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Procedimento adotado para verificar se existem diferenças significativas entre os tratamentos: • Calcula-se as médias dos tratamento; • Ordena-se estas médias (ordem crescente ou decrescente de valores); • Verifica-se se a diferença entre duas médias é inferior a DMS (), em caso afirmativo, conclui-se que não há diferença estatística entre os tratamento. • Se a diferença entre duas médias for superior a DMS então existe diferença estatística entre os tratamentos. • Geralmente, adota-se letras na frente das médias para diferencia-las, ou seja, médias com letras iguais indicam que não existe diferença significativa entre os tratamentos, para o nível de significância adotado e, consequentemente, médias com letras diferentes indicam a existência de diferença significativa entre os tratamentos. Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães EXEMPLO 1: Um experimento em DIC, foi conduzido com o objetivo de verificar o efeito de 5 tratamentos (T1, T2, T3, T4, T5), sobre a área de cicatrização (mm2) de animais submetido a cirurgia. Foram utilizadas 3 repetições (animais) para cada tratamento. Os dados obtidos no experimento são apresentados a seguir: Repetições Tratamento 1 2 3 T1 21 22 22 T2 17 22 19 T3 22 22 20 T4 15 13 16 T5 28 25 24 Verificar se existe diferença significativa para a área de cicatrização dos tratamentos. Use significância de 5%. Caso exista a diferença, utilize o teste de Tukey para mostrar essas diferenças. Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães EXEMPLO 2. Em um experimento composto por 5 tratamentos e 6 repetições, cuja montagem seguiu um DIC, obteve-se análise de variância significativa, conforme mostra o quadro abaixo: FV GL SQ QM F Ftab TRAT 4 1,4220 0,3555 21,68 2,759 RESÍDUO 25 0,4100 0,0164 TOTAL 29 1,8320 As médias dos tratamentos foram: Y 1 = 1,65; Y 2 = 1,30; Y 3 = 1,00; Y 4 = 1,15; Y 5 = 1,20 Utilize o teste de Tukey para verificar a ocorrência das diferenças significativas entre as médias de tratamentos. 4 Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães EXPERIMENTO DE DOIS CRITÉRIO - DELINEAMENTO EM BLOCOS CASUALIZADO • São considerados os princípios básicos de repetição, casualização e um controle local (linha ou coluna do experimento) • Próprio para as situações onde existe heterogeneidade do material experimental ou do ambiente onde se realiza o ensaio • exemplo: diferença de temperatura; diferença em fertilidade; diferença genética; diferença entre idades; diferença social, etc.. • Podemos associar este experimento com a ideia de amostras estratificadas, vista na estatística básica. Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães O modelo matemático ij j i ij b t Y Yij é o valor da parcela que recebeu o tratamento i no bloco j; é a média geral do experimento; ti é o efeito do tratamento i; bj é o efeito do bloco j e ij é o erro da parcela que recebeu o tratamento i no bloco j. O objetivo da blocagem é manter a variabilidade entre parcelas, dentro dos blocos, tão pequena quanto possível, contribuindo para a redução da fonte de variação residual. Estamos introduzindo mais uma fonte de variação na análise de variância, a fonte bloco. Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães O planejamento Experimental Suponha um DBC com 5 tratamentos (A, B, C, D, E) e 4 blocos (I, II, III, IV). Como exemplo da disposição das parcelas no experimento, temos: Bloco I B A D C E Bloco II E D A B C Bloco III A C B E D Bloco IV B D C A E Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Calculo das somas de quadrados (SQ) b t Y C C b T SQTrat ij i . ) ( 2 2 C Y SQTotal ij 2 C t B SQBlo j 2 cos SQResíduo = SQTotal – SQTrat – SQBlocos Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Quadro de análise de variância FV GL SQ QM F Bloco b-1 SQBloco QMBloco FBloco Trat t-1 SQTrat QMTrat FTrat Resíduo (t-1).(b-1) SQRes QMRes Total tb-1 SQTotal Lembre-se de que os quadrados médios são obtidos dividindo-se cada soma de quadrados por seu respectivo grau de liberdade; e que os F são obtidos dividindo-se os quadrados médios da fonte de variação pelo quadrado médio do resíduo. Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães As hipóteses na análise de variância são: Ho: t1= t2 = ... = tt H1: ti tj ( no mínimo para um par) Ho : não existe efeito de blocos H1 : pelo um dos blocos apresenta-se de forma diferenciada sobre a variável resposta 5 Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães EXEMPLO 3: Um experimento foi realizado com o objetivo de estudar o efeito 4 tipos de dietas alimentar de um determinado animal na conversão alimentar. O delineamento experimental foi em blocos casualizados com 4 tratamentos (dietas) e 5 blocos (repetições). TRATAMENTOS Blocos A B C D I 2,20 1,90 2,50 2,10 II 2,50 2,30 2,90 2,40 III 2,30 1,70 2,50 1,90 IV 2,20 1,60 2,40 2,20 V 2,10 1,60 2,30 2,10 Verifique se existe diferença entre tratamentos. Use nível de significância de 5%. Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães EXPERIMENTOS EM ESQUEMA FATORIAL • Nas experiências científicas, podemos estar interessados no estudo da influência de dois ou mais fatores sobre uma mesma variável resposta. • Podemos estar interessado também em verificar se dois ou mais fatores controlados pelo pesquisador estão exercendo, conjuntamente, algum tipo de influência sobre a variável resposta. • Uma forma de análise dessas interações é o esquema de análise conhecido como fatorial. • A grande vantagem da utilização do esquema fatorial é a possibilidade de analisar isoladamente os fatores e também simultânea desses fatores, reduzindo o número de análises. Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães • Nos experimentos em esquema fatorial pode-se utilizar os delineamentos inteiramente ao acaso (DIC), os delineamentos em blocos casualizados (DBC) e os quadrados latinos (DQL) • Vale ressaltar que o esquema fatorial e o esquema em parcela subdividida (que não será abordado neste curso) são apenas esquemas de análise, não se constituindo em delineamentos experimentais. • O modelo matemático de análise de variância no esquema fatorial, para um experimento com 2 fatores (A, B) em DIC é dado por: ijk ij j i ijk ab b a Y . ) ( em que: ai é o efeito do fator A; bj é o efeito do fator B; (ab)ij é o efeito da interação entre os fatores A e B Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães • As somas de quadrados são dadas por: número de repetições r número de níveis do fator que a número de níveis do fator A b em abr Y C C Y SQTotal ijk ijk ; ; : ) ( 2 2 B é o total do fator A no nível i que : T em C br T SQA i A Ai 2 Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães é o total do fator B no nível j que: T em C ar T SQB j B Bi 2 C r Y SQTrat SQB SQA SQTrat SQAxB ij 2 Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães SQResíduo = SQTotal – SQA – SQB - SQAxB • A utilização de quadros auxiliares, tornam mais simples os cálculos das somas de quadrados. • O esquema do quadro de análise de variância para um fatorial com dois fatores é apresentado a seguir: FV GL SQ QM F A a-1 SQA QMA FA B b-1 SQB QMB FB AxB (a-1).(b-1) SQAxB QMAxB FAxB Resíduo ab(r-1) SQResiduo QMResiduo TOTAL Abr-1 SQTotal 6 Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães OBSERVAÇÕES: • Se as interações apresentarem significância, deve-se proceder ao desdobramento das interações e posterior aplicação dos testes de médias. Este procedimento será mostrado no desenvolvimento do exemplo. • Se a interação for não significativa, mas os fatores são significativos, aplica-se os testes de médias para cada fator isoladamente • Se toda a análise mostrar-se não significativa, conclui-se que não existe diferença entre os tratamentos aplicados no experimento e a análise termina neste ponto • Note que o grau de complexidade da análise será cada vez maior com a adição de novos fatores na análise Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães EXEMPLO 4. Um experimento foi conduzido em DIC fatorial, para verificar o tempo de recuperação (dias) de 4 raças de animais submetidos a 3 tipos medicamentos. Os resultados foram: Y Y Y Y Y ij j i ij b t Y b t Y C C b T SQTrat ij i . ) ( 2 2 C Y SQTotal ij 2 C t B SQBlo j 2 cos - r é o número de repetições dos tratamentos, ou seja, r é o número de dados a partir do qual foi obtido o valor da média. - q(t,v) é o valor da amplitude total estudentizada, em um nível de significância. Este valor é obtido na tabela de Tukey em função do número de tratamentos envolvidos no experimento e do número de graus de liberdade (v) da fonte de variação Resíd Amplitude Total Studentizada (q) para uso no teste de Tukey ( = 0,05) K = Número de tratamentos v = Graus de liberdade do resíduo O procedimento adotado para a verificação de diferenças significativas é semelhante àquele descrito no TESTE t. EXEMPLO 3. Para os dados do EXEMPLO 1, aplique o Teste de Tukey e faça as conclusões. Use significância de 5%. EXEMPLO 4. Em um experimento composto por 5 tratamentos e 6 repetições, cuja montagem seguiu um DIC, obteve-se análise de variância significativa, conforme mostra FV GL SQ QM F TRAT 4 1,4220 0,3555 21,68 RESÍDUO 25 0,4100 0,0164 TOTAL 29 1,8320 As médias dos tratamentos foram: 1 = 1,65; 2 = 1,30; 3 = 1,00; 4 = 1,15; 5 = 1,20 Utilize o teste de Tukey para verificar a ocorrência das diferenças significativas entre as médias de tratamentos. OBS: Se as médias foram obtidas a partir de tratamentos com diferentes números de repetições, deve-se calcular um para cada par de comparação com diferentes números de BLOCOS AO ACASO (DBC) Neste tipo de delineamento são considerados os princípios básicos de repetição, casualização e controle local em um sentido ( linha ou coluna do experimento). É um delineamento próprio O objetivo da blocagem é manter a variabilidade entre parcelas, dentro dos blocos, tão pequena quanto possível, contribuindo para a redução da fonte de variação residual. O modelo matemático para este tipo de delineamento é dado por: em que: bj é o efeito do bloco j. Verifica-se pelo modelo matemático que estamos introduzindo mais uma fonte de variação na análise de variância, a fonte bloco. -O planejamento Experimental Suponha um DBC com 5 tratamentos (A, B, C, D, E) e 4 blocos (I, II, III, IV). Como exemplo da disposição das parcelas no experimento, temos: Bloco I B A D C E Bloco II E D A B C Bloco III A C B E D Bloco IV B D C A E -Calculo das somas de quadrados (SQ) a)Soma de quadrados de tratamentos (SQTrat) a)Soma de quadrados total (SQTotal) a)Soma de quadrados de Blocos (SQBlocos) a)Soma de quadrados de resíduo (SQResíduo) SQResíduo = SQTotal – SQTrat – SQBlocos -Quadro de análise de variância FV GL SQ QM F Bloco b-1 SQBloco QMBloco FBloco Trat t-1 SQTrat QMTrat F REPETIÇÃO MEDIC RAÇA 1 2 3 Total M1 A 54 52 50 156 B 46 47 49 142 C 55 54 54 163 D 51 55 48 154 M2 A 59 61 57 177 B 61 55 58 174 C 59 60 62 181 D 52 51 52 155 M3 A 59 62 64 185 B 63 58 59 180 C 63 61 58 182 D 59 59 60 178 Proceder à analise de variância e aos testes de médias, com significância de 5% Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães A resolução desse exemplo será feita em um programa computacional. Discutiremos os resultados da análise. O quadro anova mostra que ocorre uma interação significativa entre medicamento e raça, ou seja, um fator interfere nos resultados de outro fator. Fazer o desdobramento das interações e aplicar o teste de Tukey para esse desdobramento Não vamos analisar os fatores isoladamente. Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Para a raça A existe diferença significativa entre os medicamentos Para a raça B existe diferença significativa entre os medicamentos Para a raça C existe diferença significativa entre os medicamentos Para a raça D existe diferença significativa entre os medicamentos Aplicar o teste de Tukey para analisar, dentro de cada raça, onde estão as diferenças de tratamentos Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Diferença entre raças para M1 Diferença entre raças para M2 Não tem diferença entre raças para M3 7 Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Quadro resumo do teste de Tukey Raça Medicamento Média M1 M2 M3 A 52,00aAB 59,00bB 61,67bA 57,55 B 47,33aA 58,00bB 60,00bA 55,11 C 54,00aB 60,33bB 60,67bA 58,44 D 51,33aAB 51,66aA 59,33bA 54,11 Média 51,25 57,25 60,42 Médias seguidas por letras minúsculas iguais nas linhas e maiúsculas iguais nas colunas não diferem entre si, pelo teste de Tukey com 5% de significância Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães ANÁLISE DE CORRELAÇÃO Interesse em mensurar a “força” da associação entre as variáveis (geralmente através do cálculo de algum coeficiente). ANÁLISE DE REGRESSÃO Interesse em realizar previsões sobre os valores da variável dependente (resposta) a partir dos valores das variáveis independentes (preditoras). Construir um modelo estatístico (modelo de regressão): uma equação que mostre o relacionamento entre as variáveis. CORRELAÇÃO E REGRESSÃO LINEAR Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Classificação dos modelos Análise de Correlação Análise de Regressão Regressão Linear Simples Regressão Linear Múltipla Regressão Não Linear Exponencial Logística Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Duas variáveis quantitativas • temos duas variáveis quantitativas • Como medir a associação entre essas variáveis? • O coeficiente utilizado é o coeficiente de correlação de Pearson (r) COEFICIENTES DE CORRELAÇÃO Obs: Existem outros coeficientes na estatística para medir a força de associação entre duas variáveis, como Coeficiente de Correlação de Spearman, Coeficiente de Contingência, etc.. Não abordaremos estes coeficientes neste curso. Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Correlação Linear Positiva Correlação Linear Negativa SEM correlação Não linear Correlação linear simples Diagrama de dispersão indica a possibilidade de correlação linear. 8 Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Coeficiente de correlação linear de Pearson mede a força e a direção do relacionamento LINEAR entre as duas variáveis: -1,00 < r < 1,00 Quanto mais próximo de -1 ou de +1 maior será a associação ou a relação linear entre as variáveis analisadas n y y n x x n y x y x i i i i i i i i r 2 2 2 2 ) ( ) ( Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães r = -1 correlação inversa (negativa) perfeita, r = +1 correlação direta perfeita (positiva) r = 0 não existe relação linear entre X e Y. valor positivo de r aumento X Y também aumentará valor negativo de r aumento X Y decrescerá. Pode-se, de uma forma geral, dizer que se: -1,00 < r < -0,90 ou 0,90 < r < 1,00 a relação entre X e Y é forte -0,90 < r < -0,70 ou 0,70 < r < 0,90 a relação entre X e Y é moderada -0,70 < r < 0,70 a relação entre X e Y é fraca r = 0 relação linear inexistente Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães • Para verificar a significância do r ( testar a hipótese que, na população, o coeficiente de correlação é zero) a distribuição utilizada é a distribuição t – Student com (n–2) graus de liberdade 2 1 2 r n r t Obs: Se pretendemos verificar se o coeficiente de correlação é estatisticamente diferente de uma constante, com essa constante diferente de zero, devemos aplicar outro teste (Spiegel (1993) ou Freund & Simon (2000)) Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Exemplo 1. Verificar se existe correlação entre peso do animal (kg) e percentagem de gordura (%). Os resultados foram: PESO 40 45 50 55 60 GORD 6,0 7,7 7,5 8,0 9,3 Exemplo 2. Verificar se existe relação entre idade de cães (meses) e reação ao estimulo (miléssimo de segundos) idade 2 4 5 6 8 11 reação 18 12 10 8 7 5 Exemplo 3. Verificar se existe relação entre idade de pessoas adultas (anos) e renda familiar (s.m) X(idade) 25 30 35 40 45 50 Y (renda) 5 3 8 4 4 7 Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães REGRESSÃO LINEAR SIMPLES • Objetivo: obter uma equação matemática que expresse o relacionamento entre a variável dependente (resposta) e as independentes (explicativas, preditoras). • Possibilita a realização de previsões: – Como as mudanças nos valores das variáveis independente influenciam a variável dependente. – Tomada de decisões. • Análise de regressão simples: apenas duas variáveis. • Análise de regressão múltipla: uma dependente e mais de uma independente. Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães O modelo geral de regressão linear simples i i i e X Y • Melhor reta passar o “mais perto possível” dos pontos experimentais • Minimizar a distância global dos pontos em relação a reta • A equação estimada será dada por: i i i e bx a Y ^ • ei são os “erros” ou residuos (yi - ) ^ iy 9 Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães • Geralmente se utiliza o Método dos Mínimos Quadrados (MMQ) para a obtenção das estimativas dos parâmetros da equação • MMQ determinar a e b para o menor ei 2 • Para minimizar a ei 2 temos: a) Derivadas parciais em relação a a e b se anulam b) Determinante da matriz de derivadas parciais seja maior que zero. Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães • Então as estimativas de a e b serão: 2 2 [( )( )] ( ) ( ) i i i i i i i i i X Y X Y X X Y Y SPXY n b SQX X X X X n 1[ ] i i a Y b X Y bX n 2 Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Coeficiente de determinação • É um coeficiente que usamos em associação a reta de regressão para qualifica-la, ou seja, para informar o quanto os valores de Y (variável dependente) podem ser explicados por meio de X (varável independente) utilizando a equação ajustada • Esse coeficiente quanto da variação total que pode ser explicada pela reta ajustada total Variação licada Variação R r exp 2 2 Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães • Pode-se obter o coeficiente de determinação elevando-se o valor do coeficiente de correlação ao quadrado • O coeficiente de determinação pode ser expresso em % • 0 < r2 < 1 ou 0% < r2 < 100% • no caso da regressão linear simples: se r é significativo, então r2 também é significativo e o modelo é, portanto, adequado para se realizar estimativas. n y y n x x n y x y x r R r i i i i i i i i 2 2 2 2 2 2 2 2 . Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Obs: outras inferências podem ser feitas a partir dos modelos de regressão, entretanto não abordaremos estas inferências neste curso. Pode-se fazer inferências como: a) Análise de Variâncias para o modelo verificar significância do modelo; b) Cálculo o coeficiente de variação indicador da qualidade do ajuste c) Intervalos de confiança para os parâmetros do modelo estimar os limites inferiores e superiores de a e b do modelo com determinada confiança d) Teste de hipóteses para a e b verficar se são diferentes de 0 e) Análise dos resíduos verificar se o modelo atende as pressuposições para ser utilizado. Estatística Medicina Veterinária Prof. Dr. Ednaldo Carvalho Guimarães Exemplo 1. Ajustar o modelo de regressão linear para a % de gordura (Y) em função do Peso (X). Peso 40 45 50 55 60 Gordura 6,0 7,7 7,5 8,0 9,3 Exemplo 2. Ajustar o modelo de regressão linear para o Tempo de reação (Y) em função Idade (X). idade 2 4 5 6 8 11 reação 18 12 10 8 7 5