·

Cursos Gerais ·

Cálculo 1

Send your question to AI and receive an answer instantly

Ask Question

Preview text

ANOVA Análise de Variância Profª Berenice de Oliveira Bona TESTES DE ANOVA COMO INTERPRETAR UMA ANÁLISE DE VARIÂNCIA ANOVA A ANOVA ou Análise de Variância é um procedimento usado para comparar a distribuição de três ou mais grupos em amostras independentes A análise de variância é também uma forma de resumir um modelo de regressão linear através da decomposição da soma dos quadrados para cada fonte de variação no modelo e utilizando o teste F testar a hipótese de que qualquer fonte de variação no modelo é igual a zero CONTEXTUALIZANDO UMA APLICAÇÃO DA ANOVA Suponha um curso preparatório para o ENEM que tenha em seu corpo docente três professores de matemática que são responsáveis por diferentes turmas de alunos A direção da escola suspeita que a variação do desempenho dos alunos nas provas de matemática do ENEM pode ser explicada pelo trabalho desenvolvido pelos seus professores Sendo assim a direção resolveu verificar as notas na prova de matemática dos alunos de cada professor e calculou a média das notas de cada turma MÉDIA DA NOTA DOS ALUNOS 7845 MÉDIA DA NOTA DOS ALUNOS 8324 MÉDIA DA NOTA DOS ALUNOS 8042 Será que essa informação é suficiente para afirmar que o desempenho dos alunos de cada professor é realmente diferente E se um dos professores tiver em sua turma um aluno que não se preparou e errou quase todas as questões Esse aluno não seria responsável por ter diminuído a média do grupo de alunos desse professor Para verificar então se realmente o desempenho dos alunos variou de acordo com o professor se faz necessário a utilização de teste estatístico que além de considerar a média das notas leva também em conta a variação das notas dentro de cada turma A ANÁLISE DE VARIÂNCIA Um dos objetivos da aplicação da ANOVA é o de realizar teste estatístico para verificar se há diferença entre distribuição de uma medida entre três ou mais grupos Em nosso exemplo podemos definir as hipóteses do teste como Ho Não existe diferença entre o desempenho das notas dos alunos de cada professor H1 Há pelo menos um professor com alunos com desempenho diferente Mas o que significa diferença entre as distribuições Qual a relação entre as distribuições das notas dos alunos de cada professor e as hipóteses testadas pela análise de variância Caso os três grupos de alunos apresentem mesma variabilidade e mesma média de desempenho suas distribuições tendem a se sobrepor confirmando a hipótese de que não existe diferença entre o desempenho das notas dos alunos de cada professor Caso contrário ou seja quando os grupos apresentam mesma variabilidade interna e médias de desempenho diferentes as distribuições de distanciam quanto mais as médias de desempenho se diferenciam DISTRIBUIÇÃO DAS NOTAS DOS ALUNOS SUPONDO QUE NÃO HÁ DIFERENÇA ENTRE AS TURMAS T1 T2 E T3 MÉDIA T1 MÉDIA T2 MÉDIA T3 NOTAS DISTRIBUIÇÃO DAS NOTAS DOS ALUNOS SUPONDO DIFERENÇA ENTRE AS TURMAS T1 T2 E T3 MÉDIA T1 MÉDIA T2 MÉDIA T3 NOTAS O MODELO ANOVA E SEUS PRESSUPOSTOS Para aplicação da análise de variância são necessárias algumas suposições sendo elas 1 As observações são independentes ou seja cada elemento amostral aluno deve ser independente 2 Os grupos comparados apresentam a mesma variância 3 Os erros são independentes e provenientes de uma distribuição normal com média igual a zero e variância constante Cabe ressaltar que os grupos de alunos de cada professor podem ser vistos como três níveis de um mesmo fator sendo que o objetivo é saber se o fator professor exerce alguma influência na variação do desempenho das notas de matemática QUAIS SÃO OS RESULTADOS GERADOS PELA ANÁLISE DE VARIÂNCIA As informações geradas na análise de variância estão resumidas na tabela abaixo Nela são apresentados os graus de liberdade a soma de quadrados o quadrado médio a estatística F e o valorp Os graus de liberdade são calculados com base no número de professores grupos e no número total de alunos A soma de quadrados mede a variação dos dados A soma de quadrados total mede a variação total nos dados a soma de quadrados dos tratamentos mede a variação entre os professores de cada turma e a soma dos quadrados dos resíduos mede a variação dentro de cada turma ou seja mede a variação dos alunos de cada professor O quadrado médio é a razão entre a soma de quadrados e os graus de liberdade e a estatística F pode ser encontrada na tabela de distribuição F de Fisher Snedecor COMO INTERPRETAR OS RESULTADOS DA ANOVA Tomando como base a tabela anterior podese concluir que existe pelo menos dois professores com alunos com desempenho significativamente diferentes ao avaliar o valorp 0010 menor que o nível de significância estabelecido de 005 A conclusão da ANOVA pode ser feita também com base na Estatística F A estatística F tem distribuição F de FisherSnedecor com k1 e nk graus de liberdade onde k é o número de grupos k 3 e n é o número de observações n 36 Neste caso fictício obteríamos F 332 e como a Estatística F 525 foi maior que o F tabelado 332 concluise que existe pelo menos dois professores com alunos com desempenho significativamente diferentes Mas como saber quais professores com alunos com desempenhos diferentes diferem entre si A forma de averiguar isto é complementar a ANOVA através da utilização do teste de comparação múltipla como por exemplo o teste de Tukey Exercício Um professor deseja testar três métodos de ensino diferentes I II e III Para isso escolhe aleatoriamente três grupos de 5 alunos e cada grupo é ensinado por um método diferente Dáse então uma mesma prova a todos os alunos os resultados notas constam na tabela abaixo Determine se há diferença significativa entre os três métodos ao nível de significância de 5 Método I 75 62 71 58 73 Método II 81 85 68 92 90 Método III 73 79 60 75 81 a Determine a Produção média para os diferentes tratamentos b Média global para todos os tratamentos c Variação total Variação total STQ Σc j1 Σnj i1 xij X2 75 748672 62 748672 71 748672 58 748672 73 748672 81 748672 85 748672 68 748672 92 748672 90 748672 73 748672 79 748672 60 748672 75 748672 81 748672 1457733 D Variação entre os tratamentos Variação e Média Entre Grupos E Variação interior aos tratamentos f Qual a conclusão do teste ao nível de significância de 5 Explique Referências httpswwwprofcremonacommateriaismaterialestatisticametod osestatisticosanovatukey Revisando Determinar o intervalo de confiança para as pessoas de uma localidade as quais possuem em uma amostra de 40 pessoas o peso médio de 60 kg com desvio padrão de 3 kg Supor nível de confiança igual a 95 Queremos determinar PX c µ X c 95 Divide por 2 porque a tabela mostra metade da área Z 952 0952 04750 que corresponde a Z 196 então c z σn C 196 340 093 PX c µ X c 95 P60 093 µ 60 093 95 O intervalo de confiança é IC 5907 µ 6093 95 Isto significa que há 95 de chance de µ estar entre 5907 e 6093 kg ANOVA Profª Berenice de Oliveira Bona empty Determinar o intervalo de confiança para as pessoas de uma localidade das quais possuem altura média de 168 centímetros com desvio padrão de 20 cm Supor uma amostra de 272 pessoas e nível de significância igual a 90 Queremos determinar PX c μ X c 90 Divide por 2 porque a tabela mostra metade da área Z 902 0902 045 que corresponde a Z 165 então c z σn C 165 20272 2 PX c μ X c 90 P168 2 μ 168 2 90 O intervalo de confiança é IC 166 μ 170 90 Isto significa que há 90 de chance de μ estar entre 5878 e 6122 kg 4 Qual é o valor do desvio padrão e da variância do conjunto de valores seguintes 40 45 48 52 54 62 70 Desvio padrão S Σxi²n Σxin² xi xi² Graus de Liberdade gl n 1 14 e 𝛂 005 Tabela t 2145 a tcalculado 1398 e ttabelado 2145 Teste de hipóteses É uma técnica para se fazer inferência estatística Uma hipótese estatística é portanto uma suposição quanto ao valor de um parâmetro populacional O teste de hipóteses é uma técnica que nos permite aceitar ou rejeitar a hipótese estatística a partir dos dados da amostra dessa população Hipótese nula e hipótese alternativa Erro do tipo 1 e do tipo 2 httpswwwyoutubecomwatchvQsAniUXz0QA Erros do tipo 1 e do tipo 2 Temos dois tipos possíveis de erro representados no quadro a seguir Aceitase a hipótese nula Rejeitase a hipótese nula Ho é verdadeira Decisão foi correta Erro do tipo 1 H1 é falsa Erro do tipo 2 Decisão foi correta Teste para médias Um ótimo estimador para a média populacional μ é a média amostral X A distribuição amostral das médias é normal com Zr X μσn Zr teste Z de uma amostra σ desvio padrão n número de elementos da amostra X média amostral μ média populacional Exemplo 1 Suponha uma amostra aleatória de 100 elementos com média igual a X70 retirados de uma população normal com desvio padrão σ5 Considerando um nível de significância de 5 teste a hipótese de que a média populacional μ seja igual a 69 Suponha a hipótese alternativa μ 69 Ho μ68 H1 μ 69 Zr X μ σ n 70 69 5 100 15 110 2 Referências httpswwwyoutubecomwatchvQsAniUXz0QA httpseducacaouolcombrplanosdeaulamediomatematicaqual amelhorapostahtm