·
Engenharia de Computação ·
Probabilidade e Estatística 1
Envie sua pergunta para a IA e receba a resposta na hora
Recomendado para você
58
Inferência Estatística e Intervalo de Confiança
Probabilidade e Estatística 1
UFAL
3
Exercícios de Probabilidade
Probabilidade e Estatística 1
UFAL
86
Testes de Hipóteses: Inferência Estatística e Metodologia
Probabilidade e Estatística 1
UFAL
3
Lista de Exercícios sobre Variáveis Aleatórias Discretas
Probabilidade e Estatística 1
UFAL
20
Combinação Linear de Distribuições Normais
Probabilidade e Estatística 1
UFAL
42
Variáveis Aleatórias em Probabilidade e Estatística
Probabilidade e Estatística 1
UFAL
5
Lista de Exercícios sobre Distribuições Continuas: Normal e Exponencial
Probabilidade e Estatística 1
UFAL
60
Variáveis Aleatórias Contínuas e Distribuição Normal
Probabilidade e Estatística 1
UFAL
44
Variáveis Aleatórias e Distribuições Discretas em Probabilidade e Estatística
Probabilidade e Estatística 1
UFAL
83
Introdução à Probabilidade e seus Conceitos Básicos
Probabilidade e Estatística 1
UFAL
Texto de pré-visualização
UNIVERSIDADE FEDERAL DE ALAGOAS Instituto de Computação PROBABILIDADE E ESTATÍSTICA INFERÊNCIA ESTATÍSTICA Análise de Variância PROFESSOR PETRUCIO A MEDEIROS BARROS TURMA CIÊNCIA DA COMPUTAÇÃO ENG DA COMPUTAÇÃO ANÁLISE DE VARIÂNCIA Análise da Variância ANOVA é um método para testar a igualdade de três ou mais médias populacionais baseado na análise das variâncias amostrais Os dados amostrais são separados em grupos segundo uma característica fator Fator ou tratamento é uma característica que permite distinguir diferentes populações umas das outras Cada fator contém dois ou mais grupos classificações A análise de variância é utilizada quando se quer decidir se as diferenças amostrais observadas são reais causadas por diferenças significativas nas populações observadas ou casuais decorrentes da mera variabilidade amostral Parte do pressuposto que o acaso só produz pequenos desvios sendo as grandes diferenças geradas por causas reais ANÁLISE DE VARIÂNCIA Os pressupostos básicos da análise de variância são As amostras são aleatórias e independentes As populações têm distribuição normal e As variâncias populacionais são iguais ANÁLISE DE VARIÂNCIA Hipóteses do ANOVA de um Fator HIPÓTESE NULA a média de todas as populações são iguais ou seja o tratamento fator não tem efeito nenhuma variação em média entre os grupos HIPÓTESE ALTERNATIVA nem todas as médias populacionais são iguais ou seja Pelo menos uma média é diferente isto é existe efeito do tratamento Não quer dizer que todas as médias são diferentes alguns pares podem ser iguais ANÁLISE DE VARIÂNCIA Hipóteses do ANOVA de um Fator Todas a médias são iguais Ho é verdadeira Sem efeito do tratamento ANÁLISE DE VARIÂNCIA Hipóteses do ANOVA de um Fator H0 μ1 μ2 μ3 μk H1 Nem todos os μk são iguais Ao menos uma média é diferente H0 REJEITADO existe efeito do tratamento ANÁLISE DE VARIÂNCIA ANOVA de um Fator ANOVA com Fator Duplo ANÁLISE DE VARIÂNCIA ANOVA de um Fator Exemplo O número de frutos atacados depende do local da planta ANÁLISE DE VARIÂNCIA ANOVA de um Fator Exemplo O número de frutos atacados depende do local da planta ANÁLISE DE VARIÂNCIA Tabela Anova para k amostras tratamentos ANÁLISE DE VARIÂNCIA Variação Total SQ total Soma Quadrados Total SQtotal Soma de Quadrados Total ANÁLISE DE VARIÂNCIA Variação ENTRE amostras SQ entre Soma Quadrados entre Tratamentos QMentre Variância entre os Tratamentos ANÁLISE DE VARIÂNCIA Variação DENTRO das amostras SQ dentro Soma Quadrados dentro das Amostras QMdentro Variância dentro das Amostras ANÁLISE DE VARIÂNCIA Tabela ANOVA de 1 fator ANÁLISE DE VARIÂNCIA Tabela ANOVA de 1 fator H0 μ1 μ2 μk H1 pelo menos uma das médias é diferente Estátística de teste F S² entre S² dentro graus de liberdade Numerador gl1 k 1 Denominador gl2 n k O valor crítico é obtido da tabela de distribuição F Rejete H0 se F Fc ANÁLISE DE VARIÂNCIA ANOVA de um Fator Voltando ao Exemplo O número de frutos atacados depende do local da planta SQ total 11 5375² 8 5375² 4 5375² 2016250 SQ dentro 11 85² 8 85² 4 23333² 876667 SQ entre 6 85 5375² 6 55 5375² 6 51667 5375² 6 23333 5375² 1144583 Fonte da variação SQ gl MQ F F critico Entre grupos 1144583 3 381528 875998 310 Dentro dos grupos 876667 20 43583 Total 2016250 23 Como Fcalc F critico rejeitar H0 e assumir H1 ou seja que existe diferenças entre os grupos tratamentos Distribuição F de Snedecor a 5 p005 389 310 ANÁLISE DE VARIÂNCIA ANOVA de um Fator Voltando ao Exemplo O número de frutos atacados depende do local da planta Hipóteses H0 μ1 μ2 μ3 μ4 μ H1 pelo menos um μk é diferente dos demais Fonte da variação SQ gl MQ F F crítico Entre grupos 1144583 3 381528 875398 310 Dentro dos grupos 876667 20 43583 Total 2016250 23 Como Pr F rejeitar H0 ou seja que existe diferenças entre os grupos tratamentos ANÁLISE DE VARIÂNCIA ANOVA de um Fator Teste de Tukey Para os valores de p α podemos afirmar que as médias diferem ao nível de significância de 5 α 005 Quando p α não é possível afirmar que as médias diferem Diferenças acentuadas entre a borda e o centro Exemplo 1 Foram selecionados vários automóveis de 3 modelos diferentes e neles colocados a mesma quantidade de gasolina Abaixo a quilometragem obtida pelos automóveis Existe diferença entre distância média percorrida pelos diferentes tipos de automóveis Faça o teste com nível de significância de 005 1 Fator tratamento tipo de automóvel Níveis modelo 1 modelo 2 modelo 3 KM Modelos 254 Model01 263 Model01 241 Model01 237 Model01 251 Model01 234 Modelo2 218 Modelo2 235 Modelo2 227 Modelo2 216 Modelo2 200 Modelo3 222 Modelo3 197 Modelo3 206 Modelo3 204 Modelo3 Média 2492 2260 2058 x 227 n 15 k 3 SQE 5 2492 227² 5 226 227² 5 2508 227² 471640 SQD 254 2492² 263 2492² 204 2058² 111960 SQtotal 254 227² 263 227² 204 227² 583600 Fonte da variação SQ gl Variância Razo F Entre grupos 471640 2 235820 25275 389 Dentro dos grupos 111960 12 9330 Total 583600 14 ANÁLISE DE VARIÂNCIA Exemplo 1 Foram selecionados vários automóveis de 3 modelos diferentes e neles colocados a mesma quantidade de gasolina Abaixo a quilometragem obtida pelos automóveis Existe diferença entre de distância média percorrida pelos diferentes tipos de automóveis Faça o teste com nível de significância de 005 1 Fator tratamento tipo de automóvel Níveis modelo 1 modelo 2 modelo 3 Modelo 3 Modelo 2 Modelo 1 200 234 254 222 218 263 197 235 241 206 227 237 204 216 251 2058 2260 2492 Média F crítico F MQ gl SQ Fonte da variação 389 235820 25275 2 471640 Entre grupos 9330 12 111960 Dentro dos grupos 14 583600 Total ANÁLISE DE VARIÂNCIA Exemplo 1 Foram selecionados 3 modelos diferentes de carros e neles colocados a mesma quantidade de gasolina Abaixo a quilometragem obtida pelos carros Existe diferença entre distância média percorrida pelos diferentes tipos de carro Faça o teste com nível de significância de 005 1 Fator tratamento tipo de automóvel Níveis modelo 1 modelo 2 modelo 3 Modelo 1 Modelo 2 Modelo 3 254 234 200 263 218 222 241 235 197 237 227 206 251 216 204 Média 2492 2260 2058 x 2270 n 15 k 3 Distribuição F de Snedecor a 5 p005 ANÁLISE DE VARIÂNCIA Comparações Múltiplas Quando na ANOVA aceitase H0 a análise é finalizada porque não se identificou diferença estatística entre os tratamentos Todavia quando H0 for rejeitada devese conhecer quais das médias dos tratamentos diferem entre si Nesse caso devese efetuar um teste para comparações múltiplas Um teste comumente utilizado é o Teste de Tukey Passos para fazer as comparações múltiplas Calcular as médias dos tratamentos Ordenar as médias calculadas Buscar o valor na tabela t e calcular a DMS Comparar as diferenças das médias com o valor da Diferença Mínima Significativa DMS Comparações Múltiplas Teste de Tukey Dados balanceados mesmo número de observações para os tratamentos Duas médias são estatisticamente diferentes se a diferença das médias amostrais em valor absoluto for superior a DMS Diferença Mínima Significativa DMS qααNa 2 QMErro n Sendo n número de observações qααNa é um valor tabelado Na são os graus de liberdade associados a estimativa s²QMErro e a o número de tratamentos Caso ȳi ȳj DMS as médias comparadas diferem entre si ao nível de significância ANÁLISE DE VARIÂNCIA Voltando para o Exemplo 1 Foram selecionados vários automóveis de 3 modelos diferentes e neles colocados a mesma quantidade de gasolina Abaixo a quilometragem obtida pelos automóveis Existe diferença entre de distância média percorrida pelos diferentes tipos de automóveis Faça o teste com nível de significância de 005 1 Fator tratamento tipo de automóvel Níveis modelo 1 modelo 2 modelo 3 DMS 389 933 5 1680 Média 1 Média 2 2492 2260 232 DMS Média 1 Média 3 2492 2058 438 DMS Média 2 Média 3 2260 2058 202 DMS Observando os resultados obtidos pelo teste de Tukey ao nível de 5 de significância verificase que há evidências de diferenças de consumo entre os três modelos de automóveis ANÁLISE DE VARIÂNCIA Voltando para o Exemplo 1 Foram selecionados vários automóveis de 3 modelos diferentes e neles colocados a mesma quantidade de gasolina Abaixo a quilometragem obtida pelos automóveis Existe diferença entre de distância média percorrida pelos diferentes tipos de automóveis Faça o teste com nível de significância de 005 1 Fator tratamento tipo de automóvel Níveis modelo 1 modelo 2 modelo 3 DMS 389 933 5 1680 Observando os resultados obtidos pelo teste de Tukey ao nível de 5 de significância verificase que há evidência de diferenças de consumo entre os três modelos de automóveis Ao nível de significância de 1 não há evidência de diferenças entre o Modelo3 e o Modelo2 Exemplo 2 Um experimento comparou a resistência à compressão lb de quatro tipos diferentes de caixas O objetivo é avaliar se a resistência média difere para as quatro caixas avaliadas isto é desejase verificar se a variável resposta apresenta diferença na presença dos diferentes níveis Faça o teste com nível de significância de 005 Exemplo 2 Um experimento comparou a resistência à compressão lb de quatro tipos diferentes de caixas O objetivo é avaliar se a resistência média difere para as quatro caixas avaliadas isto é desejase verificar se a variável resposta apresenta diferença na presença dos diferentes níveis Faça o teste com nível de significância de 005 ANÁLISE DE VARIÂNCIA Exemplo 2 Um experimento comparou a resistência à compressão lb de quatro tipos diferentes de caixas O objetivo é avaliar se a resistência média difere para as quatro caixas avaliadas isto é desejase verificar se a variável resposta apresenta diferença na presença dos diferentes níveis Faça o teste com nível de significância de 005 Observando os resultados obtidos pelo teste de Tukey ao nível de 5 de significância verificase que há evidência amostral que a caixa 4 apresenta menor resistência quando comparadas com as demais caixas Para as demais caixas as resistências não diferem significativamente Exemplo 3 Em média os engenheiros civis por estados e regiões do Brasil foi pesquisado o salário médio de admissão de engenheiros civis em todos os estados brasileiros Separados em tabelas e calculados por suas respectivas regiões geográficas pesquisamos e verifique se as médias entre elas diferem ou não entre si a um nível de significância de 5 ANÁLISE DE VARIÂNCIA Exemplo 3 Em média os engenheiros civis por estados e regiões do Brasil Foi pesquisado o salário médio de admissão de engenheiros civis em todos os estados brasileiros Separados em tabelas e calculados por suas respectivas regiões geográficas pesquisamos e verifique se as médias entre elas diferem ou não entre si a um nível de significância de 5 Na tabela F 005 4 22 282 282 F0 Ftabelado 1 568 282 F crítico F MQ gl SQ Fonte da variação 2820 1568 1395204 4 5580815 Entre grupos 889708 22 19973575 Dentro dos grupos 26 25154390 Total Não rejeitamos H0 e concluímos que as médias não diferem entre si no nível de significância de 5 Exemplo 4 Suponha que você seja dono de um restaurante italiano e que oferece um molho especial que acompanhe a lasanha Vocês têm alguns freguês regulares que vêm todos os dias A maioria dos freguês são alunos funcionários ou executivos Alguns dos freguês que quase sempre pedem o molho especial mas você tem a impressão de que os alunos e os funcionários gostam mais do molho especial do que os executivos Considerando 10 dias representantes para cada grupo existe nesse caso alguma relação significativa ANÁLISE DE VARIÂNCIA Há evidências a 1 de significância que existem diferenças entre os três molhos ANÁLISE DE VARIÂNCIA Pressupostos da Análise de Variância Todas as observações devem ser independentes As observações em cada grupo devem possuir uma distribuição aproximadamente normal As variâncias em cada grupo devem ser aproximadamente iguais A independência entre as observações é sempre importante em uma ANOVA A condição de normalidade é muito importante quando se têm pequenas amostras em cada grupo A condição de constância das variâncias é especialmente importante quando os tamanhos das amostras que se pretende analisar são diferentes Exemplo 5 Trinta e seis pessoas participam de um experimento para descobrir os efeitos do álcool ao dirigir Foram aleatoriamente associadas três situações placebo sem álcool pouco álcool e muito álcool As bebidas não tinham diferenças visuais os participantes foram pesadas e ingeriram quantidades compatíveis Um hora após terem bebidos foram submetidos a um simulador por 10 minutos e anotados a quantidade de erros conforme abaixo Verificar se houve diferença significativas entre os grupos Exemplo 5 Trinta e seis pessoas participam de um experimento para descobrir os efeitos do álcool ao dirigir Foram aleatoriamente associadas três situações placebo sem álcool pouco álcool e muito álcool As bebidas não tinham diferenças visuais os participantes foram pesadas e ingeriram quantidades compatíveis Um hora após terem bebidos foram submetidos a um simulador por 10 minutos e anotados a quantidade de erros conforme abaixo Verificar se houve diferença significativas entre os grupos ANÁLISE DE VARIÂNCIA Como o F calculado é maior que o F critico 330 há evidências que pelo menos uma das médias é diferente das demais ANÁLISE DE VARIÂNCIA Como p adj de PlaceboMtalcool é menor do que 5 há evidências que as médias são diferente Exemplo 6 A base de dados abaixo consiste em amostras de intensidade de vento provenientes de 4 áreas distintas onde serão instalados parques eólicos No entanto a empresa responsável pela instalação está entrando no mercado nacional agora e pouco conhece a realidade destas áreas tampouco a constância de vento em cada uma delas E com isso está um pouco receosa se vale a pena concorrer nos 4 processos licitatórios de cada uma das áreas Para que a empresa não tome uma decisão às escuras foram disponibilizados dados de medições de vento em cada uma das regiões A ideia é avaliar se nas quatro regiões as intensidades de vento são iguais Caso contrário identificar qual ou quais regiões não vale a pena participar do processo de licitação As informações disponibilizadas segue apresentadas na tabela abaixo Todos os dados foram disponibilizados em metros por segundo ms ANÁLISE DE VARIÂNCIA liteacadunivalibrrcursoanovaANOVAnoR Exemplo homogeneidade das variâncias Outra maneira é testar a hipótese de homogeneidade das variâncias é através teste de Bartlett Quando pvalor for menor que o nível de significância escolhido para o teste rejeitase a hipótese nula neste caso assumese a desigualdade das variâncias Caso pvalue seja maior que o nível de significância há evidências que as variâncias são constantes ou homogêneas No caso do exemplo dos ventos o pvalor do teste de Bartlett foi maior que 005 assim há homogeneidade das variâncias ANÁLISE DE VARIÂNCIA Exemplo Normalidade dos dados Uma alternativa para verificar o pressuposto de normalidade é o teste de ShapiroWilk A percepção sobre o resultado do teste também se estrutura em torno do pvalor do mesmo modo que visto para o teste de homogeneidade das variâncias H0 consistem em dizer que há normalidade nos dados H1 que não há normalidade nos dados Assim rejeitase H0 quando p valor α normalmente utiliza se α 005 Neste exemplo os dados de vento também atendem o pressuposto de normalidade da ANOVA pvalor 005 ANÁLISE DE VARIÂNCIA Exemplo Normalidade dos dados O pvalor estimado foi igual à 0000368 PrF Isto nos leva a rejeitar a hipótese nula ou seja pelo menos uma das regiões apresenta um padrão médio de vento distinto das demais ANÁLISE DE VARIÂNCIA Exemplo verificar o pressuposto de independência das observações Antes de verificar qual ou quais regiões são distintas entre si é importante verificar o pressuposto de independência das observações Este pressuposto pode ser avaliado através da análise dos resíduos do modelo ANOVA Aplicando a função genérica plot do R aos resíduos do modelo que podem ser acessados pela função residuals ao objeto que armazena os resultados do modelo ANOVA podese visualizar a distribuição dos resíduos e sua independência à cada observação ANÁLISE DE VARIÂNCIA Exemplo Normalidade dos dados Por fim resta identificar qual ou quais áreas possuem média de ventos distintas entre si Para isto utilizamos a função TukeyHSD do R para identificar as diferenças Com base no resultado do teste de Tukey podese concluir que a área III é significativamente distinta das áreas I II e IV pois para estas três diferenças o valor de padj foi menor que 005 Observando os valores das diferenças e seus intervalos de confiança para os casos onde as diferenças foram significativas podese concluir que os ventos na área III são mais fortes que os das áreas I II e IV ANÁLISE DE VARIÂNCIA Distribuição F de Snedecor a 5 p005 Dúvidas Obrigado até a próxima aula
Envie sua pergunta para a IA e receba a resposta na hora
Recomendado para você
58
Inferência Estatística e Intervalo de Confiança
Probabilidade e Estatística 1
UFAL
3
Exercícios de Probabilidade
Probabilidade e Estatística 1
UFAL
86
Testes de Hipóteses: Inferência Estatística e Metodologia
Probabilidade e Estatística 1
UFAL
3
Lista de Exercícios sobre Variáveis Aleatórias Discretas
Probabilidade e Estatística 1
UFAL
20
Combinação Linear de Distribuições Normais
Probabilidade e Estatística 1
UFAL
42
Variáveis Aleatórias em Probabilidade e Estatística
Probabilidade e Estatística 1
UFAL
5
Lista de Exercícios sobre Distribuições Continuas: Normal e Exponencial
Probabilidade e Estatística 1
UFAL
60
Variáveis Aleatórias Contínuas e Distribuição Normal
Probabilidade e Estatística 1
UFAL
44
Variáveis Aleatórias e Distribuições Discretas em Probabilidade e Estatística
Probabilidade e Estatística 1
UFAL
83
Introdução à Probabilidade e seus Conceitos Básicos
Probabilidade e Estatística 1
UFAL
Texto de pré-visualização
UNIVERSIDADE FEDERAL DE ALAGOAS Instituto de Computação PROBABILIDADE E ESTATÍSTICA INFERÊNCIA ESTATÍSTICA Análise de Variância PROFESSOR PETRUCIO A MEDEIROS BARROS TURMA CIÊNCIA DA COMPUTAÇÃO ENG DA COMPUTAÇÃO ANÁLISE DE VARIÂNCIA Análise da Variância ANOVA é um método para testar a igualdade de três ou mais médias populacionais baseado na análise das variâncias amostrais Os dados amostrais são separados em grupos segundo uma característica fator Fator ou tratamento é uma característica que permite distinguir diferentes populações umas das outras Cada fator contém dois ou mais grupos classificações A análise de variância é utilizada quando se quer decidir se as diferenças amostrais observadas são reais causadas por diferenças significativas nas populações observadas ou casuais decorrentes da mera variabilidade amostral Parte do pressuposto que o acaso só produz pequenos desvios sendo as grandes diferenças geradas por causas reais ANÁLISE DE VARIÂNCIA Os pressupostos básicos da análise de variância são As amostras são aleatórias e independentes As populações têm distribuição normal e As variâncias populacionais são iguais ANÁLISE DE VARIÂNCIA Hipóteses do ANOVA de um Fator HIPÓTESE NULA a média de todas as populações são iguais ou seja o tratamento fator não tem efeito nenhuma variação em média entre os grupos HIPÓTESE ALTERNATIVA nem todas as médias populacionais são iguais ou seja Pelo menos uma média é diferente isto é existe efeito do tratamento Não quer dizer que todas as médias são diferentes alguns pares podem ser iguais ANÁLISE DE VARIÂNCIA Hipóteses do ANOVA de um Fator Todas a médias são iguais Ho é verdadeira Sem efeito do tratamento ANÁLISE DE VARIÂNCIA Hipóteses do ANOVA de um Fator H0 μ1 μ2 μ3 μk H1 Nem todos os μk são iguais Ao menos uma média é diferente H0 REJEITADO existe efeito do tratamento ANÁLISE DE VARIÂNCIA ANOVA de um Fator ANOVA com Fator Duplo ANÁLISE DE VARIÂNCIA ANOVA de um Fator Exemplo O número de frutos atacados depende do local da planta ANÁLISE DE VARIÂNCIA ANOVA de um Fator Exemplo O número de frutos atacados depende do local da planta ANÁLISE DE VARIÂNCIA Tabela Anova para k amostras tratamentos ANÁLISE DE VARIÂNCIA Variação Total SQ total Soma Quadrados Total SQtotal Soma de Quadrados Total ANÁLISE DE VARIÂNCIA Variação ENTRE amostras SQ entre Soma Quadrados entre Tratamentos QMentre Variância entre os Tratamentos ANÁLISE DE VARIÂNCIA Variação DENTRO das amostras SQ dentro Soma Quadrados dentro das Amostras QMdentro Variância dentro das Amostras ANÁLISE DE VARIÂNCIA Tabela ANOVA de 1 fator ANÁLISE DE VARIÂNCIA Tabela ANOVA de 1 fator H0 μ1 μ2 μk H1 pelo menos uma das médias é diferente Estátística de teste F S² entre S² dentro graus de liberdade Numerador gl1 k 1 Denominador gl2 n k O valor crítico é obtido da tabela de distribuição F Rejete H0 se F Fc ANÁLISE DE VARIÂNCIA ANOVA de um Fator Voltando ao Exemplo O número de frutos atacados depende do local da planta SQ total 11 5375² 8 5375² 4 5375² 2016250 SQ dentro 11 85² 8 85² 4 23333² 876667 SQ entre 6 85 5375² 6 55 5375² 6 51667 5375² 6 23333 5375² 1144583 Fonte da variação SQ gl MQ F F critico Entre grupos 1144583 3 381528 875998 310 Dentro dos grupos 876667 20 43583 Total 2016250 23 Como Fcalc F critico rejeitar H0 e assumir H1 ou seja que existe diferenças entre os grupos tratamentos Distribuição F de Snedecor a 5 p005 389 310 ANÁLISE DE VARIÂNCIA ANOVA de um Fator Voltando ao Exemplo O número de frutos atacados depende do local da planta Hipóteses H0 μ1 μ2 μ3 μ4 μ H1 pelo menos um μk é diferente dos demais Fonte da variação SQ gl MQ F F crítico Entre grupos 1144583 3 381528 875398 310 Dentro dos grupos 876667 20 43583 Total 2016250 23 Como Pr F rejeitar H0 ou seja que existe diferenças entre os grupos tratamentos ANÁLISE DE VARIÂNCIA ANOVA de um Fator Teste de Tukey Para os valores de p α podemos afirmar que as médias diferem ao nível de significância de 5 α 005 Quando p α não é possível afirmar que as médias diferem Diferenças acentuadas entre a borda e o centro Exemplo 1 Foram selecionados vários automóveis de 3 modelos diferentes e neles colocados a mesma quantidade de gasolina Abaixo a quilometragem obtida pelos automóveis Existe diferença entre distância média percorrida pelos diferentes tipos de automóveis Faça o teste com nível de significância de 005 1 Fator tratamento tipo de automóvel Níveis modelo 1 modelo 2 modelo 3 KM Modelos 254 Model01 263 Model01 241 Model01 237 Model01 251 Model01 234 Modelo2 218 Modelo2 235 Modelo2 227 Modelo2 216 Modelo2 200 Modelo3 222 Modelo3 197 Modelo3 206 Modelo3 204 Modelo3 Média 2492 2260 2058 x 227 n 15 k 3 SQE 5 2492 227² 5 226 227² 5 2508 227² 471640 SQD 254 2492² 263 2492² 204 2058² 111960 SQtotal 254 227² 263 227² 204 227² 583600 Fonte da variação SQ gl Variância Razo F Entre grupos 471640 2 235820 25275 389 Dentro dos grupos 111960 12 9330 Total 583600 14 ANÁLISE DE VARIÂNCIA Exemplo 1 Foram selecionados vários automóveis de 3 modelos diferentes e neles colocados a mesma quantidade de gasolina Abaixo a quilometragem obtida pelos automóveis Existe diferença entre de distância média percorrida pelos diferentes tipos de automóveis Faça o teste com nível de significância de 005 1 Fator tratamento tipo de automóvel Níveis modelo 1 modelo 2 modelo 3 Modelo 3 Modelo 2 Modelo 1 200 234 254 222 218 263 197 235 241 206 227 237 204 216 251 2058 2260 2492 Média F crítico F MQ gl SQ Fonte da variação 389 235820 25275 2 471640 Entre grupos 9330 12 111960 Dentro dos grupos 14 583600 Total ANÁLISE DE VARIÂNCIA Exemplo 1 Foram selecionados 3 modelos diferentes de carros e neles colocados a mesma quantidade de gasolina Abaixo a quilometragem obtida pelos carros Existe diferença entre distância média percorrida pelos diferentes tipos de carro Faça o teste com nível de significância de 005 1 Fator tratamento tipo de automóvel Níveis modelo 1 modelo 2 modelo 3 Modelo 1 Modelo 2 Modelo 3 254 234 200 263 218 222 241 235 197 237 227 206 251 216 204 Média 2492 2260 2058 x 2270 n 15 k 3 Distribuição F de Snedecor a 5 p005 ANÁLISE DE VARIÂNCIA Comparações Múltiplas Quando na ANOVA aceitase H0 a análise é finalizada porque não se identificou diferença estatística entre os tratamentos Todavia quando H0 for rejeitada devese conhecer quais das médias dos tratamentos diferem entre si Nesse caso devese efetuar um teste para comparações múltiplas Um teste comumente utilizado é o Teste de Tukey Passos para fazer as comparações múltiplas Calcular as médias dos tratamentos Ordenar as médias calculadas Buscar o valor na tabela t e calcular a DMS Comparar as diferenças das médias com o valor da Diferença Mínima Significativa DMS Comparações Múltiplas Teste de Tukey Dados balanceados mesmo número de observações para os tratamentos Duas médias são estatisticamente diferentes se a diferença das médias amostrais em valor absoluto for superior a DMS Diferença Mínima Significativa DMS qααNa 2 QMErro n Sendo n número de observações qααNa é um valor tabelado Na são os graus de liberdade associados a estimativa s²QMErro e a o número de tratamentos Caso ȳi ȳj DMS as médias comparadas diferem entre si ao nível de significância ANÁLISE DE VARIÂNCIA Voltando para o Exemplo 1 Foram selecionados vários automóveis de 3 modelos diferentes e neles colocados a mesma quantidade de gasolina Abaixo a quilometragem obtida pelos automóveis Existe diferença entre de distância média percorrida pelos diferentes tipos de automóveis Faça o teste com nível de significância de 005 1 Fator tratamento tipo de automóvel Níveis modelo 1 modelo 2 modelo 3 DMS 389 933 5 1680 Média 1 Média 2 2492 2260 232 DMS Média 1 Média 3 2492 2058 438 DMS Média 2 Média 3 2260 2058 202 DMS Observando os resultados obtidos pelo teste de Tukey ao nível de 5 de significância verificase que há evidências de diferenças de consumo entre os três modelos de automóveis ANÁLISE DE VARIÂNCIA Voltando para o Exemplo 1 Foram selecionados vários automóveis de 3 modelos diferentes e neles colocados a mesma quantidade de gasolina Abaixo a quilometragem obtida pelos automóveis Existe diferença entre de distância média percorrida pelos diferentes tipos de automóveis Faça o teste com nível de significância de 005 1 Fator tratamento tipo de automóvel Níveis modelo 1 modelo 2 modelo 3 DMS 389 933 5 1680 Observando os resultados obtidos pelo teste de Tukey ao nível de 5 de significância verificase que há evidência de diferenças de consumo entre os três modelos de automóveis Ao nível de significância de 1 não há evidência de diferenças entre o Modelo3 e o Modelo2 Exemplo 2 Um experimento comparou a resistência à compressão lb de quatro tipos diferentes de caixas O objetivo é avaliar se a resistência média difere para as quatro caixas avaliadas isto é desejase verificar se a variável resposta apresenta diferença na presença dos diferentes níveis Faça o teste com nível de significância de 005 Exemplo 2 Um experimento comparou a resistência à compressão lb de quatro tipos diferentes de caixas O objetivo é avaliar se a resistência média difere para as quatro caixas avaliadas isto é desejase verificar se a variável resposta apresenta diferença na presença dos diferentes níveis Faça o teste com nível de significância de 005 ANÁLISE DE VARIÂNCIA Exemplo 2 Um experimento comparou a resistência à compressão lb de quatro tipos diferentes de caixas O objetivo é avaliar se a resistência média difere para as quatro caixas avaliadas isto é desejase verificar se a variável resposta apresenta diferença na presença dos diferentes níveis Faça o teste com nível de significância de 005 Observando os resultados obtidos pelo teste de Tukey ao nível de 5 de significância verificase que há evidência amostral que a caixa 4 apresenta menor resistência quando comparadas com as demais caixas Para as demais caixas as resistências não diferem significativamente Exemplo 3 Em média os engenheiros civis por estados e regiões do Brasil foi pesquisado o salário médio de admissão de engenheiros civis em todos os estados brasileiros Separados em tabelas e calculados por suas respectivas regiões geográficas pesquisamos e verifique se as médias entre elas diferem ou não entre si a um nível de significância de 5 ANÁLISE DE VARIÂNCIA Exemplo 3 Em média os engenheiros civis por estados e regiões do Brasil Foi pesquisado o salário médio de admissão de engenheiros civis em todos os estados brasileiros Separados em tabelas e calculados por suas respectivas regiões geográficas pesquisamos e verifique se as médias entre elas diferem ou não entre si a um nível de significância de 5 Na tabela F 005 4 22 282 282 F0 Ftabelado 1 568 282 F crítico F MQ gl SQ Fonte da variação 2820 1568 1395204 4 5580815 Entre grupos 889708 22 19973575 Dentro dos grupos 26 25154390 Total Não rejeitamos H0 e concluímos que as médias não diferem entre si no nível de significância de 5 Exemplo 4 Suponha que você seja dono de um restaurante italiano e que oferece um molho especial que acompanhe a lasanha Vocês têm alguns freguês regulares que vêm todos os dias A maioria dos freguês são alunos funcionários ou executivos Alguns dos freguês que quase sempre pedem o molho especial mas você tem a impressão de que os alunos e os funcionários gostam mais do molho especial do que os executivos Considerando 10 dias representantes para cada grupo existe nesse caso alguma relação significativa ANÁLISE DE VARIÂNCIA Há evidências a 1 de significância que existem diferenças entre os três molhos ANÁLISE DE VARIÂNCIA Pressupostos da Análise de Variância Todas as observações devem ser independentes As observações em cada grupo devem possuir uma distribuição aproximadamente normal As variâncias em cada grupo devem ser aproximadamente iguais A independência entre as observações é sempre importante em uma ANOVA A condição de normalidade é muito importante quando se têm pequenas amostras em cada grupo A condição de constância das variâncias é especialmente importante quando os tamanhos das amostras que se pretende analisar são diferentes Exemplo 5 Trinta e seis pessoas participam de um experimento para descobrir os efeitos do álcool ao dirigir Foram aleatoriamente associadas três situações placebo sem álcool pouco álcool e muito álcool As bebidas não tinham diferenças visuais os participantes foram pesadas e ingeriram quantidades compatíveis Um hora após terem bebidos foram submetidos a um simulador por 10 minutos e anotados a quantidade de erros conforme abaixo Verificar se houve diferença significativas entre os grupos Exemplo 5 Trinta e seis pessoas participam de um experimento para descobrir os efeitos do álcool ao dirigir Foram aleatoriamente associadas três situações placebo sem álcool pouco álcool e muito álcool As bebidas não tinham diferenças visuais os participantes foram pesadas e ingeriram quantidades compatíveis Um hora após terem bebidos foram submetidos a um simulador por 10 minutos e anotados a quantidade de erros conforme abaixo Verificar se houve diferença significativas entre os grupos ANÁLISE DE VARIÂNCIA Como o F calculado é maior que o F critico 330 há evidências que pelo menos uma das médias é diferente das demais ANÁLISE DE VARIÂNCIA Como p adj de PlaceboMtalcool é menor do que 5 há evidências que as médias são diferente Exemplo 6 A base de dados abaixo consiste em amostras de intensidade de vento provenientes de 4 áreas distintas onde serão instalados parques eólicos No entanto a empresa responsável pela instalação está entrando no mercado nacional agora e pouco conhece a realidade destas áreas tampouco a constância de vento em cada uma delas E com isso está um pouco receosa se vale a pena concorrer nos 4 processos licitatórios de cada uma das áreas Para que a empresa não tome uma decisão às escuras foram disponibilizados dados de medições de vento em cada uma das regiões A ideia é avaliar se nas quatro regiões as intensidades de vento são iguais Caso contrário identificar qual ou quais regiões não vale a pena participar do processo de licitação As informações disponibilizadas segue apresentadas na tabela abaixo Todos os dados foram disponibilizados em metros por segundo ms ANÁLISE DE VARIÂNCIA liteacadunivalibrrcursoanovaANOVAnoR Exemplo homogeneidade das variâncias Outra maneira é testar a hipótese de homogeneidade das variâncias é através teste de Bartlett Quando pvalor for menor que o nível de significância escolhido para o teste rejeitase a hipótese nula neste caso assumese a desigualdade das variâncias Caso pvalue seja maior que o nível de significância há evidências que as variâncias são constantes ou homogêneas No caso do exemplo dos ventos o pvalor do teste de Bartlett foi maior que 005 assim há homogeneidade das variâncias ANÁLISE DE VARIÂNCIA Exemplo Normalidade dos dados Uma alternativa para verificar o pressuposto de normalidade é o teste de ShapiroWilk A percepção sobre o resultado do teste também se estrutura em torno do pvalor do mesmo modo que visto para o teste de homogeneidade das variâncias H0 consistem em dizer que há normalidade nos dados H1 que não há normalidade nos dados Assim rejeitase H0 quando p valor α normalmente utiliza se α 005 Neste exemplo os dados de vento também atendem o pressuposto de normalidade da ANOVA pvalor 005 ANÁLISE DE VARIÂNCIA Exemplo Normalidade dos dados O pvalor estimado foi igual à 0000368 PrF Isto nos leva a rejeitar a hipótese nula ou seja pelo menos uma das regiões apresenta um padrão médio de vento distinto das demais ANÁLISE DE VARIÂNCIA Exemplo verificar o pressuposto de independência das observações Antes de verificar qual ou quais regiões são distintas entre si é importante verificar o pressuposto de independência das observações Este pressuposto pode ser avaliado através da análise dos resíduos do modelo ANOVA Aplicando a função genérica plot do R aos resíduos do modelo que podem ser acessados pela função residuals ao objeto que armazena os resultados do modelo ANOVA podese visualizar a distribuição dos resíduos e sua independência à cada observação ANÁLISE DE VARIÂNCIA Exemplo Normalidade dos dados Por fim resta identificar qual ou quais áreas possuem média de ventos distintas entre si Para isto utilizamos a função TukeyHSD do R para identificar as diferenças Com base no resultado do teste de Tukey podese concluir que a área III é significativamente distinta das áreas I II e IV pois para estas três diferenças o valor de padj foi menor que 005 Observando os valores das diferenças e seus intervalos de confiança para os casos onde as diferenças foram significativas podese concluir que os ventos na área III são mais fortes que os das áreas I II e IV ANÁLISE DE VARIÂNCIA Distribuição F de Snedecor a 5 p005 Dúvidas Obrigado até a próxima aula