1
Estatística 1
UFU
5
Estatística 1
UFU
4
Estatística 1
UFU
1
Estatística 1
UFU
1
Estatística 1
UFU
98
Estatística
UFU
2
Estatística
UFU
1
Estatística 1
UFU
33
Estatística 1
UFU
2
Estatística
UFU
Texto de pré-visualização
1 Prof. Nádia Giaretta Biase Testes de hipóteses Estatística Agronomia 2 Quando o investigador confronta os valores ou pontuações da amostra com os valores “teóricos” da curva normal diz-se que procede a um teste de hipóteses. Uma hipótese é sempre uma conjectura que o investigador faz sobre as variáveis que analisa e que expressa uma antecipação dos resultados de acordo com uma dada teoria, pesquisa anterior ou mesmo experiência pessoal do investigador. Uma hipótese estatística é uma afirmativa a respeito de um parâmetro de uma distribuição de probabilidade. Teste de Hipótese 3 OBJETIVOS: O objetivo da decisão estatística é utilizar ferramentas para verificar a validade de uma determinada hipótese. Para isso utilizam se dados da amostra. Sempre testamos uma hipótese inicial (chamada na estatística de hipótese nula (H0)) que será uma igualdade, contra uma hipótese alternativa (H1) que será uma desigualdade. Teste de Hipótese 4 Exemplos: 1) O tratamento A apresenta melhores resultados do que o tratamento B Ho: pA = pB (proporção de frutos sadios de A é igual a proporção de frutos sadios de B) H1: pA > pB (proporção de frutos sadios de A é maior que de B) 2) A proporção de plantas infectadas numa determinada área agrícola é de 0,50. Ho: p = 0,5 (proporção de plantas infectadas é de 0,50) H1: p ≠0,5 (proporção de plantas infectadas é diferente de 0,50) Teste de Hipótese: 3) O estoque de sangue médio de um novo hemocentro é superior a 200 litros. Ho: μ = 200 H1: μ > 200 O teste de hipótese pode ser bilateral (quando na H1 usamos diferente), unilateral à direita (quando usamos maior na hipótese alternativa) ou unilateral a esquerda (quando H1 for menor). Teste de Hipótese: Tipos de Hipóteses - Hipótese de nulidade (H0) - é a hipótese a ser testada. Ex.: μ = 200 litros - Hipótese alternativa (H1 ou Ha) - é uma hipótese que se contrapõe à hipótese de nulidade. Ex.: H1 : μ ≠ 200 ( teste bilateral) H1 : μ > 200 ( teste unilateral a direita) H1 : μ < 200 ( teste unilateral a esquerda) 7 • À probabilidade que o investigador estabelece para aceitar/rejeitar a hipótese nula chamamos de nível de significância que se representa por nível α (alfa). • Na investigação científica os níveis α mais usados são <0,05 (menos de 5%) e <0,01 (menos de 1%). • Estabelecer um nível de significância de menos de 0,05 para aceitar/rejeitar H0, significa que o investigador apenas admite que a probabilidade das diferenças encontradas serem fruto do acaso é inferior a 5 vezes em cada 100 (margem de erro). Teste de Hipótese: nível de significância 8 Região de não rejeição de H0 (RNRH0): É a região na qual aceitamos a hipótese H0. Esta região será determinada em função do tipo de teste que será realizado (bilateral ou unilateral) Região Crítica ou Região de rejeição de H0 (RC ou RRH0): É a região que nos levará a rejeição da hipótese H0. Teste de Hipótese: região crítica 9 Teste de Hipótese Como proceder nos testes: 1) Fazer as hipóteses H0 e H1 2) Fixar a probabilidade de erro 3) Usar as tabelas estatísticas de probabilidade 4) Calcular a variável do teste 5) Aceitar ou rejeitar as hipóteses conforme a região em que a variável teste caiu sobre a curva; Região de aceitação de Ho (RA) ou de rejeição de Ho (RC) 10 a) População infinita, normal ou aproximadamente normal, variância populacional conhecida (amostra grande ou pequena) Testes de Médias H o H 1 R . C R IT IC A = o < o > o o z < -z z > z z < -z /2 e z > z /2 Z X n O x / Testes de hipóteses paramétricos 11 O Departamento de agricultura de uma cidade reporta que o custo médio para se criar um filho até a idade de 2 anos na zona rural é de R$10460. Você acredita que esse valor está incorreto e faz uma pesquisa para checar tal situação. Você seleciona uma amostra de 900 crianças (com idade de 2 anos) e descobre que a média dos custos é de R$10345 com desvio padrão de R$1540. Com 5% de significância, há evidência suficiente para concluir que a média do custo é menor de R$10460? Exemplo 1 12 b) População infinita, normal ou aproximadamente normal, variância populacional desconhecida e amostra pequena GL= n-1 Testes de Médias Ho H1 R. CRITICA =o <o >o o t<-t t>t t<-t/2 e t>t/2 t X S n O x / ( n 30) 13 De acordo com um estudo sobre dietas, uma alta ingestão de sódio pode estar relacionada a úlceras, câncer de estômago e enxaquecas. A necessidade humana de sal é de apenas 220 miligramas por dia, o que é ultrapassado na maioria as porções simples dos cereais prontos para servir. Se uma amostra aleatória de 20 porções similares de certo cereal tem média de conteúdo de sódio de 244 miligramas e desvio-padrão de 24,5 miligramas, isso sugere ao nível de 5%, que a média de sódio contido em uma porção de tal cereal é maior que 220 miligramas? Exemplo 2 14 Testes para Diferenças entre Médias a) População infinita, normal ou aproximadamente normal, variância populacional conhecida (amostras grandes ou pequenas) H0 H1 Região Crítica 1 2 d0 1 2 d0 1 2 d0 1 2 d0 / 2 / 2 e Z Z Z Z Z Z Z Z 1 2 1 2 2 2 1 2 1 2 ( ) ( ) x x z n n 15 Um prefeito quer testar se os salários diários pagos aos empregados do sexo masculino e feminino, pelas grandes organizações de sua cidade, são os mesmos para as mesmas funções. Para testar essa hipótese, uma amostra aleatória de 400 homens e 576 mulheres foi selecionada e registradas as médias salariais. A média e o desvio-padrão para os salários dos homens eram $105,70 e $5,00, respectivamente, enquanto que para as mulheres esses números foram $112,80 e $4,80. Teste a hipótese a um nível de significância de 0,01. Exemplo 3 16 b) Populações aproximadamente normais, amostras pequenas, variâncias populacionais desconhecidas e estatisticamente iguais Testes para Diferenças entre Médias Ho H1 R. CRITICA 1 2 d O 1-2<do 1-2>do 1 2 d o t<-t t>t t<-t/2 e t>t/2 2 1) ( 1) ( 2 . . 1 / / 1 ) ( ) ( 2 1 2 2 2 2 1 2 2 1 2 1 2 1 2 1 1 n n s n s n sp n n l g n n s X X t p 17 Um psicólogo estava interessado em descobrir se os homens tendem a mostrar sinais de Alzheimer mais cedo do que as mulheres. A seguir, temos as idades em que os primeiros sintomas da doença começam a ser sentidos em uma amostra de homens e mulheres. Homens 67 73 70 62 65 59 80 66 Mulheres 70 68 57 66 74 67 61 72 64 Ao nível de 0,01 de significância, teste se a diferença entre as médias das idades em que os sintomas de Alzheimer começam a ser sentidos por homens e mulheres é significativa. Considere as variâncias estatisticamente iguais. Exemplo 4 18 d) Teste para observações emparelhadas ou seja, amostras dependentes (ex: antes, depois) Testes para Observações Emparelhadas Ho H1 R. CRITICA D=do D<do D>do do t < -t t > t t<-t/2 e t>t/2 n S d D t D O / gl= n-1 19 Um remédio feito de ervas é testado em 6 pacientes com distúrbios do sono selecionados aleatoriamente. A tabela mostra o número de horas de sono que pacientes conseguem em uma noite sem o uso de remédio e o número de horas de sono que os pacientes conseguem em outra noite depois que o remédio foi administrado. Ao nível de 5% de significância, teste a afirmação de que a medicação é eficaz no tratamento da insônia, ou seja, o número de horas de sono após a medicação é superior ao número de horas de sono antes da medicação. Sem remédio: 1,0 3,4 3,7 5,5 5,8 4,8 2,9 Com remédio: 2,9 3,5 4,4 6,0 6,5 4,7 3,1 Exemplo 5 20 Testes de Proporções Ho H1 R. CRITICA p=po p<po p>po p p o z<-z z>z z<-z/2 e z>z/2 Z p p p q n O o o / 21 Um ambientalista afirma que 60% dos consumidores brasileiros estão preocupados com a modificação genética na produção de alimentos e querem evitar comida geneticamente modificada. Você quer testar essa afirmação. Você descobre que, em uma amostra aleatória de 100 consumidores brasileiros, 65% dizem estar preocupados sobre o uso de modificação genética na produção de alimentos e querem evitar comida geneticamente modificada. Com um nível nominal de significância de 10%, você pode apoiar a afirmação do ambientalista? Exemplo 6 22 Teste de Hipótese para Diferença Proporções Ho H1 R. CRITICA p1-p2=po p1-p2<po p1-p2>po p p p o 1 2 z<-z z>z z<-z/2 e z>z/2 Z p p p p p q n p q n ( ) ( ) / / 1 2 1 2 1 1 1 2 2 2 23 Pesquisadores realizaram um estudo para avaliar a qualidade de duas diferentes marcas de luvas. Entre 240 luvas de vinil, 63% vasaram vírus. Entre 240 luvas de látex, 58% vasaram vírus. Use um nível de significância de 0,05 para testar a afirmativa de que as luvas de vinil têm uma taxa de vazamento de vírus maior do que as de látex. Exemplo 7 24 Distribuição de s2 - Distribuição de 2 (Qui - Quadrado) É uma distribuição amostral de variâncias Retira-se uma amostra de n elementos de uma população normal com média e variância 2, teremos a distribuição de uma , segue uma distribuição de 2 com n-1 graus liberdade , e que: A variável tem distribuição 2 com n-1 graus de liberdade. s x x n i i n 2 2 1 1 2 2 2 ( 1) n s 25 Os valores de 2 não podem ser negativos Não é simétrica em 2 = 0 quanto maior o tamanho de n, a distribuição tende a normal. Como a curva não é simétrica, então olha-se na tabela dois valores de 2, quando queremos saber se um valor está entre 2 limites. 26 g 0,005 0,010 0,025 0,050 0,100 0,900 0,950 0,975 0,990 0,995 1 7,88 6,63 5,02 3,84 2,71 0,016 0,0039 0,0010 0,00016 0,00004 2 10,60 9,21 7,38 5,99 4,61 0,21 0,10 0,051 0,020 0,010 3 12,84 11,34 9,35 7,81 6,25 0,58 0,35 0,22 0,11 0,072 4 14,86 13,28 11,14 9,49 7,78 1,06 0,71 0,48 0,30 0,21 5 16,75 15,09 12,83 11,07 9,24 1,61 1,15 0,83 0,55 0,41 6 18,55 16,81 14,45 12,59 10,64 2,20 1,64 1,24 0,87 0,68 7 20,28 18,48 16,01 14,07 12,02 2,83 2,17 1,69 1,24 0,99 8 21,95 20,09 17,53 15,51 13,36 3,49 2,73 2,18 1,65 1,34 9 23,59 21,67 19,02 16,92 14,68 4,17 3,33 2,70 2,09 1,73 10 25,19 23,21 20,48 18,31 15,99 4,87 3,94 3,25 2,56 2,16 11 26,76 24,72 21,92 19,68 17,28 5,58 4,57 3,82 3,05 2,60 12 28,30 26,22 23,34 21,03 18,55 6,30 5,23 4,40 3,57 3,07 13 29,82 27,69 24,74 22,36 19,81 7,04 5,89 5,01 4,11 3,57 14 31,32 29,14 26,12 23,68 21,06 7,79 6,57 5,63 4,66 4,07 15 32,80 30,58 27,49 25,00 22,31 8,55 7,26 6,26 5,23 4,60 16 34,27 32,00 28,85 26,30 23,54 9,31 7,96 6,91 5,81 5,14 17 35,72 33,41 30,19 27,59 24,77 10,09 8,67 7,56 6,41 5,70 18 37,16 34,81 31,53 28,87 25,99 10,86 9,39 8,23 7,01 6,26 19 38,58 36,19 32,85 30,14 27,20 11,65 10,12 8,91 7,63 6,84 20 40,00 37,57 34,17 31,41 28,41 12,44 10,85 9,59 8,26 7,43 21 41,40 38,93 35,48 32,67 29,62 13,24 11,59 10,28 8,90 8,03 22 42,80 40,29 36,78 33,92 30,81 14,04 12,34 10,98 9,54 8,64 23 44,18 41,64 38,08 35,17 32,01 14,85 13,09 11,69 10,20 9,26 24 45,56 42,98 39,36 36,42 33,20 15,66 13,85 12,40 10,86 9,89 25 46,93 44,31 40,65 37,65 34,38 16,47 14,61 13,12 11,52 10,52 26 48,29 45,64 41,92 38,89 35,56 17,29 15,38 13,84 12,20 11,16 27 49,64 46,96 43,19 40,11 36,74 18,11 16,15 14,57 12,88 11,81 28 50,99 48,28 44,46 41,34 37,92 18,94 16,93 15,31 13,56 12,46 29 52,34 49,59 45,72 42,56 39,09 19,77 17,71 16,05 14,26 13,12 30 53,67 50,89 46,98 43,77 40,26 20,60 18,49 16,79 14,95 13,79 40 66,77 63,69 59,34 55,76 51,81 29,05 26,51 24,43 22,16 20,71 50 79,49 76,15 71,42 67,50 63,17 37,69 34,76 32,36 29,71 27,99 60 91,95 88,38 83,30 79,08 74,40 46,46 43,19 40,48 37,48 35,53 70 104,21 100,43 95,02 90,53 85,53 55,33 51,74 48,76 45,44 43,28 80 116,32 112,33 106,63 101,88 96,58 64,28 60,39 57,15 53,54 51,17 90 128,30 124,12 118,14 113,15 107,57 73,29 69,13 65,65 61,75 59,20 100 140,17 135,81 129,56 124,34 118,50 82,36 77,93 74,22 70,06 67,33 Distribuição 2 0 + t2 2 2 ( ) g t P 2 ( 10 3, 25) ? P 2 ( 10 3, 25) 0,975 P 27 g 0,005 0,010 0,025 0,050 0,100 0,900 0,950 0,975 0,990 0,995 1 7,88 6,63 5,02 3,84 2,71 0,016 0,0039 0,0010 0,00016 0,00004 2 10,60 9,21 7,38 5,99 4,61 0,21 0,10 0,051 0,020 0,010 3 12,84 11,34 9,35 7,81 6,25 0,58 0,35 0,22 0,11 0,072 4 14,86 13,28 11,14 9,49 7,78 1,06 0,71 0,48 0,30 0,21 5 16,75 15,09 12,83 11,07 9,24 1,61 1,15 0,83 0,55 0,41 6 18,55 16,81 14,45 12,59 10,64 2,20 1,64 1,24 0,87 0,68 7 20,28 18,48 16,01 14,07 12,02 2,83 2,17 1,69 1,24 0,99 8 21,95 20,09 17,53 15,51 13,36 3,49 2,73 2,18 1,65 1,34 9 23,59 21,67 19,02 16,92 14,68 4,17 3,33 2,70 2,09 1,73 10 25,19 23,21 20,48 18,31 15,99 4,87 3,94 3,25 2,56 2,16 11 26,76 24,72 21,92 19,68 17,28 5,58 4,57 3,82 3,05 2,60 12 28,30 26,22 23,34 21,03 18,55 6,30 5,23 4,40 3,57 3,07 13 29,82 27,69 24,74 22,36 19,81 7,04 5,89 5,01 4,11 3,57 14 31,32 29,14 26,12 23,68 21,06 7,79 6,57 5,63 4,66 4,07 15 32,80 30,58 27,49 25,00 22,31 8,55 7,26 6,26 5,23 4,60 16 34,27 32,00 28,85 26,30 23,54 9,31 7,96 6,91 5,81 5,14 17 35,72 33,41 30,19 27,59 24,77 10,09 8,67 7,56 6,41 5,70 18 37,16 34,81 31,53 28,87 25,99 10,86 9,39 8,23 7,01 6,26 19 38,58 36,19 32,85 30,14 27,20 11,65 10,12 8,91 7,63 6,84 20 40,00 37,57 34,17 31,41 28,41 12,44 10,85 9,59 8,26 7,43 21 41,40 38,93 35,48 32,67 29,62 13,24 11,59 10,28 8,90 8,03 22 42,80 40,29 36,78 33,92 30,81 14,04 12,34 10,98 9,54 8,64 23 44,18 41,64 38,08 35,17 32,01 14,85 13,09 11,69 10,20 9,26 24 45,56 42,98 39,36 36,42 33,20 15,66 13,85 12,40 10,86 9,89 25 46,93 44,31 40,65 37,65 34,38 16,47 14,61 13,12 11,52 10,52 26 48,29 45,64 41,92 38,89 35,56 17,29 15,38 13,84 12,20 11,16 27 49,64 46,96 43,19 40,11 36,74 18,11 16,15 14,57 12,88 11,81 28 50,99 48,28 44,46 41,34 37,92 18,94 16,93 15,31 13,56 12,46 29 52,34 49,59 45,72 42,56 39,09 19,77 17,71 16,05 14,26 13,12 30 53,67 50,89 46,98 43,77 40,26 20,60 18,49 16,79 14,95 13,79 40 66,77 63,69 59,34 55,76 51,81 29,05 26,51 24,43 22,16 20,71 50 79,49 76,15 71,42 67,50 63,17 37,69 34,76 32,36 29,71 27,99 60 91,95 88,38 83,30 79,08 74,40 46,46 43,19 40,48 37,48 35,53 70 104,21 100,43 95,02 90,53 85,53 55,33 51,74 48,76 45,44 43,28 80 116,32 112,33 106,63 101,88 96,58 64,28 60,39 57,15 53,54 51,17 90 128,30 124,12 118,14 113,15 107,57 73,29 69,13 65,65 61,75 59,20 100 140,17 135,81 129,56 124,34 118,50 82,36 77,93 74,22 70,06 67,33 Distribuição 2 0 + t2 2 2 ( ) g t P 2 ( 10 3,25) ? P 2 ( 10 3,25) 0,975 P 2 ( 15 ?) 0,9 P 2 ( 15 8,55) 0,9 P 28 Obter os seguintes valores da distribuição de 2 : a) P (2 > 1 2 ) = 0,025 com 17 g.l. b) P (2 < 1 2 ) = 0,025 com 17 g.l. c) P (1 2 < 2 < 2 2) = 0,90 com 10 g.l. d) P (1 2 < 2 < 2 2) = 0,95 com 15 g.l. e) P (10,8508 < 2 < 31,4104) com 20 g.l. 29 Teste de hipótese para uma variância H0 H1 Região Crítica 2 2 0 2 2 0 2 2 0 2 2 0 2 2 2 2 1 e 2 2 2 2 1 2 2 2 ( 1) n s 1 n 30 Uma empresa de processamento de laticínios declara que a variância da quantidade de gordura no leite integral processado por ela é de 0,35. Você suspeita que esta afirmação esta errada e descobre que uma amostra aleatória de 41 caixas de leite tem uma variância de 0,27. Ao nível de 5%, há evidência estatística o suficiente para rejeitar a declaração da empresa? Suponha que a população seja normalmente distribuída. Exemplo 8 31 Vantagens em relação aos testes paramétricos Poucos pressupostos relativos à população; Facilidade de implementação; Aplicável em situações não abrangidas pela normal; Mais eficientes quando as populações não tem distribuição Normal; Podem ser aplicados a dados categóricos. Desvantagens em relação aos testes paramétricos Não têm Parâmetros, dificultando julgamentos quantitativos entre populações Escasso aproveitamento de informação da amostra (Dados quantitativos são codificados em dados qualitativos) Testes de hipóteses não paramétricos 32 •Métodos estatísticos aplicados a conjuntos de dados onde as suposições distribucionais necessárias para aplicação de uma técnica clássica (Intervalo de Confiança, Teste de Hipótese) não são satisfatoriamente atendidas •Quando as especificações acerca de parâmetros populacionais não são rigorosas, existem testes específicos que podem ser chamados de não paramétricos ou de distribuição livre. Testes de hipóteses não paramétricos 33 Principais testes não paramétricos Utilização: 1) Aderência: ajuste de frequências observadas à frequências esperadas, ou seja, verificar se a distribuição observada se ajusta a uma distribuição teórica. Ex: Altura de pessoas segue a distribuição normal. 2) Independência (teste de contingência): verificar se existe associação (relação) entre variáveis. Ex: nível de aquisição de um produto (baixo, médio e alto) está relacionado com a cor (branco, preto, verde, vermelho, outra). TESTE DE QUI-QUADRADO (2) 34 H0 : a variável X segue determinada distribuição. H1 : a variável X não segue determinada distribuição. TESTE DE ADERÊNCIA k i i i i c fe fe fo 1 2 2 em que k é o número de classes ou colunas e fei = np. A região crítica (região de rejeição da hipótese H0) será dada por: 2 2 ( ) c ν = k − r − 1 , sendo k número de classes ou colunas, r o número de parâmetros estimados. De uma forma geral, tem- se: r = 0 para distribuições uniforme ou polinomial; r = 1 para distribuições binomial, poisson, exponencial; r= 2 para a distribuição normal. 35 Exemplo 9: Segundo Mendel (geneticista famoso), os resultados dos cruzamentos de ervilhas amarelas redonda com ervilhas verdes enrugadas ocorrem na proporção de 9:3:3:1. Uma amostra de 556 ervilhas resultantes de cruzamentos de ervilhas amarelas redondas com ervilhas verdes enrugadas foi classificada da seguinte forma: Há evidências de que os resultados desse experimento estão de acordo com a distribuição de probabilidades proposta por Mendel ao nível de 5%? 36 Exemplo 10: A tabela dá a frequência do número de erros de impressão por página de determinado livro. Ajustar essa distribuição a uma distribuição de Poisson e testar a aderência do ajustamento, ao nível de 1%. 37 H0 : a variável linha independe da variável coluna. H1 : a variável linha depende da variável coluna . TESTE DE INDEPENDÊNCIA k i i i i c fe fe fo 1 2 2 em que k é o número de classes ou colunas. A região crítica (região de rejeição da hipótese H0) será dada por: 2 2 ( ) c ν = (h-1)(k-1) nas tabelas com h linhas e k colunas geral total total coluna total linha fe .) ( 38 Exemplo 11: Um experimento realizado com 280 vacas classificados segundo a raça e o tipo de acasalamento foi efetuada com o objetivo de verificar se existe associação entre estas variáveis. Os resultados foram: Use o teste de qui-quadrado, com significância de 10%, para dizer se existe relação entre as variáveis analisadas.
1
Estatística 1
UFU
5
Estatística 1
UFU
4
Estatística 1
UFU
1
Estatística 1
UFU
1
Estatística 1
UFU
98
Estatística
UFU
2
Estatística
UFU
1
Estatística 1
UFU
33
Estatística 1
UFU
2
Estatística
UFU
Texto de pré-visualização
1 Prof. Nádia Giaretta Biase Testes de hipóteses Estatística Agronomia 2 Quando o investigador confronta os valores ou pontuações da amostra com os valores “teóricos” da curva normal diz-se que procede a um teste de hipóteses. Uma hipótese é sempre uma conjectura que o investigador faz sobre as variáveis que analisa e que expressa uma antecipação dos resultados de acordo com uma dada teoria, pesquisa anterior ou mesmo experiência pessoal do investigador. Uma hipótese estatística é uma afirmativa a respeito de um parâmetro de uma distribuição de probabilidade. Teste de Hipótese 3 OBJETIVOS: O objetivo da decisão estatística é utilizar ferramentas para verificar a validade de uma determinada hipótese. Para isso utilizam se dados da amostra. Sempre testamos uma hipótese inicial (chamada na estatística de hipótese nula (H0)) que será uma igualdade, contra uma hipótese alternativa (H1) que será uma desigualdade. Teste de Hipótese 4 Exemplos: 1) O tratamento A apresenta melhores resultados do que o tratamento B Ho: pA = pB (proporção de frutos sadios de A é igual a proporção de frutos sadios de B) H1: pA > pB (proporção de frutos sadios de A é maior que de B) 2) A proporção de plantas infectadas numa determinada área agrícola é de 0,50. Ho: p = 0,5 (proporção de plantas infectadas é de 0,50) H1: p ≠0,5 (proporção de plantas infectadas é diferente de 0,50) Teste de Hipótese: 3) O estoque de sangue médio de um novo hemocentro é superior a 200 litros. Ho: μ = 200 H1: μ > 200 O teste de hipótese pode ser bilateral (quando na H1 usamos diferente), unilateral à direita (quando usamos maior na hipótese alternativa) ou unilateral a esquerda (quando H1 for menor). Teste de Hipótese: Tipos de Hipóteses - Hipótese de nulidade (H0) - é a hipótese a ser testada. Ex.: μ = 200 litros - Hipótese alternativa (H1 ou Ha) - é uma hipótese que se contrapõe à hipótese de nulidade. Ex.: H1 : μ ≠ 200 ( teste bilateral) H1 : μ > 200 ( teste unilateral a direita) H1 : μ < 200 ( teste unilateral a esquerda) 7 • À probabilidade que o investigador estabelece para aceitar/rejeitar a hipótese nula chamamos de nível de significância que se representa por nível α (alfa). • Na investigação científica os níveis α mais usados são <0,05 (menos de 5%) e <0,01 (menos de 1%). • Estabelecer um nível de significância de menos de 0,05 para aceitar/rejeitar H0, significa que o investigador apenas admite que a probabilidade das diferenças encontradas serem fruto do acaso é inferior a 5 vezes em cada 100 (margem de erro). Teste de Hipótese: nível de significância 8 Região de não rejeição de H0 (RNRH0): É a região na qual aceitamos a hipótese H0. Esta região será determinada em função do tipo de teste que será realizado (bilateral ou unilateral) Região Crítica ou Região de rejeição de H0 (RC ou RRH0): É a região que nos levará a rejeição da hipótese H0. Teste de Hipótese: região crítica 9 Teste de Hipótese Como proceder nos testes: 1) Fazer as hipóteses H0 e H1 2) Fixar a probabilidade de erro 3) Usar as tabelas estatísticas de probabilidade 4) Calcular a variável do teste 5) Aceitar ou rejeitar as hipóteses conforme a região em que a variável teste caiu sobre a curva; Região de aceitação de Ho (RA) ou de rejeição de Ho (RC) 10 a) População infinita, normal ou aproximadamente normal, variância populacional conhecida (amostra grande ou pequena) Testes de Médias H o H 1 R . C R IT IC A = o < o > o o z < -z z > z z < -z /2 e z > z /2 Z X n O x / Testes de hipóteses paramétricos 11 O Departamento de agricultura de uma cidade reporta que o custo médio para se criar um filho até a idade de 2 anos na zona rural é de R$10460. Você acredita que esse valor está incorreto e faz uma pesquisa para checar tal situação. Você seleciona uma amostra de 900 crianças (com idade de 2 anos) e descobre que a média dos custos é de R$10345 com desvio padrão de R$1540. Com 5% de significância, há evidência suficiente para concluir que a média do custo é menor de R$10460? Exemplo 1 12 b) População infinita, normal ou aproximadamente normal, variância populacional desconhecida e amostra pequena GL= n-1 Testes de Médias Ho H1 R. CRITICA =o <o >o o t<-t t>t t<-t/2 e t>t/2 t X S n O x / ( n 30) 13 De acordo com um estudo sobre dietas, uma alta ingestão de sódio pode estar relacionada a úlceras, câncer de estômago e enxaquecas. A necessidade humana de sal é de apenas 220 miligramas por dia, o que é ultrapassado na maioria as porções simples dos cereais prontos para servir. Se uma amostra aleatória de 20 porções similares de certo cereal tem média de conteúdo de sódio de 244 miligramas e desvio-padrão de 24,5 miligramas, isso sugere ao nível de 5%, que a média de sódio contido em uma porção de tal cereal é maior que 220 miligramas? Exemplo 2 14 Testes para Diferenças entre Médias a) População infinita, normal ou aproximadamente normal, variância populacional conhecida (amostras grandes ou pequenas) H0 H1 Região Crítica 1 2 d0 1 2 d0 1 2 d0 1 2 d0 / 2 / 2 e Z Z Z Z Z Z Z Z 1 2 1 2 2 2 1 2 1 2 ( ) ( ) x x z n n 15 Um prefeito quer testar se os salários diários pagos aos empregados do sexo masculino e feminino, pelas grandes organizações de sua cidade, são os mesmos para as mesmas funções. Para testar essa hipótese, uma amostra aleatória de 400 homens e 576 mulheres foi selecionada e registradas as médias salariais. A média e o desvio-padrão para os salários dos homens eram $105,70 e $5,00, respectivamente, enquanto que para as mulheres esses números foram $112,80 e $4,80. Teste a hipótese a um nível de significância de 0,01. Exemplo 3 16 b) Populações aproximadamente normais, amostras pequenas, variâncias populacionais desconhecidas e estatisticamente iguais Testes para Diferenças entre Médias Ho H1 R. CRITICA 1 2 d O 1-2<do 1-2>do 1 2 d o t<-t t>t t<-t/2 e t>t/2 2 1) ( 1) ( 2 . . 1 / / 1 ) ( ) ( 2 1 2 2 2 2 1 2 2 1 2 1 2 1 2 1 1 n n s n s n sp n n l g n n s X X t p 17 Um psicólogo estava interessado em descobrir se os homens tendem a mostrar sinais de Alzheimer mais cedo do que as mulheres. A seguir, temos as idades em que os primeiros sintomas da doença começam a ser sentidos em uma amostra de homens e mulheres. Homens 67 73 70 62 65 59 80 66 Mulheres 70 68 57 66 74 67 61 72 64 Ao nível de 0,01 de significância, teste se a diferença entre as médias das idades em que os sintomas de Alzheimer começam a ser sentidos por homens e mulheres é significativa. Considere as variâncias estatisticamente iguais. Exemplo 4 18 d) Teste para observações emparelhadas ou seja, amostras dependentes (ex: antes, depois) Testes para Observações Emparelhadas Ho H1 R. CRITICA D=do D<do D>do do t < -t t > t t<-t/2 e t>t/2 n S d D t D O / gl= n-1 19 Um remédio feito de ervas é testado em 6 pacientes com distúrbios do sono selecionados aleatoriamente. A tabela mostra o número de horas de sono que pacientes conseguem em uma noite sem o uso de remédio e o número de horas de sono que os pacientes conseguem em outra noite depois que o remédio foi administrado. Ao nível de 5% de significância, teste a afirmação de que a medicação é eficaz no tratamento da insônia, ou seja, o número de horas de sono após a medicação é superior ao número de horas de sono antes da medicação. Sem remédio: 1,0 3,4 3,7 5,5 5,8 4,8 2,9 Com remédio: 2,9 3,5 4,4 6,0 6,5 4,7 3,1 Exemplo 5 20 Testes de Proporções Ho H1 R. CRITICA p=po p<po p>po p p o z<-z z>z z<-z/2 e z>z/2 Z p p p q n O o o / 21 Um ambientalista afirma que 60% dos consumidores brasileiros estão preocupados com a modificação genética na produção de alimentos e querem evitar comida geneticamente modificada. Você quer testar essa afirmação. Você descobre que, em uma amostra aleatória de 100 consumidores brasileiros, 65% dizem estar preocupados sobre o uso de modificação genética na produção de alimentos e querem evitar comida geneticamente modificada. Com um nível nominal de significância de 10%, você pode apoiar a afirmação do ambientalista? Exemplo 6 22 Teste de Hipótese para Diferença Proporções Ho H1 R. CRITICA p1-p2=po p1-p2<po p1-p2>po p p p o 1 2 z<-z z>z z<-z/2 e z>z/2 Z p p p p p q n p q n ( ) ( ) / / 1 2 1 2 1 1 1 2 2 2 23 Pesquisadores realizaram um estudo para avaliar a qualidade de duas diferentes marcas de luvas. Entre 240 luvas de vinil, 63% vasaram vírus. Entre 240 luvas de látex, 58% vasaram vírus. Use um nível de significância de 0,05 para testar a afirmativa de que as luvas de vinil têm uma taxa de vazamento de vírus maior do que as de látex. Exemplo 7 24 Distribuição de s2 - Distribuição de 2 (Qui - Quadrado) É uma distribuição amostral de variâncias Retira-se uma amostra de n elementos de uma população normal com média e variância 2, teremos a distribuição de uma , segue uma distribuição de 2 com n-1 graus liberdade , e que: A variável tem distribuição 2 com n-1 graus de liberdade. s x x n i i n 2 2 1 1 2 2 2 ( 1) n s 25 Os valores de 2 não podem ser negativos Não é simétrica em 2 = 0 quanto maior o tamanho de n, a distribuição tende a normal. Como a curva não é simétrica, então olha-se na tabela dois valores de 2, quando queremos saber se um valor está entre 2 limites. 26 g 0,005 0,010 0,025 0,050 0,100 0,900 0,950 0,975 0,990 0,995 1 7,88 6,63 5,02 3,84 2,71 0,016 0,0039 0,0010 0,00016 0,00004 2 10,60 9,21 7,38 5,99 4,61 0,21 0,10 0,051 0,020 0,010 3 12,84 11,34 9,35 7,81 6,25 0,58 0,35 0,22 0,11 0,072 4 14,86 13,28 11,14 9,49 7,78 1,06 0,71 0,48 0,30 0,21 5 16,75 15,09 12,83 11,07 9,24 1,61 1,15 0,83 0,55 0,41 6 18,55 16,81 14,45 12,59 10,64 2,20 1,64 1,24 0,87 0,68 7 20,28 18,48 16,01 14,07 12,02 2,83 2,17 1,69 1,24 0,99 8 21,95 20,09 17,53 15,51 13,36 3,49 2,73 2,18 1,65 1,34 9 23,59 21,67 19,02 16,92 14,68 4,17 3,33 2,70 2,09 1,73 10 25,19 23,21 20,48 18,31 15,99 4,87 3,94 3,25 2,56 2,16 11 26,76 24,72 21,92 19,68 17,28 5,58 4,57 3,82 3,05 2,60 12 28,30 26,22 23,34 21,03 18,55 6,30 5,23 4,40 3,57 3,07 13 29,82 27,69 24,74 22,36 19,81 7,04 5,89 5,01 4,11 3,57 14 31,32 29,14 26,12 23,68 21,06 7,79 6,57 5,63 4,66 4,07 15 32,80 30,58 27,49 25,00 22,31 8,55 7,26 6,26 5,23 4,60 16 34,27 32,00 28,85 26,30 23,54 9,31 7,96 6,91 5,81 5,14 17 35,72 33,41 30,19 27,59 24,77 10,09 8,67 7,56 6,41 5,70 18 37,16 34,81 31,53 28,87 25,99 10,86 9,39 8,23 7,01 6,26 19 38,58 36,19 32,85 30,14 27,20 11,65 10,12 8,91 7,63 6,84 20 40,00 37,57 34,17 31,41 28,41 12,44 10,85 9,59 8,26 7,43 21 41,40 38,93 35,48 32,67 29,62 13,24 11,59 10,28 8,90 8,03 22 42,80 40,29 36,78 33,92 30,81 14,04 12,34 10,98 9,54 8,64 23 44,18 41,64 38,08 35,17 32,01 14,85 13,09 11,69 10,20 9,26 24 45,56 42,98 39,36 36,42 33,20 15,66 13,85 12,40 10,86 9,89 25 46,93 44,31 40,65 37,65 34,38 16,47 14,61 13,12 11,52 10,52 26 48,29 45,64 41,92 38,89 35,56 17,29 15,38 13,84 12,20 11,16 27 49,64 46,96 43,19 40,11 36,74 18,11 16,15 14,57 12,88 11,81 28 50,99 48,28 44,46 41,34 37,92 18,94 16,93 15,31 13,56 12,46 29 52,34 49,59 45,72 42,56 39,09 19,77 17,71 16,05 14,26 13,12 30 53,67 50,89 46,98 43,77 40,26 20,60 18,49 16,79 14,95 13,79 40 66,77 63,69 59,34 55,76 51,81 29,05 26,51 24,43 22,16 20,71 50 79,49 76,15 71,42 67,50 63,17 37,69 34,76 32,36 29,71 27,99 60 91,95 88,38 83,30 79,08 74,40 46,46 43,19 40,48 37,48 35,53 70 104,21 100,43 95,02 90,53 85,53 55,33 51,74 48,76 45,44 43,28 80 116,32 112,33 106,63 101,88 96,58 64,28 60,39 57,15 53,54 51,17 90 128,30 124,12 118,14 113,15 107,57 73,29 69,13 65,65 61,75 59,20 100 140,17 135,81 129,56 124,34 118,50 82,36 77,93 74,22 70,06 67,33 Distribuição 2 0 + t2 2 2 ( ) g t P 2 ( 10 3, 25) ? P 2 ( 10 3, 25) 0,975 P 27 g 0,005 0,010 0,025 0,050 0,100 0,900 0,950 0,975 0,990 0,995 1 7,88 6,63 5,02 3,84 2,71 0,016 0,0039 0,0010 0,00016 0,00004 2 10,60 9,21 7,38 5,99 4,61 0,21 0,10 0,051 0,020 0,010 3 12,84 11,34 9,35 7,81 6,25 0,58 0,35 0,22 0,11 0,072 4 14,86 13,28 11,14 9,49 7,78 1,06 0,71 0,48 0,30 0,21 5 16,75 15,09 12,83 11,07 9,24 1,61 1,15 0,83 0,55 0,41 6 18,55 16,81 14,45 12,59 10,64 2,20 1,64 1,24 0,87 0,68 7 20,28 18,48 16,01 14,07 12,02 2,83 2,17 1,69 1,24 0,99 8 21,95 20,09 17,53 15,51 13,36 3,49 2,73 2,18 1,65 1,34 9 23,59 21,67 19,02 16,92 14,68 4,17 3,33 2,70 2,09 1,73 10 25,19 23,21 20,48 18,31 15,99 4,87 3,94 3,25 2,56 2,16 11 26,76 24,72 21,92 19,68 17,28 5,58 4,57 3,82 3,05 2,60 12 28,30 26,22 23,34 21,03 18,55 6,30 5,23 4,40 3,57 3,07 13 29,82 27,69 24,74 22,36 19,81 7,04 5,89 5,01 4,11 3,57 14 31,32 29,14 26,12 23,68 21,06 7,79 6,57 5,63 4,66 4,07 15 32,80 30,58 27,49 25,00 22,31 8,55 7,26 6,26 5,23 4,60 16 34,27 32,00 28,85 26,30 23,54 9,31 7,96 6,91 5,81 5,14 17 35,72 33,41 30,19 27,59 24,77 10,09 8,67 7,56 6,41 5,70 18 37,16 34,81 31,53 28,87 25,99 10,86 9,39 8,23 7,01 6,26 19 38,58 36,19 32,85 30,14 27,20 11,65 10,12 8,91 7,63 6,84 20 40,00 37,57 34,17 31,41 28,41 12,44 10,85 9,59 8,26 7,43 21 41,40 38,93 35,48 32,67 29,62 13,24 11,59 10,28 8,90 8,03 22 42,80 40,29 36,78 33,92 30,81 14,04 12,34 10,98 9,54 8,64 23 44,18 41,64 38,08 35,17 32,01 14,85 13,09 11,69 10,20 9,26 24 45,56 42,98 39,36 36,42 33,20 15,66 13,85 12,40 10,86 9,89 25 46,93 44,31 40,65 37,65 34,38 16,47 14,61 13,12 11,52 10,52 26 48,29 45,64 41,92 38,89 35,56 17,29 15,38 13,84 12,20 11,16 27 49,64 46,96 43,19 40,11 36,74 18,11 16,15 14,57 12,88 11,81 28 50,99 48,28 44,46 41,34 37,92 18,94 16,93 15,31 13,56 12,46 29 52,34 49,59 45,72 42,56 39,09 19,77 17,71 16,05 14,26 13,12 30 53,67 50,89 46,98 43,77 40,26 20,60 18,49 16,79 14,95 13,79 40 66,77 63,69 59,34 55,76 51,81 29,05 26,51 24,43 22,16 20,71 50 79,49 76,15 71,42 67,50 63,17 37,69 34,76 32,36 29,71 27,99 60 91,95 88,38 83,30 79,08 74,40 46,46 43,19 40,48 37,48 35,53 70 104,21 100,43 95,02 90,53 85,53 55,33 51,74 48,76 45,44 43,28 80 116,32 112,33 106,63 101,88 96,58 64,28 60,39 57,15 53,54 51,17 90 128,30 124,12 118,14 113,15 107,57 73,29 69,13 65,65 61,75 59,20 100 140,17 135,81 129,56 124,34 118,50 82,36 77,93 74,22 70,06 67,33 Distribuição 2 0 + t2 2 2 ( ) g t P 2 ( 10 3,25) ? P 2 ( 10 3,25) 0,975 P 2 ( 15 ?) 0,9 P 2 ( 15 8,55) 0,9 P 28 Obter os seguintes valores da distribuição de 2 : a) P (2 > 1 2 ) = 0,025 com 17 g.l. b) P (2 < 1 2 ) = 0,025 com 17 g.l. c) P (1 2 < 2 < 2 2) = 0,90 com 10 g.l. d) P (1 2 < 2 < 2 2) = 0,95 com 15 g.l. e) P (10,8508 < 2 < 31,4104) com 20 g.l. 29 Teste de hipótese para uma variância H0 H1 Região Crítica 2 2 0 2 2 0 2 2 0 2 2 0 2 2 2 2 1 e 2 2 2 2 1 2 2 2 ( 1) n s 1 n 30 Uma empresa de processamento de laticínios declara que a variância da quantidade de gordura no leite integral processado por ela é de 0,35. Você suspeita que esta afirmação esta errada e descobre que uma amostra aleatória de 41 caixas de leite tem uma variância de 0,27. Ao nível de 5%, há evidência estatística o suficiente para rejeitar a declaração da empresa? Suponha que a população seja normalmente distribuída. Exemplo 8 31 Vantagens em relação aos testes paramétricos Poucos pressupostos relativos à população; Facilidade de implementação; Aplicável em situações não abrangidas pela normal; Mais eficientes quando as populações não tem distribuição Normal; Podem ser aplicados a dados categóricos. Desvantagens em relação aos testes paramétricos Não têm Parâmetros, dificultando julgamentos quantitativos entre populações Escasso aproveitamento de informação da amostra (Dados quantitativos são codificados em dados qualitativos) Testes de hipóteses não paramétricos 32 •Métodos estatísticos aplicados a conjuntos de dados onde as suposições distribucionais necessárias para aplicação de uma técnica clássica (Intervalo de Confiança, Teste de Hipótese) não são satisfatoriamente atendidas •Quando as especificações acerca de parâmetros populacionais não são rigorosas, existem testes específicos que podem ser chamados de não paramétricos ou de distribuição livre. Testes de hipóteses não paramétricos 33 Principais testes não paramétricos Utilização: 1) Aderência: ajuste de frequências observadas à frequências esperadas, ou seja, verificar se a distribuição observada se ajusta a uma distribuição teórica. Ex: Altura de pessoas segue a distribuição normal. 2) Independência (teste de contingência): verificar se existe associação (relação) entre variáveis. Ex: nível de aquisição de um produto (baixo, médio e alto) está relacionado com a cor (branco, preto, verde, vermelho, outra). TESTE DE QUI-QUADRADO (2) 34 H0 : a variável X segue determinada distribuição. H1 : a variável X não segue determinada distribuição. TESTE DE ADERÊNCIA k i i i i c fe fe fo 1 2 2 em que k é o número de classes ou colunas e fei = np. A região crítica (região de rejeição da hipótese H0) será dada por: 2 2 ( ) c ν = k − r − 1 , sendo k número de classes ou colunas, r o número de parâmetros estimados. De uma forma geral, tem- se: r = 0 para distribuições uniforme ou polinomial; r = 1 para distribuições binomial, poisson, exponencial; r= 2 para a distribuição normal. 35 Exemplo 9: Segundo Mendel (geneticista famoso), os resultados dos cruzamentos de ervilhas amarelas redonda com ervilhas verdes enrugadas ocorrem na proporção de 9:3:3:1. Uma amostra de 556 ervilhas resultantes de cruzamentos de ervilhas amarelas redondas com ervilhas verdes enrugadas foi classificada da seguinte forma: Há evidências de que os resultados desse experimento estão de acordo com a distribuição de probabilidades proposta por Mendel ao nível de 5%? 36 Exemplo 10: A tabela dá a frequência do número de erros de impressão por página de determinado livro. Ajustar essa distribuição a uma distribuição de Poisson e testar a aderência do ajustamento, ao nível de 1%. 37 H0 : a variável linha independe da variável coluna. H1 : a variável linha depende da variável coluna . TESTE DE INDEPENDÊNCIA k i i i i c fe fe fo 1 2 2 em que k é o número de classes ou colunas. A região crítica (região de rejeição da hipótese H0) será dada por: 2 2 ( ) c ν = (h-1)(k-1) nas tabelas com h linhas e k colunas geral total total coluna total linha fe .) ( 38 Exemplo 11: Um experimento realizado com 280 vacas classificados segundo a raça e o tipo de acasalamento foi efetuada com o objetivo de verificar se existe associação entre estas variáveis. Os resultados foram: Use o teste de qui-quadrado, com significância de 10%, para dizer se existe relação entre as variáveis analisadas.