·

Administração ·

Estatística da Administração

Send your question to AI and receive an answer instantly

Ask Question

Preview text

Testes de Hipóteses com duas amostras Estatística Aplicada para proporções Para o teste de hipótese para a proporção com duas amostras vamos tratar apenas o uso da distribuição de probabilidade Normal Não trataremos o caso do uso do distribuição t de Student Implicações do tamanho da amostra Se será caracterizado como amostra e grande e por isso utilizaremos a Distribuição Normal Para o caso deste teste de hipóteses dificilmente conhecemos os valores das proporções populacionais ou seja p₁ e p₂ são desconhecidos Então o processo de cálculo da variância amostral depende totalmente dos valores das amostras Vejamos Vamos apresentar o Teste para a diferença da proporção de duas populações Hipóteses do teste Hipótese nula a proporção nas duas populações são iguais Hipótese alternativa a proporção nas duas populações são diferentes ou Testes de Hipóteses com duas amostras ou Agora vamos construir teste de hipóteses para comparar a proporção de duas populações normais Vamos nos concentrar apenas no caso de comparar a proporção para amostras independentes Considere duas populações P₁ e P₂ e para cada uma delas retirase uma amostra de onde se calcula a proporção amostral referente a uma variável aleatória Assim teremos Exemplo 1 Em um estudo com 200 mulheres adultas e 250 homens adultos ambos usuários de internet 30 das mulheres e 38 dos homens disseram que planejam comprar online ao menos uma vez durante o mês seguinte Para α 010 teste a afirmação de que há uma diferença entre a proporção de mulheres e de homens que planejam comprar online Solução Dados do Problema α 10 Vamos verificar se estamos diante de amostras grandes n1 p1 200 030 60 5 n1 q1 200 070 140 5 n2 p2 250 038 95 5 n2 q2 250 062 155 5 Vamos separar a resolução em passos Passo 1 escrever as hipóteses nula e alternativa Hipótese nula H0 p1 p2 as proporções entre homens e mulheres são iguais Hipótese alternativa H1 p1 p2 as proporções entre homens e mulheres são diferentes Passo 2 α 10 e o teste é bilateral portanto vamos dividir em duas partes α2 005 Zcrit 164 Passo 3 Cálculo do valor da estatística do teste p1 030 q1 070 p2 038 q2 062 Variância e Desvio Padrão σp1p2 p1 q1n1 p2 q2n2 03 07200 038 062250 00446 Zcalc p1 p2σp1p2 03 03800446 1794 Passo 4 Posicionar o Zcalc no gráfico analisar e escrever a conclusão Conclusão Com base no teste temos evidência suficiente para concluir que existe diferença entre a proporção de homens e mulheres Exemplo 2 Uma equipe de pesquisa médica conduziu um estudo para testar o efeito dos medicamentos na redução de colesterol Os pesquisadores descobriram que dos 4700 que tomaram o medicamento A 301 morreram de doença do coração Dos 4300 que tomaram o medicamento B 357 morreram de doenças do coração Utilizando α 005 você pode concluir que a taxa de mortalidade para aqueles que tomaram a medicação A é igual a taxa de mortalidade para aqueles que tomaram a medicação B Vamos verificar se estamos diante de amostras grandes Basta analisar os cálculos para as menores proporções Vejamos n1 p1 4700 00640 301 5 Portanto as amostras são grandes e assim podemos resolver pela distribuição Normal Testes de Hipóteses com duas amostras FIM Testes de Hipóteses com duas amostras Estatística Aplicada Testes de Hipóteses com duas amostras Definição duas amostras são independentes se a amostra selecionada de uma das populações não está relacionada à amostra selecionada na segunda população Aqui vamos construir teste de hipóteses para comparar um parâmetro estatístico de duas populações normais Vamos nos concentrar apenas no caso de comparar a média ou proporção para amostras independentes Implicações do tamanho da amostra Para amostras pequenas 30 observações com variâncias desconhecidas utilizaremos a Distribuição t de Student Para os demais casos utilizaremos a Distribuição Normal Vamos apresentar o Teste para a diferença da média de duas populações Hipóteses do teste Hipótese nula média das duas populações são iguais Hipótese alternativa média das duas populações são diferentes ou Testes de Hipóteses com duas amostras ou Testes de Hipóteses com duas amostras Para o teste de hipótese com duas amostras também é necessário decidir quanto ao uso da distribuição de probabilidade Normal ou da distribuição t de Student Para os casos onde ambas as amostra são grandes ou seja n 30 utilizaremos a distribuição Normal Para este caso vamos apresentar a formulação para se chegar ao Zcalc Cálculo da média μd μx1x2 x1 x2 Cálculo da Variância Se os desvios forem conhecidos σd σx1x2 σ1²n1 σ2²n2 Se os desvios forem desconhecidos σd σx1x2 s1²n1 s2²n2 Calculando o Zcalc μ1 μ2 0 zcalc x1 x2 μ1 μ2 σx1x2 x1 x2 0 σx1x2 x1 x2 σx1x2 μd σd Testes de Hipóteses com duas amostras Para o caso onde o desvio padrão das populações é desconhecido e uma das amostras é pequena ou seja n 30 utilizaremos a distribuição t de Student Para este caso vamos apresentar a formulação para se chegar ao tcalc Cálculo da média μd μx1x2 x1 x2 Cálculo da Variância σd σx1x2 s1²n1 s2²n2 Calculo do tcalc tcalc x1 x2 μ1 μ2 σx1x2 x1 x2 0 σx1x2 x1 x2 σx1x2 ou tcalc μd σd Determinação de tcrit O grau de liberdade para a utilização da tabela de t de Student é definido como sendo o menor entre os números n1 1 e n2 1 Exemplo 1 dist Normal Desejase verificar se existe diferença entre os salários pagos a engenheiros que atuam na região Sul e Sudeste do país através de um teste de hipóteses Para isso selecionouse aleatoriamente 31 engenheiros da região Sul e com base em seus salários anuais determinouse a média de seus salários como sendo de R4672000 com desviopadrão de R1470000 O mesmo procedimento foi adotado para 35 engenheiros da região Sudeste obtendose média de R5191000 e desviopadrão de R1620000 O teste de hipóteses deve ser feito com nível de significância igual a 5 Vamos separar a resolução em passos Passo 1 escrever as hipóteses nula e alternativa Hipótese nula H0 μ1 μ2 as médias salariais são iguais Hipótese alternativa H1 μ1 μ2 as médias salariais são diferentes A melhor forma de escrever essas hipóteses é H0 μ1 μ2 0 H1 μ1 μ2 0 Passo 2 Definição da distribuição a ser utilizada σ é desconhecido mas como n 30 vamos utilizar a distr Normal Passo 3 α 5 e o teste é bilateral portanto vamos dividir em duas partes α2 0025 Zcrit 196 Passo 4 Cálculo do valor da estatística do teste Variância σx1x2 s12n1 s22n2 Zcalc x1x20σx1x2 46720519103803805 Zcalc 136 Passo 5 Posicionar o Zcalc no gráfico analisar e escrever a conclusão Na figura observamos que o valor do Z calculado caiu dentro da região de aceitação Portanto aceitase H0 Conclusão Baseado nos dados da amostra não temos evidência suficiente para concluir que existe uma diferença entre as médias Salariais dos engenheiros das regiões Sul e Sudeste Exemplo 2 Distr Normal Desejase saber se 2 máquinas de empacotar café estão fornecendo o mesmo peso médio em kg Extraise duas amostras uma de cada máquina do seguinte modo Máquina Nova 36 amostras média 081 kg variância 000020 kg² Máquina Velha 39 amostras média 078 kg variância 000135 kg² Supondo que os pesos das amostras sigam uma distribuição normal qual é a sua conclusão a 25 de significância Solução Dados do Problema n1 36 x1 081 Kg s1² 000020 Kg² α 25 máquina velha 2 n2 39 x2 078 Kg s2² 000135 Kg² Testes de Hipóteses com duas amostras Vamos separar a resolução em passos Passo 1 escrever as hipótese nula e alternativa Hipótese nula H0 μ1 μ2 as duas máquinas fornecem o mesmo peso médio Hipótese alternativa H1 μ1 μ2 as duas máquinas fornecem pesos médios diferentes A melhor forma de escrever essas hipóteses é H0 μ1 μ2 0 H1 μ1 μ2 0 Passo 2 Definição da distribuição a ser utilizada σ é desconhecido mas como n 30 vamos utilizar a distr Normal Passo 3 α 25 e o teste é bilateral portanto vamos dividir em duas partes α2 00125 Zcrit 224 Passo 4 Cálculo do valor da estatística do teste Variância σx1x2 s1²n1 s2²n2 00002036 00013539 000634 Zcalc x1 x2 0 σx1x2 081 078 000634 Zcalc 473 Passo 5 Posicionar o Zcalc no gráfico analisar e escrever a conclusão Na figura observamos que o valor do Z calculado caiu dentro da região de rejeição Portanto rejeitase H0 Conclusão Baseado nos dados da amostra temos evidência suficiente para concluir que existe uma diferença entre aos pesos médios fornecidos pela máquina nova e máquina velha Testes de Hipóteses com duas amostras As distâncias de frenagem de 8 Volkswagen GTIs e 10 Ford Focus foram testadas enquanto viajavam a 60 milhas por hora em pista seca Os resultados são mostrados na tabela abaixo Você pode concluir que existe uma diferença na média da distância de frenagem dos dois tipos de carro Use 𝛼 001 Assuma que as populações são distribuídas normalmente e as variâncias da população não são iguais Larson 2010 Exemplo 3 Distr t de Student Solução Queremos testar se as médias da distância de frenagem são diferentes Passo 1 As hipóteses nula e alternativa são H0 μ1 μ2 0 H1 μ1 μ2 0 Passo 2 Definição da distribuição a ser utilizada Como os desvios populacionais são desconhecidos e as amostras são pequenas vamos utilizar a distribuição t de Student Passo 3 Determinação das regiões críticas aceitação e rejeição Já que as variâncias não são iguais e a menor amostra é de tamanho 8 use gl 8 1 7 Já que o teste é bicaudal com gl 7 e α 001 tcrit 3499 Passo 4 Cálculo do valor da estatística do teste O desvio padrão é σx1x2 s1²n1 s2²n2 6928 26210 25743 Assim a estatística de teste padronizado é tcalc x1 x2 μ1 μ2 σx1x2 134 143 0 25743 3496 Passo 5 Posicionar o tcalc no gráfico analisar e escrever a Como o t calculado caiu dentro da região de aceitação então aceitase H0 Portanto com base nas amostras não é possível concluir que existem diferenças nas distâncias de frenagem dos dois tipos de carros Exemplo 4 Distr t de Student Um fazendeiro deseja testar o efeito de certo fertilizante na produção de cana de açúcar Segundo o fabricante do fertilizante já na primeira utilização o produto promove um aumento significativo na produção Para realizar esse teste foram escolhidos 24 plantações das quais metade foi tratada com fertilizante e a outra não A produção média nos terrenos sem fertilizante foi de 48 Kgm² com desvio padrão de 04 Kgm² enquanto que nos terrenos tratados com fertilizante a média foi 52 Kgm² com desvio de 036 Kgm² Ao nível de 5 podese concluir que houve aumento significativo na produção de cana de açúcar por causa do fertilizante Solução Dados do Problema 𝑛1 12 𝑥1 52 Kgm² 𝑠1 036 Kgm² 𝛼 5 𝑛2 12 𝑥2 48 Kgm² 𝑠2 04 Kgm² Solução Queremos testar se a média de produtividade dos terrenos são diferentes Passo 1 As hipóteses nula e alternativa são H0 μ1 μ2 0 H1 μ1 μ2 0 Passo 2 Definição da distribuição a ser utilizada Como os desvios populacionais são desconhecidos e as amostras são pequenas vamos utilizar a distribuição t de Student Passo 3 Determinação das regiões críticas aceitação e rejeição Como ambas as amostras tem de tamanho 12 use gl 12 1 11 O teste é bicaudal e α 005 assim os valores críticos são t crit Passo 4 Cálculo do valor da estatística do teste O desvio padrão é σx1x2 s1²n1 s2²n2 036²12 042²12 0155 Assim a estatística de teste padronizado é tcalc x1 x2 μ1 μ2 52 48 0 0155 258 Passo 5 Posicionar o tcalc no gráfico analisar e escrever a Como o t calculado caiu dentro da região de rejeição então rejeitase H0 Portanto com base nas amostras é possível concluir que houve um aumento significativo na produção FIM z ESTATÍSTICA APLICADA AULA 24 TESTES DE HIPÓTESE PARTE II z Adaptado de THURMAN P W p 100 e 101 2012 Projeto do Milênio das Nações Unidas Os países não pertencentes ao G8 o grupo dos oito países de maior poder econômico possuem um produto interno bruto per capita PIB de US 1250 Agora as Nações Unidas declararam que o Projeto do Milênio melhorou de forma substancial a média per capita do PIB nesses países Na verdade uma amostra aleatória de 49 países fora do G8 revelou um PIB médio per capita de US 1400 com um desvio padrão de US 700 Considerando um nível de 10 responda a O Projeto do Milênio aumentou o PIB médio per capita dos países fora do G8 b A partir de uma perspectiva estatística perguntamos se US 1400 como média é estatística e significativamente diferente de US 1250 EXEMPLO 1 TESTES DE HIPÓTESES EXEMPLO 1 continuação a H0 Projeto do Milênio não aumentou o PIB médio per capita μ países não G8 US 1250 H1 Projeto do Milênio aumentou o PIB médio per capita μ países não G8 US 1250 dados n 49 países x 1400 s 700 α 10 1 α 90 90 50 40 128 X 1250 128100 1250 X Xcrit 1378 CONCLUSÃO Nesse caso como o valor de teste de US 1400 é maior que US 1378 rejeitamos a hipótese nula H0 e acreditamos que o Projeto do Milênio de fato aumentou significativamente a média do PIB per capita EXEMPLO 1 continuação b H0 μ países não G8 US 1250 H1 μ países não G8 US 1250 n 49 países σ 700 α 10 1 α 90 1α2 0902 045 Z 164 Z 1414 164 X 1250 X 1086 164 X 1250 X 1414 EXEMPLO 1 continuação b H0 μ países não G8 US 1250 H1 μ países não G8 US 1250 Sabemos que Xcalc 1400 CONCLUSÃO Nesse caso como o valor de teste de US 1400 não está em nenhuma das caudas aceitamos a hipótese nula H0 Assim parece que o Projeto Milênio não criou um PIB per capita médio estatística e significativamente diferente Exemplo 2 Uma dinâmica com candidatos a uma vaga no setor de produção propôs a construção de bancadas com 085m de altura Os administradores que estavam acompanhando o processo perceberam que os objetos tinham tamanhos diferentes Para tanto escolheram uma amostra de 8 bancadas e verificaram que a média do tamanho das mesmas é de 087m com desvio padrão de 0010m Considere nível de incerteza de 5 Solução Vamos testar as hipóteses H0 μ 085 H1 μ 085 teste bilateral Sabemos α 5 duas caídas 1 α 95 n 8 x 087 s 0010 n 30 σ é desconhecido dist t de student α2 0052 0025 tabela tStudent tcrit 2365 tcalc 087 085 0010 8 5667 z TESTES DE HIPÓTESES Conclusão Como 5667 2365 então devese rejeitar H0 µ 085 e aceitar H1 µ 085 ou seja a média de altura das bancadas é diferente de 085m 5667 Exemplo 2 continuação 0 z Exemplo 3 Um fabricante afirma que seus pneus radiais suportam em média uma quilometragem de 40000 km Adaptado STEVENSON W J p235236 1981 A Para testar essa afirmação o controle de qualidade selecionou uma amostra de 49 pneus Os testes nessa amostra forneceram uma média de 38000 km e desviopadrão de 3500 km Se a equipe testar essa afirmação ao nível de significância de 5 qual será sua conclusão Solução Precisamos verificar no enunciado qual a dica para escrever as hipóteses Analisando vemos que quem encomendou a pesquisa é o controle de qualidade Assim podemos escrever as hipóteses H0 µ 40000 H1 µ 40000 Dados dist Normal TESTES DE HIPÓTESES 𝑛 49 30 𝑥 38000 𝑠 3500 𝛼 5 Exemplo 3 continuação hipóteses H0 μ 40000 H1 μ 40000 bilateral α 5 duas caldas 1 α 95 1 α2 0952 0475 P0 Z Zc 045 tabela Zcrit 196 Vamos calcular o Zcalc Para isso temos Zcalc 38000 40000 3500 49 400 CONCLUSÃO Como 400 é inferior ao valor crítico inferior Z 196 o fabricante rejeitará H0 e concluirá que a vida média é diferente de 40000 Km aceitará H1 z B Para testar essa afirmação um órgão de defesa do consumidor selecionou uma amostra de 49 pneus Os testes nessa amostra forneceram uma média de 38000 km e desviopadrão de 3500 km Se o órgão testar essa afirmação ao nível de significância de 5 qual será sua conclusão Solução Precisamos verificar no enunciado qual a dica para escrever as hipóteses Analisando vemos que quem encomendou a pesquisa é um órgão de defesa do consumidor Assim podemos escrever as hipóteses H0 µ 40000 Hipóteses Dados dist Normal H1 µ 40000 Exemplo 3 continuação TESTES DE HIPÓTESES 𝑛 49 30 𝑥 38000 𝑠 3500 𝛼 5 Exemplo 3 B H0 μ 40000 Hipóteses H1 μ 40000 unilateral α 5 calda à esquerda 1 α 95 P0 Z Zc 045 tabela Zcrit 164 Zcalc 38000 40000 3500 49 400 CONCLUSÃO Como 400 excede o valor crítico inferior Zcrit 164 o órgão de defesa do consumidor rejeitará H0 e concluirá que a vida média é inferior a 40000 Km ou seja aceitará H1 Exemplo 4 Um fabricante afirma que seus pneus radiais suportam em média uma quilometragem com mais de 40000 km C Suponhamos uma amostra de 36 observações com média 41200 Km e desvio padrão amostral 3000 Km O fabricante decide testar 3 opções Vamos testar as hipóteses H0 μ 40000 1 H1 μ 40000 2 H1 μ 40000 3 H1 μ 40000 n 30 dist Normal Para 1 e 2 unilateral α 5 1α 95 95 50 45 P0 Z Zc 045 Zcrit 164 Para 3 bilateral α 5 soma das duas caldas EXEMPLO 4 continuação CONCLUSÕES H0 μ 40000 1 H1 μ 40000 Como 240 164 o fabricante aceitará H0 e concluirá que a vida média é igual a 40000 Km 2 H1 μ 40000 Como 240 164 o fabricante rejeitará H0 ou seja a vida média é superior a 40000 Km 3 H1 μ 40000 Como 240 196 o fabricante rejeitará H0 ou seja a vida média é diferente de 40000 Km FIM z ESTATÍSTICA APLICADA AULA 23 TESTES DE HIPÓTESE PARTE I z EXEMPLO 1 Indique as hipóteses nula H0 e alternativa H1 para cada uma das seguintes situações a Uma organização de teste de produtos duvida da afirmação de um fabricante de que suas pilhas tenham uma vida média de 25 horas sob operação contínua H0 µ 25 horas H1 µ 25 horas Teste unilateral à esquerda TESTES DE HIPÓTESES z EXEMPLO 1 b Tubos galvanizados devem ter uma média de 2 polegadas para serem aceitáveis H0 µ 2 polegadas H1 µ 2 polegadas Teste bilateral c Novas técnicas de instrução não serão implementadas a menos que se prove que a taxa média de aprendizagem melhorará em comparação com a técnica atualmente em uso H0 µ taxa média de aprendizagem atual H1 µ taxa média de aprendizagem atual Teste unilateral à direita TESTES DE HIPÓTESES z EXEMPLO 1 d Um fabricante de conservas deseja evitar excesso no enchimento de potes de 12 litros de geleia H0 µ 12 litros H1 µ 12 litros Teste unilateral à direita d O fabricante do item d deseja evitar deficiência e excesso no enchimento dos potes H0 µ 12 litros H1 µ 12 litros Teste bilateral TESTES DE HIPÓTESES z Se o valor da probabilidade estiver na região crítica de rejeição rejeitar Ho caso contrário aceitar H0 Imagem adaptado de TAVARES M p 107 REGIÕES DE ACEITAÇÃO E REJEIÇÃO TESTES DE HIPÓTESES CÁLCULOS DE Zcal e tcal 1 Zcrit e Zcalc Zcrit é o Z crítico referente ao nível de confiança Zcalc é o Z calculado de acordo com as hipóteses Neste caso a comparação ocorre nos valores da distr Normal Padrão N01 2 tcrit e tcalc tcrit é o t crítico referente ao nível de incerteza Neste caso a comparação ocorre nos valores da distr t Student 3 Valorcrit e Valorcalc Dado o Zcrit ou tcritic encontrase o Xcrit utilizando as fórmulas acima Neste caso a comparação ocorre ao nível da escala da variável do teste 4 ValorP ou pvalor probabilidade do evento ocorrer z Valorp ou pvalor Definição O valorP ou pvalor é uma probabilidade área da curva z ou t Esta probabilidade é calculada presumindose que a hipótese nula é verdadeira H0 TESTES DE HIPÓTESES Cuidado o valorP não é a probabilidade de que H0 seja verdadeira nem probabilidade de erro z PROCEDIMENTOS PARA UM TESTE O procedimento para um teste de hipóteses relativo a um parâmetro da população pode ser dividido em 4 passos i Definição das hipóteses nesse item escrevese as hipóteses Ho e Ha ii Identificação da estatística do teste e caracterização da sua distribuição nesse item definese a formulação e a distribuição de probabilidade utilizada iii Definição da regra de decisão com a especificação do nível de significância do teste nesse item desenhase a curva de probabilidade e delimitase a região crítica iv Cálculo do Zcalc ou tcalc estatística de teste e tomada de decisão nesse item efetuase os cálculos associados à estatística do teste e compara se com os limites da região crítica TESTES DE HIPÓTESES z EXEMPLO 2 Inspecionase uma amostra de 142 peças de uma grande remessa encontrandose 8 defeituosas O fornecedor garante que não haverá mais de 6 de peças defeituosas em cada remessa O que devemos responder com auxílio dos testes de significância é se a afirmação do fornecedor é verdadeira de acordo com 2 de significância Verificar se a hipótese do fornecedor é verdadeira TESTES DE HIPÓTESES Solução As hipóteses a serem formuladas são relacionadas a informação do fornecedor H0 p006 H1 p006 EXEMPLO 2 continuação Assim temos os dados H0 p 006 H1 p 006 α 2 n 142 p 006 q 094 Vamos calcular o desvio padrão σp σp pqn 006094142 002 Agora podemos calcular o Zcal através da expressão Zcalc x μxσx Zcalc 008 006002 100 EXEMPLO 2 continuação α 2 100 2 98 98 50 48 P0 Z Zcrit 048 Zcrit 205 Assim como Zcalc 100 é menor do que Zcrit 205 devese então aceitar H0 Conclusão Isso parece sugerir que a discrepância pode ser devida apenas ao acaso Não é preciso dizer que não podemos afirmar em definitivo que a população tenha realmente uma porcentagem de 6 de defeituosas mas em vista da distribuição amostral de tal população e da estatística amostral observada a afirmação H0 parece verdadeira EXEMPLO 2 continuação Outras formas de verificar a hipótese nula II Valor Crítico Zcrit 205 205 p006 002 p 01010 Assim pcalc pcrit 008 01010 portanto Aceitar Ho III Probabilidade ou Área valorP Zcalc 100 tabela P0Z10341345 Assim a probabilidade ou o valorp 05 0341345 01587 Então Valorp Valorcrit 01587 002 portanto Aceitar Ho pois a área calculada é maior do que a área de incerteza CONCLUSÃO FIM z Adaptado de THURMAN P W p 100 e 101 2012 Projeto do Milênio das Nações Unidas Os países não pertencentes ao G8 o grupo dos oito países de maior poder econômico possuem um produto interno bruto per capita PIB de US 1250 Agora as Nações Unidas declararam que o Projeto do Milênio melhorou de forma substancial a média per capita do PIB nesses países Na verdade uma amostra aleatória de 49 países fora do G8 revelou um PIB médio per capita de US 1400 com um desvio padrão de US 700 Considerando um nível de 10 responda a O Projeto do Milênio aumentou o PIB médio per capita dos países fora do G8 b A partir de uma perspectiva estatística perguntamos se US 1400 como média é estatística e significativamente diferente de US 1250 EXEMPLO 3 TESTES DE HIPÓTESES EXEMPLO 3 continuação a H0 Projeto do Milênio não aumentou o PIB médio per capita μ países não G8 US 1250 H1 Projeto do Milênio aumentou o PIB médio per capita μ países não G8 US 1250 n 49 países dados s 700 P0 Z Zc 040 Zcrit 128 α 10 1 α 90 90 50 40 128 X 1250 70049 128100 1250 X X 1378 CONCLUSÃO Nesse caso como o valor de teste de US 1400 é maior que US 1378 rejeitamos a hipótese nula H0 e acreditamos que o Projeto do Milênio de fato aumentou significantemente a média do PIB per capita EXEMPLO 3 continuação EXEMPLO 3 continuação z ESTATÍSTICA APLICADA AULA 22 INTRODUÇÃO AOS TESTES DE HIPÓTESES Características das Hipóteses z Uma hipótese estatística é uma afirmação sobre um parâmetro ou parâmetros associados a uma variável aleatória da população Um teste de hipóteses estatístico é um procedimento ou regra de decisão que nos possibilita decidir entre uma das hipóteses formuladas com base na informação contida na amostra Um teste de Hipótese envolve Aceitar ou Rejeitar decisões baseandose em um conjunto de evidências TESTES DE HIPÓTESES z EXEMPLOS Culpa ou inocência de um indivíduo num julgamento Eficiência ou não de uma vacina Pontualidade ou não na chegada dos funcionários Conteúdo líquido de garrafas segue ou não a orientação do rótulo como refrigerantes água sucos cervejas Falhas de comunicação em uma central de telefonia etc TESTES DE HIPÓTESES z Para testar um parâmetro populacional de modo geral devese formular duas hipóteses 1 Hipótese Nula representa uma afirmação sobre o parâmetro populacional 2 Hipótese Alternativa representa o complementar da afirmação anterior Consequência Quando uma das hipótese for verdadeira a outra deve ser falsa TESTES DE HIPÓTESES z Em resumo o teste de Hipótese envolve Aceitar ou Rejeitar a hipótese nula baseandose em dados retirados de uma amostra Uma vez tomada a decisão sobre o teste temos quatro possíveis resultados associados à essa escolha Decisão Tomada Ho é verdadeira Ho é falsa Aceitar Ho Decisão correta Erro do tipo II Rejeitar Ho Erro do tipo I Decisão correta 1 2 3 4 TESTES DE HIPÓTESES z O nível de significância α de um teste é a probabilidade de uma hipótese nula ser rejeitada quando verdadeira STEVENSON 2001225 α é igual à probabilidade associada ao erro tipo I situação 2 da tabela Devemos escolher o nível de significância ou seja a incerteza α que em geral varia de 1 a 5 TESTES DE HIPÓTESES z Vamos utilizar a distribuição Normal para qualquer tamanho de amostra se o desvio padrão da população é conhecido Vamos utilizar a distribuição Normal quando n 30 e se o desvio padrão da população é desconhecido mas nesse caso utilizamos no lugar de Vamos utilizar a distribuição t Student quando n 30 e se o desvio padrão da população é desconhecido TESTES DE HIPÓTESES z Dado um valor principal a hipótese nula H0 será dada por H0 µ média principal ou H0 p proporção principal H0 envolve o sinal de igualdade A contradição que anula a hipótese H0 ou seja a hipótese a ser verificada ou alternativa será H1 dada por H1 envolve sinal de desigualdade ou para µ e p Tanto H0 como H1 podem ser verdadeiras mas não as duas ao mesmo tempo TESTES DE HIPÓTESES z Teste Unilateral O teste da cauda a esquerda H1 envolve sinal para µ ou p É útil para verificar se determinado padrão mínimo foi atingido Exemplos conteúdo mínimo de gordura no leite Peso líquido de pacotes de determinado produto Resistência de correias à tensão Vida de um produto tal como especificada no certificado de garantia TESTES DE HIPÓTESES z O teste da cauda a direita H1 envolve sinal para µ ou p É útil para testar se determinado padrão máximo não foi excedido Exemplos Teor máximo de gordura permitido em determinado tipo de leite radiação emitida por usinas nucleares número de unidades defeituosas numa remessa de certa mercadoria quantidade de poluição atmosférica ocasionada por uma fábrica TESTES DE HIPÓTESES z Teste Bilateral H1 µ ou p O Teste Bilateral H1 envolve sinal para µ ou p Normalmente é utilizado sempre que a divergência crítica é em ambas as direções EXEMPLOS Tal como ocorreria na fabricação de roupas onde as camisas muito grandes ou muito pequenas não correspondem a determinado padrão o caso em que peças devem se ajustar uma a outra como parafuso e porca Uma variação excessiva ocasionará seja um ajuste muito frouxo de modo que as peças não permanecerão unidas ou um ajuste excessivo impedindo a conjugação das peças TESTES DE HIPÓTESES z Exercício EXEMPLO 2 capítulo 10 STEVENSON 2001238 Indique as hipóteses nula H0 e alternativa H1 para cada uma das seguintes situações a Uma organização de teste de produtos duvida da afirmação de um fabricante de que suas pilhas tenham uma vida média de 25 horas sob operação contínua H0 µ 25h H1 µ 25h z Exercício b Tubos galvanizados devem ter uma média de 2 polegadas para serem aceitáveis H0 µ 2 polegadas H1 µ 2 polegadas c Novas técnicas de instrução não serão implementadas a menos que se prove que a taxa média de aprendizagem melhorará em comparação com a técnica atualmente em uso H0 µ taxa média de aprendizagem H1 µ taxa média de aprendizagem melhorará em comparação com a técnica atualmente em uso z Exercício d Um fabricante de conservas deseja evitar excesso no enchimento de potes de 12 litros de geleia H0 µ 12l H1 µ 12l e O fabricante do item d deseja evitar deficiência e excesso no enchimento dos potes H0 µ 12l H1 µ 12l FIM z ESTATÍSTICA APLICADA AULA 19 EXEMPLOS DISTRIBUIÇÃO t DE STUDENT DISTRIBUIÇÃO t STUDENT Vamos relembrar o uso da tabela da distribuição t de student e analisar mais alguns casos EXEMPLO 1 Usando a tabela da distribuição t determine a t de forma que PT16 t 10 T16 significa que gl n 1 16 ou seja n 17 Procurar na tabela t16010 DISTRIBUIÇÃO t STUDENT EXEMPLO 1 continuação b PT49 20086 como a tabela em questão só tem 3 casas decimais após a vírgula usar PT49 2009 Solução T49 significa que gl n 1 49 ou seja n 50 se não tiver 49 na tabela devemos utilizar o mais próximo ou seja 50 Da tabela vemos que t002550 2009 Portanto PT49 20086 25 EXEMPLO 1 continuação c PT₃₆ 27238 como a tabela em questão só tem 3 casas decimais após a vírgula usar PT₃₆ 2724 Solução T₃₆ significa que gl n 1 36 ou seja n 37 como não tem na tabela ver nas linha 35 e buscar o valor mais próximo de 2724 Da tabela vemos que t₀00535 2724 Agora sabemos que PT₃₆ 2724 1 PT₃₅ 2724 Portanto PT₃₆ 27238 995 z Distribuição Normal Teorema do Limite Central Se é a média de uma amostra aleatória de tamanho n de uma população com a média e o desvio padrão e se a amostra é grande ou seja então a conversão será feita através da expressão DISTRIBUIÇÃO t STUDENT Onde População infinita População finita Distribuição t de Student Teorema do Limite Central Se x é a média de uma amostra aleatória de tamanho n de uma população com a média μ e o desvio padrão populacional σ desconhecido sendo substituído por s e se a amostra é pequena n 30 então a conversão será feita através da expressão População infinita t x μ s n População finita t x μ s n N n N 1 Onde μ x Variância s² 1 n 1 Σn i1x²i Σn i1xi² n grau de liberdade Intervalo de Confiança IC Estabelece limites que com certa probabilidade incluam o verdadeiro valor do parâmetro da população α nível de incerteza ou grau de desconfiança menor 1 α coeficiente de confiança ou nível de confiabilidade maior GRIFICAMENTE TEMSE n 30 zᵗᵁᵒᵑᵐᵉᵛ ₄⁰ ₁ α 2 ver dentro da tabela o valor mais próximo desse resultado para encontrar zᵗᵁᵒᵑᵐᵉᵛ ₄⁰ n 30 tᵗᵇ₈ₔ ₁ β α ₂ ver na tabela juntamente com o grau de liberdade gl n 1 para encontrar tᵗᵇ₈ₔ ₁ β EXEMPLO 2 Continuação b Qual deve ser o tamanho da amostra para obter no máximo a metade do erro anterior e 1128 e 2 0564 e s n t crit 2037 n 2145 0564 2037 2145 0564 n n 2037 2145 0564 n 2037 2145 2 n 7747 2 n 60 Para termos metade do erro anterior devemos ter pelo menos uma amostra de tamanho 60 unidades EXEMPLO 3 Um fabricante de bebidas deseja estimar a média de resistência de 250 garrafas provenientes de um lote da linha produção Sabese que a média e desvio padrão de 25 amostras que foram retiradas desse lote sem reposição são respectivamente 178966 e 8228 Com base nas medidas obtenha o intervalo de confiança de 99 para a média de resistência das garrafas desse lote Solução Sabemos que n 25 x 178966 s 8228 N 250 σ é desconhecido gl 24 amostra pequena pop é normal t 240005 t crit 2797 s x s n N n N 1 s x 8228 25 250 25 250 1 EXEMPLO 3 Continuação Vamos calcular o erro e t crit s x assim e 2797 1564 e 4375 Assim o Intervalo de Confiança será IC x e x e IC 178966 4375 178966 4375 IC 174591 183341 Portanto o verdadeira média de resistência das garrafas do lote deve estar no intervalo 174591 183341 com 99 de confiança EXEMPLO 4 O gerente de controle de qualidade de uma fábrica de lâmpadas de filamento precisa calcular a vida útil média de uma grande remessa de lâmpadas Uma amostra aleatória de 25 lâmpadas indicou uma vida útil média da amostra igual a 350 horas e desvio padrão de 100 horas Construa um intervalo de confiança de 99 para a média populacional Solução Sabemos que n 25 x 350 1 α 99 α 1 α2 05 σ é desconhecido amostra pequena pop é normal gl 24 Dist t de Student t240005 tcrit 2797 EXEMPLO 4 Continuação Vamos calcular o erro e tcrit sn assim e 2797 10025 e 55940 Assim o Intervalo de Confiança será IC x e x e IC 350 55940 350 55940 IC 29406 40594 Portanto a verdadeira vida média dos filamentos das lâmpadas deve estar no intervalo 29406 40594 com 99 de confiança z EXERCÍCIO De uma população normal cuja variância é desconhecida extraiu se uma amostra casual obtendose os seguintes valores 86 138 101 92 116 106 92 115 105 90 105 85 118 118 118 90 85 99 90 91 112 97 116 88 81 93 94 117 99 94 108 83 89 114 127 102 a construir um IC para µ ao nível de 1 baseando na distribuição t R 951686 1078314 b construir um IC para µ ao nível de 1 baseando na distribuição z R 955121 1074879 c comparar os resultados de a e b DISTRIBUIÇÃO t STUDENT FIM z A DISTRIBUIÇÃO t DE STUDENT AULA 18 z DISTRIBUIÇÃO t DE STUDENT Pelo Teorema do Limite Central temos que Se a população sob amostragem tem distribuição normal a distribuição das médias amostrais também será normal para todos os tamanhos de amostra Se a população é nãonormal a distribuição de médias amostrais será aproximadamente normal para grandes amostras Ainda pelo Teorema do Limite Central temos que Quando o tamanho da amostra é grande a distribuição das médias é aproximadamente Normal independente do comportamento da população Vimos que quando o desvio padrão da população não é conhecido o que é o caso geralmente devese trabalhar com o desvio padrão da amostra sx como uma estimativa de σx z DISTRIBUIÇÃO t DE STUDENT RESULTADO IMPORTANTE Se o desvio padrão da população é desconhecido e além disso as amostras tiverem 30 ou menos observações então devemos usar a distribuição t de Student ao invés da distribuição Normal z A distribuição t de Student desenvolvida por William Sealy Gosset é uma distribuição de probabilidade estatística semelhante à Normal na qual o número de graus de liberdade define e caracteriza a sua forma O número de graus de liberdade é definido por onde é o tamanho da amostra utilizada DISTRIBUIÇÃO t DE STUDENT z Vale ressaltar que a distribuição t de Student se aproxima da normal quando aumenta O gráfico da distribuição t é simétrico em relação à sua média que também é igual a zero e tem o formato semelhante à curva normal padrão porém com caudas mais largas tende a zero mais devagar DISTRIBUIÇÃO t DE STUDENT z DISTRIBUIÇÃO t DE STUDENT O GRÁFICO DA DISTRIBUIÇÃO t DE STUDENT z A tabela da distribuição t fornece um valor para a variável tal que a área probabilidade à sua direita seja conhecida com graus de liberdade ou seja é um valor tabelado tal que com graus de liberdade DISTRIBUIÇÃO t DE STUDENT z EXEMPLO 1 Qual o valor de na tabela tal que 10 com graus de liberdade DISTRIBUIÇÃO t DE STUDENT Procurando o valor desejado na tabela Concluímos que t 2228 z Sendo t uma distribuição com curva simétrica com relação à sua média assim como a normal também podemos afirmar que 10 10 DISTRIBUIÇÃO t DE STUDENT AINDA COM RELAÇÃO AO EXEMPLO 1 Assim podemos escrever 10 𝑃𝑇10 2228 1 0025 0975 e vale também Existem outras tabelas Neste caso a probabilidade calculada por toda a área à esquerda de tcrit PT tcrit 1 α z Então temos que com 10 gL 10 10 DISTRIBUIÇÃO t DE STUDENT VOLTANDO AO EXEMPLO 1 Qual o valor de na tabela tal que 10 com z EXEMPLO 2 Usando a tabela da distribuição t determine t de forma que 16 DISTRIBUIÇÃO t DE STUDENT 16 Da tabela vemos que para grau de liberdade 16 temos z DISTRIBUIÇÃO t DE STUDENT EXEMPLO 3 Usando a tabela da distribuição t determine t de forma que 5 5 Da tabela vemos que para grau de liberdade 5 temos 5 Inicialmente vamos analisar 𝑃𝑡 𝑇5 𝑡 99 Portanto podemos escrever que 5 EXEMPLO 4 Usando a tabela da distribuição t determine PT23 31 PT23 31 PT23 3104 Da tabela vemos que para grau de liberdade 23 temos PT23 3104 00025 Portanto PT23 31 00025 EXEMPLO 5 Usando a tabela da distribuição t determine PT29 2462 PT29 2462 1 PT29 2462 Da tabela vemos que para grau de liberdade 29 temos PT29 2462 001 Portanto PT29 2462 1 001 099 99 FIM