9
Estatística 1
UFOP
9
Estatística 1
UFOP
10
Estatística 1
UFOP
7
Estatística 1
UFOP
1
Estatística 1
UFSCAR
16
Estatística 1
UFSCAR
17
Estatística 1
UFSC
5
Estatística 1
IFMG
64
Estatística 1
UFSCAR
35
Estatística 1
UFGD
Texto de pré-visualização
a Encontre a probabilidade α do erro tipo I se a região crítica for x 185 b Qual será a probabilidade do erro tipo II se a altura média verdadeira da espuma for 185 milímetros c Encontre β para a média verdadeira de 195 milímetros 916 Repita o Exercício 915 supondo que o tamanho da amostra seja n 16 e que o limite da região crítica seja o mesmo 917 No Exercício 915 encontre o limite da região crítica se a probabilidade do erro tipo I for a α 001 e n 10 c α 001 e n 16 b α 005 e n 10 d α 005 e n 16 918 No Exercício 915 calcule a probabilidade de um erro tipo II se a verdadeira altura média de espuma for 185 milímetros e a α 005 e n 10 b α 005 e n 16 c Compare os valores de β calculados nos itens anteriores Que conclusão você pode tirar 919 No Exercício 915 calcule o valor p se a estatística observada for a x 180 b x 190 c x 170 920 Um fabricante está interessado na voltagem de saída de um fornecimento de energia usado em um computador pessoal A voltagem de saída é considerada normalmente distribuída com desviopadrão igual a 025 V O fabricante deseja testar H0 μ 5 V contra H1 μ 5 V usando n 8 unidades a A região de aceitação é 485 x 515 Encontre o valor de α b Encontre a potência do teste para detectar uma voltagem de saída média verdadeira de 51 V 921 Refaça o Exercício 920 usando o tamanho da amostra igual a 16 e mantenha os limites da região de aceitação Que impacto a mudança no tamanho da amostra terá nos resultados dos itens a e b 922 No Exercício 920 encontre o limite da região crítica se a probabilidade do erro tipo I for a α 001 e n 8 c α 001 e n 16 b α 005 e n 8 d α 005 e n 16 923 No Exercício 920 calcule o valor p se a estatística observada for a x 52 b x 47 c x 51 924 No Exercício 920 calcule a probabilidade de um erro tipo II se a saída média verdadeira for 505 V e a α 005 e n 10 b α 005 e n 16 c Compare os valores de β calculados nos itens anteriores Que conclusão você pode tirar 925 A proporção de adultos com 3ª grau e vivendo em Tempe Arizona é estimada como p 04 Para testar essa hipótese selecionase uma amostra aleatória de 15 adultos Se o número de graduados estiver entre 4 e 8 a hipótese será aceita do contrário concluiremos que p 04 a Encontre a probabilidade do erro tipo I para esse procedimento considerando p 04 b Encontre a probabilidade de cometer um erro tipo II se a proporção verdadeira for realmente p 02 926 Acreditase que p 03 seja a proporção em Fênix de moradores favoráveis à construção de estradas com pedágios de modo a completar o sistema de rodovias Se uma amostra aleatória de 10 moradores mostrar que 1 ou menos é favorável a essa proposta concluiremos que p 03 a Encontre a probabilidade do erro tipo I se a proporção verdadeira for p 03 b Encontre a probabilidade de cometer um erro tipo II com esse procedimento se p 02 c Qual será a potência desse procedimento se a proporção verdadeira for p 02 927 Uma amostra aleatória contém 500 votantes registrados em Fênix Eles são perguntados se são favoráveis ao uso de combustíveis oxigenados para reduzir a poluição do ar Se mais de 400 votantes responderem positivamente concluiremos que mais de 60 dos votantes são favoráveis ao uso desses combustíveis Tamanho da Amostra Valor P Potência para α 005 n Quando x 505 Quando μ Verdadeiro 505 10 0527 0097 25 0317 0170 50 0157 0293 100 0046 0516 400 63 x 105 0979 1000 25 x 1010 1000 A coluna de valor P nesse quadro indica que para tamanhos grandes de amostra o valor amostral observado de x 505 fortemente sugere que H0 μ 50 deve ser rejeitada muito embora os resultados observados da amostra impliquem que de um ponto de vista prático a média verdadeira não difere muito do valor usado na hipótese μ 50 A coluna de potência indica que se testarmos uma hipótese com um nível fixo de significância α e mesmo se houver pouca diferença prática entre a média verdadeira e o valor usado na hipótese uma amostra de tamanho grande conduzirá quase sempre à rejeição de H0 A moral dessa demonstração é clara Seja cuidadoso ao interpretar os resultados do teste de hipóteses quando a amostra tiver tamanho grande visto que qualquer pequeno desvio do valor usado na hipótese μ0 será provavelmente detectado mesmo quando a diferença for de pouca ou nenhuma significância prática EXERCÍCIOS PARA A SEÇÃO 91 91 Em cada uma das seguintes situações estabeleça se esse é um problema corretamente posto de teste de hipóteses e por quê a H0 μ 25 H1 μ 25 b H0 σ 10 H1 σ 10 c H0 x 50 H1 x 50 d H0 p 01 H1 p 05 e H0 s 30 H1 s 30 92 Um fabricante de semicondutores coleta dados provenientes de uma nova ferramenta e conduz um teste de hipóteses com a hipótese nula sendo a largura média de uma dimensão crítica igual a 100 nm A conclusão é não rejeitar a hipótese nula Esse resultado fornece uma evidência forte de que a média da dimensão crítica é igual a 100 nm Explique 93 O desviopadrão da espessura de uma dimensão crítica na fabricação de semicondutores é σ 20 nm a Estabeleça as hipóteses nula e alternativa usadas para demonstrar que o desviopadrão é reduzido b Considere que o teste prévio não rejeita a hipótese nula Esse resultado fornece evidência forte de que o desviopadrão não foi reduzido Explique 94 A força média de remoção de um conector depende do tempo de cura a Estabeleça as hipóteses nula e alternativa usadas para demonstrar que a força de remoção está abaixo de 25 newtons b Considere que o teste prévio não rejeita a hipótese nula Esse resultado fornece evidência forte de que a força de remoção é maior ou igual a 25 newtons Explique 95 Um fabricante de fibra têxtil está investigando um novo fio que a companhia afirma ter um alongamento médio de 12 quilogramas com um desviopadrão de 05 quilograma A companhia deseja testar a hipótese H0 μ 12 contra H1 μ 12 usando uma amostra aleatória de quatro espécimes a Qual será a probabilidade do erro tipo I se a região crítica for definida como x 115 quilogramas b Encontre β para o caso em que o alongamento médio verdadeiro seja 1125 quilogramas c Encontre β para o caso em que a média verdadeira seja 115 quilogramas 96 Repita o exercício 95 usando um tamanho de amostra de n 16 e a mesma região crítica 97 No Exercício 95 encontre o limite da região crítica se a probabilidade do erro tipo I for a α 001 e n 4 c α 001 e n 16 b α 005 e n 4 d α 005 e n 16 98 No Exercício 95 calcule a probabilidade de um erro tipo II se a elongação média verdadeira for 115 quilogramas e a α 005 e n 4 b α 005 e n 16 c Compare os valores de β calculados nos itens anteriores Que conclusão você pode tirar 99 No Exercício 95 calcule o valor P se a estatística observada for a x 1125 b x 110 c x 1175 910 O calor liberado em calorias por grama de uma mistura de cimento tem distribuição aproximadamente normal A média deve ser 100 e o desviopadrão é 2 Desejamos testar H0 μ 100 versus H1 μ 100 com uma amostra de n 9 espécimes a Se a região de aceitação for definida como 985 x 1015 encontre a probabilidade α do erro tipo I b Encontre β para o caso em que o verdadeiro calor médio liberado seja 103 c Encontre β para o caso em que o verdadeiro calor médio liberado seja 105 Esse valor de β é menor do que aquele encontrado no item b Por quê 911 Repita o Exercício 910 usando um tamanho de amostra de n 5 e a mesma região de aceitação 912 No Exercício 910 encontre o limite da região crítica se a probabilidade do erro tipo I for a α 001 e n 9 c α 001 e n 5 b α 005 e n 9 d α 005 e n 5 913 No Exercício 910 calcule a probabilidade de um erro tipo II se o verdadeiro calor médio liberado for 103 c a α 005 e n 9 b α 005 e n 5 c Compare os valores de β calculados nos itens anteriores Que conclusão você pode tirar 914 No Exercício 910 calcule o valor p se a estatística observada for a x 98 b x 101 c x 102 915 Uma companhia de produtos para consumidor está formulando um xampu novo e está interessada na altura em milímetros da espuma A altura da espuma tem distribuição aproximadamente normal com um desviopadrão de 20 milímetros A companhia deseja testar H0 μ 175 milímetros versus H1 μ 175 milímetros usando os resultados de n 10 amostras Capítulo 91 Testes de Hipóteses Fundamentos erros aplicações Curso Estatística Aplicada à Engenharia Nome Data Objetivos da Aula Compreender o que é hipótese estatística Diferenciar H₀ e H₁ Visualizar regiões crítica aceitação Relacionar erros I e II α β e potência Exemplificar testes uni bilaterais Resolver exercícios práticos em sala Hipótese Estatística Uma afirmação sobre os parâmetros de uma ou mais populações Exemplos típicos média proporção variância Origem problemas de decisão na engenharia pex taxa de queima H₀ Hipótese Nula H₁ Alternativa Situação H₀ H₁ Propelente μ 50 cms μ 50 cms Garrafas μ 200 psi μ 200 psi Exemplo Industrial Problema Demonstrar que μ 50 cms Dados σ 25 cms n 10 X 485 Estatísticateste Z X 50σn 190 Região crítica Z 196 α 005 bilateral Resultado não rejeita H0 Z 196 Erros Tipo I e Tipo II Tipo I α rejeitar H₀ quando ela é verdadeira Tipo II β falhar em rejeitar H₀ quando H₀ é falsa α é pré fixado β depende de n σ e diferença real Trade off baixar α β e vice versa Nível de Significância α Probabilidade de falso alarme Escolhido conforme custo de errar Representado por área sombreada nas caudas Potência do Teste 1 β Capacidade de detectar uma diferença real Aumenta com n maior μ₁μ₀ maior σ menor Ex n 10 μ₁ 52 cms potência 074 Testes Unilaterais vs Bilaterais Bilaterais desvios em qualquer direção duas caudas Unilaterais interesse em uma direção uma cauda Unilaterais têm maior potência para mesmo n Escolha depende da hipótese prática Estatística de Teste Z Z X μ₀σn População Normal ou n grande TLC Z crítico obtido da Tabela NormalPadrão Valor P Probabilidade de obter resultado extremo sob H₀ Valor P α rejeita H₀ Valor P α falha em rejeitar H₀ Ex X 513 n 16 P 0038 Teste Intervalo de Confiança H₀ rejeitada se μ₀ cair fora do IC1 α IC comunica incerteza e risco Procedimento em 7 Passos 1 Definir parâmetro de interesse 2 Formular H₀ e H₁ 3 Escolher α 4 Selecionar estatística teste 5 Derivar região crítica ou valor P 6 Coletar dados computar estatística 7 Concluir e comunicar Exercício 1 Formulação Garrafas especificação μ 200 psi σ conhecida a Escreva H₀ e H₁ se controle quer evidenciar falha b Teste será uni ou bilateral Exercício 2 Decisão σ 25 cms n 16 α 005 H₀ μ 50 H₁ μ 50 a Calcule região crítica em termos de X b Se X 513 cms qual a decisão c Qual o valor P Resumo Conclusões Testes ferramenta de decisão estatística Trade off α β importância do tamanho da amostra Valor P comunica evidência sem fixar α Referências Essa hipótese nula seria rejeitada para qualquer 0038 α porém não seria rejeitada para um nível menor de significância tal como 001 Valores P são freqüentemente calculados dessa maneira O valor observado da estatística de teste é usado para definir uma regiao crítica sendo calculado o α associado com essa região crítica Não é sempre fácil calcular o valor exato de P para um teste No entanto a maioria dos programas computacionais modernos para análise estatística reporta valores de P Mostraremos também como aproximar o valor P 915 Conexão entre Testes de Hipóteses e Intervalos de Confiança Há uma relação íntima entre o teste de uma hipótese acerca de um parâmetro ou seja θ e o intervalo de confiança para θ Se Lu for um intervalo de confiança de 1001 α para o parâmetro θ o teste de tamanho α das hipóteses H0 θ θ0 H1 θ θ0 conduzirá a rejeição de H0 se e somente se θ0 não estiver no IC Lu de 1001 α Como ilustração considere o sistema de escape do problema do propelente com X 513 σ 25 e n 16 A hipótese nula H0 μ 50 foi rejeitada usando α 005 O IC bilateral de 95 para μ pode ser calculado usando a Equação 87 Esse IC é 513 196 2516 o que quer dizer 50075 μ 52525 Uma vez que o valor H0 μ 50 não está incluído nesse intervalo a hipótese nula H0 μ 50 é rejeitada Embora testes de hipóteses e ICs sejam procedimentos equivalentes visto que a tomada de decisão ou inferência sobre μ seja de interesse cada um fornece algum conhecimento de algum modo diferente Por exemplo o intervalo de confiança fornece uma faixa de valores prováveis para μ em um nível estabelecido de confiança enquanto o teste de hipóteses é uma estrutura fácil para dispor os níveis de risco tal como o valor P associado com uma decisão específica Continuaremos a ilustrar a conexão entre os dois procedimentos ao longo de todo o texto 916 Procedimento Geral para Testes de Hipóteses Este capítulo desenvolve os procedimentos de testes de hipóteses para muitos problemas práticos O uso do seguinte sequência de etapas na metodologia de aplicação de testes de hipóteses é recomendado 1 A partir do contexto do problema identifique o parâmetro de interesse 2 Estabeleça a hipótese nula H0 3 Especifique uma hipótese alternativa apropriada H1 4 Escolha um nível de significância α 5 Determine uma estatística apropriada de teste 6 Estabeleça a região de rejeição para a estatística 7 Calcule quaisquer grandezas amostrais necessárias substituaas na equação para a estatística de teste e calcule aquele valor 8 Decida se H0 deve ou não ser rejeitada e reporte isso no contexto do problema As etapas 14 devem ser completadas antes de examinar os dados amostrais Essa sequência de etapas será ilustrada nas seções subsequentes Na prática tal procedimento formal e aparentemente rígido não é sempre necessário Geralmente uma vez que o experimentalista ou o tomador de decisão tenha decidido sobre a questão de interesse e tenha determinado o planejamento de experimentos isto é como os dados devem ser coletados como as medidas devem ser feitas e quantas observações são necessárias somente três etapas são realmente requeridas 1 Especificar a estatística de teste a ser usada tal como Zα 2 Especificar a localização da região crítica bilateral unilateral superior ou unilateral inferior 3 Especificar os critérios de rejeição tipicamente o valor de α ou o valor P no qual a região deveria ocorrer Essas etapas são freqüentemente completadas quase simultaneamente na resolução de problemas do mundo real embora enfatizamos que é importante pensar cuidadosamente sobre cada etapa Essa é a razão pela qual apresentamos e usamos o processo de oito etapas parece reforçar o essencial da abordagem correta Mesmo que você não a use toda vez para resolver problemas reais ela é uma estrutura útil quando se está aprendendo o teste de hipóteses pela primeira vez Significância Estatística versus Significância Prática Notamos previamente que é muito útil reportar os resultados de um teste de hipóteses em termos do valor P porque ele carrega mais informação que a simples afirmação rejeita H0 ou falha em rejeitar H0 Ou seja a rejeição de H0 com nível de 005 de significância é muito mais significativa se o valor da estatística de teste estiver bem na região crítica excedendo em muito o valor crítico de 5 do que se ele estiver excedendo pouco aquele valor Mesmo um valor pequeno de P pode ser difícil de interpretar do ponto de vista prático quando estamos tomando decisões pois enquanto um valor pequeno de P indica estatisticamente significativo no sentido de que H0 deve ser rejeitada em favor de H1 o desvio real de H0 que foi detectado pode ter pouca se alguma significância prática engenheiros gostam de dizer significância de engenharia Isso é particularmente verdade quando o tamanho da amostra n é grande Por exemplo considere o problema da taxa de queima do propelente do Exemplo 91 em que testamos H0 μ 50 centímetros por segundo versus H1 μ 50 centímetros por segundo com σ 25 Se supusermos que a taxa média é realmente 505 centímetros por segundo então esse não é um desvio sério de H0 μ 50 centímetros por segundo no sentido de que se a média realmente for 505 centímetros por segundo não haverá efeito prático observável no desempenho do sistema de escapamento da aeronave Em outras palavras concluir que μ 50 centímetros por segundo quando ela é realmente 505 centímetros por segundo é um erro que não é caro e não tem significância prática Para um tamanho de amostra razoavelmente grande um valor verdadeiro de μ 505 centímetros por segundo conduzirá a um X da amostra que está perto de 505 centímetros por segundo e não queremos que esse valor de X proveniente da amostra resulte na rejeição de H0 O quadro a seguir mostra o valor P para testar H0 μ 50 quando observamos X 505 centímetros por segundo e a potência do teste com α 005 quando a média verdadeira é 505 para vários tamanhos n de amostra 182 Capítulo 9 Em alguns problemas do mundo real em que os procedimentos de testes unilaterais são indicados é ocasionalmente difícil escolher uma formulação apropriada da hipótese alternativa Por exemplo suponha que um engarrafador de refrigerantes compre 10 garrafas de 10 onças de uma companhia de vidro O engarrafador quer estar certo de que as garrafas reúnem as especificações de pressão interna média ou resistência à explosão que para garrafas de 10 onças a resistência mínima é 200 psi O engarrafador decidiu formular o procedimento de decisão para um lote específico de garrafas como um problema de teste de hipóteses Há duas formulações possíveis para esse problema H0 μ 200 psi H1 μ 200 psi 95 ou H0 μ 200 psi H1 μ 200 psi 96 Considere a formulação na Equação 95 Se a hipótese nula for rejeitada as garrafas serão julgadas satisfatórias se H0 não for rejeitada a implicação é que as garrafas não obedecem as especificações e não devem ser usadas Como rejeitar H0 é uma conclusão forte essa formulação força o fabricante de garrafas a demonstrar que a resistência média à explosão das garrafas excede a especificação Agora considere a formulação na Equação 96 Nessa situação as garrafas serão julgadas satisfatórias a menos que H0 seja rejeitada Ou seja concluímos que as garrafas são satisfatórias a menos que haja uma forte evidência do contrário Qual formulação é a correta aquela da Equação 95 ou da Equação 96 A resposta depende do objetivo da análise Para a Equação 95 há alguma probabilidade de que H0 não seja rejeitada isto é decididirmos que as garrafas não seriam satisfatórias muito embora a média verdadeira seja levemente maior que 200 psi Essa formulação implica querermos que o fabricante de garrafas demonstre que o produto encontre ou exceda nossas especificações Tal formulação poderia ser apropriada se o fabricante tivesse experimentado dificuldade em encontrar as especificações no passado ou se as considerações de segurança do produto nos forçassem a manter firmemente a especificação de 200 psi Por outro lado para a formulação da Equação 96 há alguma probabilidade de que H0 seja aceita e as garrafas julgadas satisfatórias muito embora a média verdadeira seja levemente menor que 200 psi Concluíremos que as garrafas são insatisfatórias somente quando houvesse uma forte evidência de que a média não excederia 200 psi ou seja quando H0 μ 200 psi fosse rejeitada Essa formulação considera que estamos relativamente felizes com o desempenho passado do fabricante de garrafas e que pequenos desvios da especificação de μ 200 psi não são prejudiciais Na formulação das hipóteses unilaterais devemos lembrar que rejeitar H0 é sempre uma forte conclusão Conseqüentemente devemos nos perguntar o que é importante para fazer uma forte conclusão na hipótese alternativa Em problemas do mundo real isso dependerá freqüentemente do nosso ponto de vista e da nossa experiência com a situação 914 Valores P nos Testes de Hipóteses Uma maneira de reportar os resultados de um teste de hipóteses é estabelecer que a hipótese nula foi ou não rejeitada com um valor especificado de α ou nível de significância Por exemplo no problema anterior do propelente podemos dizer que H0 μ 50 foi rejeitada com um nível de significância de 005 Essa forma de conclusões é freqüentemente inadequada porque ela não dá idéia ao tomador de decisão a respeito de que o valor calculado da estatística de teste estava apenas nas proximidades da região de rejeição ou se estava muito longe dessa região Além disso o estabelecimento dos resultados dessa maneira impõe o nível predefinido de significância aos outros usuários da informação Essa abordagem pode ser insatisfatória uma vez que alguns tomadores de decisão podem ficar desconfortáveis com os riscos implicados por α 005 Com o objetivo de evitar essas dificuldades a abordagem do valor P tem sido largamente adotada na prática O valor P é a probabilidade de que a estatística de teste assumirá um valor que é no mínimo tão extremo quanto o valor observado da estatística quando a hipótese nula H0 for verdadeira Assim um valor P carrega muita informação sobre o peso da evidência contra H0 logo um tomador de decisão pode retirar uma conclusão com qualquer nível especificado de significância Daremos agora uma definição formal de um valor P Valor P O valor P é o menor nível de significância que conduz à rejeição da hipótese nula H0 com os dados fornecidos É costume chamar a estatística de teste e os dados de significante quando a hipótese nula H0 for rejeitada por conseguinte podemos pensar a respeito do valor P como o menor nível α em que os dados são significantes Uma vez que o valor P seja conhecido o tomador de decisão pode determinar quão significantes os dados são sem o analista de dados impor formalmente um nível préselecionado de significância Considere o teste bilateral de hipóteses para a taxa de queima H0 μ 50 H1 μ 50 com n 16 e σ 25 Suponha que a média amostral observada seja X 513 centímetros por segundo A Fig 96 mostra uma região crítica para esse teste com valores críticos em 513 e no valor simétrico 487 O valor P do teste é o valor α associado com essa região crítica Qualquer valor menor para α diminui a região crítica e o teste falha em rejeitar a hipótese nula quando x 513 centímetros por segundo O valor P é fácil de calcular depois de a estatística de teste ser observada Nesse exemplo Valor 1 1 07 06 05 04 03 487 02 01 48 49 50 51 52 53 X 513 Figura 96 O valor p é a área da região sombreada quando X 513 Região de Aceitação Tamanho da Amostra α β em µ 52 β em µ 505 485 x 515 10 00576 02643 08923 48 x 52 10 00114 05000 09705 4881 x 5119 16 00576 00966 08606 4842 x 5158 16 00114 02515 09578 Os resultados nos retângulos não foram calculados no texto porque podem ser facilmente verificados pelo leitor Essa apresentação e a discussão anterior revelam quatro pontos importantes 1 O tamanho da região crítica e conseqüentemente a probabilidade do erro tipo I α pode sempre ser reduzido através da seleção apropriada dos valores críticos 2 Os erros tipo I e tipo II estão relacionados Uma diminuição na probabilidade de um tipo de erro sempre resulta em um aumento da probabilidade do outro desde que o tamanho da amostra n não varie 3 Um aumento no tamanho da amostra reduzirá β desde que α seja mantido constante 4 Quando a hipótese nula é falsa β aumenta à medida que o valor verdadeiro do parâmetro se aproxima do valor usado na hipótese nula O valor de β diminui à medida que aumenta a diferença entre a média verdadeira e o valor utilizado na hipótese Geralmente αa analista controla a probabilidade α do erro tipo I quando ele ou ela seleciona os valores críticos Assim geralmente é fácil para o analista estabelecer a probabilidade de erro tipo I em ou perto de qualquer valor desejado Uma vez que o analista pode controlar diretamente a probabilidade de rejeitar erroneamente H0 sempre pensamos na rejeição da hipótese nula H0 como uma conclusão forte Por outro lado a probabilidade β do erro tipo II não é constante mas depende do valor verdadeiro do parâmetro Ela depende também do tamanho da amostra que tenhamos selecionado Pelo fato de a probabilidade β do erro tipo II ser uma função do tamanho da amostra e da extensão com que a hipótese nula H0 é falsa costumase pensar na aceitação de H0 como uma conclusão fraca a menos que saibamos que β seja aceitavelmente pequena Conseqüentemente em vez de dizer aceitar H0 preferimos a terminologia falhar em rejeitar H0 Falhar em rejeitar H0 implica que não encontramos evidência suficiente para rejeitar H0 ou seja para fazer uma afirmação forte Falhar em rejeitar H0 não significa necessariamente que haja uma alta probabilidade de que H0 seja verdadeira Isso pode significar simplesmente que mais dados são requeridos para atingir uma conclusão forte Isso pode ter implicações importantes para a formulação das hipóteses Um importante conceito de que faremos uso é a potência de um teste estatístico Potência A potência de um teste estatístico é a probabilidade de rejeitar a hipótese nula H0 quando a hipótese alternativa for verdadeira A potência é calculada como 1 β e a potência pode ser interpretada como a probabilidade de rejeitar corretamente uma hipótese nula falsa Frequentemente comparamos testes estatísticos através da comparação de suas propriedades de potência Por exemplo considere o problema da taxa de queima de propelente quando estamos testando H0 µ 50 centímetros por segundo contra H1 µ 50 centímetros por segundo Suponha que o valor verdadeiro da média seja µ 52 Quando n 10 encontramos que β 02643 assim a potência desse teste é A potência é uma medida muito descritiva e concisa da sensibilidade de um teste estatístico em que por sensibilidade entendemos a habilidade do teste de detectar diferenças Nesse caso a sensibilidade do teste para detectar a diferença entre a taxa média de queima de 50 centímetros por segundo e 52 centímetros por segundo é 07357 Isto é se a média verdadeira for realmente 52 centímetros por segundo esse teste rejeitará corretamente H0 µ 50 e detectará essa diferença em 7357 das vezes Se esse valor de potência for julgado como muito baixo o analista poderá aumentar tanto α como o tamanho da amostra n 913 Hipóteses Unilaterais e Bilaterais Na construção de hipóteses sempre vamos estabelecer a hipótese nula como uma igualdade de modo que a probabilidade do erro tipo I α pode ser controlada em um valor específico A hipótese alternativa tanto pode ser unilateral como bilateral dependendo da conclusão a ser retirada se H0 é rejeitada Se o objetivo é fazer uma alegação envolvendo afirmações tais como maior que menor que superior a excede no mínimo e assim por diante uma alternativa unilateral é apropriada Se nenhuma direção é implicada pela alegação ou se for feita a alegação não igual a uma alternativa bilateral deve ser usada EXEMPLO 91 Taxa de Queima de um Propelente Considere o problema da taxa de queima de um propelente Suponha que se a taxa de queima for menor do que 50 centímetros por segundo desejamos mostrar esse fato com uma conclusão forte As hipóteses deveriam ser estabelecidas como Aqui a região crítica está na extremidade inferior da distribuição de 𝑋 Visto que a rejeição de H0 é sempre uma conclusão forte essa afirmação das hipóteses produzirá o resultado desejado se H0 for rejeitado Note que embora a hipótese nula seja estabelecida com um sinal de igual devese incluir qualquer valor de µ não especificado pela hipótese alternativa Desse modo falhar em rejeitar H0 não significa que µ 50 centímetros por segundo exatamente mas somente que não temos evidência forte em suportar H1 180 Capítulo 9 verdadeira e o valor da média for 52 ou sujeita a H1 µ 52 Agora um erro tipo II será cometido se a média amostral x cair entre 485 e 515 os limites da região crítica quando µ 52 Como visto na Fig 93 essa é apenas a probabilidade de 485 X 515 quando a média verdadeira for µ 52 ou a área sombreada sob a distribuição normal centralizada em µ 52 Conseqüentemente referindonos à Fig 93 encontramos que Os valores z1 correspondentes a 485 e 515 quando µ 52 são Logo Assim se estivermos testando H0 µ 50 contra H1 µ 50 com n 10 e o valor verdadeiro da média for µ 52 a probabilidade de falharmos em rejeitar a falsa hipótese nula é 02643 Por simetria se o valor verdadeiro da média for µ 48 o valor de β será também 02643 A probabilidade de cometer o erro tipo II β aumenta rapidamente à medida que o valor verdadeiro de µ se aproxima do valor da hipótese feita Por exemplo ver Fig 94 em que o valor verdadeiro da média é µ 505 e o valor da hipótese é H0 µ 50 O valor verdadeiro de µ está muito perto de 50 e o valor para β é Conforme mostrado na Fig 94 os valores de z correspondentes a 485 e 515 quando µ 505 são a 485 e 515 quando µ 505 são Assim a probabilidade do erro tipo II é muito maior para o caso em que a média verdadeira é 505 centímetros por segundo do que para o caso em que a média é 52 cms Naturalmente em muitas situações práticas não estaríamos preocupados em cometer o erro tipo II se a média fosse próxima do valor utilizado na hipótese Estaríamos muito mais interessados em detectar grandes diferenças entre a média verdadeira e o valor especificado na hipótese nula A probabilidade do erro tipo II depende também do tamanho da amostra n Suponha que a hipótese nula seja H0 µ 50 centímetros por segundo e que o valor verdadeiro da média seja µ 52 Se o tamanho da amostra for aumentado de n 10 para n 16 resulta a situação da Fig 95 A distribuição normal na esquerda é a distribuição de 𝑋 quando a média é µ 50 e a distribuição normal na direita é a distribuição de 𝑋1 quando µ 52 Conforme mostrado na Fig 95 a probabilidade do erro tipo II é β P485 𝑋 515 quando µ 52 Quando n 16 o desviopadrão de 𝑋 é σ𝑛 2516 0625 e os valores z correspondentes a 485 e 515 quando µ 52 são Desse modo β P𝑧 560 z 080 Pz 080 Lembrese de que quando n 10 e µ 52 encontramos que β 02643 conseqüentemente o aumento do tamanho da amostra resulta em uma diminuição na probabilidade de erro tipo II Os resultados desta seção e outros poucos cálculos similares estão resumidos na tabela a seguir Os valores críticos são ajustados para manter α iguais para n 10 e n 16 Esse tipo de cálculo é discutido mais adiante no capítulo Figura 93 A probabilidade do erro tipo II quando µ 52 e n 10 Figura 94 A probabilidade do erro tipo II quando µ 505 e n 10 Figura 95 A probabilidade do erro tipo II quando µ 52 e n 16 Agora suponha que a taxa média verdadeira de queima seja diferente de 50 centímetros por segundo mesmo que a média amostral x caia na região de aceitação Nesse caso falharíamos em rejeitar H0 quando ela fosse falsa Esse tipo de conclusão errada é chamado de erro tipo II Erro Tipo II A falha em rejeitar a hipótese nula quando ela for falsa é definida como um erro tipo II Assim testando qualquer hipótese estatística quatro situações diferentes determinam se a decisão final está correta ou errada Essas situações estão apresentadas na Tabela 91 Tabela 91 Decisões no Teste de Hipóteses Pelo fato de a nossa decisão estar baseada em variáveis aleatórias probabilidades podem ser associadas com os erros tipo I e tipo II na Tabela 91 A probabilidade de cometer o erro tipo I é denotada pela letra grega α Algumas vezes a probabilidade do erro tipo I é chamada de nível de significância ou erro α ou tamanho do teste No exemplo da taxa de queima do propelente um erro tipo I ocorrerá quando x 515 ou x 485 quando a taxa média verdadeira de queima do propelente for µ 50 centímetros por segundo Suponha que o desviopadrão da taxa de queima seja σ 25 centímetros por segundo e que a taxa de queima tenha uma distribuição para a qual as condições do teorema do limite central se aplicam de modo que a distribuição da média amostral seja aproximadamente normal com média µ 50 e desviopadrão σ𝑛 2510 079 A probabilidade de cometer o erro tipo I ou o nível de significância de nosso teste é igual à soma das áreas que tenham sido sombreada nas extremidades da distribuição normal na Fig 92 Podemos achar essa probabilidade como Os valores de z que correspondem aos valores críticos 485 e 515 são Logo Isso implica que 574 de todas as amostras aleatórias conduziriam à rejeição da hipótese H0 µ 50 centímetros por segundo quando a taxa média verdadeira de queima fosse realmente 50 centímetros por segundo Da inspeção da Fig 92 notamos que podemos reduzir α alargando a região de aceitação Por exemplo se considerarmos os valores críticos 48 e 52 o valor de α será Poderíamos também reduzir α aumentando o tamanho da amostra Se n 16 então σ𝑛 2516 0625 e usando a região crítica original da Fig 91 encontramos Desse modo Na avaliação de um procedimento de teste de hipóteses também é importante examinar a probabilidade de um erro tipo II que denotaremos por β Isto é Para calcular β algumas vezes chamado de erro β temos de ter uma hipótese alternativa específica ou seja temos de ter um valor particular de µ Por exemplo suponha que seja importante rejeitar a hipótese nula H0 µ 50 toda vez que a taxa média de queima µ seja maior do que 52 centímetros por segundo ou menor do que 48 centímetros por segundo Poderíamos calcular a probabilidade de um erro tipo II β para os valores µ 52 e µ 48 e usar esse resultado para nos dizer alguma coisa acerca de como seria o desempenho do procedimento de teste Especificamente como o procedimento de teste funcionará se desejarmos detectar ou seja rejeitar H0 para um valor médio de µ 52 ou µ 48 Por causa da simetria só é necessário avaliar um dos dois casos encontrar a probabilidade de aceitar a hipótese nula H0 µ 50 centímetros por segundo quando a média verdadeira for µ 52 centímetros por segundo A Fig 93 nos ajudará a calcular a probabilidade do erro tipo II β A distribuição normal no lado esquerdo da Fig 93 é a distribuição da estatística de teste 𝑋 quando a hipótese nula H0 µ 50 for verdadeira ou seja isso é o que se entende pela expressão sujeita a H0 µ 50 A distribuição normal no lado direito é a distribuição de 𝑋 quando a hipótese alternativa for 91 TESTES DE HIPÓTESES 911 Hipóteses Estatísticas No capítulo anterior ilustramos como construir uma estimativa de intervalos de confiança de um parâmetro a partir de dados amostrais Entretanto muitos problemas em engenharia requere que decidamos entre aceitar ou rejeitar uma afirmação acerca de algum parâmetro A afirmação é chamada de hipótese e o procedimento de tomada de decisão sobre a hipótese é chamado de teste de hipóteses Esse é um dos mais úteis aspectos da inferência estatística uma vez que muitos tipos de problemas de tomada de decisão teste ou experimentos no mundo da engenharia podem ser formulados como problemas de teste de hipóteses Além disso como veremos há uma conexão muito íntima entre teste de hipóteses e intervalos de confiança Estimação de parâmetros com teste estatístico de hipóteses e com intervalo de confiança são métodos fundamentais usados no estágio de análise de dados de um experimento comparativo em que o engenheiro está interessado por exemplo em comparar a média de uma população com um certo valor especificado Esses experimentos comparativos simples são freqüentemente encontrados na prática e fornecem uma boa base para problemas mais complexos de planejamento de experimentos que serão discutidos nos Capítulos 13 e 14 Neste capítulo discutiremos experimentos comparativos envolvendo uma única população sendo nosso foco testar hipóteses relativas aos parâmetros da população Agora damos uma definição formal de uma hipótese estatística Hipótese Estatística Uma hipótese estatística é uma afirmação sobre os parâmetros de uma ou mais populações 178 Capítulo 9 Já que usamos distribuições de probabilidades para representar populações uma hipótese estatística pode também ser pensada como uma afirmação acerca da distribuição de probabilidades de uma variável aleatória A hipótese geralmente envolverá um ou mais parâmetros dessa distribuição Por exemplo suponha que estejamos interessados na taxa de queima de um propelente sólido usado para fornecer energia aos sistemas de escapamento de aeronaves A taxa de queima é uma variável aleatória que pode ser descrita por uma distribuição de probabilidades Suponha que nosso interesse esteja focado na taxa média de queima um parâmetro dessa distribuição Especificamente estamos interessados em decidir se a taxa média de queima é ou não 50 centímetros por segundo Podemos expressar isso formalmente como H0 μ 50 centímetros por segundo H1 μ 50 centímetros por segundo 91 A afirmação H0 μ 50 centímetros por segundo na Equação 91 é chamada de hipótese nula e a afirmação H1 μ 50 centímetros por segundo é chamada de hipótese alternativa Uma vez que a hipótese alternativa especifica valores de μ que poderiam ser maiores ou menores do que 50 centímetros por segundo ela é chamada de uma hipótese alternativa bilateral Em algumas situações podemos desejar formular uma hipótese alternativa unilateral como em H0 μ 50 centímetros por segundo H1 μ 50 centímetros por segundo ou 92 H1 μ 50 centímetros por segundo É importante lembrar que hipóteses são sempre afirmações sobre a população ou distribuição sob estudo não afirmações sobre a amostra O valor do parâmetro especificado da população na hipótese nula 50 centímetros por segundo no exemplo anterior é geralmente determinado em uma de três maneiras Primeiro ele pode resultar de experiência passada ou de conhecimento do processo ou mesmo de testes ou experimentos prévios O objetivo então de teste de hipóteses é geralmente determinar se o valor do parâmetro variou Segundo esse valor pode ser determinado a partir de alguma teoria ou modelo relativo ao processo sob estudo Aqui o objetivo do teste de hipóteses é verificar a teoria ou modelo Uma terceira situação aparece quando o valor do parâmetro da população resulta de considerações externas tais como projeto ou especificações de engenharia ou a partir de obrigações contratuais Nessa situação o objetivo usual do teste de hipóteses é obedecer ao teste Um procedimento levando a uma decisão acerca de uma hipótese particular é chamado de teste de uma hipótese Procedimentos de teste de hipóteses se apóiam no uso de informações de uma amostra aleatória proveniente da população de interesse Se essa informação for consistente com a hipótese não rejeitaremos a hipótese no entanto se essa informação for inconsistente com a hipótese concluiremos que a hipótese é falsa Enfatizamos que a verdade ou falsidade de uma hipótese particular pode nunca ser conhecida com certeza a menos que possamos examinar a população inteira Isso é geralmente impossível em muitas situações práticas Desse modo um procedimento de teste de hipóteses deveria ser desenvolvido tendose em mente a probabilidade de alcançar uma conclusão errada Em nosso tratamento de teste de hipóteses a hipótese nula sempre será estabelecida de modo que ela especifique um valor exato do para como na afirmação H0 μ 50 centímetros por segu Equação 91 Testar a hipótese envolve considerar uma tra aleatória computar uma estatística de teste a partir d amostrais e então usar a estatística de teste para tomar uma s são a respeito da hipótese nula 912 Testes de Hipóteses Estatísticas Com o objetivo de ilustrar os conceitos gerais considere o pro blema da taxa de queima do propelente introduzido anteriorm te A hipótese nula é a taxa média de queima de 50 centíme por segundo e a alternativa é que essa taxa não é igual a 50 c timetros por segundo Ou seja desejamos testar H0 μ 50 centímetros por segundo H1 μ 50 centímetros por segundo Suponha que uma amostra de n 10 espécimes seja testada e que a taxa média de queima da amostra está seja observada A média amostral é uma estimativa da média verdadeira da po pulação Um valor da média amostral x que caia próximo ao va lor da hipótese de μ 50 centímetros por segundo é uma cvi dência de que a média verdadeira μ é realmente 50 centímetros por segundo Por outro lado uma média amostral que seja consideraçãovelmente diferente de 50 centímetros por segundo é uma evidência de que a hipótese alternativa H1 é válida Assim a média amostral é a estatística de teste nesse caso A média amostral pode assumir muitos valores diferentes Suponha que se 485 x 515 nao rejeitaremos a hipótese nula H0 μ 50 e se x 485 ou x 515 rejeitaremos a hipótese nula em favor da hipótese alternativa H1 μ 50 Isso é ilustrado na Fig 91 Os valores de x que forem menores do que 485 e maiores do que 515 constituem a região crítica para o teste en quanto todos os valores que estejam no intervalo 485 x 515 formam uma região para a qual falharemos em rejeitar a hipótese nula Por convenção ela geralmente é chamada de região de aceite ação Os limites entre as regiões críticas e a região de aceitação são chamados de valores críticos Em nosso exemplo os valores críticos são 485 e 515 É comum estabelecer conclusões relativas à hipótese nula H0 Logo rejeitaremos H0 em favor de H1 se a estatística de teste cair na região crítica e falhar em rejeitar H0 Esse procedimento de decisão pode conduzir a uma de duas conclusões erradas Por exemplo a taxa média verdadeira de queima do propelente poderia ser igual a 50 centímetros por segundo Entretanto para os espécimes de propelente selecionados aleatoriamente que são testados poderíamos observar um valor de estatística de teste x que caísse na região crítica Rejeitaríamos então a hipótese nula H0 em favor da alternativa H1 quando de fato H0 seria realmente verdadeira Esse tipo de conclusão errada é chamado de erro tipo I Erro Tipo I A rejeição da hipótese nula H0 quando ela for verdadeira é definida como um erro tipo I Rejeitar H0 μ 50 cms Falhar em Rejeitar H0 μ 50 cms Rejeitar H0 μ 50 cms 485 50 515 Figura 91 Critérios de decisão para testar H0 μ 50 cms versus H1 μ 50 cms Resumo Quando queremos verificar se um processo ou produto ainda esta funcionando como deveria usamos o chamado teste de hipoteses A ideia e montar duas suposicoes a primeira chamada H0 diz que tudo continua igual a segunda H1 diz que alguma coisa mudou Antes de fazer qualquer conta a gente escolhe um valor chamado nıvel de significˆancia α por exemplo 5 Depois que temos os dados fazemos um calculo chamado estatıstica de teste Se ja soubermos a variˆancia da populacao ou se a amostra for grande usamos a formula Z X µ0 σn Aı comparamos esse valor com os limites da curva normal padrao ou trans formamos num valorp Se o resultado cair na area crıtica ou se p α a gente rejeita H0 Se nao continuamos com H0 porque os dados nao foram suficientes pra provar o contrario Existem dois tipos de teste o bilateral quando tanto um aumento quanto uma diminuicao sao importantes e o unilateral quando so um dos lados im porta por exemplo se estamos testando um mınimo garantido Como o teste unilateral concentra a area crıtica de um lado so ele geralmente tem mais chance de detectar um efeito real com o mesmo numero de dados Essa chance e chamada de potˆencia do teste 1β e ela aumenta se usamos mais dados n se a diferenca e maior ou se os dados variam menos Lembrando que rejeitar H0 nao quer dizer que H1 esta certa so quer dizer que se H0 fosse verdadeira seria bem estranho ver os dados que en contramos Outra forma de tirar a mesma conclusao e usando o intervalo de confianca se o valor que estamos testando µ0 ficar fora do intervalo de confianca de 1 α e o mesmo que rejeitar H0 Resumindo o teste de hipoteses e uma forma de tomar decisoes mesmo com incertezas tentando equilibrar o risco de dar alerta falso com o risco de deixar passar um erro 1 Slide 3 Hipotese Estatıstica Hipotese e uma frase sobre o parˆametro da populacao E o ponto de partida testamos se o dado contradiz essa frase Slide 4 H0 vs H1 H0 situacao normal H1 mudanca que importa Ex propelente µ 50 vs µ 50 Ex garrafas µ 200 vs µ 200 Slide 5 Exemplo Rapido σ 25 n 10 x 485 Z 190 regiao crıtica Z 196 Como Z 196 ficamos com H0 Slide 6 Erros Erro I α falso alarme Erro II β deixa passar defeito Mais amostra menor β para o mesmo α Slide 7 Significˆancia α α e o risco de falso alarme que aceitamos Quanto maior α mais facil rejeitar H0 Slide 8 Potˆencia 1 β Potˆencia e a chance de detectar a diferenca real Sobe com amostra maior efeito maior ou menor σ Ex n 10 µ1 52 potˆencia 74 Slide 9 Uni Bilateral Bilateral olha para mais e menos Unilateral foca num sentido e ganha potˆencia quando so esse sentido interessa garrafas 200psi Slide 10 Estatıstica Z Z X µ0σn Compara a Normal padrao tabela ou valor p 1 Slide 11 Valor p Valor p e a probabilidade de algo tao extremo sob H0 Se p α rejeitamos senao mantemos H0 Slide 12 Teste Intervalo Se µ0 cai fora do IC 1α rejeitamos Mesmo veredicto mas o IC ainda mostra onde o parˆametro pode estar Slide 13 Sete Passos 1 Parˆametro 2 H0H1 3 α 4 estatıstica 5 regiao ou p 6 dadoscalculo 7 conclusao Slide 14 Exercıcio 1 H0 µ 200 psi H1 µ 200 psi Teste unilateral inferior Slide 15 Exercıcio 2 Zc 196 xc 50 19625 4 4877 5123 x 513 5123 rejeitaH0 Z 19 p 0057 Slide 16 Resumo Teste de hipotese decisao com riscos claros α controla falso alarme β a cegueira Planeje n para equilibrar custo de errar e chance de detectar o que importa 2
9
Estatística 1
UFOP
9
Estatística 1
UFOP
10
Estatística 1
UFOP
7
Estatística 1
UFOP
1
Estatística 1
UFSCAR
16
Estatística 1
UFSCAR
17
Estatística 1
UFSC
5
Estatística 1
IFMG
64
Estatística 1
UFSCAR
35
Estatística 1
UFGD
Texto de pré-visualização
a Encontre a probabilidade α do erro tipo I se a região crítica for x 185 b Qual será a probabilidade do erro tipo II se a altura média verdadeira da espuma for 185 milímetros c Encontre β para a média verdadeira de 195 milímetros 916 Repita o Exercício 915 supondo que o tamanho da amostra seja n 16 e que o limite da região crítica seja o mesmo 917 No Exercício 915 encontre o limite da região crítica se a probabilidade do erro tipo I for a α 001 e n 10 c α 001 e n 16 b α 005 e n 10 d α 005 e n 16 918 No Exercício 915 calcule a probabilidade de um erro tipo II se a verdadeira altura média de espuma for 185 milímetros e a α 005 e n 10 b α 005 e n 16 c Compare os valores de β calculados nos itens anteriores Que conclusão você pode tirar 919 No Exercício 915 calcule o valor p se a estatística observada for a x 180 b x 190 c x 170 920 Um fabricante está interessado na voltagem de saída de um fornecimento de energia usado em um computador pessoal A voltagem de saída é considerada normalmente distribuída com desviopadrão igual a 025 V O fabricante deseja testar H0 μ 5 V contra H1 μ 5 V usando n 8 unidades a A região de aceitação é 485 x 515 Encontre o valor de α b Encontre a potência do teste para detectar uma voltagem de saída média verdadeira de 51 V 921 Refaça o Exercício 920 usando o tamanho da amostra igual a 16 e mantenha os limites da região de aceitação Que impacto a mudança no tamanho da amostra terá nos resultados dos itens a e b 922 No Exercício 920 encontre o limite da região crítica se a probabilidade do erro tipo I for a α 001 e n 8 c α 001 e n 16 b α 005 e n 8 d α 005 e n 16 923 No Exercício 920 calcule o valor p se a estatística observada for a x 52 b x 47 c x 51 924 No Exercício 920 calcule a probabilidade de um erro tipo II se a saída média verdadeira for 505 V e a α 005 e n 10 b α 005 e n 16 c Compare os valores de β calculados nos itens anteriores Que conclusão você pode tirar 925 A proporção de adultos com 3ª grau e vivendo em Tempe Arizona é estimada como p 04 Para testar essa hipótese selecionase uma amostra aleatória de 15 adultos Se o número de graduados estiver entre 4 e 8 a hipótese será aceita do contrário concluiremos que p 04 a Encontre a probabilidade do erro tipo I para esse procedimento considerando p 04 b Encontre a probabilidade de cometer um erro tipo II se a proporção verdadeira for realmente p 02 926 Acreditase que p 03 seja a proporção em Fênix de moradores favoráveis à construção de estradas com pedágios de modo a completar o sistema de rodovias Se uma amostra aleatória de 10 moradores mostrar que 1 ou menos é favorável a essa proposta concluiremos que p 03 a Encontre a probabilidade do erro tipo I se a proporção verdadeira for p 03 b Encontre a probabilidade de cometer um erro tipo II com esse procedimento se p 02 c Qual será a potência desse procedimento se a proporção verdadeira for p 02 927 Uma amostra aleatória contém 500 votantes registrados em Fênix Eles são perguntados se são favoráveis ao uso de combustíveis oxigenados para reduzir a poluição do ar Se mais de 400 votantes responderem positivamente concluiremos que mais de 60 dos votantes são favoráveis ao uso desses combustíveis Tamanho da Amostra Valor P Potência para α 005 n Quando x 505 Quando μ Verdadeiro 505 10 0527 0097 25 0317 0170 50 0157 0293 100 0046 0516 400 63 x 105 0979 1000 25 x 1010 1000 A coluna de valor P nesse quadro indica que para tamanhos grandes de amostra o valor amostral observado de x 505 fortemente sugere que H0 μ 50 deve ser rejeitada muito embora os resultados observados da amostra impliquem que de um ponto de vista prático a média verdadeira não difere muito do valor usado na hipótese μ 50 A coluna de potência indica que se testarmos uma hipótese com um nível fixo de significância α e mesmo se houver pouca diferença prática entre a média verdadeira e o valor usado na hipótese uma amostra de tamanho grande conduzirá quase sempre à rejeição de H0 A moral dessa demonstração é clara Seja cuidadoso ao interpretar os resultados do teste de hipóteses quando a amostra tiver tamanho grande visto que qualquer pequeno desvio do valor usado na hipótese μ0 será provavelmente detectado mesmo quando a diferença for de pouca ou nenhuma significância prática EXERCÍCIOS PARA A SEÇÃO 91 91 Em cada uma das seguintes situações estabeleça se esse é um problema corretamente posto de teste de hipóteses e por quê a H0 μ 25 H1 μ 25 b H0 σ 10 H1 σ 10 c H0 x 50 H1 x 50 d H0 p 01 H1 p 05 e H0 s 30 H1 s 30 92 Um fabricante de semicondutores coleta dados provenientes de uma nova ferramenta e conduz um teste de hipóteses com a hipótese nula sendo a largura média de uma dimensão crítica igual a 100 nm A conclusão é não rejeitar a hipótese nula Esse resultado fornece uma evidência forte de que a média da dimensão crítica é igual a 100 nm Explique 93 O desviopadrão da espessura de uma dimensão crítica na fabricação de semicondutores é σ 20 nm a Estabeleça as hipóteses nula e alternativa usadas para demonstrar que o desviopadrão é reduzido b Considere que o teste prévio não rejeita a hipótese nula Esse resultado fornece evidência forte de que o desviopadrão não foi reduzido Explique 94 A força média de remoção de um conector depende do tempo de cura a Estabeleça as hipóteses nula e alternativa usadas para demonstrar que a força de remoção está abaixo de 25 newtons b Considere que o teste prévio não rejeita a hipótese nula Esse resultado fornece evidência forte de que a força de remoção é maior ou igual a 25 newtons Explique 95 Um fabricante de fibra têxtil está investigando um novo fio que a companhia afirma ter um alongamento médio de 12 quilogramas com um desviopadrão de 05 quilograma A companhia deseja testar a hipótese H0 μ 12 contra H1 μ 12 usando uma amostra aleatória de quatro espécimes a Qual será a probabilidade do erro tipo I se a região crítica for definida como x 115 quilogramas b Encontre β para o caso em que o alongamento médio verdadeiro seja 1125 quilogramas c Encontre β para o caso em que a média verdadeira seja 115 quilogramas 96 Repita o exercício 95 usando um tamanho de amostra de n 16 e a mesma região crítica 97 No Exercício 95 encontre o limite da região crítica se a probabilidade do erro tipo I for a α 001 e n 4 c α 001 e n 16 b α 005 e n 4 d α 005 e n 16 98 No Exercício 95 calcule a probabilidade de um erro tipo II se a elongação média verdadeira for 115 quilogramas e a α 005 e n 4 b α 005 e n 16 c Compare os valores de β calculados nos itens anteriores Que conclusão você pode tirar 99 No Exercício 95 calcule o valor P se a estatística observada for a x 1125 b x 110 c x 1175 910 O calor liberado em calorias por grama de uma mistura de cimento tem distribuição aproximadamente normal A média deve ser 100 e o desviopadrão é 2 Desejamos testar H0 μ 100 versus H1 μ 100 com uma amostra de n 9 espécimes a Se a região de aceitação for definida como 985 x 1015 encontre a probabilidade α do erro tipo I b Encontre β para o caso em que o verdadeiro calor médio liberado seja 103 c Encontre β para o caso em que o verdadeiro calor médio liberado seja 105 Esse valor de β é menor do que aquele encontrado no item b Por quê 911 Repita o Exercício 910 usando um tamanho de amostra de n 5 e a mesma região de aceitação 912 No Exercício 910 encontre o limite da região crítica se a probabilidade do erro tipo I for a α 001 e n 9 c α 001 e n 5 b α 005 e n 9 d α 005 e n 5 913 No Exercício 910 calcule a probabilidade de um erro tipo II se o verdadeiro calor médio liberado for 103 c a α 005 e n 9 b α 005 e n 5 c Compare os valores de β calculados nos itens anteriores Que conclusão você pode tirar 914 No Exercício 910 calcule o valor p se a estatística observada for a x 98 b x 101 c x 102 915 Uma companhia de produtos para consumidor está formulando um xampu novo e está interessada na altura em milímetros da espuma A altura da espuma tem distribuição aproximadamente normal com um desviopadrão de 20 milímetros A companhia deseja testar H0 μ 175 milímetros versus H1 μ 175 milímetros usando os resultados de n 10 amostras Capítulo 91 Testes de Hipóteses Fundamentos erros aplicações Curso Estatística Aplicada à Engenharia Nome Data Objetivos da Aula Compreender o que é hipótese estatística Diferenciar H₀ e H₁ Visualizar regiões crítica aceitação Relacionar erros I e II α β e potência Exemplificar testes uni bilaterais Resolver exercícios práticos em sala Hipótese Estatística Uma afirmação sobre os parâmetros de uma ou mais populações Exemplos típicos média proporção variância Origem problemas de decisão na engenharia pex taxa de queima H₀ Hipótese Nula H₁ Alternativa Situação H₀ H₁ Propelente μ 50 cms μ 50 cms Garrafas μ 200 psi μ 200 psi Exemplo Industrial Problema Demonstrar que μ 50 cms Dados σ 25 cms n 10 X 485 Estatísticateste Z X 50σn 190 Região crítica Z 196 α 005 bilateral Resultado não rejeita H0 Z 196 Erros Tipo I e Tipo II Tipo I α rejeitar H₀ quando ela é verdadeira Tipo II β falhar em rejeitar H₀ quando H₀ é falsa α é pré fixado β depende de n σ e diferença real Trade off baixar α β e vice versa Nível de Significância α Probabilidade de falso alarme Escolhido conforme custo de errar Representado por área sombreada nas caudas Potência do Teste 1 β Capacidade de detectar uma diferença real Aumenta com n maior μ₁μ₀ maior σ menor Ex n 10 μ₁ 52 cms potência 074 Testes Unilaterais vs Bilaterais Bilaterais desvios em qualquer direção duas caudas Unilaterais interesse em uma direção uma cauda Unilaterais têm maior potência para mesmo n Escolha depende da hipótese prática Estatística de Teste Z Z X μ₀σn População Normal ou n grande TLC Z crítico obtido da Tabela NormalPadrão Valor P Probabilidade de obter resultado extremo sob H₀ Valor P α rejeita H₀ Valor P α falha em rejeitar H₀ Ex X 513 n 16 P 0038 Teste Intervalo de Confiança H₀ rejeitada se μ₀ cair fora do IC1 α IC comunica incerteza e risco Procedimento em 7 Passos 1 Definir parâmetro de interesse 2 Formular H₀ e H₁ 3 Escolher α 4 Selecionar estatística teste 5 Derivar região crítica ou valor P 6 Coletar dados computar estatística 7 Concluir e comunicar Exercício 1 Formulação Garrafas especificação μ 200 psi σ conhecida a Escreva H₀ e H₁ se controle quer evidenciar falha b Teste será uni ou bilateral Exercício 2 Decisão σ 25 cms n 16 α 005 H₀ μ 50 H₁ μ 50 a Calcule região crítica em termos de X b Se X 513 cms qual a decisão c Qual o valor P Resumo Conclusões Testes ferramenta de decisão estatística Trade off α β importância do tamanho da amostra Valor P comunica evidência sem fixar α Referências Essa hipótese nula seria rejeitada para qualquer 0038 α porém não seria rejeitada para um nível menor de significância tal como 001 Valores P são freqüentemente calculados dessa maneira O valor observado da estatística de teste é usado para definir uma regiao crítica sendo calculado o α associado com essa região crítica Não é sempre fácil calcular o valor exato de P para um teste No entanto a maioria dos programas computacionais modernos para análise estatística reporta valores de P Mostraremos também como aproximar o valor P 915 Conexão entre Testes de Hipóteses e Intervalos de Confiança Há uma relação íntima entre o teste de uma hipótese acerca de um parâmetro ou seja θ e o intervalo de confiança para θ Se Lu for um intervalo de confiança de 1001 α para o parâmetro θ o teste de tamanho α das hipóteses H0 θ θ0 H1 θ θ0 conduzirá a rejeição de H0 se e somente se θ0 não estiver no IC Lu de 1001 α Como ilustração considere o sistema de escape do problema do propelente com X 513 σ 25 e n 16 A hipótese nula H0 μ 50 foi rejeitada usando α 005 O IC bilateral de 95 para μ pode ser calculado usando a Equação 87 Esse IC é 513 196 2516 o que quer dizer 50075 μ 52525 Uma vez que o valor H0 μ 50 não está incluído nesse intervalo a hipótese nula H0 μ 50 é rejeitada Embora testes de hipóteses e ICs sejam procedimentos equivalentes visto que a tomada de decisão ou inferência sobre μ seja de interesse cada um fornece algum conhecimento de algum modo diferente Por exemplo o intervalo de confiança fornece uma faixa de valores prováveis para μ em um nível estabelecido de confiança enquanto o teste de hipóteses é uma estrutura fácil para dispor os níveis de risco tal como o valor P associado com uma decisão específica Continuaremos a ilustrar a conexão entre os dois procedimentos ao longo de todo o texto 916 Procedimento Geral para Testes de Hipóteses Este capítulo desenvolve os procedimentos de testes de hipóteses para muitos problemas práticos O uso do seguinte sequência de etapas na metodologia de aplicação de testes de hipóteses é recomendado 1 A partir do contexto do problema identifique o parâmetro de interesse 2 Estabeleça a hipótese nula H0 3 Especifique uma hipótese alternativa apropriada H1 4 Escolha um nível de significância α 5 Determine uma estatística apropriada de teste 6 Estabeleça a região de rejeição para a estatística 7 Calcule quaisquer grandezas amostrais necessárias substituaas na equação para a estatística de teste e calcule aquele valor 8 Decida se H0 deve ou não ser rejeitada e reporte isso no contexto do problema As etapas 14 devem ser completadas antes de examinar os dados amostrais Essa sequência de etapas será ilustrada nas seções subsequentes Na prática tal procedimento formal e aparentemente rígido não é sempre necessário Geralmente uma vez que o experimentalista ou o tomador de decisão tenha decidido sobre a questão de interesse e tenha determinado o planejamento de experimentos isto é como os dados devem ser coletados como as medidas devem ser feitas e quantas observações são necessárias somente três etapas são realmente requeridas 1 Especificar a estatística de teste a ser usada tal como Zα 2 Especificar a localização da região crítica bilateral unilateral superior ou unilateral inferior 3 Especificar os critérios de rejeição tipicamente o valor de α ou o valor P no qual a região deveria ocorrer Essas etapas são freqüentemente completadas quase simultaneamente na resolução de problemas do mundo real embora enfatizamos que é importante pensar cuidadosamente sobre cada etapa Essa é a razão pela qual apresentamos e usamos o processo de oito etapas parece reforçar o essencial da abordagem correta Mesmo que você não a use toda vez para resolver problemas reais ela é uma estrutura útil quando se está aprendendo o teste de hipóteses pela primeira vez Significância Estatística versus Significância Prática Notamos previamente que é muito útil reportar os resultados de um teste de hipóteses em termos do valor P porque ele carrega mais informação que a simples afirmação rejeita H0 ou falha em rejeitar H0 Ou seja a rejeição de H0 com nível de 005 de significância é muito mais significativa se o valor da estatística de teste estiver bem na região crítica excedendo em muito o valor crítico de 5 do que se ele estiver excedendo pouco aquele valor Mesmo um valor pequeno de P pode ser difícil de interpretar do ponto de vista prático quando estamos tomando decisões pois enquanto um valor pequeno de P indica estatisticamente significativo no sentido de que H0 deve ser rejeitada em favor de H1 o desvio real de H0 que foi detectado pode ter pouca se alguma significância prática engenheiros gostam de dizer significância de engenharia Isso é particularmente verdade quando o tamanho da amostra n é grande Por exemplo considere o problema da taxa de queima do propelente do Exemplo 91 em que testamos H0 μ 50 centímetros por segundo versus H1 μ 50 centímetros por segundo com σ 25 Se supusermos que a taxa média é realmente 505 centímetros por segundo então esse não é um desvio sério de H0 μ 50 centímetros por segundo no sentido de que se a média realmente for 505 centímetros por segundo não haverá efeito prático observável no desempenho do sistema de escapamento da aeronave Em outras palavras concluir que μ 50 centímetros por segundo quando ela é realmente 505 centímetros por segundo é um erro que não é caro e não tem significância prática Para um tamanho de amostra razoavelmente grande um valor verdadeiro de μ 505 centímetros por segundo conduzirá a um X da amostra que está perto de 505 centímetros por segundo e não queremos que esse valor de X proveniente da amostra resulte na rejeição de H0 O quadro a seguir mostra o valor P para testar H0 μ 50 quando observamos X 505 centímetros por segundo e a potência do teste com α 005 quando a média verdadeira é 505 para vários tamanhos n de amostra 182 Capítulo 9 Em alguns problemas do mundo real em que os procedimentos de testes unilaterais são indicados é ocasionalmente difícil escolher uma formulação apropriada da hipótese alternativa Por exemplo suponha que um engarrafador de refrigerantes compre 10 garrafas de 10 onças de uma companhia de vidro O engarrafador quer estar certo de que as garrafas reúnem as especificações de pressão interna média ou resistência à explosão que para garrafas de 10 onças a resistência mínima é 200 psi O engarrafador decidiu formular o procedimento de decisão para um lote específico de garrafas como um problema de teste de hipóteses Há duas formulações possíveis para esse problema H0 μ 200 psi H1 μ 200 psi 95 ou H0 μ 200 psi H1 μ 200 psi 96 Considere a formulação na Equação 95 Se a hipótese nula for rejeitada as garrafas serão julgadas satisfatórias se H0 não for rejeitada a implicação é que as garrafas não obedecem as especificações e não devem ser usadas Como rejeitar H0 é uma conclusão forte essa formulação força o fabricante de garrafas a demonstrar que a resistência média à explosão das garrafas excede a especificação Agora considere a formulação na Equação 96 Nessa situação as garrafas serão julgadas satisfatórias a menos que H0 seja rejeitada Ou seja concluímos que as garrafas são satisfatórias a menos que haja uma forte evidência do contrário Qual formulação é a correta aquela da Equação 95 ou da Equação 96 A resposta depende do objetivo da análise Para a Equação 95 há alguma probabilidade de que H0 não seja rejeitada isto é decididirmos que as garrafas não seriam satisfatórias muito embora a média verdadeira seja levemente maior que 200 psi Essa formulação implica querermos que o fabricante de garrafas demonstre que o produto encontre ou exceda nossas especificações Tal formulação poderia ser apropriada se o fabricante tivesse experimentado dificuldade em encontrar as especificações no passado ou se as considerações de segurança do produto nos forçassem a manter firmemente a especificação de 200 psi Por outro lado para a formulação da Equação 96 há alguma probabilidade de que H0 seja aceita e as garrafas julgadas satisfatórias muito embora a média verdadeira seja levemente menor que 200 psi Concluíremos que as garrafas são insatisfatórias somente quando houvesse uma forte evidência de que a média não excederia 200 psi ou seja quando H0 μ 200 psi fosse rejeitada Essa formulação considera que estamos relativamente felizes com o desempenho passado do fabricante de garrafas e que pequenos desvios da especificação de μ 200 psi não são prejudiciais Na formulação das hipóteses unilaterais devemos lembrar que rejeitar H0 é sempre uma forte conclusão Conseqüentemente devemos nos perguntar o que é importante para fazer uma forte conclusão na hipótese alternativa Em problemas do mundo real isso dependerá freqüentemente do nosso ponto de vista e da nossa experiência com a situação 914 Valores P nos Testes de Hipóteses Uma maneira de reportar os resultados de um teste de hipóteses é estabelecer que a hipótese nula foi ou não rejeitada com um valor especificado de α ou nível de significância Por exemplo no problema anterior do propelente podemos dizer que H0 μ 50 foi rejeitada com um nível de significância de 005 Essa forma de conclusões é freqüentemente inadequada porque ela não dá idéia ao tomador de decisão a respeito de que o valor calculado da estatística de teste estava apenas nas proximidades da região de rejeição ou se estava muito longe dessa região Além disso o estabelecimento dos resultados dessa maneira impõe o nível predefinido de significância aos outros usuários da informação Essa abordagem pode ser insatisfatória uma vez que alguns tomadores de decisão podem ficar desconfortáveis com os riscos implicados por α 005 Com o objetivo de evitar essas dificuldades a abordagem do valor P tem sido largamente adotada na prática O valor P é a probabilidade de que a estatística de teste assumirá um valor que é no mínimo tão extremo quanto o valor observado da estatística quando a hipótese nula H0 for verdadeira Assim um valor P carrega muita informação sobre o peso da evidência contra H0 logo um tomador de decisão pode retirar uma conclusão com qualquer nível especificado de significância Daremos agora uma definição formal de um valor P Valor P O valor P é o menor nível de significância que conduz à rejeição da hipótese nula H0 com os dados fornecidos É costume chamar a estatística de teste e os dados de significante quando a hipótese nula H0 for rejeitada por conseguinte podemos pensar a respeito do valor P como o menor nível α em que os dados são significantes Uma vez que o valor P seja conhecido o tomador de decisão pode determinar quão significantes os dados são sem o analista de dados impor formalmente um nível préselecionado de significância Considere o teste bilateral de hipóteses para a taxa de queima H0 μ 50 H1 μ 50 com n 16 e σ 25 Suponha que a média amostral observada seja X 513 centímetros por segundo A Fig 96 mostra uma região crítica para esse teste com valores críticos em 513 e no valor simétrico 487 O valor P do teste é o valor α associado com essa região crítica Qualquer valor menor para α diminui a região crítica e o teste falha em rejeitar a hipótese nula quando x 513 centímetros por segundo O valor P é fácil de calcular depois de a estatística de teste ser observada Nesse exemplo Valor 1 1 07 06 05 04 03 487 02 01 48 49 50 51 52 53 X 513 Figura 96 O valor p é a área da região sombreada quando X 513 Região de Aceitação Tamanho da Amostra α β em µ 52 β em µ 505 485 x 515 10 00576 02643 08923 48 x 52 10 00114 05000 09705 4881 x 5119 16 00576 00966 08606 4842 x 5158 16 00114 02515 09578 Os resultados nos retângulos não foram calculados no texto porque podem ser facilmente verificados pelo leitor Essa apresentação e a discussão anterior revelam quatro pontos importantes 1 O tamanho da região crítica e conseqüentemente a probabilidade do erro tipo I α pode sempre ser reduzido através da seleção apropriada dos valores críticos 2 Os erros tipo I e tipo II estão relacionados Uma diminuição na probabilidade de um tipo de erro sempre resulta em um aumento da probabilidade do outro desde que o tamanho da amostra n não varie 3 Um aumento no tamanho da amostra reduzirá β desde que α seja mantido constante 4 Quando a hipótese nula é falsa β aumenta à medida que o valor verdadeiro do parâmetro se aproxima do valor usado na hipótese nula O valor de β diminui à medida que aumenta a diferença entre a média verdadeira e o valor utilizado na hipótese Geralmente αa analista controla a probabilidade α do erro tipo I quando ele ou ela seleciona os valores críticos Assim geralmente é fácil para o analista estabelecer a probabilidade de erro tipo I em ou perto de qualquer valor desejado Uma vez que o analista pode controlar diretamente a probabilidade de rejeitar erroneamente H0 sempre pensamos na rejeição da hipótese nula H0 como uma conclusão forte Por outro lado a probabilidade β do erro tipo II não é constante mas depende do valor verdadeiro do parâmetro Ela depende também do tamanho da amostra que tenhamos selecionado Pelo fato de a probabilidade β do erro tipo II ser uma função do tamanho da amostra e da extensão com que a hipótese nula H0 é falsa costumase pensar na aceitação de H0 como uma conclusão fraca a menos que saibamos que β seja aceitavelmente pequena Conseqüentemente em vez de dizer aceitar H0 preferimos a terminologia falhar em rejeitar H0 Falhar em rejeitar H0 implica que não encontramos evidência suficiente para rejeitar H0 ou seja para fazer uma afirmação forte Falhar em rejeitar H0 não significa necessariamente que haja uma alta probabilidade de que H0 seja verdadeira Isso pode significar simplesmente que mais dados são requeridos para atingir uma conclusão forte Isso pode ter implicações importantes para a formulação das hipóteses Um importante conceito de que faremos uso é a potência de um teste estatístico Potência A potência de um teste estatístico é a probabilidade de rejeitar a hipótese nula H0 quando a hipótese alternativa for verdadeira A potência é calculada como 1 β e a potência pode ser interpretada como a probabilidade de rejeitar corretamente uma hipótese nula falsa Frequentemente comparamos testes estatísticos através da comparação de suas propriedades de potência Por exemplo considere o problema da taxa de queima de propelente quando estamos testando H0 µ 50 centímetros por segundo contra H1 µ 50 centímetros por segundo Suponha que o valor verdadeiro da média seja µ 52 Quando n 10 encontramos que β 02643 assim a potência desse teste é A potência é uma medida muito descritiva e concisa da sensibilidade de um teste estatístico em que por sensibilidade entendemos a habilidade do teste de detectar diferenças Nesse caso a sensibilidade do teste para detectar a diferença entre a taxa média de queima de 50 centímetros por segundo e 52 centímetros por segundo é 07357 Isto é se a média verdadeira for realmente 52 centímetros por segundo esse teste rejeitará corretamente H0 µ 50 e detectará essa diferença em 7357 das vezes Se esse valor de potência for julgado como muito baixo o analista poderá aumentar tanto α como o tamanho da amostra n 913 Hipóteses Unilaterais e Bilaterais Na construção de hipóteses sempre vamos estabelecer a hipótese nula como uma igualdade de modo que a probabilidade do erro tipo I α pode ser controlada em um valor específico A hipótese alternativa tanto pode ser unilateral como bilateral dependendo da conclusão a ser retirada se H0 é rejeitada Se o objetivo é fazer uma alegação envolvendo afirmações tais como maior que menor que superior a excede no mínimo e assim por diante uma alternativa unilateral é apropriada Se nenhuma direção é implicada pela alegação ou se for feita a alegação não igual a uma alternativa bilateral deve ser usada EXEMPLO 91 Taxa de Queima de um Propelente Considere o problema da taxa de queima de um propelente Suponha que se a taxa de queima for menor do que 50 centímetros por segundo desejamos mostrar esse fato com uma conclusão forte As hipóteses deveriam ser estabelecidas como Aqui a região crítica está na extremidade inferior da distribuição de 𝑋 Visto que a rejeição de H0 é sempre uma conclusão forte essa afirmação das hipóteses produzirá o resultado desejado se H0 for rejeitado Note que embora a hipótese nula seja estabelecida com um sinal de igual devese incluir qualquer valor de µ não especificado pela hipótese alternativa Desse modo falhar em rejeitar H0 não significa que µ 50 centímetros por segundo exatamente mas somente que não temos evidência forte em suportar H1 180 Capítulo 9 verdadeira e o valor da média for 52 ou sujeita a H1 µ 52 Agora um erro tipo II será cometido se a média amostral x cair entre 485 e 515 os limites da região crítica quando µ 52 Como visto na Fig 93 essa é apenas a probabilidade de 485 X 515 quando a média verdadeira for µ 52 ou a área sombreada sob a distribuição normal centralizada em µ 52 Conseqüentemente referindonos à Fig 93 encontramos que Os valores z1 correspondentes a 485 e 515 quando µ 52 são Logo Assim se estivermos testando H0 µ 50 contra H1 µ 50 com n 10 e o valor verdadeiro da média for µ 52 a probabilidade de falharmos em rejeitar a falsa hipótese nula é 02643 Por simetria se o valor verdadeiro da média for µ 48 o valor de β será também 02643 A probabilidade de cometer o erro tipo II β aumenta rapidamente à medida que o valor verdadeiro de µ se aproxima do valor da hipótese feita Por exemplo ver Fig 94 em que o valor verdadeiro da média é µ 505 e o valor da hipótese é H0 µ 50 O valor verdadeiro de µ está muito perto de 50 e o valor para β é Conforme mostrado na Fig 94 os valores de z correspondentes a 485 e 515 quando µ 505 são a 485 e 515 quando µ 505 são Assim a probabilidade do erro tipo II é muito maior para o caso em que a média verdadeira é 505 centímetros por segundo do que para o caso em que a média é 52 cms Naturalmente em muitas situações práticas não estaríamos preocupados em cometer o erro tipo II se a média fosse próxima do valor utilizado na hipótese Estaríamos muito mais interessados em detectar grandes diferenças entre a média verdadeira e o valor especificado na hipótese nula A probabilidade do erro tipo II depende também do tamanho da amostra n Suponha que a hipótese nula seja H0 µ 50 centímetros por segundo e que o valor verdadeiro da média seja µ 52 Se o tamanho da amostra for aumentado de n 10 para n 16 resulta a situação da Fig 95 A distribuição normal na esquerda é a distribuição de 𝑋 quando a média é µ 50 e a distribuição normal na direita é a distribuição de 𝑋1 quando µ 52 Conforme mostrado na Fig 95 a probabilidade do erro tipo II é β P485 𝑋 515 quando µ 52 Quando n 16 o desviopadrão de 𝑋 é σ𝑛 2516 0625 e os valores z correspondentes a 485 e 515 quando µ 52 são Desse modo β P𝑧 560 z 080 Pz 080 Lembrese de que quando n 10 e µ 52 encontramos que β 02643 conseqüentemente o aumento do tamanho da amostra resulta em uma diminuição na probabilidade de erro tipo II Os resultados desta seção e outros poucos cálculos similares estão resumidos na tabela a seguir Os valores críticos são ajustados para manter α iguais para n 10 e n 16 Esse tipo de cálculo é discutido mais adiante no capítulo Figura 93 A probabilidade do erro tipo II quando µ 52 e n 10 Figura 94 A probabilidade do erro tipo II quando µ 505 e n 10 Figura 95 A probabilidade do erro tipo II quando µ 52 e n 16 Agora suponha que a taxa média verdadeira de queima seja diferente de 50 centímetros por segundo mesmo que a média amostral x caia na região de aceitação Nesse caso falharíamos em rejeitar H0 quando ela fosse falsa Esse tipo de conclusão errada é chamado de erro tipo II Erro Tipo II A falha em rejeitar a hipótese nula quando ela for falsa é definida como um erro tipo II Assim testando qualquer hipótese estatística quatro situações diferentes determinam se a decisão final está correta ou errada Essas situações estão apresentadas na Tabela 91 Tabela 91 Decisões no Teste de Hipóteses Pelo fato de a nossa decisão estar baseada em variáveis aleatórias probabilidades podem ser associadas com os erros tipo I e tipo II na Tabela 91 A probabilidade de cometer o erro tipo I é denotada pela letra grega α Algumas vezes a probabilidade do erro tipo I é chamada de nível de significância ou erro α ou tamanho do teste No exemplo da taxa de queima do propelente um erro tipo I ocorrerá quando x 515 ou x 485 quando a taxa média verdadeira de queima do propelente for µ 50 centímetros por segundo Suponha que o desviopadrão da taxa de queima seja σ 25 centímetros por segundo e que a taxa de queima tenha uma distribuição para a qual as condições do teorema do limite central se aplicam de modo que a distribuição da média amostral seja aproximadamente normal com média µ 50 e desviopadrão σ𝑛 2510 079 A probabilidade de cometer o erro tipo I ou o nível de significância de nosso teste é igual à soma das áreas que tenham sido sombreada nas extremidades da distribuição normal na Fig 92 Podemos achar essa probabilidade como Os valores de z que correspondem aos valores críticos 485 e 515 são Logo Isso implica que 574 de todas as amostras aleatórias conduziriam à rejeição da hipótese H0 µ 50 centímetros por segundo quando a taxa média verdadeira de queima fosse realmente 50 centímetros por segundo Da inspeção da Fig 92 notamos que podemos reduzir α alargando a região de aceitação Por exemplo se considerarmos os valores críticos 48 e 52 o valor de α será Poderíamos também reduzir α aumentando o tamanho da amostra Se n 16 então σ𝑛 2516 0625 e usando a região crítica original da Fig 91 encontramos Desse modo Na avaliação de um procedimento de teste de hipóteses também é importante examinar a probabilidade de um erro tipo II que denotaremos por β Isto é Para calcular β algumas vezes chamado de erro β temos de ter uma hipótese alternativa específica ou seja temos de ter um valor particular de µ Por exemplo suponha que seja importante rejeitar a hipótese nula H0 µ 50 toda vez que a taxa média de queima µ seja maior do que 52 centímetros por segundo ou menor do que 48 centímetros por segundo Poderíamos calcular a probabilidade de um erro tipo II β para os valores µ 52 e µ 48 e usar esse resultado para nos dizer alguma coisa acerca de como seria o desempenho do procedimento de teste Especificamente como o procedimento de teste funcionará se desejarmos detectar ou seja rejeitar H0 para um valor médio de µ 52 ou µ 48 Por causa da simetria só é necessário avaliar um dos dois casos encontrar a probabilidade de aceitar a hipótese nula H0 µ 50 centímetros por segundo quando a média verdadeira for µ 52 centímetros por segundo A Fig 93 nos ajudará a calcular a probabilidade do erro tipo II β A distribuição normal no lado esquerdo da Fig 93 é a distribuição da estatística de teste 𝑋 quando a hipótese nula H0 µ 50 for verdadeira ou seja isso é o que se entende pela expressão sujeita a H0 µ 50 A distribuição normal no lado direito é a distribuição de 𝑋 quando a hipótese alternativa for 91 TESTES DE HIPÓTESES 911 Hipóteses Estatísticas No capítulo anterior ilustramos como construir uma estimativa de intervalos de confiança de um parâmetro a partir de dados amostrais Entretanto muitos problemas em engenharia requere que decidamos entre aceitar ou rejeitar uma afirmação acerca de algum parâmetro A afirmação é chamada de hipótese e o procedimento de tomada de decisão sobre a hipótese é chamado de teste de hipóteses Esse é um dos mais úteis aspectos da inferência estatística uma vez que muitos tipos de problemas de tomada de decisão teste ou experimentos no mundo da engenharia podem ser formulados como problemas de teste de hipóteses Além disso como veremos há uma conexão muito íntima entre teste de hipóteses e intervalos de confiança Estimação de parâmetros com teste estatístico de hipóteses e com intervalo de confiança são métodos fundamentais usados no estágio de análise de dados de um experimento comparativo em que o engenheiro está interessado por exemplo em comparar a média de uma população com um certo valor especificado Esses experimentos comparativos simples são freqüentemente encontrados na prática e fornecem uma boa base para problemas mais complexos de planejamento de experimentos que serão discutidos nos Capítulos 13 e 14 Neste capítulo discutiremos experimentos comparativos envolvendo uma única população sendo nosso foco testar hipóteses relativas aos parâmetros da população Agora damos uma definição formal de uma hipótese estatística Hipótese Estatística Uma hipótese estatística é uma afirmação sobre os parâmetros de uma ou mais populações 178 Capítulo 9 Já que usamos distribuições de probabilidades para representar populações uma hipótese estatística pode também ser pensada como uma afirmação acerca da distribuição de probabilidades de uma variável aleatória A hipótese geralmente envolverá um ou mais parâmetros dessa distribuição Por exemplo suponha que estejamos interessados na taxa de queima de um propelente sólido usado para fornecer energia aos sistemas de escapamento de aeronaves A taxa de queima é uma variável aleatória que pode ser descrita por uma distribuição de probabilidades Suponha que nosso interesse esteja focado na taxa média de queima um parâmetro dessa distribuição Especificamente estamos interessados em decidir se a taxa média de queima é ou não 50 centímetros por segundo Podemos expressar isso formalmente como H0 μ 50 centímetros por segundo H1 μ 50 centímetros por segundo 91 A afirmação H0 μ 50 centímetros por segundo na Equação 91 é chamada de hipótese nula e a afirmação H1 μ 50 centímetros por segundo é chamada de hipótese alternativa Uma vez que a hipótese alternativa especifica valores de μ que poderiam ser maiores ou menores do que 50 centímetros por segundo ela é chamada de uma hipótese alternativa bilateral Em algumas situações podemos desejar formular uma hipótese alternativa unilateral como em H0 μ 50 centímetros por segundo H1 μ 50 centímetros por segundo ou 92 H1 μ 50 centímetros por segundo É importante lembrar que hipóteses são sempre afirmações sobre a população ou distribuição sob estudo não afirmações sobre a amostra O valor do parâmetro especificado da população na hipótese nula 50 centímetros por segundo no exemplo anterior é geralmente determinado em uma de três maneiras Primeiro ele pode resultar de experiência passada ou de conhecimento do processo ou mesmo de testes ou experimentos prévios O objetivo então de teste de hipóteses é geralmente determinar se o valor do parâmetro variou Segundo esse valor pode ser determinado a partir de alguma teoria ou modelo relativo ao processo sob estudo Aqui o objetivo do teste de hipóteses é verificar a teoria ou modelo Uma terceira situação aparece quando o valor do parâmetro da população resulta de considerações externas tais como projeto ou especificações de engenharia ou a partir de obrigações contratuais Nessa situação o objetivo usual do teste de hipóteses é obedecer ao teste Um procedimento levando a uma decisão acerca de uma hipótese particular é chamado de teste de uma hipótese Procedimentos de teste de hipóteses se apóiam no uso de informações de uma amostra aleatória proveniente da população de interesse Se essa informação for consistente com a hipótese não rejeitaremos a hipótese no entanto se essa informação for inconsistente com a hipótese concluiremos que a hipótese é falsa Enfatizamos que a verdade ou falsidade de uma hipótese particular pode nunca ser conhecida com certeza a menos que possamos examinar a população inteira Isso é geralmente impossível em muitas situações práticas Desse modo um procedimento de teste de hipóteses deveria ser desenvolvido tendose em mente a probabilidade de alcançar uma conclusão errada Em nosso tratamento de teste de hipóteses a hipótese nula sempre será estabelecida de modo que ela especifique um valor exato do para como na afirmação H0 μ 50 centímetros por segu Equação 91 Testar a hipótese envolve considerar uma tra aleatória computar uma estatística de teste a partir d amostrais e então usar a estatística de teste para tomar uma s são a respeito da hipótese nula 912 Testes de Hipóteses Estatísticas Com o objetivo de ilustrar os conceitos gerais considere o pro blema da taxa de queima do propelente introduzido anteriorm te A hipótese nula é a taxa média de queima de 50 centíme por segundo e a alternativa é que essa taxa não é igual a 50 c timetros por segundo Ou seja desejamos testar H0 μ 50 centímetros por segundo H1 μ 50 centímetros por segundo Suponha que uma amostra de n 10 espécimes seja testada e que a taxa média de queima da amostra está seja observada A média amostral é uma estimativa da média verdadeira da po pulação Um valor da média amostral x que caia próximo ao va lor da hipótese de μ 50 centímetros por segundo é uma cvi dência de que a média verdadeira μ é realmente 50 centímetros por segundo Por outro lado uma média amostral que seja consideraçãovelmente diferente de 50 centímetros por segundo é uma evidência de que a hipótese alternativa H1 é válida Assim a média amostral é a estatística de teste nesse caso A média amostral pode assumir muitos valores diferentes Suponha que se 485 x 515 nao rejeitaremos a hipótese nula H0 μ 50 e se x 485 ou x 515 rejeitaremos a hipótese nula em favor da hipótese alternativa H1 μ 50 Isso é ilustrado na Fig 91 Os valores de x que forem menores do que 485 e maiores do que 515 constituem a região crítica para o teste en quanto todos os valores que estejam no intervalo 485 x 515 formam uma região para a qual falharemos em rejeitar a hipótese nula Por convenção ela geralmente é chamada de região de aceite ação Os limites entre as regiões críticas e a região de aceitação são chamados de valores críticos Em nosso exemplo os valores críticos são 485 e 515 É comum estabelecer conclusões relativas à hipótese nula H0 Logo rejeitaremos H0 em favor de H1 se a estatística de teste cair na região crítica e falhar em rejeitar H0 Esse procedimento de decisão pode conduzir a uma de duas conclusões erradas Por exemplo a taxa média verdadeira de queima do propelente poderia ser igual a 50 centímetros por segundo Entretanto para os espécimes de propelente selecionados aleatoriamente que são testados poderíamos observar um valor de estatística de teste x que caísse na região crítica Rejeitaríamos então a hipótese nula H0 em favor da alternativa H1 quando de fato H0 seria realmente verdadeira Esse tipo de conclusão errada é chamado de erro tipo I Erro Tipo I A rejeição da hipótese nula H0 quando ela for verdadeira é definida como um erro tipo I Rejeitar H0 μ 50 cms Falhar em Rejeitar H0 μ 50 cms Rejeitar H0 μ 50 cms 485 50 515 Figura 91 Critérios de decisão para testar H0 μ 50 cms versus H1 μ 50 cms Resumo Quando queremos verificar se um processo ou produto ainda esta funcionando como deveria usamos o chamado teste de hipoteses A ideia e montar duas suposicoes a primeira chamada H0 diz que tudo continua igual a segunda H1 diz que alguma coisa mudou Antes de fazer qualquer conta a gente escolhe um valor chamado nıvel de significˆancia α por exemplo 5 Depois que temos os dados fazemos um calculo chamado estatıstica de teste Se ja soubermos a variˆancia da populacao ou se a amostra for grande usamos a formula Z X µ0 σn Aı comparamos esse valor com os limites da curva normal padrao ou trans formamos num valorp Se o resultado cair na area crıtica ou se p α a gente rejeita H0 Se nao continuamos com H0 porque os dados nao foram suficientes pra provar o contrario Existem dois tipos de teste o bilateral quando tanto um aumento quanto uma diminuicao sao importantes e o unilateral quando so um dos lados im porta por exemplo se estamos testando um mınimo garantido Como o teste unilateral concentra a area crıtica de um lado so ele geralmente tem mais chance de detectar um efeito real com o mesmo numero de dados Essa chance e chamada de potˆencia do teste 1β e ela aumenta se usamos mais dados n se a diferenca e maior ou se os dados variam menos Lembrando que rejeitar H0 nao quer dizer que H1 esta certa so quer dizer que se H0 fosse verdadeira seria bem estranho ver os dados que en contramos Outra forma de tirar a mesma conclusao e usando o intervalo de confianca se o valor que estamos testando µ0 ficar fora do intervalo de confianca de 1 α e o mesmo que rejeitar H0 Resumindo o teste de hipoteses e uma forma de tomar decisoes mesmo com incertezas tentando equilibrar o risco de dar alerta falso com o risco de deixar passar um erro 1 Slide 3 Hipotese Estatıstica Hipotese e uma frase sobre o parˆametro da populacao E o ponto de partida testamos se o dado contradiz essa frase Slide 4 H0 vs H1 H0 situacao normal H1 mudanca que importa Ex propelente µ 50 vs µ 50 Ex garrafas µ 200 vs µ 200 Slide 5 Exemplo Rapido σ 25 n 10 x 485 Z 190 regiao crıtica Z 196 Como Z 196 ficamos com H0 Slide 6 Erros Erro I α falso alarme Erro II β deixa passar defeito Mais amostra menor β para o mesmo α Slide 7 Significˆancia α α e o risco de falso alarme que aceitamos Quanto maior α mais facil rejeitar H0 Slide 8 Potˆencia 1 β Potˆencia e a chance de detectar a diferenca real Sobe com amostra maior efeito maior ou menor σ Ex n 10 µ1 52 potˆencia 74 Slide 9 Uni Bilateral Bilateral olha para mais e menos Unilateral foca num sentido e ganha potˆencia quando so esse sentido interessa garrafas 200psi Slide 10 Estatıstica Z Z X µ0σn Compara a Normal padrao tabela ou valor p 1 Slide 11 Valor p Valor p e a probabilidade de algo tao extremo sob H0 Se p α rejeitamos senao mantemos H0 Slide 12 Teste Intervalo Se µ0 cai fora do IC 1α rejeitamos Mesmo veredicto mas o IC ainda mostra onde o parˆametro pode estar Slide 13 Sete Passos 1 Parˆametro 2 H0H1 3 α 4 estatıstica 5 regiao ou p 6 dadoscalculo 7 conclusao Slide 14 Exercıcio 1 H0 µ 200 psi H1 µ 200 psi Teste unilateral inferior Slide 15 Exercıcio 2 Zc 196 xc 50 19625 4 4877 5123 x 513 5123 rejeitaH0 Z 19 p 0057 Slide 16 Resumo Teste de hipotese decisao com riscos claros α controla falso alarme β a cegueira Planeje n para equilibrar custo de errar e chance de detectar o que importa 2