·

Engenharia de Produção ·

Sistemas de Gestão de Qualidade

Send your question to AI and receive an answer instantly

Ask Question

Preview text

GESTÃO DE QUALIDADE E SUSTENTABILIDADE TESTES DE HIPÓTESE AULA 6 TESTES DE HIPÓTESES Problema Executartestes de hipóteses sobre o valor de parâmetros de interesse de uma população de estudo Óbvio Se conhecermos todos os elementos de uma população o que é pouco provável também conheceremos o verdadeiro valor de um particular parâmetro de interesse e não precisaremos esti málo nem testar hipóteses sobre o seu valor Mais comum Na maioria das vezes temos acesso a uma amostra pe quena da população e as nossas conclusões deverão ser baseadas em estimativas dos parâmetros obtidos nesta amostra Teste de hipóteses é uma ferramenta estatística que permite validar ou rejeitar uma hipótese afirmação feita sobre algum parâmetro de interesse com base em resultados obtidos em uma amostra Um leilão de bezerros Nelore procedentes de duas grandes fazendas FAZ1 e FAZ2 está sendo realizado Os animais dessas duas fazendas apresentam as seguintes características Fazenda Peso médio 𝜇 Desvio padrão 𝜎 Variância 𝜎2 FAZ1 FAZ2 145𝑘𝑔 155𝑘𝑔 12𝑘𝑔 20𝑘𝑔 144𝑘𝑔2 400𝑘𝑔2 Um lote de animais de procedência ignorada vai para leilão e um comprador leigo precisa saber a procedência dos animais para fazer uma oferta pois pretende comprar somente animais da FAZ2 O edital do leiloeiro informa que pouco antes do início do evento será divulgado o peso médio 𝑥 de uma amostra de 25 animais do lote que vai para leilão Com base neste valor que regra de decisão o comprador deve usar para saber se o lote de animais que vai para leilão é da FAZ2 Vamos admitir que o peso dos animais tem distribuição normal o que é comum Sugestão Concluir que os animais são Faz2 se o peso médio 𝑥 estiver mais próximo de 155 kg e que são da Faz1 se 𝑥 estiver mais próximo de 145 kg Para testar as hipóteses 𝐻0 os animais são da Faz2 𝐻1 os animais são da Faz1 podemos definir a seguinte regra de decisão Se 𝑥 150 concluir que os animais são daFaz1 Se 𝑥 150 concluir que os animais são daFaz2 Algumas dúvidas sobre esta regra de decisão Será que o comprador pode estar enganado quanto à procedência dos animais É possível que o peso médio de um lote de 25 animais da FAZ2 seja igual ou inferior a 150 kg É possível que o peso médio de um lote de 25 animais da FAZ1 seja superior a 150 kg Na tomada de decisão sobre a procedência dos animais existem dois tipos de erro que o comprador pode cometer com base em qualquer regra préfixada que serão numerados para facilitar a linguagem Erro tipo I concluir que os animais são da FAZ1 quando na verdade são da FAZ2 Acontece quando uma amostra de animais da FAZ2 apresenta um peso médio 𝑥 150kg Erro tipo II concluir que os animais são da FAZ2 quando naver dade são da FAZ1 Acontece quando uma amostra de animais da FAZ1 apresenta um peso médio 𝑥 150kg Para calcular a probabilidade de ocorrência desses dois tipos de erros após admitir que o peso dos animais tem distribuição normal precisamos definir a hipótese de nulidade 𝐻0 e a hipótese alternativa 𝐻𝑎 𝐻0 os animais são da FAZ2 2 Ou 𝐻0 X 𝑁𝜇2 155𝑘𝑔 𝜎2 400𝑘𝑔2 𝐻𝑎 os animais são da FAZ1 1 Ou 𝐻𝑎 X 𝑁𝜇1 145𝑘𝑔 𝜎2 144𝑘𝑔2 De uma forma mais simplificada podemos escrever as duas hipóteses como 𝐻0 𝜇 155 𝜎2 400𝑘𝑔2 𝐻𝑎 𝜇 145 𝜎2 144𝑘𝑔2 Definição Região Crítica 𝑅𝐶 de um teste é a região formada pelos valores que nos levam a rejeitar a hipótese 𝐻0 Baseado na regra de decisão adotada no exemplo podemos escrever a região crítica como 𝑅𝐶 𝑥 R 𝑥 150 Então 𝑃𝐸𝑟𝑟𝑜 𝑡𝑖𝑝𝑜 𝐼 𝑃𝑥 𝑅𝐶 𝐻0 é verdadeira 𝛼 𝑃𝐸𝑟𝑟𝑜 𝑡𝑖𝑝𝑜 𝐼𝐼 𝑃𝑥 𝑅𝐶 𝐻𝑎é verdadeira 𝛽 Como vamos usar a média amostral 𝑥 de 𝑛 25 animais se os animais forem da Faz1 𝑥 𝑁145 14425 ou 𝑥 𝑁145 576 Faz2 𝑥 𝑁155 40025 ou 𝑥 𝑁155 16 A probabilidade de cometer o erro do tipo I é igual a 𝛼 𝑃Erro tipoI 𝑃𝑥 150 𝑥 𝑁15516 150155 𝑃 𝑍 16 𝑃Z 125 01056 A probabilidade de se cometer o erro do tipo II é igual a 𝛽 𝑃Erro tipoII 𝑃𝑥 150 𝑥 𝑁145 576 150145 𝑃 𝑍 576 𝑃Z 208 00188 As probabilidades de ocorrência dos dois tipos de erros Origem dos Decisão animais FAZ1 FAZ2 FAZ1 FAZ2 Sem erro 𝛼 106 𝛽 19 Sem erro O comprador leigo cometerá o Erro tipo I com maior probabilidade 106 do que o Erro tipo II 19 Figura 1 Probabilidades de cometer os erros tipo I e II relacionadas com a regra de decisão adotada Em relação ao mecanismo dos erros vale observar que 𝑖 Os tamanhos dos erros tipo I e II dependem exclusivamente da regra de decisão adotada 𝑖𝑖 Adotando outros limites na regra de decisão Se escolhermos 𝑥 inferior a 150 𝛼 e 𝛽 Se escolhermos 𝑥 superior a 150 𝛽 e 𝛼 𝑖𝑖𝑖 𝛼 e 𝛽 simultaneamente somente se aumentarmos o tamanho da amostra usada no teste Procedimento usual para realizar um teste de hipótese É mais comum fixarmos um valor para 𝛼 𝑃𝐸𝑟𝑟𝑜 𝑡𝑖𝑝𝑜 𝐼 chamado nível de significância do teste e encontrarmos a região crítica cor respondente Por exemplo fixandose 𝛼 5 o que é bastante comum temos 𝛼 005 𝑃𝑥 𝑥𝑐 𝑥 𝑁155 16 𝑃𝑍 1645 16 𝑐 1645 𝑥𝑐155 𝑥 14842kg Neste caso a região crítica fica 𝑅𝐶5 𝑥𝑐 14842 e a regra de decisão associada a esta 𝑅𝐶 pode ser escrita como Se 𝑥 14842 kg conclua que os animais são da FAZ1 Se 𝑥 14842 kg conclua que os animais são daFAZ2 Note que para esta 𝑅𝐶5 temos 𝛼 𝑃𝐸𝑟𝑟𝑜 𝑑𝑜 𝑡𝑖𝑝𝑜 𝐼𝐼 005 e Normal Média145 Desvio padrão24 𝛽 𝑃𝐸𝑟𝑟𝑜 𝑑𝑜 𝑡𝑖𝑝𝑜 𝐼𝐼 𝑃𝑥 14842 𝑥 N145576 𝑃Z 1425 00771 018 016 014 012 010 008 006 004 002 000 Densidade 00771 145 14842 Peso médio dos bezerros kg Figura 9 Probabilidades de cometer os erros tipo I e II associados à 𝑅𝐶5 𝑥𝑐 14842 Vamos generalizar a notação para os testes de hipótese sobre qual quer parâmetro De um modo geral os erros envolvidos num teste de hipótese podem ser descritos como 𝐸𝑟𝑟𝑜 𝑡𝑖𝑝𝑜 𝐼 consiste em rejeitar 𝐻0 quando ela é verdadeira ou rejeitar erroneamente 𝐻0 𝐸𝑟𝑟𝑜 𝑡𝑖𝑝𝑜 𝐼𝐼 consiste em aceitar 𝐻0 quando ela é falsa ou aceitar erroneamente a hipótese 𝐻0 A hipótese da nulidade 𝐻0 é sempre escrita como uma igualdade e a hipótese alternativa 𝐻𝑎 como uma desigualdade A especificação da hipótese alternativa 𝐻𝑎 depende do grau de in formação que se tem sobre o problema ou da pergunta feita pelo pes quisador Vamos ver alguns exemplos Situação 1 Suponhamos que os animais possam vir da FAZ2 e de outras fazendas cujos animais apresentam um peso médio inferior a 155 kg e que o interesse do comprador é por animais da FAZ2 Neste caso só iremos desconfiar que os animais não são da FAZ2 se o peso médio dos animais for bem inferior a 155 kg Neste caso as hi póteses a serem testadas podem ser definidas como ou 𝐻0 os animais são da FAZ 2 𝐻0 𝜇 155 𝑘𝑔 𝐻𝑎 os animais não são da FAZ 2 𝐻𝑎 𝜇 155 𝑘𝑔 Neste caso tanto a regra de decisão hipótese alternativa é chamada unilateral à esquerda e pode escrita como Se 𝑥 𝑥𝑐concluir que os animais não são daFAZ2 Se 𝑥 𝑥𝑐concluir que os animais são daFAZ2 Se no Exemplo 41 fixarmos 𝛼 5 teremos 005 𝑃𝑥 𝑥𝑐 𝑥 N155 16 PZ 𝑧𝛼 16 𝛼 𝑐 𝑧 165 165 𝑥𝑐155 𝑥 14840 kg 𝑅𝐶5 𝑥R 𝑥 14840 Então ao nível de 5 de significância rejeitaremos 𝐻0e concluire mos que os animais não são da FAZ2 quando 𝑥 14840𝑘𝑔 e não rejeitaremos 𝐻0e concluiremos que os animais são da Faz2quando 𝑥 14840kg Situação 2 Suponhamos agora que existem fazendas com animais mais leves e outras com animais mais pesados que os da FAZ2 mas que o comprador continue interessado nos animais da Faz2 Neste caso somente iremos desconfiar que os animais não sejam da FAZ2 quando o peso médio deles for muito diferente muito infe rior ou muito superior de 155 kg As hipóteses são escritas como ou 𝐻0 os animais são da FAZ 2 𝐻0 155 kg 𝐻𝑎 os animais não são da FAZ 2 𝐻𝑎 155 kg Neste caso a regra de decisão hipótese alternativa é chamada bilateral e pode escrita como Se 𝑥 𝑥𝑐1 ou 𝑥 𝑥𝑐2 concluímos que os animais não são da FAZ2 Se 𝑥𝑐1 𝑥 𝑥𝑐2 concluímos que os animais são da FAZ2 Fixando 5 daremos preferência aos valores críticossimétricos em relação à média x Então 005 𝑃𝑥 𝑥𝑐1 ou 𝑥 𝑥𝑐2 𝑥 𝑁15516 padronizando 𝑃Z 𝑧𝑐1 𝑃Z 𝑧𝑐 2 𝑧𝑐1 196 e 𝑧𝑐2 196 04 03 02 01 00 Densidad e 1960 0025 1960 0025 0 Z Então Neste caso a região crítica bilateral 𝑅𝐶5 𝑥 R 𝑥 14716 ou 𝑥 16284 Só concluiremos que os animais são da FAZ2 ao nível de significância 5 quando o peso médio amostral 𝑥 1471616284𝑘𝑔 196 𝑥𝑐1 155 16 𝑐1 𝑥 14716kg 16 𝑥𝑐2155 196 𝑥𝑐2 16284kg Resumindo A escolha do sinal da desigualdade que aparece na hipótese alternativa 𝐻𝑎 depende das informações apresentadas no problema ou da pergunta formulada na pesquisa Exemplo Certo fazendeiro afirma que a média de produção de leite das suas vacas é superior a 30 kgdia Para confirmar ou não essa afirmação vamos usar uma amostra de suas vacas e testar 𝐻0 𝜇 30 𝐻𝑎 𝜇 30 afirmação do fazendeiro Lembrese A hipótese da nulidade 𝐻0 sempre envolve uma igual dade e a hipótese alternativa 𝐻𝑎 sempre envolve uma desigual dade PROCEDIMENTOS BÁSICOS PARA A CONSTRUÇÃO DE UM TESTE DE HIPÓTESE Os procedimentos básicos para a construção de um teste de hipótese sobre o valor de um parâmetro genérico são 𝑖 Fixe a hipótese que será colocada à prova 𝐻0 0 hipótese da nulidade e escolha uma hipótese alternativa 𝐻𝑎 que sempre incluirá uma desigualdade e será considerada verdadeira quan do 𝐻0for rejeitada 𝐻𝑎 0 𝐻𝑎 0 𝐻𝑎 0 hipótese bilateral ou bicaudal hipótese unilateral à direita hipótese unilateral à esquerda 𝑖𝑖 Use a teoria estatística para decidir qual estatística será usada para julgar 𝐻0 Por exemplo se o parâmetro em estudo for a média 𝜇 iremos usar o estimador 𝑥 e sob normalidade temse que 𝑥 𝑁𝜇𝜎2 𝑖𝑖𝑖 Fixe 𝑃𝐸𝑟𝑟𝑜 𝑡𝑖𝑝𝑜 𝐼 e construa a região crítica 𝑅𝐶 do teste Note que a desigualdade presente na 𝑅𝐶 terá o mesmo sinal da desigualdade que aparece em 𝐻𝑎 𝑖𝑣 Use as informações fornecidas pela amostra para encontrar o valor da estatística 𝜃que definirá a decisão 𝑣 Se 𝜃 𝑅𝐶 rejeite a hipótese 𝐻0 ao nível de significância e aceite a hipótese alternativa 𝐻𝑎 como verdadeira Se 𝜃 𝑅𝐶 aceite a hipótese 𝐻0 como verdadeira Notas Na maioria dos testes a hipótese alternativa 𝐻𝑎não especifica um único valor alternativo para a média 𝜇 o que dificultaimpossibi lita o cálculo de 𝛽 𝑃𝐸𝑟𝑟𝑜 𝑡𝑖𝑝𝑜 𝐼𝐼 É muito comum usar nos testes de hipóteses o nível de significân cia 𝛼 005 5 TESTE PARAA MÉDIADEUMAPOPULAÇÃONORMAL QUANDO A VARIÂNCIA DA POPULAÇÃO 𝜎2 É CONHECIDA As hipóteses testadas neste caso podem ser escritas como 𝐻0 𝜇 𝜇0 𝐻𝑎 𝜇 𝜇0 ou 𝐻𝑎 𝜇 𝜇0 ou 𝐻𝑎 𝜇 𝜇0 onde 𝜇0 é um valor fixado pelo pesquisador A estatística do teste será 𝑥 que tem distribuição 𝑁𝜇0 𝜎2𝑛 o que implica em 𝜎2𝑛 𝑥𝜇0 𝑍 𝑁0 1 A seguir resolveremos um exemplo típico de teste de hipótese para a média quando a variância populacional 𝜎2 é conhecida O peso ao desmame de bezerros Nelore do Campus tem um desvio padrão populacional conhecido e igual a 12kg Com o objetivo de testar a afirmação do zootecnista do Campus que o peso médio dos bezerros é 220 kg sorteouse uma amostra de 80 animais obtendose 𝑥 216kg Podemos confirmar a afirmação feita pelo zootecnista ao nível de significância de 5 Resolução X peso ao desmame de bezerros Nelore 𝑋 X 𝑁220 144 ou seja 𝜇𝑋 220 e 𝜎2 122 144 Hipóteses a serem testadas 𝐻0 𝜇 220 o peso médio ao desmame é 220 kg 𝐻𝑎 𝜇 220 o peso médio ao desmame não é 220kg Sob 𝐻0 temse que 𝑥 𝑁220 14480 ou 𝑥 𝑁220 180 Da tabela da distribuição normal padrão nós temos que Distribuição normal padrão 180 196 𝑥𝑐1 220 𝑥𝑐1 21737kg 180 196 𝑥𝑐2 220 𝑥𝑐2 22263kg 04 03 02 01 00 Densidade 196 0025 196 0025 0 1alfa 095 Então 𝑅𝐶5 𝑥 R 𝑥 21737𝑘𝑔 ou 𝑥 22263𝑘𝑔 Note que a 𝑅𝐶5 é formada por valores extremos distantes de 𝜇 220 Como a média amostral 𝑥 216 kg 𝑅𝐶5 rejeitamos a hipó tese 𝐻0𝛼 5 e concluímos que o peso médio ao desmame dos bezerros Nelore não é igual a 220 kg ou seja o zootecnista do Campus fez uma afirmação equivocada Procedimento alternativo mais simples para realizar o teste 1Escrever a 𝑅𝐶 em função da variável padronizada 𝑍 2Calcular o valor 𝑧𝑐𝑎𝑙𝑐 padronizando a média amostral 𝑥 3Verificar se 𝑧𝑐𝑎𝑙𝑐 pertence ou não 𝑅𝐶 e concluir sobre a rejei ção ou não de 𝐻0 No Exemplo 42 teríamos 𝑅𝐶5 𝑧 R 𝑧 196 Padronizando a média amostral 𝑥 teremos 𝑧𝑐𝑎𝑙 216220 298 180 04 03 02 01 00 Densidade 196 0025 196 0025 0 Distribuição normal padrão 1alfa 095 Como 𝑧𝑐𝑎𝑙𝑐 298 𝑅𝐶5 concluímos mais uma vez que a hi pótese 𝐻0deve ser rejeitada ao nível de 5 de significância e que podemos concluir que a afirmação do Zootecnista foi equivocada Sabese através de pesquisas que o desvio padrão da produção leiteira de certa raça no Brasil é 𝜎 23 kgvacadia Desejandose testar a afirmação que a produção média do rebanho leiteiro de certo pecuarista é superior a 60 kgvacadia sorteouse uma amostra de 36 vacas obtendose 𝑥 67kgvacadia Com base nesses resultados teste a afirmação do pecuarista usando 𝛼 5 e 𝛼 1 Resolução 𝐻0 𝜇 60 𝐻𝑎 𝜇 60 afirmação do pecuarista 𝑅𝐶5 𝑧 R 𝑧 165 𝑅𝐶1 𝑧 R 𝑧 233 03 02 01 00 Densidad e 1645 0 04 03 02 01 00 Densidad e 233 001 0 Distribuição normal padrão Da amostra temos que 𝑥 67 e 𝑛 36 𝑧𝑐𝑎𝑙 6760 183 2336 Como 𝑧𝑐𝑎𝑙𝑐 pertence à 𝑅𝐶5 e não pertence à 𝑅𝐶1 rejeita remos 𝐻0se assumirmos 5 mas aceitaremos 𝐻0como ver dadeira se assumirmos 1 Ou seja confirmaremos a afirmação do pecuarista se admitirmos 𝛼 𝑃Erro Tipo I 005 e não confirmaremos a informação do pecuarista se admitirmos 𝛼 001 Dúvida Como escolher o melhor nível de significância A escolha do nível de significância deve ser feita antes de realizar o teste e depende do risco que o pesquisador pode admitir de rejeitar erroneamente a hipótese 𝐻0 Na maioria dos testes utilizase 𝛼 005 Quando rejeitamos 𝐻0 indicamos entre parêntesis 𝑝 005 e quando não rejeitamos 𝐻0 indicamos 𝑝 005 NÍVEL DESCRITIVO DO TESTE Problema A escolha do nível de significância é arbitrária mas deve ser feita antes de realizar a análise Procedimento usado nos pacotes estatísticos Calcular a probabilidade de se obter sob 𝐻0 uma estatística de teste mais extrema do que aquela obtida na amostra ou seja cal cular o menor nível de significância para rejeitarmos a hipótese 𝐻0 com base nos resultados amostrais Este valor é chamado nível descritivo do teste ou 𝑝𝑣𝑎𝑙𝑜𝑟 e será denotado neste material por 𝛼 Para obtenção de 𝛼 calculase a probabilidade de ocorrerem valo res mais extremos da estatística observada na amostra e que são mais favoráveis à rejeição de 𝐻0 Esta é a forma que os softwares estatísticos executam qualquer teste de hipóteses calculam o valor no nível descritivo do teste 𝛼 𝑝𝑣𝑎𝑙𝑜𝑟 e deixam que o pesquisador decida se é um valor alto ou baixo Se o valor de 𝛼 for pequeno 𝛼 5 nós concluímos pela re jeição da hipótese 𝐻0 a este nível de significância e assumimos que a hipótese 𝐻𝑎é verdadeira Se 𝛼 for grande 𝛼 5 nós aceitamos ou não rejeitamos a hi pótese 𝐻0como verdadeira Se pensarmos no nível descritivo do teste como o menor risco de rejeitar erroneamente 𝐻0 Quando o risco for considerado pequeno 𝛼 5 deveremos re jeitar 𝐻0 Quando o risco for considerado grande 𝛼 5 deveremos assu mir que a hipótese 𝐻0 é verdadeira e não deveremos rejeitála No Exemplo 43 podemos calcular o nível descritivo do teste para concluir sobre a afirmação do pecuarista Lembrando que 𝐻0 𝜇 60 𝐻𝑎 𝜇 60 𝑥 67 𝑧𝑐𝑎𝑙𝑐 183 𝛼 𝑃𝑥 67 𝑃𝑍 183 0033 Como 𝛼 0033 é considerado pe queno pois é menor que 5 nós re jeitamos 𝐻0e concluímos que a afir mação do pecuarista está correta 04 03 02 01 00 Densidade 183 0033 0 Distribuição normalpadrão TESTE SOBRE A MÉDIA DE UMA DISTRIBUIÇÃO NORMAL QUANDO A VARIÂNCIA POPULACIONAL É DESCONHECIDA Hipóteses 𝐻0 𝜇 𝜇0 𝐻𝑎 𝜇 𝜇0 ou 𝐻𝑎 𝜇 𝜇0 ou 𝐻𝑎 𝜇 𝜇0 Como a variância populacional 𝜎2 é desconhecida o que é mais co mum a estatística do teste é 𝑥 𝜇0 𝑡 𝑠2𝑛 que tem distribuição 𝑡Student com 𝑛1 graus de liberdade 23 As mudanças observadas no teor de colesterol mg100 ml do sangue de coelhos após o tratamento com um novo pro duto foram medidas em 15 coelhos Os resultados foram 17 18 22 20 23 22 21 19 21 24 22 17 19 19 20 Podemos afirmar que a mudança média no teor de colesterolfoi infe rior a 21 mg100ml ao nível de significância 𝛼 005 Resolução X mudança no teor de colesterol no sangue de coelhos Por suposição X 𝑁𝜇 𝜎2 mas 𝜎2 também é desconhecido Hipóteses 𝐻0 𝜇 21 𝐻𝑎 𝜇 21 Fixado 005 obtemos da Tábua III 005 𝑃𝑥 𝑥𝑐 𝑃𝑇 𝑡𝛼 𝑡𝛼 1761 𝑅𝐶5 𝑡 R 𝑡 1761 Da amostra 𝑛 15 𝑥 2027 mg100ml e 𝑠2 44952 𝑡𝑐𝑎𝑙𝑐 202721 4495215 rejeitamos 𝐻0 e concluímos que a mudança no teor de colesterol do sangue de coelhos não foi inferior a 21 mg100ml 133 Como 𝑡𝑐𝑎𝑙 133 𝑅𝐶5 não Também podemos calcular o nível descritivo 𝛼𝑎𝑝𝑟𝑜𝑥𝑖𝑚𝑎𝑑𝑜 do teste pois a Tábua III foi construída para poucos valores de 𝑝 𝑃𝑡 𝑡𝑐 Neste caso procuramos na linha 𝑣 14𝑔𝑙 o número mais próximo de 133 e encontramos o valor 𝑡𝛼 1345 que está associada à pro babilidade 010 𝛼 𝑃𝑥 2027 𝑃𝑡 133 010 Uma companhia de cigarros anuncia que o índice médio de nicotina dos cigarros que fabrica apresentase abaixo de 23 mg por cigarro Um laboratóriorealiza 10 análisesdesse índice obtendo 27 24 21 22 23 22 21 21 23 e 20 mg de nicotina Admitindo que o índice de nicotina dos cigarros tem distribuição normal podese aceitar ao nível de significância de 10 a afirma ção do fabricante