·
Cursos Gerais ·
Estatística 2
Envie sua pergunta para a IA e receba a resposta na hora
Recomendado para você
1
Análise Estatística de Amostras Independentes com Python
Estatística 2
UMG
5
Questionário de Estatística e Probabilidade II - Unidade 4
Estatística 2
UMG
4
Lista de Exercícios Resolvidos de Estatística
Estatística 2
UMG
1
Coleta e Análise de Tweets sobre Assédio: Script R para Busca e Visualização de Dados
Estatística 2
UMG
1
Teste t para Comparacao de Medias com Variancias Iguais - Analise de Dados Venusioxlsx
Estatística 2
UMG
6
Questionário Unidade 3 - Estatística e Probabilidade II
Estatística 2
UMG
1
Discussão sobre Personalidades e Mídia Digital
Estatística 2
UMG
1
Analise de Vendas Venusioxlsx: Teste T e Comparacao de Medias
Estatística 2
UMG
5
Atividade 7: Questionário Unidade 4 - Estatística e Probabilidade II
Estatística 2
UMG
6
Questionário da Unidade 3 - Estatística e Probabilidade II
Estatística 2
UMG
Texto de pré-visualização
PROF DEYSE GEBERT DEMAT UNIVERSIDADE ESTADUAL DE PONTA GROSSA ESTATÍSTICA E PROBABILIDADE II UNIDADE 4 INFERÊNCIA TESTES DE HIPÓTESES ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 1 INFERÊNCIA ESTATÍSTICA O objetivo da Inferência Estatística é conhecer uma população por meio de informações coletadas em amostras ou seja é possível a partir de dados amostrais fazer afirmações sobre a população da qual foi retirada essa amostra Geralmente as populações são caracterizadas por medidas numéricas descritivas denominadas parâmetros Esses parâmetros podem ser estimados em amostras e a partir deles se fazer inferência sobre os parâmetros populacionais desconhecidos Existe uma notação específica para diferenciar quando um parâmetro é estimado a partir de uma amostra ou de uma população A tabela 1 abaixo apresenta os símbolos referentes aos parâmetros amostrais e populacionais Tabela 1 Notação de parâmetros amostrais e populacionais Símbolo amostral Símbolo populacional Média X Variância S2 2 Desvio padrão S Proporção pˆ p Os métodos para realizar inferências a respeito dos parâmetros como média desvio padrão proporção pertencem a duas categorias Testes de hipóteses Estimação por ponto e intervalos de confiança 1 TESTES DE HIPÓTESES Agora aprenderemos outro método para fazer inferência sobre parâmetros populacionais Em vez de calcular uma estimativa do parâmetro pontualmente ou em intervalo conforme visto na unidade anterior iremos admitir um valor hipotético para um parâmetro populacional e com base nas informações da amostra realizaremos um teste estatístico para aceitar ou rejeitar o valor hipotético Um teste de hipóteses nada mais é que uma regra de decisão para aceitar ou rejeitar uma hipótese estatística com base nos elementos amostrais A formulação das hipóteses é o ponto inicial do problema e deve depender única e exclusivamente das conclusões que se pretende obter com o teste Hipótese estatística é uma suposição quanto ao valor de um parâmetro populacional ou quanto à natureza da distribuição de probabilidade de uma variável populacional Existem dois tipos de hipóteses hipótese nula e hipótese alternativa Hipótese nula H0 esta hipótese leva esse nome pois sempre expressará uma igualdade É a hipótese a ser testada Exemplo H0 10 ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 2 Hipótese alternativa H1 sempre que rejeitarmos a hipótese nula devemos considerar a hipótese alternativa sendo assim essa nunca expressará uma igualdade A formulação da hipótese alternativa definirá o tipo de teste unilateral ou bilateral Se a formulação de H1 indicar que o parâmetro é maior ou menor do que o valor de teste valor considerado verdadeiro até que se prove o contrário o teste será unilateral ou seja somente há interesse se as diferenças entre os dados da amostra e o valor de teste forem em uma determinada direção Se a formulação da hipótese alternativa indicar que o parâmetro é diferente do valor de comparação o teste será Bilateral ou seja há interesse nas diferenças em qualquer direção Exemplo suponha que estamos formulando hipóteses para comparar o desempenho de um processador com determinado valor de referência sendo assim temos as seguintes hipóteses possíveis 1 H0 média processador valor de referência sempre expressará igualdade 2 H1 média processador valor de referência ou 3 H1 média processador valor de referência ou 4 H1 média processador valor de referência Sempre que usarmos o sinal em H1 temse um teste bilateral pois estaremos rejeitando a igualdade para diferenças muito grandes tanto positivas quanto negativas Ver Figura 1 Figura 1 Regiões de rejeição para H0 em um teste bilateral Sempre que usarmos o sinal em H1 temse um teste unilateral à direita pois estaremos rejeitando apenas diferenças muito grandes positivas Ver Figura 2 Figura 2 Região de rejeição para H0 em um teste unilateral à direita Sempre que usarmos o sinal em H1 temse um teste unilateral à esquerda pois estaremos rejeitando apenas diferenças muito grandes negativas Ver Figura 3 ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 3 Figura 3 Região de rejeição para H0 em um teste unilateral à esquerda 11 Erros de Julgamento Há dois possíveis tipos de erros quando realizamos um teste estatístico para aceitar ou rejeitar H0 Podemos rejeitar a hipótese H0 quando ela é verdadeira ou aceitar H0 quando ela é falsa O erro de rejeitar H0 sendo ela verdadeira é denominado Erro Tipo I e a probabilidade de se cometer o Erro Tipo I é designada α Por outro lado o erro de aceitar H0 sendo ela falsa é denominado Erro Tipo II e a probabilidade de cometêlo é designada β Num teste de hipótese a probabilidade máxima com que se arrisca um erro do tipo I é chamada nível de significância do teste α Geralmente adotase um nível de significância de 005 5 ou 001 1 O complementar do nível de significância é chamado de nível de confiança pois ele indica a confiabilidade do resultado obtido é a probabilidade de que a decisão tomada esteja correta A tabela 2 apresenta um resumo dos tipos de erros que se pode cometer em um teste de hipóteses Tabela 2 Tipos de erros envolvidos em um teste de hipóteses Realidade H0 verdadeira H0 falsa Decisão tomada Não rejeitar H0 Decisão correta Nível de confiança 1α Erro Tipo II β Rejeitar H0 Erro tipo I α Decisão correta Poder do teste 1β 12 Regra de Decisão Ao final da realização de um teste de hipótese é necessário tomar uma decisão rejeitar ou não a hipótese que está sendo colocada a prova H0 Para isso devemos verificar a localização da estatística do teste se está ou não na região que rejeita H0 A figura 4 apresenta algumas das possíveis localizações da estatística de um teste ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 4 Figura 4 Algumas situações apresentando as possíveis localizações da estatística do teste 13 Mecanismo Para Aplicação de Um Teste De Hipóteses 1 Determinar as hipóteses 2 Usando a teoria estatística determinar qual teste será utilizado 3 Determinar o nível de significância do teste 4 Calcular a estatística do teste 5 Determinar as regiões de rejeição e não rejeição para H0 utilizando os percentis da distribuição do teste escolhido 6 Verificar se o valor calculado da estatística do teste está dentro ou não da região de rejeição 7 Concluir ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 5 2 TESTE DE HIPÓTESES PARA UMA VARIÂNCIA Nos casos em que há o interesse de testar a hipótese de que o parâmetro variância populacional ² de uma determinada variável seja maior menor ou diferente de um certo valor utilizase o Teste ² que é baseado na distribuição ² Hipóteses H0 2 valor H1 2 valor Teste unilateral à direita ou H1 2 valor Teste unilateral à esquerda ou H1 2 valor Teste bilateral Estatística do teste QuiQuarado ² 2 0 2 ² 1 S n CAL com grau de liberdade GL n1 Sendo n tamanho da amostra S² variância calculada na amostra 2 0 o valor de referência para a comparação valor determinado para H0 Exemplo 1 Os dados abaixo se referem ao comprimento mm de um componente de computador fabricado pela empresa JC Uma montadora de computadores só aceita comprar esse componente se ele tiver média de comprimento igual a 8018 mm e desvio padrão de 6 mm Tendo em vista estas condições a montadora retirou uma amostra de um lote de componentes da empresa JC que está apresentada abaixo Verifique com um nível de significância de 5 se a variabilidade encontrada na amostra não difere da especificação exigida pela montadora 8010 8095 8062 8144 7990 8006 8002 7991 8120 7902 Solução 1 Determinar as hipóteses H0 ² 6² H1 ² 6² Obs H1 foi determinada com o sinal de maior porque se a variabilidade da amostra for menor ou igual a 6² isso seria considerado dentro do padrão estipulado pelo comprador pois quanto menor for uma variância menor será a variação do comprimento dos componentes Sendo assim só se rejeitará H0 caso a amostra tenha variância maior que 6² 2 Usando a teoria estatística determinar qual teste será utilizado O teste indicada para esta situação é o Teste QuiQuadrado que estamos estudando 3 Determinar o nível de significância do teste ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 6 Esta informação já foi fornecida no enunciado na prática o pesquisador quem escolhe esse valor que geralmente será 5 ou 1 dependendo da necessidade de precisão do teste 4 Calcular a estatística do teste Medidas calculadas na amostra 5284 1 1 2 2 n X x S n i i 1321 36 5284 1 10 ² 1 2 0 2 S n CAL 5 Determinar as regiões de rejeição e não rejeição para H0 utilizando os percentis da distribuição do teste escolhido Como estamos usando o Teste QuiQuadrado usaremos a distribuição QuiQuadrado para determinar a região de rejeição Na hipótese alternativa foi utilizado o sinal de maior sendo assim a região de rejeição α 5 será somente para o lado direito ou seja precisamos determinar o percentil 95 pois ele indica que 95 da área da curva está abaixo dele e que 5 está acima dele Utilizando a tabela 1 dos anexos que apresenta a distribuição QuiQuadrado o valor para o limite da região de rejeição se encontra na coluna de 5 e na linha de 9 graus de liberdade sendo 16919 6 Verificar se o valor calculado da estatística do teste está dentro ou não da região de rejeição Como 2 CAL 1321 2 TABELADO 16919 então a estatística do teste se encontra em uma região que deve aceitar H0 Ver figura 5 Figura 5 Representação gráfica do teste QuiQuadrado 7 Concluir No item 6 verificamos que devemos aceitar a hipótese nula isso significa que a variância da amostra pode ser considerada igual a 36 De uma maneira mais formal com 95 de confiança podese afirmar que a variabilidade do comprimento dos componentes pode ser considerada igual a 36 ou seja a montadora de computadores pode comprar os componentes da empresa JC pois eles estão dentro das especificações exigidas ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 7 3 TESTE DE HIPÓTESES PARA COMPARAÇÃO DE DUAS VARIÂNCIAS Para se testar a igualdade de duas variâncias provenientes de duas amostras independentes obtidas de populações normais utilizase o Teste F que é baseado na distribuição F Hipóteses H0 12 2 2 H1 12 2 2 Teste unilateral à direita ou H1 12 2 2 Teste unilateral à esquerda ou H1 12 2 2 Teste bilateral Estatística do teste F FCAL 2 2 12 S FCAL S com graus de liberdade GL1 n1 1 e GL2 n2 1 Sendo 2 1S a variância calculada na amostra 1 2 2 S a variância calculada na amostra 2 n1 tamanho da amostra 1 n2 tamanho da amostra 2 O Teste F possui uma peculiaridade por ser uma razão entre dois valores É sabido que se um valor alto é dividido por um valor menor quanto mais distantes forem esses valores maior será o resultado dessa divisão Então quando decidimos colocar a maior variância no numerador da divisão e a menor variância no denominador saberemos que quanto mais diferentes elas forem maior será o valor de FCAL Sendo assim somente poderemos rejeitar a igualdade entre as duas variâncias com uma região de rejeição do lado direito Caso contrário utilizando a menor variância no numerador e a maior no denominador a região de rejeição deverá estar no lado direito Exemplo 2 Uma empresa montadora de computadores deseja comparar a variabilidade do comprimento mm de um determinado componente fornecido por duas empresas diferentes Com os dados abaixo e tendo em vista a normalidade qual a conclusão que se pode chegar ao nível α 005 Fornecedor 1 Empresa JC 801 8095 8062 8144 799 8006 8002 7991 812 7902 Fornecedor 2 Empresa WF 8108 8065 7986 8015 8080 7943 8064 7990 8052 8035 ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 8 Solução 1 Determinar as hipóteses H0 12 2 2 H1 12 2 2 Obs H1 foi determinada com o sinal de maior sendo assim a maior variância deve ser colocada no numerador da estatística do teste Caso o pesquisador utilize o sinal de menor então a menor variância deveria ser colocada no numerador da divisão 2 Usando a teoria estatística determinar qual teste será utilizado O teste indicado para esta situação é o Teste F que estamos estudando 3 Determinar o nível de significância do teste Esta informação já foi fornecida no enunciado do problema na prática o pesquisador quem escolhe esse valor que geralmente será 5 ou 1 dependendo da necessidade de precisão do teste 4 Calcular a estatística do teste Variância calculada na amostra da empresa JC 528462 1 1 2 12 n X x S n i i Variância calculada na amostra da empresa WF 251773 1 1 2 2 2 n X x S n i i 2 0989 1773 25 528462 FCALC 5 Determinar as regiões de rejeição e não rejeição para H0 utilizando os percentis da distribuição do teste escolhido Como estamos usando o Teste F usaremos a distribuição F para determinar a região de rejeição Na hipótese alternativa foi utilizado o sinal de maior sendo assim a região de rejeição α 5 será somente para o lado direito ou seja precisamos determinar o percentil 95 pois ele indica que 95 da área da curva está abaixo dele e que 5 está acima dele Utilizando a tabela 2 dos anexos que apresenta valores da distribuição F encontraremos o limite da região de rejeição na coluna de 9 graus para numerador e na linha de 9 graus de liberdade do denominador sendo 318 6 Verificar se o valor calculado da estatística do teste está dentro ou não da região de rejeição Como FCAL 20989 FTABELADO 318 então a estatística do teste se encontra em uma região que deve aceitar H0 pois não ultrapassou o limite da região de rejeição Ver figura 6 ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 9 Figura 6 Representação gráfica do teste F 7 Concluir No item 6 verificamos que devemos aceitar a hipótese nula isso significa que a variância da amostra 1 pode ser considerada igual a variância da amostra 2 O seja a variabilidade do comprimento dos componentes da empresa JC pode ser considerado igual a variabilidade do comprimentos dos componentes da empresa WF com 95 de confiança 4 TESTE DE HIPÓTESES PARA UMA MÉDIA Nos casos em que há o interesse de testar a hipótese de que o parâmetro média populacional de uma determinada variável seja maior menor ou diferente de um certo valor utilizase o Teste t que é baseado na distribuição t de Student ou o Teste Z que é baseado na distribuição Normal Hipóteses H0 valor H1 valor Teste unilateral à direita ou H1 valor Teste unilateral à esquerda ou H1 valor Teste bilateral Quando o pesquisador necessita comparar uma média a um determinado valor existem três situações possíveis que serão descritas a seguir 41 Quando a Variância Populacional 2 da Variável é Conhecida Existem situações em que a variabilidade da variável em estudo é conhecida um exemplo disso são máquinas que já possuem em sua especificação qual a variabilidade de sua produção Quando essa variância é conhecida devese utilizar o Teste Z para a comparação da média com algum valor de referência ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 10 Estatística do teste Z ZCAL n X ZCAL 0 Sendo X a média calculada na amostra 0 o valor com o qual se quer comparar definido em H0 o desvio padrão que já é conhecido e não foi calculado na amostra n tamanho da amostra Exemplo 3 Desejase estudar o tempo de resposta num sistema de rede local Estudos anteriores afirmam que o tempo de resposta ideal para uma consulta no sistema é de 12 milissegundos ms com desviopadrão de 1 milissegundo Foram monitorados 5 clientes da rede aleatoriamente escolhidos obtendose os seguintes tempos médios em ms de resposta para uma consulta no sistema 129 136 146 139 143 Perguntase o sistema continua trabalhando dentro do esperado Use alfa de 5 Solução 1 Determinar as hipóteses H0 12 e H1 12 Obs H1 foi determinada com o sinal de diferente pois o objetivo é verificar se o sistema trabalha dentro do esperado ou seja rejeitaremos H0 se o sistema gastar mais que 12 ms numa consulta e também se gastar menos que 12 ms 2 Usando a teoria estatística determinar qual teste será utilizado O teste indicado para esta situação é o Teste Z que estamos estudando 3 Determinar o nível de significância do teste Esta informação já foi fornecida no enunciado na prática o pesquisador quem escolhe esse valor que geralmente será 5 ou 1 dependendo da necessidade de precisão do teste 4 Calcular a estatística do teste Dados calculados na amostra X 1386 1591 4 5 1 12 1386 ZCAL 5 Determinar as regiões de rejeição e não rejeição para H0 utilizando os percentis da distribuição do teste escolhido Como estamos usando o Teste Z usaremos a distribuição Normal padrão para determinar a região de rejeição Na hipótese alternativa foi utilizado o sinal de diferente sendo assim teremos um teste bilateral no qual a região de rejeição α 5 será dividia em duas partes Ver figura 7 ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 11 Observando a tabela da distribuição Normal padrão tabela 3 dos anexos o percentil 975 que indica que 975 da área da curva está abaixo dele e 25 da área está acima desse valor vale 196 Esse valor foi encontrado na linha 19 e coluna 6 da tabela da Normal padrão pois nessa intersecção encontrase um valor de área correspondente a 0475002 área hachurada da imagem na tabela Como a distribuição Normal reduzida é simétrica o outro limite da região de rejeição possui o mesmo valor porém com o sinal negativo Ver figura 7 6 Verificar se o valor calculado da estatística do teste está dentro ou não da região de rejeição Como ZCAL 41591 ZTABELADO 196 então a estatística do teste se encontra em uma região que deve rejeitar H0 Ver figura 7 Figura 7 Apresentação gráfica do Teste Z 7 Concluir No item 6 verificamos que devemos rejeitar a hipótese nula isso significa que a média da amostra não pode ser considerada igual a 12 ou seja com 95 de confiança podemos afirmar que a média da amostra 1386 ms não pode ser considerada igual a 12 ms Logo o tempo de resposta do sistema é maior do que o ideal 42 Quando a Variância Populacional 2 da Variável Não é Conhecida e a Amostra é Pequena Quando a variância não é conhecida precisamos estimála na amostra Utilizando uma estimativa amostral da variância não é mais possível testarmos a média com o Teste Z da distribuição normal padrão Nestes casos o mais adequado é utilizarmos o Teste t de Student baseado na distribuição t de Student Tratase de uma distribuição de probabilidades que possui média zero como a distribuição normal padrão mas sua variância é igual a 2 sendo o grau de liberdade determinado por n1 Estatística do Teste t tCAL n S X tCAL 0 Sendo X a média calculada na amostra 0 o valor com o qual se quer comparar definido em H0 S o desvio padrão calculado na amostra n tamanho da amostra ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 12 Exemplo 4 Desejase estudar a influência do tempo de resposta num sistema de rede local Estudos anteriores afirmam que o tempo de resposta ideal para uma consulta no sistema é de 12 milissegundos ms Foram monitorados 5 clientes da rede aleatoriamente escolhidos obtendose os seguintes tempos médios em ms de resposta para uma consulta no sistema 129 136 146 139 143 O sistema continua trabalhando dentro do esperado Use alfa de 5 Solução 1 Determinar as hipóteses H0 12 H1 12 Obs H1 foi determinada com o sinal de diferente pois o objetivo é verificar se o sistema trabalha dentro do esperado ou seja rejeitaremos H0 se o sistema gastar mais que 12 ms numa consulta e também se gastar menos que 12 ms 2 Usando a teoria estatística determinar qual teste será utilizado O teste indicado para esta situação é o Teste t de Student que estamos estudando 3 Determinar o nível de significância do teste Esta informação já foi fornecida no enunciado 5 4 Calcular a estatística do teste Medidas obtidas na amostra S 0658 X 1386 3208 6 5 658 0 1386 12 tCAL 5 Determinar as regiões de rejeição e não rejeição para H0 utilizando os percentis da distribuição do teste escolhido Como estamos usando o Teste t de Student usaremos a distribuição t para determinar a região de rejeição Na hipótese alternativa foi utilizado o sinal de diferente sendo assim teremos um teste bilateral no qual a região de rejeição α 5 será dividia em duas partes Observando a tabela da distribuição t de Student tabela 4 dos anexos o percentil 975 que indica 975 da área da curva abaixo desse valor e 25 da área está acima desse valor vale 27764 Esse valor foi encontrado na linha 4 que corresponde aos graus de liberdade n1 e coluna t0975 que corresponde a área do percentil 975 área hachurada da imagem da tabela Como a distribuição t de Student é simétrica o outro limite da região de rejeição possui o mesmo valor porém com o sinal negativo Ver figura 8 6 Verificar se o valor calculado da estatística do teste está dentro ou não da região de rejeição Como tCAL 63208 tTABELADO 27764 então a estatística do teste se encontra em uma região que deve rejeitar H0 Ver figura 8 ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 13 Figura 8 Representação gráfica do Teste t de Student 7 Concluir No item 6 verificamos que devemos rejeitar a hipótese nula isso significa que a média da amostra não pode ser considerada igual a 12 ou seja com 95 de confiança podemos afirmar que a média da amostra 1386 ms não pode ser considerada igual a 12 ms Logo o tempo de resposta do sistema é maior do que o ideal 43 Quando a Variância Populacional 2 da Variável Não é Conhecida Mas a Amostra é Grande Já sabemos que quando a variância não é conhecida e precisamos estimála na amostra para testarmos a média devemos utilizar a distribuição t de Student que possui média zero como a distribuição normal padrão e variância igual a 2 sendo o grau de liberdade determinado por n1 Com isso verificamos que a variância da distribuição t de Student depende do tamanho da amostra quanto maior a amostra mais o quociente 2 aproximase de 1 a variância da distribuição normal padrão e mais a distribuição t de Student aproximase da distribuição normal padrão Por essa razão quando estamos trabalhando com amostras grandes é possível utilizar o Teste Z visto no item 41 mesmo substituindo o desvio padrão populacional pelo desvio padrão calculado na amostra S Em geral uma amostra é considerada grande quando possui 30 ou mais observações Exemplo 5 Um certo tipo de fio metálico usado na indústria eletrônica deve por padronização ser percorrido por uma corrente elétrica de intensidade i em 500 milissegundos Um engenheiro gerente de produção de uma indústria de componentes eletrônicos garante que isso acontece com os fios produzidos por sua empresa Mesmo assim um comprador desconfiado solicita uma amostra aleatória de 45 fios e os submete a teste A partir dos dados amostrais verificouse que a média do tempo de percurso foi de 490 milissegundos com um desviopadrão de 142 Sendo assim o que se pode concluir ao nível de 95 de certeza sobre a afirmação do engenheiro Suponha normalidade dos dados Solução 1 Determinar as hipóteses H0 500 H1 500 Obs H1 foi determinada com o sinal de diferente pois o objetivo é verificar se a corrente elétrica percorre o fio metálico em 500 ms ou seja rejeitaremos H0 se o tempo gasto for maior ou menor que 500 ms ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 14 2 Usando a teoria estatística determinar qual teste será utilizado O teste indicado para esta situação é o Teste Z que estamos estudando 3 Determinar o nível de significância do teste Esta informação já foi fornecida no enunciado 005 4 Calcular a estatística do teste Medidas obtidas na amostra n 45 S 142 X 490 7241 4 45 2 14 500 490 ZCAL 5 Determinar as regiões de rejeição e não rejeição para H0 utilizando os percentis da distribuição do teste escolhido Como estamos usando o Teste Z usaremos a distribuição Normal reduzida para determinar a região de rejeição Na hipótese alternativa foi utilizado o sinal de diferente sendo assim teremos um teste bilateral no qual a região de rejeição α 5 será dividia em duas partes Observando a tabela da distribuição Normal padrão tabela 3 dos anexos o percentil 975 que indica 975 da área da curva abaixo desse valor e 25 da área está acima desse valor vale 196 Esse valor foi encontrado na linha 19 e coluna 6 da tabela da Normal padrão pois nessa intersecção encontrase um valor de área correspondente a 0475002 área hachurada da imagem na tabela Como a distribuição Normal reduzida é simétrica o outro limite da região de rejeição possui o mesmo valor porém com o sinal negativo Ver figura 9 6 Verificar se o valor calculado da estatística do teste está dentro ou não da região de rejeição Como ZCAL 47241 ZTABELADO 196 então a estatística do teste se encontra em uma região que deve rejeitar H0 Ver figura 9 Figura 9 Representação gráfica do Teste Z 7 Concluir No item 6 verificamos que devemos rejeitar a hipótese nula isso significa que a média da amostra não pode ser considerada igual a 500 ou seja com 95 de confiança podemos afirmar que a média da amostra 490 ms não pode ser considerada igual a 500 ms Logo o tempo gasto para percorrer o fio metálico é menor que o afirmado pelo engenheiro ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 15 5 TESTES DE HIPÓTESES PARA DUAS MÉDIAS Neste caso o que interessa é testar a hipótese da igualdade entre duas médias populacionais 1 e 2 o que é o mesmo que testar se a diferença entre elas é igual a zero Hipóteses H0 1 2 ou 1 2 0 H1 1 2 ou 1 2 0 Teste unilateral à direita ou H1 1 2 ou 1 2 0 Teste unilateral à esquerda ou H1 1 2 ou 1 2 0 Teste bilateral Existem três situações possíveis para a comparação entre médias de duas amostras e estas serão descritas a seguir 51 Quando as Variâncias Populacionais 2 da Variável São Conhecidas Nesses casos as variâncias populacionais serão valores conhecidos e não serão estimados a partir da amostra coletada O teste mais indicado em situações como esta é o Teste Z Vale lembrar que este teste possui o mesmo nome do Teste Z que é aplicado quando se quer comparar uma média a um valor de referência estes possuem o mesmo nome pois ambos utilizam a distribuição Normal Padrão No entanto quando esse teste é aplicado para comparação entre médias de duas amostras diferentes e independentes são necessárias algumas alterações na estatística do teste que estão apresentadas a seguir Estatística do teste Z ZCAL 2 2 2 1 2 1 2 1 n n X X ZCAL Sendo 1 X a média calculada na amostra 1 2 X a média calculada na amostra 2 12 a variância da população 1 2 2 a variância da população 2 n1 tamanho da amostra 1 n2 tamanho da amostra 2 Exemplo 6 Duas marcas de monitores para computador A e B foram submetidas a um teste de durabilidade Em estudos anteriores as duas marcas verificaram que o desvio padrão da ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 16 durabilidade é de 250 dias e 300 dias respectivamente Com os dados abaixo testar ao nível de 5 de significância se o monitor A tem durabilidade superior ao monitor B Durabilidade dias Monitor A Monitor B 3412 2999 2360 3011 3246 2908 3090 3203 3183 3510 2658 3072 3014 3092 3297 3618 3531 3408 3225 2755 3534 3216 2754 3242 2738 3351 2999 2715 3071 3127 2788 2994 3546 3348 2634 2504 3488 3275 3232 3507 3395 2440 3392 3167 3414 3245 3505 3111 3429 3243 3520 3188 3254 2888 3322 2471 3683 3223 3158 3288 2907 3267 3382 3410 2969 3029 Solução 1 Determinar as hipóteses H0 A B ou A B 0 H1 A B ou A B 0 Obs H1 foi determinada com o sinal de maior pois o objetivo é verificar se a durabilidade média do monitor A é maior que a do monitor B ou seja rejeitaremos H0 apenas se a média de A for estatisticamente maior que a média de B isso é o mesmo que dizer que a diferença entre as médias é maior que zero 2 Usando a teoria estatística determinar qual teste será utilizado O teste indicado para esta situação é o Teste Z que estamos estudando 3 Determinar o nível de significância do teste Esta informação já foi fornecida no enunciado devemos utilizar 5 4 Calcular a estatística do teste Medidas obtidas na amostra X A 32283529 X B 30684687 nA 34 e nB 32 ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 17 3445 2 32 300 34 250 30684687 3529 3228 2 2 ZCAL 5 Determinar as regiões de rejeição e não rejeição para H0 utilizando os percentis da distribuição do teste escolhido Como estamos usando o Teste Z usaremos a distribuição Normal Padrão para determinar a região de rejeição Na hipótese alternativa foi utilizado o sinal de maior sendo assim teremos um teste unilateral à direita Observando a tabela da distribuição Normal reduzida tabela 3 dos anexos o percentil 95 que indica 95 da área da curva abaixo desse valor e 5 da área está acima desse valor vale 164 Esse valor foi encontrado na linha 16 e coluna 4 da tabela da Normal reduzida pois nessa intersecção encontrase um valor de área correspondente a 0449497 que é a área hachurada da imagem na tabela que indica o percentil 95 Ver figura 10 6 Verificar se o valor calculado da estatística do teste está dentro ou não da região de rejeição Como ZCAL 23445 ZTABELADO 164 então a estatística do teste se encontra em uma região que deve rejeitar H0 Ver figura 10 Figura 10 Apresentação gráfica do Teste Z para duas médias 7 Concluir No item 6 verificamos que devemos rejeitar a hipótese nula isso significa que a média da amostra A não pode ser considerada igual a média da amostra B ou seja com 95 de confiança podemos afirmar que a durabilidade média dos monitores da marca A é estatisticamente maior que a durabilidade média dos monitores da marca B 52 Quando as Variâncias Populacionais 2 da Variável Não São Conhecidas Nesses casos as variâncias deverão ser estimadas utilizando os dados das duas amostras que estão sendo estudadas Como vimos anteriormente quando as variâncias são estimadas na amostra utilizase a distribuição t de Student para testar a média Para a comparação de duas médias o procedimento do teste é semelhante no entanto há variações na sua aplicação se as variâncias estimadas na amostra forem consideradas iguais ou não Perceba que queremos comparar duas médias no entanto precisamos saber se as variâncias das amostras são iguais ou não para identificarmos qual metodologia de teste deveremos aplicar Pra essa verificação é necessário aplicarmos o Teste F antes de testarmos as médias ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 18 CASO 1 PARA VARIÂNCIAS AMOSTRAIS CONSIDERADAS IGUAIS Este é o caso em que após a aplicação do Teste F verificamos que as variâncias das duas amostras foram consideradas iguais Homocedásticas Estatística do teste t de Student tCAL 2 1 2 1 1 1 n n S X X t C CAL 2 1 1 2 1 2 2 2 2 1 1 n n S n S n SC Sendo 1 X a média calculada na amostra 1 2 X a média calculada na amostra 2 C S o desvio padrão comum 2 1S a variância calculada na amostra 1 2 2 S a variância calculada na amostra 2 n1 tamanho da amostra 1 n2 tamanho da amostra 2 CASO 2 PARA VARIÂNCIAS AMOSTRAIS CONSIDERADAS DIFERENTES Este é o caso em que após a aplicação do Teste F verificamos que as variâncias das duas amostras foram consideradas diferentes heterocedásticas Para aplicação do Teste t de Student nestes casos a maior diferença está no cálculo dos graus de liberdade GL Estatística do teste t de Student tCAL 2 2 2 1 2 1 2 1 n S n S X X tCAL 1 1 2 2 2 2 2 1 2 1 2 1 2 2 2 2 1 2 1 n n S n n S n S n S GL Sendo 1 X a média calculada na amostra 1 2 X a média calculada na amostra 2 2 1S a variância calculada na amostra 1 2 2 S a variância calculada na amostra 2 n1 tamanho da amostra 1 n2 tamanho da amostra 2 GL graus de liberdade ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 19 Exemplo 7 Duas marcas de HD para computador A e B foram submetidas a um teste de durabilidade que foi medida em meses Com os dados abaixo testar ao nível 5 se existe superioridade entre as marcas dos HDs HDA HDB 42 51 36 49 48 65 61 57 53 55 45 54 53 49 71 58 46 63 59 67 56 62 Solução 1 Determinar as hipóteses H0 A B ou A B 0 H1 A B ou A B 0 Obs H1 foi determinada com o sinal de diferente pois o objetivo é verificar se a durabilidade média dos HDs é diferente ou seja rejeitaremos a hipótese de igualdade se a diferença entre as médias for grande o suficiente tanto para diferenças negativas quanto positivas 2 Usando a teoria estatística determinar qual teste será utilizado O teste indicado para esta situação é o Teste t de Student no entanto precisamos saber se as variâncias amostrais podem ser consideradas iguais ou não para escolhermos de qual maneira aplicar o teste de médias Verificar item 3 com as instruções para aplicação do Teste F Hipóteses Teste F H0 2 A 2 B H1 2 A 2 B Medidas obtidas na amostra 2 A S 1041923 2 B S 3275 31814 75 32 1041923 FCALC Limite da região de rejeição para H0 328 na tabela F coluna 12 linha 8 ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 20 Como Fcal 31814 FTABELADO 328 a estatística do teste se encontra na região que aceita H0 logo as duas variâncias amostrais pode ser consideradas estatisticamente iguais com 95 de confiança Após essa conclusão sabemos que estamos em uma situação de acordo com o caso 1 com variâncias amostrais homocedásticas 3 Determinar o nível de significância do teste Esta informação já foi indicada no enunciado 5 4 Calcular a estatística do teste Medidas obtidas na amostra 2 A S 1041923 2 B S 3275 X A 53769 XB 55666 nA 13 e nB 9 8 6957 2 9 13 1 3275 9 1 1041923 13 SC 5031 0 9 1 13 1 6957 8 55666 53769 tCAL 5 Determinar as regiões de rejeição e não rejeição para H0 utilizando os percentis da distribuição do teste escolhido Como estamos usando o Teste t de Student usaremos a distribuição t de Student para determinar a região de rejeição Na hipótese alternativa foi utilizado o sinal de diferente sendo assim teremos um teste bilateral no qual a região de rejeição α 5 será dividia em duas partes Observando a tabela da distribuição t de Student tabela 4 dos anexos o percentil 975 que indica 975 da área da curva abaixo desse valor e 25 da área está acima desse valor vale 2086 Esse valor foi encontrado na linha 20 que corresponde ao grau de liberdade n1n22 e coluna t0975 que corresponde a área do percentil 975 área hachurada da imagem da tabela Como a distribuição t de Student é simétrica o outro limite da região de rejeição possui o mesmo valor porém com o sinal negativo Ver figura 11 6 Verificar se o valor calculado da estatística do teste está dentro ou não da região de rejeição Como tCAL 05031 tTABELADO 2086 então a estatística do teste se encontra em uma região que deve aceitar H0 Ver figura 11 Figura 11 Apresentação gráfica do Teste t de Student para duas médias com variâncias iguais 7 Concluir No item 6 verificamos que devemos aceitar a hipótese nula isso significa que as duas médias podem ser consideradas estatisticamente iguais ou seja com 95 de confiança podemos afirmar que não há superioridade em relação a durabilidade média entre as duas marcas de HD ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 21 Exemplo 8 Duas marcas de HD para computador X e Y foram submetidas a um teste de durabilidade que foi medida em meses Com os dados abaixo testar ao nível 5 se existe superioridade entre as marcas dos HDs HDX HDY 42 61 36 59 28 65 31 57 53 55 35 54 33 49 71 58 36 63 49 67 56 62 Solução 1 Determinar as hipóteses H0 X Y ou X Y 0 H1 X y ou X Y 0 Obs H1 foi determinada com o sinal de diferente pois o objetivo é verificar se a durabilidade média dos HDs é diferente 2 Usando a teoria estatística determinar qual teste será utilizado O teste indicado para esta situação é o Teste t de Student no entanto precisamos saber se as variâncias amostrais podem ser consideradas iguais ou não para escolhermos de qual maneira aplicar o teste de médias Verificar item 3 com as instruções para aplicação do Teste F Hipóteses Teste F H0 2 X 2 Y H1 2 X 2 Y Medidas obtidas na amostra 2 X S 2112435 2 Y S 238611 8 853 8611 23 2112435 FCALC Limite da região de rejeição para H0 328 na tabela da distribuição F coluna 12 linha 8 ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 22 Como Fcal 8853 FTABELADO 328 a estatística do teste se encontra na região que rejeita H0 logo as duas variâncias amostrais pode ser consideradas estatisticamente diferentes com 95 de confiança Após essa conclusão sabemos que estamos em uma situação de acordo com o caso 2 com variâncias amostrais heterocedásticas 3 Determinar o nível de significância do teste Esta informação já foi indicada no enunciado 5 4 Calcular a estatística do teste Medidas obtidas na amostra 2 X S 2112435 2 Y S 238611 X X 460769 XY 578888 nX 13 e nY 9 7169 2 9 8611 23 13 2435 211 578888 460769 tCAL 6118 15 1 9 9 8611 23 13 1 13 2435 211 9 8611 23 13 2435 211 2 2 2 GL 5 Determinar as regiões de rejeição e não rejeição para H0 utilizando os percentis da distribuição do teste escolhido Como estamos usando o Teste t de Student para o caso 2 usaremos a distribuição t de Student para determinar a região de rejeição Na hipótese alternativa foi utilizado o sinal de diferente sendo assim teremos um teste bilateral no qual a região de rejeição α 5 será dividia em duas partes Observando a tabela da distribuição t de Student tabela 4 dos anexos o percentil 975 que indica 975 da área da curva abaixo desse valor e 25 da área está acima desse valor vale 21256 Esse valor foi encontrado na tabela fazendo a média entre os valores da linha 15 e 16 da coluna t0975 Como o GL 156118 e este valor não existe na tabela podese utilizar a média entre os graus de liberdade 15 e 16 A distribuição t de Student é simétrica sendo assim o outro limite da região de rejeição possui o mesmo valor porém com o sinal negativo Ver figura 12 6 Verificar se o valor calculado da estatística do teste está dentro ou não da região de rejeição Como tCAL 27169 tTABELADO 21256 então a estatística do teste se encontra em uma região que deve rejeitar H0 Ver figura 12 Figura 12 Apresentação gráfica do Teste t de Student para duas médias com variâncias diferentes 7 Concluir No item 6 verificamos que devemos rejeitar a hipótese nula isso significa que as duas médias não podem ser consideradas estatisticamente iguais ou seja com 95 de confiança ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 23 podemos afirmar que a durabilidade média do HDY é diferente da HDX Logo a média do HDY é maior que a do HDX 6 TESTE DE HIPÓTESES PARA UMA PROPORÇÃO Nos casos em que há o interesse de testar a hipótese de que o parâmetro proporção populacional p de uma determinada variável binomial seja maior menor ou diferente de um certo valor também utilizamos o Teste Z que é baseado na distribuição Normal Padrão Hipóteses H0 p valor H1 p valor Teste unilateral à direita ou H1 p valor Teste unilateral à esquerda ou H1 p valor Teste bilateral Estatística do teste Z ZCAL n p p p p Z CAL 1 ˆ 0 0 0 n p x ˆ Sendo p0 a valor para a comparação n o tamanho da amostra pˆ a proporção estimada na amostra x o número de ocorrências do evento de interesse na amostra Exemplo 9 Num experimento para testar a eficiência do sistema inteligente KNOW na aquisição de conhecimento sobre determinado assunto elaboraramse 60 questões do tipo certoerrado Tendo em vista que a proporção mínima para que um sistema computacional de aquisição de conhecimento seja considerado eficiente é de 70 o que se pode concluir ao nível de 1 de significância sobre o KNOW uma vez que acertou 40 questões Solução 1 Determinar as hipóteses H0 p 07 H1 p 07 Obs H1 foi determinada com o sinal de menor pois o objetivo é verificar se o sistema é eficiente para tal esse sistema deve acertar 70 das questões ou mais ou seja somente rejeitaremos H0 se o sistema acertar menos que 70 das questões sendo assim considerado não eficiente ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 24 2 Usando a teoria estatística determinar qual teste será utilizado O teste indicado para esta situação é o Teste Z que estamos estudando 3 Determinar o nível de significância do teste Esta informação já foi apresentada no enunciado 001 4 Calcular a estatística do teste Medidas obtidas na amostra p 4060 06666 5634 0 60 70 1 70 70 0 6666 ZCAL 5 Determinar as regiões de rejeição e não rejeição para H0 utilizando os percentis da distribuição do teste escolhido Como estamos usando o Teste Z usaremos a distribuição Normal Padrão para determinar a região de rejeição Na hipótese alternativa foi utilizado o sinal de menor sendo assim teremos um teste unilateral à esquerda Observando a tabela da distribuição Normal padrão tabela 3 dos anexos o percentil 99 que indica 99 da área da curva abaixo desse valor e 1 da área está acima desse valor vale 233 Esse valor foi encontrado na linha 23 e coluna 3 da tabela da Normal Padrão pois nessa intersecção encontrase um valor de área correspondente a 0490097 área hachurada da imagem na tabela Como a distribuição Normal reduzida é simétrica e queremos o limite da região de rejeição para o lado esquerdo devemos apenas acrescentar o sinal negativo Ver figura 13 6 Verificar se o valor calculado da estatística do teste está dentro ou não da região de rejeição Como ZCAL 05634 ZTABELADO 233 então a estatística do teste se encontra em uma região que deve aceitar H0 Ver figura 13 Figura 13 Apresentação gráfica do Teste Z para uma proporção 7 Concluir No item 6 verificamos que não devemos rejeitar a hipótese nula isso significa que a proporção da amostra pode ser considerada igual a 07 ou seja com 99 de confiança podemos afirmar que o sistema inteligente KNOW é eficiente ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 25 7 TESTES DE HIPÓTESES PARA DUAS PROPORÇÕES Nesta situação o interesse é testar a hipótese de que não há diferença entre duas proporções obtidas em amostras de tamanhos n1 e n2 retiradas de duas populações binomiais Para esse caso também se utiliza o Teste Z porém com a caracterização desta situação Hipóteses H0 p1 p2 H1 p1 p2 Teste unilateral à direita ou H1 p1 p2 Teste unilateral à esquerda ou H1 p1 p2 Teste bilateral Estatística do teste Z ZCAL 2 2 2 1 1 1 2 1 ˆ 1 ˆ ˆ 1 ˆ ˆ ˆ n p p n p p p p ZCAL Sendo 1ˆp a proporção calculada na amostra 1 2ˆp a proporção calculada na amostra 2 n1 o tamanho da amostra 1 n2 o tamanho da amostra 2 Exemplo 10 Numa pesquisa de opinião pública realizada em uma rede social sobre a utilização dos atuais browsers foram entrevistadas 2660 pessoas que responderam a seguinte pergunta Você acha que os atuais navegadores para internet atendem satisfatoriamente as necessidades do usuário para uma navegação segura Diante do fato de que 1250 dos entrevistados eram do sexo masculino dos quais 670 responderam SIM e que 1410 eram do sexo feminino dos quais 770 também responderam afirmativamente com 99 de certeza o que se poderia concluir sobre as opiniões de homens e mulheres sobre a segurança dos navegadores Solução 1 Determinar as hipóteses H0 p1 p2 H1 p1 p2 Obs H1 foi determinada com o sinal de diferente pois o objetivo é verificar se a proporção de homens e mulheres que responderam SIM pode ser considerada a mesma sendo assim rejeitaremos H0 apenas se essa proporção for considerada diferente tanto para mais como para menos 2 Usando a teoria estatística determinar qual teste será utilizado O teste indicado para esta situação é o Teste Z que estamos estudando ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 26 3 Determinar o nível de significância do teste Esta informação já foi apresentada no enunciado 001 4 Calcular a estatística do teste Medidas obtidas na amostra 1ˆp 6701250 0536 2ˆp 7701410 054609 52169 0 1410 0 54609 54609 1 0 1250 0 536 536 1 0 0 54609 0 536 ZCAL 5 Determinar as regiões de rejeição e não rejeição para H0 utilizando os percentis da distribuição do teste escolhido Como estamos usando o Teste Z usaremos a distribuição Normal Padrão para determinar a região de rejeição Na hipótese alternativa foi utilizado o sinal de diferente sendo assim teremos um teste bilateral e a região de rejeição 1 será dividida em duas partes Observando a tabela da distribuição Normal padrão tabela 3 dos anexos o percentil 995 que indica 995 da área da curva abaixo desse valor e 05 da área está acima desse valor vale 258 Esse valor foi encontrado na linha 25 e coluna 8 da tabela da Normal Padrão pois nessa intersecção encontrase um valor de área correspondente a 0495060 área hachurada da imagem na tabela Como a distribuição Normal Padrão é simétrica o outro limite da região de rejeição será o mesmo valor porém com o sinal negativo Ver figura 14 6 Verificar se o valor calculado da estatística do teste está dentro ou não da região de rejeição Como ZCAL 052169 ZTABELADO 258 então a estatística do teste se encontra em uma região que deve aceitar H0 Ver figura 14 Figura 14 Apresentação gráfica do Teste Z para duas proporções 7 Concluir No item 6 verificamos que não devemos rejeitar a hipótese nula isso significa que a proporção da amostra 1 pode ser considerada igual a proporção da amostra 2 ou seja com 99 de confiança podemos afirmar que a proporção de homens e mulheres que acham os navegadores seguros são estatisticamente iguais Portanto o sexo não tem influência sobre essa opinião da população em estudo ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 27 ANEXOS Tabela 1Tabela da Distribuição QuiQuadrado ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 28 Tabela 2 Tabela da Distribuição F 5 ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 29 Tabela 3 Tabela Distribuição Normal Reduzida ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 30 Tabela 4 Tabela Distribuição t de Student
Envie sua pergunta para a IA e receba a resposta na hora
Recomendado para você
1
Análise Estatística de Amostras Independentes com Python
Estatística 2
UMG
5
Questionário de Estatística e Probabilidade II - Unidade 4
Estatística 2
UMG
4
Lista de Exercícios Resolvidos de Estatística
Estatística 2
UMG
1
Coleta e Análise de Tweets sobre Assédio: Script R para Busca e Visualização de Dados
Estatística 2
UMG
1
Teste t para Comparacao de Medias com Variancias Iguais - Analise de Dados Venusioxlsx
Estatística 2
UMG
6
Questionário Unidade 3 - Estatística e Probabilidade II
Estatística 2
UMG
1
Discussão sobre Personalidades e Mídia Digital
Estatística 2
UMG
1
Analise de Vendas Venusioxlsx: Teste T e Comparacao de Medias
Estatística 2
UMG
5
Atividade 7: Questionário Unidade 4 - Estatística e Probabilidade II
Estatística 2
UMG
6
Questionário da Unidade 3 - Estatística e Probabilidade II
Estatística 2
UMG
Texto de pré-visualização
PROF DEYSE GEBERT DEMAT UNIVERSIDADE ESTADUAL DE PONTA GROSSA ESTATÍSTICA E PROBABILIDADE II UNIDADE 4 INFERÊNCIA TESTES DE HIPÓTESES ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 1 INFERÊNCIA ESTATÍSTICA O objetivo da Inferência Estatística é conhecer uma população por meio de informações coletadas em amostras ou seja é possível a partir de dados amostrais fazer afirmações sobre a população da qual foi retirada essa amostra Geralmente as populações são caracterizadas por medidas numéricas descritivas denominadas parâmetros Esses parâmetros podem ser estimados em amostras e a partir deles se fazer inferência sobre os parâmetros populacionais desconhecidos Existe uma notação específica para diferenciar quando um parâmetro é estimado a partir de uma amostra ou de uma população A tabela 1 abaixo apresenta os símbolos referentes aos parâmetros amostrais e populacionais Tabela 1 Notação de parâmetros amostrais e populacionais Símbolo amostral Símbolo populacional Média X Variância S2 2 Desvio padrão S Proporção pˆ p Os métodos para realizar inferências a respeito dos parâmetros como média desvio padrão proporção pertencem a duas categorias Testes de hipóteses Estimação por ponto e intervalos de confiança 1 TESTES DE HIPÓTESES Agora aprenderemos outro método para fazer inferência sobre parâmetros populacionais Em vez de calcular uma estimativa do parâmetro pontualmente ou em intervalo conforme visto na unidade anterior iremos admitir um valor hipotético para um parâmetro populacional e com base nas informações da amostra realizaremos um teste estatístico para aceitar ou rejeitar o valor hipotético Um teste de hipóteses nada mais é que uma regra de decisão para aceitar ou rejeitar uma hipótese estatística com base nos elementos amostrais A formulação das hipóteses é o ponto inicial do problema e deve depender única e exclusivamente das conclusões que se pretende obter com o teste Hipótese estatística é uma suposição quanto ao valor de um parâmetro populacional ou quanto à natureza da distribuição de probabilidade de uma variável populacional Existem dois tipos de hipóteses hipótese nula e hipótese alternativa Hipótese nula H0 esta hipótese leva esse nome pois sempre expressará uma igualdade É a hipótese a ser testada Exemplo H0 10 ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 2 Hipótese alternativa H1 sempre que rejeitarmos a hipótese nula devemos considerar a hipótese alternativa sendo assim essa nunca expressará uma igualdade A formulação da hipótese alternativa definirá o tipo de teste unilateral ou bilateral Se a formulação de H1 indicar que o parâmetro é maior ou menor do que o valor de teste valor considerado verdadeiro até que se prove o contrário o teste será unilateral ou seja somente há interesse se as diferenças entre os dados da amostra e o valor de teste forem em uma determinada direção Se a formulação da hipótese alternativa indicar que o parâmetro é diferente do valor de comparação o teste será Bilateral ou seja há interesse nas diferenças em qualquer direção Exemplo suponha que estamos formulando hipóteses para comparar o desempenho de um processador com determinado valor de referência sendo assim temos as seguintes hipóteses possíveis 1 H0 média processador valor de referência sempre expressará igualdade 2 H1 média processador valor de referência ou 3 H1 média processador valor de referência ou 4 H1 média processador valor de referência Sempre que usarmos o sinal em H1 temse um teste bilateral pois estaremos rejeitando a igualdade para diferenças muito grandes tanto positivas quanto negativas Ver Figura 1 Figura 1 Regiões de rejeição para H0 em um teste bilateral Sempre que usarmos o sinal em H1 temse um teste unilateral à direita pois estaremos rejeitando apenas diferenças muito grandes positivas Ver Figura 2 Figura 2 Região de rejeição para H0 em um teste unilateral à direita Sempre que usarmos o sinal em H1 temse um teste unilateral à esquerda pois estaremos rejeitando apenas diferenças muito grandes negativas Ver Figura 3 ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 3 Figura 3 Região de rejeição para H0 em um teste unilateral à esquerda 11 Erros de Julgamento Há dois possíveis tipos de erros quando realizamos um teste estatístico para aceitar ou rejeitar H0 Podemos rejeitar a hipótese H0 quando ela é verdadeira ou aceitar H0 quando ela é falsa O erro de rejeitar H0 sendo ela verdadeira é denominado Erro Tipo I e a probabilidade de se cometer o Erro Tipo I é designada α Por outro lado o erro de aceitar H0 sendo ela falsa é denominado Erro Tipo II e a probabilidade de cometêlo é designada β Num teste de hipótese a probabilidade máxima com que se arrisca um erro do tipo I é chamada nível de significância do teste α Geralmente adotase um nível de significância de 005 5 ou 001 1 O complementar do nível de significância é chamado de nível de confiança pois ele indica a confiabilidade do resultado obtido é a probabilidade de que a decisão tomada esteja correta A tabela 2 apresenta um resumo dos tipos de erros que se pode cometer em um teste de hipóteses Tabela 2 Tipos de erros envolvidos em um teste de hipóteses Realidade H0 verdadeira H0 falsa Decisão tomada Não rejeitar H0 Decisão correta Nível de confiança 1α Erro Tipo II β Rejeitar H0 Erro tipo I α Decisão correta Poder do teste 1β 12 Regra de Decisão Ao final da realização de um teste de hipótese é necessário tomar uma decisão rejeitar ou não a hipótese que está sendo colocada a prova H0 Para isso devemos verificar a localização da estatística do teste se está ou não na região que rejeita H0 A figura 4 apresenta algumas das possíveis localizações da estatística de um teste ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 4 Figura 4 Algumas situações apresentando as possíveis localizações da estatística do teste 13 Mecanismo Para Aplicação de Um Teste De Hipóteses 1 Determinar as hipóteses 2 Usando a teoria estatística determinar qual teste será utilizado 3 Determinar o nível de significância do teste 4 Calcular a estatística do teste 5 Determinar as regiões de rejeição e não rejeição para H0 utilizando os percentis da distribuição do teste escolhido 6 Verificar se o valor calculado da estatística do teste está dentro ou não da região de rejeição 7 Concluir ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 5 2 TESTE DE HIPÓTESES PARA UMA VARIÂNCIA Nos casos em que há o interesse de testar a hipótese de que o parâmetro variância populacional ² de uma determinada variável seja maior menor ou diferente de um certo valor utilizase o Teste ² que é baseado na distribuição ² Hipóteses H0 2 valor H1 2 valor Teste unilateral à direita ou H1 2 valor Teste unilateral à esquerda ou H1 2 valor Teste bilateral Estatística do teste QuiQuarado ² 2 0 2 ² 1 S n CAL com grau de liberdade GL n1 Sendo n tamanho da amostra S² variância calculada na amostra 2 0 o valor de referência para a comparação valor determinado para H0 Exemplo 1 Os dados abaixo se referem ao comprimento mm de um componente de computador fabricado pela empresa JC Uma montadora de computadores só aceita comprar esse componente se ele tiver média de comprimento igual a 8018 mm e desvio padrão de 6 mm Tendo em vista estas condições a montadora retirou uma amostra de um lote de componentes da empresa JC que está apresentada abaixo Verifique com um nível de significância de 5 se a variabilidade encontrada na amostra não difere da especificação exigida pela montadora 8010 8095 8062 8144 7990 8006 8002 7991 8120 7902 Solução 1 Determinar as hipóteses H0 ² 6² H1 ² 6² Obs H1 foi determinada com o sinal de maior porque se a variabilidade da amostra for menor ou igual a 6² isso seria considerado dentro do padrão estipulado pelo comprador pois quanto menor for uma variância menor será a variação do comprimento dos componentes Sendo assim só se rejeitará H0 caso a amostra tenha variância maior que 6² 2 Usando a teoria estatística determinar qual teste será utilizado O teste indicada para esta situação é o Teste QuiQuadrado que estamos estudando 3 Determinar o nível de significância do teste ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 6 Esta informação já foi fornecida no enunciado na prática o pesquisador quem escolhe esse valor que geralmente será 5 ou 1 dependendo da necessidade de precisão do teste 4 Calcular a estatística do teste Medidas calculadas na amostra 5284 1 1 2 2 n X x S n i i 1321 36 5284 1 10 ² 1 2 0 2 S n CAL 5 Determinar as regiões de rejeição e não rejeição para H0 utilizando os percentis da distribuição do teste escolhido Como estamos usando o Teste QuiQuadrado usaremos a distribuição QuiQuadrado para determinar a região de rejeição Na hipótese alternativa foi utilizado o sinal de maior sendo assim a região de rejeição α 5 será somente para o lado direito ou seja precisamos determinar o percentil 95 pois ele indica que 95 da área da curva está abaixo dele e que 5 está acima dele Utilizando a tabela 1 dos anexos que apresenta a distribuição QuiQuadrado o valor para o limite da região de rejeição se encontra na coluna de 5 e na linha de 9 graus de liberdade sendo 16919 6 Verificar se o valor calculado da estatística do teste está dentro ou não da região de rejeição Como 2 CAL 1321 2 TABELADO 16919 então a estatística do teste se encontra em uma região que deve aceitar H0 Ver figura 5 Figura 5 Representação gráfica do teste QuiQuadrado 7 Concluir No item 6 verificamos que devemos aceitar a hipótese nula isso significa que a variância da amostra pode ser considerada igual a 36 De uma maneira mais formal com 95 de confiança podese afirmar que a variabilidade do comprimento dos componentes pode ser considerada igual a 36 ou seja a montadora de computadores pode comprar os componentes da empresa JC pois eles estão dentro das especificações exigidas ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 7 3 TESTE DE HIPÓTESES PARA COMPARAÇÃO DE DUAS VARIÂNCIAS Para se testar a igualdade de duas variâncias provenientes de duas amostras independentes obtidas de populações normais utilizase o Teste F que é baseado na distribuição F Hipóteses H0 12 2 2 H1 12 2 2 Teste unilateral à direita ou H1 12 2 2 Teste unilateral à esquerda ou H1 12 2 2 Teste bilateral Estatística do teste F FCAL 2 2 12 S FCAL S com graus de liberdade GL1 n1 1 e GL2 n2 1 Sendo 2 1S a variância calculada na amostra 1 2 2 S a variância calculada na amostra 2 n1 tamanho da amostra 1 n2 tamanho da amostra 2 O Teste F possui uma peculiaridade por ser uma razão entre dois valores É sabido que se um valor alto é dividido por um valor menor quanto mais distantes forem esses valores maior será o resultado dessa divisão Então quando decidimos colocar a maior variância no numerador da divisão e a menor variância no denominador saberemos que quanto mais diferentes elas forem maior será o valor de FCAL Sendo assim somente poderemos rejeitar a igualdade entre as duas variâncias com uma região de rejeição do lado direito Caso contrário utilizando a menor variância no numerador e a maior no denominador a região de rejeição deverá estar no lado direito Exemplo 2 Uma empresa montadora de computadores deseja comparar a variabilidade do comprimento mm de um determinado componente fornecido por duas empresas diferentes Com os dados abaixo e tendo em vista a normalidade qual a conclusão que se pode chegar ao nível α 005 Fornecedor 1 Empresa JC 801 8095 8062 8144 799 8006 8002 7991 812 7902 Fornecedor 2 Empresa WF 8108 8065 7986 8015 8080 7943 8064 7990 8052 8035 ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 8 Solução 1 Determinar as hipóteses H0 12 2 2 H1 12 2 2 Obs H1 foi determinada com o sinal de maior sendo assim a maior variância deve ser colocada no numerador da estatística do teste Caso o pesquisador utilize o sinal de menor então a menor variância deveria ser colocada no numerador da divisão 2 Usando a teoria estatística determinar qual teste será utilizado O teste indicado para esta situação é o Teste F que estamos estudando 3 Determinar o nível de significância do teste Esta informação já foi fornecida no enunciado do problema na prática o pesquisador quem escolhe esse valor que geralmente será 5 ou 1 dependendo da necessidade de precisão do teste 4 Calcular a estatística do teste Variância calculada na amostra da empresa JC 528462 1 1 2 12 n X x S n i i Variância calculada na amostra da empresa WF 251773 1 1 2 2 2 n X x S n i i 2 0989 1773 25 528462 FCALC 5 Determinar as regiões de rejeição e não rejeição para H0 utilizando os percentis da distribuição do teste escolhido Como estamos usando o Teste F usaremos a distribuição F para determinar a região de rejeição Na hipótese alternativa foi utilizado o sinal de maior sendo assim a região de rejeição α 5 será somente para o lado direito ou seja precisamos determinar o percentil 95 pois ele indica que 95 da área da curva está abaixo dele e que 5 está acima dele Utilizando a tabela 2 dos anexos que apresenta valores da distribuição F encontraremos o limite da região de rejeição na coluna de 9 graus para numerador e na linha de 9 graus de liberdade do denominador sendo 318 6 Verificar se o valor calculado da estatística do teste está dentro ou não da região de rejeição Como FCAL 20989 FTABELADO 318 então a estatística do teste se encontra em uma região que deve aceitar H0 pois não ultrapassou o limite da região de rejeição Ver figura 6 ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 9 Figura 6 Representação gráfica do teste F 7 Concluir No item 6 verificamos que devemos aceitar a hipótese nula isso significa que a variância da amostra 1 pode ser considerada igual a variância da amostra 2 O seja a variabilidade do comprimento dos componentes da empresa JC pode ser considerado igual a variabilidade do comprimentos dos componentes da empresa WF com 95 de confiança 4 TESTE DE HIPÓTESES PARA UMA MÉDIA Nos casos em que há o interesse de testar a hipótese de que o parâmetro média populacional de uma determinada variável seja maior menor ou diferente de um certo valor utilizase o Teste t que é baseado na distribuição t de Student ou o Teste Z que é baseado na distribuição Normal Hipóteses H0 valor H1 valor Teste unilateral à direita ou H1 valor Teste unilateral à esquerda ou H1 valor Teste bilateral Quando o pesquisador necessita comparar uma média a um determinado valor existem três situações possíveis que serão descritas a seguir 41 Quando a Variância Populacional 2 da Variável é Conhecida Existem situações em que a variabilidade da variável em estudo é conhecida um exemplo disso são máquinas que já possuem em sua especificação qual a variabilidade de sua produção Quando essa variância é conhecida devese utilizar o Teste Z para a comparação da média com algum valor de referência ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 10 Estatística do teste Z ZCAL n X ZCAL 0 Sendo X a média calculada na amostra 0 o valor com o qual se quer comparar definido em H0 o desvio padrão que já é conhecido e não foi calculado na amostra n tamanho da amostra Exemplo 3 Desejase estudar o tempo de resposta num sistema de rede local Estudos anteriores afirmam que o tempo de resposta ideal para uma consulta no sistema é de 12 milissegundos ms com desviopadrão de 1 milissegundo Foram monitorados 5 clientes da rede aleatoriamente escolhidos obtendose os seguintes tempos médios em ms de resposta para uma consulta no sistema 129 136 146 139 143 Perguntase o sistema continua trabalhando dentro do esperado Use alfa de 5 Solução 1 Determinar as hipóteses H0 12 e H1 12 Obs H1 foi determinada com o sinal de diferente pois o objetivo é verificar se o sistema trabalha dentro do esperado ou seja rejeitaremos H0 se o sistema gastar mais que 12 ms numa consulta e também se gastar menos que 12 ms 2 Usando a teoria estatística determinar qual teste será utilizado O teste indicado para esta situação é o Teste Z que estamos estudando 3 Determinar o nível de significância do teste Esta informação já foi fornecida no enunciado na prática o pesquisador quem escolhe esse valor que geralmente será 5 ou 1 dependendo da necessidade de precisão do teste 4 Calcular a estatística do teste Dados calculados na amostra X 1386 1591 4 5 1 12 1386 ZCAL 5 Determinar as regiões de rejeição e não rejeição para H0 utilizando os percentis da distribuição do teste escolhido Como estamos usando o Teste Z usaremos a distribuição Normal padrão para determinar a região de rejeição Na hipótese alternativa foi utilizado o sinal de diferente sendo assim teremos um teste bilateral no qual a região de rejeição α 5 será dividia em duas partes Ver figura 7 ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 11 Observando a tabela da distribuição Normal padrão tabela 3 dos anexos o percentil 975 que indica que 975 da área da curva está abaixo dele e 25 da área está acima desse valor vale 196 Esse valor foi encontrado na linha 19 e coluna 6 da tabela da Normal padrão pois nessa intersecção encontrase um valor de área correspondente a 0475002 área hachurada da imagem na tabela Como a distribuição Normal reduzida é simétrica o outro limite da região de rejeição possui o mesmo valor porém com o sinal negativo Ver figura 7 6 Verificar se o valor calculado da estatística do teste está dentro ou não da região de rejeição Como ZCAL 41591 ZTABELADO 196 então a estatística do teste se encontra em uma região que deve rejeitar H0 Ver figura 7 Figura 7 Apresentação gráfica do Teste Z 7 Concluir No item 6 verificamos que devemos rejeitar a hipótese nula isso significa que a média da amostra não pode ser considerada igual a 12 ou seja com 95 de confiança podemos afirmar que a média da amostra 1386 ms não pode ser considerada igual a 12 ms Logo o tempo de resposta do sistema é maior do que o ideal 42 Quando a Variância Populacional 2 da Variável Não é Conhecida e a Amostra é Pequena Quando a variância não é conhecida precisamos estimála na amostra Utilizando uma estimativa amostral da variância não é mais possível testarmos a média com o Teste Z da distribuição normal padrão Nestes casos o mais adequado é utilizarmos o Teste t de Student baseado na distribuição t de Student Tratase de uma distribuição de probabilidades que possui média zero como a distribuição normal padrão mas sua variância é igual a 2 sendo o grau de liberdade determinado por n1 Estatística do Teste t tCAL n S X tCAL 0 Sendo X a média calculada na amostra 0 o valor com o qual se quer comparar definido em H0 S o desvio padrão calculado na amostra n tamanho da amostra ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 12 Exemplo 4 Desejase estudar a influência do tempo de resposta num sistema de rede local Estudos anteriores afirmam que o tempo de resposta ideal para uma consulta no sistema é de 12 milissegundos ms Foram monitorados 5 clientes da rede aleatoriamente escolhidos obtendose os seguintes tempos médios em ms de resposta para uma consulta no sistema 129 136 146 139 143 O sistema continua trabalhando dentro do esperado Use alfa de 5 Solução 1 Determinar as hipóteses H0 12 H1 12 Obs H1 foi determinada com o sinal de diferente pois o objetivo é verificar se o sistema trabalha dentro do esperado ou seja rejeitaremos H0 se o sistema gastar mais que 12 ms numa consulta e também se gastar menos que 12 ms 2 Usando a teoria estatística determinar qual teste será utilizado O teste indicado para esta situação é o Teste t de Student que estamos estudando 3 Determinar o nível de significância do teste Esta informação já foi fornecida no enunciado 5 4 Calcular a estatística do teste Medidas obtidas na amostra S 0658 X 1386 3208 6 5 658 0 1386 12 tCAL 5 Determinar as regiões de rejeição e não rejeição para H0 utilizando os percentis da distribuição do teste escolhido Como estamos usando o Teste t de Student usaremos a distribuição t para determinar a região de rejeição Na hipótese alternativa foi utilizado o sinal de diferente sendo assim teremos um teste bilateral no qual a região de rejeição α 5 será dividia em duas partes Observando a tabela da distribuição t de Student tabela 4 dos anexos o percentil 975 que indica 975 da área da curva abaixo desse valor e 25 da área está acima desse valor vale 27764 Esse valor foi encontrado na linha 4 que corresponde aos graus de liberdade n1 e coluna t0975 que corresponde a área do percentil 975 área hachurada da imagem da tabela Como a distribuição t de Student é simétrica o outro limite da região de rejeição possui o mesmo valor porém com o sinal negativo Ver figura 8 6 Verificar se o valor calculado da estatística do teste está dentro ou não da região de rejeição Como tCAL 63208 tTABELADO 27764 então a estatística do teste se encontra em uma região que deve rejeitar H0 Ver figura 8 ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 13 Figura 8 Representação gráfica do Teste t de Student 7 Concluir No item 6 verificamos que devemos rejeitar a hipótese nula isso significa que a média da amostra não pode ser considerada igual a 12 ou seja com 95 de confiança podemos afirmar que a média da amostra 1386 ms não pode ser considerada igual a 12 ms Logo o tempo de resposta do sistema é maior do que o ideal 43 Quando a Variância Populacional 2 da Variável Não é Conhecida Mas a Amostra é Grande Já sabemos que quando a variância não é conhecida e precisamos estimála na amostra para testarmos a média devemos utilizar a distribuição t de Student que possui média zero como a distribuição normal padrão e variância igual a 2 sendo o grau de liberdade determinado por n1 Com isso verificamos que a variância da distribuição t de Student depende do tamanho da amostra quanto maior a amostra mais o quociente 2 aproximase de 1 a variância da distribuição normal padrão e mais a distribuição t de Student aproximase da distribuição normal padrão Por essa razão quando estamos trabalhando com amostras grandes é possível utilizar o Teste Z visto no item 41 mesmo substituindo o desvio padrão populacional pelo desvio padrão calculado na amostra S Em geral uma amostra é considerada grande quando possui 30 ou mais observações Exemplo 5 Um certo tipo de fio metálico usado na indústria eletrônica deve por padronização ser percorrido por uma corrente elétrica de intensidade i em 500 milissegundos Um engenheiro gerente de produção de uma indústria de componentes eletrônicos garante que isso acontece com os fios produzidos por sua empresa Mesmo assim um comprador desconfiado solicita uma amostra aleatória de 45 fios e os submete a teste A partir dos dados amostrais verificouse que a média do tempo de percurso foi de 490 milissegundos com um desviopadrão de 142 Sendo assim o que se pode concluir ao nível de 95 de certeza sobre a afirmação do engenheiro Suponha normalidade dos dados Solução 1 Determinar as hipóteses H0 500 H1 500 Obs H1 foi determinada com o sinal de diferente pois o objetivo é verificar se a corrente elétrica percorre o fio metálico em 500 ms ou seja rejeitaremos H0 se o tempo gasto for maior ou menor que 500 ms ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 14 2 Usando a teoria estatística determinar qual teste será utilizado O teste indicado para esta situação é o Teste Z que estamos estudando 3 Determinar o nível de significância do teste Esta informação já foi fornecida no enunciado 005 4 Calcular a estatística do teste Medidas obtidas na amostra n 45 S 142 X 490 7241 4 45 2 14 500 490 ZCAL 5 Determinar as regiões de rejeição e não rejeição para H0 utilizando os percentis da distribuição do teste escolhido Como estamos usando o Teste Z usaremos a distribuição Normal reduzida para determinar a região de rejeição Na hipótese alternativa foi utilizado o sinal de diferente sendo assim teremos um teste bilateral no qual a região de rejeição α 5 será dividia em duas partes Observando a tabela da distribuição Normal padrão tabela 3 dos anexos o percentil 975 que indica 975 da área da curva abaixo desse valor e 25 da área está acima desse valor vale 196 Esse valor foi encontrado na linha 19 e coluna 6 da tabela da Normal padrão pois nessa intersecção encontrase um valor de área correspondente a 0475002 área hachurada da imagem na tabela Como a distribuição Normal reduzida é simétrica o outro limite da região de rejeição possui o mesmo valor porém com o sinal negativo Ver figura 9 6 Verificar se o valor calculado da estatística do teste está dentro ou não da região de rejeição Como ZCAL 47241 ZTABELADO 196 então a estatística do teste se encontra em uma região que deve rejeitar H0 Ver figura 9 Figura 9 Representação gráfica do Teste Z 7 Concluir No item 6 verificamos que devemos rejeitar a hipótese nula isso significa que a média da amostra não pode ser considerada igual a 500 ou seja com 95 de confiança podemos afirmar que a média da amostra 490 ms não pode ser considerada igual a 500 ms Logo o tempo gasto para percorrer o fio metálico é menor que o afirmado pelo engenheiro ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 15 5 TESTES DE HIPÓTESES PARA DUAS MÉDIAS Neste caso o que interessa é testar a hipótese da igualdade entre duas médias populacionais 1 e 2 o que é o mesmo que testar se a diferença entre elas é igual a zero Hipóteses H0 1 2 ou 1 2 0 H1 1 2 ou 1 2 0 Teste unilateral à direita ou H1 1 2 ou 1 2 0 Teste unilateral à esquerda ou H1 1 2 ou 1 2 0 Teste bilateral Existem três situações possíveis para a comparação entre médias de duas amostras e estas serão descritas a seguir 51 Quando as Variâncias Populacionais 2 da Variável São Conhecidas Nesses casos as variâncias populacionais serão valores conhecidos e não serão estimados a partir da amostra coletada O teste mais indicado em situações como esta é o Teste Z Vale lembrar que este teste possui o mesmo nome do Teste Z que é aplicado quando se quer comparar uma média a um valor de referência estes possuem o mesmo nome pois ambos utilizam a distribuição Normal Padrão No entanto quando esse teste é aplicado para comparação entre médias de duas amostras diferentes e independentes são necessárias algumas alterações na estatística do teste que estão apresentadas a seguir Estatística do teste Z ZCAL 2 2 2 1 2 1 2 1 n n X X ZCAL Sendo 1 X a média calculada na amostra 1 2 X a média calculada na amostra 2 12 a variância da população 1 2 2 a variância da população 2 n1 tamanho da amostra 1 n2 tamanho da amostra 2 Exemplo 6 Duas marcas de monitores para computador A e B foram submetidas a um teste de durabilidade Em estudos anteriores as duas marcas verificaram que o desvio padrão da ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 16 durabilidade é de 250 dias e 300 dias respectivamente Com os dados abaixo testar ao nível de 5 de significância se o monitor A tem durabilidade superior ao monitor B Durabilidade dias Monitor A Monitor B 3412 2999 2360 3011 3246 2908 3090 3203 3183 3510 2658 3072 3014 3092 3297 3618 3531 3408 3225 2755 3534 3216 2754 3242 2738 3351 2999 2715 3071 3127 2788 2994 3546 3348 2634 2504 3488 3275 3232 3507 3395 2440 3392 3167 3414 3245 3505 3111 3429 3243 3520 3188 3254 2888 3322 2471 3683 3223 3158 3288 2907 3267 3382 3410 2969 3029 Solução 1 Determinar as hipóteses H0 A B ou A B 0 H1 A B ou A B 0 Obs H1 foi determinada com o sinal de maior pois o objetivo é verificar se a durabilidade média do monitor A é maior que a do monitor B ou seja rejeitaremos H0 apenas se a média de A for estatisticamente maior que a média de B isso é o mesmo que dizer que a diferença entre as médias é maior que zero 2 Usando a teoria estatística determinar qual teste será utilizado O teste indicado para esta situação é o Teste Z que estamos estudando 3 Determinar o nível de significância do teste Esta informação já foi fornecida no enunciado devemos utilizar 5 4 Calcular a estatística do teste Medidas obtidas na amostra X A 32283529 X B 30684687 nA 34 e nB 32 ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 17 3445 2 32 300 34 250 30684687 3529 3228 2 2 ZCAL 5 Determinar as regiões de rejeição e não rejeição para H0 utilizando os percentis da distribuição do teste escolhido Como estamos usando o Teste Z usaremos a distribuição Normal Padrão para determinar a região de rejeição Na hipótese alternativa foi utilizado o sinal de maior sendo assim teremos um teste unilateral à direita Observando a tabela da distribuição Normal reduzida tabela 3 dos anexos o percentil 95 que indica 95 da área da curva abaixo desse valor e 5 da área está acima desse valor vale 164 Esse valor foi encontrado na linha 16 e coluna 4 da tabela da Normal reduzida pois nessa intersecção encontrase um valor de área correspondente a 0449497 que é a área hachurada da imagem na tabela que indica o percentil 95 Ver figura 10 6 Verificar se o valor calculado da estatística do teste está dentro ou não da região de rejeição Como ZCAL 23445 ZTABELADO 164 então a estatística do teste se encontra em uma região que deve rejeitar H0 Ver figura 10 Figura 10 Apresentação gráfica do Teste Z para duas médias 7 Concluir No item 6 verificamos que devemos rejeitar a hipótese nula isso significa que a média da amostra A não pode ser considerada igual a média da amostra B ou seja com 95 de confiança podemos afirmar que a durabilidade média dos monitores da marca A é estatisticamente maior que a durabilidade média dos monitores da marca B 52 Quando as Variâncias Populacionais 2 da Variável Não São Conhecidas Nesses casos as variâncias deverão ser estimadas utilizando os dados das duas amostras que estão sendo estudadas Como vimos anteriormente quando as variâncias são estimadas na amostra utilizase a distribuição t de Student para testar a média Para a comparação de duas médias o procedimento do teste é semelhante no entanto há variações na sua aplicação se as variâncias estimadas na amostra forem consideradas iguais ou não Perceba que queremos comparar duas médias no entanto precisamos saber se as variâncias das amostras são iguais ou não para identificarmos qual metodologia de teste deveremos aplicar Pra essa verificação é necessário aplicarmos o Teste F antes de testarmos as médias ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 18 CASO 1 PARA VARIÂNCIAS AMOSTRAIS CONSIDERADAS IGUAIS Este é o caso em que após a aplicação do Teste F verificamos que as variâncias das duas amostras foram consideradas iguais Homocedásticas Estatística do teste t de Student tCAL 2 1 2 1 1 1 n n S X X t C CAL 2 1 1 2 1 2 2 2 2 1 1 n n S n S n SC Sendo 1 X a média calculada na amostra 1 2 X a média calculada na amostra 2 C S o desvio padrão comum 2 1S a variância calculada na amostra 1 2 2 S a variância calculada na amostra 2 n1 tamanho da amostra 1 n2 tamanho da amostra 2 CASO 2 PARA VARIÂNCIAS AMOSTRAIS CONSIDERADAS DIFERENTES Este é o caso em que após a aplicação do Teste F verificamos que as variâncias das duas amostras foram consideradas diferentes heterocedásticas Para aplicação do Teste t de Student nestes casos a maior diferença está no cálculo dos graus de liberdade GL Estatística do teste t de Student tCAL 2 2 2 1 2 1 2 1 n S n S X X tCAL 1 1 2 2 2 2 2 1 2 1 2 1 2 2 2 2 1 2 1 n n S n n S n S n S GL Sendo 1 X a média calculada na amostra 1 2 X a média calculada na amostra 2 2 1S a variância calculada na amostra 1 2 2 S a variância calculada na amostra 2 n1 tamanho da amostra 1 n2 tamanho da amostra 2 GL graus de liberdade ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 19 Exemplo 7 Duas marcas de HD para computador A e B foram submetidas a um teste de durabilidade que foi medida em meses Com os dados abaixo testar ao nível 5 se existe superioridade entre as marcas dos HDs HDA HDB 42 51 36 49 48 65 61 57 53 55 45 54 53 49 71 58 46 63 59 67 56 62 Solução 1 Determinar as hipóteses H0 A B ou A B 0 H1 A B ou A B 0 Obs H1 foi determinada com o sinal de diferente pois o objetivo é verificar se a durabilidade média dos HDs é diferente ou seja rejeitaremos a hipótese de igualdade se a diferença entre as médias for grande o suficiente tanto para diferenças negativas quanto positivas 2 Usando a teoria estatística determinar qual teste será utilizado O teste indicado para esta situação é o Teste t de Student no entanto precisamos saber se as variâncias amostrais podem ser consideradas iguais ou não para escolhermos de qual maneira aplicar o teste de médias Verificar item 3 com as instruções para aplicação do Teste F Hipóteses Teste F H0 2 A 2 B H1 2 A 2 B Medidas obtidas na amostra 2 A S 1041923 2 B S 3275 31814 75 32 1041923 FCALC Limite da região de rejeição para H0 328 na tabela F coluna 12 linha 8 ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 20 Como Fcal 31814 FTABELADO 328 a estatística do teste se encontra na região que aceita H0 logo as duas variâncias amostrais pode ser consideradas estatisticamente iguais com 95 de confiança Após essa conclusão sabemos que estamos em uma situação de acordo com o caso 1 com variâncias amostrais homocedásticas 3 Determinar o nível de significância do teste Esta informação já foi indicada no enunciado 5 4 Calcular a estatística do teste Medidas obtidas na amostra 2 A S 1041923 2 B S 3275 X A 53769 XB 55666 nA 13 e nB 9 8 6957 2 9 13 1 3275 9 1 1041923 13 SC 5031 0 9 1 13 1 6957 8 55666 53769 tCAL 5 Determinar as regiões de rejeição e não rejeição para H0 utilizando os percentis da distribuição do teste escolhido Como estamos usando o Teste t de Student usaremos a distribuição t de Student para determinar a região de rejeição Na hipótese alternativa foi utilizado o sinal de diferente sendo assim teremos um teste bilateral no qual a região de rejeição α 5 será dividia em duas partes Observando a tabela da distribuição t de Student tabela 4 dos anexos o percentil 975 que indica 975 da área da curva abaixo desse valor e 25 da área está acima desse valor vale 2086 Esse valor foi encontrado na linha 20 que corresponde ao grau de liberdade n1n22 e coluna t0975 que corresponde a área do percentil 975 área hachurada da imagem da tabela Como a distribuição t de Student é simétrica o outro limite da região de rejeição possui o mesmo valor porém com o sinal negativo Ver figura 11 6 Verificar se o valor calculado da estatística do teste está dentro ou não da região de rejeição Como tCAL 05031 tTABELADO 2086 então a estatística do teste se encontra em uma região que deve aceitar H0 Ver figura 11 Figura 11 Apresentação gráfica do Teste t de Student para duas médias com variâncias iguais 7 Concluir No item 6 verificamos que devemos aceitar a hipótese nula isso significa que as duas médias podem ser consideradas estatisticamente iguais ou seja com 95 de confiança podemos afirmar que não há superioridade em relação a durabilidade média entre as duas marcas de HD ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 21 Exemplo 8 Duas marcas de HD para computador X e Y foram submetidas a um teste de durabilidade que foi medida em meses Com os dados abaixo testar ao nível 5 se existe superioridade entre as marcas dos HDs HDX HDY 42 61 36 59 28 65 31 57 53 55 35 54 33 49 71 58 36 63 49 67 56 62 Solução 1 Determinar as hipóteses H0 X Y ou X Y 0 H1 X y ou X Y 0 Obs H1 foi determinada com o sinal de diferente pois o objetivo é verificar se a durabilidade média dos HDs é diferente 2 Usando a teoria estatística determinar qual teste será utilizado O teste indicado para esta situação é o Teste t de Student no entanto precisamos saber se as variâncias amostrais podem ser consideradas iguais ou não para escolhermos de qual maneira aplicar o teste de médias Verificar item 3 com as instruções para aplicação do Teste F Hipóteses Teste F H0 2 X 2 Y H1 2 X 2 Y Medidas obtidas na amostra 2 X S 2112435 2 Y S 238611 8 853 8611 23 2112435 FCALC Limite da região de rejeição para H0 328 na tabela da distribuição F coluna 12 linha 8 ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 22 Como Fcal 8853 FTABELADO 328 a estatística do teste se encontra na região que rejeita H0 logo as duas variâncias amostrais pode ser consideradas estatisticamente diferentes com 95 de confiança Após essa conclusão sabemos que estamos em uma situação de acordo com o caso 2 com variâncias amostrais heterocedásticas 3 Determinar o nível de significância do teste Esta informação já foi indicada no enunciado 5 4 Calcular a estatística do teste Medidas obtidas na amostra 2 X S 2112435 2 Y S 238611 X X 460769 XY 578888 nX 13 e nY 9 7169 2 9 8611 23 13 2435 211 578888 460769 tCAL 6118 15 1 9 9 8611 23 13 1 13 2435 211 9 8611 23 13 2435 211 2 2 2 GL 5 Determinar as regiões de rejeição e não rejeição para H0 utilizando os percentis da distribuição do teste escolhido Como estamos usando o Teste t de Student para o caso 2 usaremos a distribuição t de Student para determinar a região de rejeição Na hipótese alternativa foi utilizado o sinal de diferente sendo assim teremos um teste bilateral no qual a região de rejeição α 5 será dividia em duas partes Observando a tabela da distribuição t de Student tabela 4 dos anexos o percentil 975 que indica 975 da área da curva abaixo desse valor e 25 da área está acima desse valor vale 21256 Esse valor foi encontrado na tabela fazendo a média entre os valores da linha 15 e 16 da coluna t0975 Como o GL 156118 e este valor não existe na tabela podese utilizar a média entre os graus de liberdade 15 e 16 A distribuição t de Student é simétrica sendo assim o outro limite da região de rejeição possui o mesmo valor porém com o sinal negativo Ver figura 12 6 Verificar se o valor calculado da estatística do teste está dentro ou não da região de rejeição Como tCAL 27169 tTABELADO 21256 então a estatística do teste se encontra em uma região que deve rejeitar H0 Ver figura 12 Figura 12 Apresentação gráfica do Teste t de Student para duas médias com variâncias diferentes 7 Concluir No item 6 verificamos que devemos rejeitar a hipótese nula isso significa que as duas médias não podem ser consideradas estatisticamente iguais ou seja com 95 de confiança ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 23 podemos afirmar que a durabilidade média do HDY é diferente da HDX Logo a média do HDY é maior que a do HDX 6 TESTE DE HIPÓTESES PARA UMA PROPORÇÃO Nos casos em que há o interesse de testar a hipótese de que o parâmetro proporção populacional p de uma determinada variável binomial seja maior menor ou diferente de um certo valor também utilizamos o Teste Z que é baseado na distribuição Normal Padrão Hipóteses H0 p valor H1 p valor Teste unilateral à direita ou H1 p valor Teste unilateral à esquerda ou H1 p valor Teste bilateral Estatística do teste Z ZCAL n p p p p Z CAL 1 ˆ 0 0 0 n p x ˆ Sendo p0 a valor para a comparação n o tamanho da amostra pˆ a proporção estimada na amostra x o número de ocorrências do evento de interesse na amostra Exemplo 9 Num experimento para testar a eficiência do sistema inteligente KNOW na aquisição de conhecimento sobre determinado assunto elaboraramse 60 questões do tipo certoerrado Tendo em vista que a proporção mínima para que um sistema computacional de aquisição de conhecimento seja considerado eficiente é de 70 o que se pode concluir ao nível de 1 de significância sobre o KNOW uma vez que acertou 40 questões Solução 1 Determinar as hipóteses H0 p 07 H1 p 07 Obs H1 foi determinada com o sinal de menor pois o objetivo é verificar se o sistema é eficiente para tal esse sistema deve acertar 70 das questões ou mais ou seja somente rejeitaremos H0 se o sistema acertar menos que 70 das questões sendo assim considerado não eficiente ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 24 2 Usando a teoria estatística determinar qual teste será utilizado O teste indicado para esta situação é o Teste Z que estamos estudando 3 Determinar o nível de significância do teste Esta informação já foi apresentada no enunciado 001 4 Calcular a estatística do teste Medidas obtidas na amostra p 4060 06666 5634 0 60 70 1 70 70 0 6666 ZCAL 5 Determinar as regiões de rejeição e não rejeição para H0 utilizando os percentis da distribuição do teste escolhido Como estamos usando o Teste Z usaremos a distribuição Normal Padrão para determinar a região de rejeição Na hipótese alternativa foi utilizado o sinal de menor sendo assim teremos um teste unilateral à esquerda Observando a tabela da distribuição Normal padrão tabela 3 dos anexos o percentil 99 que indica 99 da área da curva abaixo desse valor e 1 da área está acima desse valor vale 233 Esse valor foi encontrado na linha 23 e coluna 3 da tabela da Normal Padrão pois nessa intersecção encontrase um valor de área correspondente a 0490097 área hachurada da imagem na tabela Como a distribuição Normal reduzida é simétrica e queremos o limite da região de rejeição para o lado esquerdo devemos apenas acrescentar o sinal negativo Ver figura 13 6 Verificar se o valor calculado da estatística do teste está dentro ou não da região de rejeição Como ZCAL 05634 ZTABELADO 233 então a estatística do teste se encontra em uma região que deve aceitar H0 Ver figura 13 Figura 13 Apresentação gráfica do Teste Z para uma proporção 7 Concluir No item 6 verificamos que não devemos rejeitar a hipótese nula isso significa que a proporção da amostra pode ser considerada igual a 07 ou seja com 99 de confiança podemos afirmar que o sistema inteligente KNOW é eficiente ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 25 7 TESTES DE HIPÓTESES PARA DUAS PROPORÇÕES Nesta situação o interesse é testar a hipótese de que não há diferença entre duas proporções obtidas em amostras de tamanhos n1 e n2 retiradas de duas populações binomiais Para esse caso também se utiliza o Teste Z porém com a caracterização desta situação Hipóteses H0 p1 p2 H1 p1 p2 Teste unilateral à direita ou H1 p1 p2 Teste unilateral à esquerda ou H1 p1 p2 Teste bilateral Estatística do teste Z ZCAL 2 2 2 1 1 1 2 1 ˆ 1 ˆ ˆ 1 ˆ ˆ ˆ n p p n p p p p ZCAL Sendo 1ˆp a proporção calculada na amostra 1 2ˆp a proporção calculada na amostra 2 n1 o tamanho da amostra 1 n2 o tamanho da amostra 2 Exemplo 10 Numa pesquisa de opinião pública realizada em uma rede social sobre a utilização dos atuais browsers foram entrevistadas 2660 pessoas que responderam a seguinte pergunta Você acha que os atuais navegadores para internet atendem satisfatoriamente as necessidades do usuário para uma navegação segura Diante do fato de que 1250 dos entrevistados eram do sexo masculino dos quais 670 responderam SIM e que 1410 eram do sexo feminino dos quais 770 também responderam afirmativamente com 99 de certeza o que se poderia concluir sobre as opiniões de homens e mulheres sobre a segurança dos navegadores Solução 1 Determinar as hipóteses H0 p1 p2 H1 p1 p2 Obs H1 foi determinada com o sinal de diferente pois o objetivo é verificar se a proporção de homens e mulheres que responderam SIM pode ser considerada a mesma sendo assim rejeitaremos H0 apenas se essa proporção for considerada diferente tanto para mais como para menos 2 Usando a teoria estatística determinar qual teste será utilizado O teste indicado para esta situação é o Teste Z que estamos estudando ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 26 3 Determinar o nível de significância do teste Esta informação já foi apresentada no enunciado 001 4 Calcular a estatística do teste Medidas obtidas na amostra 1ˆp 6701250 0536 2ˆp 7701410 054609 52169 0 1410 0 54609 54609 1 0 1250 0 536 536 1 0 0 54609 0 536 ZCAL 5 Determinar as regiões de rejeição e não rejeição para H0 utilizando os percentis da distribuição do teste escolhido Como estamos usando o Teste Z usaremos a distribuição Normal Padrão para determinar a região de rejeição Na hipótese alternativa foi utilizado o sinal de diferente sendo assim teremos um teste bilateral e a região de rejeição 1 será dividida em duas partes Observando a tabela da distribuição Normal padrão tabela 3 dos anexos o percentil 995 que indica 995 da área da curva abaixo desse valor e 05 da área está acima desse valor vale 258 Esse valor foi encontrado na linha 25 e coluna 8 da tabela da Normal Padrão pois nessa intersecção encontrase um valor de área correspondente a 0495060 área hachurada da imagem na tabela Como a distribuição Normal Padrão é simétrica o outro limite da região de rejeição será o mesmo valor porém com o sinal negativo Ver figura 14 6 Verificar se o valor calculado da estatística do teste está dentro ou não da região de rejeição Como ZCAL 052169 ZTABELADO 258 então a estatística do teste se encontra em uma região que deve aceitar H0 Ver figura 14 Figura 14 Apresentação gráfica do Teste Z para duas proporções 7 Concluir No item 6 verificamos que não devemos rejeitar a hipótese nula isso significa que a proporção da amostra 1 pode ser considerada igual a proporção da amostra 2 ou seja com 99 de confiança podemos afirmar que a proporção de homens e mulheres que acham os navegadores seguros são estatisticamente iguais Portanto o sexo não tem influência sobre essa opinião da população em estudo ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 27 ANEXOS Tabela 1Tabela da Distribuição QuiQuadrado ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 28 Tabela 2 Tabela da Distribuição F 5 ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 29 Tabela 3 Tabela Distribuição Normal Reduzida ESTATÍSTICA E PROBABILIDADE II TESTES DE HIPÓTESES PROF DEYSE GEBERT 30 Tabela 4 Tabela Distribuição t de Student