·
Cursos Gerais ·
Estatística Econômica e Introdução à Econometria
Send your question to AI and receive an answer instantly
Recommended for you
25
Intervalos de Confiança: Conceitos e Cálculos
Estatística Econômica e Introdução à Econometria
UMG
22
Análise do Erro Quadrático Médio e Métodos de Estimação
Estatística Econômica e Introdução à Econometria
UMG
7
Amostragem Estratificada: Fundamentos e Cálculos
Estatística Econômica e Introdução à Econometria
UMG
12
Estatísticas e Parâmetros Momentos Amostrais
Estatística Econômica e Introdução à Econometria
UMG
13
Teorema Central do Limite: Fundamentos e Aplicações
Estatística Econômica e Introdução à Econometria
UMG
5
Tabela de Limites Unilaterais da Distribuição F de Fisher-Snedecor aos 10% de Probabilidade
Estatística Econômica e Introdução à Econometria
UMG
8
Intervalos de Confiança para Populações Normais e Outros Modelos Estatísticos
Estatística Econômica e Introdução à Econometria
UMG
9
Amostras e Distribuições Amostrais em Estatística
Estatística Econômica e Introdução à Econometria
UMG
10
Teste de Hipóteses: Análise de Evidências e Cálculos de P-Valor
Estatística Econômica e Introdução à Econometria
UMG
12
Teoria da Informação Estatística: Mensuração e Suficiência das Estatísticas Amostrais
Estatística Econômica e Introdução à Econometria
UMG
Preview text
VII TESTES DE HIPÓTESES Neste capítulo estudaremos os elementos fundamentais da teoria dos testes de hipóteses e da sua aplicação à inferência paramétrica Como veremos existe uma dualidade entre os testes de hipóteses e a construção dos intervalos de confiança estudados no Capítulo VI anterior A rejeição de uma hipótese unilateral lançada sobre um parâmetro para um dado nível de significância 2 estará associada à não inclusão da estatística observada dentro de um intervalo de confiança 1 As aplicações estudadas focalizam exclusivamente as populações normais entendendose que nas condições de aplicação do TCL Teorema Central do Limite estas aplicações aproximam razoavelmente bem os testes correspondentes que poderiam ser construídos para as populações originais não normais Naturalmente os conceitos fundamentais da teoria dos testes e a mecânica de suas aplicações tem ambos um caráter geral que não se restringe à uma população em particular Também focalizaremos aqui apenas a construção de testes clássicos que são sempre conclusivos seja pela rejeição seja pela não rejeição da hipótese testada Hipótese Nula Isto significa que a abordagem sequêncial que contém regiões inconclusivas não será estudada 1 Conceitos Fundamentais O framework da análise é o da inferência paramétrica Temos uma amostra simples X1X2Xn de uma população X com suporte em X fdp fX fda FX ambas dependentes do parâmetro Temos uma estatística TX1X2Xn para cuja distribuição de probabilidade FTt será usada para a construção dos testes Elementos de um Teste de Hipóstese Um teste estatístico é composto dos seguintes ingredientes Hugo Boff Estatística II 2020I 2 a Uma hipótese a ser testada Esta hipóstese chamada hipóstese nula assume o seguinte formato H0 0 onde 0 é um subcojunto préespecificado do espaço paramétrico Como veremos à frente o teste de H0 será construído como um teste de rejeição A evidência amostral permite ou não rejeitar a hipótese H0 Ao ser especificada a região 0 da hipótese nula ficará implícitamente designada a região do que se chama a hipótese alternativa H1 1 onde 1 0 Frisemos que H1 não é a hipótese testada H1 é rejeitada se H0 não for rejeitada H1 é aceita somente se H0 for rejeitada b O Nível de Significância A tomada de decisão sobre o teste contempla apenas duas opções Rejeitar ou Não Rejeitar H0 Ao fazêlo dois tipos de erro podem ser cometidos Erro I Rejeitar H0 sendo H0 verdadeira Erro II Não rejeitar H0 sendo H0 falsa A implementação do teste requer a determinação prévia da probabilidade de se cometer ao menos um destes erros Notemos para estas probabilidades Pêrro I PRejeitar H0 H0 Verdadeira Pêrro II PNão Rejeitar H0 H1 Verdadeira As decisões e as probabilidades segundo H0 é verdadeira V ou falsa F são resumidas na tabela abaixo Hugo Boff Estatística II 2020I 3 H0 Decisão Prob Verdadeira Falsa Rejeita 1 Não Rejeita 1 Em testes nos quais tanto a hipótese nula como a hipótese alternativa são pontuais ambas as probabilidades de erro podem ser calculadas Nos testes mais usuais nos quais as hipóteses especificam intervalos de variação para o parâmetro testado como veremos será a probabilidade de cometer o erro do tipo I que será préfixada A probabilidade será chamada tamanho do teste ou mais comumente nível de significância do teste Tratase na verdade de uma cobertura para a região de rejeição do teste de H0 sendo esta hipótese verdadeira como veremos na sequência c Uma Região Crítica A Região Crítica RC do teste de H0 é por definição a região de rejeição de H0 Ela pode assumir a forma de intervalos abertos à direita do tipo RC T tc ou abertos à esquerda RC T tc ou a forma de uma união de intervalos de ambos os tipos RC T t1 T t2 Para cada um destes formatos da RC o teste correspondente será nomeado unilateral à direita à esquerda ou teste bilateral respectivamente Como mencionamos antes T é uma estatística para a qual será a estatística através da qual o teste é implementado O nível crítico tc será o valor que delimitará a região crítica Este valor será aquele que corresponde ao nível de significância que foi préfixado Ou seja a região de rejeição do teste estará completamente determinada pela escolha feita do tamanho a ser dado ao teste Isto significa que dado a região crítica RC será tal que PRC H0 1 Ou seja o nível de significância é o grau de cobertura dado à região de rejeição de H0 Hugo Boff Estatística II 2020I 4 Frequentemente notaremos RC para a região crítica de tamanho d Uma regra de decisão Sendo uma região de rejeição de H0 a especificação de RC define implícitamente uma regra de decisão para o teste Seja t Tx1x2xn realização amostral da estatística T A regra de decisão especifica Se t RC Rejeitase H0 a probabilidade de erro I será Se t RC Não rejeitase H0 a probabilidade de erro II será No primeiro caso a rejeição de H0 torna H1 uma hipótese plausível muito embora esta não é a hipótese testada Dizemos neste caso que H1 é aceita com a ressalva acima e Conceitos derivados Existem dois conceitos derivados deste quadro teórico os quais são de grande utilidade O primeiro é o conceito de pvalor ou pvalue que estabelece um treshold amostral acima do qual todo teste de tamanho maior que o pvalor leva à rejeição de H0 O segundo é o da Função Poder ou Power Function a qual mede a probabilidade de rejeitar H0 quando ela é falsa Tratase de um indicador importante para avaliar a qualidade do teste implementado uma vez que ele mede a capacidade do teste identificar corretamente a falsidade de H0 ao longo do intervalo de variação do parâmetro e1 PValor Sendo t Tx1x2xn a estatística observada do teste o p valor notado P é a probabilidade que a estatística amostral leve à rejeição de H0 sendo esta hipótese verdadeira P PT t H0 no teste unilateral à direita Hugo Boff Estatística II 2020I 5 P PT t H0 no teste unilateral à esquerda P 2minP P no teste bilateral Quanto menor o pvalor P maior a evidência amostral contra H0 Ou seja menos verossímil é H0 à luz da amostra Um guia qualitativo do grau de evidência amostral contra H0 é proposto por RAFisher 1924 com a seguinte escala de interpretação para a magnitude do pvalor Escala de Fisher P valor 010 005 0025 001 0005 0001 Evidência contra H0 fraca moderada substancial forte muito forte fortíssima e2 Função Poder A função poder do teste de H0 para o parâmetro notada definese como a probabiliade de rejeitar H0 com razão ou seja PRC H1 2 Observe que 1 onde é a probabilidade do erro do tipo II Quanto maior o poder do teste maior a probabilidade de se tomar uma decisão acertada rejeitando H0 Por exemplo considere o teste de H0 0 contra H1 0 Com base na estatistica T para suponha que a região de rejeição de H0 seja do tipo RC T tc A função poder ideal para este teste terá o formato abaixo Hugo Boff Estatística II 2020I 6 Como vemos no gráfico é nula a probabilidade da região de H0 e unitária a probabilidade da região de rejeição sob H1 Esta é uma situação ideal para um teste perfeitamente discriminante Vamos ilustrar os conceitos apresentados até aqui através de um exemplo analítico Exemplo 1 Analítico Papéis de renda variável negociados em bolsa tem retornos anuais com distribuição Normal de média e variância 2 Aqueles que apresentam retorno médio até 0 com risco 0 são considerados de baixo retorno B aqueles cujo retorno médio está acima de 1 com risco 1 são considerados de alto retorno A Naturalmente temos 0 1 e 0 1 Richardson está analizando os retornos anuais de uma letra imobiliária e quer saber se ela pode ser classificada como um papel do tipo A ou um papel do tipo B Ele então seleciona ao acaso n retornos passados deste papel e com base no retorno médio x obtido na amostra ele implementa o seguinte teste pontual H0 0 0 contra H1 1 1 Ou seja ele vai testar a hipótese de que a letra imobiliária é um papel de tipo B A estatística do teste é a média amostral X e a região crítica será do tipo RC X xc Ou seja Richardson implementará um teste unilateral à direita pois se a média amostral for maior que um determinado quantil crítico xc o ativo não poderá ser do tipo B e H0 deverá ser rejeitada 1 Para determinar xc Richardson admitirá um nível de significância que é a probabilidade de ele errar classificando o papel como sendo do tipo A quando na realidade ele é do tipo B Hugo Boff Estatística II 2020I 7 Temos então PRC H0 PX xc H0 ou seja PZ xc 0 0 n Pela tabela da Normal achamos z tal que PZ z de modo que xc 0 0 n z xc 0 0 n z 3 Assim a região de rejeição de H0 será X 0 0 n z como mostrado na figura à seguir Como regra de decisão se x RC x 0 0 n z rejeita H0 Neste caso a probabilidade de errar rejeitando é de 100 Caso contrário se x RC x 0 0 n z H0 não é rejeitada Neste caso a probabilidade de errar aceitando Ho é A probabilidade de cometer o erro II é calculada assim PRCc H1 PX xc H1 PZ xc 1 1 n Substituindo xc obtemos xc 1 1 n 0 0 n z 1 1 n 0z n 1 0 1 de modo que PZ 0z n 1 0 1 4 Hugo Boff Estatística II 2020I 8 2 O pvalor é P PX x H0 PZ x 0 0 n Naturalmente o nível de significância escolhido pode ser maior ou menor que o pvalor P Se ele for menor ou igual P H0 não é rejeitada se ele for maior P H0 é rejeitada 3 A função poder em testes pontuais sempre é uma constante no caso 1 1 4 Suponha que Richardson não tem razões para ser mais avesso à um tipo de erro que ao outro Ao invés de fixar ele deseja realizar um teste equilibrado tal que Qual a região crítica deste teste Vimos acima que PZ xc 0 0 n e PZ xc 1 1 n PZ 1 xc 1 n Logo a região crítica do teste equilibrado será RC X xeonde xe verifica xe 0 0 n 1 xe 1 n xe 1 0 1 0 0 0 1 1 5 Como vemos o quantil crítico do teste equilibrado é uma média ponderada dos retornos médios sob H0 e sob H1 com pesos determinados pelos riscos relativos O quantil do teste equilibrado estará mais próximo de 0 que de 1 Neste caso a probabilidade dos erros será dada por PX xe H0 PX xe H1 Naturalmente se P a hipótese H0 é rejeitada Caso contrário ela não é rejeitada A figura abaixo ilustra as regiões críticas iguaissob H0 e sob H1 do teste equilibrado Hugo Boff Estatística II 2020I 9 5 Suponha finalmente que antes de realizar a amostragem Richardson tenha em mente valores específicos para e que ele quer contemplar Quantos retornos do ativo ele deve então observar Dada a região crítica X xc e o quantil xc dado em 3 temos z xc 1 1 n 1z xc 1 n Usando agora o valor de xc vem 1z 0 0 n z 1 n 0z 1 0 n 0z 1z 1 0 n Ou seja n 0z 1z 1 0 2 6 Como o tamanho amostral deve ser um número inteiro com o semicolchête superior indicamos o arredondamento para cima ou seja tomamos o primeiro inteiro superior ao número 0z 1z 1 0 2 Exemplo 1 Numérico Para ilustrar numericamente o exemplo analítico tomamos os seguintes valores em 1000 reaisano H0 3 2 contra H1 5 5 Hugo Boff Estatística II 2020I 10 Temos também n 9 x 40 1 Para o teste de H0 com nível de significância 005 5 temos pela tabela da Normalpadrão z 165 Então por 3 o quantil crítico é xc 3 2 9 165 41 A região crítica de tamanho 5 será X 41 Como x RC não se rejeita H0 Ou seja a evidência amostral não permite rejeitar H0 Assim há indicações de que o papel analizado é do tipo B A aceitação de H0 está sujeita ao erro tipo II que ocorre se H0 é de fato falsa Calculemos então a probabilidade de ocorrência deste erro usando 4 PZ 2165 9 5 3 5 PZ 054 o que dá usando a tabela da Normalpadrão 0294 Ou seja temos uma elevada probabilidade de errar aceitando H0 2 O pvalor do teste é P PX 40 H0 PZ 4 3 23 PZ 15 0067 Ou seja na escala de Fisher a evidência amostral contra H0 é de fraca a moderada Somente testes com probabilidade de erro maior que 67 poderão levar à rejeição de H0 3 A função poder do teste é constante e igual à 1 ou seja 0706 Esta é a probabilidade de acertar rejeitando H0 4 Para a construção do teste equilibrado usamos 5 e o quantil crítico é dado por xe 5 2 5 3 2 2 5 5 25 7 3571 Devido à diferença na volatilidade dos retornos o retorno crítico é baixo Este é o retorno acima do qual o ativo é classificado como do tipo A retorno Alto com probabilidade de errar com esta classificação igual à probabilidade de errar considerandoo como do tipo B retorno Baixo Hugo Boff Estatística II 2020I 11 Devido ao baixo tamanho da amostra esta probabilidade é elevada PZ 3571 3 2 9 PZ 0856 0291 PZ 3571 5 5 9 PZ 0857 0291 5 Se antes de realizar a amostragem Richardson deseja uma probabilidade de 5 para ambos os tipos de erro qual deverá ser o tamanho da amostra Neste caso 005 de modo que z 165 e z 165 Então usando 6 obtemos n 2165 5165 5 3 2 3335 n 34 Ou seja Richardson deverá considerar 34 retornos passados do papel em análise 2 Testes Compostos em Uma População Normal Vamos estudar agora a construção de testes compostos com hipóteses alternativas múltiplas para a média e para a variância em populações normais Em cada caso as estatísticas que viabilizam a realização destes testes são as mesmas daquelas empregadas na construção dos Intervalos de Confiança estuados no Capítulo VI Os testes compostos sobre um parâmetro admitem as seguintes regras de decisão Unilateral à direita H0 0 contra H1 0 Unilateral à esquerda H0 0 contra H1 0 Bilatera l H0 0 contra H1 0 Como a região crítica RC do teste é uma região de rejeição de H0 ela sempre assumirá o formato da hipótese alternativa Assim no primeiro caso acima teremos RC T tc no segundo caso RC T tc No caso do teste bilateral a região crítica não é um intervalo mas a união de dois intervalos disjuntos RC T t1 T t2 Hugo Boff Estatística II 2020I 12 A Testes para a média Sabemos que a média amostral tem distribuição normal Xn N2n Deste modo Z Xn n N01 7 1 2 conhecida Neste caso de acôrdo com 7 a estatística do teste é a normalpadrão Dada uma cobertura da região crítica de tamanho consideramos o quantil z tal que PZ z para o caso do teste unilateral à direita PZ z para o caso do teste unilateral à esquerda Consideramos o quantil z2 tal que PZ z2 no caso do teste bilateral Segundo a regra de decisão o formato das regiões críticas será Para H0 0 contra H1 0 RC X xc H0 xc 0 n z Para H0 0 contra H1 0 RC X xc H0 xc 0 n z 0 n z Para o teste de H0 0 contra H1 0 teremos RC X x1 H0 X x2 H0 x1 0 n z2 x2 0 n z2 Em cada um destes casos rejeitase H0 com probabilidade de erro 100 se a média amostral observada pertence à região crítica Ou seja se x RC Hugo Boff Estatística II 2020I 13 Lembremos que para o cálculo do p valor em cada um destes casos devemos observar as definições P PX x H0 no teste unilateral à direita P PX x H0 no teste unilateral à esquerda P 2minP P no teste bilateral Aceitação de H0 e Intervalo de Confiança Observe que no teste bilateral H0 0 contra H1 0 de tamanho dizer que H0 não é rejeitada equivale dizer que o valor testado 0 pertence à um à um intervalo de confiança 1 centrado na média amostral x Com efeito se H0 não é rejeitada ao nível de signficância isto significa que x RC Ou seja x x1 0 n z2 e x x2 0 n z2 Logo 0 n z2 x 0 n z2 Ora estes limites para a média da amostra implicam nos seguintes limites para 0 x n z2 0 x n z2 0 IC1 Poder dos testes unilateral e bilateral O poder do teste unilateral à direita de tamanho é d PX xc H1 PZ n xc 0 Esta é a probabilidade de decidir corretamente rejeitando H0 Substituindo xc dado em 3 vem n xc z n 0 de modo que d PZ z n 0 0 1 2 z n 0 e 1 2 z2dz 0 Hugo Boff Estatística II 2020I 14 Vemos assim que é crescente com d0 e lim d 1 O diagrama abaixo para 005 z 165 0 3 4 n 81 descreve o formato típico da função poder do teste unilateral à direita linha contínua em vermelho É fácil checar que a função poder para um teste unilateral à esquerda de tamanho é e PX xc H1 PZ n xc 0 Neste caso n xc n 0 z de modo que e PZ n 0 z 0 1 2 n 0z e 1 2 z2dz 0 No diagrama abaixo o poder deste teste é mostrado na linha contínua em azul 0 1 2 3 4 5 6 00 01 02 03 04 05 06 07 08 09 10 Média Populacional Poder Poder Testes Unilaterais Poder Teste Bilateral No teste bilateral a região crítica de tamanho se decompõe em uma união de duas regiões críticas com cobertura 2 cada uma b PZ z2 n 0 0 PZ n 0 z2 0 Hugo Boff Estatística II 2020I 15 ou seja b 1 2 z2 n 0 e 1 2 z2dz 0 1 2 n 0z2 e 1 2 z2dz 0 O poder do teste bilateral é representado no diagrama acima pelas linhas pontilhadas em vermelho e azul ainda para os valores 005 z2 196 0 3 4 n 81 Como esperado o poder do teste bilateral é sempre menor que o poder dos testes unilaterais pois ele distribui a mesma cobertura sobre uma região maior do que estes Existe uma razão informacional Nos testes unilaterais é dado ao problema do teste mais informação para a rejeição do H0 do que é feito no teste bilateral uma vez que uma das regiões à esquerda ou à direita do valor testado é excluída A supremacia do teste unilateral sobre o teste bilateral mostra que ele deve ser implementado sempre que há informação suficiente para excluir uma das regiões da hipótese alternativa Ou seja o teste bilateral somente é implementado quando não se tem informação suficiente para excluir os valores maiores ou os valores menores que o valor testado Frisemos também que este resultado mostrado aqui no teste da média em população Normal é verdadeiro para o teste de qualquer outro parâmetro de qualquer população 2 2 desconhecida Neste caso como vimos no Capítulo VI 2 deverá ser estimado e a estatística do teste é a vaT Student padrão Sendo Sn1 2 1 n 1 i1 n Xi Xn2 o estimador MVU de 2 vimos em Estatística I que o quociente entre uma va Normalpadrão e a raiz quadrada de uma va quiquadrado dividida pelos seus graus de liberdade ambas independentes uma da outra formam uma va T Student Então Xn Sn1 n Tn 1 8 Deste modo a região crítica no teste unilateral à direita de H0 0 contra H1 0 terá o quantil crítico xc dado por Hugo Boff Estatística II 2020I 16 RC X xc H0 xc 0 s n t onde s é o desviopadrão amostral e t é o percentil da va Studentpadrão com n 1 graus de liberdade Comparandose este quantil crítico com aquele do mesmo teste considerado anteriormente quando 2 é conhecida vemos que este apenas substitui o desviopadrão populacional pelo desviopadrão amostral s e mutatis mutandis a estatística Z normal pela estatística T Student A implementação dos testes segue a mesma lógica descrita para o caso em que 2 conhecida A consequência de se usar o estimador da variância é visível na função poder do teste a qual apresenta valores mais baixos que aqueles obtidos quando 2 é conhecida Para mostrar isto plotamos os valores da função poder para o teste de H0 0 contra H1 0 com os parâmetros n 21 20gl 005 t 1725 s 4 0 3 A linha em vermelho é a função poder do teste quando a variância é desconhecida estatística t A curva em é d 1725 21 4 3 21 2 1 2 20 2 1 20 121 1 20 t2 21 2 dt 3 A curva em azul é a função poder do teste quando a variância é conhecida estatística z d 1 2 165 21 4 3x e 1 2 z2dz 3 Hugo Boff Estatística II 2020I 17 1 2 3 4 5 6 7 8 00 02 04 06 08 10 média pop poder d 1725 21 4 3 21 2 1 2 20 2 1 20 121 1 20 t2 21 2 dt Pelo gráfico vemos que o poder do teste de H0 quando 2 é conhecida domina o poder do teste de H0 quando 2 é estimada para os valores relevantes 0 3 B Testes para a Variância Desde o Capítulo II sabemos que n 1Sn1 2 2 2n 1 9 A distribuição do estimador amostral da variância assim como ela permite a estimação intervalar da variância da população também permite a construção de testes de hipóteses para ela usandose os percentis da va 2n 1 A construção de testes unilaterais ou bilaterais para a variância seguirá a mesma lógica apresentada para os testes da média Por exemplo antes da implantação de um programa de treinamento para os operadores de um processo produtivo na fabricação de lápis de cor a variância do número de falhas detectadas no produto era 0 2 Com base em uma amostra aleatória realizada um ano após a implementação do programa desejase avaliar estatísticamente se o treinamento melhorou a qualidade do produto reduzindo a variância do número de falhas Hugo Boff Estatística II 2020I 18 Neste caso a hipótese adequada a ser testada deverá ser unilateral à esquerda pois supõese que o treinamento não pode piorar a qualidade do produto H0 2 0 2 contra H1 2 0 2 Ou seja se a hipótese nula de que o treinamento não resultou em melhora for rejeitada a hipótese alternativa de que a melhora ocorreu deverá ser aceita Todavia se o programa de treinamento não foi implementado e que após um ano se quer simplesmente saber se houve ou não learning by doing no desempenho dos operadores do processo produtivo com redução ou aumento na variância das falhas o teste bilateral será mais adequado H0 2 0 2 contra H1 2 0 2 Para um teste de tamanho região crítica deste teste será aqui escrita em função do estimador amostral da variância unicamente RC Sn1 2 x1 Sn1 2 x2 10 Usando 9 vamos achar na tabela da 2n 1 os percentis q1 e q2 tais que P2n 1 q1 2 P2n 1 q2 Então como sob H0 n 1Sn1 2 0 2 2n 1 podemos determinar os quantis x1 e x2 em 10 x1 0 2 n 1 q1 e x2 0 2 n 1 q2 e a região de rejeição 10 fica RC Sn1 2 0 2 n 1 q1 Sn1 2 0 2 n 1 q2 10 Exemplo 2 No contexto descrito vamos avaliar se houve ou não alteração na variância do número de falhas fazendo o teste bilateral para a hipótese H0 2 45 que é o nível da variância antes do treinamento Ou seja H0 é a hipótese que o treinamento não alterou a variância do número de falhas Para 005 e uma amostra de n 25 trabalhadores submetidos ao treinamento obtemos na tabela os valores de q1 124 e q2 395 indicados no gráfico abaixo Hugo Boff Estatística II 2020I 19 24gl fq 1 21212 q11eq2 A estimativa amostral da variância foi s2 23 Então de acôrdo com 10 os limites da região crítica serão 0 2 n 1 q1 45 24 1240 235 e 0 2 n 1 q2 45 24 3950 7406 E a região de região de rejeição fica RC Sn1 2 235 Sn1 2 7406 Como s2 23 RC rejeitase H0 Ou seja existe evidência amostral de que a variância da população diminuiu para um nível abaixo do nível inicial 0 2 45 A probabilidade de errar rejeitando H0 é de 5 3 Testes em Duas Populações Normais Independentes Podemos efetuar testes de igualdade ou a proporcionalidade entre médias de duas populações normais independentes assim como podemos também testar a igualdade ou a proporcionalidade entre as variâncias destas duas populações Considere duas populações normais independentes X N11 2 e Y N22 2 Uma amostra de tamanho n1 é tomada da população X X1X2Xn1 da qual se extrai os estimadores MVU de 1e 1 2 X e S1 2 1 n1 1 i1 n1 Xi X2 Analogamente uma amostra de tamanho n2 é tomada da população Y Y1Y2Yn2 da qual se extrai os estimadores MVU de 2 e 2 2 Y e S2 2 1 n2 1 i1 n2 Yi Y2 Hugo Boff Estatística II 2020I 20 A Testes para Comparação das Médias Estamos interessados em realizar testes comparando as médias das duas populações Para k os testes assumem a forma H0 2 k1 0 contra H1 2 k1 0 Quando k 1 estaremos testando a igualdade das médias nas duas populações Escolhemos expor a construção do teste apenas no caso bilateral por uma questão de economia A construção dos testes unilaterais à direita ou à esquerda segue o mesmo método estudado no caso de uma população As estatísticas deste teste estarão baseadas nos seguintes resultados Y kX N2 k1 2 2 n2 k2 1 2 n1 11 Para a variância temos com efeito VY kX VY k2VX 2kCovXY a qual se reduz à VY k2VX pelo fato de que em razão da indepedência entre as populações a covariância entre as médias amostrais é nula O outro resultado diz respeito à distribuição das variâncias amostrais n1 1S1 2 1 2 n2 1S2 2 2 2 2n1 n2 2 12 Este resultado é consequência da normalidade e da independência das populações O número de graus de liberdade n1 n2 2 resulta da soma n1 1 n2 1 onde cada termo são os graus de liberdade da distribuição da variância amostral de cada população Esta é uma propriedade reprodutiva da 2 Como usual a região crítica do teste bilateral para a diferença das médias será RC Y kX x1 Y kX x2 13 1 Variâncias 1 22 2 conhecidas Neste caso a estatística do teste é a va NormalPadrão Z Y kX 2 k1 2 2 n2 k2 1 2 n1 N01 14 Hugo Boff Estatística II 2020I 21 Sob H0 a estatistica se reduz à Y kX 2 2 n2 k2 1 2 n1 Deste modo para um nível de significância a região de rejeição do teste de H0 dada em 13 será RC Y kX 2 2 n2 k2 1 2 n1 z2 Y kX 2 2 n2 k2 1 2 n1 z2 13 Ou seja H0 será rejeitada se a estimativa amostral y kx estiver fora do intervalo com extremidades 2 2 n2 k2 1 2 n1 z2 2 Variâncias 1 22 2 desconhecidas mas iguais Neste caso temos 2 1 2 2 2 Sinalizamos acima que o estimador MVU da variância 2 comum às duas populações é S2 n1 1S1 2 n2 1S2 2 n1 n2 2 15 e que segundo 12 temos n1 n2 2 S2 2 2n1 n2 2 12 Assim a estatística Y kX 2 k1 1 n2 k2 1 n1 S2 2 Y kX 2 k1 S 1 n2 k2 1 n1 tem distribuição t Student Ou seja Y kX 2 k1 S 1 n2 k2 1 n1 Tn1 n2 2 16 Sob H0 esta estatística se reduz à Y kX S 1 n2 k2 1 n1 Assim para um nível de significância e os quantis t2 da T Student com n1 n2 2 graus de liberdade a região de rejeição do teste de H0 dada em 13 será Hugo Boff Estatística II 2020I 22 RC Y kX s 1 n2 k2 1 n1 t2 Y kX s 1 n2 k2 1 n1 t2 13 onde s s2 é a estimativa do desviopadrão comum às duas populações Ou seja à semelhança do caso anterior H0 será rejeitada se a estimativa amostral y kx estiver fora do intervalo com extremidades s 1 n2 k2 1 n1 t2 3 Variâncias 1 22 2 desconhecidas e distintas Neste último caso um teste aproximado apenas poderá ser construído A estatística do teste terá distribuição aproximada pela t Student novamente Esta estatística será aquela dada em 14 na qual substituise as variâncias populacionais pelos seus estimadores amostrais Mostrase que sob H0 Y kX S2 2 n2 k2 S1 2 n1 T 17 Os graus de liberdade são calculados pela parte inteira da seguinte expressão s1 2 n1 s2 2 n2 2 1 n11 s1 2 n1 2 1 n21 s2 2 n2 2 A hipótese nula H0 será então rejeitada se a estimativa amostral y kx estiver fora do intervalo com extremidades s2 2 n2 k2 s1 2 n1 t2 B Testes para Comparação das Variâncias A igualdade ou proporcionalidade das variâncias das duas populações poderá ser inspecionada usando a va F Fisher Esta variável aleatória se define como o quociente entre duas vas quiquadrado independentes as quais são divididas pelos seus respectivos graus de liberdade Hugo Boff Estatística II 2020I 23 1 211 2 222 F12 17 Tratase portanto de uma va com dois parâmetros para os graus de liberdade 1 para o numerador e 2 para o denominador Obviamente temos a relação F21 1 F12 18 A densidade desta variável é representada abaixo para 12 110 linha preta 510 linha vermelha 1010 linha azul 105 linha verde 0 1 2 3 4 5 6 00 01 02 03 04 05 06 07 08 09 10 F fF fFF12 12 2 1 2 2 2 1 2 1 2 F 12 2 1 1 2 F 12 2 F 0 Vamos construir o teste bilateral para a hipótese H0 1 2 2 2 k contra H1 1 2 2 2 k A estatística do teste é S1 21 2 S2 22 2 Fn1 1n2 1 19 Sob H0 a estatística fica Hugo Boff Estatística II 2020I 24 1 k S1 2 S2 2 Fn1 1n2 1 19 Deste modo para um nível de confiança geralmente tomado a 25 ou 5 determinamos na tabela da F Fisher os quantis f1 e f2 tais que PFn1 1n2 1 f1 2 PFn1 1n2 1 f2 Finalmente a região de rejeição de H0 será RC S1 2 S2 2 kf1n1 1n2 1 S1 2 S2 2 kf2n1 1n2 1 20 Obs As tabelas da F geralmente fixam o nível e apresentam o quantil f212 à direita tal que PF12 f212 2 Para obter o quantil correpondente à área à esquerda considere que PF12 f112 P 1 F12 1 f112 ou usando 18 PF12 f112 PF21 1 f112 Assim temos 1 f112 f221 ou seja f112 1 f221 18 Aplicando este resultado à região crítica 20 esta escrevese agora RC S1 2 S2 2 k f2n2 1n1 1 S1 2 S2 2 kf2n1 1n2 1 20 Exemplo 3 As notas obtidas pelos alunos de Estatística II nas faculdades de Economia e de Administração da UFRJ são vas Normais independentes com média e variâncias desconhecidas Uma amostra com 31 alunos de Economia e 41 alunos de Administração foi tomada e as estatísticas amostrais obtidas foram x s1 2 72 45 para a Economia e y s2 2 61 54 para Administração Como os programas das disciplinas são similares e os professores praticamente os mesmos a comparação estatística entre as médias e as variâncias fazem sentido Usamos o nível de significância de 5 Hugo Boff Estatística II 2020I 25 Solução 1 Para iluminar o teste das médias vamos começar fazendo o teste da igualdade das variâncias Para 05 temos pela tabela da F os quantis à 25 f23040 194 e f24030 201 f13040 1f24030 04975 Colocando k 1 a região crítica 20 fica RC05 S1 2 S2 2 04975 S1 2 S2 2 194 19 A estatística amostral é s1 2 s2 2 45 54 0833 RC05 Ou seja a evidência amostral não permite rejeitar a hipótese da igualdade das variâncias 2 Vamos agora fazer o teste de igualdade das médias tomando as variâncias como iguais de acôrdo com o resultado do teste anterior A região crítica do teste é dado por 13 com k 1 O percentil crítico da va t Student à 25 com 70 graus de liberdade é t02570 1994 Por outro lado a estimativa do desviopadrão populacional de acôrdo com 15 é s2 31 145 41 154 31 41 2 351 70 501 s 224 Temos também 1 41 1 31 0238 Então a região crítica fica RC05 Y kX 22402381994 Y kX 22402381994 RC05 Y kX 1063 Y kX 1063 A estatística amostral do teste é y 1x 61 72 11 RC Ou seja a hipótese da igualdade das médias é rejeitada com probabilidade de erro de 5 Há uma indicação amostral de que o desempenho dos alunos de Economia é melhor a rejeição se dá no lado esquerdo da região crítica Hugo Boff Estatística II 2020I
Send your question to AI and receive an answer instantly
Recommended for you
25
Intervalos de Confiança: Conceitos e Cálculos
Estatística Econômica e Introdução à Econometria
UMG
22
Análise do Erro Quadrático Médio e Métodos de Estimação
Estatística Econômica e Introdução à Econometria
UMG
7
Amostragem Estratificada: Fundamentos e Cálculos
Estatística Econômica e Introdução à Econometria
UMG
12
Estatísticas e Parâmetros Momentos Amostrais
Estatística Econômica e Introdução à Econometria
UMG
13
Teorema Central do Limite: Fundamentos e Aplicações
Estatística Econômica e Introdução à Econometria
UMG
5
Tabela de Limites Unilaterais da Distribuição F de Fisher-Snedecor aos 10% de Probabilidade
Estatística Econômica e Introdução à Econometria
UMG
8
Intervalos de Confiança para Populações Normais e Outros Modelos Estatísticos
Estatística Econômica e Introdução à Econometria
UMG
9
Amostras e Distribuições Amostrais em Estatística
Estatística Econômica e Introdução à Econometria
UMG
10
Teste de Hipóteses: Análise de Evidências e Cálculos de P-Valor
Estatística Econômica e Introdução à Econometria
UMG
12
Teoria da Informação Estatística: Mensuração e Suficiência das Estatísticas Amostrais
Estatística Econômica e Introdução à Econometria
UMG
Preview text
VII TESTES DE HIPÓTESES Neste capítulo estudaremos os elementos fundamentais da teoria dos testes de hipóteses e da sua aplicação à inferência paramétrica Como veremos existe uma dualidade entre os testes de hipóteses e a construção dos intervalos de confiança estudados no Capítulo VI anterior A rejeição de uma hipótese unilateral lançada sobre um parâmetro para um dado nível de significância 2 estará associada à não inclusão da estatística observada dentro de um intervalo de confiança 1 As aplicações estudadas focalizam exclusivamente as populações normais entendendose que nas condições de aplicação do TCL Teorema Central do Limite estas aplicações aproximam razoavelmente bem os testes correspondentes que poderiam ser construídos para as populações originais não normais Naturalmente os conceitos fundamentais da teoria dos testes e a mecânica de suas aplicações tem ambos um caráter geral que não se restringe à uma população em particular Também focalizaremos aqui apenas a construção de testes clássicos que são sempre conclusivos seja pela rejeição seja pela não rejeição da hipótese testada Hipótese Nula Isto significa que a abordagem sequêncial que contém regiões inconclusivas não será estudada 1 Conceitos Fundamentais O framework da análise é o da inferência paramétrica Temos uma amostra simples X1X2Xn de uma população X com suporte em X fdp fX fda FX ambas dependentes do parâmetro Temos uma estatística TX1X2Xn para cuja distribuição de probabilidade FTt será usada para a construção dos testes Elementos de um Teste de Hipóstese Um teste estatístico é composto dos seguintes ingredientes Hugo Boff Estatística II 2020I 2 a Uma hipótese a ser testada Esta hipóstese chamada hipóstese nula assume o seguinte formato H0 0 onde 0 é um subcojunto préespecificado do espaço paramétrico Como veremos à frente o teste de H0 será construído como um teste de rejeição A evidência amostral permite ou não rejeitar a hipótese H0 Ao ser especificada a região 0 da hipótese nula ficará implícitamente designada a região do que se chama a hipótese alternativa H1 1 onde 1 0 Frisemos que H1 não é a hipótese testada H1 é rejeitada se H0 não for rejeitada H1 é aceita somente se H0 for rejeitada b O Nível de Significância A tomada de decisão sobre o teste contempla apenas duas opções Rejeitar ou Não Rejeitar H0 Ao fazêlo dois tipos de erro podem ser cometidos Erro I Rejeitar H0 sendo H0 verdadeira Erro II Não rejeitar H0 sendo H0 falsa A implementação do teste requer a determinação prévia da probabilidade de se cometer ao menos um destes erros Notemos para estas probabilidades Pêrro I PRejeitar H0 H0 Verdadeira Pêrro II PNão Rejeitar H0 H1 Verdadeira As decisões e as probabilidades segundo H0 é verdadeira V ou falsa F são resumidas na tabela abaixo Hugo Boff Estatística II 2020I 3 H0 Decisão Prob Verdadeira Falsa Rejeita 1 Não Rejeita 1 Em testes nos quais tanto a hipótese nula como a hipótese alternativa são pontuais ambas as probabilidades de erro podem ser calculadas Nos testes mais usuais nos quais as hipóteses especificam intervalos de variação para o parâmetro testado como veremos será a probabilidade de cometer o erro do tipo I que será préfixada A probabilidade será chamada tamanho do teste ou mais comumente nível de significância do teste Tratase na verdade de uma cobertura para a região de rejeição do teste de H0 sendo esta hipótese verdadeira como veremos na sequência c Uma Região Crítica A Região Crítica RC do teste de H0 é por definição a região de rejeição de H0 Ela pode assumir a forma de intervalos abertos à direita do tipo RC T tc ou abertos à esquerda RC T tc ou a forma de uma união de intervalos de ambos os tipos RC T t1 T t2 Para cada um destes formatos da RC o teste correspondente será nomeado unilateral à direita à esquerda ou teste bilateral respectivamente Como mencionamos antes T é uma estatística para a qual será a estatística através da qual o teste é implementado O nível crítico tc será o valor que delimitará a região crítica Este valor será aquele que corresponde ao nível de significância que foi préfixado Ou seja a região de rejeição do teste estará completamente determinada pela escolha feita do tamanho a ser dado ao teste Isto significa que dado a região crítica RC será tal que PRC H0 1 Ou seja o nível de significância é o grau de cobertura dado à região de rejeição de H0 Hugo Boff Estatística II 2020I 4 Frequentemente notaremos RC para a região crítica de tamanho d Uma regra de decisão Sendo uma região de rejeição de H0 a especificação de RC define implícitamente uma regra de decisão para o teste Seja t Tx1x2xn realização amostral da estatística T A regra de decisão especifica Se t RC Rejeitase H0 a probabilidade de erro I será Se t RC Não rejeitase H0 a probabilidade de erro II será No primeiro caso a rejeição de H0 torna H1 uma hipótese plausível muito embora esta não é a hipótese testada Dizemos neste caso que H1 é aceita com a ressalva acima e Conceitos derivados Existem dois conceitos derivados deste quadro teórico os quais são de grande utilidade O primeiro é o conceito de pvalor ou pvalue que estabelece um treshold amostral acima do qual todo teste de tamanho maior que o pvalor leva à rejeição de H0 O segundo é o da Função Poder ou Power Function a qual mede a probabilidade de rejeitar H0 quando ela é falsa Tratase de um indicador importante para avaliar a qualidade do teste implementado uma vez que ele mede a capacidade do teste identificar corretamente a falsidade de H0 ao longo do intervalo de variação do parâmetro e1 PValor Sendo t Tx1x2xn a estatística observada do teste o p valor notado P é a probabilidade que a estatística amostral leve à rejeição de H0 sendo esta hipótese verdadeira P PT t H0 no teste unilateral à direita Hugo Boff Estatística II 2020I 5 P PT t H0 no teste unilateral à esquerda P 2minP P no teste bilateral Quanto menor o pvalor P maior a evidência amostral contra H0 Ou seja menos verossímil é H0 à luz da amostra Um guia qualitativo do grau de evidência amostral contra H0 é proposto por RAFisher 1924 com a seguinte escala de interpretação para a magnitude do pvalor Escala de Fisher P valor 010 005 0025 001 0005 0001 Evidência contra H0 fraca moderada substancial forte muito forte fortíssima e2 Função Poder A função poder do teste de H0 para o parâmetro notada definese como a probabiliade de rejeitar H0 com razão ou seja PRC H1 2 Observe que 1 onde é a probabilidade do erro do tipo II Quanto maior o poder do teste maior a probabilidade de se tomar uma decisão acertada rejeitando H0 Por exemplo considere o teste de H0 0 contra H1 0 Com base na estatistica T para suponha que a região de rejeição de H0 seja do tipo RC T tc A função poder ideal para este teste terá o formato abaixo Hugo Boff Estatística II 2020I 6 Como vemos no gráfico é nula a probabilidade da região de H0 e unitária a probabilidade da região de rejeição sob H1 Esta é uma situação ideal para um teste perfeitamente discriminante Vamos ilustrar os conceitos apresentados até aqui através de um exemplo analítico Exemplo 1 Analítico Papéis de renda variável negociados em bolsa tem retornos anuais com distribuição Normal de média e variância 2 Aqueles que apresentam retorno médio até 0 com risco 0 são considerados de baixo retorno B aqueles cujo retorno médio está acima de 1 com risco 1 são considerados de alto retorno A Naturalmente temos 0 1 e 0 1 Richardson está analizando os retornos anuais de uma letra imobiliária e quer saber se ela pode ser classificada como um papel do tipo A ou um papel do tipo B Ele então seleciona ao acaso n retornos passados deste papel e com base no retorno médio x obtido na amostra ele implementa o seguinte teste pontual H0 0 0 contra H1 1 1 Ou seja ele vai testar a hipótese de que a letra imobiliária é um papel de tipo B A estatística do teste é a média amostral X e a região crítica será do tipo RC X xc Ou seja Richardson implementará um teste unilateral à direita pois se a média amostral for maior que um determinado quantil crítico xc o ativo não poderá ser do tipo B e H0 deverá ser rejeitada 1 Para determinar xc Richardson admitirá um nível de significância que é a probabilidade de ele errar classificando o papel como sendo do tipo A quando na realidade ele é do tipo B Hugo Boff Estatística II 2020I 7 Temos então PRC H0 PX xc H0 ou seja PZ xc 0 0 n Pela tabela da Normal achamos z tal que PZ z de modo que xc 0 0 n z xc 0 0 n z 3 Assim a região de rejeição de H0 será X 0 0 n z como mostrado na figura à seguir Como regra de decisão se x RC x 0 0 n z rejeita H0 Neste caso a probabilidade de errar rejeitando é de 100 Caso contrário se x RC x 0 0 n z H0 não é rejeitada Neste caso a probabilidade de errar aceitando Ho é A probabilidade de cometer o erro II é calculada assim PRCc H1 PX xc H1 PZ xc 1 1 n Substituindo xc obtemos xc 1 1 n 0 0 n z 1 1 n 0z n 1 0 1 de modo que PZ 0z n 1 0 1 4 Hugo Boff Estatística II 2020I 8 2 O pvalor é P PX x H0 PZ x 0 0 n Naturalmente o nível de significância escolhido pode ser maior ou menor que o pvalor P Se ele for menor ou igual P H0 não é rejeitada se ele for maior P H0 é rejeitada 3 A função poder em testes pontuais sempre é uma constante no caso 1 1 4 Suponha que Richardson não tem razões para ser mais avesso à um tipo de erro que ao outro Ao invés de fixar ele deseja realizar um teste equilibrado tal que Qual a região crítica deste teste Vimos acima que PZ xc 0 0 n e PZ xc 1 1 n PZ 1 xc 1 n Logo a região crítica do teste equilibrado será RC X xeonde xe verifica xe 0 0 n 1 xe 1 n xe 1 0 1 0 0 0 1 1 5 Como vemos o quantil crítico do teste equilibrado é uma média ponderada dos retornos médios sob H0 e sob H1 com pesos determinados pelos riscos relativos O quantil do teste equilibrado estará mais próximo de 0 que de 1 Neste caso a probabilidade dos erros será dada por PX xe H0 PX xe H1 Naturalmente se P a hipótese H0 é rejeitada Caso contrário ela não é rejeitada A figura abaixo ilustra as regiões críticas iguaissob H0 e sob H1 do teste equilibrado Hugo Boff Estatística II 2020I 9 5 Suponha finalmente que antes de realizar a amostragem Richardson tenha em mente valores específicos para e que ele quer contemplar Quantos retornos do ativo ele deve então observar Dada a região crítica X xc e o quantil xc dado em 3 temos z xc 1 1 n 1z xc 1 n Usando agora o valor de xc vem 1z 0 0 n z 1 n 0z 1 0 n 0z 1z 1 0 n Ou seja n 0z 1z 1 0 2 6 Como o tamanho amostral deve ser um número inteiro com o semicolchête superior indicamos o arredondamento para cima ou seja tomamos o primeiro inteiro superior ao número 0z 1z 1 0 2 Exemplo 1 Numérico Para ilustrar numericamente o exemplo analítico tomamos os seguintes valores em 1000 reaisano H0 3 2 contra H1 5 5 Hugo Boff Estatística II 2020I 10 Temos também n 9 x 40 1 Para o teste de H0 com nível de significância 005 5 temos pela tabela da Normalpadrão z 165 Então por 3 o quantil crítico é xc 3 2 9 165 41 A região crítica de tamanho 5 será X 41 Como x RC não se rejeita H0 Ou seja a evidência amostral não permite rejeitar H0 Assim há indicações de que o papel analizado é do tipo B A aceitação de H0 está sujeita ao erro tipo II que ocorre se H0 é de fato falsa Calculemos então a probabilidade de ocorrência deste erro usando 4 PZ 2165 9 5 3 5 PZ 054 o que dá usando a tabela da Normalpadrão 0294 Ou seja temos uma elevada probabilidade de errar aceitando H0 2 O pvalor do teste é P PX 40 H0 PZ 4 3 23 PZ 15 0067 Ou seja na escala de Fisher a evidência amostral contra H0 é de fraca a moderada Somente testes com probabilidade de erro maior que 67 poderão levar à rejeição de H0 3 A função poder do teste é constante e igual à 1 ou seja 0706 Esta é a probabilidade de acertar rejeitando H0 4 Para a construção do teste equilibrado usamos 5 e o quantil crítico é dado por xe 5 2 5 3 2 2 5 5 25 7 3571 Devido à diferença na volatilidade dos retornos o retorno crítico é baixo Este é o retorno acima do qual o ativo é classificado como do tipo A retorno Alto com probabilidade de errar com esta classificação igual à probabilidade de errar considerandoo como do tipo B retorno Baixo Hugo Boff Estatística II 2020I 11 Devido ao baixo tamanho da amostra esta probabilidade é elevada PZ 3571 3 2 9 PZ 0856 0291 PZ 3571 5 5 9 PZ 0857 0291 5 Se antes de realizar a amostragem Richardson deseja uma probabilidade de 5 para ambos os tipos de erro qual deverá ser o tamanho da amostra Neste caso 005 de modo que z 165 e z 165 Então usando 6 obtemos n 2165 5165 5 3 2 3335 n 34 Ou seja Richardson deverá considerar 34 retornos passados do papel em análise 2 Testes Compostos em Uma População Normal Vamos estudar agora a construção de testes compostos com hipóteses alternativas múltiplas para a média e para a variância em populações normais Em cada caso as estatísticas que viabilizam a realização destes testes são as mesmas daquelas empregadas na construção dos Intervalos de Confiança estuados no Capítulo VI Os testes compostos sobre um parâmetro admitem as seguintes regras de decisão Unilateral à direita H0 0 contra H1 0 Unilateral à esquerda H0 0 contra H1 0 Bilatera l H0 0 contra H1 0 Como a região crítica RC do teste é uma região de rejeição de H0 ela sempre assumirá o formato da hipótese alternativa Assim no primeiro caso acima teremos RC T tc no segundo caso RC T tc No caso do teste bilateral a região crítica não é um intervalo mas a união de dois intervalos disjuntos RC T t1 T t2 Hugo Boff Estatística II 2020I 12 A Testes para a média Sabemos que a média amostral tem distribuição normal Xn N2n Deste modo Z Xn n N01 7 1 2 conhecida Neste caso de acôrdo com 7 a estatística do teste é a normalpadrão Dada uma cobertura da região crítica de tamanho consideramos o quantil z tal que PZ z para o caso do teste unilateral à direita PZ z para o caso do teste unilateral à esquerda Consideramos o quantil z2 tal que PZ z2 no caso do teste bilateral Segundo a regra de decisão o formato das regiões críticas será Para H0 0 contra H1 0 RC X xc H0 xc 0 n z Para H0 0 contra H1 0 RC X xc H0 xc 0 n z 0 n z Para o teste de H0 0 contra H1 0 teremos RC X x1 H0 X x2 H0 x1 0 n z2 x2 0 n z2 Em cada um destes casos rejeitase H0 com probabilidade de erro 100 se a média amostral observada pertence à região crítica Ou seja se x RC Hugo Boff Estatística II 2020I 13 Lembremos que para o cálculo do p valor em cada um destes casos devemos observar as definições P PX x H0 no teste unilateral à direita P PX x H0 no teste unilateral à esquerda P 2minP P no teste bilateral Aceitação de H0 e Intervalo de Confiança Observe que no teste bilateral H0 0 contra H1 0 de tamanho dizer que H0 não é rejeitada equivale dizer que o valor testado 0 pertence à um à um intervalo de confiança 1 centrado na média amostral x Com efeito se H0 não é rejeitada ao nível de signficância isto significa que x RC Ou seja x x1 0 n z2 e x x2 0 n z2 Logo 0 n z2 x 0 n z2 Ora estes limites para a média da amostra implicam nos seguintes limites para 0 x n z2 0 x n z2 0 IC1 Poder dos testes unilateral e bilateral O poder do teste unilateral à direita de tamanho é d PX xc H1 PZ n xc 0 Esta é a probabilidade de decidir corretamente rejeitando H0 Substituindo xc dado em 3 vem n xc z n 0 de modo que d PZ z n 0 0 1 2 z n 0 e 1 2 z2dz 0 Hugo Boff Estatística II 2020I 14 Vemos assim que é crescente com d0 e lim d 1 O diagrama abaixo para 005 z 165 0 3 4 n 81 descreve o formato típico da função poder do teste unilateral à direita linha contínua em vermelho É fácil checar que a função poder para um teste unilateral à esquerda de tamanho é e PX xc H1 PZ n xc 0 Neste caso n xc n 0 z de modo que e PZ n 0 z 0 1 2 n 0z e 1 2 z2dz 0 No diagrama abaixo o poder deste teste é mostrado na linha contínua em azul 0 1 2 3 4 5 6 00 01 02 03 04 05 06 07 08 09 10 Média Populacional Poder Poder Testes Unilaterais Poder Teste Bilateral No teste bilateral a região crítica de tamanho se decompõe em uma união de duas regiões críticas com cobertura 2 cada uma b PZ z2 n 0 0 PZ n 0 z2 0 Hugo Boff Estatística II 2020I 15 ou seja b 1 2 z2 n 0 e 1 2 z2dz 0 1 2 n 0z2 e 1 2 z2dz 0 O poder do teste bilateral é representado no diagrama acima pelas linhas pontilhadas em vermelho e azul ainda para os valores 005 z2 196 0 3 4 n 81 Como esperado o poder do teste bilateral é sempre menor que o poder dos testes unilaterais pois ele distribui a mesma cobertura sobre uma região maior do que estes Existe uma razão informacional Nos testes unilaterais é dado ao problema do teste mais informação para a rejeição do H0 do que é feito no teste bilateral uma vez que uma das regiões à esquerda ou à direita do valor testado é excluída A supremacia do teste unilateral sobre o teste bilateral mostra que ele deve ser implementado sempre que há informação suficiente para excluir uma das regiões da hipótese alternativa Ou seja o teste bilateral somente é implementado quando não se tem informação suficiente para excluir os valores maiores ou os valores menores que o valor testado Frisemos também que este resultado mostrado aqui no teste da média em população Normal é verdadeiro para o teste de qualquer outro parâmetro de qualquer população 2 2 desconhecida Neste caso como vimos no Capítulo VI 2 deverá ser estimado e a estatística do teste é a vaT Student padrão Sendo Sn1 2 1 n 1 i1 n Xi Xn2 o estimador MVU de 2 vimos em Estatística I que o quociente entre uma va Normalpadrão e a raiz quadrada de uma va quiquadrado dividida pelos seus graus de liberdade ambas independentes uma da outra formam uma va T Student Então Xn Sn1 n Tn 1 8 Deste modo a região crítica no teste unilateral à direita de H0 0 contra H1 0 terá o quantil crítico xc dado por Hugo Boff Estatística II 2020I 16 RC X xc H0 xc 0 s n t onde s é o desviopadrão amostral e t é o percentil da va Studentpadrão com n 1 graus de liberdade Comparandose este quantil crítico com aquele do mesmo teste considerado anteriormente quando 2 é conhecida vemos que este apenas substitui o desviopadrão populacional pelo desviopadrão amostral s e mutatis mutandis a estatística Z normal pela estatística T Student A implementação dos testes segue a mesma lógica descrita para o caso em que 2 conhecida A consequência de se usar o estimador da variância é visível na função poder do teste a qual apresenta valores mais baixos que aqueles obtidos quando 2 é conhecida Para mostrar isto plotamos os valores da função poder para o teste de H0 0 contra H1 0 com os parâmetros n 21 20gl 005 t 1725 s 4 0 3 A linha em vermelho é a função poder do teste quando a variância é desconhecida estatística t A curva em é d 1725 21 4 3 21 2 1 2 20 2 1 20 121 1 20 t2 21 2 dt 3 A curva em azul é a função poder do teste quando a variância é conhecida estatística z d 1 2 165 21 4 3x e 1 2 z2dz 3 Hugo Boff Estatística II 2020I 17 1 2 3 4 5 6 7 8 00 02 04 06 08 10 média pop poder d 1725 21 4 3 21 2 1 2 20 2 1 20 121 1 20 t2 21 2 dt Pelo gráfico vemos que o poder do teste de H0 quando 2 é conhecida domina o poder do teste de H0 quando 2 é estimada para os valores relevantes 0 3 B Testes para a Variância Desde o Capítulo II sabemos que n 1Sn1 2 2 2n 1 9 A distribuição do estimador amostral da variância assim como ela permite a estimação intervalar da variância da população também permite a construção de testes de hipóteses para ela usandose os percentis da va 2n 1 A construção de testes unilaterais ou bilaterais para a variância seguirá a mesma lógica apresentada para os testes da média Por exemplo antes da implantação de um programa de treinamento para os operadores de um processo produtivo na fabricação de lápis de cor a variância do número de falhas detectadas no produto era 0 2 Com base em uma amostra aleatória realizada um ano após a implementação do programa desejase avaliar estatísticamente se o treinamento melhorou a qualidade do produto reduzindo a variância do número de falhas Hugo Boff Estatística II 2020I 18 Neste caso a hipótese adequada a ser testada deverá ser unilateral à esquerda pois supõese que o treinamento não pode piorar a qualidade do produto H0 2 0 2 contra H1 2 0 2 Ou seja se a hipótese nula de que o treinamento não resultou em melhora for rejeitada a hipótese alternativa de que a melhora ocorreu deverá ser aceita Todavia se o programa de treinamento não foi implementado e que após um ano se quer simplesmente saber se houve ou não learning by doing no desempenho dos operadores do processo produtivo com redução ou aumento na variância das falhas o teste bilateral será mais adequado H0 2 0 2 contra H1 2 0 2 Para um teste de tamanho região crítica deste teste será aqui escrita em função do estimador amostral da variância unicamente RC Sn1 2 x1 Sn1 2 x2 10 Usando 9 vamos achar na tabela da 2n 1 os percentis q1 e q2 tais que P2n 1 q1 2 P2n 1 q2 Então como sob H0 n 1Sn1 2 0 2 2n 1 podemos determinar os quantis x1 e x2 em 10 x1 0 2 n 1 q1 e x2 0 2 n 1 q2 e a região de rejeição 10 fica RC Sn1 2 0 2 n 1 q1 Sn1 2 0 2 n 1 q2 10 Exemplo 2 No contexto descrito vamos avaliar se houve ou não alteração na variância do número de falhas fazendo o teste bilateral para a hipótese H0 2 45 que é o nível da variância antes do treinamento Ou seja H0 é a hipótese que o treinamento não alterou a variância do número de falhas Para 005 e uma amostra de n 25 trabalhadores submetidos ao treinamento obtemos na tabela os valores de q1 124 e q2 395 indicados no gráfico abaixo Hugo Boff Estatística II 2020I 19 24gl fq 1 21212 q11eq2 A estimativa amostral da variância foi s2 23 Então de acôrdo com 10 os limites da região crítica serão 0 2 n 1 q1 45 24 1240 235 e 0 2 n 1 q2 45 24 3950 7406 E a região de região de rejeição fica RC Sn1 2 235 Sn1 2 7406 Como s2 23 RC rejeitase H0 Ou seja existe evidência amostral de que a variância da população diminuiu para um nível abaixo do nível inicial 0 2 45 A probabilidade de errar rejeitando H0 é de 5 3 Testes em Duas Populações Normais Independentes Podemos efetuar testes de igualdade ou a proporcionalidade entre médias de duas populações normais independentes assim como podemos também testar a igualdade ou a proporcionalidade entre as variâncias destas duas populações Considere duas populações normais independentes X N11 2 e Y N22 2 Uma amostra de tamanho n1 é tomada da população X X1X2Xn1 da qual se extrai os estimadores MVU de 1e 1 2 X e S1 2 1 n1 1 i1 n1 Xi X2 Analogamente uma amostra de tamanho n2 é tomada da população Y Y1Y2Yn2 da qual se extrai os estimadores MVU de 2 e 2 2 Y e S2 2 1 n2 1 i1 n2 Yi Y2 Hugo Boff Estatística II 2020I 20 A Testes para Comparação das Médias Estamos interessados em realizar testes comparando as médias das duas populações Para k os testes assumem a forma H0 2 k1 0 contra H1 2 k1 0 Quando k 1 estaremos testando a igualdade das médias nas duas populações Escolhemos expor a construção do teste apenas no caso bilateral por uma questão de economia A construção dos testes unilaterais à direita ou à esquerda segue o mesmo método estudado no caso de uma população As estatísticas deste teste estarão baseadas nos seguintes resultados Y kX N2 k1 2 2 n2 k2 1 2 n1 11 Para a variância temos com efeito VY kX VY k2VX 2kCovXY a qual se reduz à VY k2VX pelo fato de que em razão da indepedência entre as populações a covariância entre as médias amostrais é nula O outro resultado diz respeito à distribuição das variâncias amostrais n1 1S1 2 1 2 n2 1S2 2 2 2 2n1 n2 2 12 Este resultado é consequência da normalidade e da independência das populações O número de graus de liberdade n1 n2 2 resulta da soma n1 1 n2 1 onde cada termo são os graus de liberdade da distribuição da variância amostral de cada população Esta é uma propriedade reprodutiva da 2 Como usual a região crítica do teste bilateral para a diferença das médias será RC Y kX x1 Y kX x2 13 1 Variâncias 1 22 2 conhecidas Neste caso a estatística do teste é a va NormalPadrão Z Y kX 2 k1 2 2 n2 k2 1 2 n1 N01 14 Hugo Boff Estatística II 2020I 21 Sob H0 a estatistica se reduz à Y kX 2 2 n2 k2 1 2 n1 Deste modo para um nível de significância a região de rejeição do teste de H0 dada em 13 será RC Y kX 2 2 n2 k2 1 2 n1 z2 Y kX 2 2 n2 k2 1 2 n1 z2 13 Ou seja H0 será rejeitada se a estimativa amostral y kx estiver fora do intervalo com extremidades 2 2 n2 k2 1 2 n1 z2 2 Variâncias 1 22 2 desconhecidas mas iguais Neste caso temos 2 1 2 2 2 Sinalizamos acima que o estimador MVU da variância 2 comum às duas populações é S2 n1 1S1 2 n2 1S2 2 n1 n2 2 15 e que segundo 12 temos n1 n2 2 S2 2 2n1 n2 2 12 Assim a estatística Y kX 2 k1 1 n2 k2 1 n1 S2 2 Y kX 2 k1 S 1 n2 k2 1 n1 tem distribuição t Student Ou seja Y kX 2 k1 S 1 n2 k2 1 n1 Tn1 n2 2 16 Sob H0 esta estatística se reduz à Y kX S 1 n2 k2 1 n1 Assim para um nível de significância e os quantis t2 da T Student com n1 n2 2 graus de liberdade a região de rejeição do teste de H0 dada em 13 será Hugo Boff Estatística II 2020I 22 RC Y kX s 1 n2 k2 1 n1 t2 Y kX s 1 n2 k2 1 n1 t2 13 onde s s2 é a estimativa do desviopadrão comum às duas populações Ou seja à semelhança do caso anterior H0 será rejeitada se a estimativa amostral y kx estiver fora do intervalo com extremidades s 1 n2 k2 1 n1 t2 3 Variâncias 1 22 2 desconhecidas e distintas Neste último caso um teste aproximado apenas poderá ser construído A estatística do teste terá distribuição aproximada pela t Student novamente Esta estatística será aquela dada em 14 na qual substituise as variâncias populacionais pelos seus estimadores amostrais Mostrase que sob H0 Y kX S2 2 n2 k2 S1 2 n1 T 17 Os graus de liberdade são calculados pela parte inteira da seguinte expressão s1 2 n1 s2 2 n2 2 1 n11 s1 2 n1 2 1 n21 s2 2 n2 2 A hipótese nula H0 será então rejeitada se a estimativa amostral y kx estiver fora do intervalo com extremidades s2 2 n2 k2 s1 2 n1 t2 B Testes para Comparação das Variâncias A igualdade ou proporcionalidade das variâncias das duas populações poderá ser inspecionada usando a va F Fisher Esta variável aleatória se define como o quociente entre duas vas quiquadrado independentes as quais são divididas pelos seus respectivos graus de liberdade Hugo Boff Estatística II 2020I 23 1 211 2 222 F12 17 Tratase portanto de uma va com dois parâmetros para os graus de liberdade 1 para o numerador e 2 para o denominador Obviamente temos a relação F21 1 F12 18 A densidade desta variável é representada abaixo para 12 110 linha preta 510 linha vermelha 1010 linha azul 105 linha verde 0 1 2 3 4 5 6 00 01 02 03 04 05 06 07 08 09 10 F fF fFF12 12 2 1 2 2 2 1 2 1 2 F 12 2 1 1 2 F 12 2 F 0 Vamos construir o teste bilateral para a hipótese H0 1 2 2 2 k contra H1 1 2 2 2 k A estatística do teste é S1 21 2 S2 22 2 Fn1 1n2 1 19 Sob H0 a estatística fica Hugo Boff Estatística II 2020I 24 1 k S1 2 S2 2 Fn1 1n2 1 19 Deste modo para um nível de confiança geralmente tomado a 25 ou 5 determinamos na tabela da F Fisher os quantis f1 e f2 tais que PFn1 1n2 1 f1 2 PFn1 1n2 1 f2 Finalmente a região de rejeição de H0 será RC S1 2 S2 2 kf1n1 1n2 1 S1 2 S2 2 kf2n1 1n2 1 20 Obs As tabelas da F geralmente fixam o nível e apresentam o quantil f212 à direita tal que PF12 f212 2 Para obter o quantil correpondente à área à esquerda considere que PF12 f112 P 1 F12 1 f112 ou usando 18 PF12 f112 PF21 1 f112 Assim temos 1 f112 f221 ou seja f112 1 f221 18 Aplicando este resultado à região crítica 20 esta escrevese agora RC S1 2 S2 2 k f2n2 1n1 1 S1 2 S2 2 kf2n1 1n2 1 20 Exemplo 3 As notas obtidas pelos alunos de Estatística II nas faculdades de Economia e de Administração da UFRJ são vas Normais independentes com média e variâncias desconhecidas Uma amostra com 31 alunos de Economia e 41 alunos de Administração foi tomada e as estatísticas amostrais obtidas foram x s1 2 72 45 para a Economia e y s2 2 61 54 para Administração Como os programas das disciplinas são similares e os professores praticamente os mesmos a comparação estatística entre as médias e as variâncias fazem sentido Usamos o nível de significância de 5 Hugo Boff Estatística II 2020I 25 Solução 1 Para iluminar o teste das médias vamos começar fazendo o teste da igualdade das variâncias Para 05 temos pela tabela da F os quantis à 25 f23040 194 e f24030 201 f13040 1f24030 04975 Colocando k 1 a região crítica 20 fica RC05 S1 2 S2 2 04975 S1 2 S2 2 194 19 A estatística amostral é s1 2 s2 2 45 54 0833 RC05 Ou seja a evidência amostral não permite rejeitar a hipótese da igualdade das variâncias 2 Vamos agora fazer o teste de igualdade das médias tomando as variâncias como iguais de acôrdo com o resultado do teste anterior A região crítica do teste é dado por 13 com k 1 O percentil crítico da va t Student à 25 com 70 graus de liberdade é t02570 1994 Por outro lado a estimativa do desviopadrão populacional de acôrdo com 15 é s2 31 145 41 154 31 41 2 351 70 501 s 224 Temos também 1 41 1 31 0238 Então a região crítica fica RC05 Y kX 22402381994 Y kX 22402381994 RC05 Y kX 1063 Y kX 1063 A estatística amostral do teste é y 1x 61 72 11 RC Ou seja a hipótese da igualdade das médias é rejeitada com probabilidade de erro de 5 Há uma indicação amostral de que o desempenho dos alunos de Economia é melhor a rejeição se dá no lado esquerdo da região crítica Hugo Boff Estatística II 2020I