·

Cursos Gerais ·

Estatística Econômica e Introdução à Econometria

Send your question to AI and receive an answer instantly

Ask Question

Preview text

VII TEOREMA CENTRAL DOLIMITE A existência do Teorema Central do Limite TCL permite a aproximação pela va Normal de inúmeras variáveis que podem ser descritas como um fenômeno aleatório formado pela ação de uma grande quantidade de fatores independentes entre si Tratase do mais importante e impactante teorema da Teoria Estatística As restrições à sua aplicação são relativamente fracas o que permite a sua aplicação em ampla escala A qualidade da aproximação normal depende em grande medida do número n de fatores independentes uma vez que a convergência para a distribuição Normal se dá suponde n Ceteris Paribus quanto maior for este tamanho n melhor será a aproximação A velocidade da convergência também depende naturalmente dos graus de assimetria e curtose da variável aleatória original Quanto menor o grau de assimetria e quanto mais próximo de 3 estiver o grau de curtose da distribuição da variável original mais rápida será a convergência para a distribuição normal Vamos primeiro enunciar o teorema comentar alguns passos da sua demonstração e em seguida dar alguns exemplos da sua aplicação Teorema Central do Limite Lindeberg1922 Feller1935 Seja uma sequência infinita de vas independentes X1X2Xncom fdas F1F2Fn médias 12 n e variâncias 1 22 2n2 Considere as somas parciais de ordem n Sn X1 X2 Xn n 1 2 n n2 1 2 2 2 n2 Dado 0 considere também as variâncias restritas i 2 in in x i2dFix e sua soma parcial n2 1 2 2 2 n2 Por fim construa a sequência das vas padronizadas 2 Zn Sn n n 1 As condições necessárias e suficientes para que n lim PZn z 1 2 z e 1 2 t2dt 2 são C1 n lim n2 C2 n lim n2 n2 1 0 Uma demonstração didática deste teorema para o caso iid envolve a função característica da va Xt EeitX a qual não será vista neste curso Por isso sua prova será omitida Observações 1Lindeberg estabeleceu a suficiência das condições C1 e C2 Anos depois Feller estabeleceu sua necessidade 2O teorema garante a convergência das funções de distribuição das somas padronizadas Zn para a função de distribuição de uma va Normalpadrão ou seja n lim FZnz FZz onde Z N01 Isto é uma convegência em distribuição notada Zn n d N01 3O atendimento da condição C2 requer que as funções de distribuição sejam razoávelmente suaves no sentido que não possuam fortes descontinuidades locais na vizinhança da média 4 Nas situações mais usuais em que a sequência dos Xi é iid como amostras simples de uma população as condições C1 e C2 são facilmente atendidas Com efeito neste caso Fi FX i i e i 2 2 Deste modo n2 n2 e a condição C1 é atendida Por outro lado n2 n i n i n x 2dFXx Assim a condição C2 fica n2 n2 i n i n x 2dFXx 2 3 Exceção feita de casos patológicos o denominador deste quociente converge 0 para x 2dFXx quando n Então n2 n2 n x 2dFXx 2 2 2 1 e a condição C2 também é atendida 5 O resultado anterior assegura a convergência para a va normalpadrão das médias amostrais padronizadas das populações estatísticas mais usuais E não apenas das médias de ordem 1 mas também das médias de ordem k tipo 1n i1 n Xi k k 123 desde que os momentos populacionais correspondentes EXk e VXk também existam 6Grosseiramente falando sempre que temos um fenômeno aleatório que é resultado da ação de inúmeros fatores independentes a lei de probabilidade da padronização deste fenômeno pode ser aproximada pela distribuição normalpadrão Em sequência aos comentários 4 e 5 acima no caso de uma amostra simples de uma população com média e variância 2 como Sn nXn a expressão Zn em 1 fica Zn nXn n n2 nXn n n Xn 1 Deste modo pelo TCL em 2 teremos n Xn n d N01 2 A expressão 2 estabelece a convergência em distribuição da média padronizada para a va normal padronizada Ou seja a expressão 2 estabelece a convergência em distribuição não da média como costumeiramente se afirma mas da média padronizada ainda que na prática o teorema autoriza considerar a distribuição limite da média como sendo a distribuição normal Na sequência usaremos o TCL para a aproximação normal das médias de algumas populações não normais mais notáveis 4 Em todos os exemplos suporemos uma sequência infinita de vas iid de uma distribuição previamente especificada de modo a atender as condições C1 e C2 de Lindeberg e Feller 1 Aproximação Normal da soma de vas Exponenciais Vimos no capítulo VI anterior que a soma de uma sequência iid de uma va Exponencial de média 1 é uma va Gama com parâmetros n ou seja Se Xi Exp i 12n então Sn X1 X2 Xn n Vimos também que para conhecido a va 2Sn tem a distribuição de uma va quiquadrado com 2n graus de liberdade ou seja 2Sn 22n 3 Deste modo podemos comparar as probabilidades da média de n exponenciais independentes calculadas pela 22n com as probabilidades da média calculadas pela aproximação Normal TCL Assim vamos calcular PXn k para um dado número k usando a distribuição exata da média e esta mesma probabilidade usando a aproximação normal Para a distribuição exata temos Xn k Sn nk 2Sn 2nk de modo que usando 3 PXn k P22n 2nk 0 2nk yn1 2nn ey2dy 4 Para a aproximação normal vimos no capítulo anterior que E22n 2n e V2 2n 4n Então a padronização da va 22n leva à va Un 2Sn 2n 4n 2nSnn 1 2 n n Xn 1 5 Assim pelo TCL n Xn 1 n d N01 Z 6 5 Note que Xn k n Xn 1 n k 1 de modo que por 6 teremos PXn k PZ n k 1 n k1 1 2 ez22dz 7 Observese que a probabilidade em 5 é calculada como uma igualdade ao passo que esta mesma probabilidade em 7 é calculada como uma aproximação Para se ter uma idéia visual desta aproximação vamos plotar as densidades da quiquadrado padrão Un dada em 5 para n 10 e n 30 junto com a da normalpadrão Z cuja densidade é fZz 1 2 ez22 z 8 Para obtermos a densidade de Un sabemos do capítulo VI que se Y 2 2n sua densidade é fYy yn1 2nn ey2 y 0 9 Então sendo o Jacobiano da transformação Un Y 2n 4n dYdUn 2 n a densidade de Un será fUnu n n n un1 n en n u u 10 A figura abaixo apresenta a densidade de Un para n 10 e n 30 junto com a densidade de Z dada em 8 6 Fig1 Densidades 210 vermelho e 230 preto padronizadas e da Normalpadrão Z verde 3 2 1 0 1 2 3 4 01 02 03 04 05 06 U Z Densidades Pela Figura 1 vemos que as densidades quiquadrado padronizadas apresentam leve assimetria à direita a qual se atenua com o aumento de n Em consequência como as probabilidades são valores de área abaixo destas curvas na vizinhança da média acima ou abaixo dela a aproximação Normal superestima as probabilidades exatas O inverso ocorre longe da média em valores mais afastados da média mas não extremos a aproximação Normal subestima as probabilidades exatas Exercício 1 Calculemos as probabilidade exatas de PXn 14205 para uma população exponencial com média 10 ou seja x Exp110 para n 1030 na expressão 4 fazendo a interpolação sempre que necessário dos valores constantes nas tabelas da 2 Compare em seguida a probabilidade acima usando a aproximação Normal de acôrdo com a expressão 7 Solução a Probabilidades exatas Pela expressão 4 temos para n 10 usando a densidade de 220 PXn 14205 P220 2 1 10 1014205 P220 2841 7 PXn 14205 0 2841 y9 21010 ey2dy 089996 Para n 30 usamos a densidade de 260 PXn 14205 P220 2 1 10 3014205 P220 8523 0 8523 y29 23030 ey2dy 098218 b Aproximação Normal Pela expressão 7 temos para n 10 PXn 14205 PZ 10 1 10 14205 1 PZ 133 133 1 2 ez22dz 090824 Para n 30 obtemos PXn 14205 PZ 30 1 10 14205 1 PZ 23031 23031 1 2 ez22dz 098936 Observe que para n 10 a probabilidade aproximada representa 100090824089996 10092 da probabilidade exata em excesso de 092 Para n 30 a probabilidade aproximada representa 100098936098218 10073 da probabilidade exata em excesso de 073 Como esperado à medida que n aumenta a aproximação Normal tornase melhor Na sequência faremos aproximação Normal de duas variáveis aleeatórias discretas a Poisson e a Binomial Esta aproximação requer um ajuste A área de um retângulo de altura x e largura 1 será aproximada pela integral sob a curva Normal no intervalo x 12 x 12 Ou seja PX x x12 x12 1 2 ez22dz 8 onde EX e 2 VX A Fig2 abaixo ilustra a aproximação de X B8 1 2 pela va N42 Fig2 Densidade e Probabilidades pontuais de N42 vermelho e Probabilidades de B8 1 2 retângulos em preto 1 0 1 2 3 4 5 6 7 8 9 005 010 015 020 025 x fx 02734 02187 01093 00312 Por exemplo PX 4 8 4 128 02734 4124 2 4124 2 1 2 ez22dz 02763 2 Aproximação Normal da soma de vas Poisson Seja uma sequência X1X2Xn iid com distribuição Poisson de média Xi P e a soma Sn X1 X2 Xn Pela propriedade reprodutiva da Poisson sabemos que Sn Pn 11 Deste modo ESn n VSn Para a média amostral Xn Snn teremos EXn e VXn n Então pelo TCL vem que Xn n n d N01 12 Como anteriormente vamos comparar a probabilidade PXn k para um dado número k positivo usando a distribuição exata da média com a mesma probabilidade usando a aproximação normal 9 Observe que apesar de Sn ser va discreta número de ocorrências por intervalo de tempo a média Xn não o é necessáriamente Usando a distribuição exata temos de acôrdo com 11 PXn k PSn nk j0 kn en nj j 13 onde kn é o primeiro inteiro maior ou igual à kn Usando a distribuição Normal aproximada temos de acôrdo com 12 PXn k PZ k 1 2 n k 1 2 n 1 2 ez22dz 14 Exercício 2 O número de veículos que diariamente ficam na estrada em um trecho de uma rodovia movimentada é uma va Poisson com média 1 Calculase a probabilidade que no máximo 12 paradas ocorram em n 10 dias e que no máximo 120 paradas ocorram em n 100 dias usando a distribuição exata e a aproximação Normal Solução a Probabilidades exatas Pela expressão 13 temos para n 10 dias PXn 12 PS10 12 j0 12 e10 10j j 079156 Para n 100 dias PXn 12 PS100 120 j0 120 e100 100j j 097733 b Aproximação Normal Pela expressão 14 temos para n 10 dias PXn 12 PS10 12 PZ 125 10 10 12510 10 1 2 ez22dz 07854 10 Para n 100 dias PXn 12 PS100 120 PZ 1205 100 100 1205100 100 1 2 ez22dz 097982 Comparando estas probabilidades para n 10 a probabilidade aproximada representa 10007854079156 99 222 da probabilidade exata a menor em 077 Para n 100 a probabilidade aproximada representa 10009798209773 100 26 da probabilidade exata a maior em 026 uma diferença menor que a diferença modular anterior quando n 10 Confirmase assim que à medida que n aumenta a aproximação Normal fica mais precisa 3 Aproximação Normal para a soma de vas Bernoulli Seja X1X2Xn uma amostra de X Bernp com EX p e VX p1 p Por outro lado sabemos que o número de sucessos nas n provas Sn X1 X2 Xn tem distribuição Binomial com média np e variância np1 p Sn Bnp 15 Por outro lado a média Xn 1n Sn tem valor esperado p e variância p1 p n Então pelo TCL temos n Xn p p1 p n d N01 16 A Figura 3 abaixo função de probabilidade da Binomial com média 6 e variância 24 cruzinhas vermelhas e a densidade de uma va Normal correspondente linha contínua preta 11 Fig3 Probabilidades de B1006 pontos vermelhos e Densidade de N6 24 linha contínua preta 0 1 2 3 4 5 6 7 8 9 10 11 00 01 02 03 x PX x B1006 N6 24 Vamos agora comparar a probabilidade PXn k para um dado número k positivo usando a distribuição exata da média com a mesma probabilidade usando a aproximação normal Usando a distribuição Binomial exata temos de acôrdo com 15 PXn k PSn nk j0 kn n j pj1 pnj 17 onde kn é o primeiro inteiro maior ou igual à kn Usando a aproximação Normal com correção para continuidade temos de acôrdo com 16 PXn k PSn nk PZ nk 1 2 np np1p nk 1 2 np np1p 1 2 ez22dz 18 12 Exercício 3 Estimase que aproximadamente 60 dos visitantes de um shopping center adquirem algum produto de loja Calculamos a probabilidade que em um grupo de n 10 visitantes no máximo 6 deles sejam compradores de loja Calculamos também a probabilidade que em um grupo de 100 visitantes não mais que 60 deles sejam compradores Idem para a probabilidade que não se tenha mais de 600 compradores em um grupo de n 1000 visitantes Solução a Probabilidades exatas Usando o resultado 17obtemos para n 10 PXn 06 PS10 6 j0 6 10 j 06j0410j 061772 Para n 100 PXn 06 PS100 60 j0 60 100 j 06j04100j 053792 Para n 1000 PXn 06 PS1000 600 j0 600 1000 j 06j041000j 051201 b Aproximação Normal Pela expressão 18 temos para n 10 PXn 06 PS10 6 PZ 65 6 24 656 24 1 2 ez22dz 062656 Para n 100 PXn 06 PS100 60 PZ 605 60 24 60560 24 1 2 ez22dz 054065 13 Para n 1000 PXn 06 PS1000 600 PZ 6005 600 240 6005600 240 1 2 ez22dz 051287 Comparando estas probabilidades para n 10 a probabilidade aproximada representa 100062656061772 101 43 da probabilidade exata a maior em 143 Para n 100 a probabilidade aproximada representa 100054065053792 100 51 da probabilidade exata a maior em 051 Para n 1000a probabilidade aproximada representa 100051287051201 100 17 da probabilidade exata a maior em 017 Vemos assim que à medida que n aumenta a aproximação Normal fica mais precisa