·

Matemática ·

Inferência Estatística 1

Send your question to AI and receive an answer instantly

Ask Question

Preview text

Capítulo 2 Distribuições amostrais Considere X X1 Xn uma amostra aleatória proveniente de uma população P modelada pela distribuição de probabilidades F indexada pelo parâmetro desconhe cido Seja x x1 xn uma amostra observada Ou seja x é uma lista de n valores numéricos que contém informações sobre o parâmetro de interesse Note que para n grande a interpretação de x em relação à pode ser complicada Assim é de interesse poder condensar as informações sobre contidas na amostra x reduzindo a dimensão n da amostra Ou seja temos interesse em obter uma medida resumo da amostra Esta medida resumo é denominada de estatística Definição 8 Seja X X1 Xn uma amostra aleatória de uma população com distribuição de probabilidades F para X 2 X n Rn e 2 Uma estatística é uma função SX Rn Rm de valor real m 1 ou por vetor 1 m n tal que dado que X x a SX assume valores que só depende dos valores amostrais observados De maneira menos formal a definição 8 afirma que uma estatística SX é um valor calculado inteiramente a partir amostra X ie SX e uma função dos dados observados Exemplo 9 Seja X X1 Xn uma amostra aleatória de tamanho n proveniente de uma população com distribuição F A média amostral X 1 n n X i1 Xi depende somente dos valores da amostra logo é uma estatística Utilizando esta estatís tica reduzimos a dimensão da amostra de n para m 1 13 Outros exemplos de estatistica sao a A variancia amostral 1 S Xx X n1 d b O desviopadrao amostral ly SvVS X X n1 d c O valor minimo também denominado de I estatistica de ordem Xa min Xi d O valor maximo também denominado de nésima estatistica de ordem Xn max X 1in e Generalizando os itens c e d qualquer uma das estatisticas de ordem Xi nin Xa X2 segundo menor X Xn max X lin onde X1Xn sao os dados ordenados de maneira crescente f O ponto médio amostral Xa Xn Xmed o d 2 g A mediana X nit se n impar 7 2 X medXjXn XnXin Gy 5 Ge se n par onde X a résima estatistica de ordem para r nth pot 1 g O momento amostral de ordem k k 1 nit 14 Os exemplos citados acima são as estatísticas mais frequentemente utilizadas Con tudo como a definição de estatística é bem ampla então podemos resumir as informações da amostra de diversas outras maneiras Exercício proposto 1 Utilizando o software R gere uma amostra de tamanho n 10 de uma população com distribuição normal com média µ 5 e variância σ2 4 Obtenha para a amostra gerada o valor das estatísticas descritas nos itens a a g da página 14 Para a estatística do item g considere k 2 Repita este exercício para n 15 21 Distribuição amostral Seja X X1 Xn uma amostra aleatória de tamanho n proveniente de uma po pulação F e SX uma estatística Nosso objetivo é utilizar as informação da amostra resumida na estatística SX para atribuir um valor plausível ao parâmetro Inferência Em outra palavras dado uma amostra observada x x1 xn calculamos uma estatística amostral de interesse por exemplo x a média amostral e utilizamos esta estatística para se fazer inferência sobre algum parâmetro populacional por exemplo µ a média populacional A Figura 21 mostra esquematicamente os conceitos de população parâmetro amostra e estatística População Inferência Estimação Amostra Parâmetros α β γ μ Estatísticas X X1 Xn S2 Amostra X1Xn Figura 21 Diagrama de Venn 15 Neste ponto é importante notar que como a estatística SX é uma função das va riáveis aleatórias X1 Xn então SX também é uma variável aleatória e portanto tem associado uma distribuição de probabilidades um valor esperado e uma variância A distribuição de probabilidades de uma estatística é denominada de distribuição amostral Teorema 1 Seja X X1 Xn uma amostra aleatória proveniente de uma população com distribuição F para µ σ2 onde EXi µ e VarXi σ2 para i 1 n Então a EX µ b VarX σ2 n c ES2 σ2 Para demonstrarmos o teorema 1 precisamos relembrar as seguintes propriedades do valor esperado e da variância Se X1 e X2 são variáveis aleatórias independentes e a e b são constantes então i EaX1 bX2 aEX1 bEX2 ii VaraX1 bX2 a2VarX1 b2VarX2 Demonstração do teorema 1 a Utilizando a propriedade i descrita acima temos que EX E 1 n n X i1 Xi 1 nE n X i1 Xi 1 n n X i1 EXi 1 n n X i1 µ nµ n µ 16 b Utilizando a propriedade ii descrita acima temos que VarX Var 1 n n X i1 Xi 1 n2Var n X i1 Xi 1 n2 n X i1 VarXi 1 n2 n X i1 σ2 nσ2 n2 σ2 n c Utilizando a propriedade item i descrita acima temos que ES2 E 1 n 1 n X i1 Xi X2 1 n 1E n X i1 Xi X2 21 Antes de continuarmos com a demonstração do item c considere somente o termo nP i1 Xi X2 Somando e subtraindo µ ao termo interno temos que n X i1 Xi X2 n X i1 Xi µ X µ 2 n X i1 Xi µ2 2Xi µX µ X µ2 n X i1 Xi µ2 2X µ n X i1 Xi µ nX µ2 n X i1 Xi µ2 2X µ 0 B B B B n X i1 Xi z nX nµ 1 C C C C A nX µ2 n X i1 Xi µ2 2X µnX nµ nX µ2 n X i1 Xi µ2 2nX µX µ nX µ2 n X i1 Xi µ2 2nX µ2 nX µ2 n X i1 Xi µ2 nX µ2 17 Voltando a Equacao21 temos que 1 S E X p nX p pu nX p1 1 E Xp EnX py SeSav7 erro 1 EX p nEX p 15 2 a Var X VarX 1 5 o ao n n1 n l 2 2 noo n1 n10 7 n1 a Para ilustrar 0 resultado do TeoremaI considere o seguinte exemplo Exemplo 10 Considere uma populagao finita composta pelos seguintes 4 valores 1245 A média e a varidncia populacional sao pp 3 e o 25 Agora suponha que os parametros populacionais 6 4107 sejam quantidades desconhecidas e deseja mos estimala usando amostras de tamanho 2 retiradas com reposicao Assim podemos retirar um total de 47 16 amostras desta populacao A Tabela21 mostra as 16 possiveis amostras e seus respectivos valores Tabela 21 Todas as possiveis amostras de tamanho n 2 a ual ay fial cn las 6 so 12 ual ca fool a fool a as 14 4s sy sol ar fas wor asl ar oo A varidvel X assume um dos valores 7 VY 10 15 20 25 30 3 5 4 0 45 5 OF Como X também é uma varidvel aleatéria entao também possuf uma distribuicdo de probabilidades um valor esperado EX e uma varidncia VarX Assumindo que os resultados sao equiprovaveis a Tabela mostra a distribuicéo de probabilidades de X 18 Tabela 22 Distribuição de probabilidades de X x 10 15 20 25 30 35 40 45 50 soma px 116 216 116 216 416 216 116 216 116 1 xpx 116 316 216 516 1216 716 416 916 516 4816 x2px 116 4516 416 12516 3616 24516 1616 40516 2516 16416 A soma dos valores da terceira linha da Tabela 22 dá o valor esperado de X EX 48 16 3 A soma dos valores da quarta linha da Tabela 22 dá o valor esperado de X 2 E X 2 164 16 Logo a variância de X é dada por VarX 164 16 32 1 25 Ou seja EX µ 3 e VarX 1 25 25 2 σ2 n Exercício proposto 2 Seja X1 Xn Nµ σ2 para µ 5 e σ2 4 Utilizando o software R a gere uma amostra de tamanho n 30 e calcule X e S2 b repita o item a L 100 1000 10000 vezes e calcule a média dos L valores X e a média dos L valores S2 c Descreva o que acontece com os valores calculados no item b quando aumentamos o número de repetições L 22 Amostragem da distribuição normal Como visto na seção anterior a média amostral X e a variância amostral S2 são duas estatísticas Nesta seção apresentamos as distribuições de probabilidades associadas a estas duas estatísticas quando a amostra aleatória X X1 Xn é proveniente de uma população normal com média µ e variância σ2 para µ 2 R e σ2 2 R Iniciemos com a distribuição amostral de X 221 Distribuição amostral de X Seja X1 Xn iid Nµ σ2 e X 1 n nP i1 Xi a média amostral para µ 2 R e σ2 2 R Então a distribuição de probabilidades de X é dada no Teorema 2 19 Teorema 2 Sob as condicgées enunciadas acima a distribuigéo amostral de X dada por uma distribuigao normal com média fu e varidncia x 1 2 o XN u n Demonstragao do Teorema Sabemos do curso de probabilidade que a fungao geradora de momentos fgm de uma varidvel aleatéria com distribuigéo normal com média pe variancia o é dada por 2 Mxt exp ut ott Logo temos que EZ x zn Myt E e E or E en th Eebr ebm en I Een independéncia i1 t ye as I Mx identicamente distribuidos i1 t Tp n wl II t ot ex a Pye On St Cot t 4 not exp 4 nu py 2n ot exp 4 pe p 2n que é a fgm de uma distribuigao normal com média p e variancia x A quantidade Sa é denominado de erropadrao Neste ponto importante notar que i o desviopadrao o é uma medida de variabilidade da amostra e nao depende do tamanho da amostra n ii jé o erropadrao Tn é uma medida de variabilidade da estatistica X e depende do tamanho da amostra n 20 Como X N u sua fungao densidade de probabilidade é dada por 12 slyo2 Mey f Zu 0 Tee 202 z a para 7 ER p Reo ER A fungao d distribuicao Fz PX 2 f u 0 dz nao tem forma matematica conhecida que permita seu calculo diretamente Ou seja precisamos obter o valor de Fx numericamente No software R obtemos o valor de Fx usando o comando pnorm Como ilustragao considere uma populagao com distribuigao NV 5 4 em que retiramos amostras de tamanho n 10 A Figura 22a mostra o grafico da fungao densidade de probabilidade da distribuigéo 54 e o grafico da fungao densidade de probabilidade da distribuicdo de probabilidades da média amostral X ieX N504 A Figura 22b mostra o grafico da fungao de distribuigao Fx da N54 e da N5 0 4 Em a a fwn b Fw Figura 22 Grafico de fZn e de Fx da distribuicgao normal Como X N u entao padronizando esta quantidade temos que xX nX 7 Xo VU yey Vn oO A fungao densidade de probabilidade é dada por 1 2 z exp Fee F para z ER 21 A função de distribuição Fz zR 1 fwdw não têm forma matemática conhecida que permita seu cálculo de maneira direta Ou seja precisamos obter o valor de Fz numericamente Porém para a distribuição normal padrão os valores de Fz estão tabelados Tabela normal padrão ou Tabela Z Um exemplo de Tabela Z está disponível no AVA Nesta Tabela no meio da Tabela temos os valores de Fz e nas margens temos o valor z Exemplo 11 Considere Z N0 1 Determine o valor de F1 32 PZ 1 32 Solução Vamos determinar o valor de F1 32 usando a Tabela Z disponível no AVA Para determinar o valor F1 32 olhamos na margem lateral o valor 1 3 e traça mos uma linha horizontal imaginária passando por este valor Na margem superior olhamos o valor 0 03 e traçamos uma linha perpendicular imaginária passando por este valor O ponto onde estas duas retas imaginárias se encontram é o valor de F1 32 ie F1 32 PZ 1 32 0 9066 A Figura 23a mostra o gráfico da função densidade de probabilidade da distribuição normal padrão destacando a área abaixo da curva referente a probabilidade F1 32 0 9066 No software R usamos o comando pnorm132 A Figura 23b mostra o gráfico da função de distribuição destacando o valor de F1 32 0 9066 Ou seja um ponto na curva de Fz representa uma área abaixo da curva de fz 3 2 1 0 1 2 3 00 01 02 03 04 z Densidade a fz 3 2 1 0 1 2 3 00 02 04 06 08 10 z Fz F13209066 b Fz Figura 23 Gráfico de fz e de Fz 22 Também podemos determinar o valor z tal que Fz q para 0 q 1 previamente fixado Neste caso o valor z é denominado de percentil ou quantil de ordem q Exemplo 12 Considere Z N0 1 Determine o percentil 90 Solução Temos interesse no valor z tal que Fz 0 90 Ou seja o percentil 90 Para determinar este valor buscamos no meio da Tabela Z o valor 0 90 ou mais próximo Para este caso não temos o valor 0 90 no meio da Tabela o valor mais próximo é 0 8997 Identificado o valor determinamos o valor z nas margens da Tabela Ou seja z 1 28 No software R obtemos este valor usando o comando qnorm090 Exemplo 13 Seja Z N0 1 Determine um valor z tal que Pz Z z 0 95 Solução Note que Pz Z z 0 95 Fz Fz 0 95 Logo para Fz 0 975 e Fz 0 025 temos a probabilidade desejada Ou seja temos interesse nos percentís 2 5 e 97 5 da distribuição normal padrão Como a distribuição normal padrão é simétrica então basta obtermos o valor z referente ao percentil 97 5 No software R obtemos este valor utilizando o co mando qnorm0975 O valor de interesse é z 1 96 Também podemos obter este valor na Tabela Z utilizando o procedimento descrito na solução do exercício 12 Portanto temos que P1 96 Z 1 96 Exemplo 14 A altura dos estudante do curso de bacharelado em matemática da UFMS tem distribuição normal com média µ 170 cm e desviopadrão σ 9 cm Uma amostra de 25 estudantes é selecionada de forma aleatória Determine a a probabilidade de que a média amostral seja maior do que 174 cm b a probabilidade de que a média amostral esteja entre 167 cm e 173 cm c a altura média k dos estudantes para que PX k 0 95 d Determine as alturas médias k1 e k2 para que tenhamos Pk1 X k2 0 90 23 Solucdo Sabemos que a distribuicéo da média amostral dada por X 170 Ss Padronizando temos que V25X 170 Z vee N0 1 Portanto a a probabilidade de X ser maior do que 174 é PX 174 PZ 222 1PZ 222 1F222 00182 b a probabilidade de que a média amostral esteja entre 167 e 173 é P167 X 173 P167 Z 167 F167 F167 00474 09525 09050 c Neste item devemos determinar um valor k de forma que PX k PZ Zp FZ 095 onde z Se Ou seja temos interesse no percentil 95 da distribuicgaéo normal padrao Utilizando 0 comando qnorm095 do software R obtemos o valor z 164 Portanto temos que 164 ea k17295 d Similar ao item c neste item temos interesse em P ky X ky Pa Z 090 F 2 Fz 090 onde z a1 e 22 Ska 170 Logo para F za 095 e Fz 005 temos a probabilidade desejada Ou seja temos interesse nos percentis 5 e 95 da normal padrao Como a distribuicao normal padrao é simétrica entao basta obtermos o valor z2 referente ao percentil 95 No software R obtemos este valor utilizando 0 comando qnorm095 O valor de interesse é z 1 64 Portanto temos que 5k 170 164 ee k 16705 dk2 170 164 ea ky 17295 24 222 Distribuicao amostral de S Seja X1 Xn Np 02 eS 30 X X a variancia amostral para ys R il eo R Entao a distribuicao de probabilidades associada a S é dada no Teorema Teorema 3 Sob as condigdes enunciadas acima a distribuigao amostral da estatistica We n vs o é dada por uma distribuigao Quiquadrado com n 1 graus de liberdade W x2 Para demonstrarmos 0 Teorema3 precisamos relembrar dois resultados do curso de probabilidade i Se Z N01 entao Z x7 ind ii Se ZZ N01 entao U4 Xin A prova dos itens i e ii sao dadas no material de estudo da disciplina Probabilidade Demonstragao do teorema 3 Como XX N01 entao X FS N01 o para i 1n Pelo resultado em i temos que Xi bu 2 a2 Xb para i 1n Pelo resultado ii temos que s X b 2 SY Xe i1 Da expressao para a variancia amostral S X X temos que il n18 SX X SOX w 0X py i1 il Dividindo ambos os lados por a7 obtemos n x 9 ns OY ep ggg Ou seja n Xj Ll 7 YIM aa ays X a a o o o ee eee xa 25 Xn1 Xi Portanto W n1S2 σ2 χ2 n1 Sua função densidade de probabilidade é dada por fwn 1 1 2n12Γn 12wn121 exp n w 2 o para w 0 e n 0 O valor esperado e a variância de W são dadas por EW n 1 e VarW 2n1 A função de distribuição Fw não têm forma matemática conhecida Contudo assim como a distribuição normal padrão os valores de Fw estão Tabelados Tabela Quiquadrado disponível no AVA No software R obtemos o valor de Fw utilizando o comando pchisqt n1 A Figura 24 mostra o gráfico da função densidade de probabilidade fdp e da função de distribuição fd da distribuição Quiquadrado para os graus de liberdade n 2 4 6 8 10 Note que quanto maior o valor de n mais aberta e a curva de fwn ver Figura 24a Isto ocorre pois VarW 2n 0 5 10 15 00 01 02 03 04 05 w Densidade n3 n5 n7 n9 n11 a fwn 0 5 10 15 00 02 04 06 08 10 w Fw n3 n5 n7 n9 n11 b Fw Figura 24 Gráfico de fwn 1 e de Fw para W χ2 n1 Exemplo 15 Considere o enunciado do exercício proposto 14 ver pág23 Determine a a probabilidade de que S2 seja maior do que 50 b um valor k tal que PS2 k 0 95 c valores k1 e k2 tal que Pk1 S2 k2 0 95 Solução Sabemos que W n1S2 σ2 χ2 n1 Ou seja W 24S2 81 χ2 24 26 a Portanto a probabilidade de que S seja maior do que 50 é 245 2450 PS 50 P C a PW1481 1PW 1481 1F593 09262 b Neste item devemos determinar o valor de k de forma que 24k PSkP w a PW 0 2963k F0 2963k 095 Ou seja temos interesse no percentil 95 da distribuigao Quiquadrado com 24 graus de liberdade No software R obtemos o valor desejado utilizando o comando qchisq095 24 Na Tabela Quiquadrado identificamos os graus de liberdade na margem esquerda a probabilidade de interesse na margem superior e no meio da Tabela o percentil de interesse Este valor é 36415 Portanto temos que 02963k 36415 k S22 1228991 c Similar ao item b neste item temos interesse em 24 ky 24 ky 24 ko 24 ky P W 095 FF 095 8l 8gl 81 81 Logo para F 22 0975e F 221 0025 temos a probabilidade de sejada Ou seja temos interesse nos percentis 25 e 975 da distribuicao Quiquadrado com 24 graus de liberdade No software R obtemos estes dois valores utilizando os comandos qchisq0025 24 e qchisq0975 24 Estes valores sao 12 401 e 39364 Portanto temos que 24k 12401 3 k 41853 24k 30364 3 ky 132854 Definido as distribuicdes de probabilidades de X e S finalizamos esta subsecao apresentando o enunciado do Teorema que afirma que X e S sao variadveis aleatorias independentes para XX Np 07 Teorema 4 Seja XX wma amostra aleatéria de tamanho n de uma populagao com distribuicao normal com média 1 e varidncia 07 X1Xn a Nu07 Entao temos que a média amostral X e a varidncia amostral S sao varidveis aleatérias independentes A prova do Teorema4 é dada no apéndice 2A ver pégXX 27 223 Distribuigao tStudent Seja X1Xn oe N wu 07 para wp Re o R Considere a estatistica amostral pa Xan vnX a Jn em que S VS é 0 desviopadrao amostral Entao a distribuicao de probabilidades associada a estatistica T é dada no Teorema5 Teorema 5 Sob as condicoes enunciadas acima a distribuigao amostral da estatistica T vaX é dada pela distribuicgao tStudent com n1 graus de liberdade T tn1 Para demonstrarmos o teorema acima precisamos relembrar o seguinte resultado Resultado 1 Se Z N01eV Xin sendo Z e V independentes entao a varidvel aleatéria X Jon tem distribuigao tStudent com n graus de liberdade A prova do Resultado 1 é dada no material de estudo da disciplina Probabilidade Demonstragao do teorema5 Multiplicando e dividindo 0 denominador da estatistica T por Va obtemos p Xam XH 2 Sve 2 Imps 1 Vive varia Geno Win 1 onde Z At eW nos Como Xy n 1S 9 2 Tg NOY WH Xiny sendo Z e W independentes pelo Teorema 4 entao pelo resultado 1 temos que xX nX po Xan vn 0 Sn S A fungao densidade de probabilidade de T é dada por r 2 P yo tln 1 4 1 fttln 1 Fey 14 parat Ren 0 O valor esperado e a variancia de T sao dados por Et 0 e Vart 5 respectivamente A fungao de distribuigao Ft nao tém forma matematica conhecida Contudo os valores de Ft estao Tabelados Tabela tStudent disponivel no AVA No software R obtemos o valor de Ft utilizando 0 comando ptt n1 28 A Figura mostra o grafico da fungao densidade de probabilidade e da fungao de distribuigdo da distribuicgao tStudent com n 35 11 e da distribuigdo da distribuicgao normal padrao Note que aumentando o valor n a distribuigao tStudent se aproxima da distribuigao normal padrao a ftn 1 b Ft Figura 25 Grafico de ftn 1 e de Ft para T tn1 Exemplo 16 De uma populacao com altura média pp 170cm e desviopadrao popu lacional o desconhecido retirase uma amostra de tamanho n 25 Assumindo que as alturas de todos o individuos da populagao sao normalmente distribuidas e que o desvio padrao amostral é S 12 determine a a probabilidade da média amostral X ser superior a 180cm b 0 valor k da distribuigao de X tal que PX k 095 c valores ky e ky tal que Pky X ky 095 Solugao Como a desiopadrao populacional o é uma quantidade desconhecida deve mos utilizar o desviopadrao amostral para se calcular as quantidades desejadas Sabemos que 7 vaX tn1 Ou seja 7 X 170 1D 24 Portanto 29 a a probabilidade da média amostral X ser superior a 180cm é PX180 P 5X 170 5180 170 7 12 12 PT 1667 1PT 1667 1 F1667 00543 b Neste item devemos determinar o valor de k de maneira que 5k 170 5k 170 PX k PT F se P rs SE e 098 Ou seja temos interesse no percentil 95 da distribuigéo tStudent com 24 graus de liberdade No software R obtemos o valor desejado utilizando o co mando qt095 24 Este valor é 1711 Portanto temos que k1 121711 5k 170 1711 k Bia 170 k 174 1064 12 5 c Similar ao item b neste item temos interesse em P 5k 170 T 5k2 170 095 12 12 Escrevendo esta probabilidade utilizando a fungao de distribuigao temos ky 1 ky 1 F 5k2 170 F 5k1 170 095 12 12 Logo para F s 0975 e F Cas 0025 temos a proba bilidade desejada Ou seja temos interesse nos percentis 25 e 975 da distribuigao tStudent com 24 graus de liberdade No software R obtemos estes dois valores utilizando os comandos qchisq0025 24 e qchisq0975 24 Estes valores sao 12401 e 39364 Portanto te mos que 24k 12401 3 k 41853 24k 39364 ko 132854 30 224 Distribuição F de Snedecor Sejam X1 Xn Nµx σ2 x e Y1 Ym Nµy σ2 y amostras de tamanhos n e m provenientes de populações normais para µx µy 2 R e σ2 x σ2 y 2 R Considere as estatísticas amostrais S2 x 1 n 1 n X i1 Xi X e S2 y 1 m 1 m X i1 Yi Y Teorema 6 Nas condições enunciadas acima a distribuição amostral da estatística Q S2 x S2y é dada pela distribuição F de Snedecor com n 1 graus de liberdade no numerador e m 1 graus de liberdade no denominador Q S2 x S2 y Fn1m1 Para demonstrarmos o Teorema acima precisamos relembrar o seguinte resultado Resultado 2 Sejam U e V variáveis aleatórias independentes com distribuição Qui quadrado com n e m graus de liberdade respectivamente ie U χ2 n e V χ2 m Então a variável aleatória X Um Vn Fnm em que Fnm representa a distribuição F de Snedecor com n graus de liberdade no numerador e m graus de liberdade no denominador A prova do Resultado 2 é dada no material de estudo da disciplina Probabilidade Demonstração do teorema 6 Do Teorema 3 temos que Wx n 1S2 x σ2 x χ2 n1 e Wy m 1S2 y σ2 y χ2 m1 Logo pelo Resultado 2 temos que Wxn 1 Wym 1 S2 x σ2 x σ2 y S2 y Fn1m1 Assim para σ2 x σ2 y temos que Q S2 x S2 y Fn1m1 para Q 0 n 0 e m 0 31 A função densidade de probabilidade de Q é dada por fqn 1 m 1 para q 0 n 0 e m 0 A função de distribuição Fq não têm forma matemática conhecida Contudo os valores de Fq estão Tabelados Tabela FSnedecor disponível no AVA No software R obtemos o valor de Fq utilizando o comando pfq n1 n2 A Figura 26 mostra o gráfico da função densidade de probabilidade e da função de distribuição da distribuição F de Snedecor para alguns valores de n e m 0 1 2 3 4 5 00 02 04 06 08 10 q Densidade n3m2 n6m6 n11m11 n101m101 a ftn 1 0 1 2 3 4 5 00 02 04 06 08 10 q Densidade n3m2 n6m6 n11m11 n101m101 b Ft Figura 26 Gráfico de fqn 1 m 1 e de Fq para Q Fn1m1 Exemplo 17 A altura dos estudante do sexo masculino matriculados em curso de graduação da UFMS tem distribuição normal com média µmas 170 cm e desviopadrão σmas 9 cm E a altura dos estudantes do sexo feminino tem distribuição normal com média µfem 165 cm e desviopadrão σfem 9 cm Uma amostra de 25 estudantes do sexo masculino e 20 do sexo feminino foi selecionada de maneira aleatória Seja S2 mas e S2 fem as variâncias amostrais Determine a a probabilidade de S2 mas S2 fem b um valor k tal que PS2 mas kS2 fem 0 95 c os valores k1 e k2 de modo que Pk1S2 fem S2 mas k2S2 fem 0 95 32 Solugao Do Teorema 6 temos que Q s Fn1m1 Logo temos que y Sas Q oe F 2419 fem Portanto a a probabilidade de 7 Som PS 3 PQ1 1PQ 1F1 05068 b Neste item devemos determinar o valor de k de maneira que PSiras kSfom 090 Fk 095 Ou seja temos interesse no percentil 95 da distribuigao F de Snedecor com 24 graus de liberdade no numerador e 19 graus de liberdade no denominador No software R obtemos o valor desejado utilizando o comando qf 095 24 19 Este valor 6 k 21141 Assim temos que PS7 211415 090 c Similar ao item b neste item temos interesse em 2 2 2 P ki Siem Sinas k2Stem 095 Escrevendo esta probabilidade utilizando a fungao de distribuigao temos Logo para Fk2 0975 e Fk 0025 temos a probabilidade desejada Ou seja temos interesse nos percentis 25 e 975 da distribuicao F de Snedecor com 24 graus de liberdade no numerador e 19 graus de liberdade no denominador No software R obtemos estes dois valores utilizando os comandos qf 0025 24 19 e qf0975 24 19 Estes valores sao k 04264 e ky 24523 Assim temos que P 0 426457 Spas 245235 095 33 225 Distribuição amostral para proporção Considere uma população em que cada elemento é classificado de acordo com a pre sença ou ausência de determinada característica Por exemplo podemos estar interessados em eleitores escolhendo entre dois candidatos pessoas classificadas de acordo com o sexo alunos aprovados ou reprovados na disciplina Estatística entre outras Em termos de variável aleatória essa população é representada por uma variável ale atória de Bernoulli X 8 1 com probabilidade p 0 com probabilidade 1 p onde p é a proporção de elementos da população que possuem a característica de interesse Em geral o parâmetro p é uma quantidade desconhecida e precisamos estimalo Para isto selecionamos uma amostra aleatória X1 Xn desta população Estas n extrações correspondem a n variáveis aleatórias de Bernoulli independentes ie X1 Xn Bernoullip Como visto no curso de probabilidade temos que Y n X i1 Xi Binomialn p ie Y tem distribuição Binomial de parâmetros n e p 0 p 1 A variável Y dá o numero de sucessos nos n ensaios de Bernoulli onde sucesso neste caso representa a presença da característica de interesse Os possíveis valores de Y são 0 1 n A proporção de elementos na amostra com a característica de interesse é dada por ˆp X1 Xn n Y n Com esta quantidade é função da variável aleatória Y então a estatística ˆp também é uma variável aleatória O valor esperado de ˆp é dado por Eˆp E Y n E X1 Xn n EX1 EXn n np n p 34 A variância de ˆp é dada por Varˆp Var X1 Xn n VarX1 VarXn n2 np1 p n2 p1 p n Como a proporção amostral é uma média de uma amostra aleatória de uma população de Bernoulli de parâmetro p então o Teorema Limite Central nos diz que a distribuição da proporção amostral se aproxima de uma distribuição normal com média µp p e variância σ2 p p1p n Ou seja para n suficientemente grande temos que ˆp N p p1 p n 22 Para nos ajudar a decidir se n é suficientemente grande existe a seguinte regra empírica n p 5 Padronizando 22 temos que Z ˆp µp σp N0 1 Exemplo 18 O prefeito da cidade de Campo Grande afirma que 66 da população da cidade considera sua administração como sendo boa Isto é a proporção populacional é p 0 66 Um político opositor do prefeito duvida desta informação e divulga que vai contratar um instituto de pesquisa verificar a veracidade desta afirmação Para isto o instituto contratado vai realizar uma pesquisa com 600 indivíduos a serem selecionados de maneira aleatória Sob estas condições e assumindo que a afirmação do prefeito esteja correta determine um valor k de forma que Pp kσp ˆp p kσp 0 95 Solução Temos n 600 e p 0 66 Podemos utilizar a aproximação normal pois n p 600 0 66 396 5 Assim temos que ˆp N0 66 0 000374 O erro padrão é σp p0 000374 0 0193 Assim P0 66 0 0193k ˆp 0 66 0 0193k Pk Z k Fk Fk 0 95 Para Fk 0 975 e Fk 0 025 temos a probabilidade desejada 35 Ou seja temos interesse nos percentís 2 5 e 97 5 da distribuiçào normal padrão Como a distribuição normal padrão é simétrica então basta obtermos o valor refe rente ao percentil 97 5 No software R obtemos este valor utilizando o comando qnorm0975 O valor de interesse é k 1 96 Logo P0 6222 ˆp 0 6978 0 95 Ou seja se p 0 66 for realmente verdadeiro então a probabilidade de se observar uma estatística amostral ˆp entre 0 6222 e 0 6978 é de 95 Exercícios Propostos 1 Seja X1 Xn Nµ σ2 Descreva as distribuições de probabilidades associadas as seguintes estatísticas a a média amostral X b A estatística Z pnXµ σ c A estatística T pnXµ S onde S é o desviopadrão amostral d A estatística W n1S2 σ2 onde S2 é a variância amostral 2 A altura dos estudante do curso de bacharelado em matemática da UFMS tem distribuição normal com média µ 170 cm e desviopadrão σ 9 cm Uma amostra de 25 estudantes é selecionada de forma aleatória Determine a a probabilidade de que a média amostral seja maior do que 174 cm b a probabilidade de que a média amostral esteja entre 167 cm e 173 cm c Qual deve ser a altura média k dos estudantes para que PX k 0 90 3 Considere o enunciado do exercício 2 Determine a a probabilidade de que S2 seja maior do que 50 b um valor k tal que PS2 k 0 95 c valores k1 e k2 tal que Pk1 S2 k2 0 95 36 4 De uma população com altura média µ 170cm e desviopadrão populacional σ desconhecido retirase uma amostra de tamanho n 25 Assumindo que as alturas de todos o indivíduos da população são normalmente distribuídas e que o desvio padrão amostral é S 12 determine a a probabilidade da média amostral X ser superior a 180cm b a probabilidade da média amostral X ser inferior a 165cm c o valor k da distribuição de X tal que PX k 0 95 d valores k1 e k2 tal que Pk1 X k2 0 95 5 Seja X1 Xn Nµ σ2 Mostre que a EX µ b VarX σ2 n c ES2 σ2 d VarS2 2σ4 n1 Utilize o resultado W n1S2 σ2 χ2 n1 6 Seja X1 Xn Nµ σ2 para µ 2 R e σ2 2 R A função característica de Xi é ΦXit E eitxi exp n iµt σ2t2 2 o para i 1 n Utilizando a função característica mostre que X N µ σ2 n 7 Seja X1 Xn variáveis aleatórias independentes e identicamente distribuídas com função de distribuição contínua FXx Suponha que EXi µ para i 1 n Considere as variáveis aleatórias Y1 Yn dadas por Yi 8 1 se Xi µ 0 se Xi µ Determine a distribuição de probabilidades de nP i1 Yi 8 Seja Xi para i 1 2 3 variáveis aleatórias independentes com distribuição Ni i2 Utilize estas variáveis para construir estatísticas com as seguintes distribuições de probabilidade a Quiquadrado com 3 graus de liberdade 37 b tStudent com 2 graus de liberdade c F com 1 grau de liberdade no numerador e 2 graus de liberdade no denomina dor 38