1
Estatística 1
FEI
17
Estatística 1
FEI
1
Estatística 1
FEI
36
Estatística 1
FEI
39
Estatística 1
FEI
21
Estatística 1
FEI
3
Estatística 1
FEI
10
Estatística 1
UNICESUMAR
9
Estatística
UFU
2
Estatística
UFU
Texto de pré-visualização
Distribuição amostral da média Distribuição amostral das proporções Fonte MORETTIN LG Estatística Básica Volume único Probabilidade e Inferência Pearson 2010 Todos os direitos reservados Reprodução e divulgação total ou parcial deste documento são expressamente proibidas sem o consentimento formal por escrito da professora autora Framework da Estatística População características Técnicas de Amostragem Amostra Análise Exploratória Conclusões sobre as características da população Inferência Estatística Informações contidas nos dados DISTRIBUIÇÃO AMOSTRAL DOS ESTIMADORES População Parâmetros Amostras Estimadores ou estatísticas ˆ NOTAÇÕES Denominação População Amostra Média μ x Variância σ² s² Número de elementos N n Proporção p p AMOSTRAGEM ALEATÓRIA SIMPLES Representa a maneira mais simples de selecionar uma amostra probabilística de uma população Neste caso os elementos da população têm a mesma probabilidade de seleção DISTRIBUIÇÕES AMOSTRAIS Uma distribuição amostral é a distribuição de probabilidade de uma estatística da amostra que é formada quando amostras de tamanho n são repetidamente colhidas de uma população Se a estatística da amostra for sua média temos uma distribuição amostral da média Se a estatística da amostra for sua proporção temos uma distribuição amostral da proporção DISTRIBUIÇÕES AMOSTRAIS Procedimento para a obtenção de uma distribuição amostral de uma estatística T como por exemplo a média amostral ou a proporção amostral aConsiderar uma população X com determinado parâmetro de interesse b Obter todas as amostras retiradas da população de acordo com certo procedimento c Para cada amostra calcular o valor t da estatística T d Os valores t formam uma nova população cuja distribuição recebe o nome de distribuição amostral de T Informações presentes em Bussab e Morettin 2010 p 273 EXEMPLO Considere uma população finita X 1 2 3 4 5 Vamos determinar EXµ e VARX2 média e variância populacionais EXµ3 e VARX 2 EX2 EX2 1132 2 X PX XPX X2PX 1 02 02 02 2 02 04 08 3 02 06 18 4 02 08 32 5 02 10 5 1 30 11 EXEMPLO Vamos retirar dessa população X 12345 todas as amostras com reposição de tamanho n2 utilizando amostragem casual simples com reposição Amostras Média de cada amostra 11 10 12 15 13 20 14 25 15 30 21 15 22 20 23 25 24 30 25 35 Amostras Média de cada amostra 31 20 32 25 33 30 34 35 35 40 41 25 42 30 43 35 44 40 45 45 Amostras Média de cada amostra 51 30 52 35 53 40 54 45 55 50 x x x EXEMPLO Como a média varia de amostra para amostra é uma variável aleatória discreta Vamos analisar a distribuição de x x x P P 2 P 10 15 20 25 30 35 40 45 50 1 3 10 x x x x x x 25 1 25 2 25 1 25 1 25 2 25 3 25 3 25 3 50 9 25 6 25 12 25 4 25 10 25 25 25 5 25 15 25 45 25 4 25 14 25 49 25 12 25 48 25 9 50 81 25 1 25 5 25 25 RESULTADOS a População X 1 2 3 4 5 EXµ3 e VARX 2 11322 b Média amostral 1 10 3 3 2 2 x x VAR x E x IMPORTANTE A média das médias amostrais ou é igual à média populacional ou seja A variância da média amostral é igual à variância populacional dividida pelo tamanho da amostra ou seja O desvio padrão de ത𝑋 é chamado de erro padrão da média e é dado por EPM𝜎 ത𝑋 𝜎2 𝑛 Demonstração desses resultados na tela 26 Ex x E n VAR x x 2 2 CONCLUSÕES Se X for uma população normal com parâmetros µ e 2 e se dessa população forem retiradas amostras de tamanho n então 2 n x N Se X for uma população não normal com parâmetros µ e 2 e se dela retirarmos uma amostra de tamanho n suficientemente grande então Quanto maior o valor de n melhor será essa aproximação Esse fato resulta do TEOREMA DO LIMITE CENTRAL 2 n N x ANÁLISE VISUAL O teorema do limite central fundamenta o ramo inferencial da estatística Ele nos garante que sob certas condições de regularidade quanto mais observações tivermos ou seja quanto maior o valor de n a distribuição amostral da média de uma variável aleatória se aproxima de uma normal independente do formato original da distribuição Vamos tomar como exemplo a distribuição exponencial estudada no semestre passado cuja função densidade de probabilidade é dada por fxex com x0 Vamos considerar o formato do histograma da exponencial para 1 ANÁLISE VISUAL Vamos analisar a distribuição da média amostral para diferentes valores de n Note que à medida que o n aumenta há maior convergência para a distribuição normal SIMULAÇÃO Agora faremos uma simulação para sedimentarmos essa ideia Entre no link seguinte e selecione Begin está na parte superior à esquerda httponlinestatbookcomstatsimsamplingdistindexhtml NOMENCLATURA Representação Significado μ Média da população x Média da amostra μx Média da média amostral σ² Variância da população s² Variância da amostra σ²x Variância da média amostral σ Desvio padrão da população s Desvio padrão da amostra σx Desvio padrão da média amostral N Tamanho da população n Tamanho da amostra EXEMPLOS 1 Seja X N8026 Dessa população retiramos uma amostra de n25 Calcular 83 P x EXEMPLOS 2 Dimensionamento de amostra Seja X N1200 840 Qual deverá ser o tamanho de uma amostra com reposição de tal forma que 0 90 1204 1196 x P EXERCÍCIOS RESOLUÇÃO APÓS OS ENUNCIADOS 1 Seja X N100 85 Retiramos uma amostra de tamanho n20 Determinar Resp 0984902 105 95 x P 2 Uma variável aleatória X tem distribuição normal com média 100 e desvio padrão 10 Que tamanho deveria ter a amostra para que Resp n4 0 95 110 90 x P EXERCÍCIOS 3 O tempo de vida de certo componente mecânico tem média de 1200 horas e desvio padrão de 80 horas Numa amostra aleatória de 64 desses componentes achar a probabilidade da média amostral a ser superior a 12128 horas R 01003 b diferir em valor absoluto no máximo 15 horas da média real R 08664 RESOLUÇÕES Exercício 1 Exercício 2 RESOLUÇÕES Exercício 3a Exercício 3b Observe que o exercício não afirmou que a população é normal mas como a amostra é grande n64 podemos considerar que a média amostral é aproximadamente normal pelo Teorema do Limite Central CASO ESPECIAL Se a população for finita e de tamanho N conhecido e se a amostra de tamanho n dela retirada for sem reposição então 1 N n N n x Exemplo Seja uma população de 5000 alunos de uma faculdade Sabese que a altura média dos alunos é de 175 cm e o desvio padrão de 5 cm Retirase uma amostra sem reposição de tamanho n100 Calcule a média das médias amostrais e o desvio padrão da média amostral x x 0 495024 1 5000 100 5000 100 5 1 175 N n N n x x Logo EXERCÍCIOS RESOLUÇÃO APÓS OS ENUNCIADOS 1 Suponha que as estaturas dos 4500 estudantes do sexo masculino de uma universidade tenham média de 1725 cm e desvio padrão de 78 cm Retirase uma amostra aleatória sem reposição de 50 estudantes do sexo masculino Achar a média e o desvio padrão da média da amostra Resp 1725 1097 2 Num concurso público no qual participaram 20000 candidatos a nota média foi 42 pontos e o desvio padrão 10 pontos Numa amostra aleatória sem reposição de 196 participantes qual a probabilidade de a média da amostra ser maior do que 4136 pontos Resp 08159 RESOLUÇÃO Exercício 1 Exercício 2 DEMONSTRAÇÃO DOS RESULTADOS 𝐸 ത𝑋 𝜇 e 𝑉𝐴𝑅 ത𝑋 𝜎2 𝑛 Seja X uma população de média µ e variância 𝜎2 da qual se extrai uma amostra aleatória de n elementos X1 X2 Xn Temos que EXiµ e VARXi 𝜎2 Temse também que X1 X2 Xn são independentes Então 𝐸 ത𝑋 𝐸1 𝑛 1 𝑛 𝑋𝑖 1 𝑛 𝐸 1 𝑛 𝑋𝑖 1 𝑛 1 𝑛 𝐸 𝑋𝑖 1 𝑛 1 𝑛 𝜇 1 𝑛 𝑛𝜇 𝜇 𝑉𝐴𝑅 ത𝑋 𝑉𝐴𝑅1 𝑛 1 𝑛 𝑋𝑖 1 𝑛2 1 𝑛 𝑉𝐴𝑅 𝑋𝑖 1 𝑛2 1 𝑛 𝜎2 1 𝑛2 𝑛𝜎2 𝜎2 𝑛 DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO Estudaremos a distribuição amostral da proporção p de sucessos característica que se estuda na população Seja p conhecida A população pode ser definida como uma variável X tal que X1 se o elemento da população tem a característica X0 se o elemento da população não tem a característica PX1p PX0q sendo pq1 Calculando EXµ e VARX 2 temos X PX XPX X2PX 0 q 0 0 1 p p p 1 p p EXµ p e VARX EX2EX2pp2p1ppq DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO Retiramos uma grande amostra x1 x2 xn n dessa população com reposição e definimos x como o número de sucessos na amostra O estimador de p é dado por proporção de sucessos na amostra X Bnp logo EXnp e VARXnpq Lembrar que EkX kEX e VARkXk2 VARX sendo k constante Calculando a esperança e a variância de temos Comparação com os dados da população a População µ p e 2 pq b Proporção amostral n p q p q n n n VAR x p e VAR p n n p n E X n E x E p 1 ˆ 1 1 ˆ 2 n p q p e VAR p E p p p ˆ ˆ ˆ 2 ˆ n p x ˆ n p x ˆ Para grandes amostras a proporção amostral se distribui com média igual à proporção populacional ou seja a variância da proporção amostral é igual à variância da população dividida pelo tamanho da amostra ou seja CONCLUSÃO p E p p ˆ ˆ n p q VAR p p ˆ ˆ 2 ˆ n N p pq p n CASO ESPECIAL Proporção p desconhecida e amostra grande Quando p é desconhecida e a amostra com reposição é grande determinamos Ƹ𝑝 𝑥 𝑛 estimativa de p e 𝜎𝑝 𝑝 𝑞 𝑛 RESUMO μpp σppqn σppqn para grandes amostras e p desconhecido Símbolo Significado p Obs pq1 Proporção da população p Proporção da amostra μp Média da proporção da amostra σp Desvio padrão da proporção amostral n Tamanho da amostra EXEMPLO Suponha que se saiba que em uma certa população humana uma proporção de pessoas igual a p 008 8 seja cega para cores Se fizermos uma amostragem aleatória de 150 indivíduos da população qual a probabilidade de que a proporção de pessoas dessa amostra que seja cega para cores seja menor que 015 Resp aproximadamente 999 ROTEIRO DE ESTUDO Lista no moodle Distribuição amostral Equivalência no livrotexto Exercícios propostos da página 218 ex 1 até 4 Obs os exercícios do livrotexto já estão na lista do moodle Livrotexto MORETTIN LG Estatística Básica Volume único Probabilidade e Inferência Pearson 2010
1
Estatística 1
FEI
17
Estatística 1
FEI
1
Estatística 1
FEI
36
Estatística 1
FEI
39
Estatística 1
FEI
21
Estatística 1
FEI
3
Estatística 1
FEI
10
Estatística 1
UNICESUMAR
9
Estatística
UFU
2
Estatística
UFU
Texto de pré-visualização
Distribuição amostral da média Distribuição amostral das proporções Fonte MORETTIN LG Estatística Básica Volume único Probabilidade e Inferência Pearson 2010 Todos os direitos reservados Reprodução e divulgação total ou parcial deste documento são expressamente proibidas sem o consentimento formal por escrito da professora autora Framework da Estatística População características Técnicas de Amostragem Amostra Análise Exploratória Conclusões sobre as características da população Inferência Estatística Informações contidas nos dados DISTRIBUIÇÃO AMOSTRAL DOS ESTIMADORES População Parâmetros Amostras Estimadores ou estatísticas ˆ NOTAÇÕES Denominação População Amostra Média μ x Variância σ² s² Número de elementos N n Proporção p p AMOSTRAGEM ALEATÓRIA SIMPLES Representa a maneira mais simples de selecionar uma amostra probabilística de uma população Neste caso os elementos da população têm a mesma probabilidade de seleção DISTRIBUIÇÕES AMOSTRAIS Uma distribuição amostral é a distribuição de probabilidade de uma estatística da amostra que é formada quando amostras de tamanho n são repetidamente colhidas de uma população Se a estatística da amostra for sua média temos uma distribuição amostral da média Se a estatística da amostra for sua proporção temos uma distribuição amostral da proporção DISTRIBUIÇÕES AMOSTRAIS Procedimento para a obtenção de uma distribuição amostral de uma estatística T como por exemplo a média amostral ou a proporção amostral aConsiderar uma população X com determinado parâmetro de interesse b Obter todas as amostras retiradas da população de acordo com certo procedimento c Para cada amostra calcular o valor t da estatística T d Os valores t formam uma nova população cuja distribuição recebe o nome de distribuição amostral de T Informações presentes em Bussab e Morettin 2010 p 273 EXEMPLO Considere uma população finita X 1 2 3 4 5 Vamos determinar EXµ e VARX2 média e variância populacionais EXµ3 e VARX 2 EX2 EX2 1132 2 X PX XPX X2PX 1 02 02 02 2 02 04 08 3 02 06 18 4 02 08 32 5 02 10 5 1 30 11 EXEMPLO Vamos retirar dessa população X 12345 todas as amostras com reposição de tamanho n2 utilizando amostragem casual simples com reposição Amostras Média de cada amostra 11 10 12 15 13 20 14 25 15 30 21 15 22 20 23 25 24 30 25 35 Amostras Média de cada amostra 31 20 32 25 33 30 34 35 35 40 41 25 42 30 43 35 44 40 45 45 Amostras Média de cada amostra 51 30 52 35 53 40 54 45 55 50 x x x EXEMPLO Como a média varia de amostra para amostra é uma variável aleatória discreta Vamos analisar a distribuição de x x x P P 2 P 10 15 20 25 30 35 40 45 50 1 3 10 x x x x x x 25 1 25 2 25 1 25 1 25 2 25 3 25 3 25 3 50 9 25 6 25 12 25 4 25 10 25 25 25 5 25 15 25 45 25 4 25 14 25 49 25 12 25 48 25 9 50 81 25 1 25 5 25 25 RESULTADOS a População X 1 2 3 4 5 EXµ3 e VARX 2 11322 b Média amostral 1 10 3 3 2 2 x x VAR x E x IMPORTANTE A média das médias amostrais ou é igual à média populacional ou seja A variância da média amostral é igual à variância populacional dividida pelo tamanho da amostra ou seja O desvio padrão de ത𝑋 é chamado de erro padrão da média e é dado por EPM𝜎 ത𝑋 𝜎2 𝑛 Demonstração desses resultados na tela 26 Ex x E n VAR x x 2 2 CONCLUSÕES Se X for uma população normal com parâmetros µ e 2 e se dessa população forem retiradas amostras de tamanho n então 2 n x N Se X for uma população não normal com parâmetros µ e 2 e se dela retirarmos uma amostra de tamanho n suficientemente grande então Quanto maior o valor de n melhor será essa aproximação Esse fato resulta do TEOREMA DO LIMITE CENTRAL 2 n N x ANÁLISE VISUAL O teorema do limite central fundamenta o ramo inferencial da estatística Ele nos garante que sob certas condições de regularidade quanto mais observações tivermos ou seja quanto maior o valor de n a distribuição amostral da média de uma variável aleatória se aproxima de uma normal independente do formato original da distribuição Vamos tomar como exemplo a distribuição exponencial estudada no semestre passado cuja função densidade de probabilidade é dada por fxex com x0 Vamos considerar o formato do histograma da exponencial para 1 ANÁLISE VISUAL Vamos analisar a distribuição da média amostral para diferentes valores de n Note que à medida que o n aumenta há maior convergência para a distribuição normal SIMULAÇÃO Agora faremos uma simulação para sedimentarmos essa ideia Entre no link seguinte e selecione Begin está na parte superior à esquerda httponlinestatbookcomstatsimsamplingdistindexhtml NOMENCLATURA Representação Significado μ Média da população x Média da amostra μx Média da média amostral σ² Variância da população s² Variância da amostra σ²x Variância da média amostral σ Desvio padrão da população s Desvio padrão da amostra σx Desvio padrão da média amostral N Tamanho da população n Tamanho da amostra EXEMPLOS 1 Seja X N8026 Dessa população retiramos uma amostra de n25 Calcular 83 P x EXEMPLOS 2 Dimensionamento de amostra Seja X N1200 840 Qual deverá ser o tamanho de uma amostra com reposição de tal forma que 0 90 1204 1196 x P EXERCÍCIOS RESOLUÇÃO APÓS OS ENUNCIADOS 1 Seja X N100 85 Retiramos uma amostra de tamanho n20 Determinar Resp 0984902 105 95 x P 2 Uma variável aleatória X tem distribuição normal com média 100 e desvio padrão 10 Que tamanho deveria ter a amostra para que Resp n4 0 95 110 90 x P EXERCÍCIOS 3 O tempo de vida de certo componente mecânico tem média de 1200 horas e desvio padrão de 80 horas Numa amostra aleatória de 64 desses componentes achar a probabilidade da média amostral a ser superior a 12128 horas R 01003 b diferir em valor absoluto no máximo 15 horas da média real R 08664 RESOLUÇÕES Exercício 1 Exercício 2 RESOLUÇÕES Exercício 3a Exercício 3b Observe que o exercício não afirmou que a população é normal mas como a amostra é grande n64 podemos considerar que a média amostral é aproximadamente normal pelo Teorema do Limite Central CASO ESPECIAL Se a população for finita e de tamanho N conhecido e se a amostra de tamanho n dela retirada for sem reposição então 1 N n N n x Exemplo Seja uma população de 5000 alunos de uma faculdade Sabese que a altura média dos alunos é de 175 cm e o desvio padrão de 5 cm Retirase uma amostra sem reposição de tamanho n100 Calcule a média das médias amostrais e o desvio padrão da média amostral x x 0 495024 1 5000 100 5000 100 5 1 175 N n N n x x Logo EXERCÍCIOS RESOLUÇÃO APÓS OS ENUNCIADOS 1 Suponha que as estaturas dos 4500 estudantes do sexo masculino de uma universidade tenham média de 1725 cm e desvio padrão de 78 cm Retirase uma amostra aleatória sem reposição de 50 estudantes do sexo masculino Achar a média e o desvio padrão da média da amostra Resp 1725 1097 2 Num concurso público no qual participaram 20000 candidatos a nota média foi 42 pontos e o desvio padrão 10 pontos Numa amostra aleatória sem reposição de 196 participantes qual a probabilidade de a média da amostra ser maior do que 4136 pontos Resp 08159 RESOLUÇÃO Exercício 1 Exercício 2 DEMONSTRAÇÃO DOS RESULTADOS 𝐸 ത𝑋 𝜇 e 𝑉𝐴𝑅 ത𝑋 𝜎2 𝑛 Seja X uma população de média µ e variância 𝜎2 da qual se extrai uma amostra aleatória de n elementos X1 X2 Xn Temos que EXiµ e VARXi 𝜎2 Temse também que X1 X2 Xn são independentes Então 𝐸 ത𝑋 𝐸1 𝑛 1 𝑛 𝑋𝑖 1 𝑛 𝐸 1 𝑛 𝑋𝑖 1 𝑛 1 𝑛 𝐸 𝑋𝑖 1 𝑛 1 𝑛 𝜇 1 𝑛 𝑛𝜇 𝜇 𝑉𝐴𝑅 ത𝑋 𝑉𝐴𝑅1 𝑛 1 𝑛 𝑋𝑖 1 𝑛2 1 𝑛 𝑉𝐴𝑅 𝑋𝑖 1 𝑛2 1 𝑛 𝜎2 1 𝑛2 𝑛𝜎2 𝜎2 𝑛 DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO Estudaremos a distribuição amostral da proporção p de sucessos característica que se estuda na população Seja p conhecida A população pode ser definida como uma variável X tal que X1 se o elemento da população tem a característica X0 se o elemento da população não tem a característica PX1p PX0q sendo pq1 Calculando EXµ e VARX 2 temos X PX XPX X2PX 0 q 0 0 1 p p p 1 p p EXµ p e VARX EX2EX2pp2p1ppq DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO Retiramos uma grande amostra x1 x2 xn n dessa população com reposição e definimos x como o número de sucessos na amostra O estimador de p é dado por proporção de sucessos na amostra X Bnp logo EXnp e VARXnpq Lembrar que EkX kEX e VARkXk2 VARX sendo k constante Calculando a esperança e a variância de temos Comparação com os dados da população a População µ p e 2 pq b Proporção amostral n p q p q n n n VAR x p e VAR p n n p n E X n E x E p 1 ˆ 1 1 ˆ 2 n p q p e VAR p E p p p ˆ ˆ ˆ 2 ˆ n p x ˆ n p x ˆ Para grandes amostras a proporção amostral se distribui com média igual à proporção populacional ou seja a variância da proporção amostral é igual à variância da população dividida pelo tamanho da amostra ou seja CONCLUSÃO p E p p ˆ ˆ n p q VAR p p ˆ ˆ 2 ˆ n N p pq p n CASO ESPECIAL Proporção p desconhecida e amostra grande Quando p é desconhecida e a amostra com reposição é grande determinamos Ƹ𝑝 𝑥 𝑛 estimativa de p e 𝜎𝑝 𝑝 𝑞 𝑛 RESUMO μpp σppqn σppqn para grandes amostras e p desconhecido Símbolo Significado p Obs pq1 Proporção da população p Proporção da amostra μp Média da proporção da amostra σp Desvio padrão da proporção amostral n Tamanho da amostra EXEMPLO Suponha que se saiba que em uma certa população humana uma proporção de pessoas igual a p 008 8 seja cega para cores Se fizermos uma amostragem aleatória de 150 indivíduos da população qual a probabilidade de que a proporção de pessoas dessa amostra que seja cega para cores seja menor que 015 Resp aproximadamente 999 ROTEIRO DE ESTUDO Lista no moodle Distribuição amostral Equivalência no livrotexto Exercícios propostos da página 218 ex 1 até 4 Obs os exercícios do livrotexto já estão na lista do moodle Livrotexto MORETTIN LG Estatística Básica Volume único Probabilidade e Inferência Pearson 2010