·

Administração ·

Estatística da Administração

Send your question to AI and receive an answer instantly

Ask Question

Preview text

Como selecionar uma amostra Distribuição amostral da média Distribuição amostral das proporções Fonte MORETTIN LG Estatística Básica Volume único Probabilidade e Inferência Pearson 2010 Produção Profa Mônica Karrer e Profa Flainer Rosa de Lima Distribuição amostral dos estimadores População Parâmetros teta Amostras Estimadores ou estatísticas ˆ Notações Esperança e Variância Propriedades Principais Esperança Matemática Variância 1 Ekk k constante 1 VARk0 k constante 2 EkXkEX k constante 2 VARkXk2VARX 3 EXYEXEY 3 VARaXba2VARX a e b constantes 4 EXYEXEY 5 EX1X2XnEX1EX2EXn 6 EaXbaEXb a e b constantes 7 EXµx0 Distribuição de probabilidade Casos Esperança Matemática Variância discreto VARXEX2EX2 ou contínuo VARXEX2EX2 ou n i i i x p x X E 1 2 1 1 2 VARX n i i i n i i i x p x p x x x f x dx E X 2 2 VARX x f x dx f x dx x Como selecionar uma amostra Procedimentos científicos de obtenção de dados amostrais Levantamentos amostrais a amostra é obtida de uma população bem definida por meio de processos bem protocolados e controlados pelo pesquisador Estes podem ser classificados em levantamentos probabilísticos ou nãoprobabilísticos Os levantamentos probabilísticos reúnem técnicas que usam mecanismos aleatórios de seleção dos elementos de uma amostra atribuindo a cada um deles uma probabilidade conhecida a priori de pertencer à amostra Ex identificar a proporção de indivíduos favoráveis a um projeto Planejamento de experimentos neste caso o principal objetivo é o de analisar o efeito de uma variável sobre outra requerendo interferências do pesquisador sobre o ambiente em estudo bem como o controle de fatores externos com o intuito de medir o efeito desejado Ex Testar se um novo medicamento é eficaz Levantamentos observacionais os dados são normalmente coletados sem que o pesquisador tenha controle sobre as informações obtidas Por exemplo se quisermos prever as vendas de uma empresa em função de vendas passadas os dados são as vendas efetivamente ocorridas Informações presentes em Bussab e Morettin 2010 p 267268 Amostragem aleatória simples Representa a maneira mais fácil de selecionar uma amostra probabilística de uma população Neste caso os elementos da população têm a mesma probabilidade de seleção Em nosso curso normalmente o plano amostral considerado será o de amostragem aleatória simples com reposição Distribuições amostrais Procedimento para a obtenção de uma distribuição amostral de uma estatística T como por exemplo a média amostral ou a variância amostral aConsiderar uma população X com determinado parâmetro de interesse b Obter todas as amostras retiradas da população de acordo com certo procedimento c Para cada amostra calcular o valor t da estatística T d Os valores t formam uma nova população cuja distribuição recebe o nome de distribuição amostral de T Informações presentes em Bussab e Morettin 2010 p 273 De uma população X tiramos uma amostra de tamanho n constituída pelos elementos x1 x2 xn Estimador da média µ populacional na amostra Estimador da variância populacional 2 na amostra Distribuição amostral da média n i ix n x 1 1 2 1 2 1 1 n i i x x n s n i n i i i x n x n s 1 2 1 2 2 1 1 1 ou Exemplo Considere uma população finita X 1 2 3 4 5 Vamos determinar EXµ e VARX2 média e variância populacionais EXµ3 e VARX 2 EX2 EX2 1132 2 X PX XPX X2PX 1 02 02 02 2 02 04 08 3 02 06 18 4 02 08 32 5 02 10 5 1 30 11 Exemplo Vamos retirar dessa população X 12345 todas as amostras com reposição de tamanho n2 amostragem casual simples com reposição Amostras Média de cada amostra 11 10 12 15 13 20 14 25 15 30 21 15 22 20 23 25 24 30 25 35 Amostras Média de cada amostra 31 20 32 25 33 30 34 35 35 40 41 25 42 30 43 35 44 40 45 45 Amostras Média de cada amostra 51 30 52 35 53 40 54 45 55 50 x x x Exemplo Como a média varia de amostra para amostra é uma variável aleatória discreta Vamos analisar a distribuição de x x x P P 2 P 10 15 20 25 30 35 40 45 50 1 3 10 x x x x x x 25 1 25 2 25 1 25 1 25 2 25 3 25 3 25 3 50 9 25 6 25 12 25 4 25 10 25 25 25 5 25 15 25 45 25 4 25 14 25 49 25 12 25 48 25 9 50 81 25 1 25 5 25 25 Comparação com a média e a variância populacional a na população X 1 2 3 4 5 EXµ3 e VARX 2 11322 b na amostra 1 3 10 3 2 2 x x VAR x E x IMPORTANTE A média das médias amostrais ou é igual à média populacional ou seja A variância da média amostral é igual à variância populacional dividida pelo tamanho da amostra ou seja Ex x E n VAR x x 2 2 Conclusões Se X é uma população normal com parâmetros µ e 2 e se dessa população forem retiradas amostras de tamanho n então 2 n x N Se X é uma população não normal com parâmetros µ e 2 e se dela retirarmos uma amostra de tamanho n suficientemente grande então Esse fato resulta do TEOREMA DO LIMITE CENTRAL Se a população original tem uma distribuição próxima da normal a convergência é rápida Se a população original se afasta muito de uma normal necessitamos de uma amostra maior para que tenha uma distribuição aproximadamente normal 2 n N x x Teorema do Limite Central Observações Importantes O teorema central do limite é um teorema fundamental de probabilidade e estatísticas O teorema descreve a distribuição da média de uma amostra aleatória de uma população com variância finita Quando o tamanho amostral é suficientemente grande a distribuição da média é uma distribuição aproximadamente normal O teorema aplicase independentemente da forma da distribuição da população Muitos procedimentos estatísticos comuns requerem que os dados sejam aproximadamente normais Teorema do Limite Central Observações Importantes O teorema central do limite permite a aplicação destes procedimentos úteis a populações que são fortemente nãonormais Quão grande o tamanho amostral deve ser depende da forma da distribuição original Se a distribuição da população for simétrica um tamanho amostral de 5 poderia render uma boa aproximação Se a distribuição da população for fortemente assimétrica será necessária uma amostra maior De modo geral a distribuição da média pode ser aproximadamente normal se o tamanho amostral for maior do que 30 Teorema do Limite Central Teorema do Limite Central Graças ao teorema do limite central quando calculase uma média filhos por pessoa ou uma proporção de pessoas com casa própria de uma amostra podemos saber qual é a probabilidade de que o universo tenha esse mesmo valor ou um valor parecido O valor que calcularmos para a amostra será o mais provável para o nosso universo e conforme nos distanciamos deste valor para cima ou para baixo estes serão valores cada vez menos prováveis DESVIO PADRÃO AMOSTRAL AMOSTRA COM REPOSIÇÃO Exemplo 1 a 1 Seja X N8026 em que 80 é a média de ligações atendidas semanalmente Dessa população retiramos uma amostra de n25 operadores de telemarketing a Calcular a probabilidade de encontrarmos mais de 83 ligações atendidas Solução 1 Da população sabemos que µ80 226 e 2 Da amostra temos que Logo a média amostral tem distribuição normal com média 80 e variância 3 Então ou seja a probabilidade de encontrarmos operadores que atendem mais de 83 ligações é de 01641 83 x P 26 510 1 02 25 26 25 26 80 2 2 x x x n 25 26 2 94 02 1 80 83 x x x Z 0 001641 0 498359 50 2 94 83 P Z x P x Tabela N01 Exemplo 1 b b Calcule Solução 82 x P 196 02 1 80 82 x x x Z 0 975002 0 475002 50 1 96 82 P Z x P Resp A probabilidade de encontrarmos um operador que atenda menos de 82 ligações é de 975 Tabela N01 Exemplo 1 c c Calcule 0 9545 0 4772502 2 2 02 1 80 04 82 02 1 80 96 77 8204 7796 02 12 80 02 12 80 2 2 Z P Z P x P x P x P x x 2 x 2 P x x Solução Exemplo 2 105 95 x P 1 Da população sabemos que µ100 285 2 Da amostra temos que 2 0615 20 85 20 85 100 2 2 x x x n 2 43 0615 2 100 105 2 43 0615 2 100 95 x x x x x Z x Z 0 984902 492451 02 2 43 2 43 105 95 Z P x P Mesma área 2 Seja X N100 85 em que 100 é a média de internações de crianças em um hospital diariamente Retiramos uma amostra de tamanho n20 dias Determinar a probabilidade de encontrarmos de 95 a 105 crianças Resp 0984902 Solução 3 Exemplo 3 a 3 O tempo de vida de certo componente mecânico tem média de 1200 horas e desvio padrão de 80 horas Numa amostra aleatória de 64 desses componentes achar a probabilidade da média amostral a ser superior a 12128 horas Resp 01003 10 64 80 64 80 1212 8 2 x X P 0100273 0 399727 50 1 28 0 399727 1 28 10 1200 8 1212 Z P z Z Solução Exemplo 3 b b diferir em valor absoluto no máximo 15 horas da média real Resp 08664 0 866386 433193 02 51 2 0 51 51 51 10 1215 1200 51 10 1200 1185 1 1 Z P Z P Z Z PX120015 P15 X 1200 15 P1200 15 X 1200 15 P1185 X 1215 Solução Dimensionamento de uma amostra Se você tem o nível de confiança 1 α a média e a variância encontrar o tamanho da amostra por meio Se você tem o nível de confiança 1 α e o ERRO ESTIMADO encontre o tamanho da amostra por meio n Se você tem o tamanho da POPULAÇÃO N e o ERRO ESTIMADO encontre o tamanho da amostra por meio Dimensionamento de uma amostra Exemplo 1 1 Seja X N1200 840 em que 1200 é a média de quilos que um carreto transporta Qual deverá ser o tamanho de uma amostra de tal forma que o carreto transporte mais de 1196kg a menos de 1204kg sendo que a probabilidade deste fato ocorrer é de 90 1 Da população µ1200 e 2840 2 Da amostra Situação z 090 2 045 dentro tabela Zcrit 164 então Resolvendo uma das duas equações obtémse n14113 logo n 142 objetos 0 90 1204 1196 x P n n n x x x 840 840 1200 2 2 n n 840 1204 1200 1 64 ou 840 1196 1200 1 64 Solução 1196 1200 1204 Exemplo 1 164 4 840595n n 14117 142 amostras 2 Uma empresa recebe em média trimestralmente 100 currículos com um desvio padrão de 10 currículos Qual a quantidade de pessoas amostra a empresa deve recrutar para analisar os currículos uma vez que provavelmente há 95 de certeza que a mesma receba mais de 90 e menos de 110 currículos em um trimestre Resp n 4 funcionários Solução P90 x 110 095 n z 0952 0475 Zcrit 196 σx 10²n Exemplo 2 196 10 100260308n n 384 4 amostras O tempo de vida de certo componente mecânico tem média de 1200 horas e desvio padrão de 80 horas Numa amostra aleatória de 64 desses componentes achar a probabilidade da média amostral a ser superior a 12128 horas R 01003 n 64 População μ 1200h σ 80h Amostra com reposição μₓ 1200h σ²ₓ σ²n 80²64 100 σ 100 10 PX 12128 Z 12128 120010 128 tabela z 0399727 PX 12128 PZ 128 05 0399727 0100273 Exemplo 3 O tempo de vida de certo componente mecânico tem média de 1200 horas e desvio padrão de 80 horas Numa amostra aleatória de 64 desses componentes achar a probabilidade da média amostral b diferir em valor absoluto no máximo 15 horas da média real R 08664 Caso especial Se a população for fina e de tamanho N conhecido e se a amostra de tamanho n dela retirada for sem reposição então σₓ σ²n NnN1 σₓ σ²n NnN1 σₓ σ²n NnN1 σₓ σn NnN1 Z x μₓσₓ Z x μₓσ²n NnN1 DESVIO PADRÃO AMOSTRAL AMOSTRA COM REPOSIÇÃO σₓ σ²n σₓ σ²n σₓ σn AMOSTRA SEM REPOSIÇÃO σₓ σ²n NnN1 σₓ σ²n NnN1 σₓ σn NnN1 Caso especial EXEMPLO Seja uma população de 5000 alunos de uma faculdade Sabese que a altura média dos alunos é de 175 cm e o desvio padrão de 5 cm Retirase uma amostra sem reposição de tamanho n100 Calcule a média das médias amostrais μ e o desvio padrão da média amostral σ Solução σ² x σ²n NnN1 σ²n NnN1 σn NnN1 μ μ 175 σ σn NnN1 5100 500010050001 0495024 Exercício 1 a Suponha que as estaturas dos 4500 estudantes do sexo masculino de uma universidade tenha média de 1725 cm e desvio padrão de 78 cm 80 amostras aleatórias cada uma com 50 estudantes do sexo masculino são selecionadas sem reposição a Achar a média e o desvio padrão da média de cada amostra Resp 1725 1097 Solução σ² x σ²n NnN1 σ²n NnN1 σn NnN1 μ μ 1725 σ σn NnN1 7850 45005045001 109706 Exercício 1 b b Qual deverá ser o tamanho da amostra sem reposição considerando a população de 4500 alunos de tal forma que P1695 X 1755 095 Solução z 0952 0475 Zcrit 196 196 3782n 4500n45001 196 782²n 4500n45001 3196 782²n 4500n45001 3196² 782² 4500nn 23428001352 4500nn 1732436 4500n 1732436n 4500 1732436n n 4500 1742436n n 45001742436 n 26 amostras Num concurso público no qual participaram 30000 candidatos a nota média foi de 42 pontos e o desvio padrão de 10 pontos Numa amostra aleatória sem reposição de 225 participantes qual a probabilidade da média amostral ser maior do que 40 pontos μx μ 42 σx σ n N n N 1 10 225 06642 Z xμx σx Z xμx σ2 nNn N1 Z 4042 06642 301 tabela z 04987 PX 40 PZ 301 05 04987 09987 Considere X uma população normal com média igual a 1200 e a variância igual a 400 Qual deverá ser o tamanho da amostra sem reposição considerando uma população de 25000 objetos de tal forma que P1194 X 1206 090 R 30 Solução z 090 2 045 Zcrit 164 164 1206 1200 400 n 25000n 250001 164 400 n 25000 6 25000 n 8502785n 25000 8502785n n 25000 8512785n n 25000 8512785 30 amostras Distribuição amostral das proporções Estudaremos a distribuição amostral da proporção p de sucessos característica que se estuda na população Seja p conhecida A população pode ser definida como uma variável X tal que X1 se o elemento da população tem a característica X0 se o elemento da população não tem a característica PX1p PX0q sendo pq1 Calculando EXµ e VARX 2 temos X PX XPX X2PX 0 q 0 0 1 p p p 1 p p EXµ p e VARX EX2EX2pp2p1ppq Distribuição amostral dos estimadores Retiramos uma grande amostra x1 x2 xn n dessa população com reposição e definimos x como o número de sucessos na amostra O estimador de p é dado por proporção de sucessos na amostra X Bnp logo EXnp e VARXnpq Calculando a esperança e a variância de temos n p x ˆ pˆ Comparação com os dados da população a População µ p e 2 pq b Amostra n p q p q n n n VAR x p e VAR p n n p n E X n E x E p 1 ˆ 1 1 ˆ 2 n p q p e VAR p E p p p ˆ ˆ 2 ˆ ˆ Para grandes amostras com reposição a proporção amostral se distribui com média igual à proporção populacional ou seja a variância da proporção amostral é igual à variância da população dividida pelo tamanho da amostra ou seja ou seja é aproximadamente normal com média p e variância Conclusão p E p p ˆ ˆ n p q VAR p p ˆ 2 ˆ ˆ n N p pq p n n q p pˆ Caso especial p desconhecida e amostra grande Para população finita usamos o fator de correção Quando p é desconhecida e a amostra é grande determinamos estimativa de p e Adotaremos que uma amostra é suficientemente grande quando np 5 e nq 5 n po x ˆ n q p o o p ˆ ˆ ˆ 1 ˆ ˆ ˆ N n N n q p o o p Em uma população a proporção de pessoas favoráveis a uma determinada lei é de 40 Retiramos uma amostra de 300 pessoas dessa população Determinar Pp zcrit σp p p zcrit σp 095 para as pessoas favoráveis a lei Solução p04 e q06 z 095 2 0475 dentro tabela Zcrit 196 n 300 μp p 04 σp2 pq n 0406 300 00008 logo σp 00008 00283 P04 19600283 p 04 19600283 095 P03445 p 04555 095 Desejase saber qual a proporção de pessoas da população portadoras de determinada doença Retirase uma amostra de 400 pessoas obtendose 8 portadores da doença Uma roleta está dividida em quatro partes nas cores verde amarelo branco e preto Considere uma particular amostra de 400 giros Seja p a variável proporção amostral de paradas no amarelo Determine p 0275 R 08749 RESUMO População X Nμ σ² EX from i1 to n xipxi σ² from i1 to n xi²pxi from i1 to n xipxi² Amostra COM Reposição X Nμx σ²n μx μ σ²x σ²n Amostra SEM Reposição X Nμx σ²n NN1 μx μ σ²x σ²n NN1 σx σ²n NnN1 σ² NnN1 PROPORÇÃO Média μP p σ²P pq População X Np σ²P Amostra COM Reposição X Nμp pqn μp p σ²p pqn Amostra SEM Reposição X Nμp pqn NnN1 μp p σ²p pqn NnN1 σp pqn NnN1 pqNnnN1