·
Administração ·
Inferência Estatística 1
Send your question to AI and receive an answer instantly
Recommended for you
14
Decomposição da Soma de Quadrados e Tabela de ANOVA
Inferência Estatística 1
UFCG
1
Tabela de Dados e Informações Diversas
Inferência Estatística 1
UFCG
12
Distribuição Amostral da Proporção Exercícios Resolvidos e Teoria
Inferência Estatística 1
UFPB
2
Lista de Exercícios Resolvidos - Distribuição Amostral da Média e TCL
Inferência Estatística 1
UFPB
15
Análise de Correlação e Regressão
Inferência Estatística 1
UFCG
12
Introdução à Regressão Linear e Estimação de Parâmetros
Inferência Estatística 1
UFCG
11
Estatistica Economica - Inferência Estatística e Conceitos Básicos
Inferência Estatística 1
UFPB
1
Estatística Básica - Conteúdo Desorganizado
Inferência Estatística 1
UFCG
24
Distribuições Amostrais - Conceitos e Exemplos Estatísticos
Inferência Estatística 1
UFPB
27
Probabilidades Acumuladas en la Distribución Normal Estándar
Inferência Estatística 1
UFG
Preview text
Unidade V Inferência estatística e distribuição amostral Introdução A inferência estatística tem por objetivo fazer generalização sobre uma população com base em dados de uma amostra As populações são caracterizadas por medidas descritivas numéricas chamadas de parâmetros Muitas pesquisas estatísticas têm por objetivo fazer inferência a respeit o de um ou mais parâmetros da população Essa inferência pode ser por meio de um único valor numérico estimação pontual por uma amplitude de valores numéricos estimação por intervalo ou pelo simples sim ou não teste de hipótese Como exemplo co nsidere uma nova marca de inseticida lançada no mercado A pesquisa estatística pode ter diversos interesses i saber qual dose de inseticida mata 90 dos insetos estimação pontual ii desejar um intervalo com coeficiente 1 α de confiança para que se tenha a mortalidade de 90 dos insetos estimação por intervalo iii ou ainda o interesse poderia focar se o inset icida novo é preferível aos já existentes no mercado teste de hipóteses A estimação pontual utiliza a informação da amostra para chegar a um único valor numérico ou ponto que estima o parâmetro de interesse parâmetro populacional Ex Média Variância Coeficiente de Variação etc A estimação por intervalo utiliza a informação da amostra para chegar a dois números entre os quais se espera encontrar o parâmetro de interesse Caso este intervalo esteja associado a uma probabilidade 1 α temse um intervalo de confiança com coeficiente de confiabilidade de 1 α Enfim a Inferência estatística consiste em fazer afirmações probabilísticas sobre as características do modelo probabilístico que se supõe representar uma população a partir dos dados de uma amostra aleatória desta mesma população Conceitos População é o conjunto de todos os elementos sobre os quais desejamos d esenvolver determinado estudo Amostra é uma parte dos elementos da população ou seja qualquer subconjunto da população Parâmetro é uma medida utilizada para descrever uma característica da população Estatística é uma característica da amostra ou seja uma estatística T é uma função de X 1 X 2 X 3 X n T f X 1 X 2 X 3 X n Estimador é qualquer estatística T f X 1 X 2 X 3 X n utilizada para estimar uma quantia desconhecida Em geral ele é representado por uma determinada fórmula Estimativa é o valor numérico assumido pelo estimador quando os valores observados X 1 X 2 X 3 X n são considerados Os valores das medidasresumo além de resumirem o conjunto de dados constituem uma indicação dos prováveis valores dos parâmetros Assim em estudos baseados em amostras é comum utilizar tais medidas como estatísticas que serão utilizadas para estimar os parâmetros do modelo probabilístico que descreve a população Exemplo Considere um estudo sobre atendimento online em uma empresa que vende camisetas customizadas O interesse é estimar a média de vendas no mês de dezembro por atendente A variável de interesse seria o número de peças vendidas a população seria todos os vendedores mas será utilizad o no estudo apenas uma amostra de tamanho n que será selecionada aleatoriamente da população de vendedores N e sse ca so o p a r â m e tro de int e r e sse é a méd i a popula c io n a l µ a e st a tísti c a é a m é dia a most r a l 𝑋 o estimador será dado pela fórmula da média amostral e a estimativa é o valor da média obtido ao calcular a média amostral com os dados da amostra Parâmetros e estatísticas mais comuns Medidas Parâmetros População Estatísticas Amostra Média 𝑁 1 𝑋 𝑖 𝜇 𝑖 𝑁 𝑛 1 𝑋 𝑖 𝑋 𝑖 𝑛 Variância 𝑵 𝑋 𝑖 𝜇 2 𝜎 2 1 𝑁 𝑛 𝑋 𝑖 𝑋 2 𝑠 2 1 𝑛 Proporção 𝑓 𝑖 𝜋 𝑁 𝑓 𝑖 𝑝 𝑛 Onde N é o número de elementos da população n é o número de elementos da amostra e f i é a frequência de ocorrência de um dos valores de uma variável qualitativa na população ou na amostra As Estatísticas são variáveis aleatórias pois seus valores podem variar dependendo do resultado da amostra Como são variáveis aleatórias elas podem ser caracterizadas por meio de algum modelo probabilístico Esse modelo recebe o nome de distribuição amostral Distribuição amostral Vamos considerar uma população qualquer com um parâmetro θ de interesse e correspondendo a esse par âmetro há uma estatística T em uma amostra Amostras aleatórias são retiradas da população e para cada amostra calculase o valor t da estatística T Teremos então diversos valores de t um para cada amostra Se retirarmos todas as amostras possíveis os valores de t formam uma nova população que segue uma distribuição de probabilidades que é chamada de distribuição amostral de T Exemplo Considere uma população formada por 5 pessoas adultas para as quais foi anotado o peso em kg Vamos extrair amostras aleatórias de tamanho n 3 da população Teremos então 10 combinações de amostras possíveis População Amostras 65 68 656872 Média 6833kg 657258 Média 65kg 687258 Média 66kg 687260 Média 6667kg 72 58 60 656858 Média 6367kg 685860 Média 62kg 656860 Média 6433kg 657260 Média 6567kg 725860 Média 6333kg 655860 Média 61kg Observe que a média populacional é igual a 6460kg mas para cada amostra retirada o cálculo da média resultou um valor diferente A variação no valor médio é esperada porque a seleção amostral é um experimento aleatório Mas essa variação deve ser considerada quando são realizadas as inferências sobre os parâmetros Observe que se tirarmos a méd ia das médias obtidas de cada amostra 6833656110 6460 que é o valor da média populacional Então precisamos conhecer a distribuição amostral da estatística que estamos interessados em calcular para fazer inferências sobre os parâmetros na população Vamos estudar as distribuições amostrais mais utilizadas que são a média de uma variável quantitativa qualquer e a proporção de um dos dois únicos resultados de uma variável qualitativa Distribuição amostral da média A distribuição amostral de uma determinada estatística é a distribuição de todos os possíveis valores que ela pode assumir calculados a partir de todas as possíveis amostras de mesmo tamanho Para determinado tamanho n da amostra tomada de uma populaçã o com média μ o valor da média a mostr a l 𝑋 v a ria de u m a a mostra p a r a outr a A dist ribui çã o a mostr a l da m é dia é d e s c rita p a r a d e t er min a r o Valor Esp e rado E 𝑋 e o D e s v io Padrão 𝜎 𝑋 da distribui çã o d a s médi a s U ma v e z que o D e s v io Padrão indica a acurácia da média da amostra como um estimador por ponto 𝜎 𝑋 é usualmente chamado de Erro Padrão da Média Em geral o Valor Esperado e o Erro Padrão da Média são definidos como E 𝑋 μ n n 𝜎 𝑋 Exemplo Para o exemplo anterior dos pesos de 5 adultos se fizermos o histograma das médias das amostras obteremos Observe como a distribuição das médias amostrais da variável peso pode ser aproximada por um modelo normal apesar de não ter sido falado que a distri buição da variável na população é normal e que o valor esperado das médias amostrais média das médias é igual ao valor da média populacional da variável e a variância das médias amostrais é igual ao valor da variância populacional da variável dividida pelo tamanho da amostra Quanto maior o tamanho da amostra quanto maior n mais o histograma vai se aproximar de um modelo normal independentemente do formato da distribuição da variável na população Esse fato pode ser formalizado com os seguintes teore mas Teorema das combinações lineares Se a variável de interesse segue uma distribuição normal na população a distribuição amostral das médias de amostras aleatórias retiradas desta população também será normal independentemente do tamanho destas amostras Teorema Central do Limite Se a variável de interesse não segue uma distribuição normal na população ou não se sabe qual é a sua distribuição a distribuição amostral das médias de amostras aleatórias retiradas desta população será normal se o tamanho destas amostras for suficientemente grande com uma média igual à média populacional e uma variância igual à variância populacional dividida pelo tamanho da amostra Esse resultado é muito importante porque garante que qualquer distribuição am ostral vai convergir para a distribuição normal que é uma distribuição tabelada Distribuição amostral das proporções Considere uma população em que cada elemento é classificado de acordo com a presença ou ausência de determinada característ ica Por exemplo pessoas classificadas de acordo com o sexo trabalhadores classificados como trabalhador com carteira assinada ou não e assim por diante Em termos de variável aleatória essa população é representada por uma distribuição de Bernoulli isto é X 1 se elemento possui a característica de interesse X 0 se elemento não possui a característica de interesse Denotando por a proporção de elementos da população que possuem a característica de interesse sabemos que PX 1 EX e VarX 𝜎 2 X 1 Em geral esse parâmetro é desconhecido e precisamos estimálo a partir de uma amostra Suponha então que dessa população seja extraída uma amostra aleatória simples X 1 X 2 X n com reposição Essas n extrações correspondem a n variáveis aleatórias de Bernoulli independentes e a soma das 𝑖 1 𝑖 1 variáveis de Bernoulli 𝑆 𝑛 𝑛 𝑋 𝑖 tem distribuição binomial com parâmetros n e p Note que S n dá o número total de sucessos nas n repetições onde o sucesso representa a presença da característica de interesse Como X só assume os valores 0 ou 1 os valores possíveis de S n são 0 1 2 n Com relação à proporção 𝜋 𝑝 de e lem e ntos na a mostra que possuem a c a ra c te r í s ti c a de int e r e s s e temos q u e 𝜋 𝑝 𝑆 𝑛 𝑛 𝑋 1 𝑋 2 𝑋 𝑛 𝑛 E os valores possíveis de p são 0 1 2 𝑛 1 1 e a probabilidade de uma determinada proporção é dada por 𝑘 𝑛 𝑛 𝑛 𝑃 𝜋 𝑃 𝑛 𝑛 𝜋 𝑘 𝑃 𝑆 𝑛 𝑘 M a s a n a li s a ndo a e xp re ssão 𝜋 𝑋 1 𝑋 2 𝑋 𝑛 v e ri f i c a se q u e 𝜋 é a méd i a a mostr a l d e X que tem 𝑛 distribuição de Bernoulli com parâmetro p XBern e sabemos que EX e VarX 1 Logo temse que 𝐸 𝜋 𝐸 𝑋 1 𝑋 2 𝑋 𝑛 1 𝐸 𝑋 𝐸 𝑋 𝐸 𝑋 1 𝑛𝜋 𝜋 𝜋 𝜋 𝜋 𝑛 𝑛 1 2 𝑛 𝑛 𝑛 Como a e sp e r a n ç a do e s t im a dor é o p róp r io p a râmet r o di z se q u e o e sti m a dor 𝜋 que r e p r e s e n t a a p r opor ç ã o amostral é um estimador nãoviesado para a proporção populacional 𝜋 P a ra a v a ri â n c i a te m se que 𝑉𝑎 𝑟 𝜋 𝜎 2 𝜋 𝜋 1 𝜋 que é a v a ri â n c ia de X dividida por n 𝑛 A distribuição de probabilidade é dada por 𝑘 𝑃 𝜋 𝑛 𝑃 𝑆 𝑛 𝑘 Como a proporção amostral é uma média de uma amostra aleatória simples de uma população com distribuição de Bernoulli com parâmetro 𝜋 o Teorema Central do Limite nos diz então que a distribuição da proporção amostral se aproxima de uma normal com média 𝜋 e variância 𝜋 1 𝜋 n Isso significa que a distribuição binomial pode ser considerada aproximadamente normal Mas a aproximação da binomial pela normal é válida se 𝑛𝑝 5 e 𝑛 1 𝑝 5 Exemplo De um lote de produtos manufaturados extraise uma amostra aleatória simples de 100 itens Se 10 dos itens do lote são defeituosos calcule a probabilidade de serem sorteados no máximo 12 itens defeituosos As condições para utilização da aproximação n ormal são válidas com n 100 e p 01 temos que 100 0 1 10 5 100 0 9 90 5 Seja X número de itens defeituosos na amostra Então X bin100 01 e X N10 9 Queremos calcular PX 12 Usando a aproximação da b inomial pela normal considere Y uma va N10 9 temos que 𝑃 𝑋 12 𝑃 𝑌 125 acrescentando 05 para correção de continuidade Usando o excel podemos calcular essa probabilidade padronizando a variável e usando função ou fórmula para achar o valor Aproximação pela Normal 𝑃 𝑌 125 𝑃 𝑍 125 10 3 𝑃 𝑍 083 No excel DISTNORMPN083VERDADEIRO 07967 ou DISTNORMN125103VERDADEIRO 079767 usa os valores originais de Y média e desviopadrão Ou no Bioestat Probabilidade binomial Usando o Bioestat Obtemos o resultado 08018 Observase que utilizando a correção de continuidade a aproximação da binomial pela normal é muito boa semelhante considerando o arredondamento para duas casas decimais
Send your question to AI and receive an answer instantly
Recommended for you
14
Decomposição da Soma de Quadrados e Tabela de ANOVA
Inferência Estatística 1
UFCG
1
Tabela de Dados e Informações Diversas
Inferência Estatística 1
UFCG
12
Distribuição Amostral da Proporção Exercícios Resolvidos e Teoria
Inferência Estatística 1
UFPB
2
Lista de Exercícios Resolvidos - Distribuição Amostral da Média e TCL
Inferência Estatística 1
UFPB
15
Análise de Correlação e Regressão
Inferência Estatística 1
UFCG
12
Introdução à Regressão Linear e Estimação de Parâmetros
Inferência Estatística 1
UFCG
11
Estatistica Economica - Inferência Estatística e Conceitos Básicos
Inferência Estatística 1
UFPB
1
Estatística Básica - Conteúdo Desorganizado
Inferência Estatística 1
UFCG
24
Distribuições Amostrais - Conceitos e Exemplos Estatísticos
Inferência Estatística 1
UFPB
27
Probabilidades Acumuladas en la Distribución Normal Estándar
Inferência Estatística 1
UFG
Preview text
Unidade V Inferência estatística e distribuição amostral Introdução A inferência estatística tem por objetivo fazer generalização sobre uma população com base em dados de uma amostra As populações são caracterizadas por medidas descritivas numéricas chamadas de parâmetros Muitas pesquisas estatísticas têm por objetivo fazer inferência a respeit o de um ou mais parâmetros da população Essa inferência pode ser por meio de um único valor numérico estimação pontual por uma amplitude de valores numéricos estimação por intervalo ou pelo simples sim ou não teste de hipótese Como exemplo co nsidere uma nova marca de inseticida lançada no mercado A pesquisa estatística pode ter diversos interesses i saber qual dose de inseticida mata 90 dos insetos estimação pontual ii desejar um intervalo com coeficiente 1 α de confiança para que se tenha a mortalidade de 90 dos insetos estimação por intervalo iii ou ainda o interesse poderia focar se o inset icida novo é preferível aos já existentes no mercado teste de hipóteses A estimação pontual utiliza a informação da amostra para chegar a um único valor numérico ou ponto que estima o parâmetro de interesse parâmetro populacional Ex Média Variância Coeficiente de Variação etc A estimação por intervalo utiliza a informação da amostra para chegar a dois números entre os quais se espera encontrar o parâmetro de interesse Caso este intervalo esteja associado a uma probabilidade 1 α temse um intervalo de confiança com coeficiente de confiabilidade de 1 α Enfim a Inferência estatística consiste em fazer afirmações probabilísticas sobre as características do modelo probabilístico que se supõe representar uma população a partir dos dados de uma amostra aleatória desta mesma população Conceitos População é o conjunto de todos os elementos sobre os quais desejamos d esenvolver determinado estudo Amostra é uma parte dos elementos da população ou seja qualquer subconjunto da população Parâmetro é uma medida utilizada para descrever uma característica da população Estatística é uma característica da amostra ou seja uma estatística T é uma função de X 1 X 2 X 3 X n T f X 1 X 2 X 3 X n Estimador é qualquer estatística T f X 1 X 2 X 3 X n utilizada para estimar uma quantia desconhecida Em geral ele é representado por uma determinada fórmula Estimativa é o valor numérico assumido pelo estimador quando os valores observados X 1 X 2 X 3 X n são considerados Os valores das medidasresumo além de resumirem o conjunto de dados constituem uma indicação dos prováveis valores dos parâmetros Assim em estudos baseados em amostras é comum utilizar tais medidas como estatísticas que serão utilizadas para estimar os parâmetros do modelo probabilístico que descreve a população Exemplo Considere um estudo sobre atendimento online em uma empresa que vende camisetas customizadas O interesse é estimar a média de vendas no mês de dezembro por atendente A variável de interesse seria o número de peças vendidas a população seria todos os vendedores mas será utilizad o no estudo apenas uma amostra de tamanho n que será selecionada aleatoriamente da população de vendedores N e sse ca so o p a r â m e tro de int e r e sse é a méd i a popula c io n a l µ a e st a tísti c a é a m é dia a most r a l 𝑋 o estimador será dado pela fórmula da média amostral e a estimativa é o valor da média obtido ao calcular a média amostral com os dados da amostra Parâmetros e estatísticas mais comuns Medidas Parâmetros População Estatísticas Amostra Média 𝑁 1 𝑋 𝑖 𝜇 𝑖 𝑁 𝑛 1 𝑋 𝑖 𝑋 𝑖 𝑛 Variância 𝑵 𝑋 𝑖 𝜇 2 𝜎 2 1 𝑁 𝑛 𝑋 𝑖 𝑋 2 𝑠 2 1 𝑛 Proporção 𝑓 𝑖 𝜋 𝑁 𝑓 𝑖 𝑝 𝑛 Onde N é o número de elementos da população n é o número de elementos da amostra e f i é a frequência de ocorrência de um dos valores de uma variável qualitativa na população ou na amostra As Estatísticas são variáveis aleatórias pois seus valores podem variar dependendo do resultado da amostra Como são variáveis aleatórias elas podem ser caracterizadas por meio de algum modelo probabilístico Esse modelo recebe o nome de distribuição amostral Distribuição amostral Vamos considerar uma população qualquer com um parâmetro θ de interesse e correspondendo a esse par âmetro há uma estatística T em uma amostra Amostras aleatórias são retiradas da população e para cada amostra calculase o valor t da estatística T Teremos então diversos valores de t um para cada amostra Se retirarmos todas as amostras possíveis os valores de t formam uma nova população que segue uma distribuição de probabilidades que é chamada de distribuição amostral de T Exemplo Considere uma população formada por 5 pessoas adultas para as quais foi anotado o peso em kg Vamos extrair amostras aleatórias de tamanho n 3 da população Teremos então 10 combinações de amostras possíveis População Amostras 65 68 656872 Média 6833kg 657258 Média 65kg 687258 Média 66kg 687260 Média 6667kg 72 58 60 656858 Média 6367kg 685860 Média 62kg 656860 Média 6433kg 657260 Média 6567kg 725860 Média 6333kg 655860 Média 61kg Observe que a média populacional é igual a 6460kg mas para cada amostra retirada o cálculo da média resultou um valor diferente A variação no valor médio é esperada porque a seleção amostral é um experimento aleatório Mas essa variação deve ser considerada quando são realizadas as inferências sobre os parâmetros Observe que se tirarmos a méd ia das médias obtidas de cada amostra 6833656110 6460 que é o valor da média populacional Então precisamos conhecer a distribuição amostral da estatística que estamos interessados em calcular para fazer inferências sobre os parâmetros na população Vamos estudar as distribuições amostrais mais utilizadas que são a média de uma variável quantitativa qualquer e a proporção de um dos dois únicos resultados de uma variável qualitativa Distribuição amostral da média A distribuição amostral de uma determinada estatística é a distribuição de todos os possíveis valores que ela pode assumir calculados a partir de todas as possíveis amostras de mesmo tamanho Para determinado tamanho n da amostra tomada de uma populaçã o com média μ o valor da média a mostr a l 𝑋 v a ria de u m a a mostra p a r a outr a A dist ribui çã o a mostr a l da m é dia é d e s c rita p a r a d e t er min a r o Valor Esp e rado E 𝑋 e o D e s v io Padrão 𝜎 𝑋 da distribui çã o d a s médi a s U ma v e z que o D e s v io Padrão indica a acurácia da média da amostra como um estimador por ponto 𝜎 𝑋 é usualmente chamado de Erro Padrão da Média Em geral o Valor Esperado e o Erro Padrão da Média são definidos como E 𝑋 μ n n 𝜎 𝑋 Exemplo Para o exemplo anterior dos pesos de 5 adultos se fizermos o histograma das médias das amostras obteremos Observe como a distribuição das médias amostrais da variável peso pode ser aproximada por um modelo normal apesar de não ter sido falado que a distri buição da variável na população é normal e que o valor esperado das médias amostrais média das médias é igual ao valor da média populacional da variável e a variância das médias amostrais é igual ao valor da variância populacional da variável dividida pelo tamanho da amostra Quanto maior o tamanho da amostra quanto maior n mais o histograma vai se aproximar de um modelo normal independentemente do formato da distribuição da variável na população Esse fato pode ser formalizado com os seguintes teore mas Teorema das combinações lineares Se a variável de interesse segue uma distribuição normal na população a distribuição amostral das médias de amostras aleatórias retiradas desta população também será normal independentemente do tamanho destas amostras Teorema Central do Limite Se a variável de interesse não segue uma distribuição normal na população ou não se sabe qual é a sua distribuição a distribuição amostral das médias de amostras aleatórias retiradas desta população será normal se o tamanho destas amostras for suficientemente grande com uma média igual à média populacional e uma variância igual à variância populacional dividida pelo tamanho da amostra Esse resultado é muito importante porque garante que qualquer distribuição am ostral vai convergir para a distribuição normal que é uma distribuição tabelada Distribuição amostral das proporções Considere uma população em que cada elemento é classificado de acordo com a presença ou ausência de determinada característ ica Por exemplo pessoas classificadas de acordo com o sexo trabalhadores classificados como trabalhador com carteira assinada ou não e assim por diante Em termos de variável aleatória essa população é representada por uma distribuição de Bernoulli isto é X 1 se elemento possui a característica de interesse X 0 se elemento não possui a característica de interesse Denotando por a proporção de elementos da população que possuem a característica de interesse sabemos que PX 1 EX e VarX 𝜎 2 X 1 Em geral esse parâmetro é desconhecido e precisamos estimálo a partir de uma amostra Suponha então que dessa população seja extraída uma amostra aleatória simples X 1 X 2 X n com reposição Essas n extrações correspondem a n variáveis aleatórias de Bernoulli independentes e a soma das 𝑖 1 𝑖 1 variáveis de Bernoulli 𝑆 𝑛 𝑛 𝑋 𝑖 tem distribuição binomial com parâmetros n e p Note que S n dá o número total de sucessos nas n repetições onde o sucesso representa a presença da característica de interesse Como X só assume os valores 0 ou 1 os valores possíveis de S n são 0 1 2 n Com relação à proporção 𝜋 𝑝 de e lem e ntos na a mostra que possuem a c a ra c te r í s ti c a de int e r e s s e temos q u e 𝜋 𝑝 𝑆 𝑛 𝑛 𝑋 1 𝑋 2 𝑋 𝑛 𝑛 E os valores possíveis de p são 0 1 2 𝑛 1 1 e a probabilidade de uma determinada proporção é dada por 𝑘 𝑛 𝑛 𝑛 𝑃 𝜋 𝑃 𝑛 𝑛 𝜋 𝑘 𝑃 𝑆 𝑛 𝑘 M a s a n a li s a ndo a e xp re ssão 𝜋 𝑋 1 𝑋 2 𝑋 𝑛 v e ri f i c a se q u e 𝜋 é a méd i a a mostr a l d e X que tem 𝑛 distribuição de Bernoulli com parâmetro p XBern e sabemos que EX e VarX 1 Logo temse que 𝐸 𝜋 𝐸 𝑋 1 𝑋 2 𝑋 𝑛 1 𝐸 𝑋 𝐸 𝑋 𝐸 𝑋 1 𝑛𝜋 𝜋 𝜋 𝜋 𝜋 𝑛 𝑛 1 2 𝑛 𝑛 𝑛 Como a e sp e r a n ç a do e s t im a dor é o p róp r io p a râmet r o di z se q u e o e sti m a dor 𝜋 que r e p r e s e n t a a p r opor ç ã o amostral é um estimador nãoviesado para a proporção populacional 𝜋 P a ra a v a ri â n c i a te m se que 𝑉𝑎 𝑟 𝜋 𝜎 2 𝜋 𝜋 1 𝜋 que é a v a ri â n c ia de X dividida por n 𝑛 A distribuição de probabilidade é dada por 𝑘 𝑃 𝜋 𝑛 𝑃 𝑆 𝑛 𝑘 Como a proporção amostral é uma média de uma amostra aleatória simples de uma população com distribuição de Bernoulli com parâmetro 𝜋 o Teorema Central do Limite nos diz então que a distribuição da proporção amostral se aproxima de uma normal com média 𝜋 e variância 𝜋 1 𝜋 n Isso significa que a distribuição binomial pode ser considerada aproximadamente normal Mas a aproximação da binomial pela normal é válida se 𝑛𝑝 5 e 𝑛 1 𝑝 5 Exemplo De um lote de produtos manufaturados extraise uma amostra aleatória simples de 100 itens Se 10 dos itens do lote são defeituosos calcule a probabilidade de serem sorteados no máximo 12 itens defeituosos As condições para utilização da aproximação n ormal são válidas com n 100 e p 01 temos que 100 0 1 10 5 100 0 9 90 5 Seja X número de itens defeituosos na amostra Então X bin100 01 e X N10 9 Queremos calcular PX 12 Usando a aproximação da b inomial pela normal considere Y uma va N10 9 temos que 𝑃 𝑋 12 𝑃 𝑌 125 acrescentando 05 para correção de continuidade Usando o excel podemos calcular essa probabilidade padronizando a variável e usando função ou fórmula para achar o valor Aproximação pela Normal 𝑃 𝑌 125 𝑃 𝑍 125 10 3 𝑃 𝑍 083 No excel DISTNORMPN083VERDADEIRO 07967 ou DISTNORMN125103VERDADEIRO 079767 usa os valores originais de Y média e desviopadrão Ou no Bioestat Probabilidade binomial Usando o Bioestat Obtemos o resultado 08018 Observase que utilizando a correção de continuidade a aproximação da binomial pela normal é muito boa semelhante considerando o arredondamento para duas casas decimais