·
Administração ·
Probabilidade e Estatística 1
Send your question to AI and receive an answer instantly
Recommended for you
7
Lista de Exercícios - Espaço Amostral e Probabilidade
Probabilidade e Estatística 1
UFPA
5
Lista de Exercícios Modelos Probabilísticos - Estatística e Probabilidade
Probabilidade e Estatística 1
UFPA
14
Lista de Exercícios Resolvidos - Estatística e Probabilidade - Medidas de Ordenamento e Posição
Probabilidade e Estatística 1
UFPA
43
Metrologia Aplicada na Industria de Petroleo e Gas - Regras de Compatibilizacao e Arredondamento
Probabilidade e Estatística 1
UFPA
1
Especificações Técnicas do Equipamento de Controle de Temperatura
Probabilidade e Estatística 1
UFPA
35
Metrologia na Industria de Petroleo e Gas - Estimativa de Incerteza e Correcao de Medicoes
Probabilidade e Estatística 1
UFPA
21
Metrologia na Industria de Petroleo e Gas - Mensurando Invariavel e Variavel
Probabilidade e Estatística 1
UFPA
21
Metrologia Aplicada Industria Petroleo e Gas Mensurando Invariavel e Variavel
Probabilidade e Estatística 1
UFPA
4
Distribuicao Gaussiana ou Normal - Caracteristicas Parametros e Aplicacoes
Probabilidade e Estatística 1
UFPA
43
Metrologia Aplicada na Industria de Petroleo e Gas - Regras de Compatibilizacao de Valores
Probabilidade e Estatística 1
UFPA
Preview text
UNIVERSIDADE FEDERAL DO PARÁ PROGRAMA DE PÓSGRADUAÇÃO EM ADMINISTRAÇÃO PPGAD Disciplina Estatística Aplicada à Administração Profa Marinalva Maciel Unidade IV Modelos Probabilísticos Por causa de sua natureza aleatória não é possível prever com exatidão a ocorrência do valor de uma observação específica dessa variável Entretanto é possível prever uma estrutura de variação destas observações Esta estrutura é dada por modelos de probabilidade que nos dão o comportamento probabilístico de variáveis aleatórias e servem para calcular probabilidades Ou seja o modelo probabilístico é a descrição matemática de um fenômeno aleatório Um modelo probabilístico é uma representação para a distribuição da variável aleatória por esse motivo usualmente eles são chamados de distribuições Existem vários modelos probabilísticos tanto para variáveis discretas como para variáveis contínuas mas serão aqui estudados os mais usuais na área de administração 41 Modelos probabilísticos para variáveis discretas 411 Modelo Binomial Usase o termo binomial para designar situações em que os resultados de uma variável aleatória podem ser grupados em duas classes ou categorias Essa distribuição é usada quando estamos interessados na ocorrência de um evento e não na sua magnitude Ex produtos manufaturados classificados como perfeitos ou defeituosos As categorias devem ser mutuamente exclusivas e as classes devem ser coletivamente exaustivas É comum referirmonos às duas categorias de uma distribuição binomial como sucesso ou fracasso A utilização da distribuição binomial exige certas hipóteses 1 Há n observações 2 As n observações são idênticas 3 Cada observação enquadrase em apenas uma de duas categorias sucesso ocorre o evento de interesse ou fracasso 4 as probabilidades de sucesso p é a mesma para cada observação Cada uma dos n resultados da variável aleatória observação é denominada um ensaio de Bernoulli considerada também uma va discreta que correspondem a experimentos nos quais os resultados possíveis apresentam ou não uma determinada característica Ex lançar uma moeda e observar o resultado Outros exemplos de ensaios de Bernoulli são uma venda é efetuada ou não em uma ligação de call center um contribuinte pode ser adimplente ou inadimplente uma peça fabricada tem algum defeito ou não uma guia recolhida pode ter seu preenchimento ocorrido de forma correta ou incorreta e um consumidor que entra em uma loja pode comprar ou não comprar um produto Para eventos desse tipo podemos definir uma v a que assume apenas dois valores o valor 1 se ocorre sucesso e o valor 0 se ocorre fracasso A probabilidade de sucesso é denotada por p isto é Psucesso p 0 p 1 X 0 1 Total Px 1p p 1 Usando a definição de Esperança temos EX p VX p p2 p1 p Na distribuição binomial a variável aleatória X correspondente ao número de sucessos em n ensaios de Bernoulli Desse modo estamos interessados na probabilidade de obter x sucessos e portanto n x fracassos com PX p e PF 1 p Um resultado particular seria 𝑆𝑆𝑆 𝑆 𝑘 𝐹𝐹𝐹 𝐹 𝑛𝑘 E a probabilidade desse resultado particular é 𝑝𝑘 1 𝑝𝑛𝑘 devido a independência dos ensaios Mas qualquer sequência com k sucessos e n x fracassos terá a mesma probabilidade do resultado acima Portanto resta saber quantas sequências com x sucessos e n x fracassos podemos formar Usando técnicas de contagem é fácil ver que existem 𝐶𝑛𝑥 𝑛 𝑥𝑛𝑥sequências distintas Formalmente dizemos que a variável aleatória X número de sucessos nos n ensaios tem distribuição binomial com parâmetros n e p Xbn p FUNÇÃO DE PROBABILIDADES A função de probabilidades de uma variável X com distribuição binomial é dada por 𝑃𝑥 𝑃𝑋 𝑥 𝐶𝑛𝑥𝑝𝑥1 𝑝𝑛𝑥 𝐶𝑛𝑥 𝑛 𝑥 𝑛 𝑥𝑛𝑥 𝐶𝑛𝑥 representa o número dos possíveis resultados das n observações quando combinados em conjuntos de tamanho x Lêse Combinação de n x a x MÉDIA A esperança de uma variável aleatória X com distribuição binomial bnp é dada por 𝜇𝑋 𝐸𝑋 𝑛𝑝 VARIÂNCIA A variância de uma variável aleatória X com distribuição binomial Bnp é dada por 𝜎𝑋 2 𝑉𝑎𝑟𝑋 𝑛𝑝1 𝑝 Exemplo 1 Uma moeda honesta é lançada 3 vezes Qual a probabilidade de cair duas caras Como a moeda é honesta a probabilidade de cair cara em cada ensaio é igual a ½ ou 05 Em 3 lançamentos da moeda queremos saber a probabilidade do evento A cck ckc kcc Ou na notação binária A 110 101 011 A probabilidade do evento A é dada por PA Pcck Pckc Pkcc e pela independência dos eventos Pcck ½ x ½ x ½ 18 0125 Pckc Pkcc Logo PA 0125 0125 0125 0375 Usando a fórmula X Número de caras 𝑃2 𝑃𝑋 2 𝐶3 2 0521 0532 3 2 1 025 05 0375 Mas nós vamos usar os programas computacionais para os cálculos de probabilidade Bioestat R Exemplo 2 Em uma determinada repartição pública 10 das guias preenchidas estão incorretas Essas guias correspondem a uma liberação na qual cinco delas devem estar preenchidas conjuntamente Considere que cada uma tem a mesma probabilidade de ser preenchida incorretamente como se houvesse repetição no experimento de retirar guias a Qual a probabilidade de haver exatamente três guias incorretas nas cinco guias para liberação O sucesso é a ocorrência de guias preenchidas incorretamente Então n 5 x 3 e p 01 Logo PX 3 00081 b Qual a probabilidade de haver duas ou mais guias incorretas nas cinco guias para liberação PX 2 PX2 PX3 PX4 PX5 1 PX 2 1 PX 0 412 Modelo de Poisson Em muitos casos conhecemos o número de sucessos porém o número de fracassos ou o número total de provas seria difícil de ser determinado ou em alguns casos não teria nenhum sentido prático Por exemplo o número de acidentes automobilísticos ocorridos em uma rodovia em um mês Podemos nesse espaço de tempo determinar o número de acidentes ocorridos porém o número de acidentes que deixaram de ocorrer não poderá ser determinado Da mesma forma o número de trincas por unidade de área numa peça de concreto Podemos determinar quantas trincas ocorreram porém não saberemos contar quantas trincas não ocorreram Nesses casos a variável aleatória número de sucessos poderá ser modelada de acordo com uma distribuição de Poisson Formalmente a distribuição de Poisson é útil para descrever as probabilidades do número de ocorrências num campo ou intervalo contínuo em geral tempo ou espaço Ex defeitos por centímetro quadrado Notese que a unidade de medida tempo área é contínua mas a variável aleatória número de ocorrências é discreta A utilização da distribuição de Poisson baseiase nas seguintes hipóteses 1 a probabilidade de ocorrência é a mesma em todo campo de observação 2 a probabilidade de mais de uma ocorrência num único ponto é aproximadamente zero 3 a número de ocorrências em qualquer intervalo é independente do número de ocorrências em outro intervalo Seja X o número de sucessos em um intervalo então X é uma variável aleatória de Poisson com a seguinte distribuição de probabilidade 𝑃𝑋 𝑥 𝜆𝑥𝑒𝜆 𝑥 Parâmetros da distribuição de Poisson Esperança 𝐸𝑋 𝜇𝑥 𝜆 Variância VarX 𝜎2𝑋 𝜆 Obs A distribuição de Poisson é utilizada quando o número de observações de um experimento aleatório é muito grande ex N 100 e a probabilidade de sucesso é muito pequena ex p 01 Sabendose que uma v a tem resultados distribuídos segundo Poisson e conhecendo o número médio de ocorrências por unidade de medida podemos determinar a probabilidade de qualquer dos resultados possíveis nos intervalos para os quais desejamos A distribuição de Poisson é uma forma limite da distribuição binomial quando N tende a infinito e p tende a zero Exemplo Num livro de 800 páginas há 800 erros de impressão Qual a probabilidade de que uma página contenha pelo menos 3 erros de impressão 800800 1 PX 3 1 PX 3 1 PX 0 PX 1 PX 2 PX 0 10𝑒1 0 0 367879 PX 1 10𝑒1 1 0 367879 PX 2 12𝑒1 2 0 18394 PX 3 1 PX 3 1 09197 00803 Cálculo no Excel Para calcular cada probabilidade individual e depois somar PX 0 DISTPOISSON01FALSO PX 1 DISTPOISSON11FALSO PX 2 DISTPOISSON21FALSO Para calcular usando a função cumulative calcula de uma só vez PX 3 1 PX 3 1DISTPOISSON21VERDADEIRO Colocar verdadeiro se a probabilidade for cumulativa No R p 1sumdpois021 42 Modelos probabilísticos para variáveis contínuas 421 Modelo Uniforme O modelo mais simples para variáveis aleatórias contínuas é o uniforme Uma variável aleatória X tem modelo uniforme ou segue a distribuição uniforme quando a probabilidade de se gerar qualquer ponto em um intervalo contido no espaço amostral é proporcional ao tamanho do intervalo Para uma variável aleatória contínua qualquer X que pode assumir valores entre a e b se todos os valores entre a e b têm a mesma probabilidade de ocorrer resulta no gráfico apresentado na Figura 1 Figura 1 Representação da distribuição uniforme Para que a área entre a e b seja igual a 1 o valor da ordenada precisa ser igual a 1b a constante portanto para todo o intervalo A área escura representa a probabilidade de a variável X assumir valores no intervalo c d A probabilidade de que a variável assuma valores entre c e d sendo a c d b é a área compreendida entre c e d 𝑃𝑐 𝑋 𝑑 𝑑 𝑐 1 𝑏 𝑎 Se X tem distribuição uniforme seu valor esperado e a variância são 𝐸𝑋 𝑎𝑏 2 𝑉𝑋 𝑏𝑎2 12 Esse modelo é bastante usado na geração de números pseudoaleatórios em processos de amostragem probabilística e também em estudos de simulação 422 Distribuição Normal A distribuição normal foi estudada inicialmente no século 18 quando uma análise de erros experimentais levou a uma curva em forma de sino Embora ela tenha aparecido pela primeira vez em 1733 através de DeMoivre a distribuição normal recebe o nome de distribuição gaussiana em homenagem ao cientista alemão Karl Friedrick Gauss que foi o primeiro a utilizála em 1809 Nos séculos 18 e 19 matemáticos e físicos desenvolveram uma função de probabilidade que descrevia bem os erros experimentais obtidos em medidas físicas Esta função de probabilidade resultou na bem conhecida curva em forma de sino chamada de distribuição normal ou gaussiana Esta distribuição fornece uma boa aproximação de curvas de frequência para medidas de dimensões e características humanas como a altura de uma população Considere na Figura 2 o histograma das alturas de indivíduos considerados gigantes em uma pesquisa realizada na Inglaterra Figura 2 Histograma de alturas de indivíduos considerados gigantes A análise desse histograma indica que A distribuição dos valores da variável altura é aproximadamente simétrica em torno de 212 cm A maioria dos valores encontrase entre 202 cm e 226 cm Há uma pequena porção de valores abaixo de 200 cm e acima de 228 cm 228 224 220 216 212 208 204 200 9 8 7 6 5 4 3 2 1 0 Altura Frequencia Definindo a variável aleatória X medida da altura em centímetros de um indivíduo escolhido ao acaso da população de indivíduos considerados com altura acima do normal na Inglaterra Se estamos interessados em construir a distribuição de probabilidades de X com base na Figura 2 seria razoável ajustar ao histograma uma curva simétrica em torno de 212 conforme a Figura 3 Figura 3 Curva Normal sobreposta ao histograma de alturas Essa curva contínua corresponde ao gráfico da Distribuição Normal e denominase curva Normal Supondo que os indivíduos pesquisados sejam representativos da população de indivíduos considerados com altura acima do normal na Inglaterra podemos associar a X uma distribuição Normal Muitas variáveis na natureza variáveis físicas biológicas psicológicas comportamse de modo aproximadamente simétrico podendo ser representadas pela curva Normal Além disso a distribuição Normal é de suma importância em inferência estatística Propriedades da Distribuição Normal Se X é uma variável aleatória com distribuição Normal valem as seguintes propriedades a A curva Normal é simétrica sendo que seu centro de simetria está localizado em x x onde x é o valor esperado média ou esperança de X b A distância de x aos pontos onde a curvatura da distribuição muda de sentido é igual a x sendo x o desvio padrão de X c A moda e a mediana de X são iguais a x d A área sob a curva Normal e acima do eixo horizontal eixo dos valores da variável aleatória X é igual a 1 basta lembrar que a área total sob os histogramas construídos representando probabilidades frequências relativas é igual a 1 A partir das propriedades verificase que a distribuição Normal depende de dois parâmetros a média x que pode ser um número real qualquer e o desvio padrão x que deve ser um número real positivo Interpretando os parâmetros Uma distribuição normal pode ter qualquer média e qualquer desvio padrão Os parâmetros μ e σ determinam o formato da curva Figura 4 Figura 4 Curva normal típica 224 216 208 200 9 8 7 6 5 4 3 2 1 0 C1 Frequency média desvio padrão x fx Quando alteramos o valor de μ não alteramos a forma da distribuição apenas a deslocamos para a direita ou para a esquerda Quando alteramos o valor de σ a forma da distribuição se altera apesar de continuar simétrica em relação à média ela pode se tornar mais alta e mais estreita quando diminuímos o valor de σ e mais achatada e mais larga quando aumentamos o valor de σ As Figuras 5 e 6 apresentam essas diferenças Figura 5 Distribuições normais com mesmo Figura 6 Distribuições normais com mesma desvio padrão e médias diferentes média e desvios padrão diferentes Denotase a variável aleatória X com distribuição Normal com média μ e variância σ2 por X Nμ σ2 ou X NμXσ𝑋 2 A distribuição Normal padrão Se uma variável aleatória é contínua não existe probabilidade em um determinado ponto do espaço amostral mas apenas em um intervalo x1 x2 e envolve o cálculo de área sob a curva de distribuição da variável aleatória Para facilitar o cálculo de probabilidades em uma distribuição normal é realizada uma transformação na variável aleatória gerando uma variável Normal padrão ou padronizada o que nos permite calcular áreas sob a curva de uma distribuição normal qualquer pois as áreas associadas com a normal padronizadas são tabeladas Se X Nμ σ2 podemos transformar a variável X na variável Z por meio da fórmula 𝑍 𝑋 𝜇 𝜎 A variável Z tem distribuição normal padrão com média 0 e variância 1 Esta transformação é ilustrada pela Figura 7 Figura 7 Transformação de uma N σ2 para uma N01 Ex Servidores de um setor da UFPA possuem salários que seguem uma distribuição normal com média de R210000 MPa com desvio padrão de R5000 Em notação estatística vamos denominar a variável salário como X e X N2100 502 Será aberto um edital para servidores que recebem até R200000 Qual a probabilidade de servidores do setor participarem do edital PX 2000 P 𝑋𝜇 𝜎 20002100 50 PZ 2 A Figura 8 mostra a transformação realizada e a área desejada A B B A A B C 3 2 2 3 X X 0 1 2 3 1 2 3 Z Figura 8 Probabilidade do salário ser inferior a R200000 Para cálculo dessa probabilidade utilizamos a tabela de probabilidade Normal ou um software que forneça o resultado Tem diversos tipos de tabela Normal Algumas trazem apenas a PZz para z não negativo z0 As propriedades que seguem podem ser deduzidas da simetria da densidade em relação à média 0 e são úteis na obtenção de outras áreas não tabuladas PZz 1 PZz PZz PZz PZz PZz Utilizando as relações apresentadas acima a probabilidade de um servidor ter salário inferior a R200000 é PX 2000 PZ 2 00228 ou PZ 2 PZ 2 1 PZ 2 1 09772 00228 que através da tabela da N01 é igual a Que pode ser obtido também pelo Excel por meio da função DISTNORMPN2VERDADEIRO que retorna 002275 180 190 200 210 220 230 240 X 6 4 2 0 2 4 6 Z PX200 PZ2 z z 1 PZ z PZ z PX2000 1800 1900 2000 2100 2200 2300 2400
Send your question to AI and receive an answer instantly
Recommended for you
7
Lista de Exercícios - Espaço Amostral e Probabilidade
Probabilidade e Estatística 1
UFPA
5
Lista de Exercícios Modelos Probabilísticos - Estatística e Probabilidade
Probabilidade e Estatística 1
UFPA
14
Lista de Exercícios Resolvidos - Estatística e Probabilidade - Medidas de Ordenamento e Posição
Probabilidade e Estatística 1
UFPA
43
Metrologia Aplicada na Industria de Petroleo e Gas - Regras de Compatibilizacao e Arredondamento
Probabilidade e Estatística 1
UFPA
1
Especificações Técnicas do Equipamento de Controle de Temperatura
Probabilidade e Estatística 1
UFPA
35
Metrologia na Industria de Petroleo e Gas - Estimativa de Incerteza e Correcao de Medicoes
Probabilidade e Estatística 1
UFPA
21
Metrologia na Industria de Petroleo e Gas - Mensurando Invariavel e Variavel
Probabilidade e Estatística 1
UFPA
21
Metrologia Aplicada Industria Petroleo e Gas Mensurando Invariavel e Variavel
Probabilidade e Estatística 1
UFPA
4
Distribuicao Gaussiana ou Normal - Caracteristicas Parametros e Aplicacoes
Probabilidade e Estatística 1
UFPA
43
Metrologia Aplicada na Industria de Petroleo e Gas - Regras de Compatibilizacao de Valores
Probabilidade e Estatística 1
UFPA
Preview text
UNIVERSIDADE FEDERAL DO PARÁ PROGRAMA DE PÓSGRADUAÇÃO EM ADMINISTRAÇÃO PPGAD Disciplina Estatística Aplicada à Administração Profa Marinalva Maciel Unidade IV Modelos Probabilísticos Por causa de sua natureza aleatória não é possível prever com exatidão a ocorrência do valor de uma observação específica dessa variável Entretanto é possível prever uma estrutura de variação destas observações Esta estrutura é dada por modelos de probabilidade que nos dão o comportamento probabilístico de variáveis aleatórias e servem para calcular probabilidades Ou seja o modelo probabilístico é a descrição matemática de um fenômeno aleatório Um modelo probabilístico é uma representação para a distribuição da variável aleatória por esse motivo usualmente eles são chamados de distribuições Existem vários modelos probabilísticos tanto para variáveis discretas como para variáveis contínuas mas serão aqui estudados os mais usuais na área de administração 41 Modelos probabilísticos para variáveis discretas 411 Modelo Binomial Usase o termo binomial para designar situações em que os resultados de uma variável aleatória podem ser grupados em duas classes ou categorias Essa distribuição é usada quando estamos interessados na ocorrência de um evento e não na sua magnitude Ex produtos manufaturados classificados como perfeitos ou defeituosos As categorias devem ser mutuamente exclusivas e as classes devem ser coletivamente exaustivas É comum referirmonos às duas categorias de uma distribuição binomial como sucesso ou fracasso A utilização da distribuição binomial exige certas hipóteses 1 Há n observações 2 As n observações são idênticas 3 Cada observação enquadrase em apenas uma de duas categorias sucesso ocorre o evento de interesse ou fracasso 4 as probabilidades de sucesso p é a mesma para cada observação Cada uma dos n resultados da variável aleatória observação é denominada um ensaio de Bernoulli considerada também uma va discreta que correspondem a experimentos nos quais os resultados possíveis apresentam ou não uma determinada característica Ex lançar uma moeda e observar o resultado Outros exemplos de ensaios de Bernoulli são uma venda é efetuada ou não em uma ligação de call center um contribuinte pode ser adimplente ou inadimplente uma peça fabricada tem algum defeito ou não uma guia recolhida pode ter seu preenchimento ocorrido de forma correta ou incorreta e um consumidor que entra em uma loja pode comprar ou não comprar um produto Para eventos desse tipo podemos definir uma v a que assume apenas dois valores o valor 1 se ocorre sucesso e o valor 0 se ocorre fracasso A probabilidade de sucesso é denotada por p isto é Psucesso p 0 p 1 X 0 1 Total Px 1p p 1 Usando a definição de Esperança temos EX p VX p p2 p1 p Na distribuição binomial a variável aleatória X correspondente ao número de sucessos em n ensaios de Bernoulli Desse modo estamos interessados na probabilidade de obter x sucessos e portanto n x fracassos com PX p e PF 1 p Um resultado particular seria 𝑆𝑆𝑆 𝑆 𝑘 𝐹𝐹𝐹 𝐹 𝑛𝑘 E a probabilidade desse resultado particular é 𝑝𝑘 1 𝑝𝑛𝑘 devido a independência dos ensaios Mas qualquer sequência com k sucessos e n x fracassos terá a mesma probabilidade do resultado acima Portanto resta saber quantas sequências com x sucessos e n x fracassos podemos formar Usando técnicas de contagem é fácil ver que existem 𝐶𝑛𝑥 𝑛 𝑥𝑛𝑥sequências distintas Formalmente dizemos que a variável aleatória X número de sucessos nos n ensaios tem distribuição binomial com parâmetros n e p Xbn p FUNÇÃO DE PROBABILIDADES A função de probabilidades de uma variável X com distribuição binomial é dada por 𝑃𝑥 𝑃𝑋 𝑥 𝐶𝑛𝑥𝑝𝑥1 𝑝𝑛𝑥 𝐶𝑛𝑥 𝑛 𝑥 𝑛 𝑥𝑛𝑥 𝐶𝑛𝑥 representa o número dos possíveis resultados das n observações quando combinados em conjuntos de tamanho x Lêse Combinação de n x a x MÉDIA A esperança de uma variável aleatória X com distribuição binomial bnp é dada por 𝜇𝑋 𝐸𝑋 𝑛𝑝 VARIÂNCIA A variância de uma variável aleatória X com distribuição binomial Bnp é dada por 𝜎𝑋 2 𝑉𝑎𝑟𝑋 𝑛𝑝1 𝑝 Exemplo 1 Uma moeda honesta é lançada 3 vezes Qual a probabilidade de cair duas caras Como a moeda é honesta a probabilidade de cair cara em cada ensaio é igual a ½ ou 05 Em 3 lançamentos da moeda queremos saber a probabilidade do evento A cck ckc kcc Ou na notação binária A 110 101 011 A probabilidade do evento A é dada por PA Pcck Pckc Pkcc e pela independência dos eventos Pcck ½ x ½ x ½ 18 0125 Pckc Pkcc Logo PA 0125 0125 0125 0375 Usando a fórmula X Número de caras 𝑃2 𝑃𝑋 2 𝐶3 2 0521 0532 3 2 1 025 05 0375 Mas nós vamos usar os programas computacionais para os cálculos de probabilidade Bioestat R Exemplo 2 Em uma determinada repartição pública 10 das guias preenchidas estão incorretas Essas guias correspondem a uma liberação na qual cinco delas devem estar preenchidas conjuntamente Considere que cada uma tem a mesma probabilidade de ser preenchida incorretamente como se houvesse repetição no experimento de retirar guias a Qual a probabilidade de haver exatamente três guias incorretas nas cinco guias para liberação O sucesso é a ocorrência de guias preenchidas incorretamente Então n 5 x 3 e p 01 Logo PX 3 00081 b Qual a probabilidade de haver duas ou mais guias incorretas nas cinco guias para liberação PX 2 PX2 PX3 PX4 PX5 1 PX 2 1 PX 0 412 Modelo de Poisson Em muitos casos conhecemos o número de sucessos porém o número de fracassos ou o número total de provas seria difícil de ser determinado ou em alguns casos não teria nenhum sentido prático Por exemplo o número de acidentes automobilísticos ocorridos em uma rodovia em um mês Podemos nesse espaço de tempo determinar o número de acidentes ocorridos porém o número de acidentes que deixaram de ocorrer não poderá ser determinado Da mesma forma o número de trincas por unidade de área numa peça de concreto Podemos determinar quantas trincas ocorreram porém não saberemos contar quantas trincas não ocorreram Nesses casos a variável aleatória número de sucessos poderá ser modelada de acordo com uma distribuição de Poisson Formalmente a distribuição de Poisson é útil para descrever as probabilidades do número de ocorrências num campo ou intervalo contínuo em geral tempo ou espaço Ex defeitos por centímetro quadrado Notese que a unidade de medida tempo área é contínua mas a variável aleatória número de ocorrências é discreta A utilização da distribuição de Poisson baseiase nas seguintes hipóteses 1 a probabilidade de ocorrência é a mesma em todo campo de observação 2 a probabilidade de mais de uma ocorrência num único ponto é aproximadamente zero 3 a número de ocorrências em qualquer intervalo é independente do número de ocorrências em outro intervalo Seja X o número de sucessos em um intervalo então X é uma variável aleatória de Poisson com a seguinte distribuição de probabilidade 𝑃𝑋 𝑥 𝜆𝑥𝑒𝜆 𝑥 Parâmetros da distribuição de Poisson Esperança 𝐸𝑋 𝜇𝑥 𝜆 Variância VarX 𝜎2𝑋 𝜆 Obs A distribuição de Poisson é utilizada quando o número de observações de um experimento aleatório é muito grande ex N 100 e a probabilidade de sucesso é muito pequena ex p 01 Sabendose que uma v a tem resultados distribuídos segundo Poisson e conhecendo o número médio de ocorrências por unidade de medida podemos determinar a probabilidade de qualquer dos resultados possíveis nos intervalos para os quais desejamos A distribuição de Poisson é uma forma limite da distribuição binomial quando N tende a infinito e p tende a zero Exemplo Num livro de 800 páginas há 800 erros de impressão Qual a probabilidade de que uma página contenha pelo menos 3 erros de impressão 800800 1 PX 3 1 PX 3 1 PX 0 PX 1 PX 2 PX 0 10𝑒1 0 0 367879 PX 1 10𝑒1 1 0 367879 PX 2 12𝑒1 2 0 18394 PX 3 1 PX 3 1 09197 00803 Cálculo no Excel Para calcular cada probabilidade individual e depois somar PX 0 DISTPOISSON01FALSO PX 1 DISTPOISSON11FALSO PX 2 DISTPOISSON21FALSO Para calcular usando a função cumulative calcula de uma só vez PX 3 1 PX 3 1DISTPOISSON21VERDADEIRO Colocar verdadeiro se a probabilidade for cumulativa No R p 1sumdpois021 42 Modelos probabilísticos para variáveis contínuas 421 Modelo Uniforme O modelo mais simples para variáveis aleatórias contínuas é o uniforme Uma variável aleatória X tem modelo uniforme ou segue a distribuição uniforme quando a probabilidade de se gerar qualquer ponto em um intervalo contido no espaço amostral é proporcional ao tamanho do intervalo Para uma variável aleatória contínua qualquer X que pode assumir valores entre a e b se todos os valores entre a e b têm a mesma probabilidade de ocorrer resulta no gráfico apresentado na Figura 1 Figura 1 Representação da distribuição uniforme Para que a área entre a e b seja igual a 1 o valor da ordenada precisa ser igual a 1b a constante portanto para todo o intervalo A área escura representa a probabilidade de a variável X assumir valores no intervalo c d A probabilidade de que a variável assuma valores entre c e d sendo a c d b é a área compreendida entre c e d 𝑃𝑐 𝑋 𝑑 𝑑 𝑐 1 𝑏 𝑎 Se X tem distribuição uniforme seu valor esperado e a variância são 𝐸𝑋 𝑎𝑏 2 𝑉𝑋 𝑏𝑎2 12 Esse modelo é bastante usado na geração de números pseudoaleatórios em processos de amostragem probabilística e também em estudos de simulação 422 Distribuição Normal A distribuição normal foi estudada inicialmente no século 18 quando uma análise de erros experimentais levou a uma curva em forma de sino Embora ela tenha aparecido pela primeira vez em 1733 através de DeMoivre a distribuição normal recebe o nome de distribuição gaussiana em homenagem ao cientista alemão Karl Friedrick Gauss que foi o primeiro a utilizála em 1809 Nos séculos 18 e 19 matemáticos e físicos desenvolveram uma função de probabilidade que descrevia bem os erros experimentais obtidos em medidas físicas Esta função de probabilidade resultou na bem conhecida curva em forma de sino chamada de distribuição normal ou gaussiana Esta distribuição fornece uma boa aproximação de curvas de frequência para medidas de dimensões e características humanas como a altura de uma população Considere na Figura 2 o histograma das alturas de indivíduos considerados gigantes em uma pesquisa realizada na Inglaterra Figura 2 Histograma de alturas de indivíduos considerados gigantes A análise desse histograma indica que A distribuição dos valores da variável altura é aproximadamente simétrica em torno de 212 cm A maioria dos valores encontrase entre 202 cm e 226 cm Há uma pequena porção de valores abaixo de 200 cm e acima de 228 cm 228 224 220 216 212 208 204 200 9 8 7 6 5 4 3 2 1 0 Altura Frequencia Definindo a variável aleatória X medida da altura em centímetros de um indivíduo escolhido ao acaso da população de indivíduos considerados com altura acima do normal na Inglaterra Se estamos interessados em construir a distribuição de probabilidades de X com base na Figura 2 seria razoável ajustar ao histograma uma curva simétrica em torno de 212 conforme a Figura 3 Figura 3 Curva Normal sobreposta ao histograma de alturas Essa curva contínua corresponde ao gráfico da Distribuição Normal e denominase curva Normal Supondo que os indivíduos pesquisados sejam representativos da população de indivíduos considerados com altura acima do normal na Inglaterra podemos associar a X uma distribuição Normal Muitas variáveis na natureza variáveis físicas biológicas psicológicas comportamse de modo aproximadamente simétrico podendo ser representadas pela curva Normal Além disso a distribuição Normal é de suma importância em inferência estatística Propriedades da Distribuição Normal Se X é uma variável aleatória com distribuição Normal valem as seguintes propriedades a A curva Normal é simétrica sendo que seu centro de simetria está localizado em x x onde x é o valor esperado média ou esperança de X b A distância de x aos pontos onde a curvatura da distribuição muda de sentido é igual a x sendo x o desvio padrão de X c A moda e a mediana de X são iguais a x d A área sob a curva Normal e acima do eixo horizontal eixo dos valores da variável aleatória X é igual a 1 basta lembrar que a área total sob os histogramas construídos representando probabilidades frequências relativas é igual a 1 A partir das propriedades verificase que a distribuição Normal depende de dois parâmetros a média x que pode ser um número real qualquer e o desvio padrão x que deve ser um número real positivo Interpretando os parâmetros Uma distribuição normal pode ter qualquer média e qualquer desvio padrão Os parâmetros μ e σ determinam o formato da curva Figura 4 Figura 4 Curva normal típica 224 216 208 200 9 8 7 6 5 4 3 2 1 0 C1 Frequency média desvio padrão x fx Quando alteramos o valor de μ não alteramos a forma da distribuição apenas a deslocamos para a direita ou para a esquerda Quando alteramos o valor de σ a forma da distribuição se altera apesar de continuar simétrica em relação à média ela pode se tornar mais alta e mais estreita quando diminuímos o valor de σ e mais achatada e mais larga quando aumentamos o valor de σ As Figuras 5 e 6 apresentam essas diferenças Figura 5 Distribuições normais com mesmo Figura 6 Distribuições normais com mesma desvio padrão e médias diferentes média e desvios padrão diferentes Denotase a variável aleatória X com distribuição Normal com média μ e variância σ2 por X Nμ σ2 ou X NμXσ𝑋 2 A distribuição Normal padrão Se uma variável aleatória é contínua não existe probabilidade em um determinado ponto do espaço amostral mas apenas em um intervalo x1 x2 e envolve o cálculo de área sob a curva de distribuição da variável aleatória Para facilitar o cálculo de probabilidades em uma distribuição normal é realizada uma transformação na variável aleatória gerando uma variável Normal padrão ou padronizada o que nos permite calcular áreas sob a curva de uma distribuição normal qualquer pois as áreas associadas com a normal padronizadas são tabeladas Se X Nμ σ2 podemos transformar a variável X na variável Z por meio da fórmula 𝑍 𝑋 𝜇 𝜎 A variável Z tem distribuição normal padrão com média 0 e variância 1 Esta transformação é ilustrada pela Figura 7 Figura 7 Transformação de uma N σ2 para uma N01 Ex Servidores de um setor da UFPA possuem salários que seguem uma distribuição normal com média de R210000 MPa com desvio padrão de R5000 Em notação estatística vamos denominar a variável salário como X e X N2100 502 Será aberto um edital para servidores que recebem até R200000 Qual a probabilidade de servidores do setor participarem do edital PX 2000 P 𝑋𝜇 𝜎 20002100 50 PZ 2 A Figura 8 mostra a transformação realizada e a área desejada A B B A A B C 3 2 2 3 X X 0 1 2 3 1 2 3 Z Figura 8 Probabilidade do salário ser inferior a R200000 Para cálculo dessa probabilidade utilizamos a tabela de probabilidade Normal ou um software que forneça o resultado Tem diversos tipos de tabela Normal Algumas trazem apenas a PZz para z não negativo z0 As propriedades que seguem podem ser deduzidas da simetria da densidade em relação à média 0 e são úteis na obtenção de outras áreas não tabuladas PZz 1 PZz PZz PZz PZz PZz Utilizando as relações apresentadas acima a probabilidade de um servidor ter salário inferior a R200000 é PX 2000 PZ 2 00228 ou PZ 2 PZ 2 1 PZ 2 1 09772 00228 que através da tabela da N01 é igual a Que pode ser obtido também pelo Excel por meio da função DISTNORMPN2VERDADEIRO que retorna 002275 180 190 200 210 220 230 240 X 6 4 2 0 2 4 6 Z PX200 PZ2 z z 1 PZ z PZ z PX2000 1800 1900 2000 2100 2200 2300 2400