·

Administração ·

Estatística 2

· 2022/1

Envie sua pergunta para a IA e receba a resposta na hora

Fazer Pergunta

Texto de pré-visualização

Estatística e Probabilidade - Prof. Afonso 1 Distribuições de Probabilidade Distribuições de Probabilidade Discretas 1. DISTRIBUIÇÃO DE BERNOULLI Seja um experimento que consiste na realização de uma prova, cujos resultados só podem ser “sucesso” ou “fracasso”. Observando ainda que na realização desta prova os eventos são independentes, vamos chamar X uma variável aleatória que, de acordo com a pressuposição citada, somente assumirá valores 0 e 1 , sendo 0 a ocorrência do evento “fracasso” e 1 a ocorrência do evento “sucesso”, com probabilidades q p q 1 e , ou seja, p P x q P X     1) ( e 0) ( Dizemos que a V.A. X segue uma distribuição de Bernoulli, de parâmetro p , e escrevemos ( ) : Ber p X X = o nº de sucesso em uma única tentativa do experimento. Função de Probabilidade: px q x x P X x f      1 ) ( ( ) As principais características são: Média: Variância: Essa distribuição tem importância como geradora de novas distribuições, conforme veremos a seguir. Exemplo: Uma urna tem 30 bolas brancas e 20 verdes. Retira-se uma bola dessa urna. Seja X = número de bolas verdes. p p q p x x X E i o i i x           1 ( ) 0 ( ) ) ( ) ( 1    p q p p p p E X E X X Var x           ) 1( ) ( ) ( ) ( 2 2 2 2  5 2 5 3 5 2 )1 ( 5 3 5 3 5 2 0) ( ) ( 0 0 1                         X P X P q p x X P x x Estatística e Probabilidade - Prof. Afonso 2 2. DISTRIBUIÇÃO BINOMIAL Usa-se o termo "binomial" para caracterizar situações em que os resultados de uma variável aleatória podem ser agrupados em duas classes ou categorias. Na Distribuição Binomial:  Há n experimentações, observações ou provas idênticas;  Cada experimentação ou prova tem apenas dois resultados possíveis: um chamado "sucesso" e o outro "fracasso";  As probabilidades p de sucesso e  p  q ) (1 de fracasso permanecem constantes em todas as provas;  Os resultados das experimentações ou provas são independentes uns dos outros. Dizemos que a V.A. X segue uma distribuição Binomial, de parâmetro p n e , e escrevemos ( , ) : Bin n p X X = número de sucessos em n tentativas de Bernoulli Porém, o evento x sucessos em n provas pode acontecer em outras ordens distintas, todas com a mesma probabilidade. Como o número de ordens é o número de combinações de n elementos x a x , a probabilidade de ocorrerem x sucessos em n provas será pela: Função de Probabilidade: As principais características são: Média: n p E X x    ) (  Variância: n p q X Var x     ) (  2 Exemplo: Num determinado processo de fabricação 10% das peças são consideradas defeituosas. As peças são acondicionadas com 5 unidades cada uma. Qual a probabilidade de haver duas ou mais peças defeituosas numa caixa? px qn x x n x P X x f            ) ( ) (     ,0 3280 .( ,010) .( ,0 90) 1 5 )1 ( ,0 5905 .( ,010) .( ,0 90) 0 5 )0 ( ,0 0815 ,0 3280 ,0 5905 1 )1 ( )0 ( 1 )2 ( 4 1 5 0                             X P X P P X P X P X Estatística e Probabilidade - Prof. Afonso 3 3. DISTRIBUIÇÃO DE POISSON A distribuição de Poisson pode ser usada para determinar a probabilidade de um dado número de sucessos quando os eventos ocorrem em um continuum de tempo ou espaço. Tal processo, chamado de processo de Poisson, é similar ao processo de Bernoulli, exceto que os eventos ocorrem em um continuum ao invés de ocorrerem em tentativas ou observações fixadas. Tal como no caso do processo de Bernoulli, supõe-se que os eventos são independentes e que o processo é estacionário. Somente um valor é necessário para determinar a probabilidade de um dado número de sucessos em um processo de Poisson: o número médio de sucessos para a específica dimensão de tempo ou espaço de interesse. Este número médio é geralmente representado por  (letra grega “lambda) ou por  . Dizemos que a V.A. X segue uma distribuição de Poisson de parâmetro  , e escrevemos ( ) : Poisson  X X = número de sucessos em um intervalo de observação t fixado Função de Probabilidade: t x e x t P x t x f       ! ) ( ( , ) ) ( As principais características são: Média: Variância: Lembrando, a constante e  ,2 7183. usada em conexão com os logaritmos naturais. Exemplo; Suponhamos que os navios cheguem a um porto à razão de λ = 2 navios/hora, e que essa razão seja bem aproximada por um sucesso de Poisson. Observando o processo durante um período (t = ½) de meia hora, determine a probabilidade de: não chegar nenhum navio, e de chegarem 3 navios. t X E X      ) ( t VAR X X      ) ( 2 0,061 6 .(1) 3) ( 0,368 ! 0 .(1) 0) ( ,368 0 1 2 . 1 2 3 1 0 1 1                  e X P e X P e t x   Estatística e Probabilidade - Prof. Afonso 4 4. DISTRIBUIÇÃO GEOMÉTRICA Consideremos tentativas sucessivas e independentes de um mesmo experimento aleatório. Cada tentativa admite sucesso com probabilidade p e fracasso com probabilidade q ; p  q 1 . Dizemos que a V.A. X segue uma distribuição Geométrica de parâmetro p , e escrevemos ( ) : Geo p X X = nº de tentativas necessárias ao aparecimento do 1º sucesso. Logo, X assume os valores: X 1 , que corresponde ao sucesso (S) e p P X  )  1 ( X  2 , que corresponde ao fracasso (F) na 1ª tentativa e ao sucesso na 2ª (FS) e q p S P F P X      ) ( 2) ( X  3 , que corresponde ao fracasso (FFS) e 2ª tentativa e ao sucesso na 3ª, p q S F P F P X       2 ) ( 3) ( X  4 , que corresponde ao fracasso (FFFS) e p q P X    3 4) ( E assim sucessivamente, X  x , que corresponde a FF ... FS com: Função de Probabilidade: 1 ) ( ) (      p qx x P X x f As principais características são: Média: p X E x 1 ) (    Variância: 2 2 ) ( p q X Var x    Exemplo: A probabilidade de se encontrar o sinal de trânsito aberto numa esquina é 0,20. Qual a probabilidade de que seja necessário passar pelo local 5 vezes para encontrar o sinal aberto pela primeira vez? X= nº de vezes necessárias para encontrar o sinal aberto ,0 08 (020) ( ,0 80) 5) ( 80 ,0 20 ,0 4       X P q p Estatística e Probabilidade - Prof. Afonso 5 5. DISTRIBUIÇÃO DE PASCAL Suponhamos que um experimento aleatório seja repetido independentemente até que um evento A ocorra pela r  ésima vez. Usualmente utilizamos a notação : ( , ) : BN p x X X = número de tentativas até se obter o r  ésimo sucesso Para que r  ésimo o sucesso ocorra na x  ésima tentativa é necessário que haja um sucesso nesta tentativa e, além disso, haja ( 1) r sucessos nas (  )1 x tentativas anteriores, evento esse cuja probabilidade é dada pela distribuição binomial. Assim sendo: Função de Probabilidade: As principais características são: Média: p r X E x   ) (  Variância: 2 2 ) ( p r q X Var x     Exemplo: A probabilidade de que um sinal de trânsito esteja aberto numa esquina é 0,20. Qual a probabilidade de que seja necessário passar 10 vezes para encontra-lo aberto pela quarta vez? ,0 035 ( ,0 80) (020) 3 9 10) ( ( ,0 80) (020) 1 4 1 10 10) ( 80 ,0 20 ,0 4 10 6 4 6 4                          X P X P q p r X pr qx r r x x P X x f              1 1 ) ( ( ) Estatística e Probabilidade - Prof. Afonso 6 6. DISTRIBUIÇÃO HIPERGEOMÉTRICA Consideremos uma população com N elementos, dos quais r têm uma determinada característica (a retirada de um desses elementos corresponde ao sucesso). Retiramos dessa população, sem reposição, uma amostra de tamanho n. Dizemos que a V.A. X segue uma distribuição Hipergeométrica de parâmetro N r n , , , e escrevemos , , ) ( : Hgeo N r n X X = nº de sucessos na amostra (Saída do elemento com a característica) Podemos tirar       n N amostras sem reposição. Os sucessos na amostra podem ocorrer de       x r maneiras e fracassos de         x n r N modos. Função de Probabilidade:                        n N x n r N x r x P X f x ) ( ( ) As principais características são: Média: Variância: Exemplo: Uma firma compra lâmpadas por centenas. Examina sempre uma amostra de 15 lâmpadas para verificar se estão boas. Se uma centena inclui 12 lâmpadas queimadas, qual a probabilidade de se obter uma amostra com pelo menos uma lâmpada queimada? 875 ,0 15 100 15 88 0 12 1 15 100 0 15 12 100 0 12 1 )1 ( 0) ( 1 )1 ( 1 )1 ( 100 15 12 de lâmpadas queimadas na amostra º                                                       X P P X P X X P N n r n X n p E X x    ) (  N r p N n N n p q X Var x         )1 onde ( ) ( ) (  2 Estatística e Probabilidade - Prof. Afonso 7 7. DISTRIBUIÇÃO MULTINOMIAL Consideremos a possibilidade de k alternativas, isto é, repartimos o espaço amostral em k eventos AK A A A ......., , , 3 2 1 , mutuamente exclusivos com probabilidades 1 ...... 3 2 1      kp p p p . Então em n provas, a probabilidade de que: vezes A A vezes A A K k 3 3 2 2 1 1 , ocorra n vezes....., ocorra n , vezes; , ocorra n ; ocorra n , Sejam XK X X X ......., , , 3 2 1 , os nº de ocorrências AK A A A ......., , , 3 2 1 , respectivamente, com n X k i i   1 Nestas condições: X = nº de vezes que iA ocorrem nas n repetições do experimento Notação: ) ...... ( , : 1 pk Multi n p X Função de Probabilidade: As principais características são: Se i X , para i = 1,2,3......, k então: Média: Variância: Exemplo: Uma fábrica tem sua produção composta de 30% da máquina A, 20% da máquina B e 50% da máquina C. Retirando-se 9 peças da produção. Qual a probabilidade de serem 4 da máquina A, 2 da máquina B e 3 da máquina C. nk k n n k k K p p p n n n n n X n n X P X        ...... ! !.... ! ! ) ..... ; ( 21 1 2 1 2 1 2 2 1 1 ,0 051 3) ;2 ;4 ( ( ,0 50) ( ,0 20) !3 (030) !2 !4 !9 3) ;2 ;4 ( 3 2 1 3 2 4 3 2 1            X X X P X X X P i i x p n E X    ) (  i i i p q n Var X     ) (  2 Estatística e Probabilidade - Prof. Afonso 8 Distribuições de Probabilidade Contínuas 1. DISTRIBUIÇÃO NORMAL ou de GAUSS É um modelo particular de Variável Aleatória Contínua (VAC) cuja função densidade de probabilidade é dada por: 0 , , 2 1 ) ( 2 2 1                      R R com X e x f X O gráfico de f (x) é: As principais características dessa função são: a) O ponto máximo de f (x) é o ponto X   b) Os pontos de inflexão da função são: X    e X    c) A curva é simétrica com relação a  d) E(X )   e 2 ) ( VAR X  Se quisermos calcular a probabilidade indicada na figura: dx e b X a P X b a 2 2 1 2 1 ) (                    Para o cálculo das probabilidades, surgem dois grandes problemas: primeiro, para a integração de f (x) , pois para o cálculo é necessário o desenvolvimento em séries; segundo, seria a elaboração de uma tabela de probabilidades, pois f (x) depende de dois parâmetros (média e desvio-padrão), fato que acarretaria um grande trabalho para tabelar essas probabilidades considerando-se as várias combinações de  e 2  . Esses problemas podem ser solucionados por meio de uma mudança de variável, obtendo-se, assim a distribuição normal padronizada ou reduzida. a b Estatística e Probabilidade - Prof. Afonso 9 A Distribuição Normal Padrão – A Variável Z Z é a variável normalmente reduzida, normalmente padronizada ou variável normalizada. Os valores da variável Z são obtidos em função de X pela transformação linear.  Z  X   Z = valor da variável X expresso em desvios padrões, X = valor da variável a ser padronizado  = média da variável  = desvio padrão da variável X Características: Média:             0 1 1 1 ( )                          E E X E X E X E Z Variância:         1 1 1 ) ( 2 2 2 2                     VAR X VAR X VAR X VAR Z Logo, a função densidade de probabilidade de Z é:         z e z f z - , 2 1 ) ( 2 2 1  As probabilidades (áreas) sob f (z) são calculadas e tabeladas. Para se registarem as distribuições normais usa-se a seguinte notação: (0 1; ) : ) ( ; : 2 N Z N X   A Tabela da Curva Normal Padrão a seguir mostra todas as áreas entre 4,0 e 0 Z  Z  que correspondem às probabilidades de ocorrência da variável Z entre esses valores. Estatística e Probabilidade - Prof. Afonso 10 ) (0 z Z P   Estatística e Probabilidade - Prof. Afonso 11 Localização de uma área entre 0 e z, na tabela da curva normal padrão Exemplo: Suponha que se queira achar área entre z = 0 e z = 1,31 Para achar na tabela a área entre 0 e 1,31, localize 1,3 na primeira coluna da tabela abaixo onde se encontra a parte inteira e a primeira decimal do valor de z (veja seta). Em seguida localize 0,01 a segunda casa decimal do valor de z, que se encontra na primeira linha, em destaque, da tabela (veja seta). No cruzamento das duas setas encontra-se o número 0,4049 que é área entre 0 e 1,31. z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 Observação: Apenas a área entre 0 e z está na tabela. (A área entre 0 e –z é a mesma entre 0 e z, uma vez que a curva é simétrica em relação a média). 0,4049 Estatística e Probabilidade - Prof. Afonso 12 Exemplo: Determine os valores de z que corresponde à seguinte área: a) A área à direita de z é 0,2090 Metade da área = 0,5000 z = 0,81 Como a área dada, 0,2090, está à direita de z e é menor que 0,5000, isso significa que z é um número que está à direita de 0, isto é, z é um número positivo. Para achar o valor de z na tabela precisa-se da área entre 0 e z que é tabelada. Sendo a área tabelada = 0,2910, entra-se na tabela para achar o valor de z. z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,7 0,2580 0,2611 0,2642 0,2673 0,2703 0,2734 0,2764 0,2794 0,2823 0,2852 0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 Como as áreas da tabela estão dispostas em ordem crescente para baixo e para a direita é fácil localizar qualquer área. Neste caso a área 0,2910 está localizada conforme a indicação das setas correspondendo ao valor de z = 0,81. Observação: Se, por acaso, a área não for encontrada exatamente, use a área que estiver mais próxima (da direita ou da esquerda Área dada = 0,2090 Área tabelada = 0,5000 - 0,2090 = 0,2910 0,2910 Estatística e Probabilidade - Prof. Afonso 13 2. DISTRIBUIÇÃO UNIFORME Seja a variável aleatória X que pode tomar todos os valores num intervalo [a, b]. Se a probabilidade da variável X cair num subintervalo for a mesma para qualquer outro subintervalo de mesmo comprimento, teremos uma distribuição uniforme. Dizemos que a V.A. X segue uma distribuição Uniforme no intervalo [a ,b] e escrevemos ( , ) : U a b X A função densidade de probabilidade será: A representação gráfica da distribuição uniforme é um retângulo com base definida pelos valores a e b que estabelecem os limites de valores possíveis da variável aleatória X. Da definição da distribuição uniforme deduzimos:  A área do retângulo é igual a 1, pois a base é ( b  a ) e a altura ) 1/( b  a .  A probabilidade da variável aleatória X ser igual ou maior que a e, ao mesmo tempo, menor ou igual a b é igual a 1 ou 100%. As principais características são: Média: Variância: Exemplo: A ocorrência de panes em qualquer ponto de uma rede telefônica de km foi modelada por uma distribuição Uniforme no intervalo . Qual é a probabilidade de que uma pane venha a ocorrer nos primeiros metros? A função densidade da distribuição Uniforme é dada por 7 1 ( ) x  f se e zero, caso contrário. Assim, a probabilidade de ocorrer pane nos primeiros 800 metros é: 2 ) ( a b E X     12 ) ( a 2 b Var X   Estatística e Probabilidade - Prof. Afonso 14     E(X ) 2 2 ) (     X VAR 3. DISTRIBUIÇÃO EXPONENCIAL A distribuição de probabilidade do intervalo t entre dois sucessos consecutivos de uma lei de Poisson é a distribuição exponencial. Esta é uma distribuição que se caracteriza por ter uma função de taxa de falha constante. A distribuição exponencial é a única com esta propriedade. Esta distribuição tem sido usada extensivamente como um modelo para o tempo de vida de certos produtos e materiais. Ela descreve adequadamente o tempo de vida de óleos isolantes e dielétricos, entre outros. É amplamente utilizada na teoria das filas para modelar a extensão do tempo decorrido entre chegadas em processos tais como clientes em caixas eletrônicos de bancos, pacientes dando entrada em unidade de emergência em um hospital e pesquisas em um portal de busca na Web. A variável aleatória tem distribuição Exponencial com parâmetro , se tiver função densidade de probabilidade dada por: = parâmetro de taxa da distribuição e deve satisfazer . Neste caso, é o tempo médio de vida e é um tempo de falha. OBSERVAÇÃO: O parâmetro deve ter a mesma unidade do tempo da falha . Isto é, se é medido em horas, também será medido em horas. Dizemos que a V.A. X segue uma distribuição Exponencial de parâmetro  , e escrevemos ( ) : Exp  X As principais características são: Média: Variância: Exemplo: O tempo até a falha do ventilador de motores a diesel tem uma distribuição Exponencial com parâmetro   128700 horas. Qual a probabilidade de um destes ventiladores falhar nas primeiras 24000 horas de funcionamento? OBSERVAÇÃO: A distribuição Exponencial pode ser parametrizada de uma forma alternativa segundo a função densidade de probabilidade : Neste caso, dizemos que   0 é o parâmetro de escala da distribuição e é o inverso do parâmetro taxa na definição acima   1 . Neste definição alternativa, a variável aleatória pode ser interpretada como a duração de tempo em que um sistema mecânico ou biológico sobrevive. Para este caso, denotamos ( ) : Exp  X e, infelizmente, esta definição alternativa torna-se ambígua. Neste caso, devemos verificar qual das duas especificações está sendo utilizada quando escrevemos ( ) : Exp  X . Ou seja, devemos sempre verificar se está se referindo ao parâmetro taxa ou ao parâmetro escala da distribuição. Quando estamos trabalhando com a distribuição exponencial parametrizada com o parâmetro escala   0 temos que: Essa parametrização alternativa é mais interessante, uma vez que o valor médio é igual ao parâmetro.   1 ) (   E X 2 2 1 ) (     X Var              24000 0 24000 0 28700 ,0 567 28700 1 ( ) 24000) (0 dx e f x dx X P x 0 0 0 se x 1       x e (x)  f 0 0 0 0 e se x        x e f (x)  Estatística e Probabilidade - Prof. Afonso 15 4. DISTRIBUIÇÃO GAMA A distribuição exponencial é um caso particular da distribuição gama, que utiliza a função gama, cuja definição apresentamos a seguir. A função gama é definida pela seguinte integral: Note que o argumento da função é  ; que aparece no expoente da variável de integração x. A função gama tem a seguinte propriedade recursiva: Se  é inteiro positivo: 1)! ( ( )      4! 2 1 3 4 (4) 4 5) ( 3! 2 1 3 (3) 3 4) ( 2! 2 1 (2) 2 3) ( (2) (1) !1 1 (1) 1 2) ( 1 1) ( 0 0 1 1                                               dx e dx e x x x Por esta razão, a função gama é por vezes chamada função fatorial. Para  não inteiro (encontra-se tabelado), mas é fácil de se verificar: ,1 7725 ) ( 2 2 ) ( 2 , 2 2 2 ) ( , /2 ) ( 2 1 2 0 2 1 0 2 / 0 2 / 2 1 2 0 2 1 2 2 2 2 1                                  dv e dv du v u du e du u u du dx u x dx e x v u u x Para grandes valores de  , temos a aproximação de STIRLING:           e 2 )1 ( Definição da Distribuição Gama: Diz-se que uma variável aleatória tem distribuição gama com parâmetros   0 e   0 , e escrevemos ) ( , : Gama   X se sua função densidade de probabilidade é dada por:  = parâmetro de forma da densidade gama  = é um parâmetro de escala (afeta fortemente a dispersão) Estatística e Probabilidade - Prof. Afonso 16 Note que, quando  = 1; resulta a densidade exponencial com parâmetro  , ou seja, a densidade exponencial é um caso particular da densidade gama. Exemplo de Gráfico da Distribuição Gama: Principais características da distribuição gama: Média:       E(X ) quando usamos   0 Variância: 2 2 ) (       VAR X quando usamos   0 Exemplo: Suponha que o tempo gasto por um engenheiro selecionado aleatoriamente para executar uma tarefa tem uma distribuição gama com média 2000 horas e desvio-padrão de 400 horas. a) Determine os parâmetros  e  desta densidade. b) Qual a probabilidade do tempo gasto exceder a 2500 horas? 25 80 2000 80 2000 400 2 2 2 2 2 2                                  /80 24 25 /80 1 25 25 / 1 (! 80) 24 1 25) 80 ( 1 ) ( 1 ) ( x x x e x e x e x x f                        0,1104 1-[0,8896] (! 80) 24 1 1 2500) ( 1 2500) ( 2500 0 /80 24 25                   dx e x P X X P x