·
Cursos Gerais ·
Probabilidade
Envie sua pergunta para a IA e receba a resposta na hora

Prefere sua atividade resolvida por um tutor especialista?
- Receba resolvida até o seu prazo
- Converse com o tutor pelo chat
- Garantia de 7 dias contra erros
Texto de pré-visualização
PROBABILIDADE Aplicações à Estatística PAUL L. MEYER 2ª edição LIVROS TÉCNICOS E CIENTÍFICOS EDITORA Para Alan e David PROBABILIDADE Aplicaçõe~ à Estatística PAUL L. MEYER 1519.<1 MG13P~ Tradução fiC Ruy de C. B. Lourenço Filho \ Professor da Universidade Federal do Rio de Janeiro e da Escola Nacional de Ciências Estatísticas (ENCE/1BGE) 2~ EDIÇÃO 1i~I"rnflíllg"lf 0.528.348-4 iJC EDITORA ~ ~ L" edição: 1969- Reimpressões: 1970,1972, 1974, 1975, 1976(duas), 1977, 1978 (duas), 1980, 1981e 1982 2: edição: 1983- Reimpressões: 1991,1994 (duas), 1995, 1997, 1999 e 2000 Copyright@ 1969 por Ao Livro Técnico Título do original em inglês: Introductory Probability and Statistical Applications Copyright@ 1965 e 1969 por Addison-Wesley Publishing Company, Inc. AlI rights reserved. Authorized trans1ation from english 1anguage edition pub1ished by Addison-Wes1ey Publishing Company, Inc. Direitos exclusivos para a língua portuguesa Copyright @ 1983 by L TC - Livros Técnicos e Científicos Editora S.A. Travessa do Ouvidor, 11 Rio de Janeiro, RI - CEP 20040-040 Te!.: 21-221-9621 Fax: 21-221-3202 Reservados todos os direitos. É proibida a duplicação ou reprodução deste volume, no todo ou em parte, sob quaisquer formas ou por quaisquer meios (eletrônico, mecânico, gravação, fotocópia ou outros), sem permissão expressa da Editora. NOTADA EDITORA Temos por norma, nas traduções que editamos, converter as unida- des para o sistema legalno Brasil. No presente caso, abrimos uma exceção. O livro possui problemas nos sistemas inglês, CGS e MKS, que foram mantidos, a conselho de especialistasno assunto, visando a dar ao estudante maior flexibilidade, pela oportunidade de praticar nos diferentes sistemas. A EDITORA PREFÁCIO DA SEGUNDAEDIÇÃO Devido ao considerávelnúmero de observaçõesfavoráveisquerecebi durante os anos passados, tanto de alunos como de professores que empregaram a primeira edição deste livro, relativamente poucas altera- ções foram feitas. Durante a minha própria utilização repetida do livro, verifiquei que a organização básica do conteúdo e o nível geral de apresentação (por exemplo, a mistura de demonstrações matemáticas rigorosas com explanações mais informais e exemplos) estão bastante adequados ao tipo de estudante que se inscreveno curso. No entanto, diversasmodificaçõese acréscimosforam feitos. Antes de mais nada, foi realizado um esforço para eliminar os diversosenganos e erros de impressão que existiam na primeira edição. O autor é extre- mamente grato aos muitos leitores que não somente descobriram algunsdeles, como foram bastante interessados em me apontá-Ios. Em segundo lugar, foi feito um esforço para lançar maior esclareci- mento na relação entre várias distribuições de probabilidade, de modo que o estudante pudesse alcançar maior compreensão de como diversos modelos probabilísticos podem ser empregados para com uni obter aproximação de outro. Finalmente, alguns problemas novos foram acrescentados à já extensa lista incluída na primeira edição. O autor deseja agradecer, mais uma vez, à Addison-WesleyPu- blishing Company, pela sua cooperação em tudo quanto contribuiu para esta nova edição. P.L.M. Pullman, Washington PREFÂCIODA PRIMEIRA EDIÇÃO Se temer que suspeitem ser sua na"ativa inverídica,lembre-sedaprobabilidade. JOHN GAY Este livro é destinado a cursos de um semestre ou dois quadri- mestres, de Introdução à Teoria da Probabilidade e algumas de suas aplicações. O pré-requisito é um ano de Cálculo Diferencial e Integral. Não se supõe qualquer conhecimento prévio de Probabilidade ou de Estatística. Na Washington State University, o curso, para o qual este livrofoi preparado, vem sendo lecionado há algunsanos, principalmente a alunos orientados para a Engenharia ou às Ciências Naturais. A maioria desses alunos pode dedicar somente um semestre ao estudo desta matéria, porém, já que esses alunos estão familiarizados com o Cálculo, estão em condições de começar o estudo desta matéria por um nível além daquele estritamente elementar. Muitos tópicos da Matemática podem ser apresentados em di- ferentes estágios de dificuldade, e isto é certamente verdade para a Probabilidade. Neste livro, faz-se um esforço para tirar' proveito da base matemática do leitor, semultrapassá-Ia.Linguagemmatemática rigorosa é empregada, mas toma-se o cuidado de não se ficar excessi- vamente mergulhado em minúcias matemáticas desnecessárias. Este não é, seguramente, um "livro de receitas". Muito embora alguns conceitos sejam introduzidos e explicados de maneira não formal, as defmições e os teoremas são enunciados cuidadosamente. Quando uma demonstração pormenorizada de um teorema não é factível ou desejável, ao menos um esboço das idéias importantes é oferecido. Um traço peculiar deste livro são os "Comentários", que se seguem à maioria dos teoremas e definições. Nesses Comentários, o particular conceito ou resultado que esteja sendo apresentado é explicado de maneira intuitiva. Em virtude da restrição que nos impusemos, de escrever um livro relativamente conciso sobre um domínio muito extenso, algumas escolhas tiveram de ser feitas, quanto à inclusão ou exclusão de deter- minados tópicos. Não parece existir maneira óbvia de resolver esta XII I PREFAcIO DA PRIMEIRA EDiÇÃO PREFAcIO DA PRIMEIRA EDiÇÃO I XIII questão. Certamente, n[o sustento que para alguns dos tópicos exclui- dos, não se pudesse encontrar um lugar; nem pretendo que alguma parte da matéria n[o se pudesse omitir. Não obstante, para a maior parte dela, deu-se destaque às noções fundamentais, apresentadas bastante pormenorizadamente. Somente o Capo 11, sobre confiabili- dade, poderia ser considerado "artigo supérfluo", mas ainda aqui, sinto que as noções associadasàs questões de confiabilidade são de interesse fundamental para muitas pessoas. Além disso, conceitos de confiabili- dade constituem veículo excelente para se ilustrarem muitas das idéias anteriormente introduzidas ao livro. Muito embora a cobertura seja limitada pelo tempo disponível, uma seleção razoavelmente ampla dos assuntos foi conseguida. De um exame rápido do Sumário, fica evidenciado que cerca de três quartos do livro 8[0 dedicados a assuntos probabilísticos, enquanto o último quarto é dedicado a uma explanação da Inferência Estatística. Apesar de nada haver de extraordinário nesta particular divisãode importância entre Probabilidade e Estatística, creio que um sólido conhecimento dos fundamentos da Probabilidade é obrigatório para uma compreensão adequada dos métodos estatísticos. Idealmente, um curso de Probabi- lidade deveria ser seguido de outro, de Teoria e Metodologia Estatísti- cas. No entanto, como já mencionei anteriormente, a maioria dos alunos que toma este curso não tem tempo para uma exposição de dois semestres nesse domínio e, por isso, senti-me compelido a explanar ao menos alguns dos mais importantes aspectos do tema geral da Inferência Estatística. a sucesso potencial de determinada apresentação de um assunto não deve ser avaliado apenas em termos das idéias específicas aprendi- das e das técnicas específicas adquiridas. A apreciação fmal deve tam- bém levar em conta quão bem o estudante ficará preparado para con- tinuar seu estudo do assunto, sejapor simesmo, seja através do trabalho em um curso complementar. Se este critério for considerado impor- tante, então se tomará evidente que os conceitos básicos e as técnicas fundamentais devam ser salientados, enquanto métodos e tópicos altamente especializados devam ser relegados a um papel secundário. Isto se toma também um importante fator na seleção de quais tópicos incluir. A importância da teoria da Probabilidade é difícil de se exagerar. a modelo matemático apropriado para o estudo de um grande número de fenômenos observáveisé mais um modelo probabilístico do que um determinístico. Além disso, todo o assunto da Inferência Estatística é baseado em considerações probabilísticas. Técnicas estatísticas estão entre as mais importantes ferramentas dos cientistas e engenheiros. A fim de empregar inteligentemente essas técnicas, um profundo conhe- cimento dos conceitos probabilísticos é exigido. Espera-se que, além dos vários métodos e conceitos específicos com os quais o leitor venha a se familiarizar, ele também desenvolva uma certa atitude: a de pensar probabilisticamente, substituindo ques- tões como "Quanto tempo este componente funcionará?" por "Quão provável é que este componente funcione mais do que 100 horas?" Em muitas situações, a segunda questão poderá ser não somente a mais apropriada, mas de fato a única que tenha sentido fazer-se. Tradicionalmente, muitos dos importantes conceitos de probabi- lidade são ilustrados com o auxílio de diferentes "jogos de azar";joga- das de moedas ou dados, extração de cartas de um baralho, giração de uma roleta etc. Muito embora eu n[o tenha evitado inteiramente a referência a tais jogos, já que eles servem para ilustrar as noções funda- mentais, um esforço foi feito para colocar o estudante em contato com ilustrações mais adequadas das aplicações da probabilidade: a emissão de partículas IXpor uma fonte radioativa, amostragem de lotes, duração da vida de dispositivos eletrônicos, e os problemas relacionados de confiabilidade de componentes e de sistemasetc. Estou relutante em mencionar o mais óbvio traço de qualquer livro de Matemática: os problemas. E, no entanto, parece-me proveitoso salientar que a resolução de problemas deve ser considerada parte inte- grante do curso. Somente ao se tomar pessoalmente interessado em propor e resolver os exercícios, poderá realmente o estudante desen- volv~r uma compreensão e apreciação das idéias e uma familiaridade com as técnicas adequadas. Por isso, mais de 330 problemas foram incluídos no livro e, para mais de metade deles, respostas são dadas ao fim do livro. Além dos problemas propostos ao leitor, há numerosos exemplos resolvidos, espalhadosatravés do livro. Este livro foi escrito de maneira bem encadeada: o entendimento da maioria dos capítulos exige conhecimento profundo dos capítulos anteriores. Contudo, é possível examinar os Caps. 10 e 11 um tanto despreocupadamente, particularmente se alguém estiver interessado em dedicar mais tempo às aplicações estatísticas que são explanadas nos Caps. 13 a 15. Tal como deve ser certo para qualquer um que escrevaum livro, os débitos que tenho são muito numerosos: para com meus colegas,por muitas conversas estimulantes e úteis; para com meus próprios profes- sores, pelo conhecimento e interesse neste assunto; para com os críti- cos das versões anteriores do manuscrito, por muitas sugestõese críticas úteis; para com a Addison-WesleyPublishing Company, por sua grande ajuda e cooperação desdê as fases iniciais até o fuo mesmo deste pro- XIV I PREFAcIO DA PRIMEIRA EDIÇAO jeto; para Com a Br!l Carol Sloan, por ser uma datilógrafa eficiente e atenta; paIa com D. Van Nostrand, Inc., The Free Press, Inc. e Mac- millan Publishing Company, por sua permissão para reproduzir as Tábuas 3, 6 e 1, respectivamente; para com McGraw-HillBook Co., Inc., Oxford University Press Inc., Pergamon Press, Ltda. e Prentice- Hall, Inc., por suas permissões para citar determinados exemplos no texto, e, fmalmente para com minha esposa, não somente por me am- parar no esforço, como também por "deixar-me" e levar nossos dois filhos com ela a visitarem os avós, por dois cruciais mesesde verão, du- rante os quais fui capaz de transformar nossa casa em uma desordenada, porém tranqüila oficina, da qual surgiu, miraculosamente, a última versão final deste livro. SUMÁRIO P.L.M. Pullman, Washington Abril, 1965 Caprtulo 1. Introdução à Probabilidade 1.1 Modelos Matemáticos 1 1.2 Introdução aos Conjuntos 4 1.3 Exemplos de Experimentos Não-Determinísticos 8 1.4 O Espaço Amostral 11 1.5 Eventos 13 1.6 Freqüência Relativa 15 1.7 Noções Fundamentais de Probabilidade 17 1.8 Duas Observações 21 Caprtulo 2. Espaços Amostrais Finitos 2.1 Espaço Amostral Finito 26 2.2 Resultados Igualmente Verossímeis 27 2.3 Métodos de Enumeração 29 Caprtulo 3. Probabilidade Condicionada e Independência 3.1 Probabilidade Condicionada 42 3.2 Teorema de Bayes 49 3.3 Eventos Independentes 52 Caprtulo 4. Variáveis Aleat6rias Unidimensionais 4.1 Noção Geral de Variável Aleatória 66 4.2 Variáveis Aleatórias Discretas 72 4.3 A Distribuição Binomial 75 4.4 Variáveis Aleatórias Contínuas 80 4.5 Função de Distribuição Acumulada 85 4.6 Distribuições Mistas 89 4.7 Variáveis Aleatórias Uniformemente Distribuídas 89 4.8 Uma Observação 91 Caprtulo 5. Funções de Variáveis Aleat6rias 5.1 Um Exemplo 97 5.2 Eventos Equivalentes 97 5.3 Variáveis Aleatórias Discretas 100 5.4 Variáveis Aleatórias Contínuas 101 XVI I SUMARIO Caprtulo 6. Caprtulo 7. Caprtulo 8. Caprtulo 9. Variáveis Aleatórias de Duas ou Mais Dimensões 6.1 6.2 6.3 6.4 6.5 Variáveis Aleatórias Bidimensionais Distribuições de Probabilidade Marginal e Condicionada Variáveis Aleatórias Independentes Funções de Variável Aleatória Distribuição do Produto e do Quociente de Variáveis Aleatórias Independentes Variáveis Aleatórias n-Dimensionais 6.6 Caracterização Adicional das Variáveis Aleatórias 7.1 O Valor Esperado de Uma Variável Aleatória 7.2 Expectância de uma Função de uma Variável Aleatória 7.3 Variáveis Aleatórias Bidimensionais 7.4 Prupriedades do Valor Esperado 7.5 A Variância de uma Variável Aleatória 7.6 Propriedades da Variância de uma Variável Aleatória 7.7 Expressões Aproximadas da Expectância e da Variância 7.8 A Desigualdade de Tchebycheff 7.9 O Coeficiente de Correlação 7.1O Valor Esperado Condicionado 7.11 Regressão da Média Variáveis Aleatórias Discretas: A de Poisson e Outras 8.1 8.2 A Distribuição de Poisson A Distribuição de Poisson como Aproximação da Distribuição Binomial O Processo de Poisson A Distribuição Geométrica A Distribuição de Pascal Relação entre as Distribuições Binomial e de Pascal A Distribuição Hipergeométrica A Distribuição Multinomial 8.3 8.4 8.5 8.6 8.7 8.8 Algumas Variáveis Aleatórias Contínuas Importantes 9.1 9.2 9.3 9.4 9.5 9.6 9.7 9.8 Introdução A Distribuição Normal Propriedades da Distribuição Normal Tabulação da Distribuição Normal A Distribuição Exponencial Propriedades da Distribuição Exponencial A Distribuição Gama Propriedades da Distribuição Gama SUMARIO I XVII 110 116 121 124 9.9 A Distribuição de Qui-quadrado 9.10 Comparações entre Diversas Distribuições 9.11 A Distribuição Normal Bidimensional 9.12 Distribuições Truncadas Caprtulo 10. A FunçãoGeratrizde Momentos 128 131 10.1 Introdução 10.2 A Função Geratriz de Momentos 10.3 Exemplos de Funções Geratrizes de Momentos 10.4 Propriedades da Função Geratriz de Momentos 10.5 Propriedades Reprodutivas 10.6 Seqüências de Variáveis Aleatórias 10.7 Observação Final 137 144 149 150 156 159 162 165 167 172 175 Capítulo 11. Aplicações à Teoria da Confiabilidade 11.1 Conceitos Fundamentais 11.2 A Lei de Falhas Normal 11.3 A Lei de Falhas Exponencial 11.4 A Lei de Falhas Exponencial e a Distribuição de Poisson 11.5 A Lei de Falhas de Weibull 11.6 Confiabilidade de Sistemas Caprtulo 12. Somas de Variáveis Aleatórias 186 12.1 Introdução 12.2 A Lei dos Grandes Números 12.3 Aproximação Normal da Distribuição Binomial 12.4 O Teorema do Limite Central 12.5 Outras Distribuições Aproximadas pela Distribuição Normal: a de Poisson, a de Pascal e a Gama 12.6 A Distribuição da Soma de um Número Finito de Variáveis Aleatórias 187 194 200 203 205 206 208 Caprtulo 13. Amostras e Distribuições Amostrais 214 214 215 219 223 223 227 228 13.1 Introdução 13.2 Amostras Aleatórias 13.3 Estatísticas 13.4 Algumas Estatísticas Importantes 13.5 A Transformação Integral Caprtulo 14. Estimação de Parâmetros 14.1 Introdução 14.2 Critérios para Estimativas 14.3 Alguns Exemplos 14.4 Estimativas de Máxima Verossimilhança 14.5 O Método dos Mínimos Quadrados 230 233 234 236. 245 246 247 250 255 259 260 263 267 268 271 273 274 284 286 288 292 297 299 308 310 312 313 321 329 330 334 339 349 XVIII I SUMARIO 14.6 O Coeficiente de Correlação 14.7 Intervalos de Confiança 14.8 A Distribuição de t de Student 14.9 Mais Sobre Intervalos de Confiança Capftulo 15. Testes de Hipóteses 15.1 Introdução 15.2 Formulação Geral: Distribuição Normal com Variância Conhecida 15.3 Exemplos Adicionais 15.4 Testes de Aderência APÊNDICE RESPOSTAS A PROBLEMAS SELECIONADOS INDICAÇÕES BIBLIOGRÁFICAS fNDICE ALFABÉTICO 354 355 357 360 370 Introdução Probabilidade ,a 376 381 385 Capítulo 1 397 412 420 422 1.1. Modelos Matemáticos Neste capítulo examinaremos o tipo de fenômeno que estuda- remos por todo este livro. Além disso, formularemos um modelo matemático que nos ajudará a investigar, de maneira bastante pre- cisa, esse fenômeno. De início, é muito importante distinguir o pr6prio fenômeno e o modelo matemático para esse fenômeno. Naturalmente, não exercemos influência sobre aquilo que observamos. No entanto, ao escolher um modelo, podemos lançar mão de nosso julgamento critico. Isto foi especi.almentebem expresso pelo Prof. J. Neyman, que escreveu:* "Todas as vezes que empregarmos Matemática a fim de estudar alguns fenômenos de observação, deveremos essencialmente começar por construir um modelo matemático (determinístico ou probabilístico) para esses fenô- menos. Inevitavelmente, o modelo deve simplificar as coisas e certos por- menores devem ser desprezados. O bom resultado do modelo depende de que os pormenores desprezados sejam ou não realmente sem importância na elucidação do fenômeno estudado. A resolução do problema matemático pode estar correta e, não obstante, estar em grande discotdância com os dados ob- servados, simplesmente porque as hipóteses básicas feitas não sejam confirma- das. Geralmente é bastante difícil aíirmar com certeza se um modelo mate- mático especificado é ou não adequado, antes que alguns dados de observação sejam obtidos. A fim de verificar a. validade de um modelo, deveremos dedu- zir um certo número de conseqüências de nosso modelo e, a seguir, comparar esses resultados previstos com observações." Deveremos nos lembrar das idéias acima enquanto estivermos estudando alguns fenômenos de observação e modelos apropriados .Univer8ity of Califomia Publicatiom in Stalistics, VoI. I, University of Calüornia. Presa, 1954. 2 I PROBABILIDADE INTRODUÇÃO À PROBABILIDADE I 3 par:a sua explicação. Vamos examinar, inicialmente, o que se pode adequadamente denominar modelo detenninf8tico. Por essa expres- são pretendemos nos referir a um modelo que estipule que as con- dições sob as quais um experimento seja executado determinem o resultado do experimento. Por exemplo, se introduzirmos uma bateria em um circuito simples, o modelo matemático que, presumi- velmente, descreveria o fluxo de corrente elétrica observável seria I = E/R, isto é, a Lei de Ohm. O modelo prognostica o valor de I tão logo os valores de E e R sejam fornecidos. Dizendo de outra maneira, se o experimento mencionado for repetido um certo número de vezes, toda vez utilizando-se o mesmo circuito (isto é, conservan- do-se fixados E e R), poderemos presumivelmente esperar observar o mesmo valor para I. Quaisquer desvios que pudessem ocorrer seriam tão pequenos que, para a maioria .das finalidades, a descrição acima (isto é, o modelo) seria suficiente. O importante é que a ba- teria, fio, e amperômetro particulares utilizados para gerar e obser- var a corrente elétrica, e a nossa capacidade de empregar o instru- mento de medição, determinam o resultado em cada repetição. (Exis- tem determinados fatores que bem poderão ser diferentes de repeti- ção para repetição, que, no entanto, não influenciarão de modo dig- no de nota o resultado. Por exemplo, a temperatura e a umidade no laboratório, ou a estatura da pessoa que lê o. amperômetro, po- de-se razoavelmente admitir, não terão influência no resultado.) Na natureza, existem muitos exemplos de "experimentos", para os quais modelos determiofsticos são apropriados. Por exemplo, as leis da gravitação explicam bastante precisamente o que ~contece a um corpo que cai sob determinadas condições. As leis de Kepler nos dão o comportamento dos planetas. Em cada situação, o. mo- delo especifica que as condições, sob as quais determinado fenÔmeno acontece, determinam o valor de aJ.gumas variáveis observáveis: a grandeza da velocidade, a drea varrida durante determinado pe- dodo de tempo etc. Esses números aparecem em muitascdas fór;' mulas com as quais estamos familiarizados. Por exemplo, sa- bemos que, sob determinadas condições, a distância percorrida (verticalmente, acima do solo) por um objeto é dada por 8 = -16t2 + + vol, onde vo é a velocidade inicial e t o tempo gasto na queda. O ponto, no qual desejamos fixar nossa atenção, não é a forma parti- cular da equação acima (que é quadrática), mas antes o fato de que existe uma relação definida entre t e 8, a qual determina univo- carnente a quantidade no primeiro membro da equação, se aquelas no segundo membro forem fornecidas. - - Para um grande número de situações, o modelo matemático determinístico apresentado acima é suficiente. Contudo, existem também muitos fenômenos que requerem um modelo matemático diferente para sua investigação. São os que denominaremosmodelos não-detenninf8ticosou probabÜf8ticos. (Outra expressão muito comu- mente empregada é modelo estocástico.) Mais adiante neste capítulo, estudaremos muito minuciosamente, como tais modelos probabilisticos podem ser apresentados. Por ora, examinaremos alguns exemplos. Suponhamos que se tenha um fragmento de material radioativo que emita partículas alia. Com o auxílio de um dispositivo de con- tagem, poderemos registrar o número dessas partfculas emitidas durante um intervalo de tempo especificado. ~ evidente que não poderemos antecipar precisamente o número de partículas emitidas, ainda que se conheçam de modo exato a forma, a dimensão, a compo- sição química e a massa do objeto em estudo. Por isso, parece não existir modelo determinfstico razoável que forneça o número de par- tículas emitidas, por exemplo n, como uma função de várias carac- terísticas pertinentes ao material fonte. Deveremos considerar, em seu lugar, um modelo probabilistico. Como outro exemplo, considere-se a seguinte situação meteo- rológica. Deseja-se deterniinar qual a precipitação de chuva que cairá como resultado de uma tempestade particular, que ocorra em determinada localidade. Dispõe-se de instrumentos para registrar a precipitação. Observações meteorol6gicas podem nos fornecer considerável informação relativa à tempestade que se avizinhe: pressão barométrica em vários pontos, variações de pressão, velocidade do vento, origem e direção da tormenta, e várias leituras referentes a altitudes elevadas. Contudo, quão valiosas essas informaçõespossam ser para o progn6stico da natureza geral da precipitação (digamos, fraca, média ou forte), simplesmente não tornam possível dizer-se quanta chuva irá cair. Novamente estaremos nos ocupando de um .fenÔmeno que não se presta a um tratamento determinístico. Um modelo probabilistico explica a situação mais rigorosamente. Em princípio, poderemos ser capazes de dizer quanta chuva caiu se uma teoria tiver sido desenvolvida (o que não foi). Por isso, empregaremos um modelo probabilístico. No exemplo que trata de desintegração radioativa, deveremos empregar um modelo probabi- listico invariavelmenteem prindpio. Arriscando-nos a adiantarmos demais na apresentação de um conceito que será definido posteriormente, vamos apenas afirmar que, em um modelo determinístico, admite-se que o resultado efetivo 4 I PROBABILIDADE INTRODUÇÃO À PROBABILIDADE I 5 1.2. Introdução aos Conjuntos objetos que estejam sendo estudados. Este conjunto é, geralmente representado pela letra U. O outro conjunto que deve ser destacado pode surgir da seguinte maneira: Suponha.-se que o conjunto A seja descrito como o con- junto de todos os números reaiB x, que satisfaçam à equação Xl + 1 = O. Naturalmente, sabemos que não existem tais números; isto é, o conjunto A não contém qualquer elemento. Esta situação ocorre tão freqüentemente que se justifica a introdução de um nome especial para esse conjunto. Por isso, definiremos o conjunto vazio ou nulo como o conjunto que não contenha qualquer elemento. Ge- ralmente se representa esse conjunto por 0. Pode acontecer que, quando dois conjuntos A e B sejam consi- derados, ser elemento de A implique ser elemento de B. Nesse caso, diremos que .,4 é um subconjunto'de B, e escreveremos A C B. In- terpretação semelhante será dada para B C A. Diremos que dois conjuntos constituem o mesmo conjunto, A = B, se, e somente se, A C B e B C A. Desse modo, dois conjuntos serão iguais se, e so- mente se, eles contiverem os mesmos elementos. As duas seguintes propriedades do conjunto vazio e do conjunto fundamental são imediatas: (numérico ou de outra espécie) seja detenninado pelas condições sob as quais o experimento ou o procedimento seja executado. Em um modelo não-determinístico, no entanto, as condições da experi- mentação determinam somente o comportamento probabilístico (mais especificamente, a lei probabilística) do resultado observável. Em outras palavras, em um modelo determinístico empregamos "considerações físicas" para prever o resultado, enquanto em um modelo probabilístico empregamos a mesma espécie de considerações para especificar uma distribuição de probabilidade. A fim de expor os conceitos básicos do modelo probabilístico que desejamos desenvolver, será conveniente conhecer algumas idéias e conceitos da teoria matemática dos conjuntos. Este é um assunto dos mais extensos e muito se tem escrito sobre ele. Contudo, neces- sitaremos apenas de algumas noções fundamentais. Um conjunto é uma coleção de objetos. Usualmente, conjuntos são representados por letras maiúsculas A, B etc. Existem três maneiras de descrever que objetos esttio contidos no conjunto A: (a) Poderemos fazer uma lista dos elementos de A. Por exem- plo, A = 11,2, 3, 4} descreve o conjunto formado pelos inteiros positivos 1, 2, 3, 4. (b) Poderemos descrever o conjunto A por meio de palavras. Por exemplo, poderemos dizer que A é formado de todos os números reais entre O e 1, inclusive. (c) Para descrever o conjunto acima poderemos simplesmente éscrever A = Ix IO~ x ~ I} i isto é, A é o conjunto de todos os x. onde x é um número real entre Oe 1, inclusive. (a) Para todo conjunto A, temos que 0 C A. (b) Desde que se tenha definido o conjunto fundamental, então, para todo conjunto A, considerado na composição de U, teremos AC U. Os objetos que individualmente formam a coleção ou conjunto A são denominados membros ou elementos de A. Quando "a" for um elemento de A, escreveremos a E A, e quando "a" não for um elemento de A, escreveremos a EEA. Existem dois conjuntos especiais que, freqüenternerite, nos in- teressarão. Em muitos pronlemas nos dedicaremos a estudar um conjunto definido de objetos, e não outros. Por exemplo, poderemos nos interessar por todos os números reais, por todas as peças que saem de uma linha de produção durante um período de 24 horas etc. Definiremos o conjunto fundamental como o conjunto de todos os Exemplo 1.1. Suponha-se que U = todos os números reais, A = IxIx2 + 2x ~ 3 = O}, B = IxI (x - 2) (x2 + 2x - 3) = O} e C = Ixlx = -3,1, 2}. Então, A C B e B = C. A seguir, estudaremos a importante idéia de combinar conjun- tos dados, a fim de formarmos um novo conjunto. Há duas opera- ções fundamentais, e essas operações se assemelham, em certos as- pectos, à.<3operações de adição e multiplicação de números. Sejam dois conjuntos A e B. Definiremos C como a união de A e B (algumas vezes denomi- nada a soma de A e B), da seguinte maneira: C = Ixlx E A ou x E B (ou ambos)}. Escreveremos a união de A e B, assim: C = A U B. Desse modo, , C será formado de todos os elementos que estejam em A, ou em B, ou em ambos. 6 I PROBABI LI DADE INTRODUÇÃO À PROBABILIDADE I 7 Definiremos D como a inter8eçãode A e B (algumas vezes deno. minada o prodüto de A e B), da seguinte maneira: D = {xix E A e x E B}. Afirmamos que alguns conjuntos são equivalentes, por exemplo, A () (B () C) e (A () B) () C. Conclui-se que existe ul)l certo número de tais conjuntos equivalenre8,alguns dos quais estão rela- cionados abaixo. Se nos lembrarmos de que dois conjuntos são o mesmo conjunto sempre que eles contenham os mesmos elementos, será fácil mostrar que as afirmações feitas são verdadeiras. O leitor poderá se convencer disso, com a ajuda dos Diagramas de Venn. Escreveremos a interseção de A e B, assim: D = A () B. Portanto, D será formado de todos os elementos que estão em A e em B. Finalmente, introduziremos a noção de camplemento'de um con- junto A, na forma seguinte: O conjunto denotado por A, consti- tlÚdo por todos os elementos que não estejam em A (mas que e~tejam no conjunto fundamental U) é denominado complemento de A. Isto é, A = {xix EEAI. Um recurso gráfico, conhecido como Diagrama de Venn, poderá ser vantajosamente empregado quando estivermos combinando con- juntos, na maneira indicada acima. Em cada diagrama na Fig. 1.1, a região 8ambreadarenresenta o conjunto sob exame. (a) A U B = B U A, (b) A () B = B () A, (1.1) (c) A U (B U C)=(A U B) U C, (d) A () (B () C) = (A () B) () C. Denominaremos (a) e (b) leis camutativas, e (c) e (d) leis aB8ociativaB. AuB AnB Há outras identidade8de conjuntos encerrando união, interseção e complementação. As mais importantes delas estão enumeradas a seguir. A validade de cada uma delàS poderá ser verificada com a ajuda de um Diagrama de Venn. CD (e) A U (B () C)= (A U B) () (A U C), (f) A () (B U C) = (A () B) U (A () C), (g) A () 0 = 0, (h) A U 0 = A, ú) (A n B) = A U R, (1.2) (t) (A U B) = 11() R, (k) A = A. Flg. 1.1 Observe-se que (g) e (h) mostram que 0 se comporta entre os con- juntos (relativamente às operações'U e () da maneira que o nú- mero zero (com relação às operações de adição e multiplicação) o faz entre os números. Uma outra maneira de formar conjuntos, quando forem dados dois (ou mais) conjuntos, será necessáriaa seguir. Exemplo 1.2. Suponha-se que U = {I, 2, 3, 4, 5, 6, 7, 8, 9, 10I, A = {I, 2, 3, 4I, B = {3, 4, 5, 6I. Então, encontraremosque A = {5,6, 7, 8, 9, 10I, A U B = {I, 2, 3, 4, 5, 6I e A () B = {3,4I. Observe-se que, ao descrever um conjunto (tal como A U B), cada elemento é relacionado apenas uma vez. As operações de união e interseção, definidas acima para dois conjuntos, podem ser estendidas, intuitivamente, para qualquer número finito de conjuntos. Assim, definiremos A U B U C como A U (B U C) ou (A U B) U C, o que é equivalente, comose poderá ;verificar facilmente. De modo análogo, definiremos A () B n C como sendo A () (B n C) ou (A n B) n C, o que também se pode verificar serem equivalentes. ~ evidente que poderemos continuar essas composiçõesde conjuntos para qualquernúmero Jinito de con- juntos dados. . Definição. Sejam dois conjuntos A e B. Denominaremos produto cartesianode A e D, denotando-o por A XD, o conjunto {(a, b), a EA, b E DI, isto é, o conjunto de todos os pares ordenados nos quais o pri- meiro elemento é tirado deA e o segundo,de D. Exemplo 1.3. Suponha-se que A = {l, 2, 31;B = {I, 2,3,41. Então, A XD = {(1, 1), (1, 2),..., (1, 4), (2,1)... , (2, 4), (3,1), ... , (3,4)}. Observação. Em geral,A XB "* B XA. 8 / PROBABILIDADE INTRODUÇÃO À PROBABILIDADE / 9 A noção acima pode ser estendida da seguinte maneira: Se A 1, ... , An forem conjuntos, então,A1 XA2 X ...XAn ={(al,a2,...an), ai EAi I, ou seja, o conjunto de todas as ênuplas ordenadas. E1: Jogue um dado e observe o número mostrado na face de cima. Um caso especialimportante surgequando consideramoso produto cartesiano de um conjunto por ele próprio, isto é,A XA ouA XA XA. Exemplos disso surgem quando tratamos do plano euclideano, R X R, onde R é o conjunto de todos os números reais, e do espaço euclideano tridimensional, representado por R XR XR. O número de elementosde um conjunto terá grande importância para nós. Se existir um número finito de elementos no conjunto A, digamos aloa2, . . ., an,diremosqueA éfinito. Se existirum número infinito de elementos em A, os quais possam ser postos em correspon- dência biunívocacom os inteiros positivos, diremos que A é numerdvel ou infinito numerável. (Pode-se mostrar, por exemplo, que o con- junto de todos os números racionais é numerável.) :.Finalmente, deveremos considerar o caso de um conjunto infinito não-numerável; este tipo de conjunto possui um número infinito de elementos que não podem ser enumerados. Pode-se mostrar, por exemplo, que para quaisquer dois números reais b > a, o conjunto A = Ix Ia ~ x ~ bI contém um número não-numerável de elementos. Já que poderemos associar um ponto da reta dos números reais a cada número real, o que dissemos acima afirma que qualquer intervalo (não degenerado) contém mais do que um número contável de pontos. Os conceitos apresentados acima, muito embora representem apenas um rápido exame da teoria dos conjuntos, são suficientes para nossos objetivos: expor, com razoável rigor e precisão, as idéias fundamentais da teoria da probabilidade. E2: Jogue uma moeda quatro vezes e observe o número de caras obtido. E3: Jogtie uma moeda quatro vezes e observe a seqüência obtida de caras.e coroas. E.: Em uma linha de produção, fabrique peças em série e conte o número de peças defeituosas produzidas em um período de 24 horas. E&: Uma asa de avião é fixada por um grande número de rebi- tes. Conte o número de rebites defeituosos. 1.3. Exemplos de Experimentos Não-Determinísticos Ea: Uma lâmpada é fabricada. Em seguida é ensaiada quanto à duração da vida, pela colocação em um soquete e ano- tação do tempo decorrido (em horas) até queimar. E7: Um lote de 10 peças contém 3 defeituosas. As peças são retiradas uma a uma (sem reposição da peça retirada) até que a última peça defeituosa seja encontrada. O núme- ro total de peças retiradas do lote é contado. E.: Peças são fabricadas até que 10 peças perfeitas sejam pro- duzidas. O número total de peças fabricadas é contado. E.: Um míssil é lançado. Em um momento especificado t, suas três velocidades cOqlponentes,Vz,VIIe v. são observadas. ElO: Um míssil récem-lançado é observado nos instantes t1, t2,..., tn. Em cada um desses instantes, a altura do míssil acima do solo é registrada. Eu: A resistência à tração de uma barra metálica é medida. Eu: De uma uma, que só contém bolas pretas, tira-se uma bola e verifica-se sua cor. Eu: Um termógrafo registra a temperatura continuamente, num período de 24 horas. Em determinada localidade e em uma data especificada, esse termógrafo é lido. Eu: Na situação descrita em Eu, x e y, as temperaturas mínima e máxima, no período de 24 horas considerado, são regia- tradas. O que os experimentos acima têm em comum? Os seguintes tra- ços são pertinentes à nossa caracterização de um experimemo aleatório: (a) Cada experimento poderá. ser repetido indefinidamente sob condições essencialmente inalteradas. Estamos agora em condições de examinar o que entendemos por um experimento "aleatório" ou "não-determinístico". (Mais preci- samente, daremos exemplos de fenômenos, para os quais modelos não-determinísticos são apropriados. Esta é uma distinção que o leitor deverá guardar. Portanto, nos referiremos freqüentemente a experimentos não-determinísticos ou aleatórios, quando de fato estaremos falando de um modelonão-determinístico para um experi- mento.) :r\'ãonos esforçaremos em dar uma definição precisa deste r::onceito. Em vez disso, citaremos um grande número de exemplos que ilustrarão o que temos em mente. 10 I PROBABILIDADE INTRODUÇÃO À PROBABILIDADE I 11 (b) Muito embora não sejamos capazes de afirmar que resul- tado particular ocorrerá, seremos capazes de descrever o conjunto de todos os possíveis resultados do experimento. (c) Quando o experimento for executado repetidamente, os resultados individuais parecerão ocorrer de uma forma acidental. Contudo, quando o experimento for repetido um grande número de vezes, uma configuração definida ou regularidade surgirá. É esta regularidade que toma possível construir um modelo matemático preciso, com o qual se analisará o experimento. Mais tarde, teremos muito que dizer sobre a natureza e a importância desta regularidade. Por ora, o leitor necessita apenas pensar nas repetidas jogadas de uma moeda equilibrada. Muito embora caras e cor6'as apareçam sucessivamente, em uma maneira quase arbitrária, é fato empírico bem conhecido que, depois de um grande número de jogadas, a pro- porção de caras e a de coroas serão aproximadamente iguais. Deve-se salientar que todos os experimentos descritos acima satisfazem a essas características gerais. (Evidentemente, a última característica mencionada somente pode ser verificada pela experi- mentação; deixaremos para a intuição do leitor acreditar que se o experimento fosse repetido um grande número de vezes, a regulari- dade referida seria evidente. Por exemplo, se um grande número de lâmpadas, de um mesmo fabricante, fosse ensaiado, presumivel- mente o número de lâmpadas que se queimaria após 100horas poderia ser previsto com precisão considerável.) Note-se que o experimento E 12 apresenta o traço peculiar de que somente um resultado é possível. Em geral, tais expel"ÚT'entosnão nos interessarão, porque, realmente, o fato de não sabermos qual particular resultado virá a ocorrer, quando um experimento for realizado, é que torna um experimento interessante para nós. Comentdrio: Ao descrever os diversos experimentos, nós especificamos não somente o procedimento que tem que ser realizado, mas também aquilo que estaremos interessados em observar (veja, por exemplo, a diferença entre E 2 e E 3' citados anteriormente). Este é um ponto muito importante, ao qual novamente nos referiremos mais tarde, quando explicarmos variáveis aleatórias. Por ora, vamos apenas comentar que, em conseqüência de um procedimento experimental isolado ou a ocorrência de um fenômeno único, muitos valores numéricos diferen- tes poderiam ser calculados. Por exemplo, se uma pessoa for escolhida de um grupo grande de pessoas (e a escolha real seria o procedimento experimental previamente mencionado), poderíamos estar interessados na altura daquela pessoa, no seu peso, na sua renda anual, no número de filhos dela etc. Naturalmente, na maioria dos casos, nós saberemos, antes de iniciar nossa experimentação, quais serão as características numéricas em que iremos estar interessados. 1.4. O Espaço Amostral Definição. Para cada experimento S do tipo que estamos con- siderando, definiremos o espaçoamostralcomo o conjunto de todos os resultados possiveis de S. Geralmente representaremos esse conjunto por S. (Neste contexto, 8 representa o conjunto fundamental, expli- cado anteriormente.) Vamos considerar cada um dos experimentos acima e descrever um espaço amostral para cada um deles. O espaço amostra! 8i s& referirá ao experimento Ei. SI: 11,2,3,4,5, 6}. 82: 10, 1, 2, 3, 4}. S3: Itodas as seqüências possiveis da forma aI>a2,aa, a.}, onde cada a; = H ou T, conforme apareça cara ou coroa na i-ésima jogada. S.: 10,1,2'00" Nj,ondeNéonúmeromáximoquepodeser produzido em '24 horas. S6: 1o, 1, 2,..., M j, onde M é o número de rebites empre- gado. S8: Itlt ~ O}. S7: 13, 4, 5, 6, 7, 8, 9, 1O}. S8: 110, 11, 12,. ..}. Se: IVz,VII'v.1Vz,VII'V. números reais}. SIO: Ihl,..., hnlhi ~ °, i = 1, 2,..., n}. 811: ITIT~O}. S12: Ibola preta}. SII: Este espaço amostral é o mais complexo de todos os consi- derados aqui. Podemos admitir, com realismo, que a tem- peratura em determinada localidade nunca possa ocorrer acima ou abaixo de certos valores 1If e m. Afora esta res- trição, poderemos aceitar a possibilidade de que qualquer gráfico apareça com determinadas restrições. Presumi- velmente, o gráfico não terá saltos (isto é, ele representará uma função contínua). Além disso, o gráfico terá certas caracterlsticas de regularização, que podem ser resumidas matematicamente dizendo-se que o gráfico representa uma função derivável. Deste modo, poderemos finalmente afirmar que o espaço amostral será: liIJ uma função derivável, que satisfaça a m ~ ~ J(t) ~ M, para todo t}. 12 I PROBABILIDADE INTRODUÇÃO À PROBABILIDADE I 13 S14: /(X, y) 1m:::; X :::; Y :::; 11/}. Isto é, S14 é fonnado por todos os pontos dentro e sobre um triângulo, no plano x, y bidi- mensiona!. por exemplo se H = 100. Torna-se bem mais simples e, matemati- . camente, conveniente, admitir que todo8 os valoresdet ~ ° sejamre- sultados possíveis e, portanto, tratar o espaço amostrai Ss tal como foi originalmente definido. Diante desses comentários, alguns dos espaços amostrais des- critos são idealizados. Em todas as situações subseqüentes, o espaço amostral considerado será aquele que for matematicamente mais conveniente. Na maioria dos problemas, pouca dúvida surge quanto à escolha adequada do espaço amostra!. (Neste livro não cuidaremos de espaços amostrais da complexidade encontrada em S13' 1\0 entanto, tais espaços amostrais podem sur- gir, mas exigem para seu estudo mais :\latemática avançada do que estamos admitindo aqui.) A fim de descrever um espaço amostral associado a um experimento, devemos ter uma idéia bastante clara daquilo que estamos mensurando ou observando. Por isso, devemos falar de "um" espaço amostral associado a um experimento, e não de "o" espaço amostra!. A esse respeito, note-se a diferença entre S2 e S3' Saliente-se, também, que o resultado de um e:\:perimentonão é necessariamente, um número. Por exemplo, em E3, cada resultado é uma seqüência de caras (H) e ~oroas (T). Em Eg e Elo cada re- sultado é formado por um vetor, enquanto em Eu, cada resultado constitui uma função. Será também importante estudar o número de resultados em um espaço amostra!. Surgem três possibilidades: o espaço amostral pode ser finito, infinito numerável, ou infinito não-numeráve!. Re- lativamente aos exemplos acima, observamos que SI>S2, S3, S., S~, S7 e Su são finitos, S8 é infinito numerável, e Ss, Sg, SIO,Su, Su e S14 são infinitos não-numeráveis. Neste ponto poderá ser valioso comentar a diferença entre um espaço amostral "idealizado" matematicamente e um espaço reali- zável experimentalmente. Com este objetivo, consideremos o expe- rimento Es e seu espaço amostral associado Ss. f; evidente que, quando estivennos realmente registrando. o tempo total t, durante o qual uma lâmpada funcione, seremos "vitimas" da precisão de nosso instrumento de medir. Suponha-se que temos um instrumer.to que seja capaz de registrar o tempo com duas casas decimais, por exem- plo, 16,43 horas. Com esta restrição imposta, nosso espaçQ amos- trai se tornará infinito numerável: /0,00, 0,01,0,02,..:}. Além disso, é bastante próximo da realidade admitir que nenhuma lâmpada possa durar mais do que H horas, onde H pode ser um número muito grande. Conseqüentemente, parece que se fonnos completamente realistas na descrição deste espaço amostral, estaremos realmente tratando com um espaçoamostralfinito: {O,OO,0,01,0,02,.. ., H}. O número total de resultados seria (H/O,OI)+ 1, que poderá ser um númeromuitogrande,mesmoque H sejamoderadamentegrande, 1.5. Eventos Outra noção fundamental é o conceito de evento. Um evento A (relativo a um particular espaço amostral S, associado a um expe- rimento 8) é -simplesmenteum conjunto de resultados possíveis. Na terminologia dos conjuntos, um evento é um 8ubconjuntode um es- paço amostral S. Considerando nossa exposição anterior, isto sig- nifica que o próprio S constitui um evento, bem como o é o conjunto vazio 0. Qualquer resultado individual pode também ser tomado como um evento. Alguns exemplos de eventos são dados a seguir. Novamente, nos referimos aos experimentos relacionados acima: Ai se referirá ao evento associado ao experimento Ei: AI: Um número par ocorre, isto é, AI = /2, 4, 6}. A2: /2}; isto é, duas caras ocorrem. Aa: /HHHH, HHHT, HHTH, HTHH, THHH}; isto é, mais caras do que coroas ocorreram. A.: /O}; isto é, todas as peças são perfeitas. Ai: /3,4,.. " M}; isto é, mais do que dois rebites eram defei- tuosos. As: /t I t < 3}; isto é, a lâmpadaqueimaemmenosde 3 horas. Au: /(x, y) Iy = x + 2O}; isto é, a temperatura máxima é 200 maior do que a mínima. Quando o espaçó amostra! S for finito ou infinito numerável, todo subconjunto poderá ser considerado um evento. [Constitui um exercício fácil de provar, e o faremos resumidamente, que se S cdn- tiver n elementos, existirão exatamente 2" subconjuntos (eventos).] Contudo, se S for infinito não-numerável, surgirá uma. dificuldade teórica. Verifica-se que nem todo subconjunto imaginável poderá 14 / PROBABILIDADE INTRODUÇÃO À PROBABILIDADE / 15 ser considerado um evento. Determinados subconjuntos "não admis- siveis" deverão ser excluidos por motivos que ultrapassam o nivel desta explanação. Felizmente, tais subconjuntos não-admissiveis não surgem nas aplicações e, por isso, não cuidaremos deles aqui. Na exposição subseqüente, será admitido tacitamente que sempre que nos referirmos a um evento, ele será da espécie que já admitimos considerar. Agora, poderemos empregar as várias técnicas de combinar con- juntos (isto é, eventos) e obter novos conjuntos (isto é, eventos), os quais já apresentamos anteriormente. representa o conjunto de todos os possíveis resultados, quando a. for executado n vezes. De certo modo, S X S X . . . X S é ele próprio um espaço amostral, a saber, o espaço amostral associado a n repetições de a.. Definição. Dois eventos, A e B, são denominados mutuamente excludentes,se eles não puderem ocorrer juntos. Exprimiremos isso escrevendoA n B = 0, isto é, a interseção de A e B é o conjunto (a) Se A e B forem eventos, A U B será o evento que ocorrerá se, e somente se, A ou B (ou ambos) ocorrerem. (b) Se A e B forem eventos, A n B será o evento que ocorrerá se, e somente se, A e B ocorrerem. vazio. Exemplo 1.4. Um dispositivo eletrônico é ensaiado e o tempo total de serviço t é registrado. Admitiremos que o espaço amostral seja {tlt;2: O}. Sejam A, B e C três eventos definidos da seguinte maneira: A = {tlt < loo}; B = {tI,50::; t::; 2OO-j;C.= {tlt > 150}. (c) Se A for um eventó, A será o evento que ocorrerá se, e so- mente se, não ocorrer A. (d) Se A" ' . ., An for qualquer coleção finita de eventos, então, U:-l Ai será o evento que ocorrerá se, e somente' se, ao menos um dos eventos Ai ocorrer. Conseqüentemente, A U B = {tlt::; 2ooj; A n B = {tI50::; t < looj; B U C = {tIt ;2:50}; B n C = {t1150< t ::; 200j; A n C = 0; AUC= {tlt< lOOout>150j; A= {tlt;2:1oo};C={t!t::;150j. (e) Se AI, ..., An for qualquer coleção finita de eventos, então n:-I Ai será o evento que ocorrerá se, e somente se, todosos eventos Ai ocorrerem. Uma das características fundamentais do conceito de "experi- mento", como foi apresentado na seção anterior, é que nós não sa- bemos qual resultado particular ocorrerá quando o experimento for realizado. Por outras palavras, se A for um evento associado a um experimento, então, não poderemos afirmar com certeza que A irá ocorrer ou não. Por isso, torna-se muito importante tentar associar um número ao' evento A, o qual medirá de alguma maneira quão verossímil é que o evento A venha a ocorrer. Essa tarefa nos leva à teoria da probabilidade. (f) Se A" . . .. An,. .. for qualquer coleção infinita (numerável) de eventos, então, Ui:1 Ai será o evento que ocorrerá se, e somente se, ao menos um dos eventos Ai ocorrer. (g) Se A" .. ., An,... for qualquer coleção infinita (numerável) de eventos, então, ni:1 Ai será o evento que ocorrerá se, e somente se, todosos eventos Ai ocorrerem. 1.6. Freqüência Relativa (h) Suponha-se que S represente o espaço amostral associado a algum experimento 8., e que nós executemos 8. duas vezes. Então, S X S poderá ser empregado para representar todos .osresultados dessas duas repetições. Portanto, (SI. S2) E S X S significa que S1 resultou quando 8. foi executado a primeira vez e S2. quando8.foiexecutadoa segundavez. (i) O exemplo contido em (h) pode, obviamente, sergeneralizado. Considerem-s~n repetições de um experimento 8. cujo espaço amostra! sejaS: S XS X . . . XS = {(S 1 , S2 , . . . , Sn)' SiE S, i = I, .. . , n j A fim de motivar a maneira de tratar o assunto, considere-se o seguinte procedimento: Suponha-se que repetimos n vezes o expe- rimento 8, e sejam A e B dois eventos associados a 8. Admitamos que sejam, respectivamente, nA e nB o número de vezes que o evento A e o evento B ocorram nas n repetições. Definição. iA = nA(n é denominada freqüência relativado evento A nas n repetições de 8. A freqüência relativafA apresenta as seguin- tes propriedades, de fácil verificação: (1) O ::; iA ::; 1. (2) i A = 1 se, e somente se, A ocorrer em todasas n repetições. 16 I PROBABILIDADE INTRODUÇÃO À PROBABILIDADE I 17 (3) tA = Ose, e somente se, A nunca ocorrer nas n repetições. (4) Se A e B forem eventos mutuamente excludentes, e setA UB for a freqüência relativa associada ao evento A U B, então, tA U B = = tA +tB . (5) tA, com base em n repetições do experimento e considerada como uma função de n, "converge" em certo sentido probabilístico para P (A ), quando n -+00. Comentdrio: A Propriedade (5) está evidentemente expressada um tanto vagamente, nesta seção. Somente mais tarde (Seç. 12.2), estaremos aptos a tornar esta idéia mais precisa. Por enquanto, podemos apenas afirmar que a Propriedade (5) envolve a noção nitidamente intuitiva de que a freq üência relativa, baseada em um número crescente de observações, tende a se "estabilizar" próximo de algum valor definido. Este não é o mesmo conceito usual de convergência encontrado em alguma parte da Matemática. De fato, tal como afirmamos aqui, esta não é, de modo algum, uma conclusão matemática, mas apenas um fato empírico. Esta propriedade de estabilidade da freqüênda relativa é, por enquanto, uma. noção inteiramente intuitiva, porém mais tarde es- taremos aptos a tomá-Ia matematicamente precisa. A essência desta propriedade é que, se um experimento for executado um grande número de vezes, a freqüência relativa da ocorrência de algum evento A tenderá 8.variar ca.davez menos à medida que o número de repe- tições for aumentada. Esta característica é também conhecida como regularidadeestatística. N6s fomos um tanto vagos em nossa definição de experimento. Quando um procedimento ou mecanismo constituirá, em nossa acep- ção, um experimento capaz de ser estudado matematicamente por meio de um modelo não-determinístico 1 Já afirmamos, anteriormente, que um experimento deve ser capaz de ser realizado repetid;1mente, sob condições essencialmente inalteradas. Agora, podemos acres- centar outra condição. Quando o experimento for repetidamente realizado, ele deverá. apresentar a regularidade estatística mencio- nada acima. Mais adiante, estudaremos um teorema (denominado Lei dos Grandes Números) que mostrará que a regularidade estatís- tica é, de fato, uma conseqüênciada primeira condição: reprodutibi- lidade. A maioria de nós está intuitivamente a par deste fenômeno de estabilização, muito embora nunca o tenhamos verificado. Fazê-Ioexige considerávelporção de tempo e de paciência, porque inclui um grande número de repetições de um experimento. Contudo, algumas vezes, poderemos ser ingênuos observadores deste fenômeno, como ilustra o seguinte exemplo: Exemplo 1.5. Admitamos que estejamos postados na calçada e fixemosnossa atenção em doisblocos demeio-fioadjacentes.Suponha-se que comece a chover de tal maneira que sejamos realmente capazes de distinguir pingos isolados de chuva e registrar se essespingos caemnum meio-fio ou noutro. Ficamos a observar os pingos eaanotar seu ponto de impacto. Denotando o i-ésimopingo por Xi>onde Xi = I se o pingo cair no primeiro meio-fio, e igual a O se cair no outro, poderemos observaruma seqüência como, por exemplo, I, 1, O,1, O,O,O,I, O,0,1. ~ evidente que não seremoscapazes de prever onde um particular pingo irá cair. (Nosso experimento consta de alguma espécie de situação me- teorológica que causa a queda dos pingos de chuva.) Se calcularmos a freqüência relativa do evento A = {o pingo cai no meio-fio I}, então, a seqüência de resultados acima dará origem às seguintes freqüências relativas (baseadas na observação de 1, 2, 3, .-.pingos): 1,1,2/3,3/4, 3/5, 3/6, 3/7,4/8,4/9,4/10,5/11, " . Esses números evidenciam um elevado grau de variação, especialmente no início. É intuitivamente evidente que, se o experimento acimacontinuasseindefmidamente, essas freqüências relativas iriam se estabilizar próximas do valor 1/2. Conse- qüentemente, teríamos toda razão em acreditar que, depois de algum tempo decorrido, os dois meios-fiosestariam igualmente molhados. 1.7. Noções Fundamentais de Probabilidade Voltemos agora ao problema proposto acima: atribuir um número a cada. evento A, o qual avaliará quão verossímil será a ocorrência. de A quando o experimento for realizado. Uma possivel maneira de tratar a questão seria a seguinte: repetir o experimento um grande número de vezes, calcular a freqüência relativa f A e utilizar esse nú- mero. Quando recordamos as propriedades de f A, toma-se evidente que este número fornece uma informação muito precisa de quão ve- rossímilé a ocorrência de A. Além disso,.sabemos que à medida que o experimento se repetir mais e mais vezes, a freqüência relativa fAse estabilizará pr6xima de algum número, suponhamos p. Há, con- tudo, duas sérias objeções a esta maneira de tratar a questão: (a) Não está esclarecido quão grande deva ser n, antes que se conheça o nú- mero: 1.0001 2.oo0? lO.ooo? (b) Uma vez que o experimento tenha sitio completamente' descrito e o evento A especificado, o número que estamos. procurando não deverá depender do experimentador ou da particular veia de sorte que ele possua. {Por exemplo, é pos- sível que uma moeda perfeitamente equilibrada, quando jogada 10 vezes, venha a apresentar 9 caras e 1 coroa. A freqüência rela- tiva do evento A = locorrer cara I seria, nesse caso, igual a 9/10. 18 I PROBABILIDADE INTRODUÇÃO À PROBABILIDADE I 19 No entanto, é evidente que nas pr6ximas 10 jogadas o padrão de caras e coroas possa se inverter.) O que desejamos é um meio de obter tal número, sem recorrer à experimentação. Naturalmente, para. que o número que convencionarmos tenha significado, qualquer experimentação subseqüente deverá produzir uma freqüência rela- tiva que seja "pr6xima" do valor convencionado, particularmente se o número de repetições, no qual a freqüência relativa calculada se tenha baseado, for muito grande. N6s procederemos,formalmente, da seguinte maneira: Definição. Seja S um experimento. Seja S um espaço amostral associado a S. A cada even1ioA associaremos um número real re- presentado por P(A) e denominado probabilidadede A, que satisfaça à.s seguintes propriedades: terá que ser um pouco mais paciente (até o pr6ximo capitulo), antes que aprenda como avaliar P(A). Antes de voltarmos a esta questão, vamos enunciar e demonstrar várias conseqüências relacionadas a P(A), que decorrem das condições acima e que não dependem da ma- neira pela qual n6s realmente calculamos P(A). Teorema 1.1. Se ~ for o conjunto vazio, então P (0) = o. Demonstração: Para qualquer evento A, podemos escrever A = A U 0. Uma vez que A e 0 são mutuamente excludentes, decorre da Propriedade 3, que P(A) = P(A U 0) = P(A) + P(~). Daqui, a conclusão do teorema é imediata. (1) O =:;;P(A) =:;;1. (2) P(S) = 1. (1.3) (3) Se A e B forem eventos mutuamente excludentes, P(AUB)= = P(A) + P(B). (4) Se AI>A2"'" An,... forem, dois a dois, eventos mutua- mente excludentes, então, Comentário: Mais tarde, teremos ocasião de ver que a reciproca do teorema acima não é verdadeira. Isto é, se P(A) = O,não poderemos, em geral, concluir que A = 9, porque existem situações nas quais atribuímos probabilidade zero a um evento que pode ocorrer. Teorema 1.2. Se 11 for o evento complementar de A, então P(A) = 1 - P(A). (1.4) P(Ut-lAi) = P(A1) + P(A2) + ...+ P(An) +... Demonstração: Podemos escrever S = A U 11 e, empregando a,<!Propriedades 2 e 3, obteremos 1 = P(A) + P(A). Observe-se que da Propriedade 3, decorre imediatamente que, para qualquer n finito, P(ü Ai)= i:P(Ai). i-I i-I Comentário: Este é um resultado particularmente útil, porque ele significa que sempre que desejarmos avaliar P(A), poderemos calcular P(A) e, depois, obtermos o resultado desejado por subtração. Veremos mais tarde que, em mui- tos problemas, é muito mais fácil calcular P(A) do que P(A). A Propriedade 4 não se seguirá; no entanto, quando considerarmos o espaço amostral idealizado, esta propriedade será imposta e, por isso, foi incluída aqui. A escolha das propriedades da probabilidade acima relacionadas é, obviamente, sugerida pelas correspondentes características da freqüência relativa. A propriedade, antes mencionada como regu- laridade estatística, será mais adiante vinculada a esta definição de probabilidade. Por enquanto, n6s apenas afirmamos que se pode mostrar que os números P(A) e fA são "pr6ximos" um do outro (em determinado sentido), se fA for baseado CIX).um grande número de repetições. :É este fato que nos dá a justificativa da utilização de P(A) para avaliarmos quão verossímil é a ocorrência de A. Por enquanto não sabemos como calcular P(A). Nós apenas arrolamos algumas propriedades gerais que P(A) possui. O leitor Teorema 1.3. Se A e B forem dois eventos quaisquer, então P(A U B) = P(A) + P(B) - P(A () B). (1.5) Demonstração:.A idéia desta demonstração é decompor A U B e B em dois eventos mutuamente excludentes e, em seguida, aplicar a Propriedade 3. (Veja o Diagrama de Venn na Fig. 1.2.) Desse modo escreveremos A U B = A U (B () A), B = (A () B) U (B () A). Conseqüentemente, P(A U B) = P(A) + P(B () 11), P(B) = P(A () B) + P(B () A). 20 I PROBABILIDADE INTRODUÇÃO À PROBABILIDADE I 21 Subtraindo a segunda igualdade da primeira, obtém-se qüentemente, P(B) = P(A) + P(B n ii) 2::P(A), porque P(B () Ã) 2:: 2::°, pela Propriedade 1. P(A U B) - P(B) = P(A) - P(A () B) Comentário: Este resultado é, certamente, de conhecimento intuitivo, pois ele a.firma que se B deve ocorrer sempre que A ocorra, conseqüentemente, B é mais provável do que A. e daí chega-se ao resultado. 1.8. Algumas Observações " (a) Cabe aqui uma palavra de advertência. Da exposição an- terior poderia ser (incorretamente) inferido que quando escolhermos um modelo probabilístico para a descrição de algum fenômeno de observação, estaremos abandonando todas as relações determinís- ticas. Nada poderia estar mais distante da verdade. Nós ainda utilizamos o fato de que, por exemplo, a Lei de Ohm I = E/R vale em determinadas circunstâncias. A diferença seria uma diferença de interpretação. Em vez de afirmar que a relação,acima determina I para E e R dados, admitiremos que E ou R (ou ambos) possam variar de alguma maneira aleatória imprevisível e que, em conse- qüência, I variará também de alguma forma aleatória. Para E e R dados, I será ainda determinado pela relação acima. O impor- tante é que, quando se adotar um modelo probabilístico para a des- crição de um circuito, considera-se a possibilidade de que E e R pos- sam variar de alguma maneira imprevisível, a qual somente pode ser descrita probabilisticamente. Portanto, desde que tenha sen- tido considerar somente a probabilidadede que E e R tomem certos valores, torna-se significativo falar somente da probabilidade de que I venha a tomar certos valores. (JJ /B S " 0~ ~ AnB AnB Fig.1.2 Comentário: Este teorema representa uma extensão imediata da Proprie- .dade 3, porque se A n B = 0, obteremos do enunciado acima a Propriedade 3. Teorema 1.4. Se A, B e C forem três eventos quaisquer, então P(A U B U C)=P(A) + P(B)+P(C)-P(A () B)-P(A () C)- - P(B () C) + P(A () B n C). (1.6) Demonstração: A demonstração consiste em escrever A U B U C na forma (A U B) U C e aplicar ó resultado do teorema anterior. Deixa-se ao leitor completar a demonstração. Comentário: Uma extensão óbvia do teorema é sugerida. quaisquer k eventos. Então, k k p(A1 U A2 U ", U Ak) = L P(Ai) - L P(Ai n Aj)+ i-I i<j-2 Sejam Alt..., Ak, (b) Algumas vezes, pode ser difícil realizar a escolha entre a adoção de um modelo determinístico ou um modelo probabilístico. Poderá depender da complicação de nossa técnica de mensuração e da exatidão associada a ela. Por exemplo, se medidas exatas forem tão difíceis de obter que leituras repetidas da mesma quantidade conduzam a resulta- dos variados, um modelo probabilístico será sem dúvida mais adequado para descrever a situação. k + L P(AinAjnAr) + ." + (-1)k-lp(AlnA2n...nAk). i<j<r-3 (1.7) (c) IndicaremoS' resumidamente que, sob certas circunstâncias, teremos condições de fazer hipóteses adicionais sobre o comportamento probabilístico de nossosresultados experimentais, as quais nos conduzi- rão a um método de avaliação das probabilidades básicas. A escolha dessashipóteses adicionaispode ser baseada em consideraçõesfísicas do experimento (por exemplo, propriedades de simetria), evidência empí- Este resultado pode ser facilmente estabelecido por indução matemática. Teorema 1.5. Se A C B, então P(A) ~ P(B). Demonstração: Podemos decompor B em dois eventos mutua- mente excludentes, na seguinte forma: B = A. U (B () Ã). Conse- 22 I PROBABILIDADE INTRODUÇÃO À PROBABILIDADE I 23 rica ou, em alguns casos, apenas julgamento pessoal, baseado em experiência anterior de uma situação similar. A freqüência relativatA pode desempenhar um importante papel em nossa deliberação sobre a atribuição numérica de P(A). Contudo, é importante compreender que qualquer suposição que façamos sobre P(A) deve ser tal, que sejam satisfeitos os axiomas básicosdesde (1) até (4) da Defmição(1.3). preender que estaremos tão-somente substituindo um valor postulado por uma aproximação obtida experimentalmente. Quão boa ou má essa aproximação possa ser, de modo algum influencia a estrutura lógica de nosso modelo. Muito embora o fenômeno que o modelo tente representar tenha sido levado em conta na construção do mode- lo, nós nos teremos distanciado do próprio fenômeno (ao menos tempo- rariamente), quando entrarmos no reino do modelo. (d) No curso do desenvolvimento das idéias básicas da teoria da probabilidade, faremos algumas referências a deterllÚnadas analogias mecânicas. A primeira delas pode ser apropriada aqui. Em Mecânica, atribuímos a cada corpo B sua massa, digamos m(B). Em seguida, fa- remos diversos cálculos e obteremos várias conclusões sobre o compor- tamento de B e suas relações com outros corpos, muitas das quais envolvem sua massa m (B). O fato de que nós poderemos ter que recorrer a alguma aproximação para obter realmente m(B) para um corpo especificado não diminui a utilidade do conceito de massa. Semelhantemente, estipularemos para cada eventoA associadoaoespaço amostral de um experimento um número P(A), denollÚnadoprobabili- dade de A, e satisfazendonossos axiomasbásicos. Ao calcularrealmente P (A) para um evento específico, nós teremos que fazer hipóteses adicionaisou que obter uma aproximaçãobaseadaem evidênciaempírica. Problemas 1.1. Suponha qlle o conjunto fundamental seja formado pelOlfinteiros p0- sitivos de 1 a 10. Sejam A == {2,3, 41,B == (3,4, 51,e C == {5,6, 71. Enu- mere os elementos dos seguintes conjuntos: (a)A n B. (b)A U B. (c)à n 1i. (d)A n (B n C). (e) A n (B U C). 1.2. Suponha que o conjunto fundamental U seja dado por U == == {xlO=:;;x=:;;21. Sejam os conjuntos A e B definidos da forma seguinte: A == {xl 1/2< x=:;;1\ e B == (xll/4=:;;x < 3/2\. Descrevaos seguintescon- juntos: (a) A U B. (b) A U B. (c)A n B. (d)A n B. (e) t muito importante compreender que nós tenhamos pos- tulado a existência do número P(A), e que tenhamos postulado de- ternúnadas propriedades que esse número possui. A validade das várias conseqüência:s (teoremas), decorrentes desses postulados, de modo algum depende da maneira pela qual iremos obter um ~alor numérico para P(A). :f; essencial que este ponto fique claro. Por exemplo, admitimos que P(A U B) = P(A) + P(B). A fim de em- pregar esta relação para a avaliação concreta de P(A U B), deveremos conhecer os valores de P(A) e de P(B). Explicaremos, resumida- mente, que sob certas circunstâncias, nós poderemos fazer suposições adicionais que conduzam a um método de avaliação dessas probabi- lidades. Se essas (ou outras) suposições não forem fundamentadas, poderemos ter de recorrer à experimentação a fim de alcançar o valor de P(A) a partir de dados reais. A freqüência relativa iA desempe- nhará nisso um importante papel e será, de fato, utilizada para apro- ximar P(A). 1.3. Quais das seguintes relações sf.o verdadeiras? (a) (A U B) n (A U C) == A U (B n C). (b) (A U B) == (A n B) U B. (c) à [) B == A U B. (d) (A U B) n C == à n Bne. (e) (A n B) n (B n C)== 9. 1.4. Suponha que o conjunto fundamental seja formado por todos os pontos (x, y) de coordenadas ambas inteiras, e que estejam dentro ou sobre a fronteira do quadrado limitado pelasretas x == O,y == O,% == 6 e y == 6. Enumereos ele- mentos dos seguintes conjunt{)S: (a) A == (X,y)IX2+y2=:;;6\. (b) B== {(x,y)IY=:;;X2\. (c) C == {(x,y)lx =:;;y21. (d) B n C. (e) (B U A) n C. 1.5. Empregue diagramas de Venn para estabelecer as seguintes rel~ões: (a) A C B e B C C implica que A C C. (b) A C B implica que A == A n B. (c) A C B implica que B C A. (d) A C B implica que A U C C B U C. (e) A n B == 9 e C C A implicamque B n C == 9. Contudo, é importante saber que i A e P(A) não são a mesma coisa; que nós apenas utilizaremos iA para aproximar P(A) e que, sempre que' nos referirmos a P(A), estaremos nos referindo ao valor postulado. Se nós "identificarmos" iA com P(A), deveremos com- 1.6. Peças que saem de uma linha de produção silo marcadM defeituosa (D) ou não defeituosa (N). As peças são inspecionadas e sus. condição registrads.. Isto é feito até que duas peças defeituosas consecutivas sejam fabricadas ou que quatro peças tenham sido inspecionadas, aquilo que ocorra em primeiro lugar. Descreva um espaço amostral para este experimento. 24 I PROBABILIDADE ,INTRODUÇÃO À PROBABILIDADE I 25 1.7. (a) Uma caixa com N lâmpadas contém r lâmpadas (r < N) com fil&- mento partido. Essas lâmpadas são verificadas uma a uma, até que uma lâm- pada defeituosa seja encontrada. Descreva um espaço amostra! para este expe- rimento. (b) Suponha que as lâmpadas acima sejam verificadas uma a uma, até que todas as defeituosas tenham sido encontradas. Descreva o espaço amost~a! para este experimento. (e) Exatamente dois dos eventos ocorrem. (d) Não mais de dois dos eventos ocorrem simultaneamente. 1.12. Demonstre o Teor IA. 1.8. Considere quatro objetos, a, b, e e d. Suponha que a ordem em que tais objetos sejam 'listados represente o resultado de um experimento. Sejam os eventos A. e B definidos assim: A. = ta está na primeira posição}; B = = Ib está na segunda posiçã.o!. (a) Enumere todos os elementos do espaço amostral. (b) Enumere todos os elementos dos eventos A. () B e .<1U B. 1.13. (a) Verifique que para qois eventos quaisquer, AI e .1.2, temos que P(AI U .1.2)::::;P(AI) + P(A2). (b) Verifique que para quaisquer n eventos AI" . ., An, temos que P(AI U. . . U An)::::;P(AIJ +. .. + P(An). [Swesúl:o: Empregue a indução matemática. O resúltado enunciado em (b) é denominado desigualdade de Boole.] 1.9. Um lote contém peças pesando 5, 10, 15, . .., 50 gramas. Admitamos que ao menos duas peças de cada peso sejam encontradas no lote. Duas peças são retiradas do lote. Sejam X o peso da primeira peça escolhida e Y o peso da segunda. Portanto, o par de números (X, Y) representa um resultado simples do experimento. Empregando o plano .\T, marque o espaço amostral e os seguin- tes eventos: 1.14. O Teor. 1.3 trata da probabilidade de que ao menos um de dois eventos A ou B ocorra. O seguinte enunciado se refere à probabilidade de que exatamente um dos eventos A ou B OCOrra.Verifique que PICA() B) U (B () :A)]= P(A) + P(B) - 2P(A () B). (a) [X = YI. (b) IY > XI. (e) A segunda peça é duas vezes mais pesada que a primeira. (d) A primeira peça pesa menos 10 gramas que a seglmda peça. (e) O peso médio de duas peças é menor do que 30 gramas. 1.15. Um certo tipo de motor elétrico falha se ocorrer uma das seguintes situações: emperramento dos mancais, queima dos enrolamentos, desgaste das escovas. Suponha que o emperramento seja duas vezes mais prpvável do que a queima, esta sendo quatro vezes mais provável do que o des!;aste das escovas. Qual será a probabilidade de que a falha seja devida a cada uma dessas circuns- tâncias ? 1.16. Suponha que A e B sejam eventos tais que P(A) = x, P(B) = y, e P(A () B) = z. Exprima cada uma das seguintes probabilidades em termos dex,yez. 1.10. Durante um período de 24 horas, em algum momento X, uma chave é posta na posiçã.o "ligada". Depois, em algum momento futuro Y (ainda du- rante o mesmo período de 24 horas), a cha\'e é virada para a posição "desligada". Suponha que X e Y sejam medidas em horas, no eixo dos tempos, com o infcio do período na origem da escala. O resultado do experimento é constituído pelo par de números (X, Y). (a) P(A:U B). (b) P(A: () B). (e) PcA U B). (d) P(A: () B). 1.17. Suponha que A, B e C sejam eventos tais que P(A) = P(B) = P(C) = = 1/4, P(A ri B) = P(C () B) = Oe P(A () C) = 1/8. Calcule a probabilidade de queao menosum.doseventosA, B ou C ocorra. (a) Descreva o espaço amostra\. (b) Descreva e marque no plano XY os seguintes eventos: (i) O circuito está ligado por uma hora ou menos. (ü) O circuito está ligado no tempo z, onde z é algum instante no período dado de 24 horas. (iii) O circuito é ligado antes do tempo II e desligado depois do tempo Ii (onde também II < 12são dois instantes durante o período de 24 horas especificado). (iv) O circuito permanece ligado duas vezes mais tempo do que desligado. 1.18. Uma instalação é constituída de duas caldeiras e uma máquina. Admita que o evento A seja que a máquina esteja em boas condições de funcionamento, enquanto os eventos Bk (k = I, 2) são os eventosde que ak-ésimacaldeiraesteja em boas condições. O evento C é que a instalação possa funcionar. Se a instalação puder funcionar sempre que a máquina e pelo menos uma das caldeiras funcionar, expresse os eventos C e C, em termos de A e dos Bk' 1.11. Sejam A, B e C três eventos associados a um experimento. em notações de conjuntos, as seguintes afirmações verbais: (a) Ao menos um dos eventos ocorre. (b) Exatamente um dos eventos ocorre. Exprima 1.19. Um mecanismo tem dois tipos de unidades: I e 11. Suponha que se disponha de duas unidades do tipo I e três unidades do tipo 11.Defina os eventos A k, k = 1, 2 e Bj, j = 1, 2, 3 da seguinte maneira :Ak: a k.ésimaunidade do tipo I está funcionando adequadamente; Br aj-ésima unidade do tipo 11está funcionan- do adequadamente. Finalmente, admita que C represente o evento: o mecanismo funciona. Admita que o mecanismo funcione se ao menos uma unidade do tipo I e ao menos duas unidades do tipo 11funcionarem; expresse o evento C em termos dosAk e dosBj- ESPAÇOS AMOSTRAIS FINITOS / 27 Capítulo 2 . Para resumir: a atribuição de probabilidadesPi a cada evento elementar lad, sujeito às condições (a) e (b) citadas anteriormente, determina unicamente P(A) para cada evento A C S, onde P(A) é dado pela Eq. (2.1). Para. avaliarmos os Pi individuais, alguma hipótese referente aos resultados individuais deve ser feita. Exemplo 2.1. Suponha-se que somente três resultados sejam possíveis em um experimento, a saber, a1l (12e (1a. Aléni disso, su- ponha-se que. aI seja duas vezes mais provável de ocorrer que <Ia,o qual por sua vez é duas vezes mais provável de ocorrer que (1a. Portanto, 'PI = 2p2 e P2= 2Pa. Já que PI + P2 + pa = 1, te- remos 4pa + 2pa + pa = 1, o que finalmente dá Espaços Amostrais Finitos 2.1. EspaçoAmostral Finito 1 Pa= 7' 2 4 P2 = 7 e PI = T' Neste capítulo nos ocuparemos unicamente de experimentos para os quais o espaço amostral 8 seja formado de um número jinito de elementos. Isto é, admitiremos que 8 possa ser escrito sob a forma 8 = IaI, a2,. . ., ak I. Se nos reportarmos aos exemplos de espaços amostrais da Seç. 1.4, observaremos que 811 82, 83, 84, 86, 87 e 812 são todos finitos. A fim de caracterizar P(A) para este modelo, deveremos ini- cialmente considerar o evento formado por um resultado simples, algumas vezes denominado evento simples ou elementar, A = Ia;}. Procederemos da seguinte maneira: A cada evento simples {lli} associaremos um número Pi, deno- minado probabilidade de {ai I, que satisfaça às seguintes condições: (a) pi ~ °, i = 1,2,..., k, (b) PI + P2 + ... + pk = 1. Comenl4rio: Na exposição que se segue, empregaremos a expressão "igual- mente verosslmeis" para significar "igualmente prová"eis". 2.2. Resultados Igualmente Verossímeis [Porque Ia;} é um evento, essas condições devem ser coerentes com aquelas postuladas para as probabilidades dos eventos em geral, como foi feito nas Eq. (1.3). É fácil verificar que isso se dá.J Em seguida, suponha-se que um evento A seja constituído por r resultados, 1 ~ r ~ k, a saber A hip6tese mais comumente feita para espaços amostrais fini- tos é a de que todos os resultados sejam igualmente verossímeis. Esta hipótese não pode ser, contudo, tomada como segura; ela deve ser cuidadosamente justificada. Existem muitos experimentos para os quais tal hip6tese é assegurada, mas existem também muitas si- tuações experimentais nas quais seria absolutamente errôneo acei- tar-se essa suposição. Por exemplo, seria bastante irreal supor que seja igualmente verossímil não ocorrerem chamadas telefônicas em um centro entre 1 e 2 horas da madrugada e entre 17 e 18 horas da tarde. Se todos os k resultados forem igualmente verossímeis, segue-se que cada probabilidade será Pi = l/k. Conseqüentemente,a con- dição PI + .. . +Pk = 1 toma-se kPi = 1 para.todo i. Disto de- Correque, para. qualquer evento A formado de r resultados, teremos P(A) = Pi,+ Pi, +...+ PiTo (2.1) P(A) = r/k. Este métodode avaliar P(A) é freqüentementeenunciadoda seguinte maneira.: P(A) == numero de casos favoráveis a A pelos quais B pode ocorrer número total de caSos pelos quais & pode ocorrer É Uiuito importante compreender que a expressão de P(A) acima é apenas uma conseqüência da suposição de que todos os resultados A = Iai" ai". . ., aiT}, onde j I, j2,. . ., jT representam um qualquer dos r índices, de 1 até k. Conseqüentemente, conclui-se da Eq. (1.3), Propriedade 4, que ~ 28 I PROBABILIDADE ESPAÇOS AMOSTRAIS FINITOS I 29 sejam igualmente verossímeis, e ela é aplicável somente quando essa suposição for atendida. Ela certamente não serve como uma defi- nição geral de probabilidade. Exemplo 2.2. Um dado é lançado e todos os resultados se su- põem igualmente verossímeis. O evento A ocorrerá se, e somente se, um número maior do que 4 aparecer, isto é, A = {5, 6}. Con- seqüentemente, P(A) = 1/6 + 1/6 = 2/6. Exemplo 2.3. Uma moeda equilibrada é atirada duas vezes. Seja A o evento: {aparece uma cara}. Na avaliação de P(A), a análise do problema poderia ser a seguinte: O espaço amostral é 8 = 10, 1, 2} onde cada resultado representa o número de caras que ocorre. Portanto, seria encontrada P(A) = 1/3! Esta análise é obviamente incorreta, porque no espaço amostral considerado acima, todos os resultados não são igualmente verossímeis. A fim de aplicar os métodos expostos, deveremos considerar em s.eu lugar o espaço amostral 8' = IHH, HT, TH, TT}, onde H representa cara, e T coroa. Neste espaço amostral todos os resultados são igualmente verossímeis e, por isso, obteremos como solução correta de nosso problema: P(A) = 2/4 = 1/2. Poderiamos empregar corretamente o espaço 8 da seguinte maneira: Os resultados O e 2 são igualmente verossímeis, enquanto o resultado 1 é duas vezes mais provável que qualquer um dos outros. Portanto, P(A) = 1/2, o que concorda com a resposta anterior. Este exemplo ilustra dois aspectos. Primeiro, deveremos estar bastante seguros de que todos os resultados possam supor-se igual- mente verossímeis, antes de empregar o procedimento acima. Se- gundo, poderemos freqüentemente, por uma escolha apropriada do espaço amostral, reduzir o problema a outro, em que todos os resul- tados sejam igualmente verossímeis. Sempre que possível, isto deve ser feito porque geralmente torna o cálculo mais simples. Este aspecto será de novo mencionado em exemplos subseqüentes. lhendo um cartão, tentaremos garantir que cada parafuso tenha de fato a mesma probabilidade de ser escolhido. Assim, poderemos nos meter em enorme trabalho a fim de assegurarmos que a suposição matemática de resultados igualmente verossímeis seja de fato apro- priada. Nos exemplos já vistos e em muitos que se seguirão, trataremos da escolha 3.()aeàSo de um ou mais objetos de uma dada coleção de objetos. Definamos esta noção mais precisamente. Suponhamos que se tenha N objetos, a saber aI, a2,.. ., aN. (a) Escolher ao acaso um objeto,dentre N objetos, significa que cada objeto tem a mesma probabilidade de ser esc,Olhido, isto é, Prob (escolher lli) = l/N, i = 1, 2,..., N. (b) Escolher ao acaso dois objetos, dentre N objetos, significa que cada par de objetos (deixada a ordem à parte) tem a mesma pro- babilidade de ser escolhido que qualquer outro par. Por exemplo, se devemos escolher ao acaso dois objetos dentre (aI, a2,a3,a4),obter aI e a2 é então tão provável quanto obter a2e a3etc. Esta formula- ção levanta imediatamente a questão de quantos pares diferentes existem. Admita-se que existam K desses pares. Então, a proba- bilidade de cada par seria l/K. Logo, veremos como calcular K. (c) Escolherao acaso n objetos(n ::::;;N) dentre N objetos signi- fica que cada ênupla, a saber lli., lli". . ., llin é tão provável de ser escolhida quanto qualquer outra ênupla. Comentário: Já sugerimos acima que se deve tomar extremo cuidado durante o procedimento experimental, para assegurarmos que a suposição matemática de "escolher ao acaso" seja atendida. 2.3. .~étodos de Enumeração Muito freqüentemente, a maneira pela qual o experimento .é executado determina se os resultados possíveis são igualmente ve- rossímeis ou não. Por exemplo, suponha-se que retiremos um para- fuso de uma caixa que contenha três parafusos de tamanhos diferen- tes. Se simplesmente escolhermos o parafuso estendendo a mão dentro da caixa e apanhando aquele que tocarmos primeiro, é óbvio que o parafuso maior terá maior probabilidade de ser escolhido que os outros dois. No entanto, etiquetando cuidadosamente cada para- fuso com um número, escrevendo o número em um cartão, e esco- Deveremos fazer uma digressão, a esta altura, para aprender- mos como enumerar. Considere-se novamente a forma já vista de P(A), a saber P(A) = r/k, onde k é igual ao número total de maneiras pelas quais 8 pode ocorrer, enquanto r é igual ao número de ma- neiras pelas quais A pode ocorrer. Nos exemplos apresentados até aqui, pequena dificuldade foi ençontrada para calcular r e k. Mas nós precisamos estudar situações apenas um pouco mais complica- das, para percebermos a necessidade de alguns procedimentos siste- máticos de contagem ou enumeração. , . ...', ~Ij~ ~ 30 I PROBABILIDADE Exemplo 2.4. Uma partida de cem peças é composta de 20 peças defeituosas e 80 peças perfeitas. Dez dessas peças são esco- lhidas ao acaso, sem reposição de qualquer peça escolhida antes que a seguinte seja escolhida. Qual é a probabilidade de que exatamente metade das peças escolhidas seja defeituosa? Para analisarmos este problema, consideremos o seguinte espa- ço amostra I S. Cada elemento de S é constituído de dez possíveis peças da partida, (ih i2,. . ., ilo). Quantos resultados desses existem? E dentre esses resultados, quantos têm a característica de que exa- tamente a metade das peças seja defeituosa? Nós, evidentemente, precisamos ter condições de responder a tais questões a fim de resol- vermos o problema em estudo. Muitos problemas semelhantes dão origem a questões análogas. Nas poucas seções seguintes, apresen- taremos algumas técnicas sistemáticas de enumeração. A.. Regra da Multiplicação. Suponha-se que um procedimento designado por 1 possa ser executado de nl maJ~eiras. Admita-se que um segundo procedimento, designado por 2, possa ser executado de n2 maneiras. Suponha-se, também, que cada maneira de executar 1 possa ser seguida por qualquer daquelas para executar 2. Então, o procedimento formado por 1 seguido de 2 poderá ser executado de nl . n2 maneiras. Para indicar a validade deste principio, é mais fácil considerar o seguinte tratamento sistemático. p LI L2 Fig. 2.1 Considerem-seum ponto P e duas retas L1 e L2. Admita-se que o procedimento 1 consista em ir de P até L1,enquanto o procedimento 2 consista em ir de L1 a.té L2. A Fig. 2.1 i.i1dicacomo o resultado final é obtido. C0ment6.rio: Obviamente, esta regra pode ser estencijda a qualquer número de procedimentos. Se existirem k procedimentos e o i-ésimo procedimento puder ser executado de n&maneiras, i = 1, 2, . .., k, entAo o procedimento formado por 1, seguido por 2, ..., seguido pelo procedimento k, poderá ser executado de R11'1:!... Rk maneiras. ESPAÇOS AMOSTRAIS FINITOS I 31 Exemplo 2.5. Uma peça manufaturada deve passar por três estações de controle. Em cada estação, a peça é inspecionada para determinada característica e marcada adequadamente. Na primeira estação, três classificações são possíveis, enquanto nas duas últimas, quatro classificações sij.o possíveis. Conseqüentemente, existem 3 . 4 . 4 = 48 maneiras pelas quais uma peça pode ser marcada. B. Regra da Adição. Suponha-se que um procedimento, de- signado por 1, possa ser realizado de nl maneiras. Admita-se que um segundo procedimento, designado por 2, possa ser realizado de n2 maneiras. Além disso, suponha-se que não seja possível que ambos os procedimentos 1 e 2 sejam realizados em conjunto. Então, o número de maneiras pelas quais poderemos realizar ou 1 ou 2 será nl + n2. Novamente, empregaremos um tratamento esquemático para nos convencermos da validade da regra da adição, como a Fig. 2.2 indica. LI P l.z Fig.2.2 Comentário: Esta regra também pode ser generalizada da seguinte maneira: Se existirem k procedimentos e !) i-ésimo procedimento puder ser realizado de ~ maneiras, i = 1, 2, . . ., k, entAo,o número de maneiras pelas quais poderemos realizar ou o procedimento 1, ou o procedimento 2, ou. .., ou o procedimento k, é dado por nl + n2 + . ., + Rk, supondo-,se que dois quaisquer deles não se pos- sam realizar co,untamente. Exemplo 2.6. Suponha-se que estejamos planejando uma via- gem e devamos escolher entre o transporte por ônibus ou por trem. Se existirem três rodovias e duas ferrovi~, então existirão 3 + 2 = 5 caminhos disponíveis para a viagem. C. Permutações e Arranjo3. (a) Suponha-se que nós temos n objetos diferentes. De quantas maneiras nPn poderemos dispor (per- mutar) esses objetos? Por exemplo, se tivermos os objetos a, b e c, POderemos considerar as seguintes permutações: abc, acb, bac, bca, cab e cba. Portanto, a resposta é 6. Considere-se, em geral, o se- ~ 32 I PROBABILIDADE ESPA-çOS AMOSTRAIS FINITOS I 33 1 2 n escolher r dentre essesn objetos sem considerarmos a grdem. Por exemplo, temós os objetos a, b, c e d, e r = 2; desejamQs contar ab, ac, ad, bc, bd e 00;por outras palavras, não contaremos ab e ba, por- que os mesmos objetos estão incluídos e somente a ordem é diversa. Para obtermos o resultadà geral, recordaremos a fórmula dedu- zida acima: o número de maneiras de escolher r objetos dentre n, e permutar os r escolhidos é n!f(n - r)! Seja C o número de maneiras de escolher r dentre os n, não considerada a ordem. (Isto é, C é o número procurado.) Observe-se que, uma vez que r objetos tenham sido escÓlhidos, existirão r! maneiras de pe.rmutá-Íos. Conseqüen- temente, aplicando-se novamente a regra da multiplicação, junta- mente com esse resultado, obteremos guinte esquema: Permutar os n objetos equivale a colocá-Iosdentro de uma caixa com n compartimentos, em alguma ordenação: O primeiro comparti.mento pode ser ocupado por qualquer uma das n maneiras, o segundo compartimento por qualquer uma das (n - 1) maneiras,..., e o último compartimento apenas por uma maneira. Portanto, aplicando-se a regra da multiplicação, vista acima, verifica-se que a caixa poderá ser carregada de n(n-1) (n- 2) . . . 1 maneiras. Este número aparece tão freqüentemente em Matemática que se adotam um nome e um símbolo especiais para ele. Definição. Sendo n um inteiro positivo, definimosn! = (n)(n- 1) (n- 2) . . . 1 e o denominamos fatorial de n. TS'1lbém definimos O!= 1. n! c ,- ), r. - (n - r . Portanto, o número de maneiras de escolher r dentre n objetos dife- rentes, não se considerando.a ordem, é dado por Dessa maneira, o número de permutações de n objetos diferen- tes é dado por n! C = r!(n- r)! nPn= n! Este número surge em muitas passagens da Matemática e, por isso, um símbolo especial é empregado para ele. Escreveremos (b) Considerem-se novamente n objetos diferentes. Agora de- sejamos' escolher r desses objetos, O::; r ::; n e permutar os r esco- lhidos. Denotaremos o número de maneiras de fazer isso (arranjos) por nA,. Recorremos novamente ao esquema acima, de encher uma caixa de n compartimentos; desta vez simplesmente paramos depois que o compartimento de ordem r tenha sido ocupado. Assim, o pri- meiro compartimento pode ser preenchido de n maneiras, o segundo de (n - 1) maneiras,... e o de ordem r de n - (r - 1) maneiras. Portanto, o procedimento completo poderá ser executado, novamente aplicando-se a regra da multiplicação, de n! r!(n -, r)! =(~) Para nossos objetivos atuais, (~) somente fica definido para n in- teiro positivo e r um inteiro tal que O::; r ::; n. Contudo, pode- remos definir (~) de modo mais geral, para qualquer número real n e para qualquer inteiro não negativo r, na forma seguinte: n(n - 1)(n - 2) . . . (n -r + 1) ( n) = n(n - l)(n - 2) .., (n - r + 1) . r r! nA, = 2 Os números (~) são freqüentemente denominados coeficientesbino- miai8, porque eles aparecem como coeficientesno desenvolvimento da expressio binomial (a + b)ft. Se n for um inteiro positivo, (a + b)n = ==(4 + b) (4 + b) ... (a + b). Quando a multiplicação tiver sido executada,cada termo será formadode k elementosa, e de (n- k) elementbs b, k = °, 1, 2, . . ., n. Quantos termos da forma akbn-k maneiras. Empregando a notação de fatorial, introduzida acima, poderemos escrever D. Combinações. C.onsiderem-se, novamente, n objetos dife- rentes. Agora, trataremos da contagem do número de maneiras de ........-- 34 I PROBABILIDADE existirão? Simplesmente contaremos o número de maneiras possí- veis de escolher k dentre os n elementos a, deixando de lado a ordem. Mas isto é justamente dado por (~). Dai obtermos o que é conhe- cido como o teorema binomial: (a + b)"= t ( n) akb"-k. /e-O k Os números (~)apresentam muitas propriedades interessantes, ape- nas duas das quais meqcionaremos aqui: (A menos que se diga. expressamente de modo diverso, admitiremos que n seja inteiro posi- tivo e r um inteiro, O:::;r :::;nJ (a) (~) = (n ~ r), (b) (;) = (~= n + (n ~ 1) ~ fácil verificar algebricamente as dUM identidades acima. Basta desenvolverem-se, em cada uma, o primeiro e o segundo membros, e verificar que são iguais. Existe, contudo, outra maneira de verificar essas identidades, que emprega a interpretação que demos para (;), a saber, o nú- mero demaneirasdeescolherr dentre n coisas. (a) Quanao escolhemosr dentre n coisas, estamos ao mesmo tempo deixando (n - r) coisas não escolhidas, e, por isso, escolher r dentre n é equivalente a escolher (n - r) dentre n. Ora, iS80 é exa- tamente a primeira identidade a verificar. (b) Vamos fixar um qualquer dos n objetos, por exemplo o pri- meiro, ai. Ao escolher r objetos, ai estará incluído ou estará excluído, mas não ambas as coisas. Portanto, ao contar o número de maneiras de escolher r objetos, poderemos aplicar a Regra da Adição, expli- cada anteriormente. Se ai for excluído, então deveremos escolher os r objetos dese- jados dentre os restantes (n - 1) objetos, e existem (n ~ 1)maneiras de se fazer isso. Se ai for incluído, então somente (r - 1) mais objetos devem slJr escolhidos dentre os restantes (n - 1) objetos e isto pode ser feito de (~= ~) maneiras. Conseqüentemente, o .número procu- rado é a soma desses dois, o que verifica a segunda identidade. ESPAÇOS AMOSTRAIS FINITOS I 35 Comentário: Neste contexto, os coeficientes binomiais ( ~ ) têm sentido somente se n e k forem inteiros não-negativos, com O .;;;k .;;;n. Todavia, se escre- vermos n! n)_- (k - k!(n-k)! n (n - 1) ... (n - k + 1) k! (2.2) observaremos que a última expressão tem sentido se n for quaJquer número real e k for qualquer inteiro não-negativo. Portanto, -3 (-3)(-4)...(-7) ( ) = 5 5! e assim por diante. Empregando esta versão estendida dos coeficientes binomiais, poderemos estabelecer a forma generalizada do teorema binomial: (1+x)n= ~ (n)xk k =0 k Esta série tem significadopara qualquer n real e para todo x tal que Ix I < 1. Observe-seque, se n for um inteiro positivo,a sérieinfinita sereduz aum número finito de termos, porque, neste caso, ( ~ ) = O,sek > n. Exemplo 2.7. (a) Dentre oito pessoas, quantas comissões de três membros podem ser escolhidas? Desde que duas comissões sejam a mesma comissão se forem constituídas pelas mesmas pessoas (não se levando em conta a ordem em que sejam escolhidas), teremos (g) = 56 comissões possíveis. (b) Com oito bandeiras diferentes, quantos sinais feitos com u.&;bandeiras se podem obter? Este problema parece-se muito com o anterior. No entanto, aqui a ordem acarreta diferença e, por isso, obteremos 81/5!= 336 sinais. (c) Um grupo de oito pessoas é formado de cinco homens e três mulheres. Quantas comissões de três pessoas podem ser cons- tituídas, incluindo exatamente dois homens? Aqui deveremos fazer duas coisas: escolher dois homens (dentre cinco) e escolher uma mulher (dentre três). Daí obtermos como número procurado ( ~ ) .( ~ ) = 30 comissões. (d) Agora poderemos verificar uma afirmação feita anterior- mente, a saber, a de que o número de subconjuntos (ou partes) de ~ 36 / PROBABILIDADE ESPAÇOS AMOSTRAIS FINITOS / 37 um conjunto constituído de n elementos é igual a 2" (contados o conjunto vazio e o pr6prio conjunto). Simplesmente associemos a cada elemento o valor um ou zero, conforme esse elemento deva ser incluído ou excluído do subconjunto. Existem duas maneiras de rotular cada elemento e existem ao todo n desses elementos. Dai a regra da multiplicação nos dizer que existem 2 . 2 . 2 . . . 2 = 2" rotulações possíveis. Mas cada rotulação particular representa uma escolha de um subconjunto. Por exemplo, (I, I, O,O,O, . . ., O) constituiria. o subconjunto formado exatamente por aI e a2. Ainda, (I, 1, , 1) representaria o pr6prio S, e (O,O, ..., O) representaria o conjunto vazio. (e) Poderíamos obter o resultado acima, pelo emprego da Regra da Adição, na forma seguinte: Para obter subconjuntos, deveremos escolher o conjunto vazio, aqueles subconjuntos constituídos exata- mente por um elemento, aqueles constituídos exatamente por dois elementos, . . ., e o pr6prio conjunto constituído por todos os n ele- mentos. Isto seria feito de então, a probabilidade de que as n peças escolhidas sejam exatamente 81 da classe A e (n - 8J da classe B será dada por (:~)(n ~28) (~) (A expresSão acima se denomina probabilidade hipergeométrica,e será ainda reencontrada.) (~)+(~)+(~) + ... + (:) Comentário: f': muitO importante especificar, quando Calarmos de peças extraídas ao acaso, se a e!iI:olha é com ou sem r'-'P08içi!.o.Na maioria dos casos concretQ8, pretenderemos a I1ltima. Por exemplo, quando inspecionamos certo m1mero de peças manuCaturadas a Cim de descobrirmos quantas deCeituosas po. derio existir, geralmente nio tencionaremos examinar a mesma peça duas vezes. Já dissemos que o nl1merode maneiras de escolher r coisas dentre n, nio considerada a ordem, é dado por (~). O nl1mero de maneiras de escolher r coisas dentre n, com reposiçf.o, é dado por nr. Neste caso, estarem08 interessados na ordem em que as peças sejam escolhidas. maneiras. Ora, a soma desses coeficientes binomiais ê exatamente o desenvolvimento de (1 + 1)" = 2". Voltemos agora ao Ex. 2.4. De uma partida formada por 20 peças defeituosas e 80 peças perfeitas, escolhemos ao acaso 10 (sem reposição). O número de maneiras de fazer isso ê e~). Daí, a probabilidade de achar exatamente 5 peças defeituosas e 5 perfeitas entre as 10 escolhidas ser dada por Exemplo 2.9. Admitamos que se escolham ao acaso dois objetos, dentre os quatro denominados a, b, c e d. (a) Se escolhermos sem reposição, o espaço amostral S poderá ser representado da forma abaixo: (~)(~) e~) S= {(a,b); (a,c); (b,c); (b,d); (c,d); (a,d)}. Existem(~)= 6 resultados possíveis. Cada um desses resultados indica somente quais os dois objetos que foram escolhidose nâQa or- dem em que eles foram escolhidos. (b) Se escolhermos com reposição, o espaço amostra! S' poderá ser representado por: Exemplo 2.8. Vamos generalizar o problema acima. Admi- tamos que temos N peças. Se escolhermosao acaso n delas, sem repo- sição, teremos (~) diferentes amostras possíveis, todas elas com 11 mesma probabilidade de serem escolhidas. Se as N peças forem formadas por rI da classe A e r2 da classe B (com rI + r2 = N), { (a, a); (a, b); (a, c); (a, d); (b, a); (b, b); (b, c); (b, d);} w= . (c,a); (c,b);(c,c,);(c,d); (d, a); (d, b);(d,c);(d, d) Existem 42 = 16 resultados possíveis. Aqui, cada um desses resul- tados indica quais objetos foram escolhidos e a ordem em que eles o foram. Escolher ao acaso implica que, se escolhermos sem repo- siÇão,todos os resultados em S serão igualmente verossímeis,enquanto se escolhermos com reposição, então todos os resultados em S' serão igualmente verossímeis. Portanto, se A for o evento {o objeto c é Por meio de logaritmos de fatoriais (os quais se acham tabulados), a expressão acima pode ser avaliada como igual 11.0,021. .........- 38 / PROBABILIDADE escolhido I, então teremos: de D, P(A) = 3/6 = 1/2 se escolhennos sem reposição; e de S', P(A) = 7/16 se escolhennos com reposição. E. Permutw;õescom Alguns Elementos Repetidos. Em todas as técnicas de enumeração já apresentadas, admitimos que todos os objetos considerados fossem diferentes (isto é, distinguíveis). No entanto, não é sempre essa a situação que ocorre. Suponha-se, a seguir, que temos n objetos, tais que nl sejam de uma primeira espécie, n2 de uma segunda espécie,. . ., nk de uma. k-ésima espécie, com nl + n2 + ... + nk = n. Nesse caso, o nú- mero de pennutações possíveis desses n objetos é dado por n! nl!n2!.. .nk! y Deixa-se ao leitor a dedução dessa fónnula. Note-se que, se todos os objetos fossem diferentes, teríamos nt = 1, i = 1,2, . . ., k, e, conseqüentemente, a fórmula acima se reduziria a n!, que é o resul- tado obtido anterionnente. '1. Comentário: Devemos salientar mais uma vez que a atribuição realística de probabilidades a resultados individuais de um espaço amostral (ou a uma coleção de resultados, isto é, um evento) constitui alguma coisa que não pode ser deduzida matematicamente, mas que deve ser originada de outras considerações. Por exem- plo, poderemos recorrer a determinados traços simétricos do experimento para averiguar se todos os resultados são igualmente prováveis. Além disso, poderemos construir um procedimento de amostragem (por exemplo, escolliendo um ou vários indivíduos de uma população especificada) de tal maneira que seja razoável admitir que todas as escollias sejam igualmente prováveis. Em muitos outros casos, quando nenhuma suposição básica natural seja apropriada, deveremos recorrer à aproximação da freqüência relativa. Nós repetiremos o experimento n vezes e, em seguida, calcularemos a proporção de vezes em que o resultado (ou evento) em es- tudo tenha ocorrido. Ao empregar isto como uma aproximação, sabemos que é bastante improvável que esta freqüência relativa difira da "verdadeira" probabili- dade (cuja existência tenha sido especificada por nosso modelp teórico), de um valor apreciável, se n for suficientemente grande. Ql!ando for impossível estabe- lecer suposições razoáveis sobre a probabilidade de um resultado e também impossível repetir o experimento um grande número de vezes (em virtude de considerações de custo ou de tempo, por exemplo), será realmente bastante sem sentido prosseguir com um estudo probabilístico do experimento, exceto em uma base puramente teórica. (para um comentário adicional sobre este mesmo ponto, veja a Seção 13.5). Problemas 2.1. o seguinte grupo de pessoasestá numa sala: 5 homens maioresde 21 anos; 4 homenscommenos de 21 anos de idade; 6 mulheresmaioresde 21 anOS,e ESPAÇOS AMOSTRAIS FINITOS / 39 3 mulheres menores. Uma pessoa é escolhida ao acaso. Definem-se os seguint.es eventos: A -(a pessoa é maior de 21 anos/; B = Ia pessoa f! menor de 21 anosl; C - Ia pessoa é homem); D = Ia pessoa é mulherl. Calcule: (o) P(B U D), (b) P(A n C). 2.2. Em uma sala, 10 pessoas estão usando emblemas numerados de 1 até 10. Três pessoas sio escolhidas ao acaso e convidadas a sa(rem da sala simultunea- mente. O nlimero de seu emblema é anotado. (o) Qual é a probabilidade de que o menor illimero de emblema seja 5? (b) Qual é a probabilidade de que o maior nlimero de emblema seja 5? 2.3. (o) Suponha que os três d(gitos 1, 2 e 3 sejam escritos em ordem alea- tória. Qual a probabilidade'de que ao menos um d(gito ocupe seu lugar próprio? (b) O mesmo que em (o), com os dígitos 1, 2, 3 e 4. (c) O mesmo que em (a), com os d(gitos 1, 2, 3, ..., n. Sugestão: Empregue 0.7). (d) Examine a resposta a (c), quando n for grande. 2.4. perfeitas. ficadas. (a) Qual a probabilidade de que sejam encontradas exatamente 90 peça.~ defeituosas ? (b) Qual a probabilidade de que se encontrem ao menos 2 peças defeituosa.~? 2.5. Dez fieha.~numeradas de 1 até 10 são misturadas em uma Urna. Dua.~ fichas, numeradaS (X, Y), são extra(das da urna, suce&;ivamente e sem reposição. Qual é a probabilidade de que seja X + Y = 1O? 2.6. Um lote é formado de 10 artigos bons, 4 com defeitos menores e 2 com defeitos graves. Um artIgo é escolhido ao acaso. Ache a probabilidade de que: (a) Ele não tenha defeitos. (b) Ele não tenha defeitos graves. (c) Ele ou seja perfeito ou tenha defeitos graves. Uma remessa de 1.500 arruelas contém 400 peças defeituosas e 1.100 Duzentas arruelas são escolhidas ao ac.aso (sem reposição) e cIassi- 2.7. Se do lote de artigos descrito no Probl. 2.6, dois artigos forem escolhi- dos (sem reposição), ache a probabilidade de que: c.a) Ambos sejam perfeitos. (b) Ambos tenham defeitos graves. (c) Ao menos um seja perfeito. (d) No máximo um seja perfeito. (e) Exatamente um seja perfeito. (J) Nenhum deles tenha defeitos graves. (g) Nenhum deles seja perfeito. 2.8. Um produto 'é montado em três estágios. No primeiro estágio, exis- tem 5 linhas de montagem; no segundo estágio, existem 4 linhas de montagem e no terceiro estágio, existem 6 linhas de montagem. De quantas maneiras dife- rentes poderá o produto se deslocar durante o processo de montagem? 2.9. Um inspetor visita 6 máquinas diferentes durante um dia. A fim de evitar que os operários saibam quando ele os irá inspecionar, o inspetor varia a ordenação de suas visitas, De quantas maneiras isto poderá ser feito? ---- 40 / PROBABILIDADE ESPAÇOS AMOSTRAIS FINITOS / 41 2.10. Um mecanismo complexo pode falhar em 15 estágios. De qualitas maneiras poderá ocorrer que ele falhe em 3 estágios? 2.11. Existem 12 categorias de defeitos menores de uma peça manufatu- rada, e 10 tipos de defeitos graves. De quantas maneiras poderio ocorrer 1 de- feito menor e 1 grave? E 2 defeitos menores e 2 graves? 2.21. Um lote contém n peças, das quais se sabe serem r defeituosas. Se a ordem da inspeção das peças se fizer ao acaso, qual a probabilidade de que a peça inspecionada em k-ésimo lugar (k ~ r) seja a última peça defeituosa contida no lote? 2.12. Um mecanismo pode ser posto em uma dentre quatro posições: a, b, c 11li. Existem 8 desses mecanismos incltúdos em um sistema. (o) De quantas maneiras esse sistema pode ser disposto? (b) Admita que esses mecanismos sejam instalados em determinada ordem (linear) preestabelecida. De quantas maneiras o sistema poderá ser disposto, se dois mecanismos adjacentes não estiverém em igual posição? (c) Quantas maneiras de dispor serli.opossíveis, se somente as posições (Je b forem usadas, e o forem com igual freqüência? (d) Quantas maneiras serli.o possíveis, se somente duas posições forem usa.- das, e dessas posições uma ocorrer três vezes mais freqüentemente que a outra? 2.22. Dentre os números O, 1, 2, . . . , 9 são escolhidos ao acaso (sem repo- sição) r números (O < r < 10). Qual é a probabilidade de que não ocorram dois númerosiguais? 2.13. Suponha que de N objetos, n sejam escolhidos ao acaso, com reposição. Qual será a probabilidade de que nenhum objeto seja escolhido mais do que uma vez? (Admita n < N.) 2.14. Com as seis letras a, b, c, d, t, j quantas palavras-código de 4 letras poderio ser formadas se: (a) Nenhuma let~a puder ser repetida? (b) Qualquer letra puder ser repetida qualquer número de vezes? 2.15. Supondo que (951))= a e (~) = b, expresse (19~) emtermos de o e b. (Suge&l4ô: Nao calcule as expressões acima, para resolver o problema:) 2.16. Uma caixa contém etiquetas numeradas 1, 2, ..., n. Duas etique- tas si!.oescolhidas ao acaso. Determine a probabilidade de que os números das etiquetas sejam inteiros consecutivos se: (a) As etiquetas forem escolhidas sem reposiçli.o. (b) As etiquetas forem escolhidas com reposição. 2.17. Quantos subconjuntos se podem formar, contendo ao menos um ele- mento, de um conjunto de 100 elementos? 2.18. Um inteiro é escolhidoao acaso,dentre os números1, 2,. . ., 50. Qual será a probabilidadede que o númeroescolhidoseja divisívelpor 6 ou por 8? 2.19. Dentre 6 números positivos e 8 negativos, escolhem-se ao acaso 4 números (sem reposição) e multiplicam-se esses números. Qual será a probabili- dade de que o produto séja um número positivo? 2.20. Determinado composto químico é obtido pela mistura de 5 líquidos diferente~. Propõe-se despejar um líquido em um tanque e, em seguida, juntar o~ outros líquidos sucessiv~mente. Todas as seqüências possíveis devem ser ensaiadas, para verificar-se qual delas dará o melhor resultado. Quantos ensaios deverão ser efetuados? ~ PROBABILIDADE CONDICIONADA EtND'EPENDÊNCIA J .43 fazê-Io em relação ao espaço amostral original S. Consideremos o Diagrama de Venn da Fig. 3.1. Quando calcularmos P(B) estaremos nos perguntando quão provável será estar- mos em B, sabendo que devemos estar em S. E quando calcularmos P(B IA) esta- remos perguntando quão provável será es- tarmos em B, sabendo que devemos estar em A. (Isto é, o espaço amostral ficou reduzidode S para A.) Logo, daremos uma definição rigorosa de P(B IA). Por enquan- to, contudo, empregaremos nossa noção intuitiva de probabilidade condicionada e daremos um exemplo. Exemplo 3.1. Dois dados equilibrados são lançados, regis- trando-se o result~do como (Xl, X2),onde Xi é o resultado do i-ésimo dado, i = 1,2. Por isso, o espaço amostral S pode ser represen- tado pela seguinte lista de 36 resultados igualmente prováveis. Probabilidade Condicionada e Independência A B GD Fig.3.1 Capítulo 3 3.1. Probabi Iidade Co,nd,icionada 'Vamos reexaminar a diferença entre extrair uma peça de um lote, ao acaso, com ou sem reposição. No Ex. 2.4, o lote estudado tinha a seguinte composição: 80 não-defeituosas e 20 defeituosas. Suponha-se que escolhemos duas peças desse lote: (a) com reposi- ção; (b) sem reposição. Definamos os dois eventos seguintes: A = Ia primeira peça é defeituosa}; B = Ia segunda peça é defeituosa} . Se estivermos extraindo com reposição, P(A) = P(B) = 20/100 = = 1/5, porque cada vez que extrairmos do lote, existirão 20 peças defeituosas no total de 100. No entanto, se estivermos extraindo sem reposição, os resultados não seI'ãQtão imediatos. É ainda ver- dade, naturalmente, que P(A) = 1/5. Mas e sobre P(B)? É evi- dente que, a fim de calcularmos P(B), deveremos conhecer a compo- sição do lote no momento de se extrair a segundapeça. Isto é, deve- remos saber se A ocorreu ou não. Este exemplomostra a necessidade de se introduzir o seguinte importante conceito. Sejam A e B dois eventos associados ao experimento S. De- notaremos por P(B IA) a probabilidade condicionada do evento B, quando A tiver ocorrido. No exemplo acima, P(B IA) = 19/99, porque se A tiver ocorrido, então para a segunda extração restarão somente 99 peças, das quais 19 delàs serão defeituosas. Sempre que calcularmos P(B IA), estaremos essencialmente cal- culandoP(B) em relaçãoao espaço.amostralreduzidoA, em lugar de { (I, 1) S = (2,/) (6, 1) s (1,2) (2,2) (1, 6) ) (2,6) ~ (6, 6) f (6,2) Consideremos os dois eventos seguintes: A = {(Xl, X2) IXI + X2 = 10}, B = {(Xl>x2)lxl > X2}. Assim, A = {(5,5), (4,6), {6,4J}e B = {(2,1), (3, 1),(3,2), . . ., (6,5)}. 3 ~ 15 1 Portanto, P(A) = 36 e P(l$) = 36' E P(BIA) = "3' uma vez que o espaço amostral é, agora, formado por A (isto é,três resultados), e somente um desses três resultados é coerente com o evento B. De modo semelhante, poderemos calcular P(A IB) = 1/15. Finalmente, vamos calcular P(A () B)., O evento A n B ocorre se, e somente se, a soma dos dois dados for 10 e se o primeiro dado tiver apresentado um valor maior que o segundo dado. Existe ape- nasum desses resultados e, por isso, P(A () B) = 1/36. Se fizermos um exame cuidadoso dos vários números já calculados, concluiremos que P(A IB) = P(A () B) P(B) e P(BIA) = P(A () B) P(A) . --- 44 I PROBABILIDADE PROBABILIDADE CONDICIONADA E INDEPENDÊNCIA I 45 Essas relações não surgiram apenas do particular exemplo que consideramos. Ao contrário, elas são bastante gerais, e nos dão um caminho p8:ra definir rigorosamente a probabilidade condicionada. Para sugerir essa definição, voltemos ao conceit'J de freqüência relativa. Admitamos que um experimento g tenha sido. repetido n vezes. Sejam nA, nB e nAnBo número de vezes que, respectiva- mente, os eventos A, B e A n B tenham ocorrido em n repetições. Qual o significado de nAnB/nA? Representa a freqüência relativa de B naqueles resultados em que A tenha ocorrido. Isto é, nAnB/nA é a freqüêncja relativa de B, condicionada a que A tenha ocorrido. Poderemos escrever nAnB/nA,da seguinte forma: 1UnB nAnB/n f AnB -- --, nA - nA/n - f A evento B, como indicaram os exemplos precedentes. Dentro em breve, estudare- mOSum caso especial importante, para o quaIP(B) e P(B I A) serão iguais. (e) Observe-1>eque a probabilidade condicionada está definida em termos da medida de probabilidade não. condicionada P, isto é, se conhecermos P(B) para todo B c S, poderemos calcular P(B I A) para todo B c S. onde fAnB e fA são as freqüências relativas dos eventos A n B e A, respectivamente. Como já dissemos (e explicaremos mais tarde) se n, o número de repetições for grande, f AnBserá próxima de P(A n B) e f A será próxima de P(A). Conseqüentemente, a relação acima sugere que nAnB/nA será próxima de P(B IA). Por isso, estabelece- remos a seguinte definição: Definição: Deste modo, temos duas maneiras de calcular a probabilidade condicionada P(B IA): (a) Diretamente, pela consideração da probabilidade de B em relação ao espaço amostral reduzido A. (b) Empregando a definição acima, onde P(A n B) e P(A) são calculados em relação ao espaço amostral original S. Commtário:SeA = S, obteremosP(BIS)= P(B n S)/P(S)= P(B), porque P(S)= 1 e B n S = B. Isto é como seria de se esperar, porque dizer que S ocorreu é apenas dizer que o experimento foi realizado. Ê) Tab. 3.1 I MJ l! N- P(A n B) P(B IA) = nl A\ , desde que P(A) > O. (3.1) Comentários: (a) t:': importante compreender que isso nAo é um teoremá (nós não demonstramos coisa alguma), nem é um axioma. Apenas introduzimos a noção intuitiva de probabilidade condicionada e, depoi.'!, estabelecemos uma definição -formal daquilo que essa noção significa. O fato de que nossa definição formal corresponde à.nOSsa noção intuitiva é fundamentado- pelo parágrafo. que precede à definição. . (b) t:':assunto simples verificar que P(BIA) para A fixado, satisfaz aos vários postulados de probabilidade das Eq. (1.3). (VerProbl. 3.22.) Isto éj temos (1') O~ P(B IA) ~ 1, (2') P(S IA) = 1, (3') P(Bi U BtIA) = P(BdA) + P(B2IA) se Bi n B2= *', (3.2) (4') P(Bi U B2 U .. 'IA) = P(BiIA) + P(B211l) + ... se B, n B; = *' para i 'J4j. Exemplo 3.2. Suponha-se que um escrit6rio possua 100 má- quinas de calcular. Algumas dessas máquinas são elétricas (E), enquanto outras são manuais (M); e algumas são novas (N), enquanto outras são muito usadas (U). A Tab. 3.1 dá o número de máquinas de cada categoria. Uma pessoa entra no escrit6rio, pega uma má- quina ao acaso, e descobre que é nova. Qual será a probabilidade de que seja elétrica? Em termos da notação introduzida, desejamos calcular P(E IN). Considerando-se somente o espaço amostral reduzido é, as 70 máquinas novas), temos P(EjN) = 40/70 = 4/7. gandoa definiçãode probabilidadecondicionada,temosque N (isto Empre- P(EIN) = P(E nN) = 40/100 - 4 - P(N} 70/100 -"7' (c) SeA = S,P(B I S) =P(B n S) I P(S) =P(B). (d) A cada evento B c S poderemosassociardois números, P(B), a proba- bilidade (não-condicionada) de B, e P(B I A), a probabilidade condicionada de B, desdeque algum eventoA (para o qual P(A) > O) tenha ocorrido. Em geral, essas duas medidas de probabilidade atribuirão probabilidades diferentes ao A mais importante conseqüência da definição de probabilidane condicionada acima, é obtida ao se escrever: P(A n B) = P(BIA)P(A) ou, equivalentemente, ~ - 40 30 70 20 10 30 60 40 46 I PROBABILIDADE PROBABILIDADE CONDICIONADA E INDEPENDÊNCIA I 47 P(A n B)=P(A I B)P(B) (3.3.a) Isto é, algumas vezes, mencionado como o teoremada multiplicação de probabilidades. Podemos aplicar esse teorema para calcular a probabilidade da ocorrência conjunta dos eventos A e B. (b) P(A IB) = P(A fi B)jP(B) = [P(A)jP(B)] ~ P(A), já que O~ P(B) ~ 1. (c) P(A IB) = P(A fi B)jP(B) = P(B)!P(B) = 1 ~ P(A). (d) Neste caso nada poderemos afirmar sobre a grandeza rela- tiva de P(A IB) e P(A). Observe-se que em dois dos casos acima, P(A) 5. P(A IB); em um caso, P(A) ~ P(A IB); e no quarto caso, não podemos fazer qual- quer comparação. Até aqui, empregamos o conceito de probabilidade condicionada a fim de avaliar a probabilidade de ocorrência conjunta de dois even- tos. Poderemos aplicar esse conceito em outra maneira rle calcular a probabilidade de um evento simples A. Necessitaremos da se- guinte definição: Exemplo 3.3. Consideremos novamente o lote formado de 20 peças defeituosas e 80 não-defeituosas, estudado no intcio da Seç. 3.1. Se escolhermos ao acaso duas peças, sem reposição, qual será a pro- babilidade de que ambas as peças sejam defeituosas? Como anteriormente, definamos os eventos A e B, na seguinte forma. A = Ia primeira peça é defeituosa I; B = Ia segunda peça é defeituosaI. Conseqüentemente, pediremos P(A fi B), que poderemos cal- cular, de acordo com a f6rmc~laacima, como P(B IA) P(A). :\Ias, P(B IA) = 19/99, enquanto P(A) = 1/5. Portanto, P(.4 fi B) = = 19j495. Definição. Dizemos que os eventos B1I Bt,. . ., BIr:representam uma partiçãodo espaço amostral S, quando (a) Bi fi Bj = 0, para todo i ~ i. Ir: (c) P(Bi) > O para todo i. Explicando: Quando o experimento &é realizado um, e somente um, dos ('ventos Ri ocorre. (Por exemplo:na jogada de um dado, BI= /1,21,B2= /3,4,51 e B3= {6} representariam uma particão do espaço amostral, enquanto CI = 11, 2, 3, 41 e C2 = 14, 5, 61 não o representariam.) Consideremos A um evento qual- quer referente a S, e BI, B2"", BIr:uma partição de S. O Diagrama de Venn na Fig. 3.3 ilustra isso para k = 8. Portanto, poderemos escrever Comentdrio: O teorema da multiplicação de probabilidades (3.3.a) pode ser generalizado para mais de dois eventos, da seguinte maneira: (b) U Bi = S. i-I PIA, ri A 2 ri ...ri An] = =P(A,)P(A, IA,)P(A3 IA.,A2)...P(An IA.,...An-l)' (3.3.b) s cQ)T~lf(]5l 60 (d) Nenhum desses casos (a)AnB~O (b) A:; B (c) B c A Fig.3.2 Fig.3.3 Examinemos agora, rapidamente, se poderemos fazer uma afir- mação geral sobre a grandeza relativa de P(A IB) e P(A). Consi- deraremos quatro casos, que estão ilustrados pelos Diagramas de Venn, na Fig. 3.2. Teremos: (a) P(A IB) = O ~ P(A), porque A não poderá ocorrer se B tiver ocorrido. A = A fi BI U A () B2 U '" U A fi BIr:. Naturalmente, alguns dos conjuntos A fi Bj poderão ser vazios, ma.'! isso não invalida essa decomposição de A. O ponto importante é qUe todos os eventos A () BI,..., A () BIr:são dois a dois mutua- Inente excludentes. Por isso, poderemos aplicar a propriedade da ----- 48 I PROBABILIDADE PROBABILIDADE CONDICIONADA E INDEPENDÊNCIA I 49 P(A) = P(.1 n BI) + P(A n B1) +...+ P(A n Bk). Pede-se P(A), e empregando-se o resultado acima, poderemos escrever: adição de eventos mutuamente excIudentes [Eq. (1.3)], e escrever Este resultado representa uma relação extremamente útil, porque freqüentemeqte, quando P(A) é pedida, pode ser dificil calculá-Ia diretamente. No entanto, com a informação adicional de que B; tenha ocorrido, seremos capazes de calcular P(.1 IBj) e, em seguida, empregar a fórmula acima. Exemplo 3.4. Consideremos (pela última vez) o lote de 20 peças defeituosas e 80 não-defeituosas, do qúal extrairemos duas peças, sem reposição. Novamente definindo-se A e B como iguais a A = Ia primeira peça extraída é defeituosa}, B = Ia segunda peça extraída é defeituosaI, poderemos,agora,calcularP(B), assim: P(.1) = P(.1 IBI)P(BI~ + P(A IB2)P(B,) + P(A IBa)P(Ba). Ora, P(BI)= 1/2, enquanto P(B2)= P(B3)= 1/4. Também, P(.1 IBI) = ==P(A IB2) = 0,02, enquanto P(A IBa) = 0,04. Levando-se esses va- lores à expressão acima, encontraremos P(.1) = 0,025. Comentário: A seguinte analogia com o teorema da probabilidade total é observada em Química: Suponha-se que temos k frascos contendo diferentes soluções de um mesmo sal totalizando, digamos, um litro. Seja P(Bi) o volume do i-ésimo frasco e seja P(A IBi) a concentração da solução no i-ésimo frasco. Se reunirmos todas as soluções em um só frasco e se P(A) denotar a concentração da solução resultante, teremos: Contudo, c'ada termo P(.1 n BJ pode ser expressona forma P(A IB;). .P(Bj) c, daí, obteremos o que se denomina o teorema da pl"Obabili- dade lolal: P(.1) = P(.1IBI)P(BI') + P(AIB2)P(B,)+.. .+P(AIBk)P(Bk). (3.4) P(A) = P(A IBI)P(BI) + "'. + PIA IBk)P(Bk). 3.2. Teorema de Bayes P(B) = P(BIA)P(.1) + P(BIA)P(A). Poderemos empregar o Ex. 3.5 para sugerir outro importante resultado. Suponha-se que uma peça seja retirada do depósito e se verifique ser ela defeituosa. Qual é a probabilidade de que tenha sido produzida na fábrica I? Empregando a notação já introduzida, pede-se P(Bi! A). Pode- remos calcular esta probabilidade como uma conseqüência da seguinte exposição: Seja BI, B2,. . ., Bk uma partição do espaço amostral S e seja A um evento associado a S. Aplicando-se a definição de pro- babilidade condicionada, poderemos escrever Empregando alguns dos .cálculos realizados no Ex. 3.3, encontramos que 19 1 20 4 1 P(B) = - . - + - . - = - 9959955 Este resultado pode ser um tanto surpreendente, especialmente se o leitor se recordar de que no início da Seç. 3.1 encontramos que P(B) = 1/5, quando extraímos as peças com reposição. . Exemplo 3.5. Uma determinada peça é manufaturada por três fábricas, digamos 1, 2 e 3. Sabe-se que 1 produz o dobro de peças que 2, e 2 e 3 produziram o mesmo número de peças (durante um periodo de produção especificado). Sabe-se também que 2 por cento das peças produzidas por 1 e por 2 são defeituosas, enquanto 4 por cento daquelas produzidas por 3 são defeituosas. Todas as peças produzidas são colocadas em um depósito, e depois uma peça é ex- traída ao acaso. Qual é a probabilidade de que essa peça seja de- feituosa? Vamos introduzir os seguintes eventos: A = Ia peça é defei- tuosa}, BI = Ia peça provém de 11, B2 = Ia peça provém de 2}, Ba = Ia peça provém de 3}. P(.1 IBi)P(Bi) P(BdA) = 2:::7=1P(.1IBJ)P(Bj) t. = 1,2,..., k. {3.5) Este resultado é conhecido como Teorema de Bayes. É também denominado fórmula da probabilidade das "causas" (ou dos "antece- dentes"). Desde que os Bi constituam uma partição do espaço amos- traI um, e somente um, dos eventos Bi ocorrerá. (Isto é, um dos eventos Bi deverá ocorrer e somenle um poderd ocorrer.) Portanto, a expressão acima nos dá a probabilidade de um particular Bi (isto é, uma "causa"), dado que o evento A lenha ocorrido. A fim de aplicar esse teorema, deveremos conhecer os valores dasP(Bi). Muito freqüentemente, esses valores são desconhecidos, e isso limita a apli- eabilidade do teorema. Tem havido considerável controvérsia sobre o Teorema de Bayes; ele é perfeitamente correto matemati- camente; somente a escolha imprópria dos P(Bi) pode tornar o resul- tado discutível. ~ 50 I PROBABILIDADE PROBABILIDADE CONDICIONADA E INDEPENDÊNCIA I 51 Voltando ao problema proposto acima, e agora aplicando a Eq. (3.5), obtemos: Façamos alguns cálculos: P(B1IA) == (0,02)(1/2) . .-'-'" /__.''-1., ==0,40. P(A) ==0,6;P(B) ==0,4;P(Sd IA) ==0,7; P(Sa IA) ==0,3;P(Sd IB) ==0,3;P(Sa IB) ==0,7. Desejamos realmente saber: Comentdrio: De novo, podemos encontrar para o Teorema de Bayes, uma analogia da Química. Em k frascos, temos soluções do mesmo sal, porém de concentrações diferentes. Admita-se que o volume total das soluções seja um litro. Denotando por P(Bi) o volume da solução do i-ésimo frasco, e a concentra' ção do sal nesse i-ésimo frasco por P(A IBi)' verificaremos que a Eq. (3.5) fornece a proporção da quantidade total do sal que é encontrada no i-ésimo frasco. P(A ISd), P(A ISa), P(BISd) e P(BISa). Suponha-se que realmente retiremos um bombom de sabor doce. Qual decisão seríamos mais tentados a tomar? Vamos comparar o seguinte exemplo do Teorema de Bayes nos daráuma oportuni- dade para introduzir a idéia do diagramo de árvore, um esquemabas- tante útil para analisar determinados problemas. Suponha-se que um grande número de caixas de bombons sejam compostas de dois tipos, A e B. O tipo A contém 70 por cento de bombons doces e 30 por cento de bombons amargos, enquanto no ti- po B essaspercentagens de sabor são inversas. Além disso, suponha-se que 60 por cento de todas as caixas de bombons sejam do tipo A, en- quanto asrestantessejam do tipo B. Você agora se defronta com o seguinte problema de decisão: uma caixa do tipo desconhecido lhe é oferecida. Você terá permissão para tirar uma amostra de bombom (uma situação reconhecidamente irrea- lística, mas que nos permitirá introduzir idéias importantes, sem ficar muito complicado), e com esta informação você deve decidir se adivi- nha que a caixa que lhe foi oferecida é do tipo A ou se do tipo B. O seguinte "diagrama de árvore" (assim denominado por causa dos vários passos ou ramos que aparecem) nos ajudará a analisar o p~óblema.(Sd e Sa correspondem,respectivamente,a escolherum bombomde sabor doce ou um bombom de sabor amargo.) P(A ISd) e P(BISd)' Empregando a fórmula de Bayes, teremos , P(Sd IA)P(A) - P(A ISd) == P(Sd IA)P(A) + P(Sd IB)P(B) (0,7)(0,6) - 7 (0,7)(0,6) + (0,3)(0,4) -9' Cálculo semelhante dará P(BISd) ==2/9. Sa Dessa maneira, baseados na evidência que tivemos (isto é, a tirada de um bombom de sabor doce) é 2 ~ vezes mais provável que nós este- . 2 Jamosdiante de uma caixa do tipo A, em vez de uma do tipo B. Con- seqüentemente, poderíamos presumivelmente decidir que uma caixa do tipo A foi apresentada. (Naturalmente, nós poderíamos estar errados. A Sugestão desta análise é que estaremos escolhendo aquela alternativa que pareça a mais provável, com base na evidência limitada que ti- vermos.) Em termos do diagrama da árvore, o que era realmente necessário (e foi feito) era uma análise para o passado. Assim, dado o que foi observado Sd, neste caso qual a probabilidade de que o tipo A seja o envolvido? . Uma situação mais interessante surge, se nos for permitido tirar ~OIS bombons antes de decidir se se trata do tipo A ou do tipo B. este caso,o diagramade árvore aparece assim: Sd Sa Sd r-- 52 I PROBABILIDADE PROBABILIDADE CONDICIONADA E INDEPENDÊNCIA I 53 Sd' Sa ou Sa' Sd tados igualmente prováveis, considerados no Ex. 3.1, encontraremos que P(A) = 18/36 = 1/2, P(B) = 12/36 = 1/3, enquanto P(A n B) = = 6/36= 1/6. Conseqüentemente, P(A IB) = P(A n B) / P(B) = ==(1/6)/(1/3)= 1/2. Sd,Sd Sa,Sa Sd' Sa ou Sa' Sd Deste modo encontramos, como seria de se esperar, que a proba- bilidade absoluta (ou não condicionada) é igual à probabilidade COIt- dicionada P(A IB). Semelhantemente, p(BnA) (t) 1 P(BIA) =. P(A) = U-) = 3 = P(B). Sd,Sd Sa,Sa DaI, poderíamos ser tentados a dizer que A e B serão indepen- dentes se, e somente se, P(A IB) = P(A) e P(B IA) = P(B). Muito embora isso'pudesse ser essencialmente apropriado, existe outra forma de colocar a questão que contorna a dificuldade encontrada aqui, a saber, que tanto P(A) como P(B) devem ser não-nulos para que as igualdades acima tenham significado. Consideremos P(A n B), supondo que as probabilidades condi- cionadas sejam iguais às correspondentes probabilidades absolutas. Teremos: No problema 3.26, você será chamado a decidir de qual dos dois ti- pos, A ou B, você tirou a amostra, na dependência de qual seja obser- vado dentre três resultados experimentais possíveis. 3.3. Eventos Independentes Ja consideramos -eventos A e B que não podem ocorrer conjun- tamente, isto é, A n B = 0. Tais eventos Rãodenominados mutua- mente excludentes, ou eventos incompatíveis. Observamos anterior- mente que se A e B forem mutuamente excludentes, então P(A IB) = °, porque a ocorrência dada de B impede a ocorrência de A. No outro extremo, temos a 'situação já estudada, na qual R :> A e, conse- qüentemente, P(R IA) = 1. Em cada uma das situações mencionadas, saber que R já ocorreu nos dá alguma informação bastante definida referente. à probabili- dade de ocorrência de A. Existem, porém, muitas situações nas quais saber que algum evento R ocorreu não tem qualquer interesse quanto à ocorrência ou não ocorrência de A. Exemplo 3.6. Suponhamos que um dado equilibrado seja jogado duas vezes. Definamos os eventos A e R, da seguinte forma: A = 10 primeiro dado mostra um número par}, R = 10 segundo dado mostra um 5 ou um 6}. P(A n R) = P(A IB)P(R) = P(A)P(R), P(A n B) = P(B IA)P(A) = P(R)P(A). Desse modo, desde que nem P(A) nem P(R) sejam iguais a zero, veri- ficamos que as probabilidades absolutas serão iguais às probabili- dades cond,icionadasse, e somente se, P(A n R) = P(A) P(R). Em conseqüência, formulamos a seguinte definição, a qual será também válida quer P(A) ou P(B) seja nulo: Definição: A e R serão eventosindependentesse, e somente se, P(A n B) = P(A)P(R). (3.6) ~ intuitivamente compreensível que os eventos A e B são intei- ramente não relacionados. Saber que R ocorreu não fornece qual- quer informação sobre a ocorrência de A. De fato, o seguinte cál- culo mostra isso. Tomando como nosso espaço amostral os 36 resul- Comentário: Esta definição é, essencialmente, equivalente àquela BUgerida acilIla, a saber, que A e B são independentes quando P(BIA) = P(B) e P(A IB) = = P(A). Esta última forma é ligeiramente mais intuitiva, porque diz precisa- lDente o que se tinha tentado dizer antes: que A e B seria independentes se o co- nhecimento da ocorrência de A de nenhum modo influenciar a probabilidade da OCorrênciade B. Pelo exame do seguinte exemplo, v~ que a definição formal &cima adotada IIpresenta também uma certa atração intuitiva. Exemplo 3.7. Consideremos novamente o Ex. 3.2. Inicial- rn.enteexaminaremos apenas a tabela abaixo, em que são fornecidos a-- 54 I PROBABILIDADE PROBABILIDADE CONDICIONADA E INDEPENDÊNCIA I 55 somente os valores marginais. Isto é, existem 60 máquinas elétri- cas e 40 manuais, e delas 70 são novas enquanto 30 são usadas. 60 I 70 30 100 condições físicas sob as quais o experimento seja realizado tornarão possível decidir se tal suposição será justificada ou ao menos apro- ximadamente justificada. Exemplo 3.8. Consideremos um lote grande de peças, digamos 10.000. Admitamos que 10 por cento dessas peças sejam defeituosas e 90 por cento perfeitas. Duas peças são extraídas. Qual é a pro- babilidade de que ambas sejam perfeitas? Definamos os eventos A e B, assim: A = Ia primeira peça -é perfeita I, B = Ia segunda peça é perfeita}. E M ~\ 40 Existem muitas maneiras de preencher as casas da tabela, con- cordantes com os totais marginais dados. A seguir apresentaremo::, algumas dessas possibilidades. E M E M E M N 1 60 10 \ 70 N 1 30 40 I 70 N \ 42 28 \ 70 u O 30 30 U 30 O 30 U IR 12 30 60 40 100 60 40 100 60 40 100 ~ W 00 Consideremos a Tab. (.a). Aqui todas as máquinas elétricas são novas e todas as máquinas usadas são manuais. Desse modo, existe uma conexão óbvia (não necessariamente causa]) entre a ca- racterística de ser elétrica e a de ser nova. Semelhantemente, na Tab. (b), todas as máquinas manuais são novas e todas as máquinas usadas são elétricas. Também, uma conexão definida existe en tre essas características. No entanto, quando chegamos à Tab. (c), a situação fica bem diferente: aqui, nenhuma relação evidente existe. Por exemplo, 60 por cento de todas as máquinas são détricas, e exatamente 60 por cento das máquinas usadas são eiétricas. Se- melhantemente, 70 por cento de todas as máquinas são novas, enquanto exatamente 70 por cento das máquinas manuais sij.Qnovas etc. Portanto, nenhuma indicação está evidente de que a carac- terística de "ser nova" e de "ser elétrica" tenham qualquer cone- xão uma com a outra. Naturalmente, esta tabela foi construída justamente de modo a apresentar essa propriedade. Como foram obtidos os valores das casas da tabela? Apenas com o emprego da Eq. (3.6); isto é, porque P(E) = 60/100 e P(N) = 70/100, deveremos ter, para independência, P(E n N) = P(E) P(N) = 42/100. Daí, a casa na tabela que indique o número de máquinas elétricas novas deverá conter o número 42. As outras casas seriam obtidas de ma- peira análoga. Na maioria das aplicações, teremos que adotar a hipôtege de in- dep~ndência de dois eventos A e B, e depois empregar essa suposiçãO para calcular P(A n B) como igual a P(A) P(B). Geralmente, Se admitirmos que a primeira peça seja reposta, antes que a segunda seja escolhida, então os eventos A e B podem ser considerados inde- pendentes e, portanto, P(A n B) = (0,9)(0,9) = 0,81. Na prá- tica, contudo, a segunda peça é escolhida sem a reposição da primeira peça; neste caso, P(A n B) = P(BIA)P(A) = t~~~ (0,9) que é aproximadamente igual a 0,81. Assim, muito embora A e B não sejam independentes no segundo caso, a hipótese de independên- cia (que simplifica consideravelmente os cálculos) acarreta apenas um erro desprezível. (Recorde-se o objetivo de um modelo matemá- tico, tal como foi apresentado na Seç. 1.1.) Se existissem somente poucas peças no lote, digamos 30, a hipótese de independência teria acarretado um erro grande. Por isso, torna-se importante verificar cuidadosamente as condições sob as quais o experimento é realizado, a fim de estabelecer a validade de uma suposição de independência entre os vários eventos. Exemplo 3.9. Admitamos que um mecanismo seja constituído por dois componentes montados em ~érie, como indicado na Fig. 3.4. Cada componente tem uma probabilidade p de não funcionar. Qual será a probabilidade de que o mecanismo funcione? --@ §-- Fig.3.4 J!:evidente que o mecanismo funcionará se, e somente se, ambos 08componentesestiverem funcionando. Por isso, Prob (o mecanismo funcione) = Prob (C1 funcione e C2 funcione). ~ 56 I PROBABILIDADE PROBABILIDADE CONDICIONADA E INDEPENDÊNCIA I 57 A informação fornecido.não nos permite continuar sem que se saiba (ou se suponha) que os dois mecanismostrabalhem independentemente um do outro. Isto pode, ou não, ser uma suposição realista, depen- dendo de como as duas partes sejam engatadas. Se admitirmos que as duas partes trabalhem independentemente, obteremos para. a probabilidade pedida o valor (1 - p)z. Será importante para n6s, estendermos a noção de independên- cia para mais de dois eventos. Consideremos, inicialmente, três eventos associados a um experimento, digamos A, B e C. Se A e B, A e C, B e C forem independentes dois a dois (no sentido acima), então não se concluirá, em geral, que não exista dependência entre os três eventos. O exemplo seguinte (um tanto artificial) ilustra. esse ponto. ComenJár':Q:Na maioria das aplicações, não precisaremos verificar todas essas condições,porque nós geralmenteadmitimosa independência(baseada na- quilo que conhecermosdo experimento). Depois,empregaremosessa suposição para calcular, digamosP(Ai. () Ai, () ... () Aik) comoP(Aú)P(Ai,) . . . P(Aik)' Exemplo 3.11. A probabilidade de fechamento de cada relê do circuito apresentado na Fig. 3.5 ê dada por p. Se todos os relés fun- cionarem independentemente, qual será a probabilidade de que haja corrente entre os terminais L e R? ~:::~ Exemplo 3.10. Suponha-se que joguemos dois dados. se os eventos A, B e C da seguinte forma: A == 10primeirodado mostra.um número par}, B == 10 segundo dado mostra um número ímpar}, C == Iambos os dados mostram números ímpares mostram números pares}. Definam- Fig.3.5 P(A ri B) == P(A)P(B), P(B ri C) == P(B)P(C), P(A n C) == P(A)P(C), P(A ri B n C) == P(A)P(B)P(C). (3.7) Represente-se por Ai o evento 10 relê i está fechado J, i == 1, 2, 3,4. Represente-se por E o evento Ia corrente passa de L para R}. Em conseqüência, E == (AI ri Az) U (Aa ri A4). (Observe-se que AI ri Az e Aa ri A4 não são mutuamente excIudentes.) Portanto, P(E) == P(AI ri Az)+ P(Aa ri A4)- P(AI ri Az ri Aari A4) == pz+ pZ - p4 == 2pz- p4.. Exemplo 3.12. Suponhamos novamente que, para o circuito da Fig. 3.6, a probabilidade de que cada relê esteja fechado ê p, e que todos os relés funcionem independentemente. Qual será a proba- bilidade de que exista corrente entre os terminais L e R? Empregando a mesma notação do Ex. 3.11, teremos que P(E) == P(AI n Az) + P(A~) + P(A3 n A4) - P(AI ri Az ri A~) - P(AI ri Az ri AJ ri A4) - P(A~ ri Aa ri Ac) + P(AI ri Az ri Aa ri A4 ri A~) == p2 + p + pZ - p3 - p4 - p3 + p' == p + 2p2- 2p3 - p4 + p'. Vamos encerrar este capitulo com a indicação de uma bastante comum, mas errÔnea, resolução de um problema. ou ambos Temos P(A) ==P(B) ==P(C) ==1/2. Além disso, P(A ri B) == ==P(A ri C) ==P(B n C) ==1/4. Portanto, 08 três eventos são todos independentes dois a dois. Contudo, P(A ri B ri C) == ==O ~ P(A) P(B) P(C). Este exemplo sugere a seguinte defInição. Definição. Diremos que os três eventos A, B e C são mutua- mente independentes se, e somente se, todas as condições seguintes fo- rem válidas: I I1 11 1I I1I1II J Finalmente, generalizaremos esta noção para n eventos, na seguinte definição: Definição. Os n eventos AI, Az,..., An serão mutuamente inde- pendentesse, e somentese, tivermospara k == 2,3, ..., n: P(Ail ri Aiz ri ... ri Aik) == P(Ail)P(Aiz) ... P(Aik)' (3.8) ~A2.~~ Fig.3.6 (Existem ao todo 2n -n - 1 condições ai arroladas; veja o ProbI. 3.18.) 58 I PROBABILIDADE PROBABILIDADE CONDICIONADA E INDEPENDÊNCIA / 59 Exemplo 3.13. Admita-se que dentre seis parafusos, dois sejam menores do que um comprimento especificado. Se dois dos parafu-;- sos forem escolhidos ao acaso, qual será a probabilidade de que os dois parafusos mais curtos sejam extraIdos? Seja Ai o evento (o i-ési- mo parafuso escolhido é curto}, i = 1, 2. Portanto, desejamos calcular P(A, () A2). A solução correta é obtida, naturalmente, escrevendo Em seguida, representaremos as várias probabilidades pelas áreas dos retângulos, como na Fig. 3.8. Em cada caso, as regiõessombreadas indicam o evento B: no retângulo da esquerda, estamos representando A n B e, no da direita,A' n B. 1 2 1 P(A1 11A2) = P(A2)P(A1) = 5" . "6 = 15' 8' 1 2 1 P(A1 11 A2) = P(A2IAI)P(AI) = 5" . "6 = 15' A solução comum, mas incorreta, é obtida escrevendo-se 8 Naturalmente, o importante é que, muito embora a resposta esteja numericamente correta, a identificação de 1/5 com P(A2) é incorreta~ 1/5 representa P(A2IAI)' Para calcular P(A2) corretamente, escre- veremos - - 1 2- 2 4 1 P(A2) = P(A2IAI)P(AI)+ P(A2IAI)P(AI)=-'-. -- + - . - = - . 5 6 563 3.4. ConsideraçõesEsquemáticas;Probabilidade Condicionada e Independência Agora, admitamos que se desejecalcularP (B I A). Por isso,neces- sitamos somente considerar A, isto é, A' pode ser ignorado no cálculo. Observamosque a proporção de B emA é 1/4. (poderemos também ve- rificar isso pela aplicação da Eq. (3.1): P(B IA) = P(A n B) IP(A) = = 0,1/0,4 = 1/4.) Portanto, P(B' IA) = 3/4, e nosso diagrama repre- sentandoessaprobabilidade condicionada seriadado pela Fig. 3.9. o A abordagem esquemática seguinte poderá ser útil para compreen- der a probabilidade condicionada. Suponhamos que A e B sejam dois eventos associados a um espaço amostral para o qual asvárias probabi- lidadesestão indicadas no Diagramade Venn, dado na Fig. 3.7. .. A' 0,2 Observe-se,também, que se A for dado como tendo ocorrido, toda a probabilidade (isto é, I) deverá ser associada ao evento A, enquanto nenhuma probabilidade (isto é, O) estará associada a A'. Além disso, observe-seque, no retângulo da esquerda, representando A, somente os Valoresindividuaismudaram na Fig. 3.8 para a Fig. 3.9 (cuja somaé 1, em lugarde 0,4). Contudo, as proporções dentro do retângulo permane- ceramasmesmas(isto é, 3:1). Fig.3.7 Tem-se P(A () B) = 0,1; P(A) = 0,1 + 0,3 = 0,4 eP(B) = 0,1 +0,4 == = 0,5. -ar-- 0,6 0.2 0,4 B' 0,3 B A A' Fig.3.8 1,0 8' 0,75 8 A Fig.3.9 -- 60 I PROBABILIDADE PROBABILIDADE CONDICIONADA E INDEPENDÊNCIA I 61 0,45 8' 3.3. Uma caixa contém 4 válvulas defeituosas e 6 perfeitas. Duas viUvulas são extraídas juntas. Uma delas é ensaiada e se verifica. Ser perfeita. Qu.aJ a probabilidade de que a outra válvula também seja perfeita? 3.4. No' problema anterior, as válvulas são verificadas extrai.ndo-se uma válvula ao acaso, ensaiando-a e repetindo-se o procedimento até que todas as 4 válvulas defeituosas sejam encontradas. Qual será a probabilidade de que a quarta válvula defeituosa seja. encontrada: (a) No quinto ensaio,? (b) No décimo ensaio? 3.5. Suponha que A e B sejam eventos independentes associados a um ex- perimento. Se a probabilidade de A ou B ocorrerem for igual a 0,6, eJ)quanto a probabilidade da ocorrência de A fo~ iglilU a 0,4, detennine a probabilidade da ocorrência de B. 3.6. Vinte peças, 12 das quais são defeituosas e 8 perfeitas, são inspecio- nadas uma após a outra. Se essas peças forem extraídas ao. acaso, qual será a probabilidade de que: (a) ABduas primeiras peças sejam defeituosas? (b) As duas primeiras peças sejam perfeitas? (c) Das .duasprimeiras peças inspecionadas, uma seja perfeita e a outra. defeituosa? 3.7. Suponha que temos duas urnas 1 e 2, cada uma com duas gavetas. A urna 1 contém uma moeda de ouro em uma gaxeta e uma moeda de prata na outra gaveta; enquanto a urna 2 contém uma. moeda de ouro em cada gaveta. Uma urna é escolhida ao acaso; a seguir uma de suas gavetas é aberta ao acaso. Verifica-se que a moeda encontrada nessa. gaveta é de ouro. Qual a probabili- dade de que a moeda provenha da urna 2? Vamos também ilustrar a noção de independência, empregando a abordagem esquemática introduzida anteriormente. Suponhamos que A e B sejam como indicado na Fig. 3.1O. Nesse caso, as proporções nos dois retângulos, represéntando A e A', são asmesmas:3: 1nos dois casos. Por isso, teremos P (B) = 0,1 + 0,15 = 0,25 e P (B () A) = = 0,1/0,4 = 0,25. 0,6 0,4 B' 0,3 B 8 A Fig.3.10 Finalmente, observe-se que, simplesmente olhando a Fig. 3.8, poderemos também calcular as outras probabilidades condicionadas: P(A I B) = 1/5 (desde que 1/5 da área total retangular representando B esteja ocupada por A); P (A' I B) = 4/5. Problemas 3.8. Um saco contém três moedas, uma das quais foi cunhada COIp.duas caras, enquanto as duas outras moedas são normais e não viciadas. Uma moeda é tirada ao acaso do saco e jogada quatro vezes, em seqüência. Se sair cara ÚJda vez, qual será a probabilidade de que essa seja a moeda de duas caras? 3.9. Em uma fábrica de parafusos, as máquinas A, B e C produzem 25, 35 e 40 por cento do total produzido, respectivamente. Da produção de cada máqui- na, 5, 4 e 2 por cento, respectivamente, são parafusos defeituosos. Escolhe-se ao acaso um parafuso e se verifica s~r defeituoso. Qual será a probabilidade de que o parafuso venha da máquina A ? Da B? Da C? 3.10. Sejam A e B dois eventos associad0s a um experimento. Suponha que P(A) = 0,4, enquanto P(A U B) = 0,7. Seja P(B) = p. (a) Para que valor de p, A e B serão mutuamente excludentes? (b) Para que valor de p, A e B serão independentes? 3.11. Três componentes C1, C2 e Ca, de um mecanismo são postos em série (e~ linha reta). Suponha que esses componentes sejam dispostos em ordem alea- t6~a. Seja R o evento IC2 está à direita de C1}I e seja S o evento ICa está à di- reita de CII. OS eventos R e S são independentes? Por quê? 3.12. Um dado é lançado e, independentemente, urna carta é extraída de l1IDbaralho completo (52 cartas). Qual será a probabilidade de que: 3.1. A urna 1 contém x bolas brancas e y bolas ve(melhan. A Il.l:n.a.2. con- tém z bolas brancas e v bolas vermelhas. Uma bola é escolhida ao acaso da u(na. ~ e posta na urna 2. A seguir, uma bola é escolhida ao acaso da urna 2. Qual será a probabilidade de que esta bola seja branca? 3.2. Duas válvulas defeituosas se misturam com duas válvulas pedeitas. As válvulas são ensaiJ,.das,UIIlAa uma., até que ambas as defeituosas sejam eocontradas. (a) Qual sed. a probabilidade de que a illtiJrui.v9.1vuladefeituosa. seja enoon- tradano segundo ensa.io? (b) Qual será a probabilidade de que a última válvula defeituosa. seja encon- trada no terceiro, ensaio? (c) Qual será a proba.bilidade de que a última vMvula defei.tuosa.sejaencoo- trada 110quarto ensaio? (d) Some os Ilúmeros obtidos em (a), (b) e (c) acima. O (esultado é surpre- endente ? ----- PROBABILIDADE CONDICIONADA E INDEPENDÊNCIA I 63 62 I PROBABILIDADE (a) O dado mostre um número par e a carta seja de um naipe vermelho? (b) O dado mostre um número par ou a carta seja de um naipe vermelho? 3.13. Um número binário é constituído apenas dos dígitos zero e um. (Por exemplo, 1 011, 1 100 etc.) Esses números têm importante papel na utilização de computadores eletrônicos. Suponha que um número binário seja formado de n dígitos. Suponha que a probabilidade de um dígito incorreto aparecer seja p e que os erroS em diferentes dígitos sejam independentes uns dos outros. Qual será a probabilidade de formar-se um nÚ~To incorreto? (c) A tenha mais desarranjos que B. (tI) B tenha duas vezes mais desarranjos que A. (e) B tenha 4 desarranjos, quando se saiba que B já tenha tido 2 desar- ranjos. (j) O número mínimo de desarranjos das duas máquinas seja 3; seja menor do que 3. (,) O IJI,Wneromáximo de desarranjos das máquinas seja 3; seja maior que 3. 3.16. J ogam-se dois dados. Desde que as faces mostrem números dife- rentes, qual é a probabilidade de que uma face seja 4? 3.17. Sabe-se que na fabricação de um certo artigo, defeitos de um tipo ocorrem com probabilidade 0,1 e defeitos de outro tipo com probabilidade 0,05. Qual será a probabilidade de que: (a) Um artigo não tenha ambos os tiPos de defeitos? (b) Um artigo seja defeituoso? (c) Um artigo tenha apena.s um tipo de defeito, sabido que"'é defeituoso? 3.14. Um dado é atirado n vezes. Qual é a probabilidade de que "6" apa- reça ao menos uma vez em n jogadas? 3.15. Cada uma de duas pessoas joga três moedas equilibradas. Qual é a probabilidade de que elas obtenham o mesmo número de caras? (a) (b) 3.22. Verifique pelas Eqs. (3.2) que, sendo  fuo, P(BjA) satisfaz aos váriO!! postulados da probabilidade. 3.23. Se cada elemento de um determinante de segunda ordem for zero ou um, qual será a probabilidade de que o valor do determinante seja positivo? (Admita que os elementos do determinante sejam escqIhidos independentemente, a cada valor se atribuindo a probabilidade 1/2.) 3.24. Verifique que o teorema da multiplicação P(A Í1 B) = P(A IB)P(B), estabelecido para dois eventos, pode ser estendido para tr~s eventos, da seguinte maneira: P(A Í1 B Í1 C) = P(A IB Í1 C)P(BIC)P(c). 3.25. Uma montagem eletrônica é formada de dois Bubsistemas A e B. De procedimentos de ensaio anteriores, as seguintes probabilidades se admitem c0- nhecidas; P(A falhe) = 0,20, P(A e B falhem) = 0,15, P(B falhe lIozinAo)- 0,15. Calcule as seguintes probabilidades: (a) P(A falhe I B tenha falhado). (b) P(A falhe sozinho). 3.26. Conclua a análise do exemplo dado na Seção 3.2, pela decisão de qual dos dois tipos de caixa de bombons, A ou B, foi apresentada, baseando...e na evidência dos dois bombons que foram tirados na amostra. 3.27. Sempre que um experimento é realizado, a ocorrência de um parti- cu1ar evento A é igual a 0,2. O experimento é repetido independentemente, até que A ocorra. Calcule a probabilidade de que seja necessário levar a cabo o experi- mento até a quarta vez. 3.18. Verifique que o número de condições impostas pela Eq. (3.8) é dado por2"-n-1. 3.19. Demonstre que, seA e B forem eventos independentes, também o serão A e B, 11e B, 11e B. 3.20. Na Fig. 3.11(a) e (b), suponha que a probabilidade de que cadarelé esteja fechadoseja p, e que cada relé seja aberto ou fechadoindependentemente um do outro. Em cada caso, determine a probabilidadede que a corrente passe de L para R. ~T~ ~~.~. 2 R .;\lI, . W'H;r Fig. 3.11 3.28. Suponha que .um equipamento possua N wlvulas, todas necessárias para seu funcionamento. A fim de localizar uma válvula com mau funcionamento, faz-se a substituição de cada válvula, sucessivamente, por uma válvula nova. Calcule a probabilidade de que seja necessário trocar N válvulas, se a probabilidade (cons- tante) de uma válvula estar desarranjada por p. 3.29. Demonstre: SeP (A I B) > P (A), então,P (B IA) > P (B). 3.21. Duas máquinas A e B, sendo operadas independentemente, podem ter alguns desarranjos cada dia. A Tab. 3.2 dá a distribuição de probabilidades dos desarranjos para cada máquina. Calcule as seguintes probabilidades: (a) A e B tenham o mesmo número de desarranjos. (b) O númel'O total de desarranjos seja menor que 4; menor que 5. ~ Tab. 3.2 Númerode I 2 desarranjós O 1 3 4 5 6 -I 0,1 0,2 0,3 0,2 0,09 0,07 0,04 0,3 0,1 0,1 0,1 0,1 0,15 0,15/ ...........- 64 / PROBABILIDADE PROBABILIDADE CONDICIONADA E INDEPENDÊNCIA / 65 3.30. Uma válvula a vácuo pode provir de três fabricantes, com probabili- dades p, = 0,25, P2 = 0,50 e P3 = 0,25. As probabilidades de que, durante determinado período de tempo, a válvula funcione bem são, respectivamente, 0,1; 0,2 e 0,4 para cada um dos fabricantes. Calcule a probabilidade de que uma válvula escolliida ao acaso funcione bem durante o período de tempo especificado. 3.31. Um sistema elétrico é composto de dois comutadores do tipo A, um do tipo B, e quatro do tipo C, ligados como indica a Fig. 3.12. Calcule a probabi- lidade de que uma pane no circuito não possa ser eliminada com a chave K, se os comutadores A, B e C estiverem abertos (isto é, desligados) com probabilidades 0,3; 0,4 e 0,2, respectivamente, e se eles operarem independentemente. (b) ele leia exatamente um dos jornais; (c) ele leia ao menos A e B, se se souber que ele lê ao.menos um dos jornais publicados. 3.36. Uma moeda equilibrada é jogada 2n vezes. (a) Obtenha a probabi- lidadé de que ocorrerá um igual número de caras e coroas; (b) Mostre que a probabilidade calculada em (a) é uma função decrescente de n. 3.37. Cada uma das n urnas: Urna 1, Urna 2, ..., Urna n, contém O'bolas brancas e {3bolas pretas. Uma bola é retirada da Urna 1 e posta na Urna 2; em se- guida, uma bola é retirada da Urna 2 e posta na Urna 3, e assim por diante. Final- mente, uma bola é retirada da Urna n. Se a primeira bola transferida for branca, qual será a probabilidade de que a última bola escolliida seja branca? Que acon- tece, se n -->oo? [Sugestão: Faça Pn = Prob (a n-ésima bola transferida seja branca) e exprima Pn em termos de Pn - 1'] 3.38. A Urna 1 contém O'bolas brancas e {3bolas pretas, enquanto a Urna 2 contém {3bolas brancas e O'pretas. Uma bola é extraída (de uma das urnas) e é em seguida reposta naquela urna. Se a bola extraída for branca, escolha a próxima bola da Urna 1; se a bola extraída for preta, escollia a próxima bola da Urna 2. Continue a operar dessa maneira. Dado que a primeira bola escolliida venha da Urna 1, calcule Prob (n-ésima bola escolliida seja branca) e também o limite dessa probabilidade, quando n -->00. Fig.3.12 3.39. Uma máquina impressora pode imprimir n letras, digamos 0',,0'2' ... , O'w Ela é acionada por impulsos elétricos, cada letra sendo produzida por um impulso diferente. Suponha que exista uma probabilidade constante P de imprimir a letra correta e também suponha independência. Um dos n impulsos, escolliido ao acaso, foi alimentado na máquina duas vezes e, em ambas, a letra 0', foi im- pressa. Calcule a probabilidade de que o impulso escolhido tenha sido para impri- mirO',. 3.32. A probabilidade de que um sistema fique sobrecarregado é 0,4 duran- te cada etapa de um experimento. Calcule a probabilidade de que o sistema deixe de funcionar em três tentativas independentes do experimento, se as proba- bilidades de fallias em 1,2 ou 3 tentativas forem iguais, respectivamente, a 0,2; 0,5 e 0,8. 3.33. Quatro sinais de rádio são emitidos sucessivamente. Se a recepção de cada um for independente da recepção de outro, e se essas probabilidades forem 0,1; 0,2; 0,3 e 0,4, respectivamente, calcule a probabilidade de '<!ue k .sinais venham a ser recebidos para k = 0,1,2,3,4. 3.34. A seguinte (de algum modo simplória) previsão de tempo é empregada por um amador. O tempo, diariamente, é classificado como "seco" ou "úmido ", e supõe-se que a probabilidade de que qualquer dia dado seja igual ao dia anterior seja uma constante p (O < p < 1). Com base em registros passados, admite-se que I? de janeiro tenha probabilidade {3de ser dia "seco". Fazendo {3n= probabilida- de (de que o n-ésimo dia do ano seja "seco"), pede-se obter uma expressão para t3nem termos de t3e de p. Calcule também limn -+ 00t3ne interprete o seu resulta- do [Sugestão: Exprima t3nem termos de t3n- 1'] 3.35. Três jornais A, B e C são publicados em uma cidade e uma recente pesquisa entre os leitores indica o seguinte: 20 por cento lêem A; 26 por cento lêem B~ 14 por cento lêem C; 8 por cento lêem A e B; 5 por cento lêem A e C; 2 por cento lêem A, B e C; e 40. por cento lêem B e C. Para um adulto escolliido ao acaso, calcule a probabilidade de que: (a) ele não leia qualquer dos jornais; ~ Variáveis Aleatórias Unidimensionais Capítulo 4 4.1. Noção Geral de Variável Aleatória Ao descrever o espaço amostral de um experimento, não especi- ficamos que um resultado individual necessariamente seja um nú- mero. De fato, apresentamos alguns exemplos nos quais os resul- tados do experimento não eram uma quantidade numérica. Por exemplo, ao descrever uma peça manufaturada, podemos empregar apenas as categorias "defeituosa" e "não defeituosa". Também, ao observar a temperatura durante o período de 24 horas, podemos simplesmente registrar a curva traçada pelo term6grafo. Contudo, em muitas situações experimentais, estaremos interessados na mcn- suração de alguma coisa e no seu registro como um número. Mesmo nos casos mencionados acima, poderemos atribuir um número a cada resultado (não numérico) do experimento. Por exemplo, poderemos atribuir o valor um às peças perfeitas e o valor zero às defeituosas. Poderemos registrar a temperatura máxima do dia, ou a temperatura mínima, ou a média das temperaturas máxima e mínima. Os exemplos acima são bastante típicos. de uma "classe muito geral de problemas: em muitas situações experimentais, desejamos atribuir um número real x a todo elemento s do espaço amostral S. Isto é, x = X(s) é o valor de uma função X do espaço amostral no espaço dos números reais. Com isto em mente, formulamos a seguinte definição. J Definição. Sejam S um experimento e S um espaço amostral I associado ao experi~ento. Uma fun~ão X, ~ue associ~ a cada el,e- mento s E S urilnumero real, X(s), e denomlllada vanável aleat6na, Comentários: (a) A terminologia acima é um tanto infcliz, mas é tão uni- vers",lmente aceit"', que nã.o nos ",fastaremos dei"" Tornamos tão claro qu",nto possivel que X é um'" junçlJ.O,e contudo, a denominamos uma variável (aleatória)1 VARIÃVEIS ALEATÓRIAS UNIDIMENSIONAIS I 67 (b) E evidente que nem toda função imaginável pode ser considerada uma variável aleatória. Um requisito (embora não seja o mais geral) é que, para todo número real x, o evento [X(s) = x I e, para todo intervalo I, o evento [X(s) E II têm probabilidades bem definidas, consistentes com os axiomas básicos. Na maioria das aplicações, essa dificuldade não surge e nós não voltaremos a nos referir a ela. (c) Em algum8B situações, o resultado s do espaço amostral já constitui a caracterfstica numérica que desejamos registrar. Simplesmente tomaremos X(s) = s, a função identidade. (d) Na maior parte de llOBSasubseqüente exposição sobre variáveis alea- tórias, não necessitaremos indicar a natureza funcional de X. Geralmente, esta- remos interessados nos valores possíveis de X, mais do que de onde eles se origi- nam. Por exemplo, suponh~ que atiremos duas moedas e consideremos o es- paço associado a este experimento. Isto é, S = (HH, HT, TH, TTI. Definamos a variável aleatória da seguinte maneira: X é o número de caras (H) obtidas nas dU8Bmoedas. Daí, X(HH) = 2, X(IlT) = X(TIl) = 1e X(TT) = O. S = espaço amostral de S Rx = valorespossívei~de X Fig.4.1 (e) ~ muito importante compreender uma exigência fundamental de uma função (unívoca): A cada s E S corresponderá exatamente um valor X(s). Isto está apresentado esquematicarnente na Fig. 4.1. Diferentes valores de s podem levar ao mesmo valor de X, Por exemplo, na ilustração acima, verificamos que X(HT)= X(TH) = 1. O espaço Rx, conjunto de todos os valores possíveis de X, é algumas vezes denominado contradominio. De certo modo, podere- mos considerar Rx como um outro espaço amostral. O espaço amos- tral (original) S corresponde ao resultado (possivelmente não-Dumé- rico) do experimento, enquanto Rx é o espaço amostral associado à variável aleat6ria X, representando a característica numérica que nos poderá interessar. Se for X(s) = 8, teremos S = Rx. Muito embora estejamos prevenido!! do perigo didático inerente a dar muitas explicações para uma mesma coisa, vamos salientar que poderemos pensar em UIIl3-variável aleat6ria X, de duas maneiras: (~) Realizamos o 'experimento 8 que dá. um resultado 8 E Sj a 8eguircalculamos o número X(a). -- - 68 I PROBABILIDADE (b) Realizamos 8, obtemos o resultado s, e (imediatamente) calculamos X(s). Neste caso, o número X(s) é pensado como o pró- prio resultado do experimento e Rx se toma o espaço amostral do experimento. A diferença entre as interpretações (a) e (b) é percebida com dificl,lldade;é relativamente secundária, mas merecedora de atenção. Em (a), o experimento essencialmentetermina com a observação de 8. A avaliação de X(s) é considerada alguma coisa que é feita poste- riormente, e que não é influenciada pela aleatoriedade de 8. Em (b), o experimento não é considerado concluído até que o número X(s) tenha sido realmente calculado, desse modo se originando o es- paço amostral Rx. Muito embora a primeira interpretação, (a), seja aquela geralmente pretendida, a segunda interpretação, (b), pode- rá ser muito útil e o leitor deverá lembrar-se dela. Aquilo que estamos dizendo, e isso ficará cada vez mais claro nas seções posteriores, é que no estudo das variáveis aleatórias estaremos mais interessados nos valores que X toma do que em sua forma funcio- nal. Conseqüentemente, em muitos casos, ignoramos completamente o espaço amostral subjacenteno qual X pode ser definido. Exemplo 4.1. Suponha-se que uma lâmpada tenha sido posta em um soquete. O experiment,oserá considerado terminado quando a lâmpada se queimar. Qual será um possível resultado, s? Uma das maneiras de descrever 8 seria apenas registrar o dia e a hora em que a lâmpada se queimou, por exemplo: 19 de maio, 16 h e 32 mino Em conseqüência, o espaço amostral poderia ser representado por S = I(d, t)\ d = dia, t = momento do diaI. Presumivelmente, a variável aleatória que interessa é X, a duração até queimar. Obser- ve-se que, uma vez que s = (d, t) tenha sido observado, o cálculo de X(s) não inclui qualquer aleatoriedade. Quando 8 é especificado, X(s) fica completamente determinado. As duas interpretações explicadas acima podem ser aplicadas a este exemplo, como se segue. Em (a), consideramos o experimento terminado com a observação s = (d, t), o dia e a hora. O cálculo de X(s) é realizado depois, abrangendo uma operação aritmética simples. Em (b), con~ideramos que o experimento somente estará terminado depois que X(s) tenha sido calculado e um número, por exemplo, X(s) = 107 horas seja então considerado o resultado do experimento. Pode-se salientar que análise semelhante se aplicaria à qual- quer outra variável que interessasse, por exemplo, Y(s), a tempe- ratura da sala no momento em que a lâmpada se tenha queimado. VARIÁVEIS ALEATÓRIAS UNIDIMENSIONAIS I 69 Exemplo 4.2. Três moedas são atiradas sobre a mesa. Tão logo as moedas repousem, a fase "aleatória" do experimento termi- nou. Um resultado simples s poderia consistir na descrição deta- lhada de como e onde as moedas pousaram. Presumivelmente, estaremos somente interessados em certas características numéricas associadas a este experimento. Por exemplo, poderíaltlos avaliar: X(s) = número de caras que apareceram, Y(s) = distâ.ncia máxima entre duas moedas quaisquer, Z(s) = distância minima das moedas a um bordo qualquer da mesa. Se for a variável X que interesse, poderemos, como se explicou no exemplo anterior, incluir a avaliação de X(s) na descrição de nosso experimento e, depois, simplesmente afirmar que o espaço amostral associado ao experimento é {O, 1, 2, 3}, correspondendo aos valores de X. Conquanto muito freqüentemente venhamos a adotar esta interpretação, é importante compreender que a contagem do número de caras é feita depois que os aspectos aleat6rios do experimento te- nham terminado. Comentário: Referindo-nos a variáveis aleatórias, empregamos quase sem exceção letras maiúsculas, como X, Y, Z etc. Contudo, quando falamos do valor que essas variáveis aleatórias tomam, usaremos, em geral, letras minúsculas, como x, y, z etc. Esta é uma distinção muito importante a ser feita e o estudante pode bem parar para considerá-Ia. Por exemplo, quando nós falamos em escolher uma pessoa ao acaso, de alguma população designada, e medimos sua altura (em centí- metros, por exemplo), poderemos nos referir aos resultados possiveis como uma variável aleatória X. Poderemos então formular várias questões sobre X, como indagar se P (X ;;. 60). No entanto, uma vez que tenhamos escolhido uma pessoa e medido sua altura, obteremos um valor específico de X, digamos x. Por isso, não teria sentido indagar se P (x ;;. 60), uma vez que x é ou não é ;;. 60. Esta distinção entre uma variável aleatória e seu valor é importante e nós voltaremos a fazer referência a ela. Quando estivermos interessados nos eventos associados a um espaço amostral S, verificaremos a necessidade de examinar os eventos relativamente à variável aleat6ria X, isto é, subespaços do contra- dOminioRx. Bastante freqüentemente, certos eventos associados a S são "relacionados" (em um sentido a ser explicado) a eventos associadoscom Rx, na seguinte forma: Definição. Sejam um experimento 8 e seu espaço amostral S. Seja X uma variável aleat6ria definida em S e seja Rx seu contrado- IXúnio. Seja B um evento definido em relação a Rx, isto é, B C Rx. r- 70 I PROBABILIDADE Então, A será. defInido assim: A = {s E SIX(s) E B}. (4.1) Explicando: A será. constituído por todos os resultados em S, para 08 quais X(s) E B (veja Fig. 4.2). Neste caso, diremos que A e B são eventosequivalente8. RX Fig.4.2 Comenú1nos: (a) Dizendo a mesma coisa, com menos rigor: .A.e B serão equi- valentes sempre que ocorram juntos. Isto é, quando A ocorre, B ocorre, e inver- samente. Porque se A tiver ocorrido, então um resultado s terá ocorrido, para o qual X(s) E B e, portanto, B ocorreu. Reciprocamente, se B ocorreu, um valor X(s) terá sido observado, para o qual s E A e, portanto, .A.ocorreu. (b) ~ importante compreender que, 'em nessa defrnição 'de '~l!I1tos equiva- lentes, A e B são associados a espaços amostrais diferentes. Exemplo 4.3. Considere-se a jogada de duas moedas. Dai, S = ,{HH, HT, TH, TT}. Seja X'O número de caras obtido.. Por- tanto, Rx = 1o, I, 2}. Seja B = {I}. Já que X(I/T) = X('!'1/) = I se, e somentesc, X(s) = 1, temos quc A = {HT, TH} é'cquivalenteaB. Agora, daremos a seguinte importante definição. Definição. Seja B um evento no 'c<YIJ.tra:dOTIÚmo Rx. caso, definimos P(B) da seguinte maneira Nesse P(B) = P(A), onde A = Is E SIX(s) E R}: . (4.2) Explicando: Definimos P(B) ig\'lal à pro'babilida:de do evento A C S, 'o qual é equivalente a B, no sentido da Eq. (4.1). Comentários: (a) Estamos ,admitindo que probabilidades possam ser asso- ciadas a eventos em S. portanto, a definição acrma torna possível atriburrpro- babilidades a eventos associados a Ilx em tcrmos'de probabilidades definidas sobreS. (b) ~ realmente possível demonstrar que P(B) deve ser definida tal como o fizemos. Contudo, isto envolveria algumas dificuldades teóricas que desejamos evitar e, por isso, procedemos como acima. (c) Desde que na formulação 'da Eq. (4,2) os eventos A e B se referem a espaços amostrais diferentes, deveríamos realmente empregar notação diferente quando nos referíS8ernos a probabilidades definidas sobre S e àquelas 'definidas sobre Ilx, digamos algtlma coisa tal corno P(A) e Px(B). No entanto, 'Ilão fare- -- VARIÁVEIS ALEATÓRIAS UNIDIMENSIONAIS I 71 mos isso, mas continuaremos simplesmente a escrever P(Ã) e P(B). 'O contexto em que tais expressões apar{,çam tornará clara a interpretação. (d) As probabilidades associadas a eventos no espaço amostral (original) S são, de 'certo modo, determinadas por "forças fora de nosso controle", ou como às vezes se diz "pela Natureza". A composição de uma fonte radioativa 'que emita partículas, a dí..~posiçãode um grande número de 1'CS8088'que façam éhamadas telefônicas durante certa hora, e a agitação térmica que dê 'origem a 'um fluxo ou as condições atmosféricas que dêem origem a uma tempestade, ilustram esse as- pecto. Quando introduzimos uma variável aleatória X e seu 'contradomínio Rx estamos induzindo probabilidades nos eventos associados aRx, as quais serão es- tritamente determinadas se as probabiliclades associadas a 'eventos em S forem especificadas. Exemplo 4.4. Se as moedas consideradas '110 Ex. 4.3 forem "equilibradas", tercmos P(HT) = P(TH) = 1/4. Po.rtanto,P'(HT, TH) = 1/4 + 1/4 = 1/2. (Os cálculos acima são uma 'Consequência direta de nossa suposição fundamental referente â propriedade de equilíbrio ou simetria das moedas.) Visto que'o evento {X = I}' é equivalcnte ao evento {HT, TH}, empregando a Eq. (4.1), teremos que P(X = 1) == P(HT, TH) = 1/2. [Na realidade não'eriste escolha para o valor de P(X = 1) coerente com a Eq. .(4.2), uma vez que P(HT, -TH) tenha sido determinada. 11:neste sentido que probabi- lidades associadas a eventos de Rx são induzidas.J Comentário: Agora qúe jii estabelecemos a existência de uma função de pro- babilidade induzida sobre o contradomínio de X - Eqs. (4.1 e 4.2)- achamos conveniente 8'Uprimir a natureza funcional de X. Por isso, escr~erem08(como fizemos no 'exemplo acima) P(X = 1) = 1/2. O que se quer dizer é que, um certo evento no espaço amostral S, a saber {HT., THI = {s IX(s) = 11 'ocorre com pro- babilidade 112. Daí atribuirmos -essa mesma probabilidade ao '~ento {X = 11 no contradomínio, Continuaremos a escrever expressões semelhantes a P(X = 1), P(X ~ 5) etc. ~ muito 'impurlántepara o leitor compreender o que essas expressões re&lm:enterepresentam. Uma vez que as probabilidades associadas aos válios resultados (ou eventos) no contradombrio Rx tenham sido determinadas (mais precisamente, induzi das), ignoraremos freqüentemente o espaço amostral original S, que deu origem a essas probabilidades. Assim, 'no exemplo anterior, simplesmente estaremos interessados em Rx = {O, I, 2} e as probabilidades associadas (1/4, 1/2, 1/4). O fato, de que essas probabilidades sejam determinadas por urna função de probabilidade definida sobre o espaço amostral original S, não nos interessa, quando estamos apenas interessados em estudar 08 valores da variável aleatória X. Ao apresentar, em minúc1as, muitos dos importantes cOI1'~eitos 'referentes a variáveis aleatórias, julgamos conveniente distinguir ;-- 72 I PROBABILIDADE dois casos importantes: as variáveis aleatórias discretas e as variá- veis aleatórias contínuas. 4.2. Variáveis Aleat6riasDiscretas Definição. Seja X uma variável aleatória. Se o número de va- lores possíveis de X (isto é, Rx,o contradominio) for finito ou infi- nito numerável, denominaremos X de variávelaleat6riadiscreta. Isto é, os valores possíveis de X, podem ser postos em lista como X" X2,.. ., x". No caso finito, a lista acaba, e no caso infinito numerá- 'lei, a lista continua indefinida.mente. Exemplo 4.5. Uma fonte radioativa está emitindo partículas a. A emissão dessas partículas é observada em um dispositivo contador, durante um período de tempo especificado. A variável aleatória seguinte é a que interessa: X = número de partículas observadas. I1 I I II I I Quais são os valores possíveis de X? Admitiremos que esses valores são todos os inteiros não negativos, isto é, R:r = /0, 1,2...,11,.. .1. Uma objeção com que já nos defrontamos uma vez pode, novamente, ser levantada neste ponto. Pode-se argumentar que durante um es- pecificado intervalo (finito) de tempo, é impossível observar mais do que, digamos N partículas, onde N pode ser um inteiro positivo muito grande. Conseqüentemente, os valores possíveis para X real- mente seriam: O, 1, 2,..., N. Contudo, toma-se matematicamente mais simples considerar a descrição idealizada feita ,acima. De fa- to, sempre que admitirmos que os valores possíveis de uma variá- vel aleatória X sejam infinito numerável, estaremos realmente consi- derando um:!.:representação idealizada de X. À vista de nossas explicações anteriores da descrição probabi- listica de eventos éom um número finito ou infiuito numerável de elementos, a descri~ão p~abilistica de uma variável aleatória dis- creta não apresen~a.rá quàlquer dificuldade. Procederemos da se- guinte maneira: Definição. Seja X uma.-.v:ariávelaleatória discreta. Portando, R... o contradomínio de X, será formado no máximo por um número in- finito numerável de valores Xl, X2,... A cãda possível resultado x, associaremos um número p(Xi)= P(X = Xi), denominado probabi- lidade de Xi. Os números p(Xi), i = 1,2,. .. devem satisfazer às - VARIÁVEIS ALEATÓRIAS UNIDIMENSIONAIS I 73 seguintes condições: (a) P(Xi)~ Opara todo i, (b) t P(Xi) = 1. .-1 (4.3) A função p, definida acima, é denominada fun~ão de probabilidade (ou função de probabilidade no ponto) da variável aleatória X. A coleção de pares [.ri, p(Xi)], i = 1,2,..., é.algumas vezes denominada distribuição de probabilidade de X. COl/umtários:(a) A escolhaparticular dos números p(Xi)é presumlvelmente determinadaa partir,da função de probabilidadeassociadaaos eventos no espaço @-() Fig.4.3 amostrai S, no qual X seja definida. Isto é, p(.1;) = p(aIX(s) = ri]. [Veja as Eqs. (4.1 e 4.2).] Contudo, já que estamos interessados apenM nos valores de X, isto é, Rx, e as probabilidades 1ISS0ciadasa estes valores, est&remOllnovamente suprimindo a natureza funcional de X. (Veja a Fig. 4.3.) Muito embora, na maio- ria dos casos, os números sejam de fato determinados a partir da distribuição de probabilidades em algum espaço amostral subjacente S, qualquer conjunto de números p(.1;),que satisfaçam às Eqs. (4.3), pode servir como descrição probabi- IIstil'a apropriada de uma variável aleatória discreta. (b) Se X tomar apenas um número finito de valores, digamos XII.. "XN' então p(.1;)= O para i > N, e, portanto, a série infinita na Eq. (4.3) se transforma em uma soma finita. (c) Podemos salienta:', novamente, uma analogia com a Mecânica, ao con- siderarmos a massa total de uma unidade distribuída sobre a reta real, com a massa total concentrada nos pontos XII :1:2,'" Os númerosp(Xi)representam a quan- tidade de massa localizada no ponto Xi. . (d) A interpretação geométrica (Fig. 4.4) de uma distribuição de probabi- lidade é freqüentemente útil. p(x) Rx x Fig.4.4 Flg.4.5 ..r-- - 74 I PROBABILIDADE Seja B um evento associadoà variável aleat6ria Xi isto é, B C Rx (Fig. 4.5). Suponha-se, especificamente, que B = 1 Xi1'Xi".. .). Dai, P(B) = f[sIX(s) E BJ (porque esses eventos são equivalentes) P[sIX(s) = Xii,j = 1,2,...J = 'tp(rii)' ,=1 Explicando: A probabilidade de um evento B é igual à soma das probabilidades dos resultados individuais associados com B. (4.4) Comentdrios: (a) Suponhamos que a variável aleatória discreta X possa tomar somente um número finito de valores, x, , . . . , xN' Se os resultados forem igualmente prováveis,então teremos obviamente p(x,) =,.. =P(xN)= I/N. (b) Se X tomar um número infinito numerável de valores, então é impossível ter todos os valores igualmente prováveis; porque não poderemos satisfazer à condição ,~oo p(x ,.) = 1, setivermosp(x ,') = c para todo i. ,= 1 (c) Em todo intervalo finito, existirá no máximo um número finito de valores possíveis de X. Se algum desses intervalos não contiverqualquer desses valores possíveis, nós atribuiremos a ele probabilidade zero. Assim, se Rx = = [x" x2,. .. ,xn] e se nenhum xi E [a, b], então P [a';; X.;; b] = O. Exemillo 4.6. Suponhamos que uma válvula eletrônica seja posta em um soquete e ensaiada. Admitamos que a probabilidade de que o teste seja positivo seja 3/4; dai, a probabilidade de que se- ja negativo é igual a 1/4. Admitamos também que estejamos ensai:' ando uma partida grande 'dessas válvulas. Os ensaios continuam até que a primeira válvula positiva apareça. Definamos a variá- vel aleatória, assim: X é o n.úmero de testes necessários para con- cluir o experimento. O espaço amostral associado a este experi- mento é: s=: 1+,- +,- - +,- - - +,.,.1. Para determinarmos a distribuição de proba.bilidade de X, racioci- naremos da seguinte forma: os valores possíveis de X são 1, 2,. . .n, .-.. (estamos, obviamente, tratando com um espa.çoamostral idealizado). E será X = n se, e somente se, as prhneiras (n - 1) válvulas forem nega.tivas e a. n.-ésima válvula for positiva. Se aceitarmos que a condição de uma válvula não influencie a condição de outra, pode- remos escrever p(n) = P(X = n) =(~r-I ( : ), n = 1,2, "', VARIÁVEIS ALEATÓRIAS UNIDIMENSIONAIS I 75 Para verificarmos que esses valores de p(n) satisfazem à. Eq. (4.3) observaremos que L p(n) n-I 3 ( 1 1 ) - 1+-+-+... 4 4 16 3 1 1 - 4 1 - , 1-- 4 Comentário: Estamos empregando aqui o resultado de que a 8rrie 9!'omilrica 1 + r + r + .., converge para Il(1 - r) sempre que Ir I < 1. Este é um re- sultado que será mencionado muilas vezes. Suponha-se que desejemos calcular P(A), ondeA é defini~ocomo:10 experimentotcrmina depoisde 11mnúmeroPIU: de repetições,l Empregando n Eq, (4.4), teremos: .. 3 3 P(A) = L p(2n) = 16 + 256+ ... "=1 3 I 3 I 1 =-(1+ -+,.,)=--=- 16 ]6 16 1 5 1 - 16 4.3. A Distribuição Binomial Nos próximos capítulos, estudaremos pormenorizadamente algu- mas variáveis discretas importantes. Agora estudaremos apenas uma delas e, em seguida, a empregaremos para ilustrar alguns conceitos importantes. Exemplo 4.7. Suponha que peças saiam de uma linha de produ- ção e sejamclassificadascomo defeituosas (D) ou como não-defeituosas (N), isto é, perfeitas. Admita que três dessaspeças, da produção de um dia, sejam escolhidas ao acaso e classificadas de acordo com esse es- qUema.O espaço amostral para esse experimento, S, pode ser assim, apreSentado: S = {DDD,DDN, DND, NDD, NND,NDN, DNN, NNNJ, (Outra maneira de descrever S é como S =SI X S2 X S3, o produ- ~ocartesianode SI, S2 e S3, onde cadaSi = [D,NJ.) , uponhamos que seja 0,2 a probabilidade de uma peça ser defeItuosa e 0,8 a de ser não-defeituosa. Admitamos que essas probabiJidades ~ 76 I PROBABILIDADE sejam as mesmas para cada peça, ao menos enquanto durar o nosso estudo. Finalmente, admita-se que a classificação de qualquer peça em particular, seja independente da classificação de qualquer outra peça. Empregando essas suposições, segue-se que as probabilidades associadasaos vários resultados do espaço amostral S, como se explicou acima, são: (0,2)3, (0,8)(0,2)2, (0,8)(0,2)2, (0,8)(0,2)2, (0,2)(0,8)2, (0,2)(0,8)2, (0,2)(0,8)2, (0,8)3. Geralmente, nosso interesse não está dirigido para os resultados indivi- duais de S. Ao contrário, desejamos tão-somente conhecer qUllntas peças defeituosas seriam encontradas (não interessando a ordem em que tenham ocorrido). Isto é, desejamos estudar a variávelaleatória X, a qual atribui a cada resultado s e S o número de peças defeituosas encontradas em s. Conseqüentemente, o conjunto dos valores possí- veisde X é (O,1,2, 3}. Poderemos obter a distribuição de probabilidade de X, P(xi) = = P(X = xi)' da seguinte maneira: X = Ose, e somente se, ocorrer NNN; X = 1 se, e somente se, ocorrer DNN, NDN, ou NND; X = 2 se, e somente se, ocorrer DDN, DND, ou NDD; X = 3 se, e somente se, ocorrer DDD. (Note-se que (NNNI é equivalente a [X = 01 etc.) Então, p(O)= P(X = O)= (0,8)3 p(1) = P(X = 1)= 3(0,2)(0,8)2, p(2) =P(X= 2) = 3(0,2)2(0,8), p(3) =P(X= 3) = (0,2)3. Observe que a soma dessas probabilidades é igual ai, porque a soma pode ser escrita como igual a (0,8 + 0,2)3. Comentdrio: A explicação dada ilustra como as probabilidades em um con- tradomínio Rx (neste caso [O, 1, 2, 3/) são induzidos pelas probabilidades defini- das sobre o espaço amostral S. Porque a hipótese de que os oito resultados de S = (DDD,DDN,DND,NDD,NND,NDN. DNN,NNNI tenham as probabilidades dadas no Ex. 4.7, determinou o valor de p (x) para todo x € Rx' VARIÃVEIS ALEATÓRIAS UNIDIMENSIONAIS I 77 Vamos agora generalizar as noções introduzidas no ex. anterior. Definição: Consideremos um experimento S e seja A algum evento associado a S. Admita-se que P(A) = p e conseqüentemente P(Ã) = 1 - p. Considerem-se n repetições de S. Daí, o espaço amostral será formado po.:.todas as seqüênciaspossíveis {aloa2,.. ., a" G onde cada (lié ou A ou A, dependendo de que tenha ocorrido A ou A na i-ésima repetição de 8. (Existem 2" dessas seqüências.) Além disso, suponha-se que P(A) = p permaneça a mesma para todas as repetições. A variável aleatória X será assim definida: X = número de vezes que o e-ventoA tenha ocorrido. Denominaremos X de va- riável aleatória binomial, com parâmetros n e p. Seus valores possí- veis são evidentemente O, 1, 2,. . ., n. (De maneira equivalente, dire- mos que X tem uma distribuição binomial.) As repetições individuais de E serão denominadas Provas de Bernouilli. Teorema4.1. Seja X uma variável binomial, baseada em n repetições. Então, P(X = k) = (~ ) pk(l - p)n-k, k = O, 1, . . ., n. (4.5) Demonstração: Considere-se um particular elemento do espaço amostral de S satisfazendo à condição X = k. Um resultadocomo esse poderia surgir, por exemplo, se nas primeiras k repetições de & ocorresse A, enquanto nas últimas n - k repetições ocorresse A, isto é, AAA... AAAA... A. I I I I k n -- k Como todas as repetições são independentes, a probabilidade desta seqüênciaparticular seria pk(l - p),,-I<,mas exatamente essa mesma probabilidade seria associada a qualquer outro resultado para o qual X = k. O número total de tais resultados é igual a (k), por- que deveremos escolher exatamente k posições (dentre n) para o eVentoA. Ora, isso dá o resultado acima, porque esses (k) resul- tados são todos mutuamente excludentes. ~ 78 I PROBABILIDADE Comentários: (a) Para verificar noeso resultado, observemos que empre- gando o teorema binomial temos Lk~O P(X = k) = Lk-O (k) pk(l - p),,-k = [p + (1 - p)]" = I" = 1, como era de se esperar. Como as probabilidades G) pk(l - p),,-k são obtidas pelo desenvolvimento da expressão binomial [p + (1 - p)]n, eIà. recebe a denomi- nação de distribuição binomial. (b) Sempre que realizarmos repetições independentes de um experimento e estivermos interessados somente em uma dicotomia - defeituoso ou não-def,eic tuoso (perfeito); dureza acima ou abaixo de certo padrãoj nível de ruído em um sistema de comunicações acima ou abaixo de um limiar preestabelecido - esta- remos virtualmente tratando com um espaço amostral no qual podemos definir uma variável aleatória binomial. Enquanto as condições da experimentação permaneçam suficientemente estáveis, de modo que a probabilidade de algum atributo, digamosA, permaneçaconstante, poderemosempregaro modeloacima. (c) Se n for pequeno, os termos individuais da distribuiçãobinomialserão relativamente fáceisde calcular. Contudo, se n for relativamente grande, os cálculosse tornam bastante incômodos. Felizmente,foram preparadas tábuas de probabilidadesbinomiaisj existem várias dessas tábuas. (Veja o Apêndice.) Exemplo 4.8. Suponha-se que uma válvula eletrônica, instalada em determinado circuito, tenha probabilidade 0,2 de funcionar mais do que 500 horas. Se ensaiarmos 20 válvulas, qual será a probabili- dade de que delas, exatamente k, funcionem mais que 500 horas, k = O, 1, 2, ..., 20? PI.--) .. .x 12 13 14 15 16 17 18 Fig.4.6 Se X for o número de válvulas que funcionem mais de 500 ho- ras, admitiremos que X tenha uma distribuição binomial. Então, P(X = k) = e~)(0,2t(0,8ro-k. Os valores podem ser lidos na Tab. 4.1. Se marcarmos os valores dessa distribuição, obteremos o gráfico apresentado na Fig. 4.6. A configuração que observamos aqui é })astante geral. As probabilidades binomiais crescem monotonica- mente, até que atingem um valor máximo e, depois, decrescem mo- notonicamente. (Veja o Probl. 4.8.) ............- -- VARIÁVEIS ALEATÓRIAS UNIDIMENSIONAIS I 79 Tab. 4.1 P(X = O)= 0,012 P(X = 1) = 0,058 P(X = 2) = 0,137 P(X = 3) = 0,205 (As probabilidades P(X = 4) = 0,218 P(X = 5) = 0,175 P(X = 6) = 0,109 P(X = 7) = 0,055 restantes são menores P(X = 8) = 0,022 P(X = 9) = 0,007 P(X = 10) = 0,002 P(X = k) = 0+para k ~ 11 do que 0,001.) Exemplo 4.9. Ao operar determinada máquina, existe alguma probabilidade de que o operador da máquina cometa um erro. Po- de-se admitir, razoavelmente, que o operador aprenda, no sentido de que decresça a probabilidade de cometer um erro, se ele usar repeti- damente a máquina. Suponha que o operador faça n tentativas e que as n repetições sejam estatisticamente independentes. Suponhamos, especi- ficamente, que P (um erro ser cometido na i-ésima repetição) = l/(i + 1), i = 1, 2, ..., n. Admitamos que se pretendam 4 tentativas (isto é, n = 4) e defmamos a variável aleatória X como o número de operações da máquina, executadas sem erro. Note-se que X não tem distribuição binomial, porque a probabilidade de "sucesso" não é constante. Para calcular a probabilidade de que X = 3, por exemplo, pro- cede-se do seguinte modo: X = 3 se, e somente se, houver exatamente uma tentativa mal sucedida. Isto pode ocorrer na primeira, segunda, terceira ou quarta tentativas. Portanto, 1234 1134 1214 ~X=~= + + + 2345 2345 2345 1231 5 + =-. 2 3 4 5 12 Exemplo 4.10. Considere-se uma situação semelhante àquela apresentada no Ex. 4.9. Agora, admitiremos que exista uma pro- babilidade constante Pl de não cometer um erro na máquina, durante cada uma das n) tentativas, e uma probabilidade constante P2 ::s;p) de não cometer um erro em cada uma das n2 repetições subseqüentes. Seja X o número de operações bem sucedidas da máquina durante as n == n) + n2 tentativas independentes. Vamos procurar a expressão geral de P(X = k). Pelo mesmo motivo dado no exemplo precedente, X não tem distribuição binomiaI. Para obter P(X ==k), procede-se qa seguinte maneira: Sejam Yl o número de operações corretas durante as primeiras 711tentativas, e Y2 o número de operações corretas durante as n2 ~ntativas subseqüentes. Portanto, Y) e Y2 são variá.veis aleatórias Independentes e X = Y1 + Y2. Assim, X = k se, e somente se. 80 I PROBABILIDADE YI = r e Y2 = k - r, para qualquer inteiro r que satisfaça às condi~ ções O :::;r :::;nl e O :::;k - r :::;n2. As restrições acima, sobre r, são equivalentes aO:::; r:::; nl e k - n2 :::; r :::; k. Combinando-as, poderemos escrever máx. (O,k - - n2) :::;r :::;mín. (k, nl)' Portanto, teremos P(X = k) = r=m!n.(k,nl) ( ) ( n ) = L n: p~(l- PI)nl-r k ~ r pzk-r (1-P2)n2-(k-r). r=máx.(0,k-n2) Com nossa convenção usual de que m = O sempre que b > a ou b < O, poderemos escrever a probabilidade acima como nl ( ) ( ) nl r n2 k-r P(X = k) = r~ r Pl (1 - Pl)nl-rk - r p2 (1 - P2)"2-k+r (4.6) Por exemplo, se Pl = 0,2, P2= 0,1, nl = n2 = 10 e k = 2, a proba- bilidade acima fica, depois de um cálculo direto: P(X = 2) = to (1~) (0,2)'(0,8)10-r(2 1~ r) (0,1)2-'(0,9)8+<" = 0,27. Comentário: Suponha.-se que VI = V2. Neste caso, a Eq. (4.6) se reduz a (~) P~ (1 - Pl)n-k, porque agora a variável aleatória X tem. uma distribuição bino:nial. Para verificar que é assim, note-se que poderemos escrever, (desde que nl + ~ = n): P(X = k) = p~(1 - V.)ft-k~O( ~l) ( k ~ r ) Para verificar que a somá acima é igual a (~), basta. comparar os coeficientes das potências de xk em ambos os membros da identidade (1 + x)nl (1 + X)"2== = (1 + X)"l+nZ. .4.4. Variáveis Aleatórias Contínuas Suponha-se que o contradomínio de X seja formado por um número finito muito grande de valores, digamos todos os valores ;r; no intervalo O:::; x :::; 1, da forma: O; 0,01; 0,02; ...; 0,98; 0,99; 1,00. A cada um desses v~lores está associado um número não-ne- gativo p(Xi) = P(X ':" Xi), i = 1, 2, . . ., cuja soma é igual a 1. Esta. operação está representada geometricamente na Fig. 4.7. ~ VARIÁVEIS ALEATÓRIAS UNIDIMENSIONAIS I 81 Já salientamos anteriormente que poderia ser mateÍnaticamente ais fácil idealiz~r a apresentação probabilística de X, pela m . suposição d e que X pudesse tomar todos os valores possíveis, ° :::;x :::;1. Se fizenÍlos isso, que acontecerá às probabilidades no ponto p(Xi)? Co- mo os. valores possíveis de X não são numeráveis, não podemos real- mente falar do i-ésimo valor de X, e, por isso, p(Xi) se toma sem sentido. O que faremos é substituir a função P definida somente para Xl, X2,. .. por uma função f definida (neste contexto) para todos os valores de x, O :::;X :::; 1. As proprie- dades da Eq. (4.3) serão substituídas por f(x) ~ O e foi f(x)dx = 1. Vamos proceder formalmente como se segue. I'(;c) ~, 1 Fig.4.7 Definição: Diz-se que X é uma variável aleatória contínua, se existir uma função f, denominada função densidade de probabilidade (fdp) de X que satisfaça às seguintes condições: (a) f(x);;' Opara todo x, (b) f~ :f(x)dx= 1, (4.7) (c) para quaisquer a, b, com - 00 < a < b < + 00, teremos P(a~X~b)=fg f(x)dx. (4.8) Comentários: (a) Estaremos essencialmente dizendo que X é uma variável aleatória contínua, se X puder tomar todos os valores em algum intervalo (c, d), onde c e d podem ser - 00e + 00,respectivamente. A existência estipulada de uma fdp constitui um artifício matemático, que possui considerável apelo intuitivo e toma nossos cálculos mais simples. Em relação a isso, também devemos salientar que, quando supomos que X seja uma variável aleatória contínua, estamos tratan- do com uma descrição idealizada de X. (b) P(c < X < d) representa a área sob a curva no gráfico da Fig. 4.8, da fdp f. entre x = c e x = do f(x) ~ .. . ' '..) r~ x-c x-d Fig.4.8 ~ 82 I PROBABI LIDADE (c) Constitui uma conseqüência da descriçio probabillstica de X, acUna que, para qualquer valor especificado de X, digamos %o,teremos P(X = :to) = O' porque P(X = :to) = .1;:° J(z) dz = O. Este resultado pode parecer muito con~ tntrio t\ nossa intuição. Contudo, devemoS compreender que se permitirmos que X tome todos os valores em algum intervalo, entAo a probabilidade zero nlo é equivalente t\ impossibilidade. Por isso, no caso contínuo, P(A) = O nlo implica ser A = li, o conjunto vazio. (Veja-o Teor. 1.1.) Explicando iss, menos rigo- rosamente, considere-se a escolha de um ponto ao acaso, no segmento de reta IzlO .:S z.:s 21. Muito embora possamos estar desejosos em concordar (Para objetivos matemáticos) que cada ponto imaginável no segmento possa ser resultado de nosso experimento, ficaríamos completamente surpreendidos quanto a isso, 88 de fato escolhéSSemosprecisamente o ponto médio do segmento ou qualquer outro ponto especiJicado. Quando expressamos isto em linguagem matemática rigorosa, dizemos que o evento tem "probabilidade ,!ero". Tendo em vista essas observações, as seguintes probabilidades serl.o todas iguais, se X for uma variável aleatória contínua: P(c~ X ~ d), P(c~X < d), P(c< X ~d), e P(c < X < d). (d) Apesar de nlo verificarmos aqui os detalhes, pode-se mostrar que essa atribuição de probabilidades a eventos em Rx satisfaz aos axiomas básioos da probabilidade [Eq. (1.3)1, onde poderemos tomar Izl - '" < z < + '"I como nosso espaço amOlltral. (e) Se uma função J* satisfizer às condi9lles J* (z) ~ O para todo z, e f-+,,;" J* (z) dz = K, onde K é um número real positivo (nlo necessariiunente igual a 1), entAo J* nlo satisfaz a todas as condições para ser uma fdp. No entanto, poderemos facilmente definir uma nova função, digamos J, em termos deJ*, assim: J(z) = J*(z) K para todo z. Em conseqüência, J satisfá a todas as condições de uma fdp. (f) Se X tomar valores somente em algum intervalo finito [a, b1 poderemos simplesmente pôr J(z) = O para todo z EE[a, bl. Em conseqüência, a fdp fican defmida para todo8os valores reais de z, e poderemos exigir quef-+"'- J(z) dz=l. Sempre que a fdp for especificada somente para determinados valores de z, deve- remos supor que seja zero em todos os demais. (g) J(z) não representa a probabilidade de coisa algumal Anteriormente j' salientamos que, por exemplo, P(X = 2) = O e, conseqüentemente, J(2) cer- tamente nlo representa essa probabilidade. Somente quando a função for in- tegrada entre dois limites, ela produzirá. uma probabilidade. Poderemos, con- tudo, dar uma interpretação deJ(x)âz, da seguinte maneira: Do teorema do valor médio, em Cálculo, tem-se que l x+.:lX P(x ~ X ~ z + .:lx)= x j(s) ds = Mjm, z ~ ~~ z + .:lx. -- VARIÁVEIS ALEATÓRIAS UNIDIMENSIONAIS I 83 l>x for pequeno, j(x).:lx será aproximadamente igual a P(x:S X.:S x + .:lx)-, ~;ej for contínua à direita, esta aproximação se tornará mais exata quando l>x--->O.) (h) Devemos novamente salientar que a distribuição de probabilidade (neste caso a fdp) é induzida em Rx pela probabilidade subjacente associada com eventos eJDS. Por isso, quando escrevemos P(c < X < d), queremos significar como sem- re P[c < X(s) < dI, que por sua vez é igual a P[sl c < X(s) < d], já que esses Pventos são equivalentes. A definição anterior, Eq. (4.8), estipula essencialmente :existência de UJDa fdp J definida sobre Rx tal que P[Bic< X(s) < dI = jd J(x) dx. Novamente suprimiremos a natureza funcional de X e, por isso, trataremos so- mente com Rx e a fdp j. (i) No caso contínuo, também poderemos considerar a seguinte analogia com a Mecdnica: Suponha-se que temos uma massa total de uma unidade conti- nuamente distribuída sobre o intervalo a ~ x ~ b. Nesse caso, J(x) representa a densidade de massa no ponto x e J;d}(x) dx representa a massa total contida no intervalo c ~ z ~ d. Exemplo 4.11. A existência de uma fdp foi admitida na exposição de uma variável aleatória contínua. Vamos considerar um exemplo simples,no qual poderemos facilmente determinar a fdp, fazendo uma suposiçãoapropriada sobre o comportamento probabilístico da variável aleatória.Suponhamos que um ponto seja escolhido no intervalo (0,1). Representemospor X a variávelaleatória cujo valor sejaa abscissax do ponto escolhido. Supor: Se l for qualquer intervalo em (0,1), então Prob [X E l] será diretamente proporcional ao cumprimento de l, digamos L (1). Istoé~Prob [X E l] ::::kL(1), onde k é a constante de proporcionalida- de. (E fácil verificar, tomando-se l ::::(0,1) e observando-se que L [(0,1)]::::1e Prob [X E (0,1)]:::: 1,que k ::::1.) Obviamente,X torna todos os valores em (0,1). Qual é sua fdp? Assim,podemosencontrar uma função f tal que P(a< X < b)::::J ~ f(x)dx? Note que, se a < b < Oou 1< a < b, P(a < X < b) ::::Oe, por is- SO,f(x):::: O.Se O< a < b < I,P(a<X<b):::: b - a e, conseqüente- rnente,f(x):::: 1.Portanto, encontramos f(x):::: { 1,O<x< 1 O,para quaisquer outros valores. ~ - ...........- 84 I PROBABILIDADE VARIÁVEIS ALEATÓRIAS UNIDIMENSIONAIS I 85 Evidentemente, f(x) ~ Oe f-+~~ f(x)dx = fr/2x dx = 1. Para calcu- lar P(X:( 1/2), deve-seapenas calcular a integral fol/2 (2x) dx = 1/4. Sabemos, de nossO emprego de modelos determinísticos, que certas funções gozam de papel mais importante que outras. Por exemplo, as funções linear, quadrática, exponencial e tri'gonométrica têm apel vital na .explicação de modelos determinísticos. Ao desenvol- ~er modelQs não-determinísticos (isto é, probabilísticos) verificare- moS que certas""variáveis aleatórias são de notável importância. Exemplo 4.12. Suponhamos que a variável aleatória X seja contínua. (Veja a Fig. 4.9.) Seja a fdp f dada por f(x) = 2x, O< x < 1, = O, para quaisquer outros valores. fl..x) \ ,~-, .. 4.5. Função de Distribuição Acumulada fl..x) x= 1500 x = 2500 Vamosintroduzir outro importante conceito geral, neste capítulo. Definição. Seja X uma variável aleatória, discreta ou contínua. Define-se a função F como&. Junção de distribuição acumulada da variável aleatória X (abreviadamente indicada fd) como F(x) = = P(X :::;x). Teorema4.2. (a) Se X for uma variável aleatória discreta x Fig.4.9 Fig. 4.10 F(x) = :E p(Xj), j (4.9) o conceito de probabilidade condicionada, explicado no Capo3, pode ser significativamente aplicado a variáveis aleatórias. Assim, no exemplo acima. podemos calcular p( X :::;+ It :::; X :::; ~). Aplicando-se diretamente a definição de probabilidade condicionada, teremos onde o somatório é estendido a todos os índices j que satisfaçam à condição Xj :::;x. (b) Se X for uma variável aleatória contínua com fdp f, P(~ < X < ~) 3 - - 2 P(~ < X < ~) 3 - - 3 f l/2 1132x dx 5/36 5 = fi;~ 2x dx = 1/3 = 12~ Exemplo 4.13. Seja X a duração da vida (em horas) de um certo tipo de lâmpada. Admitindo que X seja uma variável aleató- ria contínua, suponha-se que a fdp f de X seja dada por p (X < ~ \ ~ <' X < ~) - 2 3 - - 3 F(x) = 1: f(s)ds. (4.10) Demonstração. Ambos os resultádos decorrem imediatamente da definição. Exemplo 4.14. Suponhamos que a variável aleatória X tome os três valores O, 1 e 2, com probabilidades 1/3, 1/6 e 1/2, respectiva- mynte. Então, f(x) = a/x 3, 1.500 :::; x :::; 2.500, = O,para quaisquer outros valores. (Isto é, está se atribuindo probabilidade zero aos eventos! X < 1.500I e IX > 2.500}.) Para calcular a constante a,. recorre-se à condição f-~~ f(x) dx = 1, que neste caso se torna J;..~gr: (a/x3)dx = 1. Daí se obtém a = 7.031.250. O gráfico de f está apresentado na Fig. 4.10. Em capítulo posterior estudaremos, pormenorizadamente, mUl- tas variáveis aleatórias importantes, tanto discretas como continuas. = 1 se x ~ 2. (Observe-seque é muito importante indicar a inclusão ou a exclusão dos r . . lInites, na descrição dos diversos intervalos.) O gráfico de F está apresentado na Fig. 4.11. ~ F(x) = O se x < O, 1 se O:::;x < I, =- 3 1 se 1 :::;x < 2, - 2 86 I PROBABILIDADE Flx) ih-, , .x 3 1 2 3 Fig. 4.11 Exemplo 4.15. Suponhamos que X seja uma variável continua com fdp f(x) = 2x, O< x < 1, = O, para quaisquer outros valores. Portanto, a fdp de F é dada por F(x) = O se x :5 O, = [Z 28 d8 = X2 se O< x :5 1, =lsex>1. o gráfico está apresentado na Fig. 4.12. F(x) x I" Flg. 4.12 Os gráficos apresentados nas Figa. 4.11 e 4.12 para as fd são, em cada caso, bastante típicos, no seguinte sentido: (a) Se X for uma variávelaleatória discreta, com um número finito de valores possíveis, o gráfico da fd será constituído por segmentosde reta horizontais (nesse caso, a fd se denomina função em degraus). A função F é contínua, exceto nos valores possíveis de X: XI, . . .,xn' . . . No valor xi o gráfico apresenta um "salto" de magnitude p(xi) === =P(X=xi)' (b) Se X for uma variável aleat6ria contínua, F será uma função contmua para todo x. -- VARIÃVEIS ALEATÓRIAS UNIDIMENSIONAIS I 87 (c) A fd F é definida para t0d08os valores de x, o que é um motivo . unportante para considerá-Ia. Existem duas outras importantes propriedades da fd, que re- sumiremos no teorema seguinte: Teorema4.3. (a) A função F é não-decrescente. Isto é, se Xl ~ X2, teremos F(Xl) :5 F(X2). (b) lilIb->-.F(x) = O e lifiz-+..F(x) = 1.[Freqüentemente, escre- vemos isto como F( - co) = O e F( co) = 1.] Dem0n8tração:(a) Definamos os eventos A e B, assim: A = = IX :5Xl}, B = IX :5X2}. Portanto, como Xl:5 X" teremos A C B e, pelo Teor. 1.5,P(A) :5 P(B), que é o resultadodesejado. (b) No casocontinuo,teremos: F( - co.)=~~.. I".. f(8) d8 = O, F( co) =l.~f. /(8) d8 = 1. No casodiscreto, o raciocfnioé análogo. A função de distribuição (acumulada) é importante por muitas razões. Isto é particularmente verdadeiro quando tratarmos com uma variávelaleatória contínua, porque nesse caso não poderemos estudar o comportamento probabilístico de X através do cálculo de P(X =x). Aquelaprobabilidade é sempreigual a zero no caso contínuo. Contudo, poderemosindagar de P(X ~ x) e, como demonstra o teorema seguin- te, obter a fdp de X Teorema4.4. (a) Seja F a fd de uma variável aleat6ria con- tinua, com fdp f. Então, d f(x) = dx F(x), para todo x no qual F seja derivável. (b) Seja X uma variável aleat6ria discreta, com valores possi- veis XI, X2,.. " e suponha-se que esses valores tenham sido indexados de modo que XI < X2 < ... Seja F a fd de X. Então, p(Xj) = P(X = xJ) "" F(xj) - F(xj-I). (4.12) Demonstração:(a)F(x)=P(X :5 x) = J.:.. f(s) ds. Por isso, BJ?li- cando-seo teorema fundamental do Cálculo, obteremos F'(x) = f(x). ~ -- 88 I PROBABILIDADE VARIÁVEIS ALEATÓRIAS UNIDIMENSIONAIS I 89 (b) Como admitimos XI< X2< ..., teremos F(Xj) = P(X = Xj U X = Xj-I U" .U X = XI) = pU) + pU - 1) +.. . + p(I). 4.6. Distribuições Mistas F(x) = O, X ~ O, = 1 - e-, x > O. Restringimos nossa explanação tão-somente a variáveis alea- 'rias que sejam discretas ou contínuas. Tais variáveis são certa- to . I. - C d h ' . ente as mais Importantes nas ap Icaçoes.ontu o, a situações mm que poderemos encontrar um tipo misto: a variável aleatória X eode tomar alguns valores diferentes, digamos Xl,. . . Xn, com proba- ~ilidade nA,o-nula, e também tomar todos os valores em algum in- tervalo, digamos a ~ X ~ b. A distribuiç:w de probabilidade de tal variável aleatória seria obtida pela combinação das idéias já exa- minadas na descrição de variáveis aleatórias discretas e de contí- nuas, como se verá a seguir. A cada valor x. associa-se um número p(x.) tal que p(x.) ~ O para todo i, e tal que L~-l p(x.) = p < 1. Em seguida, define-se uma função j, satisfazendo a j(x) ~ O, f.b f(x) dx = 1 - p. Para todo a, b, com - 00 < a < b < + oo,P(a';;;; <X< b) = f.b f(x) dx + L P(xi)' Desta maneira, aten- {i:o<;;xi<;;b} deremos à condição P(S) = P( - 00 < X < CX» = 1. Uma variável aleatória de tipo misto poderia surgir da maneira explicada a seguir. Supónha-se que estejamos ensaiando algum equipamento e façamos igual a X o tempo de funcionamento. Em muitos problemas, descreveremos X como uma variável aleatória contínua, com valores possíveis X ~ O. No entanto, podem surgir situações nas quais exista uma probabilidade não-nula de que a peça não funcione de modo algum, isto é, falhe no momento X = O. Nesse caso, desejaríamos modificar nosso modelo e atribuir uma probabili- dade p > O ao resultado X = O. Conseqüentemente, teríamos P(X = O) = P e P(X > O) = 1 - p. Deste modo, p descreveria a distribuição de X no ponto O, enquanto a fdp j descreveria a distri- buiçãopara valoresde X > O.(Vejaa Fig. 4.13.) . }{x) ~ ,- . P(X~O)=p l"'/(X)dX=I-P ~ E F(Xj-l) = P(X = Xj-I U X = Xj-2 U'" U X = XI) = p(j - 1) + pU - 2)+ .. .+ p(I). Portanto, F(Xj)- F(xj-I) = P(X = Xj)= p(Xj). Comentdrio: Vamos resumidamente reconsiderar a parte (o) do Teorema 4.4. Recordemos a definição de derivada de uma função F: F(x)= lim F(x+h)-F(x) h"'" o h = lim P(X <;;x + h) - P(X <;;x) h"'" 0+ h = lim ~ [P(x < X <;;x +h)1. h"'" 0+ h Portanto, se h for pequeno e positivo, F' (x) =[(x) ~P(x <X<;x +h) h . Assim, [(x) é aproximadamente igual à "quantidade de probabilidade no intervalo (x, x + h) pelo comprimento h". Daí o nome [unção densidade de probabilidade. Exemplo 4.16. Suponha-se que uma variável aleatória conti- nua tenha a fd F dada por Kesse caso, F'(x) = e- para x > O,e, por isso, a fdp será dada por j(i) = e-, x ~ O, = O, para quaisquer outros valores. x X=Q x=b Cumentário: f: oportuno dizer uma palavra final sobre a tenninologia. Esta tenninologia, muito embora ainda não unifonne, tornou-se bastante padroni- zada. Quando falamos da distribuiçl!O de probabilidade de uma variável alea- tória X, nos referimos à sua fdp se"X fOr continua, ou A sua função de probabili- dade no ponto, p, definida para Xl>x~,... se X for discreta. Quando falamOS da função de distribuição acumulada, ou algumas vezes apenas Junçl!o de distri- buição (ou[unção de repartição),queremos semprenos referir a F, ondeF(x) ::::: =P(X <;;x). Fig. 4.13 Fig. 4.14 4.7. Variáveis Aleatórias Uniformemente Distribuídas Nos Caps. 8 e 9, estudaremos minuciosamente muitas variáveis aleatórias di t . á . d . scre as e contínuas Importantes. J mtro UZImos a --- .........- 90 / PROBABILIDADE VARIÃVEIS ALEATÓRIAS UNIDIMENSIONAIS / 91 Definição. Suponha-se que X seja uma variável aleatória COn- tínua, que tome todos os valores no intervalo [a, b], no qual a e b sejam ambos finitos. Se a fdp de X for dada por 1 f(x) = ~b ' -a Exemplo 4.18. A dureza H de uma peça de aço (avaliada na escala Rockwell) pode-se supor ser uma variável aleatória contínua uniformemente distribuída sobre o intervalo [50, 70], da escala B. Conseqüentemente, importante variável aleatória binomial. VI)JIlOS agora examinar, resumidamente; uma importante variável aleatória contínua. f(h) = 2~' 50 < h < 70, a ~ x ~ b, (4.13) = O, para quaisquer outros valores. = O, para quaisquer outros valores, diremos que X é uniformemente distribuída sobre o intervalo [a, b]. (Veja a Fig. 4.14.) COTMntárws:(a) Uma variável aleatória uniformemente distribuída tem uma fdp que é ronstanlesobre o intervalo de definição. A fim de satisfazer à condiçãof--+:'" f(x) dx = 1, essaconstantedeve ser igual ao inverso do compri- mento do intervalo. (b) Uma variável aleatória uniformementedistribuída representa o análogo continuo dos resultados igualmente prováveis, no seguinte sentido. Para qual- quer subintervalo[C,d],onde a.s c < d.s b,P(c.s X .s d) é a mesma para todos os subintervalos que tenham o mesmo comprimento. Isto é, Exemplo 4.19. Vamos obter a expressão da fd de uma variável aleatória uniformemente distribuída. F(x) = P(X ~ x) = f"'", f(s)ds =0 sex<a, x - a = -b se a ~ x < b, -a = 1 se x ~ b. O gráficoestá apresentadona Fig.4.15. .f. d d - c P(c.s X.s d) = . f(z)dz = - b-a 4.8 UmaObservação e, por isso, depende unicamente do comprimento do intervalo e não da posição desse intervalo. (c) Agora podemos tornar mais precisa a noção intuitiva de escolMr ao acaso um ponto P, em um intervalo [a, bJ. Por isto simplesmente queremos dizer que a coordenada z do ponto escolhido, digamos X, é uniformemente distribuída sobre !a, bl. EXémplo 4.17. Um ponto é escolhido ao acaso no segmento de reta [O, 2]. Qual será a probabilidade de que o ponto' escolhido esteja entre 1 e 3/2? Fazendo-se X representar a coordenada do ponto escolhido, nós temos que a fdp de X é dada por f(x) = 1/2, O< x < 2 e, portanto, P(l ~ X ~ 3/2)= 1/4. x Repetidamente temos salientado que em algum estágio de nosso desenvolvimentode um modelo probabilístico, algumas probabilidades devem ser atribuídas a resultados, com base ou em evidência experi- mental(como as freqüênciasrelativas,por exemplo) ouem algumaoutra consideração,como a experiência passada com o fenômeno que esteja em estudo. A seguinte questão pode ocorrer ao estudante: Por que nós não podemos obter todas as probabilidades em que estejamos interessa- dos por tais meios não-dedutivos? A resposta é que muitos eventos cujas probabilidades desejamos conhecer são tão complicados que nosso conhecimento intuitivo é insuficiente.Por exemplo, suponhamos que 1000 peças estejam saindo diariamente de uma linha de produção, algumasdas quais defeituosas. Desejamos saber a probabilidade de ter 50 ou menos peças defeituosas em certo dia. Mesmo que estejamos familiarizadoscom o comportamento geral do processo de produção, poderá ser difícil para nós associarmos uma medida quantitativa com o eVento:50 ou menos peças são defeituosas. No entanto, poderemos ser capazesde fazer a afirmação de que qualquer peça individualtenha probabilidade de 0,10 de ser defeituosa. (Assim a experiência passada nos d' . ' a a lllforrnaçãode que cerca de 10 por cento das peças são defei- F(x) x=a x=b Fig. 4.15 ~ -- 92 I PROBABILIDADE VARIÁVEIS ALEATÓRIAS UNIDIMENSIONAIS I 93 tuosas.) Além disso, poderemos estar inclinados a admitir que, indivi. dualmente, as peças sejam defeituosas ou perfeitas independentemente uma da outra. Agora, poderemos proceder dedutivamente e obter a probabilidade do evento em estudo. Assim, se X = número de peças defeituosas, 50 ( 1000) P(X ~ 50) =k~O k (O,lO)k (0,90)1000 - k 4.5. Suponha que a máquina 1 produza (por dia) o dobro das peças que - produzidas pela máquina 2. No entanto, 4% das peças fabricadas pela m&.- sa;na 1 tendem a ser defeituosas, enquanto somente cerca de 2% de defeituosas q od~z a máquina 2. Admita que a produção diária das duas máquinas seja mis- pr da Uma amostra aleatória de 10 peças é extraída da produção total. Qual tura ~. será a probabilidade de que essa amostra contenha 2 peças defeituosas? 4.6. Foguetes são lançados até que o primeiro lançamento bem sucedido tenha ocorrido. Se isso não ocorrer até 5 tentativas, o experimento é suspeoso e o equipamento inspecionado. Admita que exista uma probabilidade constante de 0,8 de haver um lançamento bem sucedido e que os sucessivos lançamentos sejam independentes. Suponha que o custo do primeiro lançamento seja K dó- lares, enquanto os lançamentos subseqüentes custam K/3 dólares. Sempre que ocorre um lançamento bem sucedido, uma certa quantidade de informação é obti- df!.,a qual pode ser expressa como um ganho financeiro de C dólares. Sendo T o custo líquido"desse experimento, estabeleça a distribuição de probabilidade de T. o que se quer destacar aqui é que os váriosmétodos que nós dedu- zimos para calcular probabilidades (e outros que serão estudados subseqüentemente) são de enorme importância, porque com eles pode- remos avaliar probabilidades associadasa eventos bastante complicados, as quais seriam difíceis de obter por meios intuitivos ou empíricos. Problemas 4.7. Calcule P(X = 5), onde X é a variável aleatória definida no Ex. 4.10. suponha que nI ==10, 1t2= 15, PI = 0,3 e P2 = 0,2. 4.8. (Propriedades das Probabilidades Binomiais.) Na explanação do Ex. 4.8, um padrão geral para as probabilidades binomiais (k)pk(1 - p)n-kfoisugerido. Vamos denotar essas probabilidades por Pn(k). (a) Mostre que, para O~ k < n, temos 4.1. Sab&-se que uma determinada moeda apresenta cara três vezes mais freqüentemente que coroa. Essa moeda é jogada três vezes. Seja X o número de caras que aparece. Estabeleça a distribuiçio de probabilidade de X e tam- bém a fd. Faça um esboço do gráfico de ambu. 4.2. De wn lote que contém 25 peças, das quais 5 são deleitu08lll!, 8ão esco- lhidas ~ ao acaso. Seja X o número de defeitU0S88encontradas. Estabeleça a distribuição de probabilidade de X, quando: (o) AB peças forem escolhidas com reposição. (b) AB peças forem escolhidas sem reposição. P(X> . + elx > .)-P(X ~ e). Pn(k + l)/Pn(k) = [(n - k)/(k + 1)] [1'/(1- 1')]. (b) Empregando (a), mostre que (i) Pn(k + 1)> Pn(k) se k < np - (1 - p), (ii) Pn(k+ 1) = Pn(k) se k = np - (1 - 1'), (iü) Pn(k + 1) < Pn(k) se k > np - (1 - 1'). (c) Mostre que se np - (1 - 1') for um inteiro, Pn(k) toma seu valor máximo para dois valores de k, a saber, ko = np - (1 - 1') e ko' = np - (1 - p) + 1. (d) Mostre que se np - (1 - 1') não for um inteiro, então Pn(k) toma seu valor máximo quando k for igual ao men<;>rinteiro maior que ko. (e) Mostre que se np - (1 - 1') < O, Pn(O)> Pn(l) > ... > Pn(n), enquanto se np - (1 - 1') = O, Pn(O)= Pn(1) > Pn(2) > ... > Vn(n). 4.9. A variável aleatória contínua X tem para fdp: }(z) = x/2, O~ x ~ 2. São feitas duas determinações independentes de X. Qual será a probabilidade ?e que ambas essas determinações sejam maiores do que I? Se três determinações In~ependentes forem feitas, qual a probabilidade de que exatamente duas delas sejam rnaiores do que I? 4.10. Possa ser r Seja X a duração da vida de uma válvula eletrônica e admita-se que X .. be-bo: > epresentada por uma vanável aleatória contínua, com fdp }(z) = , :dO. ~eja Pj = P(j ~ X < j + 1). Verifique que Vj é da forma (1 - a)aj eterrninea. se b4.11. A variável aleatória contínua X tem fdp }(z) = 3X2, -1 ~ x ~ O for Um número que satisfaça a -1 < b < O,calcule P(X';;' bIX < b/2). 4.3. Suponha que a variável aleatória X tenha os valores po8I!fveis1, 2, 3,. . .1 e P(X-i) - l/2j, j - 1,2,... (a) Calcule P(X eer par). (b) Calcule P(X ~ 5). (o) Calcule P(X eer diviafvel por 3). 4.4. Considere uma variável aleatória X com resultados possfveis:~, 1, 2,. . . Suponha que P(X ,.J) -(1 - a)aj, j = O,1,2, . .. (a) Para que valores de a o modelo acima tem eentido? (b) Verifique que essa expres8ão representa uma legítima distribuição de probabilidade. (o) Mostre que, para quaisquer dois inteiros positivos. e e, ~ ~ 94 / PROBABILIDADE VARIÁVEIS ALEATÓRIAS UNIDIMENSIONAIS I 95 4.12. Suponha que f e g sejam fdp no mesmo intervalo a ~ x ~ b. (a) Verifique que j + g não é uma fdp nesse interv~o. (b) Verifique que, para todo número {l, O < {l < 1, {lf(x) + (1 - {l)g(x) é uma fdp nesse intervalo. 4.13. Suponha que o gráfico na Fig. 4.16 represente a fdp de uma variável aleatória X. 4.17. Cada uma das seguintes funções representa a fd de \Una variável alea- tória continua. Em cada caso, F(z) = Opara z < a e F(z) = 1 para x > b, onde [ b) é o intervalo indicado. Em cada caso, (',b~('e o gráfico da função F, deter- ;ine a fdp f e faça o seu gráfico. Também verifique que f é ~lma fdp. (a) F(x) = x/5, O2 x.s 5. (b) F(z) = (2/7r)sen-I (yI;-), O.s x.s 1. i (c) F(x) = e3.r,- '" < x.s O. (d) F(z) = z3/2 + 2' -1 .s z .s 1. (a) Qual será a relação entre a e b? (b) Se a > O e b > O, que se pode dizer do maior valor que b pode tomar r (Veja a Fig. 4.16.) f(x)b . x x= -a x=b 4.18. Seja .\ a duração da vida (medida. em horas) de um dispositivo eletrÔnico. Suponha que X seja X variável aleatória contínua com fdp fez) = = k/zn, 2.000 .s z.s 10.000. (a) Para n = 2, determine k. (b) Para n = 3, determine k. (c) Para n em geral, determine k. (d) Qual a probabilidade de que o dispositivo falhe antes que 5.000 horas se tenham passado? (e) Esboce a fd F(I) para a letra (c) e deter- mine sua. forma algébrica. Fig. 4.16 4.19. Seja X uma variável aleatória com distribuição binomial, baseada em 10 repetições de um experimento. Se p = 0,3, calculeas seguintesprobabili- dades, empregando a tábua da distribuição binomial do Ap~ndi<le: (a) P(X ~ 8); (b) P(X = 7); (c) P(X > 6). 4.14. A percentagem de álcool (100 X) em certo composto pode ser consi- deradaumavariávelaleatória,_onde X, O< X < 1, tema seguinte'fdp:. f(x) = 20x3(1- x), O<x<1. 4.20. Suponha que X seja uniformemente distribulda sobre [- a, + aI, onde a > O. Quando posslvel, determine a de modo que as seguintes relações sejam satisfeitas: (a) Estabeleça a expressão da fd F e esboce seu gráfico. (b) Calcule P(X ~ 2/3). (c) Suponha que o preço de venda desse composto dependa do conteúdo de álcool. Especificamente, se 1/3 < X < 2/3, o composto se vende por Cl dó- lares/galão; caso contrário, ele se vende por C2 dólares/galão. Se o custo for C3 dólares/galão, calcule a distribuição de probabilidade do lucro líquido por galão. 4.15. Seja X uma. variável aleatória continua, com fdp dada por (a) P(X > 1) = + . (d) P(X <~) = 0,3. 2 (b) P(X > 1) = .!- . 2 (c) P(X <~) = 0,7. 2 (e) P(IXI < 1) = P(IXI > 1). f(x) = ax, O~ x ~ 1, = a, 1.s x ~ 2, = -ax + 3a, 2 ~ x ~ 3, = O, para. quaisquer outros valores. (a) Determine a constante a. (b) Determine a fd F e esboce o seu gráfico. (c) Se Xli X2 e X3 forem três observações independentes de X, qual será a proba- bilidade de, exatamente, um desses três números ser maior do que 1,5? 4.21. Suponha que X tenha distriblÚção uniforme sobre [O,aJ, a > O. Res- ponda às perguntas do Probl. 4.20. 4.22. Um ponto é escolhido ao acaso, sobre uma reta de comprimento L. Qual é a probabilidade de que o quociente do segmento mais curto para o mais longo seja menor do que 1/4? 4.16. O diâmetro X de um cabo elétrico supõe-se ser uma variável aleatória continua X, com fdp f(x) = 6x(1 - x), O~ x ~ 1. (a) Verifique que essa expressão é I1ma fdp e esboce o seu gráfico. (b) Obtenha uma. expressão para a. fd de X e esboce o seu gráfico. (c) Determine um número b tal que P(X < b) = 2P(X > b). (d) Calcule P(X ~ 1/211/3 < X < 2/3). 4.23. Uma fábrica produz 10 recipientes de vidro por dia. Deve-se supor que exista uma probabilidade constante p = 0,1 de produzir um recipiente defei- tuoso. Antes que esses recipientes sejam estocados, eles são inspecionados e os defeituosossão separados. Admita que exista uma probabilidade con<tante r = 0,1 de que um recipiente defeituoso seja mal c1l1SSificado.Faça X igual ao número de recipientes classificados como defeituosos ao fim de um dia de produção. (Admita que todos os recipientes fabricados em um dia sejam inspecionados na- quele dia.) (a) CalculeP(X = 3) e P(X > 3). (b) Obtenha a expressãode P(X = k). d 4.24. Suponha que 5 por cento de todas as peças que saiam de uma linha e fabnc""õ~' . . . . n d -r-v sejam defeItuosas. Se 10 dessas peças forem escolhidas e lnspeCIO- t a das, qual será a probabilidade de que no máximo 2 defeituosas sejam encon- ra as? ~ ~ 96 I PROBABILIDADE 4.25. Suponha que a duração da vida (em horas) de uma certa válvula seja uma variável aleatória contínua X com fdp l(x) = 100/x2, para x > 100, e zero para quaisquer outros valores de x. (a) Qual será a probabilidade de que uma válvula dure menos de 200 horas se soubermos que ela ainda está funcionando após 150 horas de serviço? ' (b) Se três dessas válvulas forem instaladas em um conjunto, qual será a probabilidade de que exatamente uma delas tenha de ser substituída após 150 horas de serviço? (c) Qual será Q número máximo de válvulas que poderá ser colocado em um conjunto, de modo que exista uma probabilidade de 0,5 de que após 150 horas de serviço to~as elas ainda estejam funcionando? 4.26. Um experimento consiste em n tentativas independentes. Deve-se admitir que por causa da "aprendizagem", a probabilidade de obter um resul- tado favorável cresça com o número de tentativas realizadas. Especificamente, suponha que P (sucesso na i-ésima repetição) = (i + l)/(i + 2), i = 1,2, ..., n. (a) Qual será a probabilidade de ter ao menos 3 resultados favoráveis, em 8 repetições? (b) Qual serll a probabilidade de que o primeiro resultado favorllvel ocorra na oitava repetição? Funções de Variáveis Aleatórias Capítulo 5 5.1. Um Exemplo 4.27. Com referência ao Ex. 4.10: (a) Calcule P(X = 2), se n = 4. (b) Para n arbitrllrio, verifique que P(X = n - 1) = P (exatamente uma tentativa mal sucedida) é igual a [l/(n + l)]L~-l (l/i). Suponhamos que o raio do orifício de um tubo calibrado com precisão X seja considerado uma variável aleatória contínua com fdp j. Seja A == 7rX2 a área da secção transversal do orifício. É intuitivamente evidente que, um& vez que o valor de X é o resul- tado de um experimento aleatório, o valor de A também o é. Quer dizer, A é uma variável aleatória (contínua) e desejamos obter sua fdp, que denotaremos g. Esperamos, uma vez que A é função de X, que a fdp g seja de algum modo deduzível do conhecimento da fdp J. Neste capítulo, trataremos de problemas desse tipo geral. Antes porém de nos familiarizarmos com algumas das técnicas espe- cíficas necessárias, vamos exprimir os conceitos acima mais rigoro- samente. 4.28. Se a varillvel aleatória K fór uniformemente distribuída sobre (O,5), qual será a probabilidade de que as raizes da equação 4X2+ 4xK + K + 2 = O sejam reais? 4.29. Suponha que a variávelaleatóriaX tenha valorespossíveis,1,2,3,. . . e que P(X=r)=k(1-{J)r- 1,0<{J<1. 5.2. Eventos Equivalentes (a) Determine a constante k. (b) Ache a moda desta distribuição (isto é, o valor de r que torne P(X =r) a maior de todas). Seja E um experimento e seja S um espaço amostral associado a 8. Seja X uma variável aleatória definida em S. Suponha-se que Y == H(x) seja uma função real de x. Então, Y == H(X) é uma 4.30. Uma varillvel aleatória X pode tomar quatro valores, com probabili- dades (1 + 3x)/4, (1 - x)/4, (1 + 2x)/4 e (1 - 4%)/4. Para que valores de x é esta uma distribuição de probabilidade? Ry R, Q G X (=) H H(,)~, Fig. 5.1 " '. anavel aleatória, porque para todo sE S, um valor de Y fica de- te . .l1n.inado,a saber y ==H [X(s)J. Esquematicamente,teremos a. Flg. 5.1. ~ 98 / PROBABILIDADE Como anteriormente, denominaremos Rx o contradomínio de X, o conjunto de todos os valores possíveis da função X. Semelhante- mente, definiremos Ry como o contradominio da varidvel aleatória Y, o conjunto de todos os valores possíveis de Y. Anteriormente, já definimos [Eq. (4.1)1 a noção de eventos equivalentes em S e em Rx. Agora, estenderemos esse conceito na seguinte forma natural. Definição. Seja C um evento (subconjunto) associado ao con- tradomínio Ry, de Y, como se explicou acima. Seja B C Rx defi- nido assim: B= IxERx:H(x)EC}. Em palavras: B é o conjunto de todos os valores de X, tais que H(x) E C. Se B e C forem relacionados desse modo, os denomina- remoseventosequivalentes. Comentários: (a) Como anteriormente, a interpretação não formal disso é que R e C serão eventos equivalentes se, e somente se, R e C ocorrerem conjunta- mente. Isto é, quando B ocorrer, C ocorrerá, e inversamente. (b) Suponha-se que A seja um evento associado a S, o qual é equivalente a um evento R associado a Rx. Então, se C for um evento associado a Ry o qual é equivalente a R, teremos que A será equivalente a C. (c) :f; também importante compreender que quando falamos de eventos equivalentes (no sentido acima), esses eventos são associados a diferentes espaços amostraÍs. Exemplo 5.1. Suponha-se que H(x) = 1I"X2,tal como na Seç. 5.1. Então, os eventos B: IX > 2} e C: IY > 411"j são equivalentes. Porque, se Y = 11"X2, então IX > 2j ocorrerá se, e somentese, IY > 411"}ocorrer, desde que X não pode tom.ar valores negativos no caso presente. (Veja a Fig. 5.2.) y )'=4.. x x=2 Fig.5.2 Comerúário: :f; também importante salientar que uma notação abreviada está sendo empregada quando escrevemos expressões tais como IX > 2} e IY > 4".1. Aquilo a que nos estaremos referindo, naturalmente, são os valores de X e os valores de Y, isto é, IsIX(s) > Z} e {xlY(x) > hl. (5.1) .........- FUNÇÕES DE VARIÁVEIS ALEATÓRIAS /99 Tal como fizemos no Capo 4, [Eq. (4.2)1, daremos a seguinte definição. Definição: Seja uma variável aleatória X definida no espaço amostral S. Seja Rx o contradomínio de X. Seja H uma função real e considere-sea variável aleatória Y = H(X) com contradomínio Ry. Para qualquer evento C C Ry, definiremos P(C) assim: P(C) = P[{x E Rx:H(x) E CI]. (5.2) Em linguagem corrente: A probabilidade de um evento asso- ciado ao contradomínio de Y é definida como a probabilidade do evento equivalente (em termos de X), como indicado pela Eq. (5.2). Comerúários: (a) A definição acima torna possível calcular probahilidades que envolvam eventos associados a Y, se conhecermos a distribuição de proba- bilidade de X e se pudermos determinar o evento equivalente em apreço. (b) Uma vez que explicamos anteriormente [Eq. (4.1 e 4.2)] como relacionar probabilidades associadas a Rx com probabilidades associadas a S, podemos re- escrever a Eq. (5.2) assim: P(C) = P[{x E Rx: H(x) E CI] = P[(s E S: H [X(s)]E CII. Exemplo 5.2. Seja X uma variável contínua com fdp f(x) = e-, x > O. (Uma integração simples confirma que J;~ e- dx = 1.) Suponha-se que H(x) = 2x + 1. Em conseqüência, Rx = Ix Ix > O}, enquanto Ry = Iy Iy > I}. Suponha-se que o even- to C seja definido deste modo: C = IY 2: 5}. x Então, y 2: 5 se, e somente se, 2x + 1 2: 5, o que por sua vez acarreta x 2: 2. Daí, C é equivalente a B = IX 2: 2}. (Veja Fig. 5.3.) Então, P(X 2: 2) = .h ~ e- dx = lfe2. Aplicando-seentãoa. Eq. (5.2)encontraremos que ~(Y 2: 5) = lfe2. v y=5 .<=2 Fig.5.3 d C07nenidri08: (a) t novamente, proveitoso salientar que poderemos consi- erar a incorporação de ambas as avaliações de x = X(s) e .de y = H(x) em nosso eXperimento e, conseqüentemente, considerar apenas Ry, o contradomfnio de Y, COllloo espaço amostral de nosso experimento. u! Rigorosamente falando, o espaço amostral de nosso experimento é S e o re- a tado do experimento é /t. Tudo o que se faz subseqüentemente nAo é influen- .I-- roo / PROBABILIDADE dado pela natureza aleatória do experimento. A determinação de x = X(8) e a avaliaçãode y == H(x) são processosrigorosamentedeterminlsticosdepoisque 8 tenha sido observado. Contudo, como já explicamos, podemos incorporar esses cálculos lia descrição de nosso experimento e, deste modo, tratar diretamente com o contradomlnio Ry. (b) Exatamente do modo como a distribuição de probabilidade foi induzida em Rx pela distribuição de probabilidade sobre o espaço amostral original S, a distribllição de probabilidade de Y será determinada quando a distribuição de probabilidade de X for conhecida. Assim, no Ex. 5.2 acima, a distribuição espe- ciCicadade Xdetermillou completamente o valor de P(Y ~ 5). (c) Ao considerar uma função de uma variável aleatória X, digamos Y = H(X), devemos observar que nem toda função H conceblvel poderá ser aceita. Contudo, as funções que surgem nas aplicações estão infalivelmente entre aquelas que podemos considerar e, por isso, não nos referiremos mais a esta pequena difi. culdade. 5.3. Varjáveis Aleatórias Discretas Caso 1. X é uma variável aleatória discreta. Se X for uma variável aleatória discreta e Y = H(X), nesse caso segue-se imedia- tamente que Y será também uma variável aleat6ria iliscreta. Porque supor que os valores possíveis de X possam ser enume- rados como XII X2,. . ",Xn,. .. acarreta qUe certamente os valores possíveis de Y sejam enumerados como YI = H(XI), Y2= H(X2)" . . (Alguns desses valores de Y poderão ser iguais, mas isso certamente não perturba o fato de que esses valores possam ser enumerados.) Exemplo 5.3. Suponhamos que a variável aleat6ria X tome os três valores -1, Oe 1, com probabilidades 1/3, 1/2 e 1/6, respectiva- mente. Seja Y = 3X + 1. Nesse caso os valores possíveis de Y são - 2, 1 e 4, tomados com probabilidades 1/3, 1/2 e 1/6. Este exemplo sugere o seguinte procedimentogeral: Se XII"" Xn,. .. forem os valores possíveis de X, p(Xi) = P(X = Xi), e H for uma função tal que, a cada valor Y correspohda exatamente um valor x, então a ilistribuição de probabilidade de Y será obtida do seguinte modo: Valores possíveis de Y: Probabilidades de Y: Yi = H(Xi), i = 1,,2,..., n,...; q(Yi)= P (Y = Yi) = p(Xi). Muito freqüentemente a função H não possui a característica acima, e poderá acontecer que vários valores' de X levem ao mesmo valor de Y, como ilustra o exemplo seguinte. Exemplo 5.4. Suponha-se que consideramoli a mesma variável aleat6ria X, como no Ex. 5.3 acima. Contudo, ~troduÚmos Y = X2. ......- FUNÇÕES DE VARIÃV~S ALEATÓRIAS /-101 portanto, os valores possíveis de Y são zero e um, tomados com pro- babilidades 1/2 e 1/2, porque Y = 1 se, e somente se, X = - 1 ou X = 1 e a probabilidade deste último evento é 1/3 + 1/6 = 1/2. Em termos de nossa terminologia preliminar, os eventos B: IX = :i: 11 e C: IY =.11 são eventos equivalentes e, em conseqüência, pela Eq. (5.2) têm iguais probabilidades. O procedimentogeralpara situações como a apresentada no exem- plo acima é o seguinte: Sejam Xii''Xi2". ., Xik" .. os valores de X que tenham a propriedade H(Xij) = Yi para todo j. Então, q(Yi)= P(Y = Yi) = P(Xil) + p(Xi) + " . isto é, para calcular a probabilidade d9 evento IY = Yi I, acha-se o evento equivalente em termos de X (no contradomínio Rx) e em seguidaailiciollam-se todas as probabilidades correspondentes. (Veja a Fig. 5.4.) (r-O Fig. 5.4 Exemplo5.5. Admita-se que X tenha os valores possíveis 1, 2,..., n, . .. e suponha-seque P(X = n} = (1/2)n. Seja Y = 1 se X for par, Y = -1 se X for ímpar. Portanto, Y toma os dois valores - 1 e + 1. Desde que Y = 1 se, e somente se, X = 2, ou X = 4, ou X = 6, ou . .., a aplicação da Eq. (5.2) fornece 1 1 1 -~ P(Y = 1) = 4 + 16 + 64 + ... - 3 . Conseqüentemente: 2 P(Y = -1) = 1- P(Y = 1)= -3 t Caso 2. X é uma variável aleat6ria contínua. Pode acoll- d~cerque X seja uma variável aleat6ria contínua enquanto Y seja IScreta. Por exemplo, suponha-se que X possa tomar todos os valores reais, enquanto Y seja definido igual a + 1 se X ~ O, e Y = - 1 se X < O. A fim de obter a distribuição de probabilidade de Y, determina-se apenas o evento equivalente (no contradomínio Rx) correspondente aos diferentes valores de Y. Neste caso, Y = 1 se, e somente se, X ~ O, enquanto Y = - 1 se, e somente se, X < O. Por isso,P(Y = 1) = P(X ~ O),enquanto P(Y = -1) = P(X < O). Se a fdp de X forconhecida,essasprobabilidadespoderãoser calcula~ das. No caso geral, se IY = y;} for equivalente a um evento, por exemplo A, no contradomínio de X, então 102 I PROBABILIDADE -- FUNÇÕES DE \7ARIÁVEIS ALEATÓRIAS I 103 G(y) = P(Y =s;y) = P(3X + 1 =s; y) = P[X =s;(y - 1)/31 1 <11-1)/3 = o 2x dx = [(y - 1)/312. Daí . 2 g(y) = G'(y) = "9 (y - 1). q(Yi) = P(Y = Yi) = .J;. J(x) dx. Desde que J(x) > Opara O< x < 1, encontramos que g(y) > O para 1 < y < 4. Comentário:O evento A, referido acima, equivalente ao evento IY ~ fi) é apenas IX ~ (y - 1)/31. Existe uma outra maneira, ligeiramente diferente, de obter o mesmo resultado, a qual será de utilidade mais tarde. Considere- mos novamente G(y) = P(Y =s; y) = P (X =s; y; 1) = F( Y ; 1 ), onde F é a fd de X; isto é, F(x) = P(X =s;x). 5.4. Variáveis Aleatórias Contínuas o caso mais importante (e mais freqüentemente encontrado) aparece quando X for uma variável aleatória contínua com fdp J e H for uma função contínua. Conseqüentemente Y = H(X) será uma variável aleatória contínua, e nossa tarefa será obter sua fdp, que dcnotaremos por g. o procedimento geral será: y A fim de calcular a derivada de G, G'(y), empregaremos a regra de derivação de função, como segue: dG(y)= dG(y). du, onde u = 1L..=...!... dy du dy 3 Portanto, , 1 1 ( Y-l ) 1 G (y) = F'(u) .- =J(u) . - = 2 - .-,- , 3 3 3 3 (a) Obter G, a fd de Y, na qual G(y) = P(Y ::::; y), achando-se o evento A (no contradomínio de X) o qual é equivalente ao evento IY=s;y}. (b) Derivar G(y) em relação 3. y, a fim de obter g(y). (c) Determinar aqueles valo- res de y no contradomínio de Y, para os quais g(y) > O. Exemplo 5.6. Suponhamos que X tenha fdp I I :11I J(x) = 2x, O < x < 1, = O, para outros quaisquer valores. Seja H(x) = 3x + L Daí, para obter a fdp de Y = H(X), teremos (veja a Fig. 5.5). g(y) como anteriormente. A fdp de Y l ...,. o gnl/ioo"p""""lado na F;g. ~ 5.6. (Para verificar o cálculo, ob- c(y)~9(y-l) r4 I serve que Jl g(y)dy = 1.) - ..)' )'-1 y~4 Exemplo 5.7. Suponhamos que Fig. 5.6 uma variável aleatória contínua tem . a fdp comofoi dada no Ex. 5.6. Se- Ja H(x) ==c"'. Para achar a fdp de Y = H(X), procederemos co- rno se indica a seguir (veja a Fig. 5.7): G(y) = P(Y =s;y) = P(e-X =s;y) = P(X ~ -Iny) =11 -1011 2xdx = 1 - (-In y)2. x Fig.5.5 ~ 104 / PROBABILIDADE Daí, g(y) = G'(y) = - 2 ln y/v. Visto que f(x) > O para O < x < 1 encontramos que g(y) > O para l/e < y < 1. [Observe que o sinai algébrico para g(y) está correto, pois que ln y < Opara l/e < y < 1.] O gráfico de g(y) está esboçado na Fig. 5.8. y 'X :(.1')L \' = ! 'e .1'= I )' x= -10 Y Fig.5.7 Fig.5.8 Poderemos também obter o resultado acima por um tratamento um pouco diferente, que esboçaremos resumidamente. Tal como anteriormente G(y) = P(Y ~ y) ==P(X ~ -ln y) = 1- P(X ~ -lny) = 1- F(-ln'y), onde F é a fd de X, como antes. A fim de obter a derivada de G, aplicaremos também a regra de derivação de função de função, co- mo se segue: dG(y) dG du dY=d;;~' onde u = - ln y. Deste modo G'(y) = - F'(u) (- ~)=+ 21n Y' (- ~), L! tal como anteriormente. Vamos agora generalizar o tratamento sugerido pelos exemplos acima. O passo mais importante em' cada um dos exemplos foi dado quando substituímos o evento IY ~ y I pelo evento equivalente em termos da variável aleatória X. Nos problemas acima, isso foi re- lativamente fácil porque em cada caso a função de X era estrita- mente crescente ou estritamente decrescente. ....... ,FUNÇÓES DE VARIÃVEIS,ALEATÓRIAS / 105 Na Fig. 5.9, 11é uma função estritamente crescente de x. Por . poderemos resolver 11= H(x) em termos de 11,isto é, x = H-'Ú/), isSO, onde H-I é denominada fun- , ção inversade H. Portanto, se H for estritamentecrescente IH(X) ~ 11I seráequivaiente a IX ~ H-'(y)I, enquantose H for estritamentedecrescente, IH(X) ~ yI será equivalente a Ix ~ H-'(y)}. O processo empregado nos exem- Y pIos acima pode agora ser ge- neralizado, na seguinte forma: y X_H-I(y) Fig. 5.9 Te<rrema5.1. Seja X uma variável aleatória contínua com fdp f, onde f(x) > O,para a < x < b. Suponha-seque y = H(x) seja uma função de x estritamente monótona (ou crescente ou decrescente). Admita-se que essa função seja derivável (e, portanto, contínua) para todo x. Então, a variável aleatória Y, definida como Y = H(X) possuia fdp g dada por g(y) = f(x) 1:1, (5.3) ondex é expresso em termos de y. Se H for crescente, então g será não-nuIapara aqueles valores de y que satisfaçam H(a) < y < H(b). Se H for decrescente, então g será não-nula para aqueles valores de y que satisfaçam H(b) < y < H(a). Demonstração: (a) Suponha-se que H seja uma função estrita- mente crescente. Daí G(y) = P(Y ~ y) = P[H(X) ~ y] =P[X ~ H-'(y)] = F[H-'(y)]. Derivando G(y) em relação a y, obteremos com o emprego da regra. da derivada de função de funçll.o: Portanto, dG(y) dG(y) dx di! =--a;- dy' onde x = H-I (y). G'(y)= dF(x) dx = f(x) dx. dx dy d1l ~ 106 / PROBABILIDADE (b) Suponha-se que H seja uma função decrescente. Dai G(y) = P(Y ~ y) = P[H(X) ~ y) = P{X ~ H-l(y») = 1- P[X ~ H-l(y») = 1 - F[:H-l(y»). Procedendo tal como acima, poderemos escrever dG(y) = dG(y) dx = ~ [1- F(x)] dx = - J(x) dx. dy dx dy dx dy dy Comentário: O sinal algébrico obtido em (b) está correto porque, se y for uma função decrescente de X, X será uma função decrescente de y e, conseqüente- mente, dx/dy < O. Deste modo, pelo emprego do sinal, com o valor absoluto em tomo de dx/dy, poderemos combinar o resultado de (a) e de (b) e obter a forma final do teorema. Exemplo 5.8. Vamos reexaminar os Exs. 5.6 e 5.7 pela aplicação do Teor. 5.1. (a) No Ex. 5.6 tivemos J(x) = 2x, O< x < 1, e y = 3x + 1. Conseqüentemente, x = (y - 1)/3 e dx/dy = 1/3. Por isso, g(y) = = 2 [(y- 1)/3)(1/3) = 12/9)(y - 1), 1 < y < 4, o que confirma o resultado obtido anteriormente. (b) No Ex. 5.7, tivemos J(x) = 2x, O< x < 1 e y = e-4. Em conseqüência, x = - ln y e dx/dy = - l/y. Deste modo, g(y) = = - 2(In y)/y, l/e < y < 1, o que também confirma o resultado já obtido. Se y = H(x) não for uma função monótona de x, não poderemos aplicar diretamente o processo acima. Em vez disso, voltaremos ao processo geral esquematizado acima. O exemplo seguinte ilustra esse procedimento. Exemplo 5.9. Suponhamos que J(x) = 1/2, -1 < x < 1, = O, fora desse intervalo. 11111"'''1 I Seja H(x) = x'. Obviamente, esta não é uma função monótona sobre o intervalo [-1, 1] (Fig. 5.10). Por isso, obteremos a fdp de Y = X' do seguintemodo: G(y) = P(Y ~ y) = P(X' ~ y) = P(- Vy ~ X ~ vy) . = F(vy) - F(- VY), ....... FUNÇÕ':S OE VARIÁVEIS ALEATÓRIAS / 107 onde F é a fd da variável aleatória X. Logo, g(y) = G'(y)= J(V~ - J(-V!) 2Vy -2Vy = 2~Y [J(VY)+ J(- Vy»). Deste modo, g(y) = (1/2Vy) (1/2 + 1/2) = 1/2VY,0< y< 1. (Veja a Fig. 5.11.) g(y) y (q) Y=X2 x x=-I x=1 y Fig. 5.10 Fig. 5.11 O processo empregado no exemplo acima fornece o seguinte re- sultado geral. Teorema5.2. Seja X uma variável aleatória contínua com fdp J. Façamos Y = X2. Então, a variável aleatória Y tem a fdp dada por 1 . r - g(y) = - r [J(v y) +J(-Vy)J. 2v y Demonstração:Veja o Ex. 5.9. Problemas Y 5.1. Suponha que X seja uniformemente distribuída sobre (-1, 1). Seja == 4 - X2. Achar a fdp de Y, g(y), e fazer seu gráfico. Verifique também que g(y) é a fdp adequada. f 5.2. Suponha que X seja uniformemente distribuída sobre (l, 3). Ache a dp das seguintes variáveis aleatórias: (a) Y == 3X + 4, (b) Z = eX. Verjfi . que em cada caso que a função obtida é a fdp. Esboce os gráficos. ~ 108 I PROBABILIDADE 5.3. Suponha que a variável aleatória contínua X tenha fdp J(x) = e-:e, z > O. Ache a fdp das seguintesvariáveis aleatórias: (a) Y = XI, (b) Z = 3/(X + 1)2. 5.4. Suponha que a variável aleatória discreta X tome os valores 1, 2 e 3 com igual probabilidade. Ache a distribuição de probabilidade de Y = 2X+ 3. 5.5. Suponha que X seja uniformemente distribuída sobre o intervalo (O,1). Ache a fdp das seguintes variáveis aleatórias: (a) Y = X2 + 1, (b) Z = l/(X + 1). 5.6. Suponha que X seja uniformemente distribuída sobre (-1, 1). Ache a fdp das seguintes variáveis aleatórias: (a) Y = sen(1rf2)X, (b) Z = cos(1r/2)X, (c) W = IXI. 5.7. Suponha que o raio de uma esfera seja uma variável aleatória continua. (Em virtude de imprecisões do processo de fabricação, os raios das diferentes es- feras podem ser diferentes.) Suponha que o raio R tenha fdp J(r) = 6r(1 - r), O < r < 1. Ache a fdl? do volume Veda ácea superficial S da esfera. 5.8. Uma corrente elétrica oscilante 1 pode ser considerada como uma va- riável aleatória uniformemente distribulda sobre o intervalo (9, 11). Se essa corrente passar em um resistor de 2 ohms, qual será a fdp da potência P = 212? 5.9. A velocidade de uma molécula em um gás uniforme em equillbrio é uma variável aleatória V cuja fdp é dada por J(v) = av2e-b.., v > O, onde b = mf2kT e k, Tem denotam respectivamente a constante de Boltzman, a temperatura absoluta e a massa da molécula. (a) Calcular a constante a (em termos de b). [Sugestllo: Considere o fato de que 1;," e-zI dx = V;/2 e integre por partes.] (b) Estabeleça a distribuiçã.o da variável aleatória W = mV2/2, a qual re- presenta a energia cinética da molécula. 5.10. A tensão elétrica aleatória X é uniformemente distribulda sobre o intervalo (-k, k). .Se Y for a entrada de um dispositivo nã.o-linear, com as carac- terlsticas indicadas na Fig. 5.12, ache a distribuição de probabilidade de Y, nos três casos seguintes: (a) k < a, (b) a < k < xo, (c) k > xo. y Y=Yo x -X.Q -Q fi "'o Flg. 5.12 Ctmlentário: A distribuição de probabilidade de Y constitui um exemplo de uma distribuição mista. Y toma o valor zero com probabilidade não-nula e também toma todos os valores em certos. intervalos. (Veja a Baç. 4.6.) FUNÇÕES DE VARIÁVEIS ALEATÓRIAS I 109 5.11. A energia radiante (em Btu/hora/pé') é dada pela seguinte função da temperatura T (em escala Fahrenheit): E = 0,173 (T/IOO)4. Suponha que a temperatura T seja considerada uma variável aleatória contínua como fdp J{t) = 200r', 40~ t ~ 50, = O, para outros quaisquer valores. Estabeleça a fdp da energia radiante E. 5.12. Para medir velocidades do ar, utiliza-se um tubo (conhecido como tubo estático de Pitot), o qual permite que se meça a pressão diferencial. Esta pressão diferencial é dada por P = 0/2) dV', onde d é a densidade do ar e V é a velocidade do vento (mph). Achar a fdp de P, quando V for uma variável aleatória uniformemente distribuída sobre (10, 20). 5.13. Suponha que P(X.;; 0,29) = 0,75,ondeX é umavariávelaleatória contínua com alguma distribuição definida sobre (O, 1). Quando Y = 1 - X, determinark de modo queP(Y.;; k) = 0,25. ........
Envie sua pergunta para a IA e receba a resposta na hora
Texto de pré-visualização
PROBABILIDADE Aplicações à Estatística PAUL L. MEYER 2ª edição LIVROS TÉCNICOS E CIENTÍFICOS EDITORA Para Alan e David PROBABILIDADE Aplicaçõe~ à Estatística PAUL L. MEYER 1519.<1 MG13P~ Tradução fiC Ruy de C. B. Lourenço Filho \ Professor da Universidade Federal do Rio de Janeiro e da Escola Nacional de Ciências Estatísticas (ENCE/1BGE) 2~ EDIÇÃO 1i~I"rnflíllg"lf 0.528.348-4 iJC EDITORA ~ ~ L" edição: 1969- Reimpressões: 1970,1972, 1974, 1975, 1976(duas), 1977, 1978 (duas), 1980, 1981e 1982 2: edição: 1983- Reimpressões: 1991,1994 (duas), 1995, 1997, 1999 e 2000 Copyright@ 1969 por Ao Livro Técnico Título do original em inglês: Introductory Probability and Statistical Applications Copyright@ 1965 e 1969 por Addison-Wesley Publishing Company, Inc. AlI rights reserved. Authorized trans1ation from english 1anguage edition pub1ished by Addison-Wes1ey Publishing Company, Inc. Direitos exclusivos para a língua portuguesa Copyright @ 1983 by L TC - Livros Técnicos e Científicos Editora S.A. Travessa do Ouvidor, 11 Rio de Janeiro, RI - CEP 20040-040 Te!.: 21-221-9621 Fax: 21-221-3202 Reservados todos os direitos. É proibida a duplicação ou reprodução deste volume, no todo ou em parte, sob quaisquer formas ou por quaisquer meios (eletrônico, mecânico, gravação, fotocópia ou outros), sem permissão expressa da Editora. NOTADA EDITORA Temos por norma, nas traduções que editamos, converter as unida- des para o sistema legalno Brasil. No presente caso, abrimos uma exceção. O livro possui problemas nos sistemas inglês, CGS e MKS, que foram mantidos, a conselho de especialistasno assunto, visando a dar ao estudante maior flexibilidade, pela oportunidade de praticar nos diferentes sistemas. A EDITORA PREFÁCIO DA SEGUNDAEDIÇÃO Devido ao considerávelnúmero de observaçõesfavoráveisquerecebi durante os anos passados, tanto de alunos como de professores que empregaram a primeira edição deste livro, relativamente poucas altera- ções foram feitas. Durante a minha própria utilização repetida do livro, verifiquei que a organização básica do conteúdo e o nível geral de apresentação (por exemplo, a mistura de demonstrações matemáticas rigorosas com explanações mais informais e exemplos) estão bastante adequados ao tipo de estudante que se inscreveno curso. No entanto, diversasmodificaçõese acréscimosforam feitos. Antes de mais nada, foi realizado um esforço para eliminar os diversosenganos e erros de impressão que existiam na primeira edição. O autor é extre- mamente grato aos muitos leitores que não somente descobriram algunsdeles, como foram bastante interessados em me apontá-Ios. Em segundo lugar, foi feito um esforço para lançar maior esclareci- mento na relação entre várias distribuições de probabilidade, de modo que o estudante pudesse alcançar maior compreensão de como diversos modelos probabilísticos podem ser empregados para com uni obter aproximação de outro. Finalmente, alguns problemas novos foram acrescentados à já extensa lista incluída na primeira edição. O autor deseja agradecer, mais uma vez, à Addison-WesleyPu- blishing Company, pela sua cooperação em tudo quanto contribuiu para esta nova edição. P.L.M. Pullman, Washington PREFÂCIODA PRIMEIRA EDIÇÃO Se temer que suspeitem ser sua na"ativa inverídica,lembre-sedaprobabilidade. JOHN GAY Este livro é destinado a cursos de um semestre ou dois quadri- mestres, de Introdução à Teoria da Probabilidade e algumas de suas aplicações. O pré-requisito é um ano de Cálculo Diferencial e Integral. Não se supõe qualquer conhecimento prévio de Probabilidade ou de Estatística. Na Washington State University, o curso, para o qual este livrofoi preparado, vem sendo lecionado há algunsanos, principalmente a alunos orientados para a Engenharia ou às Ciências Naturais. A maioria desses alunos pode dedicar somente um semestre ao estudo desta matéria, porém, já que esses alunos estão familiarizados com o Cálculo, estão em condições de começar o estudo desta matéria por um nível além daquele estritamente elementar. Muitos tópicos da Matemática podem ser apresentados em di- ferentes estágios de dificuldade, e isto é certamente verdade para a Probabilidade. Neste livro, faz-se um esforço para tirar' proveito da base matemática do leitor, semultrapassá-Ia.Linguagemmatemática rigorosa é empregada, mas toma-se o cuidado de não se ficar excessi- vamente mergulhado em minúcias matemáticas desnecessárias. Este não é, seguramente, um "livro de receitas". Muito embora alguns conceitos sejam introduzidos e explicados de maneira não formal, as defmições e os teoremas são enunciados cuidadosamente. Quando uma demonstração pormenorizada de um teorema não é factível ou desejável, ao menos um esboço das idéias importantes é oferecido. Um traço peculiar deste livro são os "Comentários", que se seguem à maioria dos teoremas e definições. Nesses Comentários, o particular conceito ou resultado que esteja sendo apresentado é explicado de maneira intuitiva. Em virtude da restrição que nos impusemos, de escrever um livro relativamente conciso sobre um domínio muito extenso, algumas escolhas tiveram de ser feitas, quanto à inclusão ou exclusão de deter- minados tópicos. Não parece existir maneira óbvia de resolver esta XII I PREFAcIO DA PRIMEIRA EDiÇÃO PREFAcIO DA PRIMEIRA EDiÇÃO I XIII questão. Certamente, n[o sustento que para alguns dos tópicos exclui- dos, não se pudesse encontrar um lugar; nem pretendo que alguma parte da matéria n[o se pudesse omitir. Não obstante, para a maior parte dela, deu-se destaque às noções fundamentais, apresentadas bastante pormenorizadamente. Somente o Capo 11, sobre confiabili- dade, poderia ser considerado "artigo supérfluo", mas ainda aqui, sinto que as noções associadasàs questões de confiabilidade são de interesse fundamental para muitas pessoas. Além disso, conceitos de confiabili- dade constituem veículo excelente para se ilustrarem muitas das idéias anteriormente introduzidas ao livro. Muito embora a cobertura seja limitada pelo tempo disponível, uma seleção razoavelmente ampla dos assuntos foi conseguida. De um exame rápido do Sumário, fica evidenciado que cerca de três quartos do livro 8[0 dedicados a assuntos probabilísticos, enquanto o último quarto é dedicado a uma explanação da Inferência Estatística. Apesar de nada haver de extraordinário nesta particular divisãode importância entre Probabilidade e Estatística, creio que um sólido conhecimento dos fundamentos da Probabilidade é obrigatório para uma compreensão adequada dos métodos estatísticos. Idealmente, um curso de Probabi- lidade deveria ser seguido de outro, de Teoria e Metodologia Estatísti- cas. No entanto, como já mencionei anteriormente, a maioria dos alunos que toma este curso não tem tempo para uma exposição de dois semestres nesse domínio e, por isso, senti-me compelido a explanar ao menos alguns dos mais importantes aspectos do tema geral da Inferência Estatística. a sucesso potencial de determinada apresentação de um assunto não deve ser avaliado apenas em termos das idéias específicas aprendi- das e das técnicas específicas adquiridas. A apreciação fmal deve tam- bém levar em conta quão bem o estudante ficará preparado para con- tinuar seu estudo do assunto, sejapor simesmo, seja através do trabalho em um curso complementar. Se este critério for considerado impor- tante, então se tomará evidente que os conceitos básicos e as técnicas fundamentais devam ser salientados, enquanto métodos e tópicos altamente especializados devam ser relegados a um papel secundário. Isto se toma também um importante fator na seleção de quais tópicos incluir. A importância da teoria da Probabilidade é difícil de se exagerar. a modelo matemático apropriado para o estudo de um grande número de fenômenos observáveisé mais um modelo probabilístico do que um determinístico. Além disso, todo o assunto da Inferência Estatística é baseado em considerações probabilísticas. Técnicas estatísticas estão entre as mais importantes ferramentas dos cientistas e engenheiros. A fim de empregar inteligentemente essas técnicas, um profundo conhe- cimento dos conceitos probabilísticos é exigido. Espera-se que, além dos vários métodos e conceitos específicos com os quais o leitor venha a se familiarizar, ele também desenvolva uma certa atitude: a de pensar probabilisticamente, substituindo ques- tões como "Quanto tempo este componente funcionará?" por "Quão provável é que este componente funcione mais do que 100 horas?" Em muitas situações, a segunda questão poderá ser não somente a mais apropriada, mas de fato a única que tenha sentido fazer-se. Tradicionalmente, muitos dos importantes conceitos de probabi- lidade são ilustrados com o auxílio de diferentes "jogos de azar";joga- das de moedas ou dados, extração de cartas de um baralho, giração de uma roleta etc. Muito embora eu n[o tenha evitado inteiramente a referência a tais jogos, já que eles servem para ilustrar as noções funda- mentais, um esforço foi feito para colocar o estudante em contato com ilustrações mais adequadas das aplicações da probabilidade: a emissão de partículas IXpor uma fonte radioativa, amostragem de lotes, duração da vida de dispositivos eletrônicos, e os problemas relacionados de confiabilidade de componentes e de sistemasetc. Estou relutante em mencionar o mais óbvio traço de qualquer livro de Matemática: os problemas. E, no entanto, parece-me proveitoso salientar que a resolução de problemas deve ser considerada parte inte- grante do curso. Somente ao se tomar pessoalmente interessado em propor e resolver os exercícios, poderá realmente o estudante desen- volv~r uma compreensão e apreciação das idéias e uma familiaridade com as técnicas adequadas. Por isso, mais de 330 problemas foram incluídos no livro e, para mais de metade deles, respostas são dadas ao fim do livro. Além dos problemas propostos ao leitor, há numerosos exemplos resolvidos, espalhadosatravés do livro. Este livro foi escrito de maneira bem encadeada: o entendimento da maioria dos capítulos exige conhecimento profundo dos capítulos anteriores. Contudo, é possível examinar os Caps. 10 e 11 um tanto despreocupadamente, particularmente se alguém estiver interessado em dedicar mais tempo às aplicações estatísticas que são explanadas nos Caps. 13 a 15. Tal como deve ser certo para qualquer um que escrevaum livro, os débitos que tenho são muito numerosos: para com meus colegas,por muitas conversas estimulantes e úteis; para com meus próprios profes- sores, pelo conhecimento e interesse neste assunto; para com os críti- cos das versões anteriores do manuscrito, por muitas sugestõese críticas úteis; para com a Addison-WesleyPublishing Company, por sua grande ajuda e cooperação desdê as fases iniciais até o fuo mesmo deste pro- XIV I PREFAcIO DA PRIMEIRA EDIÇAO jeto; para Com a Br!l Carol Sloan, por ser uma datilógrafa eficiente e atenta; paIa com D. Van Nostrand, Inc., The Free Press, Inc. e Mac- millan Publishing Company, por sua permissão para reproduzir as Tábuas 3, 6 e 1, respectivamente; para com McGraw-HillBook Co., Inc., Oxford University Press Inc., Pergamon Press, Ltda. e Prentice- Hall, Inc., por suas permissões para citar determinados exemplos no texto, e, fmalmente para com minha esposa, não somente por me am- parar no esforço, como também por "deixar-me" e levar nossos dois filhos com ela a visitarem os avós, por dois cruciais mesesde verão, du- rante os quais fui capaz de transformar nossa casa em uma desordenada, porém tranqüila oficina, da qual surgiu, miraculosamente, a última versão final deste livro. SUMÁRIO P.L.M. Pullman, Washington Abril, 1965 Caprtulo 1. Introdução à Probabilidade 1.1 Modelos Matemáticos 1 1.2 Introdução aos Conjuntos 4 1.3 Exemplos de Experimentos Não-Determinísticos 8 1.4 O Espaço Amostral 11 1.5 Eventos 13 1.6 Freqüência Relativa 15 1.7 Noções Fundamentais de Probabilidade 17 1.8 Duas Observações 21 Caprtulo 2. Espaços Amostrais Finitos 2.1 Espaço Amostral Finito 26 2.2 Resultados Igualmente Verossímeis 27 2.3 Métodos de Enumeração 29 Caprtulo 3. Probabilidade Condicionada e Independência 3.1 Probabilidade Condicionada 42 3.2 Teorema de Bayes 49 3.3 Eventos Independentes 52 Caprtulo 4. Variáveis Aleat6rias Unidimensionais 4.1 Noção Geral de Variável Aleatória 66 4.2 Variáveis Aleatórias Discretas 72 4.3 A Distribuição Binomial 75 4.4 Variáveis Aleatórias Contínuas 80 4.5 Função de Distribuição Acumulada 85 4.6 Distribuições Mistas 89 4.7 Variáveis Aleatórias Uniformemente Distribuídas 89 4.8 Uma Observação 91 Caprtulo 5. Funções de Variáveis Aleat6rias 5.1 Um Exemplo 97 5.2 Eventos Equivalentes 97 5.3 Variáveis Aleatórias Discretas 100 5.4 Variáveis Aleatórias Contínuas 101 XVI I SUMARIO Caprtulo 6. Caprtulo 7. Caprtulo 8. Caprtulo 9. Variáveis Aleatórias de Duas ou Mais Dimensões 6.1 6.2 6.3 6.4 6.5 Variáveis Aleatórias Bidimensionais Distribuições de Probabilidade Marginal e Condicionada Variáveis Aleatórias Independentes Funções de Variável Aleatória Distribuição do Produto e do Quociente de Variáveis Aleatórias Independentes Variáveis Aleatórias n-Dimensionais 6.6 Caracterização Adicional das Variáveis Aleatórias 7.1 O Valor Esperado de Uma Variável Aleatória 7.2 Expectância de uma Função de uma Variável Aleatória 7.3 Variáveis Aleatórias Bidimensionais 7.4 Prupriedades do Valor Esperado 7.5 A Variância de uma Variável Aleatória 7.6 Propriedades da Variância de uma Variável Aleatória 7.7 Expressões Aproximadas da Expectância e da Variância 7.8 A Desigualdade de Tchebycheff 7.9 O Coeficiente de Correlação 7.1O Valor Esperado Condicionado 7.11 Regressão da Média Variáveis Aleatórias Discretas: A de Poisson e Outras 8.1 8.2 A Distribuição de Poisson A Distribuição de Poisson como Aproximação da Distribuição Binomial O Processo de Poisson A Distribuição Geométrica A Distribuição de Pascal Relação entre as Distribuições Binomial e de Pascal A Distribuição Hipergeométrica A Distribuição Multinomial 8.3 8.4 8.5 8.6 8.7 8.8 Algumas Variáveis Aleatórias Contínuas Importantes 9.1 9.2 9.3 9.4 9.5 9.6 9.7 9.8 Introdução A Distribuição Normal Propriedades da Distribuição Normal Tabulação da Distribuição Normal A Distribuição Exponencial Propriedades da Distribuição Exponencial A Distribuição Gama Propriedades da Distribuição Gama SUMARIO I XVII 110 116 121 124 9.9 A Distribuição de Qui-quadrado 9.10 Comparações entre Diversas Distribuições 9.11 A Distribuição Normal Bidimensional 9.12 Distribuições Truncadas Caprtulo 10. A FunçãoGeratrizde Momentos 128 131 10.1 Introdução 10.2 A Função Geratriz de Momentos 10.3 Exemplos de Funções Geratrizes de Momentos 10.4 Propriedades da Função Geratriz de Momentos 10.5 Propriedades Reprodutivas 10.6 Seqüências de Variáveis Aleatórias 10.7 Observação Final 137 144 149 150 156 159 162 165 167 172 175 Capítulo 11. Aplicações à Teoria da Confiabilidade 11.1 Conceitos Fundamentais 11.2 A Lei de Falhas Normal 11.3 A Lei de Falhas Exponencial 11.4 A Lei de Falhas Exponencial e a Distribuição de Poisson 11.5 A Lei de Falhas de Weibull 11.6 Confiabilidade de Sistemas Caprtulo 12. Somas de Variáveis Aleatórias 186 12.1 Introdução 12.2 A Lei dos Grandes Números 12.3 Aproximação Normal da Distribuição Binomial 12.4 O Teorema do Limite Central 12.5 Outras Distribuições Aproximadas pela Distribuição Normal: a de Poisson, a de Pascal e a Gama 12.6 A Distribuição da Soma de um Número Finito de Variáveis Aleatórias 187 194 200 203 205 206 208 Caprtulo 13. Amostras e Distribuições Amostrais 214 214 215 219 223 223 227 228 13.1 Introdução 13.2 Amostras Aleatórias 13.3 Estatísticas 13.4 Algumas Estatísticas Importantes 13.5 A Transformação Integral Caprtulo 14. Estimação de Parâmetros 14.1 Introdução 14.2 Critérios para Estimativas 14.3 Alguns Exemplos 14.4 Estimativas de Máxima Verossimilhança 14.5 O Método dos Mínimos Quadrados 230 233 234 236. 245 246 247 250 255 259 260 263 267 268 271 273 274 284 286 288 292 297 299 308 310 312 313 321 329 330 334 339 349 XVIII I SUMARIO 14.6 O Coeficiente de Correlação 14.7 Intervalos de Confiança 14.8 A Distribuição de t de Student 14.9 Mais Sobre Intervalos de Confiança Capftulo 15. Testes de Hipóteses 15.1 Introdução 15.2 Formulação Geral: Distribuição Normal com Variância Conhecida 15.3 Exemplos Adicionais 15.4 Testes de Aderência APÊNDICE RESPOSTAS A PROBLEMAS SELECIONADOS INDICAÇÕES BIBLIOGRÁFICAS fNDICE ALFABÉTICO 354 355 357 360 370 Introdução Probabilidade ,a 376 381 385 Capítulo 1 397 412 420 422 1.1. Modelos Matemáticos Neste capítulo examinaremos o tipo de fenômeno que estuda- remos por todo este livro. Além disso, formularemos um modelo matemático que nos ajudará a investigar, de maneira bastante pre- cisa, esse fenômeno. De início, é muito importante distinguir o pr6prio fenômeno e o modelo matemático para esse fenômeno. Naturalmente, não exercemos influência sobre aquilo que observamos. No entanto, ao escolher um modelo, podemos lançar mão de nosso julgamento critico. Isto foi especi.almentebem expresso pelo Prof. J. Neyman, que escreveu:* "Todas as vezes que empregarmos Matemática a fim de estudar alguns fenômenos de observação, deveremos essencialmente começar por construir um modelo matemático (determinístico ou probabilístico) para esses fenô- menos. Inevitavelmente, o modelo deve simplificar as coisas e certos por- menores devem ser desprezados. O bom resultado do modelo depende de que os pormenores desprezados sejam ou não realmente sem importância na elucidação do fenômeno estudado. A resolução do problema matemático pode estar correta e, não obstante, estar em grande discotdância com os dados ob- servados, simplesmente porque as hipóteses básicas feitas não sejam confirma- das. Geralmente é bastante difícil aíirmar com certeza se um modelo mate- mático especificado é ou não adequado, antes que alguns dados de observação sejam obtidos. A fim de verificar a. validade de um modelo, deveremos dedu- zir um certo número de conseqüências de nosso modelo e, a seguir, comparar esses resultados previstos com observações." Deveremos nos lembrar das idéias acima enquanto estivermos estudando alguns fenômenos de observação e modelos apropriados .Univer8ity of Califomia Publicatiom in Stalistics, VoI. I, University of Calüornia. Presa, 1954. 2 I PROBABILIDADE INTRODUÇÃO À PROBABILIDADE I 3 par:a sua explicação. Vamos examinar, inicialmente, o que se pode adequadamente denominar modelo detenninf8tico. Por essa expres- são pretendemos nos referir a um modelo que estipule que as con- dições sob as quais um experimento seja executado determinem o resultado do experimento. Por exemplo, se introduzirmos uma bateria em um circuito simples, o modelo matemático que, presumi- velmente, descreveria o fluxo de corrente elétrica observável seria I = E/R, isto é, a Lei de Ohm. O modelo prognostica o valor de I tão logo os valores de E e R sejam fornecidos. Dizendo de outra maneira, se o experimento mencionado for repetido um certo número de vezes, toda vez utilizando-se o mesmo circuito (isto é, conservan- do-se fixados E e R), poderemos presumivelmente esperar observar o mesmo valor para I. Quaisquer desvios que pudessem ocorrer seriam tão pequenos que, para a maioria .das finalidades, a descrição acima (isto é, o modelo) seria suficiente. O importante é que a ba- teria, fio, e amperômetro particulares utilizados para gerar e obser- var a corrente elétrica, e a nossa capacidade de empregar o instru- mento de medição, determinam o resultado em cada repetição. (Exis- tem determinados fatores que bem poderão ser diferentes de repeti- ção para repetição, que, no entanto, não influenciarão de modo dig- no de nota o resultado. Por exemplo, a temperatura e a umidade no laboratório, ou a estatura da pessoa que lê o. amperômetro, po- de-se razoavelmente admitir, não terão influência no resultado.) Na natureza, existem muitos exemplos de "experimentos", para os quais modelos determiofsticos são apropriados. Por exemplo, as leis da gravitação explicam bastante precisamente o que ~contece a um corpo que cai sob determinadas condições. As leis de Kepler nos dão o comportamento dos planetas. Em cada situação, o. mo- delo especifica que as condições, sob as quais determinado fenÔmeno acontece, determinam o valor de aJ.gumas variáveis observáveis: a grandeza da velocidade, a drea varrida durante determinado pe- dodo de tempo etc. Esses números aparecem em muitascdas fór;' mulas com as quais estamos familiarizados. Por exemplo, sa- bemos que, sob determinadas condições, a distância percorrida (verticalmente, acima do solo) por um objeto é dada por 8 = -16t2 + + vol, onde vo é a velocidade inicial e t o tempo gasto na queda. O ponto, no qual desejamos fixar nossa atenção, não é a forma parti- cular da equação acima (que é quadrática), mas antes o fato de que existe uma relação definida entre t e 8, a qual determina univo- carnente a quantidade no primeiro membro da equação, se aquelas no segundo membro forem fornecidas. - - Para um grande número de situações, o modelo matemático determinístico apresentado acima é suficiente. Contudo, existem também muitos fenômenos que requerem um modelo matemático diferente para sua investigação. São os que denominaremosmodelos não-detenninf8ticosou probabÜf8ticos. (Outra expressão muito comu- mente empregada é modelo estocástico.) Mais adiante neste capítulo, estudaremos muito minuciosamente, como tais modelos probabilisticos podem ser apresentados. Por ora, examinaremos alguns exemplos. Suponhamos que se tenha um fragmento de material radioativo que emita partículas alia. Com o auxílio de um dispositivo de con- tagem, poderemos registrar o número dessas partfculas emitidas durante um intervalo de tempo especificado. ~ evidente que não poderemos antecipar precisamente o número de partículas emitidas, ainda que se conheçam de modo exato a forma, a dimensão, a compo- sição química e a massa do objeto em estudo. Por isso, parece não existir modelo determinfstico razoável que forneça o número de par- tículas emitidas, por exemplo n, como uma função de várias carac- terísticas pertinentes ao material fonte. Deveremos considerar, em seu lugar, um modelo probabilistico. Como outro exemplo, considere-se a seguinte situação meteo- rológica. Deseja-se deterniinar qual a precipitação de chuva que cairá como resultado de uma tempestade particular, que ocorra em determinada localidade. Dispõe-se de instrumentos para registrar a precipitação. Observações meteorol6gicas podem nos fornecer considerável informação relativa à tempestade que se avizinhe: pressão barométrica em vários pontos, variações de pressão, velocidade do vento, origem e direção da tormenta, e várias leituras referentes a altitudes elevadas. Contudo, quão valiosas essas informaçõespossam ser para o progn6stico da natureza geral da precipitação (digamos, fraca, média ou forte), simplesmente não tornam possível dizer-se quanta chuva irá cair. Novamente estaremos nos ocupando de um .fenÔmeno que não se presta a um tratamento determinístico. Um modelo probabilistico explica a situação mais rigorosamente. Em princípio, poderemos ser capazes de dizer quanta chuva caiu se uma teoria tiver sido desenvolvida (o que não foi). Por isso, empregaremos um modelo probabilístico. No exemplo que trata de desintegração radioativa, deveremos empregar um modelo probabi- listico invariavelmenteem prindpio. Arriscando-nos a adiantarmos demais na apresentação de um conceito que será definido posteriormente, vamos apenas afirmar que, em um modelo determinístico, admite-se que o resultado efetivo 4 I PROBABILIDADE INTRODUÇÃO À PROBABILIDADE I 5 1.2. Introdução aos Conjuntos objetos que estejam sendo estudados. Este conjunto é, geralmente representado pela letra U. O outro conjunto que deve ser destacado pode surgir da seguinte maneira: Suponha.-se que o conjunto A seja descrito como o con- junto de todos os números reaiB x, que satisfaçam à equação Xl + 1 = O. Naturalmente, sabemos que não existem tais números; isto é, o conjunto A não contém qualquer elemento. Esta situação ocorre tão freqüentemente que se justifica a introdução de um nome especial para esse conjunto. Por isso, definiremos o conjunto vazio ou nulo como o conjunto que não contenha qualquer elemento. Ge- ralmente se representa esse conjunto por 0. Pode acontecer que, quando dois conjuntos A e B sejam consi- derados, ser elemento de A implique ser elemento de B. Nesse caso, diremos que .,4 é um subconjunto'de B, e escreveremos A C B. In- terpretação semelhante será dada para B C A. Diremos que dois conjuntos constituem o mesmo conjunto, A = B, se, e somente se, A C B e B C A. Desse modo, dois conjuntos serão iguais se, e so- mente se, eles contiverem os mesmos elementos. As duas seguintes propriedades do conjunto vazio e do conjunto fundamental são imediatas: (numérico ou de outra espécie) seja detenninado pelas condições sob as quais o experimento ou o procedimento seja executado. Em um modelo não-determinístico, no entanto, as condições da experi- mentação determinam somente o comportamento probabilístico (mais especificamente, a lei probabilística) do resultado observável. Em outras palavras, em um modelo determinístico empregamos "considerações físicas" para prever o resultado, enquanto em um modelo probabilístico empregamos a mesma espécie de considerações para especificar uma distribuição de probabilidade. A fim de expor os conceitos básicos do modelo probabilístico que desejamos desenvolver, será conveniente conhecer algumas idéias e conceitos da teoria matemática dos conjuntos. Este é um assunto dos mais extensos e muito se tem escrito sobre ele. Contudo, neces- sitaremos apenas de algumas noções fundamentais. Um conjunto é uma coleção de objetos. Usualmente, conjuntos são representados por letras maiúsculas A, B etc. Existem três maneiras de descrever que objetos esttio contidos no conjunto A: (a) Poderemos fazer uma lista dos elementos de A. Por exem- plo, A = 11,2, 3, 4} descreve o conjunto formado pelos inteiros positivos 1, 2, 3, 4. (b) Poderemos descrever o conjunto A por meio de palavras. Por exemplo, poderemos dizer que A é formado de todos os números reais entre O e 1, inclusive. (c) Para descrever o conjunto acima poderemos simplesmente éscrever A = Ix IO~ x ~ I} i isto é, A é o conjunto de todos os x. onde x é um número real entre Oe 1, inclusive. (a) Para todo conjunto A, temos que 0 C A. (b) Desde que se tenha definido o conjunto fundamental, então, para todo conjunto A, considerado na composição de U, teremos AC U. Os objetos que individualmente formam a coleção ou conjunto A são denominados membros ou elementos de A. Quando "a" for um elemento de A, escreveremos a E A, e quando "a" não for um elemento de A, escreveremos a EEA. Existem dois conjuntos especiais que, freqüenternerite, nos in- teressarão. Em muitos pronlemas nos dedicaremos a estudar um conjunto definido de objetos, e não outros. Por exemplo, poderemos nos interessar por todos os números reais, por todas as peças que saem de uma linha de produção durante um período de 24 horas etc. Definiremos o conjunto fundamental como o conjunto de todos os Exemplo 1.1. Suponha-se que U = todos os números reais, A = IxIx2 + 2x ~ 3 = O}, B = IxI (x - 2) (x2 + 2x - 3) = O} e C = Ixlx = -3,1, 2}. Então, A C B e B = C. A seguir, estudaremos a importante idéia de combinar conjun- tos dados, a fim de formarmos um novo conjunto. Há duas opera- ções fundamentais, e essas operações se assemelham, em certos as- pectos, à.<3operações de adição e multiplicação de números. Sejam dois conjuntos A e B. Definiremos C como a união de A e B (algumas vezes denomi- nada a soma de A e B), da seguinte maneira: C = Ixlx E A ou x E B (ou ambos)}. Escreveremos a união de A e B, assim: C = A U B. Desse modo, , C será formado de todos os elementos que estejam em A, ou em B, ou em ambos. 6 I PROBABI LI DADE INTRODUÇÃO À PROBABILIDADE I 7 Definiremos D como a inter8eçãode A e B (algumas vezes deno. minada o prodüto de A e B), da seguinte maneira: D = {xix E A e x E B}. Afirmamos que alguns conjuntos são equivalentes, por exemplo, A () (B () C) e (A () B) () C. Conclui-se que existe ul)l certo número de tais conjuntos equivalenre8,alguns dos quais estão rela- cionados abaixo. Se nos lembrarmos de que dois conjuntos são o mesmo conjunto sempre que eles contenham os mesmos elementos, será fácil mostrar que as afirmações feitas são verdadeiras. O leitor poderá se convencer disso, com a ajuda dos Diagramas de Venn. Escreveremos a interseção de A e B, assim: D = A () B. Portanto, D será formado de todos os elementos que estão em A e em B. Finalmente, introduziremos a noção de camplemento'de um con- junto A, na forma seguinte: O conjunto denotado por A, consti- tlÚdo por todos os elementos que não estejam em A (mas que e~tejam no conjunto fundamental U) é denominado complemento de A. Isto é, A = {xix EEAI. Um recurso gráfico, conhecido como Diagrama de Venn, poderá ser vantajosamente empregado quando estivermos combinando con- juntos, na maneira indicada acima. Em cada diagrama na Fig. 1.1, a região 8ambreadarenresenta o conjunto sob exame. (a) A U B = B U A, (b) A () B = B () A, (1.1) (c) A U (B U C)=(A U B) U C, (d) A () (B () C) = (A () B) () C. Denominaremos (a) e (b) leis camutativas, e (c) e (d) leis aB8ociativaB. AuB AnB Há outras identidade8de conjuntos encerrando união, interseção e complementação. As mais importantes delas estão enumeradas a seguir. A validade de cada uma delàS poderá ser verificada com a ajuda de um Diagrama de Venn. CD (e) A U (B () C)= (A U B) () (A U C), (f) A () (B U C) = (A () B) U (A () C), (g) A () 0 = 0, (h) A U 0 = A, ú) (A n B) = A U R, (1.2) (t) (A U B) = 11() R, (k) A = A. Flg. 1.1 Observe-se que (g) e (h) mostram que 0 se comporta entre os con- juntos (relativamente às operações'U e () da maneira que o nú- mero zero (com relação às operações de adição e multiplicação) o faz entre os números. Uma outra maneira de formar conjuntos, quando forem dados dois (ou mais) conjuntos, será necessáriaa seguir. Exemplo 1.2. Suponha-se que U = {I, 2, 3, 4, 5, 6, 7, 8, 9, 10I, A = {I, 2, 3, 4I, B = {3, 4, 5, 6I. Então, encontraremosque A = {5,6, 7, 8, 9, 10I, A U B = {I, 2, 3, 4, 5, 6I e A () B = {3,4I. Observe-se que, ao descrever um conjunto (tal como A U B), cada elemento é relacionado apenas uma vez. As operações de união e interseção, definidas acima para dois conjuntos, podem ser estendidas, intuitivamente, para qualquer número finito de conjuntos. Assim, definiremos A U B U C como A U (B U C) ou (A U B) U C, o que é equivalente, comose poderá ;verificar facilmente. De modo análogo, definiremos A () B n C como sendo A () (B n C) ou (A n B) n C, o que também se pode verificar serem equivalentes. ~ evidente que poderemos continuar essas composiçõesde conjuntos para qualquernúmero Jinito de con- juntos dados. . Definição. Sejam dois conjuntos A e B. Denominaremos produto cartesianode A e D, denotando-o por A XD, o conjunto {(a, b), a EA, b E DI, isto é, o conjunto de todos os pares ordenados nos quais o pri- meiro elemento é tirado deA e o segundo,de D. Exemplo 1.3. Suponha-se que A = {l, 2, 31;B = {I, 2,3,41. Então, A XD = {(1, 1), (1, 2),..., (1, 4), (2,1)... , (2, 4), (3,1), ... , (3,4)}. Observação. Em geral,A XB "* B XA. 8 / PROBABILIDADE INTRODUÇÃO À PROBABILIDADE / 9 A noção acima pode ser estendida da seguinte maneira: Se A 1, ... , An forem conjuntos, então,A1 XA2 X ...XAn ={(al,a2,...an), ai EAi I, ou seja, o conjunto de todas as ênuplas ordenadas. E1: Jogue um dado e observe o número mostrado na face de cima. Um caso especialimportante surgequando consideramoso produto cartesiano de um conjunto por ele próprio, isto é,A XA ouA XA XA. Exemplos disso surgem quando tratamos do plano euclideano, R X R, onde R é o conjunto de todos os números reais, e do espaço euclideano tridimensional, representado por R XR XR. O número de elementosde um conjunto terá grande importância para nós. Se existir um número finito de elementos no conjunto A, digamos aloa2, . . ., an,diremosqueA éfinito. Se existirum número infinito de elementos em A, os quais possam ser postos em correspon- dência biunívocacom os inteiros positivos, diremos que A é numerdvel ou infinito numerável. (Pode-se mostrar, por exemplo, que o con- junto de todos os números racionais é numerável.) :.Finalmente, deveremos considerar o caso de um conjunto infinito não-numerável; este tipo de conjunto possui um número infinito de elementos que não podem ser enumerados. Pode-se mostrar, por exemplo, que para quaisquer dois números reais b > a, o conjunto A = Ix Ia ~ x ~ bI contém um número não-numerável de elementos. Já que poderemos associar um ponto da reta dos números reais a cada número real, o que dissemos acima afirma que qualquer intervalo (não degenerado) contém mais do que um número contável de pontos. Os conceitos apresentados acima, muito embora representem apenas um rápido exame da teoria dos conjuntos, são suficientes para nossos objetivos: expor, com razoável rigor e precisão, as idéias fundamentais da teoria da probabilidade. E2: Jogue uma moeda quatro vezes e observe o número de caras obtido. E3: Jogtie uma moeda quatro vezes e observe a seqüência obtida de caras.e coroas. E.: Em uma linha de produção, fabrique peças em série e conte o número de peças defeituosas produzidas em um período de 24 horas. E&: Uma asa de avião é fixada por um grande número de rebi- tes. Conte o número de rebites defeituosos. 1.3. Exemplos de Experimentos Não-Determinísticos Ea: Uma lâmpada é fabricada. Em seguida é ensaiada quanto à duração da vida, pela colocação em um soquete e ano- tação do tempo decorrido (em horas) até queimar. E7: Um lote de 10 peças contém 3 defeituosas. As peças são retiradas uma a uma (sem reposição da peça retirada) até que a última peça defeituosa seja encontrada. O núme- ro total de peças retiradas do lote é contado. E.: Peças são fabricadas até que 10 peças perfeitas sejam pro- duzidas. O número total de peças fabricadas é contado. E.: Um míssil é lançado. Em um momento especificado t, suas três velocidades cOqlponentes,Vz,VIIe v. são observadas. ElO: Um míssil récem-lançado é observado nos instantes t1, t2,..., tn. Em cada um desses instantes, a altura do míssil acima do solo é registrada. Eu: A resistência à tração de uma barra metálica é medida. Eu: De uma uma, que só contém bolas pretas, tira-se uma bola e verifica-se sua cor. Eu: Um termógrafo registra a temperatura continuamente, num período de 24 horas. Em determinada localidade e em uma data especificada, esse termógrafo é lido. Eu: Na situação descrita em Eu, x e y, as temperaturas mínima e máxima, no período de 24 horas considerado, são regia- tradas. O que os experimentos acima têm em comum? Os seguintes tra- ços são pertinentes à nossa caracterização de um experimemo aleatório: (a) Cada experimento poderá. ser repetido indefinidamente sob condições essencialmente inalteradas. Estamos agora em condições de examinar o que entendemos por um experimento "aleatório" ou "não-determinístico". (Mais preci- samente, daremos exemplos de fenômenos, para os quais modelos não-determinísticos são apropriados. Esta é uma distinção que o leitor deverá guardar. Portanto, nos referiremos freqüentemente a experimentos não-determinísticos ou aleatórios, quando de fato estaremos falando de um modelonão-determinístico para um experi- mento.) :r\'ãonos esforçaremos em dar uma definição precisa deste r::onceito. Em vez disso, citaremos um grande número de exemplos que ilustrarão o que temos em mente. 10 I PROBABILIDADE INTRODUÇÃO À PROBABILIDADE I 11 (b) Muito embora não sejamos capazes de afirmar que resul- tado particular ocorrerá, seremos capazes de descrever o conjunto de todos os possíveis resultados do experimento. (c) Quando o experimento for executado repetidamente, os resultados individuais parecerão ocorrer de uma forma acidental. Contudo, quando o experimento for repetido um grande número de vezes, uma configuração definida ou regularidade surgirá. É esta regularidade que toma possível construir um modelo matemático preciso, com o qual se analisará o experimento. Mais tarde, teremos muito que dizer sobre a natureza e a importância desta regularidade. Por ora, o leitor necessita apenas pensar nas repetidas jogadas de uma moeda equilibrada. Muito embora caras e cor6'as apareçam sucessivamente, em uma maneira quase arbitrária, é fato empírico bem conhecido que, depois de um grande número de jogadas, a pro- porção de caras e a de coroas serão aproximadamente iguais. Deve-se salientar que todos os experimentos descritos acima satisfazem a essas características gerais. (Evidentemente, a última característica mencionada somente pode ser verificada pela experi- mentação; deixaremos para a intuição do leitor acreditar que se o experimento fosse repetido um grande número de vezes, a regulari- dade referida seria evidente. Por exemplo, se um grande número de lâmpadas, de um mesmo fabricante, fosse ensaiado, presumivel- mente o número de lâmpadas que se queimaria após 100horas poderia ser previsto com precisão considerável.) Note-se que o experimento E 12 apresenta o traço peculiar de que somente um resultado é possível. Em geral, tais expel"ÚT'entosnão nos interessarão, porque, realmente, o fato de não sabermos qual particular resultado virá a ocorrer, quando um experimento for realizado, é que torna um experimento interessante para nós. Comentdrio: Ao descrever os diversos experimentos, nós especificamos não somente o procedimento que tem que ser realizado, mas também aquilo que estaremos interessados em observar (veja, por exemplo, a diferença entre E 2 e E 3' citados anteriormente). Este é um ponto muito importante, ao qual novamente nos referiremos mais tarde, quando explicarmos variáveis aleatórias. Por ora, vamos apenas comentar que, em conseqüência de um procedimento experimental isolado ou a ocorrência de um fenômeno único, muitos valores numéricos diferen- tes poderiam ser calculados. Por exemplo, se uma pessoa for escolhida de um grupo grande de pessoas (e a escolha real seria o procedimento experimental previamente mencionado), poderíamos estar interessados na altura daquela pessoa, no seu peso, na sua renda anual, no número de filhos dela etc. Naturalmente, na maioria dos casos, nós saberemos, antes de iniciar nossa experimentação, quais serão as características numéricas em que iremos estar interessados. 1.4. O Espaço Amostral Definição. Para cada experimento S do tipo que estamos con- siderando, definiremos o espaçoamostralcomo o conjunto de todos os resultados possiveis de S. Geralmente representaremos esse conjunto por S. (Neste contexto, 8 representa o conjunto fundamental, expli- cado anteriormente.) Vamos considerar cada um dos experimentos acima e descrever um espaço amostral para cada um deles. O espaço amostra! 8i s& referirá ao experimento Ei. SI: 11,2,3,4,5, 6}. 82: 10, 1, 2, 3, 4}. S3: Itodas as seqüências possiveis da forma aI>a2,aa, a.}, onde cada a; = H ou T, conforme apareça cara ou coroa na i-ésima jogada. S.: 10,1,2'00" Nj,ondeNéonúmeromáximoquepodeser produzido em '24 horas. S6: 1o, 1, 2,..., M j, onde M é o número de rebites empre- gado. S8: Itlt ~ O}. S7: 13, 4, 5, 6, 7, 8, 9, 1O}. S8: 110, 11, 12,. ..}. Se: IVz,VII'v.1Vz,VII'V. números reais}. SIO: Ihl,..., hnlhi ~ °, i = 1, 2,..., n}. 811: ITIT~O}. S12: Ibola preta}. SII: Este espaço amostral é o mais complexo de todos os consi- derados aqui. Podemos admitir, com realismo, que a tem- peratura em determinada localidade nunca possa ocorrer acima ou abaixo de certos valores 1If e m. Afora esta res- trição, poderemos aceitar a possibilidade de que qualquer gráfico apareça com determinadas restrições. Presumi- velmente, o gráfico não terá saltos (isto é, ele representará uma função contínua). Além disso, o gráfico terá certas caracterlsticas de regularização, que podem ser resumidas matematicamente dizendo-se que o gráfico representa uma função derivável. Deste modo, poderemos finalmente afirmar que o espaço amostral será: liIJ uma função derivável, que satisfaça a m ~ ~ J(t) ~ M, para todo t}. 12 I PROBABILIDADE INTRODUÇÃO À PROBABILIDADE I 13 S14: /(X, y) 1m:::; X :::; Y :::; 11/}. Isto é, S14 é fonnado por todos os pontos dentro e sobre um triângulo, no plano x, y bidi- mensiona!. por exemplo se H = 100. Torna-se bem mais simples e, matemati- . camente, conveniente, admitir que todo8 os valoresdet ~ ° sejamre- sultados possíveis e, portanto, tratar o espaço amostrai Ss tal como foi originalmente definido. Diante desses comentários, alguns dos espaços amostrais des- critos são idealizados. Em todas as situações subseqüentes, o espaço amostral considerado será aquele que for matematicamente mais conveniente. Na maioria dos problemas, pouca dúvida surge quanto à escolha adequada do espaço amostra!. (Neste livro não cuidaremos de espaços amostrais da complexidade encontrada em S13' 1\0 entanto, tais espaços amostrais podem sur- gir, mas exigem para seu estudo mais :\latemática avançada do que estamos admitindo aqui.) A fim de descrever um espaço amostral associado a um experimento, devemos ter uma idéia bastante clara daquilo que estamos mensurando ou observando. Por isso, devemos falar de "um" espaço amostral associado a um experimento, e não de "o" espaço amostra!. A esse respeito, note-se a diferença entre S2 e S3' Saliente-se, também, que o resultado de um e:\:perimentonão é necessariamente, um número. Por exemplo, em E3, cada resultado é uma seqüência de caras (H) e ~oroas (T). Em Eg e Elo cada re- sultado é formado por um vetor, enquanto em Eu, cada resultado constitui uma função. Será também importante estudar o número de resultados em um espaço amostra!. Surgem três possibilidades: o espaço amostral pode ser finito, infinito numerável, ou infinito não-numeráve!. Re- lativamente aos exemplos acima, observamos que SI>S2, S3, S., S~, S7 e Su são finitos, S8 é infinito numerável, e Ss, Sg, SIO,Su, Su e S14 são infinitos não-numeráveis. Neste ponto poderá ser valioso comentar a diferença entre um espaço amostral "idealizado" matematicamente e um espaço reali- zável experimentalmente. Com este objetivo, consideremos o expe- rimento Es e seu espaço amostral associado Ss. f; evidente que, quando estivennos realmente registrando. o tempo total t, durante o qual uma lâmpada funcione, seremos "vitimas" da precisão de nosso instrumento de medir. Suponha-se que temos um instrumer.to que seja capaz de registrar o tempo com duas casas decimais, por exem- plo, 16,43 horas. Com esta restrição imposta, nosso espaçQ amos- trai se tornará infinito numerável: /0,00, 0,01,0,02,..:}. Além disso, é bastante próximo da realidade admitir que nenhuma lâmpada possa durar mais do que H horas, onde H pode ser um número muito grande. Conseqüentemente, parece que se fonnos completamente realistas na descrição deste espaço amostral, estaremos realmente tratando com um espaçoamostralfinito: {O,OO,0,01,0,02,.. ., H}. O número total de resultados seria (H/O,OI)+ 1, que poderá ser um númeromuitogrande,mesmoque H sejamoderadamentegrande, 1.5. Eventos Outra noção fundamental é o conceito de evento. Um evento A (relativo a um particular espaço amostral S, associado a um expe- rimento 8) é -simplesmenteum conjunto de resultados possíveis. Na terminologia dos conjuntos, um evento é um 8ubconjuntode um es- paço amostral S. Considerando nossa exposição anterior, isto sig- nifica que o próprio S constitui um evento, bem como o é o conjunto vazio 0. Qualquer resultado individual pode também ser tomado como um evento. Alguns exemplos de eventos são dados a seguir. Novamente, nos referimos aos experimentos relacionados acima: Ai se referirá ao evento associado ao experimento Ei: AI: Um número par ocorre, isto é, AI = /2, 4, 6}. A2: /2}; isto é, duas caras ocorrem. Aa: /HHHH, HHHT, HHTH, HTHH, THHH}; isto é, mais caras do que coroas ocorreram. A.: /O}; isto é, todas as peças são perfeitas. Ai: /3,4,.. " M}; isto é, mais do que dois rebites eram defei- tuosos. As: /t I t < 3}; isto é, a lâmpadaqueimaemmenosde 3 horas. Au: /(x, y) Iy = x + 2O}; isto é, a temperatura máxima é 200 maior do que a mínima. Quando o espaçó amostra! S for finito ou infinito numerável, todo subconjunto poderá ser considerado um evento. [Constitui um exercício fácil de provar, e o faremos resumidamente, que se S cdn- tiver n elementos, existirão exatamente 2" subconjuntos (eventos).] Contudo, se S for infinito não-numerável, surgirá uma. dificuldade teórica. Verifica-se que nem todo subconjunto imaginável poderá 14 / PROBABILIDADE INTRODUÇÃO À PROBABILIDADE / 15 ser considerado um evento. Determinados subconjuntos "não admis- siveis" deverão ser excluidos por motivos que ultrapassam o nivel desta explanação. Felizmente, tais subconjuntos não-admissiveis não surgem nas aplicações e, por isso, não cuidaremos deles aqui. Na exposição subseqüente, será admitido tacitamente que sempre que nos referirmos a um evento, ele será da espécie que já admitimos considerar. Agora, poderemos empregar as várias técnicas de combinar con- juntos (isto é, eventos) e obter novos conjuntos (isto é, eventos), os quais já apresentamos anteriormente. representa o conjunto de todos os possíveis resultados, quando a. for executado n vezes. De certo modo, S X S X . . . X S é ele próprio um espaço amostral, a saber, o espaço amostral associado a n repetições de a.. Definição. Dois eventos, A e B, são denominados mutuamente excludentes,se eles não puderem ocorrer juntos. Exprimiremos isso escrevendoA n B = 0, isto é, a interseção de A e B é o conjunto (a) Se A e B forem eventos, A U B será o evento que ocorrerá se, e somente se, A ou B (ou ambos) ocorrerem. (b) Se A e B forem eventos, A n B será o evento que ocorrerá se, e somente se, A e B ocorrerem. vazio. Exemplo 1.4. Um dispositivo eletrônico é ensaiado e o tempo total de serviço t é registrado. Admitiremos que o espaço amostral seja {tlt;2: O}. Sejam A, B e C três eventos definidos da seguinte maneira: A = {tlt < loo}; B = {tI,50::; t::; 2OO-j;C.= {tlt > 150}. (c) Se A for um eventó, A será o evento que ocorrerá se, e so- mente se, não ocorrer A. (d) Se A" ' . ., An for qualquer coleção finita de eventos, então, U:-l Ai será o evento que ocorrerá se, e somente' se, ao menos um dos eventos Ai ocorrer. Conseqüentemente, A U B = {tlt::; 2ooj; A n B = {tI50::; t < looj; B U C = {tIt ;2:50}; B n C = {t1150< t ::; 200j; A n C = 0; AUC= {tlt< lOOout>150j; A= {tlt;2:1oo};C={t!t::;150j. (e) Se AI, ..., An for qualquer coleção finita de eventos, então n:-I Ai será o evento que ocorrerá se, e somente se, todosos eventos Ai ocorrerem. Uma das características fundamentais do conceito de "experi- mento", como foi apresentado na seção anterior, é que nós não sa- bemos qual resultado particular ocorrerá quando o experimento for realizado. Por outras palavras, se A for um evento associado a um experimento, então, não poderemos afirmar com certeza que A irá ocorrer ou não. Por isso, torna-se muito importante tentar associar um número ao' evento A, o qual medirá de alguma maneira quão verossímil é que o evento A venha a ocorrer. Essa tarefa nos leva à teoria da probabilidade. (f) Se A" . . .. An,. .. for qualquer coleção infinita (numerável) de eventos, então, Ui:1 Ai será o evento que ocorrerá se, e somente se, ao menos um dos eventos Ai ocorrer. (g) Se A" .. ., An,... for qualquer coleção infinita (numerável) de eventos, então, ni:1 Ai será o evento que ocorrerá se, e somente se, todosos eventos Ai ocorrerem. 1.6. Freqüência Relativa (h) Suponha-se que S represente o espaço amostral associado a algum experimento 8., e que nós executemos 8. duas vezes. Então, S X S poderá ser empregado para representar todos .osresultados dessas duas repetições. Portanto, (SI. S2) E S X S significa que S1 resultou quando 8. foi executado a primeira vez e S2. quando8.foiexecutadoa segundavez. (i) O exemplo contido em (h) pode, obviamente, sergeneralizado. Considerem-s~n repetições de um experimento 8. cujo espaço amostra! sejaS: S XS X . . . XS = {(S 1 , S2 , . . . , Sn)' SiE S, i = I, .. . , n j A fim de motivar a maneira de tratar o assunto, considere-se o seguinte procedimento: Suponha-se que repetimos n vezes o expe- rimento 8, e sejam A e B dois eventos associados a 8. Admitamos que sejam, respectivamente, nA e nB o número de vezes que o evento A e o evento B ocorram nas n repetições. Definição. iA = nA(n é denominada freqüência relativado evento A nas n repetições de 8. A freqüência relativafA apresenta as seguin- tes propriedades, de fácil verificação: (1) O ::; iA ::; 1. (2) i A = 1 se, e somente se, A ocorrer em todasas n repetições. 16 I PROBABILIDADE INTRODUÇÃO À PROBABILIDADE I 17 (3) tA = Ose, e somente se, A nunca ocorrer nas n repetições. (4) Se A e B forem eventos mutuamente excludentes, e setA UB for a freqüência relativa associada ao evento A U B, então, tA U B = = tA +tB . (5) tA, com base em n repetições do experimento e considerada como uma função de n, "converge" em certo sentido probabilístico para P (A ), quando n -+00. Comentdrio: A Propriedade (5) está evidentemente expressada um tanto vagamente, nesta seção. Somente mais tarde (Seç. 12.2), estaremos aptos a tornar esta idéia mais precisa. Por enquanto, podemos apenas afirmar que a Propriedade (5) envolve a noção nitidamente intuitiva de que a freq üência relativa, baseada em um número crescente de observações, tende a se "estabilizar" próximo de algum valor definido. Este não é o mesmo conceito usual de convergência encontrado em alguma parte da Matemática. De fato, tal como afirmamos aqui, esta não é, de modo algum, uma conclusão matemática, mas apenas um fato empírico. Esta propriedade de estabilidade da freqüênda relativa é, por enquanto, uma. noção inteiramente intuitiva, porém mais tarde es- taremos aptos a tomá-Ia matematicamente precisa. A essência desta propriedade é que, se um experimento for executado um grande número de vezes, a freqüência relativa da ocorrência de algum evento A tenderá 8.variar ca.davez menos à medida que o número de repe- tições for aumentada. Esta característica é também conhecida como regularidadeestatística. N6s fomos um tanto vagos em nossa definição de experimento. Quando um procedimento ou mecanismo constituirá, em nossa acep- ção, um experimento capaz de ser estudado matematicamente por meio de um modelo não-determinístico 1 Já afirmamos, anteriormente, que um experimento deve ser capaz de ser realizado repetid;1mente, sob condições essencialmente inalteradas. Agora, podemos acres- centar outra condição. Quando o experimento for repetidamente realizado, ele deverá. apresentar a regularidade estatística mencio- nada acima. Mais adiante, estudaremos um teorema (denominado Lei dos Grandes Números) que mostrará que a regularidade estatís- tica é, de fato, uma conseqüênciada primeira condição: reprodutibi- lidade. A maioria de nós está intuitivamente a par deste fenômeno de estabilização, muito embora nunca o tenhamos verificado. Fazê-Ioexige considerávelporção de tempo e de paciência, porque inclui um grande número de repetições de um experimento. Contudo, algumas vezes, poderemos ser ingênuos observadores deste fenômeno, como ilustra o seguinte exemplo: Exemplo 1.5. Admitamos que estejamos postados na calçada e fixemosnossa atenção em doisblocos demeio-fioadjacentes.Suponha-se que comece a chover de tal maneira que sejamos realmente capazes de distinguir pingos isolados de chuva e registrar se essespingos caemnum meio-fio ou noutro. Ficamos a observar os pingos eaanotar seu ponto de impacto. Denotando o i-ésimopingo por Xi>onde Xi = I se o pingo cair no primeiro meio-fio, e igual a O se cair no outro, poderemos observaruma seqüência como, por exemplo, I, 1, O,1, O,O,O,I, O,0,1. ~ evidente que não seremoscapazes de prever onde um particular pingo irá cair. (Nosso experimento consta de alguma espécie de situação me- teorológica que causa a queda dos pingos de chuva.) Se calcularmos a freqüência relativa do evento A = {o pingo cai no meio-fio I}, então, a seqüência de resultados acima dará origem às seguintes freqüências relativas (baseadas na observação de 1, 2, 3, .-.pingos): 1,1,2/3,3/4, 3/5, 3/6, 3/7,4/8,4/9,4/10,5/11, " . Esses números evidenciam um elevado grau de variação, especialmente no início. É intuitivamente evidente que, se o experimento acimacontinuasseindefmidamente, essas freqüências relativas iriam se estabilizar próximas do valor 1/2. Conse- qüentemente, teríamos toda razão em acreditar que, depois de algum tempo decorrido, os dois meios-fiosestariam igualmente molhados. 1.7. Noções Fundamentais de Probabilidade Voltemos agora ao problema proposto acima: atribuir um número a cada. evento A, o qual avaliará quão verossímil será a ocorrência. de A quando o experimento for realizado. Uma possivel maneira de tratar a questão seria a seguinte: repetir o experimento um grande número de vezes, calcular a freqüência relativa f A e utilizar esse nú- mero. Quando recordamos as propriedades de f A, toma-se evidente que este número fornece uma informação muito precisa de quão ve- rossímilé a ocorrência de A. Além disso,.sabemos que à medida que o experimento se repetir mais e mais vezes, a freqüência relativa fAse estabilizará pr6xima de algum número, suponhamos p. Há, con- tudo, duas sérias objeções a esta maneira de tratar a questão: (a) Não está esclarecido quão grande deva ser n, antes que se conheça o nú- mero: 1.0001 2.oo0? lO.ooo? (b) Uma vez que o experimento tenha sitio completamente' descrito e o evento A especificado, o número que estamos. procurando não deverá depender do experimentador ou da particular veia de sorte que ele possua. {Por exemplo, é pos- sível que uma moeda perfeitamente equilibrada, quando jogada 10 vezes, venha a apresentar 9 caras e 1 coroa. A freqüência rela- tiva do evento A = locorrer cara I seria, nesse caso, igual a 9/10. 18 I PROBABILIDADE INTRODUÇÃO À PROBABILIDADE I 19 No entanto, é evidente que nas pr6ximas 10 jogadas o padrão de caras e coroas possa se inverter.) O que desejamos é um meio de obter tal número, sem recorrer à experimentação. Naturalmente, para. que o número que convencionarmos tenha significado, qualquer experimentação subseqüente deverá produzir uma freqüência rela- tiva que seja "pr6xima" do valor convencionado, particularmente se o número de repetições, no qual a freqüência relativa calculada se tenha baseado, for muito grande. N6s procederemos,formalmente, da seguinte maneira: Definição. Seja S um experimento. Seja S um espaço amostral associado a S. A cada even1ioA associaremos um número real re- presentado por P(A) e denominado probabilidadede A, que satisfaça à.s seguintes propriedades: terá que ser um pouco mais paciente (até o pr6ximo capitulo), antes que aprenda como avaliar P(A). Antes de voltarmos a esta questão, vamos enunciar e demonstrar várias conseqüências relacionadas a P(A), que decorrem das condições acima e que não dependem da ma- neira pela qual n6s realmente calculamos P(A). Teorema 1.1. Se ~ for o conjunto vazio, então P (0) = o. Demonstração: Para qualquer evento A, podemos escrever A = A U 0. Uma vez que A e 0 são mutuamente excludentes, decorre da Propriedade 3, que P(A) = P(A U 0) = P(A) + P(~). Daqui, a conclusão do teorema é imediata. (1) O =:;;P(A) =:;;1. (2) P(S) = 1. (1.3) (3) Se A e B forem eventos mutuamente excludentes, P(AUB)= = P(A) + P(B). (4) Se AI>A2"'" An,... forem, dois a dois, eventos mutua- mente excludentes, então, Comentário: Mais tarde, teremos ocasião de ver que a reciproca do teorema acima não é verdadeira. Isto é, se P(A) = O,não poderemos, em geral, concluir que A = 9, porque existem situações nas quais atribuímos probabilidade zero a um evento que pode ocorrer. Teorema 1.2. Se 11 for o evento complementar de A, então P(A) = 1 - P(A). (1.4) P(Ut-lAi) = P(A1) + P(A2) + ...+ P(An) +... Demonstração: Podemos escrever S = A U 11 e, empregando a,<!Propriedades 2 e 3, obteremos 1 = P(A) + P(A). Observe-se que da Propriedade 3, decorre imediatamente que, para qualquer n finito, P(ü Ai)= i:P(Ai). i-I i-I Comentário: Este é um resultado particularmente útil, porque ele significa que sempre que desejarmos avaliar P(A), poderemos calcular P(A) e, depois, obtermos o resultado desejado por subtração. Veremos mais tarde que, em mui- tos problemas, é muito mais fácil calcular P(A) do que P(A). A Propriedade 4 não se seguirá; no entanto, quando considerarmos o espaço amostral idealizado, esta propriedade será imposta e, por isso, foi incluída aqui. A escolha das propriedades da probabilidade acima relacionadas é, obviamente, sugerida pelas correspondentes características da freqüência relativa. A propriedade, antes mencionada como regu- laridade estatística, será mais adiante vinculada a esta definição de probabilidade. Por enquanto, n6s apenas afirmamos que se pode mostrar que os números P(A) e fA são "pr6ximos" um do outro (em determinado sentido), se fA for baseado CIX).um grande número de repetições. :É este fato que nos dá a justificativa da utilização de P(A) para avaliarmos quão verossímil é a ocorrência de A. Por enquanto não sabemos como calcular P(A). Nós apenas arrolamos algumas propriedades gerais que P(A) possui. O leitor Teorema 1.3. Se A e B forem dois eventos quaisquer, então P(A U B) = P(A) + P(B) - P(A () B). (1.5) Demonstração:.A idéia desta demonstração é decompor A U B e B em dois eventos mutuamente excludentes e, em seguida, aplicar a Propriedade 3. (Veja o Diagrama de Venn na Fig. 1.2.) Desse modo escreveremos A U B = A U (B () A), B = (A () B) U (B () A). Conseqüentemente, P(A U B) = P(A) + P(B () 11), P(B) = P(A () B) + P(B () A). 20 I PROBABILIDADE INTRODUÇÃO À PROBABILIDADE I 21 Subtraindo a segunda igualdade da primeira, obtém-se qüentemente, P(B) = P(A) + P(B n ii) 2::P(A), porque P(B () Ã) 2:: 2::°, pela Propriedade 1. P(A U B) - P(B) = P(A) - P(A () B) Comentário: Este resultado é, certamente, de conhecimento intuitivo, pois ele a.firma que se B deve ocorrer sempre que A ocorra, conseqüentemente, B é mais provável do que A. e daí chega-se ao resultado. 1.8. Algumas Observações " (a) Cabe aqui uma palavra de advertência. Da exposição an- terior poderia ser (incorretamente) inferido que quando escolhermos um modelo probabilístico para a descrição de algum fenômeno de observação, estaremos abandonando todas as relações determinís- ticas. Nada poderia estar mais distante da verdade. Nós ainda utilizamos o fato de que, por exemplo, a Lei de Ohm I = E/R vale em determinadas circunstâncias. A diferença seria uma diferença de interpretação. Em vez de afirmar que a relação,acima determina I para E e R dados, admitiremos que E ou R (ou ambos) possam variar de alguma maneira aleatória imprevisível e que, em conse- qüência, I variará também de alguma forma aleatória. Para E e R dados, I será ainda determinado pela relação acima. O impor- tante é que, quando se adotar um modelo probabilístico para a des- crição de um circuito, considera-se a possibilidade de que E e R pos- sam variar de alguma maneira imprevisível, a qual somente pode ser descrita probabilisticamente. Portanto, desde que tenha sen- tido considerar somente a probabilidadede que E e R tomem certos valores, torna-se significativo falar somente da probabilidade de que I venha a tomar certos valores. (JJ /B S " 0~ ~ AnB AnB Fig.1.2 Comentário: Este teorema representa uma extensão imediata da Proprie- .dade 3, porque se A n B = 0, obteremos do enunciado acima a Propriedade 3. Teorema 1.4. Se A, B e C forem três eventos quaisquer, então P(A U B U C)=P(A) + P(B)+P(C)-P(A () B)-P(A () C)- - P(B () C) + P(A () B n C). (1.6) Demonstração: A demonstração consiste em escrever A U B U C na forma (A U B) U C e aplicar ó resultado do teorema anterior. Deixa-se ao leitor completar a demonstração. Comentário: Uma extensão óbvia do teorema é sugerida. quaisquer k eventos. Então, k k p(A1 U A2 U ", U Ak) = L P(Ai) - L P(Ai n Aj)+ i-I i<j-2 Sejam Alt..., Ak, (b) Algumas vezes, pode ser difícil realizar a escolha entre a adoção de um modelo determinístico ou um modelo probabilístico. Poderá depender da complicação de nossa técnica de mensuração e da exatidão associada a ela. Por exemplo, se medidas exatas forem tão difíceis de obter que leituras repetidas da mesma quantidade conduzam a resulta- dos variados, um modelo probabilístico será sem dúvida mais adequado para descrever a situação. k + L P(AinAjnAr) + ." + (-1)k-lp(AlnA2n...nAk). i<j<r-3 (1.7) (c) IndicaremoS' resumidamente que, sob certas circunstâncias, teremos condições de fazer hipóteses adicionais sobre o comportamento probabilístico de nossosresultados experimentais, as quais nos conduzi- rão a um método de avaliação das probabilidades básicas. A escolha dessashipóteses adicionaispode ser baseada em consideraçõesfísicas do experimento (por exemplo, propriedades de simetria), evidência empí- Este resultado pode ser facilmente estabelecido por indução matemática. Teorema 1.5. Se A C B, então P(A) ~ P(B). Demonstração: Podemos decompor B em dois eventos mutua- mente excludentes, na seguinte forma: B = A. U (B () Ã). Conse- 22 I PROBABILIDADE INTRODUÇÃO À PROBABILIDADE I 23 rica ou, em alguns casos, apenas julgamento pessoal, baseado em experiência anterior de uma situação similar. A freqüência relativatA pode desempenhar um importante papel em nossa deliberação sobre a atribuição numérica de P(A). Contudo, é importante compreender que qualquer suposição que façamos sobre P(A) deve ser tal, que sejam satisfeitos os axiomas básicosdesde (1) até (4) da Defmição(1.3). preender que estaremos tão-somente substituindo um valor postulado por uma aproximação obtida experimentalmente. Quão boa ou má essa aproximação possa ser, de modo algum influencia a estrutura lógica de nosso modelo. Muito embora o fenômeno que o modelo tente representar tenha sido levado em conta na construção do mode- lo, nós nos teremos distanciado do próprio fenômeno (ao menos tempo- rariamente), quando entrarmos no reino do modelo. (d) No curso do desenvolvimento das idéias básicas da teoria da probabilidade, faremos algumas referências a deterllÚnadas analogias mecânicas. A primeira delas pode ser apropriada aqui. Em Mecânica, atribuímos a cada corpo B sua massa, digamos m(B). Em seguida, fa- remos diversos cálculos e obteremos várias conclusões sobre o compor- tamento de B e suas relações com outros corpos, muitas das quais envolvem sua massa m (B). O fato de que nós poderemos ter que recorrer a alguma aproximação para obter realmente m(B) para um corpo especificado não diminui a utilidade do conceito de massa. Semelhantemente, estipularemos para cada eventoA associadoaoespaço amostral de um experimento um número P(A), denollÚnadoprobabili- dade de A, e satisfazendonossos axiomasbásicos. Ao calcularrealmente P (A) para um evento específico, nós teremos que fazer hipóteses adicionaisou que obter uma aproximaçãobaseadaem evidênciaempírica. Problemas 1.1. Suponha qlle o conjunto fundamental seja formado pelOlfinteiros p0- sitivos de 1 a 10. Sejam A == {2,3, 41,B == (3,4, 51,e C == {5,6, 71. Enu- mere os elementos dos seguintes conjuntos: (a)A n B. (b)A U B. (c)à n 1i. (d)A n (B n C). (e) A n (B U C). 1.2. Suponha que o conjunto fundamental U seja dado por U == == {xlO=:;;x=:;;21. Sejam os conjuntos A e B definidos da forma seguinte: A == {xl 1/2< x=:;;1\ e B == (xll/4=:;;x < 3/2\. Descrevaos seguintescon- juntos: (a) A U B. (b) A U B. (c)A n B. (d)A n B. (e) t muito importante compreender que nós tenhamos pos- tulado a existência do número P(A), e que tenhamos postulado de- ternúnadas propriedades que esse número possui. A validade das várias conseqüência:s (teoremas), decorrentes desses postulados, de modo algum depende da maneira pela qual iremos obter um ~alor numérico para P(A). :f; essencial que este ponto fique claro. Por exemplo, admitimos que P(A U B) = P(A) + P(B). A fim de em- pregar esta relação para a avaliação concreta de P(A U B), deveremos conhecer os valores de P(A) e de P(B). Explicaremos, resumida- mente, que sob certas circunstâncias, nós poderemos fazer suposições adicionais que conduzam a um método de avaliação dessas probabi- lidades. Se essas (ou outras) suposições não forem fundamentadas, poderemos ter de recorrer à experimentação a fim de alcançar o valor de P(A) a partir de dados reais. A freqüência relativa iA desempe- nhará nisso um importante papel e será, de fato, utilizada para apro- ximar P(A). 1.3. Quais das seguintes relações sf.o verdadeiras? (a) (A U B) n (A U C) == A U (B n C). (b) (A U B) == (A n B) U B. (c) à [) B == A U B. (d) (A U B) n C == à n Bne. (e) (A n B) n (B n C)== 9. 1.4. Suponha que o conjunto fundamental seja formado por todos os pontos (x, y) de coordenadas ambas inteiras, e que estejam dentro ou sobre a fronteira do quadrado limitado pelasretas x == O,y == O,% == 6 e y == 6. Enumereos ele- mentos dos seguintes conjunt{)S: (a) A == (X,y)IX2+y2=:;;6\. (b) B== {(x,y)IY=:;;X2\. (c) C == {(x,y)lx =:;;y21. (d) B n C. (e) (B U A) n C. 1.5. Empregue diagramas de Venn para estabelecer as seguintes rel~ões: (a) A C B e B C C implica que A C C. (b) A C B implica que A == A n B. (c) A C B implica que B C A. (d) A C B implica que A U C C B U C. (e) A n B == 9 e C C A implicamque B n C == 9. Contudo, é importante saber que i A e P(A) não são a mesma coisa; que nós apenas utilizaremos iA para aproximar P(A) e que, sempre que' nos referirmos a P(A), estaremos nos referindo ao valor postulado. Se nós "identificarmos" iA com P(A), deveremos com- 1.6. Peças que saem de uma linha de produção silo marcadM defeituosa (D) ou não defeituosa (N). As peças são inspecionadas e sus. condição registrads.. Isto é feito até que duas peças defeituosas consecutivas sejam fabricadas ou que quatro peças tenham sido inspecionadas, aquilo que ocorra em primeiro lugar. Descreva um espaço amostral para este experimento. 24 I PROBABILIDADE ,INTRODUÇÃO À PROBABILIDADE I 25 1.7. (a) Uma caixa com N lâmpadas contém r lâmpadas (r < N) com fil&- mento partido. Essas lâmpadas são verificadas uma a uma, até que uma lâm- pada defeituosa seja encontrada. Descreva um espaço amostra! para este expe- rimento. (b) Suponha que as lâmpadas acima sejam verificadas uma a uma, até que todas as defeituosas tenham sido encontradas. Descreva o espaço amost~a! para este experimento. (e) Exatamente dois dos eventos ocorrem. (d) Não mais de dois dos eventos ocorrem simultaneamente. 1.12. Demonstre o Teor IA. 1.8. Considere quatro objetos, a, b, e e d. Suponha que a ordem em que tais objetos sejam 'listados represente o resultado de um experimento. Sejam os eventos A. e B definidos assim: A. = ta está na primeira posição}; B = = Ib está na segunda posiçã.o!. (a) Enumere todos os elementos do espaço amostral. (b) Enumere todos os elementos dos eventos A. () B e .<1U B. 1.13. (a) Verifique que para qois eventos quaisquer, AI e .1.2, temos que P(AI U .1.2)::::;P(AI) + P(A2). (b) Verifique que para quaisquer n eventos AI" . ., An, temos que P(AI U. . . U An)::::;P(AIJ +. .. + P(An). [Swesúl:o: Empregue a indução matemática. O resúltado enunciado em (b) é denominado desigualdade de Boole.] 1.9. Um lote contém peças pesando 5, 10, 15, . .., 50 gramas. Admitamos que ao menos duas peças de cada peso sejam encontradas no lote. Duas peças são retiradas do lote. Sejam X o peso da primeira peça escolhida e Y o peso da segunda. Portanto, o par de números (X, Y) representa um resultado simples do experimento. Empregando o plano .\T, marque o espaço amostral e os seguin- tes eventos: 1.14. O Teor. 1.3 trata da probabilidade de que ao menos um de dois eventos A ou B ocorra. O seguinte enunciado se refere à probabilidade de que exatamente um dos eventos A ou B OCOrra.Verifique que PICA() B) U (B () :A)]= P(A) + P(B) - 2P(A () B). (a) [X = YI. (b) IY > XI. (e) A segunda peça é duas vezes mais pesada que a primeira. (d) A primeira peça pesa menos 10 gramas que a seglmda peça. (e) O peso médio de duas peças é menor do que 30 gramas. 1.15. Um certo tipo de motor elétrico falha se ocorrer uma das seguintes situações: emperramento dos mancais, queima dos enrolamentos, desgaste das escovas. Suponha que o emperramento seja duas vezes mais prpvável do que a queima, esta sendo quatro vezes mais provável do que o des!;aste das escovas. Qual será a probabilidade de que a falha seja devida a cada uma dessas circuns- tâncias ? 1.16. Suponha que A e B sejam eventos tais que P(A) = x, P(B) = y, e P(A () B) = z. Exprima cada uma das seguintes probabilidades em termos dex,yez. 1.10. Durante um período de 24 horas, em algum momento X, uma chave é posta na posiçã.o "ligada". Depois, em algum momento futuro Y (ainda du- rante o mesmo período de 24 horas), a cha\'e é virada para a posição "desligada". Suponha que X e Y sejam medidas em horas, no eixo dos tempos, com o infcio do período na origem da escala. O resultado do experimento é constituído pelo par de números (X, Y). (a) P(A:U B). (b) P(A: () B). (e) PcA U B). (d) P(A: () B). 1.17. Suponha que A, B e C sejam eventos tais que P(A) = P(B) = P(C) = = 1/4, P(A ri B) = P(C () B) = Oe P(A () C) = 1/8. Calcule a probabilidade de queao menosum.doseventosA, B ou C ocorra. (a) Descreva o espaço amostra\. (b) Descreva e marque no plano XY os seguintes eventos: (i) O circuito está ligado por uma hora ou menos. (ü) O circuito está ligado no tempo z, onde z é algum instante no período dado de 24 horas. (iii) O circuito é ligado antes do tempo II e desligado depois do tempo Ii (onde também II < 12são dois instantes durante o período de 24 horas especificado). (iv) O circuito permanece ligado duas vezes mais tempo do que desligado. 1.18. Uma instalação é constituída de duas caldeiras e uma máquina. Admita que o evento A seja que a máquina esteja em boas condições de funcionamento, enquanto os eventos Bk (k = I, 2) são os eventosde que ak-ésimacaldeiraesteja em boas condições. O evento C é que a instalação possa funcionar. Se a instalação puder funcionar sempre que a máquina e pelo menos uma das caldeiras funcionar, expresse os eventos C e C, em termos de A e dos Bk' 1.11. Sejam A, B e C três eventos associados a um experimento. em notações de conjuntos, as seguintes afirmações verbais: (a) Ao menos um dos eventos ocorre. (b) Exatamente um dos eventos ocorre. Exprima 1.19. Um mecanismo tem dois tipos de unidades: I e 11. Suponha que se disponha de duas unidades do tipo I e três unidades do tipo 11.Defina os eventos A k, k = 1, 2 e Bj, j = 1, 2, 3 da seguinte maneira :Ak: a k.ésimaunidade do tipo I está funcionando adequadamente; Br aj-ésima unidade do tipo 11está funcionan- do adequadamente. Finalmente, admita que C represente o evento: o mecanismo funciona. Admita que o mecanismo funcione se ao menos uma unidade do tipo I e ao menos duas unidades do tipo 11funcionarem; expresse o evento C em termos dosAk e dosBj- ESPAÇOS AMOSTRAIS FINITOS / 27 Capítulo 2 . Para resumir: a atribuição de probabilidadesPi a cada evento elementar lad, sujeito às condições (a) e (b) citadas anteriormente, determina unicamente P(A) para cada evento A C S, onde P(A) é dado pela Eq. (2.1). Para. avaliarmos os Pi individuais, alguma hipótese referente aos resultados individuais deve ser feita. Exemplo 2.1. Suponha-se que somente três resultados sejam possíveis em um experimento, a saber, a1l (12e (1a. Aléni disso, su- ponha-se que. aI seja duas vezes mais provável de ocorrer que <Ia,o qual por sua vez é duas vezes mais provável de ocorrer que (1a. Portanto, 'PI = 2p2 e P2= 2Pa. Já que PI + P2 + pa = 1, te- remos 4pa + 2pa + pa = 1, o que finalmente dá Espaços Amostrais Finitos 2.1. EspaçoAmostral Finito 1 Pa= 7' 2 4 P2 = 7 e PI = T' Neste capítulo nos ocuparemos unicamente de experimentos para os quais o espaço amostral 8 seja formado de um número jinito de elementos. Isto é, admitiremos que 8 possa ser escrito sob a forma 8 = IaI, a2,. . ., ak I. Se nos reportarmos aos exemplos de espaços amostrais da Seç. 1.4, observaremos que 811 82, 83, 84, 86, 87 e 812 são todos finitos. A fim de caracterizar P(A) para este modelo, deveremos ini- cialmente considerar o evento formado por um resultado simples, algumas vezes denominado evento simples ou elementar, A = Ia;}. Procederemos da seguinte maneira: A cada evento simples {lli} associaremos um número Pi, deno- minado probabilidade de {ai I, que satisfaça às seguintes condições: (a) pi ~ °, i = 1,2,..., k, (b) PI + P2 + ... + pk = 1. Comenl4rio: Na exposição que se segue, empregaremos a expressão "igual- mente verosslmeis" para significar "igualmente prová"eis". 2.2. Resultados Igualmente Verossímeis [Porque Ia;} é um evento, essas condições devem ser coerentes com aquelas postuladas para as probabilidades dos eventos em geral, como foi feito nas Eq. (1.3). É fácil verificar que isso se dá.J Em seguida, suponha-se que um evento A seja constituído por r resultados, 1 ~ r ~ k, a saber A hip6tese mais comumente feita para espaços amostrais fini- tos é a de que todos os resultados sejam igualmente verossímeis. Esta hipótese não pode ser, contudo, tomada como segura; ela deve ser cuidadosamente justificada. Existem muitos experimentos para os quais tal hip6tese é assegurada, mas existem também muitas si- tuações experimentais nas quais seria absolutamente errôneo acei- tar-se essa suposição. Por exemplo, seria bastante irreal supor que seja igualmente verossímil não ocorrerem chamadas telefônicas em um centro entre 1 e 2 horas da madrugada e entre 17 e 18 horas da tarde. Se todos os k resultados forem igualmente verossímeis, segue-se que cada probabilidade será Pi = l/k. Conseqüentemente,a con- dição PI + .. . +Pk = 1 toma-se kPi = 1 para.todo i. Disto de- Correque, para. qualquer evento A formado de r resultados, teremos P(A) = Pi,+ Pi, +...+ PiTo (2.1) P(A) = r/k. Este métodode avaliar P(A) é freqüentementeenunciadoda seguinte maneira.: P(A) == numero de casos favoráveis a A pelos quais B pode ocorrer número total de caSos pelos quais & pode ocorrer É Uiuito importante compreender que a expressão de P(A) acima é apenas uma conseqüência da suposição de que todos os resultados A = Iai" ai". . ., aiT}, onde j I, j2,. . ., jT representam um qualquer dos r índices, de 1 até k. Conseqüentemente, conclui-se da Eq. (1.3), Propriedade 4, que ~ 28 I PROBABILIDADE ESPAÇOS AMOSTRAIS FINITOS I 29 sejam igualmente verossímeis, e ela é aplicável somente quando essa suposição for atendida. Ela certamente não serve como uma defi- nição geral de probabilidade. Exemplo 2.2. Um dado é lançado e todos os resultados se su- põem igualmente verossímeis. O evento A ocorrerá se, e somente se, um número maior do que 4 aparecer, isto é, A = {5, 6}. Con- seqüentemente, P(A) = 1/6 + 1/6 = 2/6. Exemplo 2.3. Uma moeda equilibrada é atirada duas vezes. Seja A o evento: {aparece uma cara}. Na avaliação de P(A), a análise do problema poderia ser a seguinte: O espaço amostral é 8 = 10, 1, 2} onde cada resultado representa o número de caras que ocorre. Portanto, seria encontrada P(A) = 1/3! Esta análise é obviamente incorreta, porque no espaço amostral considerado acima, todos os resultados não são igualmente verossímeis. A fim de aplicar os métodos expostos, deveremos considerar em s.eu lugar o espaço amostral 8' = IHH, HT, TH, TT}, onde H representa cara, e T coroa. Neste espaço amostral todos os resultados são igualmente verossímeis e, por isso, obteremos como solução correta de nosso problema: P(A) = 2/4 = 1/2. Poderiamos empregar corretamente o espaço 8 da seguinte maneira: Os resultados O e 2 são igualmente verossímeis, enquanto o resultado 1 é duas vezes mais provável que qualquer um dos outros. Portanto, P(A) = 1/2, o que concorda com a resposta anterior. Este exemplo ilustra dois aspectos. Primeiro, deveremos estar bastante seguros de que todos os resultados possam supor-se igual- mente verossímeis, antes de empregar o procedimento acima. Se- gundo, poderemos freqüentemente, por uma escolha apropriada do espaço amostral, reduzir o problema a outro, em que todos os resul- tados sejam igualmente verossímeis. Sempre que possível, isto deve ser feito porque geralmente torna o cálculo mais simples. Este aspecto será de novo mencionado em exemplos subseqüentes. lhendo um cartão, tentaremos garantir que cada parafuso tenha de fato a mesma probabilidade de ser escolhido. Assim, poderemos nos meter em enorme trabalho a fim de assegurarmos que a suposição matemática de resultados igualmente verossímeis seja de fato apro- priada. Nos exemplos já vistos e em muitos que se seguirão, trataremos da escolha 3.()aeàSo de um ou mais objetos de uma dada coleção de objetos. Definamos esta noção mais precisamente. Suponhamos que se tenha N objetos, a saber aI, a2,.. ., aN. (a) Escolher ao acaso um objeto,dentre N objetos, significa que cada objeto tem a mesma probabilidade de ser esc,Olhido, isto é, Prob (escolher lli) = l/N, i = 1, 2,..., N. (b) Escolher ao acaso dois objetos, dentre N objetos, significa que cada par de objetos (deixada a ordem à parte) tem a mesma pro- babilidade de ser escolhido que qualquer outro par. Por exemplo, se devemos escolher ao acaso dois objetos dentre (aI, a2,a3,a4),obter aI e a2 é então tão provável quanto obter a2e a3etc. Esta formula- ção levanta imediatamente a questão de quantos pares diferentes existem. Admita-se que existam K desses pares. Então, a proba- bilidade de cada par seria l/K. Logo, veremos como calcular K. (c) Escolherao acaso n objetos(n ::::;;N) dentre N objetos signi- fica que cada ênupla, a saber lli., lli". . ., llin é tão provável de ser escolhida quanto qualquer outra ênupla. Comentário: Já sugerimos acima que se deve tomar extremo cuidado durante o procedimento experimental, para assegurarmos que a suposição matemática de "escolher ao acaso" seja atendida. 2.3. .~étodos de Enumeração Muito freqüentemente, a maneira pela qual o experimento .é executado determina se os resultados possíveis são igualmente ve- rossímeis ou não. Por exemplo, suponha-se que retiremos um para- fuso de uma caixa que contenha três parafusos de tamanhos diferen- tes. Se simplesmente escolhermos o parafuso estendendo a mão dentro da caixa e apanhando aquele que tocarmos primeiro, é óbvio que o parafuso maior terá maior probabilidade de ser escolhido que os outros dois. No entanto, etiquetando cuidadosamente cada para- fuso com um número, escrevendo o número em um cartão, e esco- Deveremos fazer uma digressão, a esta altura, para aprender- mos como enumerar. Considere-se novamente a forma já vista de P(A), a saber P(A) = r/k, onde k é igual ao número total de maneiras pelas quais 8 pode ocorrer, enquanto r é igual ao número de ma- neiras pelas quais A pode ocorrer. Nos exemplos apresentados até aqui, pequena dificuldade foi ençontrada para calcular r e k. Mas nós precisamos estudar situações apenas um pouco mais complica- das, para percebermos a necessidade de alguns procedimentos siste- máticos de contagem ou enumeração. , . ...', ~Ij~ ~ 30 I PROBABILIDADE Exemplo 2.4. Uma partida de cem peças é composta de 20 peças defeituosas e 80 peças perfeitas. Dez dessas peças são esco- lhidas ao acaso, sem reposição de qualquer peça escolhida antes que a seguinte seja escolhida. Qual é a probabilidade de que exatamente metade das peças escolhidas seja defeituosa? Para analisarmos este problema, consideremos o seguinte espa- ço amostra I S. Cada elemento de S é constituído de dez possíveis peças da partida, (ih i2,. . ., ilo). Quantos resultados desses existem? E dentre esses resultados, quantos têm a característica de que exa- tamente a metade das peças seja defeituosa? Nós, evidentemente, precisamos ter condições de responder a tais questões a fim de resol- vermos o problema em estudo. Muitos problemas semelhantes dão origem a questões análogas. Nas poucas seções seguintes, apresen- taremos algumas técnicas sistemáticas de enumeração. A.. Regra da Multiplicação. Suponha-se que um procedimento designado por 1 possa ser executado de nl maJ~eiras. Admita-se que um segundo procedimento, designado por 2, possa ser executado de n2 maneiras. Suponha-se, também, que cada maneira de executar 1 possa ser seguida por qualquer daquelas para executar 2. Então, o procedimento formado por 1 seguido de 2 poderá ser executado de nl . n2 maneiras. Para indicar a validade deste principio, é mais fácil considerar o seguinte tratamento sistemático. p LI L2 Fig. 2.1 Considerem-seum ponto P e duas retas L1 e L2. Admita-se que o procedimento 1 consista em ir de P até L1,enquanto o procedimento 2 consista em ir de L1 a.té L2. A Fig. 2.1 i.i1dicacomo o resultado final é obtido. C0ment6.rio: Obviamente, esta regra pode ser estencijda a qualquer número de procedimentos. Se existirem k procedimentos e o i-ésimo procedimento puder ser executado de n&maneiras, i = 1, 2, . .., k, entAo o procedimento formado por 1, seguido por 2, ..., seguido pelo procedimento k, poderá ser executado de R11'1:!... Rk maneiras. ESPAÇOS AMOSTRAIS FINITOS I 31 Exemplo 2.5. Uma peça manufaturada deve passar por três estações de controle. Em cada estação, a peça é inspecionada para determinada característica e marcada adequadamente. Na primeira estação, três classificações são possíveis, enquanto nas duas últimas, quatro classificações sij.o possíveis. Conseqüentemente, existem 3 . 4 . 4 = 48 maneiras pelas quais uma peça pode ser marcada. B. Regra da Adição. Suponha-se que um procedimento, de- signado por 1, possa ser realizado de nl maneiras. Admita-se que um segundo procedimento, designado por 2, possa ser realizado de n2 maneiras. Além disso, suponha-se que não seja possível que ambos os procedimentos 1 e 2 sejam realizados em conjunto. Então, o número de maneiras pelas quais poderemos realizar ou 1 ou 2 será nl + n2. Novamente, empregaremos um tratamento esquemático para nos convencermos da validade da regra da adição, como a Fig. 2.2 indica. LI P l.z Fig.2.2 Comentário: Esta regra também pode ser generalizada da seguinte maneira: Se existirem k procedimentos e !) i-ésimo procedimento puder ser realizado de ~ maneiras, i = 1, 2, . . ., k, entAo,o número de maneiras pelas quais poderemos realizar ou o procedimento 1, ou o procedimento 2, ou. .., ou o procedimento k, é dado por nl + n2 + . ., + Rk, supondo-,se que dois quaisquer deles não se pos- sam realizar co,untamente. Exemplo 2.6. Suponha-se que estejamos planejando uma via- gem e devamos escolher entre o transporte por ônibus ou por trem. Se existirem três rodovias e duas ferrovi~, então existirão 3 + 2 = 5 caminhos disponíveis para a viagem. C. Permutações e Arranjo3. (a) Suponha-se que nós temos n objetos diferentes. De quantas maneiras nPn poderemos dispor (per- mutar) esses objetos? Por exemplo, se tivermos os objetos a, b e c, POderemos considerar as seguintes permutações: abc, acb, bac, bca, cab e cba. Portanto, a resposta é 6. Considere-se, em geral, o se- ~ 32 I PROBABILIDADE ESPA-çOS AMOSTRAIS FINITOS I 33 1 2 n escolher r dentre essesn objetos sem considerarmos a grdem. Por exemplo, temós os objetos a, b, c e d, e r = 2; desejamQs contar ab, ac, ad, bc, bd e 00;por outras palavras, não contaremos ab e ba, por- que os mesmos objetos estão incluídos e somente a ordem é diversa. Para obtermos o resultadà geral, recordaremos a fórmula dedu- zida acima: o número de maneiras de escolher r objetos dentre n, e permutar os r escolhidos é n!f(n - r)! Seja C o número de maneiras de escolher r dentre os n, não considerada a ordem. (Isto é, C é o número procurado.) Observe-se que, uma vez que r objetos tenham sido escÓlhidos, existirão r! maneiras de pe.rmutá-Íos. Conseqüen- temente, aplicando-se novamente a regra da multiplicação, junta- mente com esse resultado, obteremos guinte esquema: Permutar os n objetos equivale a colocá-Iosdentro de uma caixa com n compartimentos, em alguma ordenação: O primeiro comparti.mento pode ser ocupado por qualquer uma das n maneiras, o segundo compartimento por qualquer uma das (n - 1) maneiras,..., e o último compartimento apenas por uma maneira. Portanto, aplicando-se a regra da multiplicação, vista acima, verifica-se que a caixa poderá ser carregada de n(n-1) (n- 2) . . . 1 maneiras. Este número aparece tão freqüentemente em Matemática que se adotam um nome e um símbolo especiais para ele. Definição. Sendo n um inteiro positivo, definimosn! = (n)(n- 1) (n- 2) . . . 1 e o denominamos fatorial de n. TS'1lbém definimos O!= 1. n! c ,- ), r. - (n - r . Portanto, o número de maneiras de escolher r dentre n objetos dife- rentes, não se considerando.a ordem, é dado por Dessa maneira, o número de permutações de n objetos diferen- tes é dado por n! C = r!(n- r)! nPn= n! Este número surge em muitas passagens da Matemática e, por isso, um símbolo especial é empregado para ele. Escreveremos (b) Considerem-se novamente n objetos diferentes. Agora de- sejamos' escolher r desses objetos, O::; r ::; n e permutar os r esco- lhidos. Denotaremos o número de maneiras de fazer isso (arranjos) por nA,. Recorremos novamente ao esquema acima, de encher uma caixa de n compartimentos; desta vez simplesmente paramos depois que o compartimento de ordem r tenha sido ocupado. Assim, o pri- meiro compartimento pode ser preenchido de n maneiras, o segundo de (n - 1) maneiras,... e o de ordem r de n - (r - 1) maneiras. Portanto, o procedimento completo poderá ser executado, novamente aplicando-se a regra da multiplicação, de n! r!(n -, r)! =(~) Para nossos objetivos atuais, (~) somente fica definido para n in- teiro positivo e r um inteiro tal que O::; r ::; n. Contudo, pode- remos definir (~) de modo mais geral, para qualquer número real n e para qualquer inteiro não negativo r, na forma seguinte: n(n - 1)(n - 2) . . . (n -r + 1) ( n) = n(n - l)(n - 2) .., (n - r + 1) . r r! nA, = 2 Os números (~) são freqüentemente denominados coeficientesbino- miai8, porque eles aparecem como coeficientesno desenvolvimento da expressio binomial (a + b)ft. Se n for um inteiro positivo, (a + b)n = ==(4 + b) (4 + b) ... (a + b). Quando a multiplicação tiver sido executada,cada termo será formadode k elementosa, e de (n- k) elementbs b, k = °, 1, 2, . . ., n. Quantos termos da forma akbn-k maneiras. Empregando a notação de fatorial, introduzida acima, poderemos escrever D. Combinações. C.onsiderem-se, novamente, n objetos dife- rentes. Agora, trataremos da contagem do número de maneiras de ........-- 34 I PROBABILIDADE existirão? Simplesmente contaremos o número de maneiras possí- veis de escolher k dentre os n elementos a, deixando de lado a ordem. Mas isto é justamente dado por (~). Dai obtermos o que é conhe- cido como o teorema binomial: (a + b)"= t ( n) akb"-k. /e-O k Os números (~)apresentam muitas propriedades interessantes, ape- nas duas das quais meqcionaremos aqui: (A menos que se diga. expressamente de modo diverso, admitiremos que n seja inteiro posi- tivo e r um inteiro, O:::;r :::;nJ (a) (~) = (n ~ r), (b) (;) = (~= n + (n ~ 1) ~ fácil verificar algebricamente as dUM identidades acima. Basta desenvolverem-se, em cada uma, o primeiro e o segundo membros, e verificar que são iguais. Existe, contudo, outra maneira de verificar essas identidades, que emprega a interpretação que demos para (;), a saber, o nú- mero demaneirasdeescolherr dentre n coisas. (a) Quanao escolhemosr dentre n coisas, estamos ao mesmo tempo deixando (n - r) coisas não escolhidas, e, por isso, escolher r dentre n é equivalente a escolher (n - r) dentre n. Ora, iS80 é exa- tamente a primeira identidade a verificar. (b) Vamos fixar um qualquer dos n objetos, por exemplo o pri- meiro, ai. Ao escolher r objetos, ai estará incluído ou estará excluído, mas não ambas as coisas. Portanto, ao contar o número de maneiras de escolher r objetos, poderemos aplicar a Regra da Adição, expli- cada anteriormente. Se ai for excluído, então deveremos escolher os r objetos dese- jados dentre os restantes (n - 1) objetos, e existem (n ~ 1)maneiras de se fazer isso. Se ai for incluído, então somente (r - 1) mais objetos devem slJr escolhidos dentre os restantes (n - 1) objetos e isto pode ser feito de (~= ~) maneiras. Conseqüentemente, o .número procu- rado é a soma desses dois, o que verifica a segunda identidade. ESPAÇOS AMOSTRAIS FINITOS I 35 Comentário: Neste contexto, os coeficientes binomiais ( ~ ) têm sentido somente se n e k forem inteiros não-negativos, com O .;;;k .;;;n. Todavia, se escre- vermos n! n)_- (k - k!(n-k)! n (n - 1) ... (n - k + 1) k! (2.2) observaremos que a última expressão tem sentido se n for quaJquer número real e k for qualquer inteiro não-negativo. Portanto, -3 (-3)(-4)...(-7) ( ) = 5 5! e assim por diante. Empregando esta versão estendida dos coeficientes binomiais, poderemos estabelecer a forma generalizada do teorema binomial: (1+x)n= ~ (n)xk k =0 k Esta série tem significadopara qualquer n real e para todo x tal que Ix I < 1. Observe-seque, se n for um inteiro positivo,a sérieinfinita sereduz aum número finito de termos, porque, neste caso, ( ~ ) = O,sek > n. Exemplo 2.7. (a) Dentre oito pessoas, quantas comissões de três membros podem ser escolhidas? Desde que duas comissões sejam a mesma comissão se forem constituídas pelas mesmas pessoas (não se levando em conta a ordem em que sejam escolhidas), teremos (g) = 56 comissões possíveis. (b) Com oito bandeiras diferentes, quantos sinais feitos com u.&;bandeiras se podem obter? Este problema parece-se muito com o anterior. No entanto, aqui a ordem acarreta diferença e, por isso, obteremos 81/5!= 336 sinais. (c) Um grupo de oito pessoas é formado de cinco homens e três mulheres. Quantas comissões de três pessoas podem ser cons- tituídas, incluindo exatamente dois homens? Aqui deveremos fazer duas coisas: escolher dois homens (dentre cinco) e escolher uma mulher (dentre três). Daí obtermos como número procurado ( ~ ) .( ~ ) = 30 comissões. (d) Agora poderemos verificar uma afirmação feita anterior- mente, a saber, a de que o número de subconjuntos (ou partes) de ~ 36 / PROBABILIDADE ESPAÇOS AMOSTRAIS FINITOS / 37 um conjunto constituído de n elementos é igual a 2" (contados o conjunto vazio e o pr6prio conjunto). Simplesmente associemos a cada elemento o valor um ou zero, conforme esse elemento deva ser incluído ou excluído do subconjunto. Existem duas maneiras de rotular cada elemento e existem ao todo n desses elementos. Dai a regra da multiplicação nos dizer que existem 2 . 2 . 2 . . . 2 = 2" rotulações possíveis. Mas cada rotulação particular representa uma escolha de um subconjunto. Por exemplo, (I, I, O,O,O, . . ., O) constituiria. o subconjunto formado exatamente por aI e a2. Ainda, (I, 1, , 1) representaria o pr6prio S, e (O,O, ..., O) representaria o conjunto vazio. (e) Poderíamos obter o resultado acima, pelo emprego da Regra da Adição, na forma seguinte: Para obter subconjuntos, deveremos escolher o conjunto vazio, aqueles subconjuntos constituídos exata- mente por um elemento, aqueles constituídos exatamente por dois elementos, . . ., e o pr6prio conjunto constituído por todos os n ele- mentos. Isto seria feito de então, a probabilidade de que as n peças escolhidas sejam exatamente 81 da classe A e (n - 8J da classe B será dada por (:~)(n ~28) (~) (A expresSão acima se denomina probabilidade hipergeométrica,e será ainda reencontrada.) (~)+(~)+(~) + ... + (:) Comentário: f': muitO importante especificar, quando Calarmos de peças extraídas ao acaso, se a e!iI:olha é com ou sem r'-'P08içi!.o.Na maioria dos casos concretQ8, pretenderemos a I1ltima. Por exemplo, quando inspecionamos certo m1mero de peças manuCaturadas a Cim de descobrirmos quantas deCeituosas po. derio existir, geralmente nio tencionaremos examinar a mesma peça duas vezes. Já dissemos que o nl1merode maneiras de escolher r coisas dentre n, nio considerada a ordem, é dado por (~). O nl1mero de maneiras de escolher r coisas dentre n, com reposiçf.o, é dado por nr. Neste caso, estarem08 interessados na ordem em que as peças sejam escolhidas. maneiras. Ora, a soma desses coeficientes binomiais ê exatamente o desenvolvimento de (1 + 1)" = 2". Voltemos agora ao Ex. 2.4. De uma partida formada por 20 peças defeituosas e 80 peças perfeitas, escolhemos ao acaso 10 (sem reposição). O número de maneiras de fazer isso ê e~). Daí, a probabilidade de achar exatamente 5 peças defeituosas e 5 perfeitas entre as 10 escolhidas ser dada por Exemplo 2.9. Admitamos que se escolham ao acaso dois objetos, dentre os quatro denominados a, b, c e d. (a) Se escolhermos sem reposição, o espaço amostral S poderá ser representado da forma abaixo: (~)(~) e~) S= {(a,b); (a,c); (b,c); (b,d); (c,d); (a,d)}. Existem(~)= 6 resultados possíveis. Cada um desses resultados indica somente quais os dois objetos que foram escolhidose nâQa or- dem em que eles foram escolhidos. (b) Se escolhermos com reposição, o espaço amostra! S' poderá ser representado por: Exemplo 2.8. Vamos generalizar o problema acima. Admi- tamos que temos N peças. Se escolhermosao acaso n delas, sem repo- sição, teremos (~) diferentes amostras possíveis, todas elas com 11 mesma probabilidade de serem escolhidas. Se as N peças forem formadas por rI da classe A e r2 da classe B (com rI + r2 = N), { (a, a); (a, b); (a, c); (a, d); (b, a); (b, b); (b, c); (b, d);} w= . (c,a); (c,b);(c,c,);(c,d); (d, a); (d, b);(d,c);(d, d) Existem 42 = 16 resultados possíveis. Aqui, cada um desses resul- tados indica quais objetos foram escolhidos e a ordem em que eles o foram. Escolher ao acaso implica que, se escolhermos sem repo- siÇão,todos os resultados em S serão igualmente verossímeis,enquanto se escolhermos com reposição, então todos os resultados em S' serão igualmente verossímeis. Portanto, se A for o evento {o objeto c é Por meio de logaritmos de fatoriais (os quais se acham tabulados), a expressão acima pode ser avaliada como igual 11.0,021. .........- 38 / PROBABILIDADE escolhido I, então teremos: de D, P(A) = 3/6 = 1/2 se escolhennos sem reposição; e de S', P(A) = 7/16 se escolhennos com reposição. E. Permutw;õescom Alguns Elementos Repetidos. Em todas as técnicas de enumeração já apresentadas, admitimos que todos os objetos considerados fossem diferentes (isto é, distinguíveis). No entanto, não é sempre essa a situação que ocorre. Suponha-se, a seguir, que temos n objetos, tais que nl sejam de uma primeira espécie, n2 de uma segunda espécie,. . ., nk de uma. k-ésima espécie, com nl + n2 + ... + nk = n. Nesse caso, o nú- mero de pennutações possíveis desses n objetos é dado por n! nl!n2!.. .nk! y Deixa-se ao leitor a dedução dessa fónnula. Note-se que, se todos os objetos fossem diferentes, teríamos nt = 1, i = 1,2, . . ., k, e, conseqüentemente, a fórmula acima se reduziria a n!, que é o resul- tado obtido anterionnente. '1. Comentário: Devemos salientar mais uma vez que a atribuição realística de probabilidades a resultados individuais de um espaço amostral (ou a uma coleção de resultados, isto é, um evento) constitui alguma coisa que não pode ser deduzida matematicamente, mas que deve ser originada de outras considerações. Por exem- plo, poderemos recorrer a determinados traços simétricos do experimento para averiguar se todos os resultados são igualmente prováveis. Além disso, poderemos construir um procedimento de amostragem (por exemplo, escolliendo um ou vários indivíduos de uma população especificada) de tal maneira que seja razoável admitir que todas as escollias sejam igualmente prováveis. Em muitos outros casos, quando nenhuma suposição básica natural seja apropriada, deveremos recorrer à aproximação da freqüência relativa. Nós repetiremos o experimento n vezes e, em seguida, calcularemos a proporção de vezes em que o resultado (ou evento) em es- tudo tenha ocorrido. Ao empregar isto como uma aproximação, sabemos que é bastante improvável que esta freqüência relativa difira da "verdadeira" probabili- dade (cuja existência tenha sido especificada por nosso modelp teórico), de um valor apreciável, se n for suficientemente grande. Ql!ando for impossível estabe- lecer suposições razoáveis sobre a probabilidade de um resultado e também impossível repetir o experimento um grande número de vezes (em virtude de considerações de custo ou de tempo, por exemplo), será realmente bastante sem sentido prosseguir com um estudo probabilístico do experimento, exceto em uma base puramente teórica. (para um comentário adicional sobre este mesmo ponto, veja a Seção 13.5). Problemas 2.1. o seguinte grupo de pessoasestá numa sala: 5 homens maioresde 21 anos; 4 homenscommenos de 21 anos de idade; 6 mulheresmaioresde 21 anOS,e ESPAÇOS AMOSTRAIS FINITOS / 39 3 mulheres menores. Uma pessoa é escolhida ao acaso. Definem-se os seguint.es eventos: A -(a pessoa é maior de 21 anos/; B = Ia pessoa f! menor de 21 anosl; C - Ia pessoa é homem); D = Ia pessoa é mulherl. Calcule: (o) P(B U D), (b) P(A n C). 2.2. Em uma sala, 10 pessoas estão usando emblemas numerados de 1 até 10. Três pessoas sio escolhidas ao acaso e convidadas a sa(rem da sala simultunea- mente. O nlimero de seu emblema é anotado. (o) Qual é a probabilidade de que o menor illimero de emblema seja 5? (b) Qual é a probabilidade de que o maior nlimero de emblema seja 5? 2.3. (o) Suponha que os três d(gitos 1, 2 e 3 sejam escritos em ordem alea- tória. Qual a probabilidade'de que ao menos um d(gito ocupe seu lugar próprio? (b) O mesmo que em (o), com os dígitos 1, 2, 3 e 4. (c) O mesmo que em (a), com os d(gitos 1, 2, 3, ..., n. Sugestão: Empregue 0.7). (d) Examine a resposta a (c), quando n for grande. 2.4. perfeitas. ficadas. (a) Qual a probabilidade de que sejam encontradas exatamente 90 peça.~ defeituosas ? (b) Qual a probabilidade de que se encontrem ao menos 2 peças defeituosa.~? 2.5. Dez fieha.~numeradas de 1 até 10 são misturadas em uma Urna. Dua.~ fichas, numeradaS (X, Y), são extra(das da urna, suce&;ivamente e sem reposição. Qual é a probabilidade de que seja X + Y = 1O? 2.6. Um lote é formado de 10 artigos bons, 4 com defeitos menores e 2 com defeitos graves. Um artIgo é escolhido ao acaso. Ache a probabilidade de que: (a) Ele não tenha defeitos. (b) Ele não tenha defeitos graves. (c) Ele ou seja perfeito ou tenha defeitos graves. Uma remessa de 1.500 arruelas contém 400 peças defeituosas e 1.100 Duzentas arruelas são escolhidas ao ac.aso (sem reposição) e cIassi- 2.7. Se do lote de artigos descrito no Probl. 2.6, dois artigos forem escolhi- dos (sem reposição), ache a probabilidade de que: c.a) Ambos sejam perfeitos. (b) Ambos tenham defeitos graves. (c) Ao menos um seja perfeito. (d) No máximo um seja perfeito. (e) Exatamente um seja perfeito. (J) Nenhum deles tenha defeitos graves. (g) Nenhum deles seja perfeito. 2.8. Um produto 'é montado em três estágios. No primeiro estágio, exis- tem 5 linhas de montagem; no segundo estágio, existem 4 linhas de montagem e no terceiro estágio, existem 6 linhas de montagem. De quantas maneiras dife- rentes poderá o produto se deslocar durante o processo de montagem? 2.9. Um inspetor visita 6 máquinas diferentes durante um dia. A fim de evitar que os operários saibam quando ele os irá inspecionar, o inspetor varia a ordenação de suas visitas, De quantas maneiras isto poderá ser feito? ---- 40 / PROBABILIDADE ESPAÇOS AMOSTRAIS FINITOS / 41 2.10. Um mecanismo complexo pode falhar em 15 estágios. De qualitas maneiras poderá ocorrer que ele falhe em 3 estágios? 2.11. Existem 12 categorias de defeitos menores de uma peça manufatu- rada, e 10 tipos de defeitos graves. De quantas maneiras poderio ocorrer 1 de- feito menor e 1 grave? E 2 defeitos menores e 2 graves? 2.21. Um lote contém n peças, das quais se sabe serem r defeituosas. Se a ordem da inspeção das peças se fizer ao acaso, qual a probabilidade de que a peça inspecionada em k-ésimo lugar (k ~ r) seja a última peça defeituosa contida no lote? 2.12. Um mecanismo pode ser posto em uma dentre quatro posições: a, b, c 11li. Existem 8 desses mecanismos incltúdos em um sistema. (o) De quantas maneiras esse sistema pode ser disposto? (b) Admita que esses mecanismos sejam instalados em determinada ordem (linear) preestabelecida. De quantas maneiras o sistema poderá ser disposto, se dois mecanismos adjacentes não estiverém em igual posição? (c) Quantas maneiras de dispor serli.opossíveis, se somente as posições (Je b forem usadas, e o forem com igual freqüência? (d) Quantas maneiras serli.o possíveis, se somente duas posições forem usa.- das, e dessas posições uma ocorrer três vezes mais freqüentemente que a outra? 2.22. Dentre os números O, 1, 2, . . . , 9 são escolhidos ao acaso (sem repo- sição) r números (O < r < 10). Qual é a probabilidade de que não ocorram dois númerosiguais? 2.13. Suponha que de N objetos, n sejam escolhidos ao acaso, com reposição. Qual será a probabilidade de que nenhum objeto seja escolhido mais do que uma vez? (Admita n < N.) 2.14. Com as seis letras a, b, c, d, t, j quantas palavras-código de 4 letras poderio ser formadas se: (a) Nenhuma let~a puder ser repetida? (b) Qualquer letra puder ser repetida qualquer número de vezes? 2.15. Supondo que (951))= a e (~) = b, expresse (19~) emtermos de o e b. (Suge&l4ô: Nao calcule as expressões acima, para resolver o problema:) 2.16. Uma caixa contém etiquetas numeradas 1, 2, ..., n. Duas etique- tas si!.oescolhidas ao acaso. Determine a probabilidade de que os números das etiquetas sejam inteiros consecutivos se: (a) As etiquetas forem escolhidas sem reposiçli.o. (b) As etiquetas forem escolhidas com reposição. 2.17. Quantos subconjuntos se podem formar, contendo ao menos um ele- mento, de um conjunto de 100 elementos? 2.18. Um inteiro é escolhidoao acaso,dentre os números1, 2,. . ., 50. Qual será a probabilidadede que o númeroescolhidoseja divisívelpor 6 ou por 8? 2.19. Dentre 6 números positivos e 8 negativos, escolhem-se ao acaso 4 números (sem reposição) e multiplicam-se esses números. Qual será a probabili- dade de que o produto séja um número positivo? 2.20. Determinado composto químico é obtido pela mistura de 5 líquidos diferente~. Propõe-se despejar um líquido em um tanque e, em seguida, juntar o~ outros líquidos sucessiv~mente. Todas as seqüências possíveis devem ser ensaiadas, para verificar-se qual delas dará o melhor resultado. Quantos ensaios deverão ser efetuados? ~ PROBABILIDADE CONDICIONADA EtND'EPENDÊNCIA J .43 fazê-Io em relação ao espaço amostral original S. Consideremos o Diagrama de Venn da Fig. 3.1. Quando calcularmos P(B) estaremos nos perguntando quão provável será estar- mos em B, sabendo que devemos estar em S. E quando calcularmos P(B IA) esta- remos perguntando quão provável será es- tarmos em B, sabendo que devemos estar em A. (Isto é, o espaço amostral ficou reduzidode S para A.) Logo, daremos uma definição rigorosa de P(B IA). Por enquan- to, contudo, empregaremos nossa noção intuitiva de probabilidade condicionada e daremos um exemplo. Exemplo 3.1. Dois dados equilibrados são lançados, regis- trando-se o result~do como (Xl, X2),onde Xi é o resultado do i-ésimo dado, i = 1,2. Por isso, o espaço amostral S pode ser represen- tado pela seguinte lista de 36 resultados igualmente prováveis. Probabilidade Condicionada e Independência A B GD Fig.3.1 Capítulo 3 3.1. Probabi Iidade Co,nd,icionada 'Vamos reexaminar a diferença entre extrair uma peça de um lote, ao acaso, com ou sem reposição. No Ex. 2.4, o lote estudado tinha a seguinte composição: 80 não-defeituosas e 20 defeituosas. Suponha-se que escolhemos duas peças desse lote: (a) com reposi- ção; (b) sem reposição. Definamos os dois eventos seguintes: A = Ia primeira peça é defeituosa}; B = Ia segunda peça é defeituosa} . Se estivermos extraindo com reposição, P(A) = P(B) = 20/100 = = 1/5, porque cada vez que extrairmos do lote, existirão 20 peças defeituosas no total de 100. No entanto, se estivermos extraindo sem reposição, os resultados não seI'ãQtão imediatos. É ainda ver- dade, naturalmente, que P(A) = 1/5. Mas e sobre P(B)? É evi- dente que, a fim de calcularmos P(B), deveremos conhecer a compo- sição do lote no momento de se extrair a segundapeça. Isto é, deve- remos saber se A ocorreu ou não. Este exemplomostra a necessidade de se introduzir o seguinte importante conceito. Sejam A e B dois eventos associados ao experimento S. De- notaremos por P(B IA) a probabilidade condicionada do evento B, quando A tiver ocorrido. No exemplo acima, P(B IA) = 19/99, porque se A tiver ocorrido, então para a segunda extração restarão somente 99 peças, das quais 19 delàs serão defeituosas. Sempre que calcularmos P(B IA), estaremos essencialmente cal- culandoP(B) em relaçãoao espaço.amostralreduzidoA, em lugar de { (I, 1) S = (2,/) (6, 1) s (1,2) (2,2) (1, 6) ) (2,6) ~ (6, 6) f (6,2) Consideremos os dois eventos seguintes: A = {(Xl, X2) IXI + X2 = 10}, B = {(Xl>x2)lxl > X2}. Assim, A = {(5,5), (4,6), {6,4J}e B = {(2,1), (3, 1),(3,2), . . ., (6,5)}. 3 ~ 15 1 Portanto, P(A) = 36 e P(l$) = 36' E P(BIA) = "3' uma vez que o espaço amostral é, agora, formado por A (isto é,três resultados), e somente um desses três resultados é coerente com o evento B. De modo semelhante, poderemos calcular P(A IB) = 1/15. Finalmente, vamos calcular P(A () B)., O evento A n B ocorre se, e somente se, a soma dos dois dados for 10 e se o primeiro dado tiver apresentado um valor maior que o segundo dado. Existe ape- nasum desses resultados e, por isso, P(A () B) = 1/36. Se fizermos um exame cuidadoso dos vários números já calculados, concluiremos que P(A IB) = P(A () B) P(B) e P(BIA) = P(A () B) P(A) . --- 44 I PROBABILIDADE PROBABILIDADE CONDICIONADA E INDEPENDÊNCIA I 45 Essas relações não surgiram apenas do particular exemplo que consideramos. Ao contrário, elas são bastante gerais, e nos dão um caminho p8:ra definir rigorosamente a probabilidade condicionada. Para sugerir essa definição, voltemos ao conceit'J de freqüência relativa. Admitamos que um experimento g tenha sido. repetido n vezes. Sejam nA, nB e nAnBo número de vezes que, respectiva- mente, os eventos A, B e A n B tenham ocorrido em n repetições. Qual o significado de nAnB/nA? Representa a freqüência relativa de B naqueles resultados em que A tenha ocorrido. Isto é, nAnB/nA é a freqüêncja relativa de B, condicionada a que A tenha ocorrido. Poderemos escrever nAnB/nA,da seguinte forma: 1UnB nAnB/n f AnB -- --, nA - nA/n - f A evento B, como indicaram os exemplos precedentes. Dentro em breve, estudare- mOSum caso especial importante, para o quaIP(B) e P(B I A) serão iguais. (e) Observe-1>eque a probabilidade condicionada está definida em termos da medida de probabilidade não. condicionada P, isto é, se conhecermos P(B) para todo B c S, poderemos calcular P(B I A) para todo B c S. onde fAnB e fA são as freqüências relativas dos eventos A n B e A, respectivamente. Como já dissemos (e explicaremos mais tarde) se n, o número de repetições for grande, f AnBserá próxima de P(A n B) e f A será próxima de P(A). Conseqüentemente, a relação acima sugere que nAnB/nA será próxima de P(B IA). Por isso, estabelece- remos a seguinte definição: Definição: Deste modo, temos duas maneiras de calcular a probabilidade condicionada P(B IA): (a) Diretamente, pela consideração da probabilidade de B em relação ao espaço amostral reduzido A. (b) Empregando a definição acima, onde P(A n B) e P(A) são calculados em relação ao espaço amostral original S. Commtário:SeA = S, obteremosP(BIS)= P(B n S)/P(S)= P(B), porque P(S)= 1 e B n S = B. Isto é como seria de se esperar, porque dizer que S ocorreu é apenas dizer que o experimento foi realizado. Ê) Tab. 3.1 I MJ l! N- P(A n B) P(B IA) = nl A\ , desde que P(A) > O. (3.1) Comentários: (a) t:': importante compreender que isso nAo é um teoremá (nós não demonstramos coisa alguma), nem é um axioma. Apenas introduzimos a noção intuitiva de probabilidade condicionada e, depoi.'!, estabelecemos uma definição -formal daquilo que essa noção significa. O fato de que nossa definição formal corresponde à.nOSsa noção intuitiva é fundamentado- pelo parágrafo. que precede à definição. . (b) t:':assunto simples verificar que P(BIA) para A fixado, satisfaz aos vários postulados de probabilidade das Eq. (1.3). (VerProbl. 3.22.) Isto éj temos (1') O~ P(B IA) ~ 1, (2') P(S IA) = 1, (3') P(Bi U BtIA) = P(BdA) + P(B2IA) se Bi n B2= *', (3.2) (4') P(Bi U B2 U .. 'IA) = P(BiIA) + P(B211l) + ... se B, n B; = *' para i 'J4j. Exemplo 3.2. Suponha-se que um escrit6rio possua 100 má- quinas de calcular. Algumas dessas máquinas são elétricas (E), enquanto outras são manuais (M); e algumas são novas (N), enquanto outras são muito usadas (U). A Tab. 3.1 dá o número de máquinas de cada categoria. Uma pessoa entra no escrit6rio, pega uma má- quina ao acaso, e descobre que é nova. Qual será a probabilidade de que seja elétrica? Em termos da notação introduzida, desejamos calcular P(E IN). Considerando-se somente o espaço amostral reduzido é, as 70 máquinas novas), temos P(EjN) = 40/70 = 4/7. gandoa definiçãode probabilidadecondicionada,temosque N (isto Empre- P(EIN) = P(E nN) = 40/100 - 4 - P(N} 70/100 -"7' (c) SeA = S,P(B I S) =P(B n S) I P(S) =P(B). (d) A cada evento B c S poderemosassociardois números, P(B), a proba- bilidade (não-condicionada) de B, e P(B I A), a probabilidade condicionada de B, desdeque algum eventoA (para o qual P(A) > O) tenha ocorrido. Em geral, essas duas medidas de probabilidade atribuirão probabilidades diferentes ao A mais importante conseqüência da definição de probabilidane condicionada acima, é obtida ao se escrever: P(A n B) = P(BIA)P(A) ou, equivalentemente, ~ - 40 30 70 20 10 30 60 40 46 I PROBABILIDADE PROBABILIDADE CONDICIONADA E INDEPENDÊNCIA I 47 P(A n B)=P(A I B)P(B) (3.3.a) Isto é, algumas vezes, mencionado como o teoremada multiplicação de probabilidades. Podemos aplicar esse teorema para calcular a probabilidade da ocorrência conjunta dos eventos A e B. (b) P(A IB) = P(A fi B)jP(B) = [P(A)jP(B)] ~ P(A), já que O~ P(B) ~ 1. (c) P(A IB) = P(A fi B)jP(B) = P(B)!P(B) = 1 ~ P(A). (d) Neste caso nada poderemos afirmar sobre a grandeza rela- tiva de P(A IB) e P(A). Observe-se que em dois dos casos acima, P(A) 5. P(A IB); em um caso, P(A) ~ P(A IB); e no quarto caso, não podemos fazer qual- quer comparação. Até aqui, empregamos o conceito de probabilidade condicionada a fim de avaliar a probabilidade de ocorrência conjunta de dois even- tos. Poderemos aplicar esse conceito em outra maneira rle calcular a probabilidade de um evento simples A. Necessitaremos da se- guinte definição: Exemplo 3.3. Consideremos novamente o lote formado de 20 peças defeituosas e 80 não-defeituosas, estudado no intcio da Seç. 3.1. Se escolhermos ao acaso duas peças, sem reposição, qual será a pro- babilidade de que ambas as peças sejam defeituosas? Como anteriormente, definamos os eventos A e B, na seguinte forma. A = Ia primeira peça é defeituosa I; B = Ia segunda peça é defeituosaI. Conseqüentemente, pediremos P(A fi B), que poderemos cal- cular, de acordo com a f6rmc~laacima, como P(B IA) P(A). :\Ias, P(B IA) = 19/99, enquanto P(A) = 1/5. Portanto, P(.4 fi B) = = 19j495. Definição. Dizemos que os eventos B1I Bt,. . ., BIr:representam uma partiçãodo espaço amostral S, quando (a) Bi fi Bj = 0, para todo i ~ i. Ir: (c) P(Bi) > O para todo i. Explicando: Quando o experimento &é realizado um, e somente um, dos ('ventos Ri ocorre. (Por exemplo:na jogada de um dado, BI= /1,21,B2= /3,4,51 e B3= {6} representariam uma particão do espaço amostral, enquanto CI = 11, 2, 3, 41 e C2 = 14, 5, 61 não o representariam.) Consideremos A um evento qual- quer referente a S, e BI, B2"", BIr:uma partição de S. O Diagrama de Venn na Fig. 3.3 ilustra isso para k = 8. Portanto, poderemos escrever Comentdrio: O teorema da multiplicação de probabilidades (3.3.a) pode ser generalizado para mais de dois eventos, da seguinte maneira: (b) U Bi = S. i-I PIA, ri A 2 ri ...ri An] = =P(A,)P(A, IA,)P(A3 IA.,A2)...P(An IA.,...An-l)' (3.3.b) s cQ)T~lf(]5l 60 (d) Nenhum desses casos (a)AnB~O (b) A:; B (c) B c A Fig.3.2 Fig.3.3 Examinemos agora, rapidamente, se poderemos fazer uma afir- mação geral sobre a grandeza relativa de P(A IB) e P(A). Consi- deraremos quatro casos, que estão ilustrados pelos Diagramas de Venn, na Fig. 3.2. Teremos: (a) P(A IB) = O ~ P(A), porque A não poderá ocorrer se B tiver ocorrido. A = A fi BI U A () B2 U '" U A fi BIr:. Naturalmente, alguns dos conjuntos A fi Bj poderão ser vazios, ma.'! isso não invalida essa decomposição de A. O ponto importante é qUe todos os eventos A () BI,..., A () BIr:são dois a dois mutua- Inente excludentes. Por isso, poderemos aplicar a propriedade da ----- 48 I PROBABILIDADE PROBABILIDADE CONDICIONADA E INDEPENDÊNCIA I 49 P(A) = P(.1 n BI) + P(A n B1) +...+ P(A n Bk). Pede-se P(A), e empregando-se o resultado acima, poderemos escrever: adição de eventos mutuamente excIudentes [Eq. (1.3)], e escrever Este resultado representa uma relação extremamente útil, porque freqüentemeqte, quando P(A) é pedida, pode ser dificil calculá-Ia diretamente. No entanto, com a informação adicional de que B; tenha ocorrido, seremos capazes de calcular P(.1 IBj) e, em seguida, empregar a fórmula acima. Exemplo 3.4. Consideremos (pela última vez) o lote de 20 peças defeituosas e 80 não-defeituosas, do qúal extrairemos duas peças, sem reposição. Novamente definindo-se A e B como iguais a A = Ia primeira peça extraída é defeituosa}, B = Ia segunda peça extraída é defeituosaI, poderemos,agora,calcularP(B), assim: P(.1) = P(.1 IBI)P(BI~ + P(A IB2)P(B,) + P(A IBa)P(Ba). Ora, P(BI)= 1/2, enquanto P(B2)= P(B3)= 1/4. Também, P(.1 IBI) = ==P(A IB2) = 0,02, enquanto P(A IBa) = 0,04. Levando-se esses va- lores à expressão acima, encontraremos P(.1) = 0,025. Comentário: A seguinte analogia com o teorema da probabilidade total é observada em Química: Suponha-se que temos k frascos contendo diferentes soluções de um mesmo sal totalizando, digamos, um litro. Seja P(Bi) o volume do i-ésimo frasco e seja P(A IBi) a concentração da solução no i-ésimo frasco. Se reunirmos todas as soluções em um só frasco e se P(A) denotar a concentração da solução resultante, teremos: Contudo, c'ada termo P(.1 n BJ pode ser expressona forma P(A IB;). .P(Bj) c, daí, obteremos o que se denomina o teorema da pl"Obabili- dade lolal: P(.1) = P(.1IBI)P(BI') + P(AIB2)P(B,)+.. .+P(AIBk)P(Bk). (3.4) P(A) = P(A IBI)P(BI) + "'. + PIA IBk)P(Bk). 3.2. Teorema de Bayes P(B) = P(BIA)P(.1) + P(BIA)P(A). Poderemos empregar o Ex. 3.5 para sugerir outro importante resultado. Suponha-se que uma peça seja retirada do depósito e se verifique ser ela defeituosa. Qual é a probabilidade de que tenha sido produzida na fábrica I? Empregando a notação já introduzida, pede-se P(Bi! A). Pode- remos calcular esta probabilidade como uma conseqüência da seguinte exposição: Seja BI, B2,. . ., Bk uma partição do espaço amostral S e seja A um evento associado a S. Aplicando-se a definição de pro- babilidade condicionada, poderemos escrever Empregando alguns dos .cálculos realizados no Ex. 3.3, encontramos que 19 1 20 4 1 P(B) = - . - + - . - = - 9959955 Este resultado pode ser um tanto surpreendente, especialmente se o leitor se recordar de que no início da Seç. 3.1 encontramos que P(B) = 1/5, quando extraímos as peças com reposição. . Exemplo 3.5. Uma determinada peça é manufaturada por três fábricas, digamos 1, 2 e 3. Sabe-se que 1 produz o dobro de peças que 2, e 2 e 3 produziram o mesmo número de peças (durante um periodo de produção especificado). Sabe-se também que 2 por cento das peças produzidas por 1 e por 2 são defeituosas, enquanto 4 por cento daquelas produzidas por 3 são defeituosas. Todas as peças produzidas são colocadas em um depósito, e depois uma peça é ex- traída ao acaso. Qual é a probabilidade de que essa peça seja de- feituosa? Vamos introduzir os seguintes eventos: A = Ia peça é defei- tuosa}, BI = Ia peça provém de 11, B2 = Ia peça provém de 2}, Ba = Ia peça provém de 3}. P(.1 IBi)P(Bi) P(BdA) = 2:::7=1P(.1IBJ)P(Bj) t. = 1,2,..., k. {3.5) Este resultado é conhecido como Teorema de Bayes. É também denominado fórmula da probabilidade das "causas" (ou dos "antece- dentes"). Desde que os Bi constituam uma partição do espaço amos- traI um, e somente um, dos eventos Bi ocorrerá. (Isto é, um dos eventos Bi deverá ocorrer e somenle um poderd ocorrer.) Portanto, a expressão acima nos dá a probabilidade de um particular Bi (isto é, uma "causa"), dado que o evento A lenha ocorrido. A fim de aplicar esse teorema, deveremos conhecer os valores dasP(Bi). Muito freqüentemente, esses valores são desconhecidos, e isso limita a apli- eabilidade do teorema. Tem havido considerável controvérsia sobre o Teorema de Bayes; ele é perfeitamente correto matemati- camente; somente a escolha imprópria dos P(Bi) pode tornar o resul- tado discutível. ~ 50 I PROBABILIDADE PROBABILIDADE CONDICIONADA E INDEPENDÊNCIA I 51 Voltando ao problema proposto acima, e agora aplicando a Eq. (3.5), obtemos: Façamos alguns cálculos: P(B1IA) == (0,02)(1/2) . .-'-'" /__.''-1., ==0,40. P(A) ==0,6;P(B) ==0,4;P(Sd IA) ==0,7; P(Sa IA) ==0,3;P(Sd IB) ==0,3;P(Sa IB) ==0,7. Desejamos realmente saber: Comentdrio: De novo, podemos encontrar para o Teorema de Bayes, uma analogia da Química. Em k frascos, temos soluções do mesmo sal, porém de concentrações diferentes. Admita-se que o volume total das soluções seja um litro. Denotando por P(Bi) o volume da solução do i-ésimo frasco, e a concentra' ção do sal nesse i-ésimo frasco por P(A IBi)' verificaremos que a Eq. (3.5) fornece a proporção da quantidade total do sal que é encontrada no i-ésimo frasco. P(A ISd), P(A ISa), P(BISd) e P(BISa). Suponha-se que realmente retiremos um bombom de sabor doce. Qual decisão seríamos mais tentados a tomar? Vamos comparar o seguinte exemplo do Teorema de Bayes nos daráuma oportuni- dade para introduzir a idéia do diagramo de árvore, um esquemabas- tante útil para analisar determinados problemas. Suponha-se que um grande número de caixas de bombons sejam compostas de dois tipos, A e B. O tipo A contém 70 por cento de bombons doces e 30 por cento de bombons amargos, enquanto no ti- po B essaspercentagens de sabor são inversas. Além disso, suponha-se que 60 por cento de todas as caixas de bombons sejam do tipo A, en- quanto asrestantessejam do tipo B. Você agora se defronta com o seguinte problema de decisão: uma caixa do tipo desconhecido lhe é oferecida. Você terá permissão para tirar uma amostra de bombom (uma situação reconhecidamente irrea- lística, mas que nos permitirá introduzir idéias importantes, sem ficar muito complicado), e com esta informação você deve decidir se adivi- nha que a caixa que lhe foi oferecida é do tipo A ou se do tipo B. O seguinte "diagrama de árvore" (assim denominado por causa dos vários passos ou ramos que aparecem) nos ajudará a analisar o p~óblema.(Sd e Sa correspondem,respectivamente,a escolherum bombomde sabor doce ou um bombom de sabor amargo.) P(A ISd) e P(BISd)' Empregando a fórmula de Bayes, teremos , P(Sd IA)P(A) - P(A ISd) == P(Sd IA)P(A) + P(Sd IB)P(B) (0,7)(0,6) - 7 (0,7)(0,6) + (0,3)(0,4) -9' Cálculo semelhante dará P(BISd) ==2/9. Sa Dessa maneira, baseados na evidência que tivemos (isto é, a tirada de um bombom de sabor doce) é 2 ~ vezes mais provável que nós este- . 2 Jamosdiante de uma caixa do tipo A, em vez de uma do tipo B. Con- seqüentemente, poderíamos presumivelmente decidir que uma caixa do tipo A foi apresentada. (Naturalmente, nós poderíamos estar errados. A Sugestão desta análise é que estaremos escolhendo aquela alternativa que pareça a mais provável, com base na evidência limitada que ti- vermos.) Em termos do diagrama da árvore, o que era realmente necessário (e foi feito) era uma análise para o passado. Assim, dado o que foi observado Sd, neste caso qual a probabilidade de que o tipo A seja o envolvido? . Uma situação mais interessante surge, se nos for permitido tirar ~OIS bombons antes de decidir se se trata do tipo A ou do tipo B. este caso,o diagramade árvore aparece assim: Sd Sa Sd r-- 52 I PROBABILIDADE PROBABILIDADE CONDICIONADA E INDEPENDÊNCIA I 53 Sd' Sa ou Sa' Sd tados igualmente prováveis, considerados no Ex. 3.1, encontraremos que P(A) = 18/36 = 1/2, P(B) = 12/36 = 1/3, enquanto P(A n B) = = 6/36= 1/6. Conseqüentemente, P(A IB) = P(A n B) / P(B) = ==(1/6)/(1/3)= 1/2. Sd,Sd Sa,Sa Sd' Sa ou Sa' Sd Deste modo encontramos, como seria de se esperar, que a proba- bilidade absoluta (ou não condicionada) é igual à probabilidade COIt- dicionada P(A IB). Semelhantemente, p(BnA) (t) 1 P(BIA) =. P(A) = U-) = 3 = P(B). Sd,Sd Sa,Sa DaI, poderíamos ser tentados a dizer que A e B serão indepen- dentes se, e somente se, P(A IB) = P(A) e P(B IA) = P(B). Muito embora isso'pudesse ser essencialmente apropriado, existe outra forma de colocar a questão que contorna a dificuldade encontrada aqui, a saber, que tanto P(A) como P(B) devem ser não-nulos para que as igualdades acima tenham significado. Consideremos P(A n B), supondo que as probabilidades condi- cionadas sejam iguais às correspondentes probabilidades absolutas. Teremos: No problema 3.26, você será chamado a decidir de qual dos dois ti- pos, A ou B, você tirou a amostra, na dependência de qual seja obser- vado dentre três resultados experimentais possíveis. 3.3. Eventos Independentes Ja consideramos -eventos A e B que não podem ocorrer conjun- tamente, isto é, A n B = 0. Tais eventos Rãodenominados mutua- mente excludentes, ou eventos incompatíveis. Observamos anterior- mente que se A e B forem mutuamente excludentes, então P(A IB) = °, porque a ocorrência dada de B impede a ocorrência de A. No outro extremo, temos a 'situação já estudada, na qual R :> A e, conse- qüentemente, P(R IA) = 1. Em cada uma das situações mencionadas, saber que R já ocorreu nos dá alguma informação bastante definida referente. à probabili- dade de ocorrência de A. Existem, porém, muitas situações nas quais saber que algum evento R ocorreu não tem qualquer interesse quanto à ocorrência ou não ocorrência de A. Exemplo 3.6. Suponhamos que um dado equilibrado seja jogado duas vezes. Definamos os eventos A e R, da seguinte forma: A = 10 primeiro dado mostra um número par}, R = 10 segundo dado mostra um 5 ou um 6}. P(A n R) = P(A IB)P(R) = P(A)P(R), P(A n B) = P(B IA)P(A) = P(R)P(A). Desse modo, desde que nem P(A) nem P(R) sejam iguais a zero, veri- ficamos que as probabilidades absolutas serão iguais às probabili- dades cond,icionadasse, e somente se, P(A n R) = P(A) P(R). Em conseqüência, formulamos a seguinte definição, a qual será também válida quer P(A) ou P(B) seja nulo: Definição: A e R serão eventosindependentesse, e somente se, P(A n B) = P(A)P(R). (3.6) ~ intuitivamente compreensível que os eventos A e B são intei- ramente não relacionados. Saber que R ocorreu não fornece qual- quer informação sobre a ocorrência de A. De fato, o seguinte cál- culo mostra isso. Tomando como nosso espaço amostral os 36 resul- Comentário: Esta definição é, essencialmente, equivalente àquela BUgerida acilIla, a saber, que A e B são independentes quando P(BIA) = P(B) e P(A IB) = = P(A). Esta última forma é ligeiramente mais intuitiva, porque diz precisa- lDente o que se tinha tentado dizer antes: que A e B seria independentes se o co- nhecimento da ocorrência de A de nenhum modo influenciar a probabilidade da OCorrênciade B. Pelo exame do seguinte exemplo, v~ que a definição formal &cima adotada IIpresenta também uma certa atração intuitiva. Exemplo 3.7. Consideremos novamente o Ex. 3.2. Inicial- rn.enteexaminaremos apenas a tabela abaixo, em que são fornecidos a-- 54 I PROBABILIDADE PROBABILIDADE CONDICIONADA E INDEPENDÊNCIA I 55 somente os valores marginais. Isto é, existem 60 máquinas elétri- cas e 40 manuais, e delas 70 são novas enquanto 30 são usadas. 60 I 70 30 100 condições físicas sob as quais o experimento seja realizado tornarão possível decidir se tal suposição será justificada ou ao menos apro- ximadamente justificada. Exemplo 3.8. Consideremos um lote grande de peças, digamos 10.000. Admitamos que 10 por cento dessas peças sejam defeituosas e 90 por cento perfeitas. Duas peças são extraídas. Qual é a pro- babilidade de que ambas sejam perfeitas? Definamos os eventos A e B, assim: A = Ia primeira peça -é perfeita I, B = Ia segunda peça é perfeita}. E M ~\ 40 Existem muitas maneiras de preencher as casas da tabela, con- cordantes com os totais marginais dados. A seguir apresentaremo::, algumas dessas possibilidades. E M E M E M N 1 60 10 \ 70 N 1 30 40 I 70 N \ 42 28 \ 70 u O 30 30 U 30 O 30 U IR 12 30 60 40 100 60 40 100 60 40 100 ~ W 00 Consideremos a Tab. (.a). Aqui todas as máquinas elétricas são novas e todas as máquinas usadas são manuais. Desse modo, existe uma conexão óbvia (não necessariamente causa]) entre a ca- racterística de ser elétrica e a de ser nova. Semelhantemente, na Tab. (b), todas as máquinas manuais são novas e todas as máquinas usadas são elétricas. Também, uma conexão definida existe en tre essas características. No entanto, quando chegamos à Tab. (c), a situação fica bem diferente: aqui, nenhuma relação evidente existe. Por exemplo, 60 por cento de todas as máquinas são détricas, e exatamente 60 por cento das máquinas usadas são eiétricas. Se- melhantemente, 70 por cento de todas as máquinas são novas, enquanto exatamente 70 por cento das máquinas manuais sij.Qnovas etc. Portanto, nenhuma indicação está evidente de que a carac- terística de "ser nova" e de "ser elétrica" tenham qualquer cone- xão uma com a outra. Naturalmente, esta tabela foi construída justamente de modo a apresentar essa propriedade. Como foram obtidos os valores das casas da tabela? Apenas com o emprego da Eq. (3.6); isto é, porque P(E) = 60/100 e P(N) = 70/100, deveremos ter, para independência, P(E n N) = P(E) P(N) = 42/100. Daí, a casa na tabela que indique o número de máquinas elétricas novas deverá conter o número 42. As outras casas seriam obtidas de ma- peira análoga. Na maioria das aplicações, teremos que adotar a hipôtege de in- dep~ndência de dois eventos A e B, e depois empregar essa suposiçãO para calcular P(A n B) como igual a P(A) P(B). Geralmente, Se admitirmos que a primeira peça seja reposta, antes que a segunda seja escolhida, então os eventos A e B podem ser considerados inde- pendentes e, portanto, P(A n B) = (0,9)(0,9) = 0,81. Na prá- tica, contudo, a segunda peça é escolhida sem a reposição da primeira peça; neste caso, P(A n B) = P(BIA)P(A) = t~~~ (0,9) que é aproximadamente igual a 0,81. Assim, muito embora A e B não sejam independentes no segundo caso, a hipótese de independên- cia (que simplifica consideravelmente os cálculos) acarreta apenas um erro desprezível. (Recorde-se o objetivo de um modelo matemá- tico, tal como foi apresentado na Seç. 1.1.) Se existissem somente poucas peças no lote, digamos 30, a hipótese de independência teria acarretado um erro grande. Por isso, torna-se importante verificar cuidadosamente as condições sob as quais o experimento é realizado, a fim de estabelecer a validade de uma suposição de independência entre os vários eventos. Exemplo 3.9. Admitamos que um mecanismo seja constituído por dois componentes montados em ~érie, como indicado na Fig. 3.4. Cada componente tem uma probabilidade p de não funcionar. Qual será a probabilidade de que o mecanismo funcione? --@ §-- Fig.3.4 J!:evidente que o mecanismo funcionará se, e somente se, ambos 08componentesestiverem funcionando. Por isso, Prob (o mecanismo funcione) = Prob (C1 funcione e C2 funcione). ~ 56 I PROBABILIDADE PROBABILIDADE CONDICIONADA E INDEPENDÊNCIA I 57 A informação fornecido.não nos permite continuar sem que se saiba (ou se suponha) que os dois mecanismostrabalhem independentemente um do outro. Isto pode, ou não, ser uma suposição realista, depen- dendo de como as duas partes sejam engatadas. Se admitirmos que as duas partes trabalhem independentemente, obteremos para. a probabilidade pedida o valor (1 - p)z. Será importante para n6s, estendermos a noção de independên- cia para mais de dois eventos. Consideremos, inicialmente, três eventos associados a um experimento, digamos A, B e C. Se A e B, A e C, B e C forem independentes dois a dois (no sentido acima), então não se concluirá, em geral, que não exista dependência entre os três eventos. O exemplo seguinte (um tanto artificial) ilustra. esse ponto. ComenJár':Q:Na maioria das aplicações, não precisaremos verificar todas essas condições,porque nós geralmenteadmitimosa independência(baseada na- quilo que conhecermosdo experimento). Depois,empregaremosessa suposição para calcular, digamosP(Ai. () Ai, () ... () Aik) comoP(Aú)P(Ai,) . . . P(Aik)' Exemplo 3.11. A probabilidade de fechamento de cada relê do circuito apresentado na Fig. 3.5 ê dada por p. Se todos os relés fun- cionarem independentemente, qual será a probabilidade de que haja corrente entre os terminais L e R? ~:::~ Exemplo 3.10. Suponha-se que joguemos dois dados. se os eventos A, B e C da seguinte forma: A == 10primeirodado mostra.um número par}, B == 10 segundo dado mostra um número ímpar}, C == Iambos os dados mostram números ímpares mostram números pares}. Definam- Fig.3.5 P(A ri B) == P(A)P(B), P(B ri C) == P(B)P(C), P(A n C) == P(A)P(C), P(A ri B n C) == P(A)P(B)P(C). (3.7) Represente-se por Ai o evento 10 relê i está fechado J, i == 1, 2, 3,4. Represente-se por E o evento Ia corrente passa de L para R}. Em conseqüência, E == (AI ri Az) U (Aa ri A4). (Observe-se que AI ri Az e Aa ri A4 não são mutuamente excIudentes.) Portanto, P(E) == P(AI ri Az)+ P(Aa ri A4)- P(AI ri Az ri Aari A4) == pz+ pZ - p4 == 2pz- p4.. Exemplo 3.12. Suponhamos novamente que, para o circuito da Fig. 3.6, a probabilidade de que cada relê esteja fechado ê p, e que todos os relés funcionem independentemente. Qual será a proba- bilidade de que exista corrente entre os terminais L e R? Empregando a mesma notação do Ex. 3.11, teremos que P(E) == P(AI n Az) + P(A~) + P(A3 n A4) - P(AI ri Az ri A~) - P(AI ri Az ri AJ ri A4) - P(A~ ri Aa ri Ac) + P(AI ri Az ri Aa ri A4 ri A~) == p2 + p + pZ - p3 - p4 - p3 + p' == p + 2p2- 2p3 - p4 + p'. Vamos encerrar este capitulo com a indicação de uma bastante comum, mas errÔnea, resolução de um problema. ou ambos Temos P(A) ==P(B) ==P(C) ==1/2. Além disso, P(A ri B) == ==P(A ri C) ==P(B n C) ==1/4. Portanto, 08 três eventos são todos independentes dois a dois. Contudo, P(A ri B ri C) == ==O ~ P(A) P(B) P(C). Este exemplo sugere a seguinte defInição. Definição. Diremos que os três eventos A, B e C são mutua- mente independentes se, e somente se, todas as condições seguintes fo- rem válidas: I I1 11 1I I1I1II J Finalmente, generalizaremos esta noção para n eventos, na seguinte definição: Definição. Os n eventos AI, Az,..., An serão mutuamente inde- pendentesse, e somentese, tivermospara k == 2,3, ..., n: P(Ail ri Aiz ri ... ri Aik) == P(Ail)P(Aiz) ... P(Aik)' (3.8) ~A2.~~ Fig.3.6 (Existem ao todo 2n -n - 1 condições ai arroladas; veja o ProbI. 3.18.) 58 I PROBABILIDADE PROBABILIDADE CONDICIONADA E INDEPENDÊNCIA / 59 Exemplo 3.13. Admita-se que dentre seis parafusos, dois sejam menores do que um comprimento especificado. Se dois dos parafu-;- sos forem escolhidos ao acaso, qual será a probabilidade de que os dois parafusos mais curtos sejam extraIdos? Seja Ai o evento (o i-ési- mo parafuso escolhido é curto}, i = 1, 2. Portanto, desejamos calcular P(A, () A2). A solução correta é obtida, naturalmente, escrevendo Em seguida, representaremos as várias probabilidades pelas áreas dos retângulos, como na Fig. 3.8. Em cada caso, as regiõessombreadas indicam o evento B: no retângulo da esquerda, estamos representando A n B e, no da direita,A' n B. 1 2 1 P(A1 11A2) = P(A2)P(A1) = 5" . "6 = 15' 8' 1 2 1 P(A1 11 A2) = P(A2IAI)P(AI) = 5" . "6 = 15' A solução comum, mas incorreta, é obtida escrevendo-se 8 Naturalmente, o importante é que, muito embora a resposta esteja numericamente correta, a identificação de 1/5 com P(A2) é incorreta~ 1/5 representa P(A2IAI)' Para calcular P(A2) corretamente, escre- veremos - - 1 2- 2 4 1 P(A2) = P(A2IAI)P(AI)+ P(A2IAI)P(AI)=-'-. -- + - . - = - . 5 6 563 3.4. ConsideraçõesEsquemáticas;Probabilidade Condicionada e Independência Agora, admitamos que se desejecalcularP (B I A). Por isso,neces- sitamos somente considerar A, isto é, A' pode ser ignorado no cálculo. Observamosque a proporção de B emA é 1/4. (poderemos também ve- rificar isso pela aplicação da Eq. (3.1): P(B IA) = P(A n B) IP(A) = = 0,1/0,4 = 1/4.) Portanto, P(B' IA) = 3/4, e nosso diagrama repre- sentandoessaprobabilidade condicionada seriadado pela Fig. 3.9. o A abordagem esquemática seguinte poderá ser útil para compreen- der a probabilidade condicionada. Suponhamos que A e B sejam dois eventos associados a um espaço amostral para o qual asvárias probabi- lidadesestão indicadas no Diagramade Venn, dado na Fig. 3.7. .. A' 0,2 Observe-se,também, que se A for dado como tendo ocorrido, toda a probabilidade (isto é, I) deverá ser associada ao evento A, enquanto nenhuma probabilidade (isto é, O) estará associada a A'. Além disso, observe-seque, no retângulo da esquerda, representando A, somente os Valoresindividuaismudaram na Fig. 3.8 para a Fig. 3.9 (cuja somaé 1, em lugarde 0,4). Contudo, as proporções dentro do retângulo permane- ceramasmesmas(isto é, 3:1). Fig.3.7 Tem-se P(A () B) = 0,1; P(A) = 0,1 + 0,3 = 0,4 eP(B) = 0,1 +0,4 == = 0,5. -ar-- 0,6 0.2 0,4 B' 0,3 B A A' Fig.3.8 1,0 8' 0,75 8 A Fig.3.9 -- 60 I PROBABILIDADE PROBABILIDADE CONDICIONADA E INDEPENDÊNCIA I 61 0,45 8' 3.3. Uma caixa contém 4 válvulas defeituosas e 6 perfeitas. Duas viUvulas são extraídas juntas. Uma delas é ensaiada e se verifica. Ser perfeita. Qu.aJ a probabilidade de que a outra válvula também seja perfeita? 3.4. No' problema anterior, as válvulas são verificadas extrai.ndo-se uma válvula ao acaso, ensaiando-a e repetindo-se o procedimento até que todas as 4 válvulas defeituosas sejam encontradas. Qual será a probabilidade de que a quarta válvula defeituosa seja. encontrada: (a) No quinto ensaio,? (b) No décimo ensaio? 3.5. Suponha que A e B sejam eventos independentes associados a um ex- perimento. Se a probabilidade de A ou B ocorrerem for igual a 0,6, eJ)quanto a probabilidade da ocorrência de A fo~ iglilU a 0,4, detennine a probabilidade da ocorrência de B. 3.6. Vinte peças, 12 das quais são defeituosas e 8 perfeitas, são inspecio- nadas uma após a outra. Se essas peças forem extraídas ao. acaso, qual será a probabilidade de que: (a) ABduas primeiras peças sejam defeituosas? (b) As duas primeiras peças sejam perfeitas? (c) Das .duasprimeiras peças inspecionadas, uma seja perfeita e a outra. defeituosa? 3.7. Suponha que temos duas urnas 1 e 2, cada uma com duas gavetas. A urna 1 contém uma moeda de ouro em uma gaxeta e uma moeda de prata na outra gaveta; enquanto a urna 2 contém uma. moeda de ouro em cada gaveta. Uma urna é escolhida ao acaso; a seguir uma de suas gavetas é aberta ao acaso. Verifica-se que a moeda encontrada nessa. gaveta é de ouro. Qual a probabili- dade de que a moeda provenha da urna 2? Vamos também ilustrar a noção de independência, empregando a abordagem esquemática introduzida anteriormente. Suponhamos que A e B sejam como indicado na Fig. 3.1O. Nesse caso, as proporções nos dois retângulos, represéntando A e A', são asmesmas:3: 1nos dois casos. Por isso, teremos P (B) = 0,1 + 0,15 = 0,25 e P (B () A) = = 0,1/0,4 = 0,25. 0,6 0,4 B' 0,3 B 8 A Fig.3.10 Finalmente, observe-se que, simplesmente olhando a Fig. 3.8, poderemos também calcular as outras probabilidades condicionadas: P(A I B) = 1/5 (desde que 1/5 da área total retangular representando B esteja ocupada por A); P (A' I B) = 4/5. Problemas 3.8. Um saco contém três moedas, uma das quais foi cunhada COIp.duas caras, enquanto as duas outras moedas são normais e não viciadas. Uma moeda é tirada ao acaso do saco e jogada quatro vezes, em seqüência. Se sair cara ÚJda vez, qual será a probabilidade de que essa seja a moeda de duas caras? 3.9. Em uma fábrica de parafusos, as máquinas A, B e C produzem 25, 35 e 40 por cento do total produzido, respectivamente. Da produção de cada máqui- na, 5, 4 e 2 por cento, respectivamente, são parafusos defeituosos. Escolhe-se ao acaso um parafuso e se verifica s~r defeituoso. Qual será a probabilidade de que o parafuso venha da máquina A ? Da B? Da C? 3.10. Sejam A e B dois eventos associad0s a um experimento. Suponha que P(A) = 0,4, enquanto P(A U B) = 0,7. Seja P(B) = p. (a) Para que valor de p, A e B serão mutuamente excludentes? (b) Para que valor de p, A e B serão independentes? 3.11. Três componentes C1, C2 e Ca, de um mecanismo são postos em série (e~ linha reta). Suponha que esses componentes sejam dispostos em ordem alea- t6~a. Seja R o evento IC2 está à direita de C1}I e seja S o evento ICa está à di- reita de CII. OS eventos R e S são independentes? Por quê? 3.12. Um dado é lançado e, independentemente, urna carta é extraída de l1IDbaralho completo (52 cartas). Qual será a probabilidade de que: 3.1. A urna 1 contém x bolas brancas e y bolas ve(melhan. A Il.l:n.a.2. con- tém z bolas brancas e v bolas vermelhas. Uma bola é escolhida ao acaso da u(na. ~ e posta na urna 2. A seguir, uma bola é escolhida ao acaso da urna 2. Qual será a probabilidade de que esta bola seja branca? 3.2. Duas válvulas defeituosas se misturam com duas válvulas pedeitas. As válvulas são ensaiJ,.das,UIIlAa uma., até que ambas as defeituosas sejam eocontradas. (a) Qual sed. a probabilidade de que a illtiJrui.v9.1vuladefeituosa. seja enoon- tradano segundo ensa.io? (b) Qual será a probabilidade de que a última válvula defeituosa. seja encon- trada no terceiro, ensaio? (c) Qual será a proba.bilidade de que a última vMvula defei.tuosa.sejaencoo- trada 110quarto ensaio? (d) Some os Ilúmeros obtidos em (a), (b) e (c) acima. O (esultado é surpre- endente ? ----- PROBABILIDADE CONDICIONADA E INDEPENDÊNCIA I 63 62 I PROBABILIDADE (a) O dado mostre um número par e a carta seja de um naipe vermelho? (b) O dado mostre um número par ou a carta seja de um naipe vermelho? 3.13. Um número binário é constituído apenas dos dígitos zero e um. (Por exemplo, 1 011, 1 100 etc.) Esses números têm importante papel na utilização de computadores eletrônicos. Suponha que um número binário seja formado de n dígitos. Suponha que a probabilidade de um dígito incorreto aparecer seja p e que os erroS em diferentes dígitos sejam independentes uns dos outros. Qual será a probabilidade de formar-se um nÚ~To incorreto? (c) A tenha mais desarranjos que B. (tI) B tenha duas vezes mais desarranjos que A. (e) B tenha 4 desarranjos, quando se saiba que B já tenha tido 2 desar- ranjos. (j) O número mínimo de desarranjos das duas máquinas seja 3; seja menor do que 3. (,) O IJI,Wneromáximo de desarranjos das máquinas seja 3; seja maior que 3. 3.16. J ogam-se dois dados. Desde que as faces mostrem números dife- rentes, qual é a probabilidade de que uma face seja 4? 3.17. Sabe-se que na fabricação de um certo artigo, defeitos de um tipo ocorrem com probabilidade 0,1 e defeitos de outro tipo com probabilidade 0,05. Qual será a probabilidade de que: (a) Um artigo não tenha ambos os tiPos de defeitos? (b) Um artigo seja defeituoso? (c) Um artigo tenha apena.s um tipo de defeito, sabido que"'é defeituoso? 3.14. Um dado é atirado n vezes. Qual é a probabilidade de que "6" apa- reça ao menos uma vez em n jogadas? 3.15. Cada uma de duas pessoas joga três moedas equilibradas. Qual é a probabilidade de que elas obtenham o mesmo número de caras? (a) (b) 3.22. Verifique pelas Eqs. (3.2) que, sendo  fuo, P(BjA) satisfaz aos váriO!! postulados da probabilidade. 3.23. Se cada elemento de um determinante de segunda ordem for zero ou um, qual será a probabilidade de que o valor do determinante seja positivo? (Admita que os elementos do determinante sejam escqIhidos independentemente, a cada valor se atribuindo a probabilidade 1/2.) 3.24. Verifique que o teorema da multiplicação P(A Í1 B) = P(A IB)P(B), estabelecido para dois eventos, pode ser estendido para tr~s eventos, da seguinte maneira: P(A Í1 B Í1 C) = P(A IB Í1 C)P(BIC)P(c). 3.25. Uma montagem eletrônica é formada de dois Bubsistemas A e B. De procedimentos de ensaio anteriores, as seguintes probabilidades se admitem c0- nhecidas; P(A falhe) = 0,20, P(A e B falhem) = 0,15, P(B falhe lIozinAo)- 0,15. Calcule as seguintes probabilidades: (a) P(A falhe I B tenha falhado). (b) P(A falhe sozinho). 3.26. Conclua a análise do exemplo dado na Seção 3.2, pela decisão de qual dos dois tipos de caixa de bombons, A ou B, foi apresentada, baseando...e na evidência dos dois bombons que foram tirados na amostra. 3.27. Sempre que um experimento é realizado, a ocorrência de um parti- cu1ar evento A é igual a 0,2. O experimento é repetido independentemente, até que A ocorra. Calcule a probabilidade de que seja necessário levar a cabo o experi- mento até a quarta vez. 3.18. Verifique que o número de condições impostas pela Eq. (3.8) é dado por2"-n-1. 3.19. Demonstre que, seA e B forem eventos independentes, também o serão A e B, 11e B, 11e B. 3.20. Na Fig. 3.11(a) e (b), suponha que a probabilidade de que cadarelé esteja fechadoseja p, e que cada relé seja aberto ou fechadoindependentemente um do outro. Em cada caso, determine a probabilidadede que a corrente passe de L para R. ~T~ ~~.~. 2 R .;\lI, . W'H;r Fig. 3.11 3.28. Suponha que .um equipamento possua N wlvulas, todas necessárias para seu funcionamento. A fim de localizar uma válvula com mau funcionamento, faz-se a substituição de cada válvula, sucessivamente, por uma válvula nova. Calcule a probabilidade de que seja necessário trocar N válvulas, se a probabilidade (cons- tante) de uma válvula estar desarranjada por p. 3.29. Demonstre: SeP (A I B) > P (A), então,P (B IA) > P (B). 3.21. Duas máquinas A e B, sendo operadas independentemente, podem ter alguns desarranjos cada dia. A Tab. 3.2 dá a distribuição de probabilidades dos desarranjos para cada máquina. Calcule as seguintes probabilidades: (a) A e B tenham o mesmo número de desarranjos. (b) O númel'O total de desarranjos seja menor que 4; menor que 5. ~ Tab. 3.2 Númerode I 2 desarranjós O 1 3 4 5 6 -I 0,1 0,2 0,3 0,2 0,09 0,07 0,04 0,3 0,1 0,1 0,1 0,1 0,15 0,15/ ...........- 64 / PROBABILIDADE PROBABILIDADE CONDICIONADA E INDEPENDÊNCIA / 65 3.30. Uma válvula a vácuo pode provir de três fabricantes, com probabili- dades p, = 0,25, P2 = 0,50 e P3 = 0,25. As probabilidades de que, durante determinado período de tempo, a válvula funcione bem são, respectivamente, 0,1; 0,2 e 0,4 para cada um dos fabricantes. Calcule a probabilidade de que uma válvula escolliida ao acaso funcione bem durante o período de tempo especificado. 3.31. Um sistema elétrico é composto de dois comutadores do tipo A, um do tipo B, e quatro do tipo C, ligados como indica a Fig. 3.12. Calcule a probabi- lidade de que uma pane no circuito não possa ser eliminada com a chave K, se os comutadores A, B e C estiverem abertos (isto é, desligados) com probabilidades 0,3; 0,4 e 0,2, respectivamente, e se eles operarem independentemente. (b) ele leia exatamente um dos jornais; (c) ele leia ao menos A e B, se se souber que ele lê ao.menos um dos jornais publicados. 3.36. Uma moeda equilibrada é jogada 2n vezes. (a) Obtenha a probabi- lidadé de que ocorrerá um igual número de caras e coroas; (b) Mostre que a probabilidade calculada em (a) é uma função decrescente de n. 3.37. Cada uma das n urnas: Urna 1, Urna 2, ..., Urna n, contém O'bolas brancas e {3bolas pretas. Uma bola é retirada da Urna 1 e posta na Urna 2; em se- guida, uma bola é retirada da Urna 2 e posta na Urna 3, e assim por diante. Final- mente, uma bola é retirada da Urna n. Se a primeira bola transferida for branca, qual será a probabilidade de que a última bola escolliida seja branca? Que acon- tece, se n -->oo? [Sugestão: Faça Pn = Prob (a n-ésima bola transferida seja branca) e exprima Pn em termos de Pn - 1'] 3.38. A Urna 1 contém O'bolas brancas e {3bolas pretas, enquanto a Urna 2 contém {3bolas brancas e O'pretas. Uma bola é extraída (de uma das urnas) e é em seguida reposta naquela urna. Se a bola extraída for branca, escolha a próxima bola da Urna 1; se a bola extraída for preta, escollia a próxima bola da Urna 2. Continue a operar dessa maneira. Dado que a primeira bola escolliida venha da Urna 1, calcule Prob (n-ésima bola escolliida seja branca) e também o limite dessa probabilidade, quando n -->00. Fig.3.12 3.39. Uma máquina impressora pode imprimir n letras, digamos 0',,0'2' ... , O'w Ela é acionada por impulsos elétricos, cada letra sendo produzida por um impulso diferente. Suponha que exista uma probabilidade constante P de imprimir a letra correta e também suponha independência. Um dos n impulsos, escolliido ao acaso, foi alimentado na máquina duas vezes e, em ambas, a letra 0', foi im- pressa. Calcule a probabilidade de que o impulso escolhido tenha sido para impri- mirO',. 3.32. A probabilidade de que um sistema fique sobrecarregado é 0,4 duran- te cada etapa de um experimento. Calcule a probabilidade de que o sistema deixe de funcionar em três tentativas independentes do experimento, se as proba- bilidades de fallias em 1,2 ou 3 tentativas forem iguais, respectivamente, a 0,2; 0,5 e 0,8. 3.33. Quatro sinais de rádio são emitidos sucessivamente. Se a recepção de cada um for independente da recepção de outro, e se essas probabilidades forem 0,1; 0,2; 0,3 e 0,4, respectivamente, calcule a probabilidade de '<!ue k .sinais venham a ser recebidos para k = 0,1,2,3,4. 3.34. A seguinte (de algum modo simplória) previsão de tempo é empregada por um amador. O tempo, diariamente, é classificado como "seco" ou "úmido ", e supõe-se que a probabilidade de que qualquer dia dado seja igual ao dia anterior seja uma constante p (O < p < 1). Com base em registros passados, admite-se que I? de janeiro tenha probabilidade {3de ser dia "seco". Fazendo {3n= probabilida- de (de que o n-ésimo dia do ano seja "seco"), pede-se obter uma expressão para t3nem termos de t3e de p. Calcule também limn -+ 00t3ne interprete o seu resulta- do [Sugestão: Exprima t3nem termos de t3n- 1'] 3.35. Três jornais A, B e C são publicados em uma cidade e uma recente pesquisa entre os leitores indica o seguinte: 20 por cento lêem A; 26 por cento lêem B~ 14 por cento lêem C; 8 por cento lêem A e B; 5 por cento lêem A e C; 2 por cento lêem A, B e C; e 40. por cento lêem B e C. Para um adulto escolliido ao acaso, calcule a probabilidade de que: (a) ele não leia qualquer dos jornais; ~ Variáveis Aleatórias Unidimensionais Capítulo 4 4.1. Noção Geral de Variável Aleatória Ao descrever o espaço amostral de um experimento, não especi- ficamos que um resultado individual necessariamente seja um nú- mero. De fato, apresentamos alguns exemplos nos quais os resul- tados do experimento não eram uma quantidade numérica. Por exemplo, ao descrever uma peça manufaturada, podemos empregar apenas as categorias "defeituosa" e "não defeituosa". Também, ao observar a temperatura durante o período de 24 horas, podemos simplesmente registrar a curva traçada pelo term6grafo. Contudo, em muitas situações experimentais, estaremos interessados na mcn- suração de alguma coisa e no seu registro como um número. Mesmo nos casos mencionados acima, poderemos atribuir um número a cada resultado (não numérico) do experimento. Por exemplo, poderemos atribuir o valor um às peças perfeitas e o valor zero às defeituosas. Poderemos registrar a temperatura máxima do dia, ou a temperatura mínima, ou a média das temperaturas máxima e mínima. Os exemplos acima são bastante típicos. de uma "classe muito geral de problemas: em muitas situações experimentais, desejamos atribuir um número real x a todo elemento s do espaço amostral S. Isto é, x = X(s) é o valor de uma função X do espaço amostral no espaço dos números reais. Com isto em mente, formulamos a seguinte definição. J Definição. Sejam S um experimento e S um espaço amostral I associado ao experi~ento. Uma fun~ão X, ~ue associ~ a cada el,e- mento s E S urilnumero real, X(s), e denomlllada vanável aleat6na, Comentários: (a) A terminologia acima é um tanto infcliz, mas é tão uni- vers",lmente aceit"', que nã.o nos ",fastaremos dei"" Tornamos tão claro qu",nto possivel que X é um'" junçlJ.O,e contudo, a denominamos uma variável (aleatória)1 VARIÃVEIS ALEATÓRIAS UNIDIMENSIONAIS I 67 (b) E evidente que nem toda função imaginável pode ser considerada uma variável aleatória. Um requisito (embora não seja o mais geral) é que, para todo número real x, o evento [X(s) = x I e, para todo intervalo I, o evento [X(s) E II têm probabilidades bem definidas, consistentes com os axiomas básicos. Na maioria das aplicações, essa dificuldade não surge e nós não voltaremos a nos referir a ela. (c) Em algum8B situações, o resultado s do espaço amostral já constitui a caracterfstica numérica que desejamos registrar. Simplesmente tomaremos X(s) = s, a função identidade. (d) Na maior parte de llOBSasubseqüente exposição sobre variáveis alea- tórias, não necessitaremos indicar a natureza funcional de X. Geralmente, esta- remos interessados nos valores possíveis de X, mais do que de onde eles se origi- nam. Por exemplo, suponh~ que atiremos duas moedas e consideremos o es- paço associado a este experimento. Isto é, S = (HH, HT, TH, TTI. Definamos a variável aleatória da seguinte maneira: X é o número de caras (H) obtidas nas dU8Bmoedas. Daí, X(HH) = 2, X(IlT) = X(TIl) = 1e X(TT) = O. S = espaço amostral de S Rx = valorespossívei~de X Fig.4.1 (e) ~ muito importante compreender uma exigência fundamental de uma função (unívoca): A cada s E S corresponderá exatamente um valor X(s). Isto está apresentado esquematicarnente na Fig. 4.1. Diferentes valores de s podem levar ao mesmo valor de X, Por exemplo, na ilustração acima, verificamos que X(HT)= X(TH) = 1. O espaço Rx, conjunto de todos os valores possíveis de X, é algumas vezes denominado contradominio. De certo modo, podere- mos considerar Rx como um outro espaço amostral. O espaço amos- tral (original) S corresponde ao resultado (possivelmente não-Dumé- rico) do experimento, enquanto Rx é o espaço amostral associado à variável aleat6ria X, representando a característica numérica que nos poderá interessar. Se for X(s) = 8, teremos S = Rx. Muito embora estejamos prevenido!! do perigo didático inerente a dar muitas explicações para uma mesma coisa, vamos salientar que poderemos pensar em UIIl3-variável aleat6ria X, de duas maneiras: (~) Realizamos o 'experimento 8 que dá. um resultado 8 E Sj a 8eguircalculamos o número X(a). -- - 68 I PROBABILIDADE (b) Realizamos 8, obtemos o resultado s, e (imediatamente) calculamos X(s). Neste caso, o número X(s) é pensado como o pró- prio resultado do experimento e Rx se toma o espaço amostral do experimento. A diferença entre as interpretações (a) e (b) é percebida com dificl,lldade;é relativamente secundária, mas merecedora de atenção. Em (a), o experimento essencialmentetermina com a observação de 8. A avaliação de X(s) é considerada alguma coisa que é feita poste- riormente, e que não é influenciada pela aleatoriedade de 8. Em (b), o experimento não é considerado concluído até que o número X(s) tenha sido realmente calculado, desse modo se originando o es- paço amostral Rx. Muito embora a primeira interpretação, (a), seja aquela geralmente pretendida, a segunda interpretação, (b), pode- rá ser muito útil e o leitor deverá lembrar-se dela. Aquilo que estamos dizendo, e isso ficará cada vez mais claro nas seções posteriores, é que no estudo das variáveis aleatórias estaremos mais interessados nos valores que X toma do que em sua forma funcio- nal. Conseqüentemente, em muitos casos, ignoramos completamente o espaço amostral subjacenteno qual X pode ser definido. Exemplo 4.1. Suponha-se que uma lâmpada tenha sido posta em um soquete. O experiment,oserá considerado terminado quando a lâmpada se queimar. Qual será um possível resultado, s? Uma das maneiras de descrever 8 seria apenas registrar o dia e a hora em que a lâmpada se queimou, por exemplo: 19 de maio, 16 h e 32 mino Em conseqüência, o espaço amostral poderia ser representado por S = I(d, t)\ d = dia, t = momento do diaI. Presumivelmente, a variável aleatória que interessa é X, a duração até queimar. Obser- ve-se que, uma vez que s = (d, t) tenha sido observado, o cálculo de X(s) não inclui qualquer aleatoriedade. Quando 8 é especificado, X(s) fica completamente determinado. As duas interpretações explicadas acima podem ser aplicadas a este exemplo, como se segue. Em (a), consideramos o experimento terminado com a observação s = (d, t), o dia e a hora. O cálculo de X(s) é realizado depois, abrangendo uma operação aritmética simples. Em (b), con~ideramos que o experimento somente estará terminado depois que X(s) tenha sido calculado e um número, por exemplo, X(s) = 107 horas seja então considerado o resultado do experimento. Pode-se salientar que análise semelhante se aplicaria à qual- quer outra variável que interessasse, por exemplo, Y(s), a tempe- ratura da sala no momento em que a lâmpada se tenha queimado. VARIÁVEIS ALEATÓRIAS UNIDIMENSIONAIS I 69 Exemplo 4.2. Três moedas são atiradas sobre a mesa. Tão logo as moedas repousem, a fase "aleatória" do experimento termi- nou. Um resultado simples s poderia consistir na descrição deta- lhada de como e onde as moedas pousaram. Presumivelmente, estaremos somente interessados em certas características numéricas associadas a este experimento. Por exemplo, poderíaltlos avaliar: X(s) = número de caras que apareceram, Y(s) = distâ.ncia máxima entre duas moedas quaisquer, Z(s) = distância minima das moedas a um bordo qualquer da mesa. Se for a variável X que interesse, poderemos, como se explicou no exemplo anterior, incluir a avaliação de X(s) na descrição de nosso experimento e, depois, simplesmente afirmar que o espaço amostral associado ao experimento é {O, 1, 2, 3}, correspondendo aos valores de X. Conquanto muito freqüentemente venhamos a adotar esta interpretação, é importante compreender que a contagem do número de caras é feita depois que os aspectos aleat6rios do experimento te- nham terminado. Comentário: Referindo-nos a variáveis aleatórias, empregamos quase sem exceção letras maiúsculas, como X, Y, Z etc. Contudo, quando falamos do valor que essas variáveis aleatórias tomam, usaremos, em geral, letras minúsculas, como x, y, z etc. Esta é uma distinção muito importante a ser feita e o estudante pode bem parar para considerá-Ia. Por exemplo, quando nós falamos em escolher uma pessoa ao acaso, de alguma população designada, e medimos sua altura (em centí- metros, por exemplo), poderemos nos referir aos resultados possiveis como uma variável aleatória X. Poderemos então formular várias questões sobre X, como indagar se P (X ;;. 60). No entanto, uma vez que tenhamos escolhido uma pessoa e medido sua altura, obteremos um valor específico de X, digamos x. Por isso, não teria sentido indagar se P (x ;;. 60), uma vez que x é ou não é ;;. 60. Esta distinção entre uma variável aleatória e seu valor é importante e nós voltaremos a fazer referência a ela. Quando estivermos interessados nos eventos associados a um espaço amostral S, verificaremos a necessidade de examinar os eventos relativamente à variável aleat6ria X, isto é, subespaços do contra- dOminioRx. Bastante freqüentemente, certos eventos associados a S são "relacionados" (em um sentido a ser explicado) a eventos associadoscom Rx, na seguinte forma: Definição. Sejam um experimento 8 e seu espaço amostral S. Seja X uma variável aleat6ria definida em S e seja Rx seu contrado- IXúnio. Seja B um evento definido em relação a Rx, isto é, B C Rx. r- 70 I PROBABILIDADE Então, A será. defInido assim: A = {s E SIX(s) E B}. (4.1) Explicando: A será. constituído por todos os resultados em S, para 08 quais X(s) E B (veja Fig. 4.2). Neste caso, diremos que A e B são eventosequivalente8. RX Fig.4.2 Comenú1nos: (a) Dizendo a mesma coisa, com menos rigor: .A.e B serão equi- valentes sempre que ocorram juntos. Isto é, quando A ocorre, B ocorre, e inver- samente. Porque se A tiver ocorrido, então um resultado s terá ocorrido, para o qual X(s) E B e, portanto, B ocorreu. Reciprocamente, se B ocorreu, um valor X(s) terá sido observado, para o qual s E A e, portanto, .A.ocorreu. (b) ~ importante compreender que, 'em nessa defrnição 'de '~l!I1tos equiva- lentes, A e B são associados a espaços amostrais diferentes. Exemplo 4.3. Considere-se a jogada de duas moedas. Dai, S = ,{HH, HT, TH, TT}. Seja X'O número de caras obtido.. Por- tanto, Rx = 1o, I, 2}. Seja B = {I}. Já que X(I/T) = X('!'1/) = I se, e somentesc, X(s) = 1, temos quc A = {HT, TH} é'cquivalenteaB. Agora, daremos a seguinte importante definição. Definição. Seja B um evento no 'c<YIJ.tra:dOTIÚmo Rx. caso, definimos P(B) da seguinte maneira Nesse P(B) = P(A), onde A = Is E SIX(s) E R}: . (4.2) Explicando: Definimos P(B) ig\'lal à pro'babilida:de do evento A C S, 'o qual é equivalente a B, no sentido da Eq. (4.1). Comentários: (a) Estamos ,admitindo que probabilidades possam ser asso- ciadas a eventos em S. portanto, a definição acrma torna possível atriburrpro- babilidades a eventos associados a Ilx em tcrmos'de probabilidades definidas sobreS. (b) ~ realmente possível demonstrar que P(B) deve ser definida tal como o fizemos. Contudo, isto envolveria algumas dificuldades teóricas que desejamos evitar e, por isso, procedemos como acima. (c) Desde que na formulação 'da Eq. (4,2) os eventos A e B se referem a espaços amostrais diferentes, deveríamos realmente empregar notação diferente quando nos referíS8ernos a probabilidades definidas sobre S e àquelas 'definidas sobre Ilx, digamos algtlma coisa tal corno P(A) e Px(B). No entanto, 'Ilão fare- -- VARIÁVEIS ALEATÓRIAS UNIDIMENSIONAIS I 71 mos isso, mas continuaremos simplesmente a escrever P(Ã) e P(B). 'O contexto em que tais expressões apar{,çam tornará clara a interpretação. (d) As probabilidades associadas a eventos no espaço amostral (original) S são, de 'certo modo, determinadas por "forças fora de nosso controle", ou como às vezes se diz "pela Natureza". A composição de uma fonte radioativa 'que emita partículas, a dí..~posiçãode um grande número de 1'CS8088'que façam éhamadas telefônicas durante certa hora, e a agitação térmica que dê 'origem a 'um fluxo ou as condições atmosféricas que dêem origem a uma tempestade, ilustram esse as- pecto. Quando introduzimos uma variável aleatória X e seu 'contradomínio Rx estamos induzindo probabilidades nos eventos associados aRx, as quais serão es- tritamente determinadas se as probabiliclades associadas a 'eventos em S forem especificadas. Exemplo 4.4. Se as moedas consideradas '110 Ex. 4.3 forem "equilibradas", tercmos P(HT) = P(TH) = 1/4. Po.rtanto,P'(HT, TH) = 1/4 + 1/4 = 1/2. (Os cálculos acima são uma 'Consequência direta de nossa suposição fundamental referente â propriedade de equilíbrio ou simetria das moedas.) Visto que'o evento {X = I}' é equivalcnte ao evento {HT, TH}, empregando a Eq. (4.1), teremos que P(X = 1) == P(HT, TH) = 1/2. [Na realidade não'eriste escolha para o valor de P(X = 1) coerente com a Eq. .(4.2), uma vez que P(HT, -TH) tenha sido determinada. 11:neste sentido que probabi- lidades associadas a eventos de Rx são induzidas.J Comentário: Agora qúe jii estabelecemos a existência de uma função de pro- babilidade induzida sobre o contradomínio de X - Eqs. (4.1 e 4.2)- achamos conveniente 8'Uprimir a natureza funcional de X. Por isso, escr~erem08(como fizemos no 'exemplo acima) P(X = 1) = 1/2. O que se quer dizer é que, um certo evento no espaço amostral S, a saber {HT., THI = {s IX(s) = 11 'ocorre com pro- babilidade 112. Daí atribuirmos -essa mesma probabilidade ao '~ento {X = 11 no contradomínio, Continuaremos a escrever expressões semelhantes a P(X = 1), P(X ~ 5) etc. ~ muito 'impurlántepara o leitor compreender o que essas expressões re&lm:enterepresentam. Uma vez que as probabilidades associadas aos válios resultados (ou eventos) no contradombrio Rx tenham sido determinadas (mais precisamente, induzi das), ignoraremos freqüentemente o espaço amostral original S, que deu origem a essas probabilidades. Assim, 'no exemplo anterior, simplesmente estaremos interessados em Rx = {O, I, 2} e as probabilidades associadas (1/4, 1/2, 1/4). O fato, de que essas probabilidades sejam determinadas por urna função de probabilidade definida sobre o espaço amostral original S, não nos interessa, quando estamos apenas interessados em estudar 08 valores da variável aleatória X. Ao apresentar, em minúc1as, muitos dos importantes cOI1'~eitos 'referentes a variáveis aleatórias, julgamos conveniente distinguir ;-- 72 I PROBABILIDADE dois casos importantes: as variáveis aleatórias discretas e as variá- veis aleatórias contínuas. 4.2. Variáveis Aleat6riasDiscretas Definição. Seja X uma variável aleatória. Se o número de va- lores possíveis de X (isto é, Rx,o contradominio) for finito ou infi- nito numerável, denominaremos X de variávelaleat6riadiscreta. Isto é, os valores possíveis de X, podem ser postos em lista como X" X2,.. ., x". No caso finito, a lista acaba, e no caso infinito numerá- 'lei, a lista continua indefinida.mente. Exemplo 4.5. Uma fonte radioativa está emitindo partículas a. A emissão dessas partículas é observada em um dispositivo contador, durante um período de tempo especificado. A variável aleatória seguinte é a que interessa: X = número de partículas observadas. I1 I I II I I Quais são os valores possíveis de X? Admitiremos que esses valores são todos os inteiros não negativos, isto é, R:r = /0, 1,2...,11,.. .1. Uma objeção com que já nos defrontamos uma vez pode, novamente, ser levantada neste ponto. Pode-se argumentar que durante um es- pecificado intervalo (finito) de tempo, é impossível observar mais do que, digamos N partículas, onde N pode ser um inteiro positivo muito grande. Conseqüentemente, os valores possíveis para X real- mente seriam: O, 1, 2,..., N. Contudo, toma-se matematicamente mais simples considerar a descrição idealizada feita ,acima. De fa- to, sempre que admitirmos que os valores possíveis de uma variá- vel aleatória X sejam infinito numerável, estaremos realmente consi- derando um:!.:representação idealizada de X. À vista de nossas explicações anteriores da descrição probabi- listica de eventos éom um número finito ou infiuito numerável de elementos, a descri~ão p~abilistica de uma variável aleatória dis- creta não apresen~a.rá quàlquer dificuldade. Procederemos da se- guinte maneira: Definição. Seja X uma.-.v:ariávelaleatória discreta. Portando, R... o contradomínio de X, será formado no máximo por um número in- finito numerável de valores Xl, X2,... A cãda possível resultado x, associaremos um número p(Xi)= P(X = Xi), denominado probabi- lidade de Xi. Os números p(Xi), i = 1,2,. .. devem satisfazer às - VARIÁVEIS ALEATÓRIAS UNIDIMENSIONAIS I 73 seguintes condições: (a) P(Xi)~ Opara todo i, (b) t P(Xi) = 1. .-1 (4.3) A função p, definida acima, é denominada fun~ão de probabilidade (ou função de probabilidade no ponto) da variável aleatória X. A coleção de pares [.ri, p(Xi)], i = 1,2,..., é.algumas vezes denominada distribuição de probabilidade de X. COl/umtários:(a) A escolhaparticular dos números p(Xi)é presumlvelmente determinadaa partir,da função de probabilidadeassociadaaos eventos no espaço @-() Fig.4.3 amostrai S, no qual X seja definida. Isto é, p(.1;) = p(aIX(s) = ri]. [Veja as Eqs. (4.1 e 4.2).] Contudo, já que estamos interessados apenM nos valores de X, isto é, Rx, e as probabilidades 1ISS0ciadasa estes valores, est&remOllnovamente suprimindo a natureza funcional de X. (Veja a Fig. 4.3.) Muito embora, na maio- ria dos casos, os números sejam de fato determinados a partir da distribuição de probabilidades em algum espaço amostral subjacente S, qualquer conjunto de números p(.1;),que satisfaçam às Eqs. (4.3), pode servir como descrição probabi- IIstil'a apropriada de uma variável aleatória discreta. (b) Se X tomar apenas um número finito de valores, digamos XII.. "XN' então p(.1;)= O para i > N, e, portanto, a série infinita na Eq. (4.3) se transforma em uma soma finita. (c) Podemos salienta:', novamente, uma analogia com a Mecânica, ao con- siderarmos a massa total de uma unidade distribuída sobre a reta real, com a massa total concentrada nos pontos XII :1:2,'" Os númerosp(Xi)representam a quan- tidade de massa localizada no ponto Xi. . (d) A interpretação geométrica (Fig. 4.4) de uma distribuição de probabi- lidade é freqüentemente útil. p(x) Rx x Fig.4.4 Flg.4.5 ..r-- - 74 I PROBABILIDADE Seja B um evento associadoà variável aleat6ria Xi isto é, B C Rx (Fig. 4.5). Suponha-se, especificamente, que B = 1 Xi1'Xi".. .). Dai, P(B) = f[sIX(s) E BJ (porque esses eventos são equivalentes) P[sIX(s) = Xii,j = 1,2,...J = 'tp(rii)' ,=1 Explicando: A probabilidade de um evento B é igual à soma das probabilidades dos resultados individuais associados com B. (4.4) Comentdrios: (a) Suponhamos que a variável aleatória discreta X possa tomar somente um número finito de valores, x, , . . . , xN' Se os resultados forem igualmente prováveis,então teremos obviamente p(x,) =,.. =P(xN)= I/N. (b) Se X tomar um número infinito numerável de valores, então é impossível ter todos os valores igualmente prováveis; porque não poderemos satisfazer à condição ,~oo p(x ,.) = 1, setivermosp(x ,') = c para todo i. ,= 1 (c) Em todo intervalo finito, existirá no máximo um número finito de valores possíveis de X. Se algum desses intervalos não contiverqualquer desses valores possíveis, nós atribuiremos a ele probabilidade zero. Assim, se Rx = = [x" x2,. .. ,xn] e se nenhum xi E [a, b], então P [a';; X.;; b] = O. Exemillo 4.6. Suponhamos que uma válvula eletrônica seja posta em um soquete e ensaiada. Admitamos que a probabilidade de que o teste seja positivo seja 3/4; dai, a probabilidade de que se- ja negativo é igual a 1/4. Admitamos também que estejamos ensai:' ando uma partida grande 'dessas válvulas. Os ensaios continuam até que a primeira válvula positiva apareça. Definamos a variá- vel aleatória, assim: X é o n.úmero de testes necessários para con- cluir o experimento. O espaço amostral associado a este experi- mento é: s=: 1+,- +,- - +,- - - +,.,.1. Para determinarmos a distribuição de proba.bilidade de X, racioci- naremos da seguinte forma: os valores possíveis de X são 1, 2,. . .n, .-.. (estamos, obviamente, tratando com um espa.çoamostral idealizado). E será X = n se, e somente se, as prhneiras (n - 1) válvulas forem nega.tivas e a. n.-ésima válvula for positiva. Se aceitarmos que a condição de uma válvula não influencie a condição de outra, pode- remos escrever p(n) = P(X = n) =(~r-I ( : ), n = 1,2, "', VARIÁVEIS ALEATÓRIAS UNIDIMENSIONAIS I 75 Para verificarmos que esses valores de p(n) satisfazem à. Eq. (4.3) observaremos que L p(n) n-I 3 ( 1 1 ) - 1+-+-+... 4 4 16 3 1 1 - 4 1 - , 1-- 4 Comentário: Estamos empregando aqui o resultado de que a 8rrie 9!'omilrica 1 + r + r + .., converge para Il(1 - r) sempre que Ir I < 1. Este é um re- sultado que será mencionado muilas vezes. Suponha-se que desejemos calcular P(A), ondeA é defini~ocomo:10 experimentotcrmina depoisde 11mnúmeroPIU: de repetições,l Empregando n Eq, (4.4), teremos: .. 3 3 P(A) = L p(2n) = 16 + 256+ ... "=1 3 I 3 I 1 =-(1+ -+,.,)=--=- 16 ]6 16 1 5 1 - 16 4.3. A Distribuição Binomial Nos próximos capítulos, estudaremos pormenorizadamente algu- mas variáveis discretas importantes. Agora estudaremos apenas uma delas e, em seguida, a empregaremos para ilustrar alguns conceitos importantes. Exemplo 4.7. Suponha que peças saiam de uma linha de produ- ção e sejamclassificadascomo defeituosas (D) ou como não-defeituosas (N), isto é, perfeitas. Admita que três dessaspeças, da produção de um dia, sejam escolhidas ao acaso e classificadas de acordo com esse es- qUema.O espaço amostral para esse experimento, S, pode ser assim, apreSentado: S = {DDD,DDN, DND, NDD, NND,NDN, DNN, NNNJ, (Outra maneira de descrever S é como S =SI X S2 X S3, o produ- ~ocartesianode SI, S2 e S3, onde cadaSi = [D,NJ.) , uponhamos que seja 0,2 a probabilidade de uma peça ser defeItuosa e 0,8 a de ser não-defeituosa. Admitamos que essas probabiJidades ~ 76 I PROBABILIDADE sejam as mesmas para cada peça, ao menos enquanto durar o nosso estudo. Finalmente, admita-se que a classificação de qualquer peça em particular, seja independente da classificação de qualquer outra peça. Empregando essas suposições, segue-se que as probabilidades associadasaos vários resultados do espaço amostral S, como se explicou acima, são: (0,2)3, (0,8)(0,2)2, (0,8)(0,2)2, (0,8)(0,2)2, (0,2)(0,8)2, (0,2)(0,8)2, (0,2)(0,8)2, (0,8)3. Geralmente, nosso interesse não está dirigido para os resultados indivi- duais de S. Ao contrário, desejamos tão-somente conhecer qUllntas peças defeituosas seriam encontradas (não interessando a ordem em que tenham ocorrido). Isto é, desejamos estudar a variávelaleatória X, a qual atribui a cada resultado s e S o número de peças defeituosas encontradas em s. Conseqüentemente, o conjunto dos valores possí- veisde X é (O,1,2, 3}. Poderemos obter a distribuição de probabilidade de X, P(xi) = = P(X = xi)' da seguinte maneira: X = Ose, e somente se, ocorrer NNN; X = 1 se, e somente se, ocorrer DNN, NDN, ou NND; X = 2 se, e somente se, ocorrer DDN, DND, ou NDD; X = 3 se, e somente se, ocorrer DDD. (Note-se que (NNNI é equivalente a [X = 01 etc.) Então, p(O)= P(X = O)= (0,8)3 p(1) = P(X = 1)= 3(0,2)(0,8)2, p(2) =P(X= 2) = 3(0,2)2(0,8), p(3) =P(X= 3) = (0,2)3. Observe que a soma dessas probabilidades é igual ai, porque a soma pode ser escrita como igual a (0,8 + 0,2)3. Comentdrio: A explicação dada ilustra como as probabilidades em um con- tradomínio Rx (neste caso [O, 1, 2, 3/) são induzidos pelas probabilidades defini- das sobre o espaço amostral S. Porque a hipótese de que os oito resultados de S = (DDD,DDN,DND,NDD,NND,NDN. DNN,NNNI tenham as probabilidades dadas no Ex. 4.7, determinou o valor de p (x) para todo x € Rx' VARIÃVEIS ALEATÓRIAS UNIDIMENSIONAIS I 77 Vamos agora generalizar as noções introduzidas no ex. anterior. Definição: Consideremos um experimento S e seja A algum evento associado a S. Admita-se que P(A) = p e conseqüentemente P(Ã) = 1 - p. Considerem-se n repetições de S. Daí, o espaço amostral será formado po.:.todas as seqüênciaspossíveis {aloa2,.. ., a" G onde cada (lié ou A ou A, dependendo de que tenha ocorrido A ou A na i-ésima repetição de 8. (Existem 2" dessas seqüências.) Além disso, suponha-se que P(A) = p permaneça a mesma para todas as repetições. A variável aleatória X será assim definida: X = número de vezes que o e-ventoA tenha ocorrido. Denominaremos X de va- riável aleatória binomial, com parâmetros n e p. Seus valores possí- veis são evidentemente O, 1, 2,. . ., n. (De maneira equivalente, dire- mos que X tem uma distribuição binomial.) As repetições individuais de E serão denominadas Provas de Bernouilli. Teorema4.1. Seja X uma variável binomial, baseada em n repetições. Então, P(X = k) = (~ ) pk(l - p)n-k, k = O, 1, . . ., n. (4.5) Demonstração: Considere-se um particular elemento do espaço amostral de S satisfazendo à condição X = k. Um resultadocomo esse poderia surgir, por exemplo, se nas primeiras k repetições de & ocorresse A, enquanto nas últimas n - k repetições ocorresse A, isto é, AAA... AAAA... A. I I I I k n -- k Como todas as repetições são independentes, a probabilidade desta seqüênciaparticular seria pk(l - p),,-I<,mas exatamente essa mesma probabilidade seria associada a qualquer outro resultado para o qual X = k. O número total de tais resultados é igual a (k), por- que deveremos escolher exatamente k posições (dentre n) para o eVentoA. Ora, isso dá o resultado acima, porque esses (k) resul- tados são todos mutuamente excludentes. ~ 78 I PROBABILIDADE Comentários: (a) Para verificar noeso resultado, observemos que empre- gando o teorema binomial temos Lk~O P(X = k) = Lk-O (k) pk(l - p),,-k = [p + (1 - p)]" = I" = 1, como era de se esperar. Como as probabilidades G) pk(l - p),,-k são obtidas pelo desenvolvimento da expressão binomial [p + (1 - p)]n, eIà. recebe a denomi- nação de distribuição binomial. (b) Sempre que realizarmos repetições independentes de um experimento e estivermos interessados somente em uma dicotomia - defeituoso ou não-def,eic tuoso (perfeito); dureza acima ou abaixo de certo padrãoj nível de ruído em um sistema de comunicações acima ou abaixo de um limiar preestabelecido - esta- remos virtualmente tratando com um espaço amostral no qual podemos definir uma variável aleatória binomial. Enquanto as condições da experimentação permaneçam suficientemente estáveis, de modo que a probabilidade de algum atributo, digamosA, permaneçaconstante, poderemosempregaro modeloacima. (c) Se n for pequeno, os termos individuais da distribuiçãobinomialserão relativamente fáceisde calcular. Contudo, se n for relativamente grande, os cálculosse tornam bastante incômodos. Felizmente,foram preparadas tábuas de probabilidadesbinomiaisj existem várias dessas tábuas. (Veja o Apêndice.) Exemplo 4.8. Suponha-se que uma válvula eletrônica, instalada em determinado circuito, tenha probabilidade 0,2 de funcionar mais do que 500 horas. Se ensaiarmos 20 válvulas, qual será a probabili- dade de que delas, exatamente k, funcionem mais que 500 horas, k = O, 1, 2, ..., 20? PI.--) .. .x 12 13 14 15 16 17 18 Fig.4.6 Se X for o número de válvulas que funcionem mais de 500 ho- ras, admitiremos que X tenha uma distribuição binomial. Então, P(X = k) = e~)(0,2t(0,8ro-k. Os valores podem ser lidos na Tab. 4.1. Se marcarmos os valores dessa distribuição, obteremos o gráfico apresentado na Fig. 4.6. A configuração que observamos aqui é })astante geral. As probabilidades binomiais crescem monotonica- mente, até que atingem um valor máximo e, depois, decrescem mo- notonicamente. (Veja o Probl. 4.8.) ............- -- VARIÁVEIS ALEATÓRIAS UNIDIMENSIONAIS I 79 Tab. 4.1 P(X = O)= 0,012 P(X = 1) = 0,058 P(X = 2) = 0,137 P(X = 3) = 0,205 (As probabilidades P(X = 4) = 0,218 P(X = 5) = 0,175 P(X = 6) = 0,109 P(X = 7) = 0,055 restantes são menores P(X = 8) = 0,022 P(X = 9) = 0,007 P(X = 10) = 0,002 P(X = k) = 0+para k ~ 11 do que 0,001.) Exemplo 4.9. Ao operar determinada máquina, existe alguma probabilidade de que o operador da máquina cometa um erro. Po- de-se admitir, razoavelmente, que o operador aprenda, no sentido de que decresça a probabilidade de cometer um erro, se ele usar repeti- damente a máquina. Suponha que o operador faça n tentativas e que as n repetições sejam estatisticamente independentes. Suponhamos, especi- ficamente, que P (um erro ser cometido na i-ésima repetição) = l/(i + 1), i = 1, 2, ..., n. Admitamos que se pretendam 4 tentativas (isto é, n = 4) e defmamos a variável aleatória X como o número de operações da máquina, executadas sem erro. Note-se que X não tem distribuição binomial, porque a probabilidade de "sucesso" não é constante. Para calcular a probabilidade de que X = 3, por exemplo, pro- cede-se do seguinte modo: X = 3 se, e somente se, houver exatamente uma tentativa mal sucedida. Isto pode ocorrer na primeira, segunda, terceira ou quarta tentativas. Portanto, 1234 1134 1214 ~X=~= + + + 2345 2345 2345 1231 5 + =-. 2 3 4 5 12 Exemplo 4.10. Considere-se uma situação semelhante àquela apresentada no Ex. 4.9. Agora, admitiremos que exista uma pro- babilidade constante Pl de não cometer um erro na máquina, durante cada uma das n) tentativas, e uma probabilidade constante P2 ::s;p) de não cometer um erro em cada uma das n2 repetições subseqüentes. Seja X o número de operações bem sucedidas da máquina durante as n == n) + n2 tentativas independentes. Vamos procurar a expressão geral de P(X = k). Pelo mesmo motivo dado no exemplo precedente, X não tem distribuição binomiaI. Para obter P(X ==k), procede-se qa seguinte maneira: Sejam Yl o número de operações corretas durante as primeiras 711tentativas, e Y2 o número de operações corretas durante as n2 ~ntativas subseqüentes. Portanto, Y) e Y2 são variá.veis aleatórias Independentes e X = Y1 + Y2. Assim, X = k se, e somente se. 80 I PROBABILIDADE YI = r e Y2 = k - r, para qualquer inteiro r que satisfaça às condi~ ções O :::;r :::;nl e O :::;k - r :::;n2. As restrições acima, sobre r, são equivalentes aO:::; r:::; nl e k - n2 :::; r :::; k. Combinando-as, poderemos escrever máx. (O,k - - n2) :::;r :::;mín. (k, nl)' Portanto, teremos P(X = k) = r=m!n.(k,nl) ( ) ( n ) = L n: p~(l- PI)nl-r k ~ r pzk-r (1-P2)n2-(k-r). r=máx.(0,k-n2) Com nossa convenção usual de que m = O sempre que b > a ou b < O, poderemos escrever a probabilidade acima como nl ( ) ( ) nl r n2 k-r P(X = k) = r~ r Pl (1 - Pl)nl-rk - r p2 (1 - P2)"2-k+r (4.6) Por exemplo, se Pl = 0,2, P2= 0,1, nl = n2 = 10 e k = 2, a proba- bilidade acima fica, depois de um cálculo direto: P(X = 2) = to (1~) (0,2)'(0,8)10-r(2 1~ r) (0,1)2-'(0,9)8+<" = 0,27. Comentário: Suponha.-se que VI = V2. Neste caso, a Eq. (4.6) se reduz a (~) P~ (1 - Pl)n-k, porque agora a variável aleatória X tem. uma distribuição bino:nial. Para verificar que é assim, note-se que poderemos escrever, (desde que nl + ~ = n): P(X = k) = p~(1 - V.)ft-k~O( ~l) ( k ~ r ) Para verificar que a somá acima é igual a (~), basta. comparar os coeficientes das potências de xk em ambos os membros da identidade (1 + x)nl (1 + X)"2== = (1 + X)"l+nZ. .4.4. Variáveis Aleatórias Contínuas Suponha-se que o contradomínio de X seja formado por um número finito muito grande de valores, digamos todos os valores ;r; no intervalo O:::; x :::; 1, da forma: O; 0,01; 0,02; ...; 0,98; 0,99; 1,00. A cada um desses v~lores está associado um número não-ne- gativo p(Xi) = P(X ':" Xi), i = 1, 2, . . ., cuja soma é igual a 1. Esta. operação está representada geometricamente na Fig. 4.7. ~ VARIÁVEIS ALEATÓRIAS UNIDIMENSIONAIS I 81 Já salientamos anteriormente que poderia ser mateÍnaticamente ais fácil idealiz~r a apresentação probabilística de X, pela m . suposição d e que X pudesse tomar todos os valores possíveis, ° :::;x :::;1. Se fizenÍlos isso, que acontecerá às probabilidades no ponto p(Xi)? Co- mo os. valores possíveis de X não são numeráveis, não podemos real- mente falar do i-ésimo valor de X, e, por isso, p(Xi) se toma sem sentido. O que faremos é substituir a função P definida somente para Xl, X2,. .. por uma função f definida (neste contexto) para todos os valores de x, O :::;X :::; 1. As proprie- dades da Eq. (4.3) serão substituídas por f(x) ~ O e foi f(x)dx = 1. Vamos proceder formalmente como se segue. I'(;c) ~, 1 Fig.4.7 Definição: Diz-se que X é uma variável aleatória contínua, se existir uma função f, denominada função densidade de probabilidade (fdp) de X que satisfaça às seguintes condições: (a) f(x);;' Opara todo x, (b) f~ :f(x)dx= 1, (4.7) (c) para quaisquer a, b, com - 00 < a < b < + 00, teremos P(a~X~b)=fg f(x)dx. (4.8) Comentários: (a) Estaremos essencialmente dizendo que X é uma variável aleatória contínua, se X puder tomar todos os valores em algum intervalo (c, d), onde c e d podem ser - 00e + 00,respectivamente. A existência estipulada de uma fdp constitui um artifício matemático, que possui considerável apelo intuitivo e toma nossos cálculos mais simples. Em relação a isso, também devemos salientar que, quando supomos que X seja uma variável aleatória contínua, estamos tratan- do com uma descrição idealizada de X. (b) P(c < X < d) representa a área sob a curva no gráfico da Fig. 4.8, da fdp f. entre x = c e x = do f(x) ~ .. . ' '..) r~ x-c x-d Fig.4.8 ~ 82 I PROBABI LIDADE (c) Constitui uma conseqüência da descriçio probabillstica de X, acUna que, para qualquer valor especificado de X, digamos %o,teremos P(X = :to) = O' porque P(X = :to) = .1;:° J(z) dz = O. Este resultado pode parecer muito con~ tntrio t\ nossa intuição. Contudo, devemoS compreender que se permitirmos que X tome todos os valores em algum intervalo, entAo a probabilidade zero nlo é equivalente t\ impossibilidade. Por isso, no caso contínuo, P(A) = O nlo implica ser A = li, o conjunto vazio. (Veja-o Teor. 1.1.) Explicando iss, menos rigo- rosamente, considere-se a escolha de um ponto ao acaso, no segmento de reta IzlO .:S z.:s 21. Muito embora possamos estar desejosos em concordar (Para objetivos matemáticos) que cada ponto imaginável no segmento possa ser resultado de nosso experimento, ficaríamos completamente surpreendidos quanto a isso, 88 de fato escolhéSSemosprecisamente o ponto médio do segmento ou qualquer outro ponto especiJicado. Quando expressamos isto em linguagem matemática rigorosa, dizemos que o evento tem "probabilidade ,!ero". Tendo em vista essas observações, as seguintes probabilidades serl.o todas iguais, se X for uma variável aleatória contínua: P(c~ X ~ d), P(c~X < d), P(c< X ~d), e P(c < X < d). (d) Apesar de nlo verificarmos aqui os detalhes, pode-se mostrar que essa atribuição de probabilidades a eventos em Rx satisfaz aos axiomas básioos da probabilidade [Eq. (1.3)1, onde poderemos tomar Izl - '" < z < + '"I como nosso espaço amOlltral. (e) Se uma função J* satisfizer às condi9lles J* (z) ~ O para todo z, e f-+,,;" J* (z) dz = K, onde K é um número real positivo (nlo necessariiunente igual a 1), entAo J* nlo satisfaz a todas as condições para ser uma fdp. No entanto, poderemos facilmente definir uma nova função, digamos J, em termos deJ*, assim: J(z) = J*(z) K para todo z. Em conseqüência, J satisfá a todas as condições de uma fdp. (f) Se X tomar valores somente em algum intervalo finito [a, b1 poderemos simplesmente pôr J(z) = O para todo z EE[a, bl. Em conseqüência, a fdp fican defmida para todo8os valores reais de z, e poderemos exigir quef-+"'- J(z) dz=l. Sempre que a fdp for especificada somente para determinados valores de z, deve- remos supor que seja zero em todos os demais. (g) J(z) não representa a probabilidade de coisa algumal Anteriormente j' salientamos que, por exemplo, P(X = 2) = O e, conseqüentemente, J(2) cer- tamente nlo representa essa probabilidade. Somente quando a função for in- tegrada entre dois limites, ela produzirá. uma probabilidade. Poderemos, con- tudo, dar uma interpretação deJ(x)âz, da seguinte maneira: Do teorema do valor médio, em Cálculo, tem-se que l x+.:lX P(x ~ X ~ z + .:lx)= x j(s) ds = Mjm, z ~ ~~ z + .:lx. -- VARIÁVEIS ALEATÓRIAS UNIDIMENSIONAIS I 83 l>x for pequeno, j(x).:lx será aproximadamente igual a P(x:S X.:S x + .:lx)-, ~;ej for contínua à direita, esta aproximação se tornará mais exata quando l>x--->O.) (h) Devemos novamente salientar que a distribuição de probabilidade (neste caso a fdp) é induzida em Rx pela probabilidade subjacente associada com eventos eJDS. Por isso, quando escrevemos P(c < X < d), queremos significar como sem- re P[c < X(s) < dI, que por sua vez é igual a P[sl c < X(s) < d], já que esses Pventos são equivalentes. A definição anterior, Eq. (4.8), estipula essencialmente :existência de UJDa fdp J definida sobre Rx tal que P[Bic< X(s) < dI = jd J(x) dx. Novamente suprimiremos a natureza funcional de X e, por isso, trataremos so- mente com Rx e a fdp j. (i) No caso contínuo, também poderemos considerar a seguinte analogia com a Mecdnica: Suponha-se que temos uma massa total de uma unidade conti- nuamente distribuída sobre o intervalo a ~ x ~ b. Nesse caso, J(x) representa a densidade de massa no ponto x e J;d}(x) dx representa a massa total contida no intervalo c ~ z ~ d. Exemplo 4.11. A existência de uma fdp foi admitida na exposição de uma variável aleatória contínua. Vamos considerar um exemplo simples,no qual poderemos facilmente determinar a fdp, fazendo uma suposiçãoapropriada sobre o comportamento probabilístico da variável aleatória.Suponhamos que um ponto seja escolhido no intervalo (0,1). Representemospor X a variávelaleatória cujo valor sejaa abscissax do ponto escolhido. Supor: Se l for qualquer intervalo em (0,1), então Prob [X E l] será diretamente proporcional ao cumprimento de l, digamos L (1). Istoé~Prob [X E l] ::::kL(1), onde k é a constante de proporcionalida- de. (E fácil verificar, tomando-se l ::::(0,1) e observando-se que L [(0,1)]::::1e Prob [X E (0,1)]:::: 1,que k ::::1.) Obviamente,X torna todos os valores em (0,1). Qual é sua fdp? Assim,podemosencontrar uma função f tal que P(a< X < b)::::J ~ f(x)dx? Note que, se a < b < Oou 1< a < b, P(a < X < b) ::::Oe, por is- SO,f(x):::: O.Se O< a < b < I,P(a<X<b):::: b - a e, conseqüente- rnente,f(x):::: 1.Portanto, encontramos f(x):::: { 1,O<x< 1 O,para quaisquer outros valores. ~ - ...........- 84 I PROBABILIDADE VARIÁVEIS ALEATÓRIAS UNIDIMENSIONAIS I 85 Evidentemente, f(x) ~ Oe f-+~~ f(x)dx = fr/2x dx = 1. Para calcu- lar P(X:( 1/2), deve-seapenas calcular a integral fol/2 (2x) dx = 1/4. Sabemos, de nossO emprego de modelos determinísticos, que certas funções gozam de papel mais importante que outras. Por exemplo, as funções linear, quadrática, exponencial e tri'gonométrica têm apel vital na .explicação de modelos determinísticos. Ao desenvol- ~er modelQs não-determinísticos (isto é, probabilísticos) verificare- moS que certas""variáveis aleatórias são de notável importância. Exemplo 4.12. Suponhamos que a variável aleatória X seja contínua. (Veja a Fig. 4.9.) Seja a fdp f dada por f(x) = 2x, O< x < 1, = O, para quaisquer outros valores. fl..x) \ ,~-, .. 4.5. Função de Distribuição Acumulada fl..x) x= 1500 x = 2500 Vamosintroduzir outro importante conceito geral, neste capítulo. Definição. Seja X uma variável aleatória, discreta ou contínua. Define-se a função F como&. Junção de distribuição acumulada da variável aleatória X (abreviadamente indicada fd) como F(x) = = P(X :::;x). Teorema4.2. (a) Se X for uma variável aleatória discreta x Fig.4.9 Fig. 4.10 F(x) = :E p(Xj), j (4.9) o conceito de probabilidade condicionada, explicado no Capo3, pode ser significativamente aplicado a variáveis aleatórias. Assim, no exemplo acima. podemos calcular p( X :::;+ It :::; X :::; ~). Aplicando-se diretamente a definição de probabilidade condicionada, teremos onde o somatório é estendido a todos os índices j que satisfaçam à condição Xj :::;x. (b) Se X for uma variável aleatória contínua com fdp f, P(~ < X < ~) 3 - - 2 P(~ < X < ~) 3 - - 3 f l/2 1132x dx 5/36 5 = fi;~ 2x dx = 1/3 = 12~ Exemplo 4.13. Seja X a duração da vida (em horas) de um certo tipo de lâmpada. Admitindo que X seja uma variável aleató- ria contínua, suponha-se que a fdp f de X seja dada por p (X < ~ \ ~ <' X < ~) - 2 3 - - 3 F(x) = 1: f(s)ds. (4.10) Demonstração. Ambos os resultádos decorrem imediatamente da definição. Exemplo 4.14. Suponhamos que a variável aleatória X tome os três valores O, 1 e 2, com probabilidades 1/3, 1/6 e 1/2, respectiva- mynte. Então, f(x) = a/x 3, 1.500 :::; x :::; 2.500, = O,para quaisquer outros valores. (Isto é, está se atribuindo probabilidade zero aos eventos! X < 1.500I e IX > 2.500}.) Para calcular a constante a,. recorre-se à condição f-~~ f(x) dx = 1, que neste caso se torna J;..~gr: (a/x3)dx = 1. Daí se obtém a = 7.031.250. O gráfico de f está apresentado na Fig. 4.10. Em capítulo posterior estudaremos, pormenorizadamente, mUl- tas variáveis aleatórias importantes, tanto discretas como continuas. = 1 se x ~ 2. (Observe-seque é muito importante indicar a inclusão ou a exclusão dos r . . lInites, na descrição dos diversos intervalos.) O gráfico de F está apresentado na Fig. 4.11. ~ F(x) = O se x < O, 1 se O:::;x < I, =- 3 1 se 1 :::;x < 2, - 2 86 I PROBABILIDADE Flx) ih-, , .x 3 1 2 3 Fig. 4.11 Exemplo 4.15. Suponhamos que X seja uma variável continua com fdp f(x) = 2x, O< x < 1, = O, para quaisquer outros valores. Portanto, a fdp de F é dada por F(x) = O se x :5 O, = [Z 28 d8 = X2 se O< x :5 1, =lsex>1. o gráfico está apresentado na Fig. 4.12. F(x) x I" Flg. 4.12 Os gráficos apresentados nas Figa. 4.11 e 4.12 para as fd são, em cada caso, bastante típicos, no seguinte sentido: (a) Se X for uma variávelaleatória discreta, com um número finito de valores possíveis, o gráfico da fd será constituído por segmentosde reta horizontais (nesse caso, a fd se denomina função em degraus). A função F é contínua, exceto nos valores possíveis de X: XI, . . .,xn' . . . No valor xi o gráfico apresenta um "salto" de magnitude p(xi) === =P(X=xi)' (b) Se X for uma variável aleat6ria contínua, F será uma função contmua para todo x. -- VARIÃVEIS ALEATÓRIAS UNIDIMENSIONAIS I 87 (c) A fd F é definida para t0d08os valores de x, o que é um motivo . unportante para considerá-Ia. Existem duas outras importantes propriedades da fd, que re- sumiremos no teorema seguinte: Teorema4.3. (a) A função F é não-decrescente. Isto é, se Xl ~ X2, teremos F(Xl) :5 F(X2). (b) lilIb->-.F(x) = O e lifiz-+..F(x) = 1.[Freqüentemente, escre- vemos isto como F( - co) = O e F( co) = 1.] Dem0n8tração:(a) Definamos os eventos A e B, assim: A = = IX :5Xl}, B = IX :5X2}. Portanto, como Xl:5 X" teremos A C B e, pelo Teor. 1.5,P(A) :5 P(B), que é o resultadodesejado. (b) No casocontinuo,teremos: F( - co.)=~~.. I".. f(8) d8 = O, F( co) =l.~f. /(8) d8 = 1. No casodiscreto, o raciocfnioé análogo. A função de distribuição (acumulada) é importante por muitas razões. Isto é particularmente verdadeiro quando tratarmos com uma variávelaleatória contínua, porque nesse caso não poderemos estudar o comportamento probabilístico de X através do cálculo de P(X =x). Aquelaprobabilidade é sempreigual a zero no caso contínuo. Contudo, poderemosindagar de P(X ~ x) e, como demonstra o teorema seguin- te, obter a fdp de X Teorema4.4. (a) Seja F a fd de uma variável aleat6ria con- tinua, com fdp f. Então, d f(x) = dx F(x), para todo x no qual F seja derivável. (b) Seja X uma variável aleat6ria discreta, com valores possi- veis XI, X2,.. " e suponha-se que esses valores tenham sido indexados de modo que XI < X2 < ... Seja F a fd de X. Então, p(Xj) = P(X = xJ) "" F(xj) - F(xj-I). (4.12) Demonstração:(a)F(x)=P(X :5 x) = J.:.. f(s) ds. Por isso, BJ?li- cando-seo teorema fundamental do Cálculo, obteremos F'(x) = f(x). ~ -- 88 I PROBABILIDADE VARIÁVEIS ALEATÓRIAS UNIDIMENSIONAIS I 89 (b) Como admitimos XI< X2< ..., teremos F(Xj) = P(X = Xj U X = Xj-I U" .U X = XI) = pU) + pU - 1) +.. . + p(I). 4.6. Distribuições Mistas F(x) = O, X ~ O, = 1 - e-, x > O. Restringimos nossa explanação tão-somente a variáveis alea- 'rias que sejam discretas ou contínuas. Tais variáveis são certa- to . I. - C d h ' . ente as mais Importantes nas ap Icaçoes.ontu o, a situações mm que poderemos encontrar um tipo misto: a variável aleatória X eode tomar alguns valores diferentes, digamos Xl,. . . Xn, com proba- ~ilidade nA,o-nula, e também tomar todos os valores em algum in- tervalo, digamos a ~ X ~ b. A distribuiç:w de probabilidade de tal variável aleatória seria obtida pela combinação das idéias já exa- minadas na descrição de variáveis aleatórias discretas e de contí- nuas, como se verá a seguir. A cada valor x. associa-se um número p(x.) tal que p(x.) ~ O para todo i, e tal que L~-l p(x.) = p < 1. Em seguida, define-se uma função j, satisfazendo a j(x) ~ O, f.b f(x) dx = 1 - p. Para todo a, b, com - 00 < a < b < + oo,P(a';;;; <X< b) = f.b f(x) dx + L P(xi)' Desta maneira, aten- {i:o<;;xi<;;b} deremos à condição P(S) = P( - 00 < X < CX» = 1. Uma variável aleatória de tipo misto poderia surgir da maneira explicada a seguir. Supónha-se que estejamos ensaiando algum equipamento e façamos igual a X o tempo de funcionamento. Em muitos problemas, descreveremos X como uma variável aleatória contínua, com valores possíveis X ~ O. No entanto, podem surgir situações nas quais exista uma probabilidade não-nula de que a peça não funcione de modo algum, isto é, falhe no momento X = O. Nesse caso, desejaríamos modificar nosso modelo e atribuir uma probabili- dade p > O ao resultado X = O. Conseqüentemente, teríamos P(X = O) = P e P(X > O) = 1 - p. Deste modo, p descreveria a distribuição de X no ponto O, enquanto a fdp j descreveria a distri- buiçãopara valoresde X > O.(Vejaa Fig. 4.13.) . }{x) ~ ,- . P(X~O)=p l"'/(X)dX=I-P ~ E F(Xj-l) = P(X = Xj-I U X = Xj-2 U'" U X = XI) = p(j - 1) + pU - 2)+ .. .+ p(I). Portanto, F(Xj)- F(xj-I) = P(X = Xj)= p(Xj). Comentdrio: Vamos resumidamente reconsiderar a parte (o) do Teorema 4.4. Recordemos a definição de derivada de uma função F: F(x)= lim F(x+h)-F(x) h"'" o h = lim P(X <;;x + h) - P(X <;;x) h"'" 0+ h = lim ~ [P(x < X <;;x +h)1. h"'" 0+ h Portanto, se h for pequeno e positivo, F' (x) =[(x) ~P(x <X<;x +h) h . Assim, [(x) é aproximadamente igual à "quantidade de probabilidade no intervalo (x, x + h) pelo comprimento h". Daí o nome [unção densidade de probabilidade. Exemplo 4.16. Suponha-se que uma variável aleatória conti- nua tenha a fd F dada por Kesse caso, F'(x) = e- para x > O,e, por isso, a fdp será dada por j(i) = e-, x ~ O, = O, para quaisquer outros valores. x X=Q x=b Cumentário: f: oportuno dizer uma palavra final sobre a tenninologia. Esta tenninologia, muito embora ainda não unifonne, tornou-se bastante padroni- zada. Quando falamos da distribuiçl!O de probabilidade de uma variável alea- tória X, nos referimos à sua fdp se"X fOr continua, ou A sua função de probabili- dade no ponto, p, definida para Xl>x~,... se X for discreta. Quando falamOS da função de distribuição acumulada, ou algumas vezes apenas Junçl!o de distri- buição (ou[unção de repartição),queremos semprenos referir a F, ondeF(x) ::::: =P(X <;;x). Fig. 4.13 Fig. 4.14 4.7. Variáveis Aleatórias Uniformemente Distribuídas Nos Caps. 8 e 9, estudaremos minuciosamente muitas variáveis aleatórias di t . á . d . scre as e contínuas Importantes. J mtro UZImos a --- .........- 90 / PROBABILIDADE VARIÃVEIS ALEATÓRIAS UNIDIMENSIONAIS / 91 Definição. Suponha-se que X seja uma variável aleatória COn- tínua, que tome todos os valores no intervalo [a, b], no qual a e b sejam ambos finitos. Se a fdp de X for dada por 1 f(x) = ~b ' -a Exemplo 4.18. A dureza H de uma peça de aço (avaliada na escala Rockwell) pode-se supor ser uma variável aleatória contínua uniformemente distribuída sobre o intervalo [50, 70], da escala B. Conseqüentemente, importante variável aleatória binomial. VI)JIlOS agora examinar, resumidamente; uma importante variável aleatória contínua. f(h) = 2~' 50 < h < 70, a ~ x ~ b, (4.13) = O, para quaisquer outros valores. = O, para quaisquer outros valores, diremos que X é uniformemente distribuída sobre o intervalo [a, b]. (Veja a Fig. 4.14.) COTMntárws:(a) Uma variável aleatória uniformemente distribuída tem uma fdp que é ronstanlesobre o intervalo de definição. A fim de satisfazer à condiçãof--+:'" f(x) dx = 1, essaconstantedeve ser igual ao inverso do compri- mento do intervalo. (b) Uma variável aleatória uniformementedistribuída representa o análogo continuo dos resultados igualmente prováveis, no seguinte sentido. Para qual- quer subintervalo[C,d],onde a.s c < d.s b,P(c.s X .s d) é a mesma para todos os subintervalos que tenham o mesmo comprimento. Isto é, Exemplo 4.19. Vamos obter a expressão da fd de uma variável aleatória uniformemente distribuída. F(x) = P(X ~ x) = f"'", f(s)ds =0 sex<a, x - a = -b se a ~ x < b, -a = 1 se x ~ b. O gráficoestá apresentadona Fig.4.15. .f. d d - c P(c.s X.s d) = . f(z)dz = - b-a 4.8 UmaObservação e, por isso, depende unicamente do comprimento do intervalo e não da posição desse intervalo. (c) Agora podemos tornar mais precisa a noção intuitiva de escolMr ao acaso um ponto P, em um intervalo [a, bJ. Por isto simplesmente queremos dizer que a coordenada z do ponto escolhido, digamos X, é uniformemente distribuída sobre !a, bl. EXémplo 4.17. Um ponto é escolhido ao acaso no segmento de reta [O, 2]. Qual será a probabilidade de que o ponto' escolhido esteja entre 1 e 3/2? Fazendo-se X representar a coordenada do ponto escolhido, nós temos que a fdp de X é dada por f(x) = 1/2, O< x < 2 e, portanto, P(l ~ X ~ 3/2)= 1/4. x Repetidamente temos salientado que em algum estágio de nosso desenvolvimentode um modelo probabilístico, algumas probabilidades devem ser atribuídas a resultados, com base ou em evidência experi- mental(como as freqüênciasrelativas,por exemplo) ouem algumaoutra consideração,como a experiência passada com o fenômeno que esteja em estudo. A seguinte questão pode ocorrer ao estudante: Por que nós não podemos obter todas as probabilidades em que estejamos interessa- dos por tais meios não-dedutivos? A resposta é que muitos eventos cujas probabilidades desejamos conhecer são tão complicados que nosso conhecimento intuitivo é insuficiente.Por exemplo, suponhamos que 1000 peças estejam saindo diariamente de uma linha de produção, algumasdas quais defeituosas. Desejamos saber a probabilidade de ter 50 ou menos peças defeituosas em certo dia. Mesmo que estejamos familiarizadoscom o comportamento geral do processo de produção, poderá ser difícil para nós associarmos uma medida quantitativa com o eVento:50 ou menos peças são defeituosas. No entanto, poderemos ser capazesde fazer a afirmação de que qualquer peça individualtenha probabilidade de 0,10 de ser defeituosa. (Assim a experiência passada nos d' . ' a a lllforrnaçãode que cerca de 10 por cento das peças são defei- F(x) x=a x=b Fig. 4.15 ~ -- 92 I PROBABILIDADE VARIÁVEIS ALEATÓRIAS UNIDIMENSIONAIS I 93 tuosas.) Além disso, poderemos estar inclinados a admitir que, indivi. dualmente, as peças sejam defeituosas ou perfeitas independentemente uma da outra. Agora, poderemos proceder dedutivamente e obter a probabilidade do evento em estudo. Assim, se X = número de peças defeituosas, 50 ( 1000) P(X ~ 50) =k~O k (O,lO)k (0,90)1000 - k 4.5. Suponha que a máquina 1 produza (por dia) o dobro das peças que - produzidas pela máquina 2. No entanto, 4% das peças fabricadas pela m&.- sa;na 1 tendem a ser defeituosas, enquanto somente cerca de 2% de defeituosas q od~z a máquina 2. Admita que a produção diária das duas máquinas seja mis- pr da Uma amostra aleatória de 10 peças é extraída da produção total. Qual tura ~. será a probabilidade de que essa amostra contenha 2 peças defeituosas? 4.6. Foguetes são lançados até que o primeiro lançamento bem sucedido tenha ocorrido. Se isso não ocorrer até 5 tentativas, o experimento é suspeoso e o equipamento inspecionado. Admita que exista uma probabilidade constante de 0,8 de haver um lançamento bem sucedido e que os sucessivos lançamentos sejam independentes. Suponha que o custo do primeiro lançamento seja K dó- lares, enquanto os lançamentos subseqüentes custam K/3 dólares. Sempre que ocorre um lançamento bem sucedido, uma certa quantidade de informação é obti- df!.,a qual pode ser expressa como um ganho financeiro de C dólares. Sendo T o custo líquido"desse experimento, estabeleça a distribuição de probabilidade de T. o que se quer destacar aqui é que os váriosmétodos que nós dedu- zimos para calcular probabilidades (e outros que serão estudados subseqüentemente) são de enorme importância, porque com eles pode- remos avaliar probabilidades associadasa eventos bastante complicados, as quais seriam difíceis de obter por meios intuitivos ou empíricos. Problemas 4.7. Calcule P(X = 5), onde X é a variável aleatória definida no Ex. 4.10. suponha que nI ==10, 1t2= 15, PI = 0,3 e P2 = 0,2. 4.8. (Propriedades das Probabilidades Binomiais.) Na explanação do Ex. 4.8, um padrão geral para as probabilidades binomiais (k)pk(1 - p)n-kfoisugerido. Vamos denotar essas probabilidades por Pn(k). (a) Mostre que, para O~ k < n, temos 4.1. Sab&-se que uma determinada moeda apresenta cara três vezes mais freqüentemente que coroa. Essa moeda é jogada três vezes. Seja X o número de caras que aparece. Estabeleça a distribuiçio de probabilidade de X e tam- bém a fd. Faça um esboço do gráfico de ambu. 4.2. De wn lote que contém 25 peças, das quais 5 são deleitu08lll!, 8ão esco- lhidas ~ ao acaso. Seja X o número de defeitU0S88encontradas. Estabeleça a distribuição de probabilidade de X, quando: (o) AB peças forem escolhidas com reposição. (b) AB peças forem escolhidas sem reposição. P(X> . + elx > .)-P(X ~ e). Pn(k + l)/Pn(k) = [(n - k)/(k + 1)] [1'/(1- 1')]. (b) Empregando (a), mostre que (i) Pn(k + 1)> Pn(k) se k < np - (1 - p), (ii) Pn(k+ 1) = Pn(k) se k = np - (1 - 1'), (iü) Pn(k + 1) < Pn(k) se k > np - (1 - 1'). (c) Mostre que se np - (1 - 1') for um inteiro, Pn(k) toma seu valor máximo para dois valores de k, a saber, ko = np - (1 - 1') e ko' = np - (1 - p) + 1. (d) Mostre que se np - (1 - 1') não for um inteiro, então Pn(k) toma seu valor máximo quando k for igual ao men<;>rinteiro maior que ko. (e) Mostre que se np - (1 - 1') < O, Pn(O)> Pn(l) > ... > Pn(n), enquanto se np - (1 - 1') = O, Pn(O)= Pn(1) > Pn(2) > ... > Vn(n). 4.9. A variável aleatória contínua X tem para fdp: }(z) = x/2, O~ x ~ 2. São feitas duas determinações independentes de X. Qual será a probabilidade ?e que ambas essas determinações sejam maiores do que I? Se três determinações In~ependentes forem feitas, qual a probabilidade de que exatamente duas delas sejam rnaiores do que I? 4.10. Possa ser r Seja X a duração da vida de uma válvula eletrônica e admita-se que X .. be-bo: > epresentada por uma vanável aleatória contínua, com fdp }(z) = , :dO. ~eja Pj = P(j ~ X < j + 1). Verifique que Vj é da forma (1 - a)aj eterrninea. se b4.11. A variável aleatória contínua X tem fdp }(z) = 3X2, -1 ~ x ~ O for Um número que satisfaça a -1 < b < O,calcule P(X';;' bIX < b/2). 4.3. Suponha que a variável aleatória X tenha os valores po8I!fveis1, 2, 3,. . .1 e P(X-i) - l/2j, j - 1,2,... (a) Calcule P(X eer par). (b) Calcule P(X ~ 5). (o) Calcule P(X eer diviafvel por 3). 4.4. Considere uma variável aleatória X com resultados possfveis:~, 1, 2,. . . Suponha que P(X ,.J) -(1 - a)aj, j = O,1,2, . .. (a) Para que valores de a o modelo acima tem eentido? (b) Verifique que essa expres8ão representa uma legítima distribuição de probabilidade. (o) Mostre que, para quaisquer dois inteiros positivos. e e, ~ ~ 94 / PROBABILIDADE VARIÁVEIS ALEATÓRIAS UNIDIMENSIONAIS I 95 4.12. Suponha que f e g sejam fdp no mesmo intervalo a ~ x ~ b. (a) Verifique que j + g não é uma fdp nesse interv~o. (b) Verifique que, para todo número {l, O < {l < 1, {lf(x) + (1 - {l)g(x) é uma fdp nesse intervalo. 4.13. Suponha que o gráfico na Fig. 4.16 represente a fdp de uma variável aleatória X. 4.17. Cada uma das seguintes funções representa a fd de \Una variável alea- tória continua. Em cada caso, F(z) = Opara z < a e F(z) = 1 para x > b, onde [ b) é o intervalo indicado. Em cada caso, (',b~('e o gráfico da função F, deter- ;ine a fdp f e faça o seu gráfico. Também verifique que f é ~lma fdp. (a) F(x) = x/5, O2 x.s 5. (b) F(z) = (2/7r)sen-I (yI;-), O.s x.s 1. i (c) F(x) = e3.r,- '" < x.s O. (d) F(z) = z3/2 + 2' -1 .s z .s 1. (a) Qual será a relação entre a e b? (b) Se a > O e b > O, que se pode dizer do maior valor que b pode tomar r (Veja a Fig. 4.16.) f(x)b . x x= -a x=b 4.18. Seja .\ a duração da vida (medida. em horas) de um dispositivo eletrÔnico. Suponha que X seja X variável aleatória contínua com fdp fez) = = k/zn, 2.000 .s z.s 10.000. (a) Para n = 2, determine k. (b) Para n = 3, determine k. (c) Para n em geral, determine k. (d) Qual a probabilidade de que o dispositivo falhe antes que 5.000 horas se tenham passado? (e) Esboce a fd F(I) para a letra (c) e deter- mine sua. forma algébrica. Fig. 4.16 4.19. Seja X uma variável aleatória com distribuição binomial, baseada em 10 repetições de um experimento. Se p = 0,3, calculeas seguintesprobabili- dades, empregando a tábua da distribuição binomial do Ap~ndi<le: (a) P(X ~ 8); (b) P(X = 7); (c) P(X > 6). 4.14. A percentagem de álcool (100 X) em certo composto pode ser consi- deradaumavariávelaleatória,_onde X, O< X < 1, tema seguinte'fdp:. f(x) = 20x3(1- x), O<x<1. 4.20. Suponha que X seja uniformemente distribulda sobre [- a, + aI, onde a > O. Quando posslvel, determine a de modo que as seguintes relações sejam satisfeitas: (a) Estabeleça a expressão da fd F e esboce seu gráfico. (b) Calcule P(X ~ 2/3). (c) Suponha que o preço de venda desse composto dependa do conteúdo de álcool. Especificamente, se 1/3 < X < 2/3, o composto se vende por Cl dó- lares/galão; caso contrário, ele se vende por C2 dólares/galão. Se o custo for C3 dólares/galão, calcule a distribuição de probabilidade do lucro líquido por galão. 4.15. Seja X uma. variável aleatória continua, com fdp dada por (a) P(X > 1) = + . (d) P(X <~) = 0,3. 2 (b) P(X > 1) = .!- . 2 (c) P(X <~) = 0,7. 2 (e) P(IXI < 1) = P(IXI > 1). f(x) = ax, O~ x ~ 1, = a, 1.s x ~ 2, = -ax + 3a, 2 ~ x ~ 3, = O, para. quaisquer outros valores. (a) Determine a constante a. (b) Determine a fd F e esboce o seu gráfico. (c) Se Xli X2 e X3 forem três observações independentes de X, qual será a proba- bilidade de, exatamente, um desses três números ser maior do que 1,5? 4.21. Suponha que X tenha distriblÚção uniforme sobre [O,aJ, a > O. Res- ponda às perguntas do Probl. 4.20. 4.22. Um ponto é escolhido ao acaso, sobre uma reta de comprimento L. Qual é a probabilidade de que o quociente do segmento mais curto para o mais longo seja menor do que 1/4? 4.16. O diâmetro X de um cabo elétrico supõe-se ser uma variável aleatória continua X, com fdp f(x) = 6x(1 - x), O~ x ~ 1. (a) Verifique que essa expressão é I1ma fdp e esboce o seu gráfico. (b) Obtenha uma. expressão para a. fd de X e esboce o seu gráfico. (c) Determine um número b tal que P(X < b) = 2P(X > b). (d) Calcule P(X ~ 1/211/3 < X < 2/3). 4.23. Uma fábrica produz 10 recipientes de vidro por dia. Deve-se supor que exista uma probabilidade constante p = 0,1 de produzir um recipiente defei- tuoso. Antes que esses recipientes sejam estocados, eles são inspecionados e os defeituosossão separados. Admita que exista uma probabilidade con<tante r = 0,1 de que um recipiente defeituoso seja mal c1l1SSificado.Faça X igual ao número de recipientes classificados como defeituosos ao fim de um dia de produção. (Admita que todos os recipientes fabricados em um dia sejam inspecionados na- quele dia.) (a) CalculeP(X = 3) e P(X > 3). (b) Obtenha a expressãode P(X = k). d 4.24. Suponha que 5 por cento de todas as peças que saiam de uma linha e fabnc""õ~' . . . . n d -r-v sejam defeItuosas. Se 10 dessas peças forem escolhidas e lnspeCIO- t a das, qual será a probabilidade de que no máximo 2 defeituosas sejam encon- ra as? ~ ~ 96 I PROBABILIDADE 4.25. Suponha que a duração da vida (em horas) de uma certa válvula seja uma variável aleatória contínua X com fdp l(x) = 100/x2, para x > 100, e zero para quaisquer outros valores de x. (a) Qual será a probabilidade de que uma válvula dure menos de 200 horas se soubermos que ela ainda está funcionando após 150 horas de serviço? ' (b) Se três dessas válvulas forem instaladas em um conjunto, qual será a probabilidade de que exatamente uma delas tenha de ser substituída após 150 horas de serviço? (c) Qual será Q número máximo de válvulas que poderá ser colocado em um conjunto, de modo que exista uma probabilidade de 0,5 de que após 150 horas de serviço to~as elas ainda estejam funcionando? 4.26. Um experimento consiste em n tentativas independentes. Deve-se admitir que por causa da "aprendizagem", a probabilidade de obter um resul- tado favorável cresça com o número de tentativas realizadas. Especificamente, suponha que P (sucesso na i-ésima repetição) = (i + l)/(i + 2), i = 1,2, ..., n. (a) Qual será a probabilidade de ter ao menos 3 resultados favoráveis, em 8 repetições? (b) Qual serll a probabilidade de que o primeiro resultado favorllvel ocorra na oitava repetição? Funções de Variáveis Aleatórias Capítulo 5 5.1. Um Exemplo 4.27. Com referência ao Ex. 4.10: (a) Calcule P(X = 2), se n = 4. (b) Para n arbitrllrio, verifique que P(X = n - 1) = P (exatamente uma tentativa mal sucedida) é igual a [l/(n + l)]L~-l (l/i). Suponhamos que o raio do orifício de um tubo calibrado com precisão X seja considerado uma variável aleatória contínua com fdp j. Seja A == 7rX2 a área da secção transversal do orifício. É intuitivamente evidente que, um& vez que o valor de X é o resul- tado de um experimento aleatório, o valor de A também o é. Quer dizer, A é uma variável aleatória (contínua) e desejamos obter sua fdp, que denotaremos g. Esperamos, uma vez que A é função de X, que a fdp g seja de algum modo deduzível do conhecimento da fdp J. Neste capítulo, trataremos de problemas desse tipo geral. Antes porém de nos familiarizarmos com algumas das técnicas espe- cíficas necessárias, vamos exprimir os conceitos acima mais rigoro- samente. 4.28. Se a varillvel aleatória K fór uniformemente distribuída sobre (O,5), qual será a probabilidade de que as raizes da equação 4X2+ 4xK + K + 2 = O sejam reais? 4.29. Suponha que a variávelaleatóriaX tenha valorespossíveis,1,2,3,. . . e que P(X=r)=k(1-{J)r- 1,0<{J<1. 5.2. Eventos Equivalentes (a) Determine a constante k. (b) Ache a moda desta distribuição (isto é, o valor de r que torne P(X =r) a maior de todas). Seja E um experimento e seja S um espaço amostral associado a 8. Seja X uma variável aleatória definida em S. Suponha-se que Y == H(x) seja uma função real de x. Então, Y == H(X) é uma 4.30. Uma varillvel aleatória X pode tomar quatro valores, com probabili- dades (1 + 3x)/4, (1 - x)/4, (1 + 2x)/4 e (1 - 4%)/4. Para que valores de x é esta uma distribuição de probabilidade? Ry R, Q G X (=) H H(,)~, Fig. 5.1 " '. anavel aleatória, porque para todo sE S, um valor de Y fica de- te . .l1n.inado,a saber y ==H [X(s)J. Esquematicamente,teremos a. Flg. 5.1. ~ 98 / PROBABILIDADE Como anteriormente, denominaremos Rx o contradomínio de X, o conjunto de todos os valores possíveis da função X. Semelhante- mente, definiremos Ry como o contradominio da varidvel aleatória Y, o conjunto de todos os valores possíveis de Y. Anteriormente, já definimos [Eq. (4.1)1 a noção de eventos equivalentes em S e em Rx. Agora, estenderemos esse conceito na seguinte forma natural. Definição. Seja C um evento (subconjunto) associado ao con- tradomínio Ry, de Y, como se explicou acima. Seja B C Rx defi- nido assim: B= IxERx:H(x)EC}. Em palavras: B é o conjunto de todos os valores de X, tais que H(x) E C. Se B e C forem relacionados desse modo, os denomina- remoseventosequivalentes. Comentários: (a) Como anteriormente, a interpretação não formal disso é que R e C serão eventos equivalentes se, e somente se, R e C ocorrerem conjunta- mente. Isto é, quando B ocorrer, C ocorrerá, e inversamente. (b) Suponha-se que A seja um evento associado a S, o qual é equivalente a um evento R associado a Rx. Então, se C for um evento associado a Ry o qual é equivalente a R, teremos que A será equivalente a C. (c) :f; também importante compreender que quando falamos de eventos equivalentes (no sentido acima), esses eventos são associados a diferentes espaços amostraÍs. Exemplo 5.1. Suponha-se que H(x) = 1I"X2,tal como na Seç. 5.1. Então, os eventos B: IX > 2} e C: IY > 411"j são equivalentes. Porque, se Y = 11"X2, então IX > 2j ocorrerá se, e somentese, IY > 411"}ocorrer, desde que X não pode tom.ar valores negativos no caso presente. (Veja a Fig. 5.2.) y )'=4.. x x=2 Fig.5.2 Comerúário: :f; também importante salientar que uma notação abreviada está sendo empregada quando escrevemos expressões tais como IX > 2} e IY > 4".1. Aquilo a que nos estaremos referindo, naturalmente, são os valores de X e os valores de Y, isto é, IsIX(s) > Z} e {xlY(x) > hl. (5.1) .........- FUNÇÕES DE VARIÁVEIS ALEATÓRIAS /99 Tal como fizemos no Capo 4, [Eq. (4.2)1, daremos a seguinte definição. Definição: Seja uma variável aleatória X definida no espaço amostral S. Seja Rx o contradomínio de X. Seja H uma função real e considere-sea variável aleatória Y = H(X) com contradomínio Ry. Para qualquer evento C C Ry, definiremos P(C) assim: P(C) = P[{x E Rx:H(x) E CI]. (5.2) Em linguagem corrente: A probabilidade de um evento asso- ciado ao contradomínio de Y é definida como a probabilidade do evento equivalente (em termos de X), como indicado pela Eq. (5.2). Comerúários: (a) A definição acima torna possível calcular probahilidades que envolvam eventos associados a Y, se conhecermos a distribuição de proba- bilidade de X e se pudermos determinar o evento equivalente em apreço. (b) Uma vez que explicamos anteriormente [Eq. (4.1 e 4.2)] como relacionar probabilidades associadas a Rx com probabilidades associadas a S, podemos re- escrever a Eq. (5.2) assim: P(C) = P[{x E Rx: H(x) E CI] = P[(s E S: H [X(s)]E CII. Exemplo 5.2. Seja X uma variável contínua com fdp f(x) = e-, x > O. (Uma integração simples confirma que J;~ e- dx = 1.) Suponha-se que H(x) = 2x + 1. Em conseqüência, Rx = Ix Ix > O}, enquanto Ry = Iy Iy > I}. Suponha-se que o even- to C seja definido deste modo: C = IY 2: 5}. x Então, y 2: 5 se, e somente se, 2x + 1 2: 5, o que por sua vez acarreta x 2: 2. Daí, C é equivalente a B = IX 2: 2}. (Veja Fig. 5.3.) Então, P(X 2: 2) = .h ~ e- dx = lfe2. Aplicando-seentãoa. Eq. (5.2)encontraremos que ~(Y 2: 5) = lfe2. v y=5 .<=2 Fig.5.3 d C07nenidri08: (a) t novamente, proveitoso salientar que poderemos consi- erar a incorporação de ambas as avaliações de x = X(s) e .de y = H(x) em nosso eXperimento e, conseqüentemente, considerar apenas Ry, o contradomfnio de Y, COllloo espaço amostral de nosso experimento. u! Rigorosamente falando, o espaço amostral de nosso experimento é S e o re- a tado do experimento é /t. Tudo o que se faz subseqüentemente nAo é influen- .I-- roo / PROBABILIDADE dado pela natureza aleatória do experimento. A determinação de x = X(8) e a avaliaçãode y == H(x) são processosrigorosamentedeterminlsticosdepoisque 8 tenha sido observado. Contudo, como já explicamos, podemos incorporar esses cálculos lia descrição de nosso experimento e, deste modo, tratar diretamente com o contradomlnio Ry. (b) Exatamente do modo como a distribuição de probabilidade foi induzida em Rx pela distribuição de probabilidade sobre o espaço amostral original S, a distribllição de probabilidade de Y será determinada quando a distribuição de probabilidade de X for conhecida. Assim, no Ex. 5.2 acima, a distribuição espe- ciCicadade Xdetermillou completamente o valor de P(Y ~ 5). (c) Ao considerar uma função de uma variável aleatória X, digamos Y = H(X), devemos observar que nem toda função H conceblvel poderá ser aceita. Contudo, as funções que surgem nas aplicações estão infalivelmente entre aquelas que podemos considerar e, por isso, não nos referiremos mais a esta pequena difi. culdade. 5.3. Varjáveis Aleatórias Discretas Caso 1. X é uma variável aleatória discreta. Se X for uma variável aleatória discreta e Y = H(X), nesse caso segue-se imedia- tamente que Y será também uma variável aleat6ria iliscreta. Porque supor que os valores possíveis de X possam ser enume- rados como XII X2,. . ",Xn,. .. acarreta qUe certamente os valores possíveis de Y sejam enumerados como YI = H(XI), Y2= H(X2)" . . (Alguns desses valores de Y poderão ser iguais, mas isso certamente não perturba o fato de que esses valores possam ser enumerados.) Exemplo 5.3. Suponhamos que a variável aleat6ria X tome os três valores -1, Oe 1, com probabilidades 1/3, 1/2 e 1/6, respectiva- mente. Seja Y = 3X + 1. Nesse caso os valores possíveis de Y são - 2, 1 e 4, tomados com probabilidades 1/3, 1/2 e 1/6. Este exemplo sugere o seguinte procedimentogeral: Se XII"" Xn,. .. forem os valores possíveis de X, p(Xi) = P(X = Xi), e H for uma função tal que, a cada valor Y correspohda exatamente um valor x, então a ilistribuição de probabilidade de Y será obtida do seguinte modo: Valores possíveis de Y: Probabilidades de Y: Yi = H(Xi), i = 1,,2,..., n,...; q(Yi)= P (Y = Yi) = p(Xi). Muito freqüentemente a função H não possui a característica acima, e poderá acontecer que vários valores' de X levem ao mesmo valor de Y, como ilustra o exemplo seguinte. Exemplo 5.4. Suponha-se que consideramoli a mesma variável aleat6ria X, como no Ex. 5.3 acima. Contudo, ~troduÚmos Y = X2. ......- FUNÇÕES DE VARIÃV~S ALEATÓRIAS /-101 portanto, os valores possíveis de Y são zero e um, tomados com pro- babilidades 1/2 e 1/2, porque Y = 1 se, e somente se, X = - 1 ou X = 1 e a probabilidade deste último evento é 1/3 + 1/6 = 1/2. Em termos de nossa terminologia preliminar, os eventos B: IX = :i: 11 e C: IY =.11 são eventos equivalentes e, em conseqüência, pela Eq. (5.2) têm iguais probabilidades. O procedimentogeralpara situações como a apresentada no exem- plo acima é o seguinte: Sejam Xii''Xi2". ., Xik" .. os valores de X que tenham a propriedade H(Xij) = Yi para todo j. Então, q(Yi)= P(Y = Yi) = P(Xil) + p(Xi) + " . isto é, para calcular a probabilidade d9 evento IY = Yi I, acha-se o evento equivalente em termos de X (no contradomínio Rx) e em seguidaailiciollam-se todas as probabilidades correspondentes. (Veja a Fig. 5.4.) (r-O Fig. 5.4 Exemplo5.5. Admita-se que X tenha os valores possíveis 1, 2,..., n, . .. e suponha-seque P(X = n} = (1/2)n. Seja Y = 1 se X for par, Y = -1 se X for ímpar. Portanto, Y toma os dois valores - 1 e + 1. Desde que Y = 1 se, e somente se, X = 2, ou X = 4, ou X = 6, ou . .., a aplicação da Eq. (5.2) fornece 1 1 1 -~ P(Y = 1) = 4 + 16 + 64 + ... - 3 . Conseqüentemente: 2 P(Y = -1) = 1- P(Y = 1)= -3 t Caso 2. X é uma variável aleat6ria contínua. Pode acoll- d~cerque X seja uma variável aleat6ria contínua enquanto Y seja IScreta. Por exemplo, suponha-se que X possa tomar todos os valores reais, enquanto Y seja definido igual a + 1 se X ~ O, e Y = - 1 se X < O. A fim de obter a distribuição de probabilidade de Y, determina-se apenas o evento equivalente (no contradomínio Rx) correspondente aos diferentes valores de Y. Neste caso, Y = 1 se, e somente se, X ~ O, enquanto Y = - 1 se, e somente se, X < O. Por isso,P(Y = 1) = P(X ~ O),enquanto P(Y = -1) = P(X < O). Se a fdp de X forconhecida,essasprobabilidadespoderãoser calcula~ das. No caso geral, se IY = y;} for equivalente a um evento, por exemplo A, no contradomínio de X, então 102 I PROBABILIDADE -- FUNÇÕES DE \7ARIÁVEIS ALEATÓRIAS I 103 G(y) = P(Y =s;y) = P(3X + 1 =s; y) = P[X =s;(y - 1)/31 1 <11-1)/3 = o 2x dx = [(y - 1)/312. Daí . 2 g(y) = G'(y) = "9 (y - 1). q(Yi) = P(Y = Yi) = .J;. J(x) dx. Desde que J(x) > Opara O< x < 1, encontramos que g(y) > O para 1 < y < 4. Comentário:O evento A, referido acima, equivalente ao evento IY ~ fi) é apenas IX ~ (y - 1)/31. Existe uma outra maneira, ligeiramente diferente, de obter o mesmo resultado, a qual será de utilidade mais tarde. Considere- mos novamente G(y) = P(Y =s; y) = P (X =s; y; 1) = F( Y ; 1 ), onde F é a fd de X; isto é, F(x) = P(X =s;x). 5.4. Variáveis Aleatórias Contínuas o caso mais importante (e mais freqüentemente encontrado) aparece quando X for uma variável aleatória contínua com fdp J e H for uma função contínua. Conseqüentemente Y = H(X) será uma variável aleatória contínua, e nossa tarefa será obter sua fdp, que dcnotaremos por g. o procedimento geral será: y A fim de calcular a derivada de G, G'(y), empregaremos a regra de derivação de função, como segue: dG(y)= dG(y). du, onde u = 1L..=...!... dy du dy 3 Portanto, , 1 1 ( Y-l ) 1 G (y) = F'(u) .- =J(u) . - = 2 - .-,- , 3 3 3 3 (a) Obter G, a fd de Y, na qual G(y) = P(Y ::::; y), achando-se o evento A (no contradomínio de X) o qual é equivalente ao evento IY=s;y}. (b) Derivar G(y) em relação 3. y, a fim de obter g(y). (c) Determinar aqueles valo- res de y no contradomínio de Y, para os quais g(y) > O. Exemplo 5.6. Suponhamos que X tenha fdp I I :11I J(x) = 2x, O < x < 1, = O, para outros quaisquer valores. Seja H(x) = 3x + L Daí, para obter a fdp de Y = H(X), teremos (veja a Fig. 5.5). g(y) como anteriormente. A fdp de Y l ...,. o gnl/ioo"p""""lado na F;g. ~ 5.6. (Para verificar o cálculo, ob- c(y)~9(y-l) r4 I serve que Jl g(y)dy = 1.) - ..)' )'-1 y~4 Exemplo 5.7. Suponhamos que Fig. 5.6 uma variável aleatória contínua tem . a fdp comofoi dada no Ex. 5.6. Se- Ja H(x) ==c"'. Para achar a fdp de Y = H(X), procederemos co- rno se indica a seguir (veja a Fig. 5.7): G(y) = P(Y =s;y) = P(e-X =s;y) = P(X ~ -Iny) =11 -1011 2xdx = 1 - (-In y)2. x Fig.5.5 ~ 104 / PROBABILIDADE Daí, g(y) = G'(y) = - 2 ln y/v. Visto que f(x) > O para O < x < 1 encontramos que g(y) > O para l/e < y < 1. [Observe que o sinai algébrico para g(y) está correto, pois que ln y < Opara l/e < y < 1.] O gráfico de g(y) está esboçado na Fig. 5.8. y 'X :(.1')L \' = ! 'e .1'= I )' x= -10 Y Fig.5.7 Fig.5.8 Poderemos também obter o resultado acima por um tratamento um pouco diferente, que esboçaremos resumidamente. Tal como anteriormente G(y) = P(Y ~ y) ==P(X ~ -ln y) = 1- P(X ~ -lny) = 1- F(-ln'y), onde F é a fd de X, como antes. A fim de obter a derivada de G, aplicaremos também a regra de derivação de função de função, co- mo se segue: dG(y) dG du dY=d;;~' onde u = - ln y. Deste modo G'(y) = - F'(u) (- ~)=+ 21n Y' (- ~), L! tal como anteriormente. Vamos agora generalizar o tratamento sugerido pelos exemplos acima. O passo mais importante em' cada um dos exemplos foi dado quando substituímos o evento IY ~ y I pelo evento equivalente em termos da variável aleatória X. Nos problemas acima, isso foi re- lativamente fácil porque em cada caso a função de X era estrita- mente crescente ou estritamente decrescente. ....... ,FUNÇÓES DE VARIÃVEIS,ALEATÓRIAS / 105 Na Fig. 5.9, 11é uma função estritamente crescente de x. Por . poderemos resolver 11= H(x) em termos de 11,isto é, x = H-'Ú/), isSO, onde H-I é denominada fun- , ção inversade H. Portanto, se H for estritamentecrescente IH(X) ~ 11I seráequivaiente a IX ~ H-'(y)I, enquantose H for estritamentedecrescente, IH(X) ~ yI será equivalente a Ix ~ H-'(y)}. O processo empregado nos exem- Y pIos acima pode agora ser ge- neralizado, na seguinte forma: y X_H-I(y) Fig. 5.9 Te<rrema5.1. Seja X uma variável aleatória contínua com fdp f, onde f(x) > O,para a < x < b. Suponha-seque y = H(x) seja uma função de x estritamente monótona (ou crescente ou decrescente). Admita-se que essa função seja derivável (e, portanto, contínua) para todo x. Então, a variável aleatória Y, definida como Y = H(X) possuia fdp g dada por g(y) = f(x) 1:1, (5.3) ondex é expresso em termos de y. Se H for crescente, então g será não-nuIapara aqueles valores de y que satisfaçam H(a) < y < H(b). Se H for decrescente, então g será não-nula para aqueles valores de y que satisfaçam H(b) < y < H(a). Demonstração: (a) Suponha-se que H seja uma função estrita- mente crescente. Daí G(y) = P(Y ~ y) = P[H(X) ~ y] =P[X ~ H-'(y)] = F[H-'(y)]. Derivando G(y) em relação a y, obteremos com o emprego da regra. da derivada de função de funçll.o: Portanto, dG(y) dG(y) dx di! =--a;- dy' onde x = H-I (y). G'(y)= dF(x) dx = f(x) dx. dx dy d1l ~ 106 / PROBABILIDADE (b) Suponha-se que H seja uma função decrescente. Dai G(y) = P(Y ~ y) = P[H(X) ~ y) = P{X ~ H-l(y») = 1- P[X ~ H-l(y») = 1 - F[:H-l(y»). Procedendo tal como acima, poderemos escrever dG(y) = dG(y) dx = ~ [1- F(x)] dx = - J(x) dx. dy dx dy dx dy dy Comentário: O sinal algébrico obtido em (b) está correto porque, se y for uma função decrescente de X, X será uma função decrescente de y e, conseqüente- mente, dx/dy < O. Deste modo, pelo emprego do sinal, com o valor absoluto em tomo de dx/dy, poderemos combinar o resultado de (a) e de (b) e obter a forma final do teorema. Exemplo 5.8. Vamos reexaminar os Exs. 5.6 e 5.7 pela aplicação do Teor. 5.1. (a) No Ex. 5.6 tivemos J(x) = 2x, O< x < 1, e y = 3x + 1. Conseqüentemente, x = (y - 1)/3 e dx/dy = 1/3. Por isso, g(y) = = 2 [(y- 1)/3)(1/3) = 12/9)(y - 1), 1 < y < 4, o que confirma o resultado obtido anteriormente. (b) No Ex. 5.7, tivemos J(x) = 2x, O< x < 1 e y = e-4. Em conseqüência, x = - ln y e dx/dy = - l/y. Deste modo, g(y) = = - 2(In y)/y, l/e < y < 1, o que também confirma o resultado já obtido. Se y = H(x) não for uma função monótona de x, não poderemos aplicar diretamente o processo acima. Em vez disso, voltaremos ao processo geral esquematizado acima. O exemplo seguinte ilustra esse procedimento. Exemplo 5.9. Suponhamos que J(x) = 1/2, -1 < x < 1, = O, fora desse intervalo. 11111"'''1 I Seja H(x) = x'. Obviamente, esta não é uma função monótona sobre o intervalo [-1, 1] (Fig. 5.10). Por isso, obteremos a fdp de Y = X' do seguintemodo: G(y) = P(Y ~ y) = P(X' ~ y) = P(- Vy ~ X ~ vy) . = F(vy) - F(- VY), ....... FUNÇÕ':S OE VARIÁVEIS ALEATÓRIAS / 107 onde F é a fd da variável aleatória X. Logo, g(y) = G'(y)= J(V~ - J(-V!) 2Vy -2Vy = 2~Y [J(VY)+ J(- Vy»). Deste modo, g(y) = (1/2Vy) (1/2 + 1/2) = 1/2VY,0< y< 1. (Veja a Fig. 5.11.) g(y) y (q) Y=X2 x x=-I x=1 y Fig. 5.10 Fig. 5.11 O processo empregado no exemplo acima fornece o seguinte re- sultado geral. Teorema5.2. Seja X uma variável aleatória contínua com fdp J. Façamos Y = X2. Então, a variável aleatória Y tem a fdp dada por 1 . r - g(y) = - r [J(v y) +J(-Vy)J. 2v y Demonstração:Veja o Ex. 5.9. Problemas Y 5.1. Suponha que X seja uniformemente distribuída sobre (-1, 1). Seja == 4 - X2. Achar a fdp de Y, g(y), e fazer seu gráfico. Verifique também que g(y) é a fdp adequada. f 5.2. Suponha que X seja uniformemente distribuída sobre (l, 3). Ache a dp das seguintes variáveis aleatórias: (a) Y == 3X + 4, (b) Z = eX. Verjfi . que em cada caso que a função obtida é a fdp. Esboce os gráficos. ~ 108 I PROBABILIDADE 5.3. Suponha que a variável aleatória contínua X tenha fdp J(x) = e-:e, z > O. Ache a fdp das seguintesvariáveis aleatórias: (a) Y = XI, (b) Z = 3/(X + 1)2. 5.4. Suponha que a variável aleatória discreta X tome os valores 1, 2 e 3 com igual probabilidade. Ache a distribuição de probabilidade de Y = 2X+ 3. 5.5. Suponha que X seja uniformemente distribuída sobre o intervalo (O,1). Ache a fdp das seguintes variáveis aleatórias: (a) Y = X2 + 1, (b) Z = l/(X + 1). 5.6. Suponha que X seja uniformemente distribuída sobre (-1, 1). Ache a fdp das seguintes variáveis aleatórias: (a) Y = sen(1rf2)X, (b) Z = cos(1r/2)X, (c) W = IXI. 5.7. Suponha que o raio de uma esfera seja uma variável aleatória continua. (Em virtude de imprecisões do processo de fabricação, os raios das diferentes es- feras podem ser diferentes.) Suponha que o raio R tenha fdp J(r) = 6r(1 - r), O < r < 1. Ache a fdl? do volume Veda ácea superficial S da esfera. 5.8. Uma corrente elétrica oscilante 1 pode ser considerada como uma va- riável aleatória uniformemente distribulda sobre o intervalo (9, 11). Se essa corrente passar em um resistor de 2 ohms, qual será a fdp da potência P = 212? 5.9. A velocidade de uma molécula em um gás uniforme em equillbrio é uma variável aleatória V cuja fdp é dada por J(v) = av2e-b.., v > O, onde b = mf2kT e k, Tem denotam respectivamente a constante de Boltzman, a temperatura absoluta e a massa da molécula. (a) Calcular a constante a (em termos de b). [Sugestllo: Considere o fato de que 1;," e-zI dx = V;/2 e integre por partes.] (b) Estabeleça a distribuiçã.o da variável aleatória W = mV2/2, a qual re- presenta a energia cinética da molécula. 5.10. A tensão elétrica aleatória X é uniformemente distribulda sobre o intervalo (-k, k). .Se Y for a entrada de um dispositivo nã.o-linear, com as carac- terlsticas indicadas na Fig. 5.12, ache a distribuição de probabilidade de Y, nos três casos seguintes: (a) k < a, (b) a < k < xo, (c) k > xo. y Y=Yo x -X.Q -Q fi "'o Flg. 5.12 Ctmlentário: A distribuição de probabilidade de Y constitui um exemplo de uma distribuição mista. Y toma o valor zero com probabilidade não-nula e também toma todos os valores em certos. intervalos. (Veja a Baç. 4.6.) FUNÇÕES DE VARIÁVEIS ALEATÓRIAS I 109 5.11. A energia radiante (em Btu/hora/pé') é dada pela seguinte função da temperatura T (em escala Fahrenheit): E = 0,173 (T/IOO)4. Suponha que a temperatura T seja considerada uma variável aleatória contínua como fdp J{t) = 200r', 40~ t ~ 50, = O, para outros quaisquer valores. Estabeleça a fdp da energia radiante E. 5.12. Para medir velocidades do ar, utiliza-se um tubo (conhecido como tubo estático de Pitot), o qual permite que se meça a pressão diferencial. Esta pressão diferencial é dada por P = 0/2) dV', onde d é a densidade do ar e V é a velocidade do vento (mph). Achar a fdp de P, quando V for uma variável aleatória uniformemente distribuída sobre (10, 20). 5.13. Suponha que P(X.;; 0,29) = 0,75,ondeX é umavariávelaleatória contínua com alguma distribuição definida sobre (O, 1). Quando Y = 1 - X, determinark de modo queP(Y.;; k) = 0,25. ........