·
Enfermagem ·
Bioestatística
Envie sua pergunta para a IA e receba a resposta na hora
Texto de pré-visualização
INTRODUÇÃO AOS TESTES DE HIPÓTESE Professor Alan Corrêa Diniz INTRODUÇÃO Motivação Uma pesquisa deseja saber o efeito de um medicamento sobre uma determinada vitamina presente no sangue Suponha que a concentração dessa vitamina no sangue seja dada por uma distribuição normal DEFICIENTE NORMAL EXCESSO INTRODUÇÃO Situação 1 Amostra de pessoas com deficiência dessa vitamina Objetivo criar um medicamento que aumente a concentração dessa vitamina no sangue Concentração dessa vitamina no sangue aumentou Concentração dessa vitamina no sangue permaneceu a mesma INTRODUÇÃO Situação 2 Amostra de pessoas com excesso dessa vitamina Objetivo criar um medicamento que diminua a concentração dessa vitamina no sangue Concentração dessa vitamina no sangue diminuiu Concentração dessa vitamina no sangue permaneceu a mesma INTRODUÇÃO Situação 3 Amostra aleatória Amostra com deficiência dessa vitamina Amostra com excesso dessa vitamina Amostra com concentração dessa vitamina nos padrões normais DEFINIÇÕES Definição Uma hipótese estatística é uma afirmação acerca dos parâmetros de uma ou mais populações ou acerca da distribuição da população É uma afirmação sobre uma população e não sobre amostra Normalmente são formuladas duas hipóteses H0 hipótese nula ou conservadora que é a hipótese que não se quer testar aquilo que eu já tenho não desafia o que já sabe ou foi especificado Ha hipótese alternativa que será aceita se não for possível provar que H0 é verdadeira é inovador desafia o que se é conhecido objetivo de pesquisa VOLTANDO AO EXEMPLO Situação 1 H0 𝜇 10 unidadesml Ha 𝜇 10 unidadesml Situação 2 H0 𝜇 18 unidadesml Ha 𝜇 18 unidadesml Situação 3 H0 𝜇 10 unidadesml Ha 𝜇 14 unidadesml Se a população tiver deficiência da vitamina 𝜇 14 Se a população tiver excesso da vitamina 𝜇 14 HIPÓTESES DE INTERESSE Unilaterais H0 𝜇 a Ha 𝜇 a unilateral à esquerda ou H0 𝜇 a Ha 𝜇 a unilateral à direita Costumase utilizar a notação abaixo equivalentes H0 𝜇 a Ha 𝜇 a unilateral à esquerda ou H0 𝜇 a Ha 𝜇 a unilateral à direita Bilaterais H0 𝜇 a Ha 𝜇 a Aqui não precisa alterar a notação igualdade e diferença são complementares Identifique as hipóteses que estão sendo testadas em cada caso informando se são uni ou bilaterais A companhia de transporte afirma que em média o intervalo entre sucessivos ônibus é de 15 minutos Uma associação de usuários de transportes coletivos acha que a pontualidade é muito importante e pretende testar a afirmação da companhia Os amortecedores de automóveis que circulam entre cidades duram em média 30 mil quilômetros segundo informações de algumas oficinas especializadas Um proprietário de automóvel deseja testar essa informação Um veterinário conseguiu ganho médio diário de 3 litros de leite por vaca com uma nova composição de ração Um pecuarista acredita que o ganho não é tão grande assim ERROS Erro tipo I rejeitar H0 quando está verdadeira Erro tipo II não rejeitar H0 quando está falsa A probabilidade de cometer o erro tipo I é denominada nível de significância e é denotada por α A probabilidade de cometer erro tipo II é denotada por β Decisão H0 é verdadeira H0 é falsa Não rejeitar H0 Decisão Correta Erro tipo II Rejeitar H0 Erro tipo I Decisão Correta ERROS DE DECISÃO Na prática é especificado a probabilidade máxima permissível de se cometer o erro tipo I chamado nível de significância Escolhas comuns para o nível de significância são 005 5 e 001 1 Assim se a probabilidade de se cometer um erro Tipo I é controlada por selecionar um pequeno valor para o nível de significância temos um alto grau de confiança que a conclusão para rejeitar H0 está correta Em tais casos temos o suporte estatístico para concluir que H0 é falso e Ha é verdadeiro Qualquer hipótese sugerida para Ha é aceita ERROS DE DECISÃO Como na prática não se atenta para a probabilidade de se cometer o erro tipo II se decidimos aceitar H0 não podemos determinar quão confiantes podemos estar com aquela decisão Assim recomendase que seja usado a declaração não rejeitar H0 em vez de aceitar H0 ESTATÍSTICA DO TESTE Temos agora que escolher a estatística do teste isto é uma função dos dados da amostra na qual a decisão rejeitar H0 ou não rejeitar H0 se baseia 𝑍 ҧ𝑥𝜇 𝜎 𝑛 para a distribuição normal da média com 𝝈 conhecido 𝑡 ҧ𝑥𝜇 𝑠 𝑛 para a distribuição tStudent 𝝈 desconhecido grau de liberdade gl n 1 COMO REALIZAR TESTES DE HIPÓTESE Para amostras pequenas n 30 ou quando σ for desconhecido usamos s desviopadrão amostral ao invés de σ desviopadrão populacional e consideramos o grau de liberdade como n1 Para σ desconhecido a distribuição é uma t não uma normal mas para amostras de tamanho muito grandes as diferenças entre as distribuições normal e t são desprezíveis mas o uso da distribuição t dá melhores resultados TESTE DE HIPÓTESE UNILATERAL À DIREITA 𝐻0 𝜇 𝑎 𝐻𝑎 𝜇 𝑎 Não rejeitar H0 Rejeitar H0 TESTE DE HIPÓTESE UNILATERAL À ESQUERDA 𝐻0 𝜇 𝑎 𝐻𝑎 𝜇 𝑎 Rejeitar H0 Não rejeitar H0 TESTE DE HIPÓTESE BILATERAL 𝐻0 𝜇 𝑎 𝐻𝑎 𝜇 𝑎 α2 α2 Rejeitar H0 Rejeitar H0 Não rejeitar H0 TESTE DE HIPÓTESE UNILATERAL À ESQUERDA Exemplo Uma pesquisa feita em universidades mostrou que professores de Estatística ganham em média de R 4567800 por ano com um desvio padrão de R 700000 Uma amostra com 81 professores chegou à média de R 4800000 Construa um teste de hipótese verificando se o salário médio pode ser menor que o informado a um nível de significância de 5 𝐻0 𝜇 45678 𝐻𝑎𝜇 45678 𝑍 ҧ𝑥 𝜇 𝜎 𝑛 48000 45678 7000 81 2322 77777 298 Para 5 zc 165 Conclusão Não rejeitamos H0 O salário não é menor que R 4567800 considerando o nível de significância de 5 zc 165 TESTE DE HIPÓTESE BILATERAL Exemplo Um comprador de tijolos julga que a qualidade dos tijolos está deteriorando Sabese pela experiência passada que a média de resistência ao esmagamento destes tijolos é de 400 libras com desvio padrão de 20 libras Uma amostra de 100 tijolos deu uma média de 395 libras Teste a hipótese de que a qualidade média não se alterou contra a alternativa de que se tenha deteriorado considere o nível de significância de 5 Teste bilateral 𝐻0 𝜇 400 𝐻𝑎 𝜇 400 𝑍 ҧ𝑥 𝜇 𝜎 𝑛 395 400 20 100 5 2 25 Conclusão rejeitamos H0 isto é a resistência não é mais de 400 libras zc 196 zc 196 Para 5 zc 196 TESTE DE HIPÓTESE UNILATERAL À DIREITA Exemplo Um trecho de uma rodoviária quando é utilizado o radar são verificadas em média 7 infrações diárias por excesso de velocidade O chefe da polícia acredita que este número pode ter aumentado Para verificar isso o radar foi mantido por 10 dias consecutivos Os resultados foram 8 9 5 7 8 12 6 9 6 10 com desvio padrão de 21 Os dados trazem evidências do aumento das infrações a um nível de significância de 5 𝐻0 𝜇 7 𝐻𝑎 𝜇 7 Média amostral 895781269610 10 8 Usando tStudent 𝑡 ҧ𝑥𝜇 𝑠 𝑛 87 21 10 15 t 15 tc 183 Conclusão Não rejeitamos H0 o que implica que o número de infrações não teve um aumento significativo gl 10 1 9 INTERVALOS DE CONFIANÇA Professor Alan Corrêa Diniz INTERVALOS DE CONFIANÇA Até agora vimos estimadores pontuais que fornecem um único valor numérico para o parâmetro de interesse De agora em diante vamos usar os dados amostrais para calcular um intervalo de valores plausíveis de um parâmetro populacional desconhecido Como os estimadores são variáveis aleatórias podese apresentar uma estimativa mais informativa para o parâmetro de interesse uma que inclua uma medida de precisão do valor obtido Esse método é denominado por intervalos de confiança IC e incorpora à estimativa pontual do parâmetro informações a respeito de sua variabilidade INTERVALOS DE CONFIANÇA Podese utilizar o conhecimento da distribuição da média amostral para construir um intervalo de confiança para a média 𝝁 de uma população Dada uma variável aleatória X com média 𝜇 e variância 𝝈² conhecida temse que Dado que X siga uma distribuição normal ou que n seja suficientemente grande Teorema Central do Limite INTERVALOS DE CONFIANÇA Para a variável aleatória Z que segue uma distribuição normal padrão 95 das observações se encontram entre 196 e 196 Dado que As propriedades da distribuição normal permitem a manipulação da desigualdade dentro do parênteses sem alterar a afirmação da probabilidade INTERVALOS DE CONFIANÇA Ao multiplicar os três termos da desigualdade pelo erro padrão da média 𝜎 𝑛 temse Em seguida podese subtrair a média amostral ത𝑋 dos três termos da desigualdade Por fim podese multiplicar os três termos da desigualdade por 1 Ao rearranjarmos os termos da desigualdades temse INTERVALOS DE CONFIANÇA O intervalo anterior considera os valores inferior e superior que limitam 95 dos valores mais prováveis de representarem a média populacional As quantidades ത𝑋 196 𝜎 𝑛 e ത𝑋 196 𝜎 𝑛 limitam o intervalo de confiança de 95 para a média da população ou seja com 95 de confiança o intervalo ത𝑋 196 𝜎 𝑛 ത𝑋 196 𝜎 𝑛 conterá a média populacional 𝝁 Em outras palavras se forem retiradas 100 amostras independentes e construídos 100 intervalos de confiança 95 desses intervalos iriam conter o valor de 𝝁 e 5 deles não INTERVALOS DE CONFIANÇA É importante ressaltar que apesar de procurarmos tirar conclusões sobre a média populacional 𝜇 essa média é um valor fixo embora desconhecido e não uma variável aleatória O intervalo de confiança mais comum é o que considera um nível de confiança de 95 porém esse não é o único Podese montar intervalos de confiança de qualquer tamanho dependendo do interesse do pesquisador no entanto intervalos de menos de 90 de confiança são de pouca utilidade INTERVALOS DE CONFIANÇA Seja 𝑧𝛼2 o valor que limita uma área de 𝛼2 na extremidade superior da distribuição normal padrão e 𝑧𝛼2 o valor que limita uma área de 𝛼2 na extremidade inferior da distribuição normal padrão Então a forma geral para um intervalo de confiança de 1001 𝛼 para 𝜇 é dada por Se por exemplo tomarmos e 𝛼 005 teríamos Coeficiente de confiança EXEMPLO 1 Suponha que os comprimentos de jacarés adultos de uma certa raça siga uma distribuição normal com média 𝜇 e variância igual a 001 m² Uma amostra de dez animais foi sorteada e forneceu média de 169 m Encontre o intervalo de 95 de confiança para o parâmetro desconhecido 𝜇 𝜎 0012 𝑚² 001 𝑚 ത𝑋 169 𝑚 𝐼𝐶 95 𝑛 10 𝑗𝑎𝑐𝑎𝑟é𝑠 95 1 𝛼 100 𝛼 005 5 𝑧 𝛼 2 𝑧 005 2 𝑧0025 𝑧0025 196 𝑧0025 196 𝐼𝐶 ത𝑋 𝑧 𝛼 2 𝜎 𝑛 ത𝑋 𝑧 𝛼 2 𝜎 𝑛 𝐼𝐶 95 169 196 001 10 169 196 001 10 𝐼𝐶 95 157 181 𝑚 𝐼𝑠𝑡𝑜 é 𝑠𝑒 100 𝑎𝑚𝑜𝑠𝑡𝑟𝑎𝑠 𝑓𝑜𝑟𝑒𝑚 𝑟𝑒𝑡𝑖𝑟𝑎𝑑𝑎𝑠 𝑒𝑚 95 𝑑𝑒𝑙𝑎𝑠 𝑎 𝑚é𝑑𝑖𝑎 𝜇 𝑒𝑠𝑡𝑎𝑟á 𝑐𝑜𝑛𝑡𝑖𝑑𝑎 𝑛𝑜 𝐼𝐶 𝑎𝑐𝑖𝑚𝑎 𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 EXEMPLO 2 Um provedor de acesso à internet está monitorando a duração do tempo das conexões de seus clientes com o objetivo de dimensionar seus equipamentos São desconhecidas a média e a distribuição de probabilidade desse tempo mas o desvio padrão por analogia a outros serviços é considerado igual a 50 minutos Uma amostra de 500 conexões resultou num valor médio observado de 25 minutos O que dizer da verdadeira média com confiança 92 𝜎 50 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 𝑛 500 𝑐𝑜𝑛𝑒𝑥õ𝑒𝑠 𝐼𝐶 92 ത𝑋 25 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 92 1 𝛼 100 𝛼 008 8 𝑧 𝛼 2 𝑧 008 2 𝑧004 𝑧004 175 𝑧004 175 𝐼𝐶 ത𝑋 𝑧 𝛼 2 𝜎 𝑛 ത𝑋 𝑧 𝛼 2 𝜎 𝑛 𝐼𝐶 92 25 175 50 500 25 175 50 500 𝐼𝐶 92 2444 2556 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 𝐼𝑠𝑡𝑜 é 𝑠𝑒 100 𝑎𝑚𝑜𝑠𝑡𝑟𝑎𝑠 𝑓𝑜𝑟𝑒𝑚 𝑟𝑒𝑡𝑖𝑟𝑎𝑑𝑎𝑠 𝑒𝑚 92 𝑑𝑒𝑙𝑎𝑠 𝑎 𝑚é𝑑𝑖𝑎 𝜇 𝑒𝑠𝑡𝑎𝑟á 𝑐𝑜𝑛𝑡𝑖𝑑𝑎 𝑛𝑜 𝐼𝐶 𝑎𝑐𝑖𝑚𝑎 𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 INTERVALOS DE CONFIANÇA O tamanho de um intervalo de confiança varia de acordo com o nível de confiança do mesmo ou de acordo com o tamanho da amostra Para uma amostra de tamanho n fixo INTERVALOS DE CONFIANÇA Para 𝛼 005 EXEMPLO 3 A vida média de baterias automotivas de uma certa marca está sendo estudada Baseado em estudos similares com outras marcas é possível admitir que a vida dessas baterias segue a distribuição normal com desvio padrão de 45 meses De qual tamanho deverá ser a amostra para que a amplitude do intervalo de 90 de confiança para a vida média seja de 3 meses 𝜎 45 𝑚𝑒𝑠𝑒𝑠 𝑛 𝐼𝐶 90 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑𝑒 3 𝑚𝑒𝑠𝑒𝑠 90 1 𝛼 100 𝛼 01 10 𝑧 𝛼 2 𝑧 01 2 𝑧005 𝑧005 1645 𝑧005 1645 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑𝑒 ത𝑋 𝑧 𝛼 2 𝜎 𝑛 ത𝑋 𝑧 𝛼 2 𝜎 𝑛 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑𝑒 2𝑧 𝛼 2 𝜎 𝑛 3 21645 45 𝑛 𝑛 2435 24 𝑏𝑎𝑡𝑒𝑟𝑖𝑎𝑠 𝑎𝑝𝑟𝑜𝑥𝑖𝑚𝑎𝑑𝑎𝑚𝑒𝑛𝑡𝑒 INTERVALOS DE CONFIANÇA O Teorema Central do Limite diz que a distribuição de probabilidade do estimador da proporção de determinada característica quando n é grande o suficiente se aproxima de uma distribuição normal padrão Logo analogamente ao que foi feito para a média podese construir um intervalo de confiança para a proporção em uma população com base na proporção amostral Mas temos um problema aqui INTERVALOS DE CONFIANÇA Não é possível utilizar o intervalo de confiança encontrado já que não conhecemos o valor de p Sendo assim são propostas as soluções abaixo Substituir p por Ƹ𝑝 intervalo otimista Substituir p1p por 14 valor máximo que p1 p pode alcançar intervalo conservador EXEMPLO 4 Pretendese estimar a proporção p de cura através do uso de um certo medicamento em doentes contaminados com cercária que é uma das formas do verme da esquistossomose Um experimento consistiu em aplicar o medicamento em 200 pacientes escolhidos ao acaso e observar que 160 deles foram curados O que podemos dizer da proporção p na população em geral a um nível de 99 de confiança utilize ambos os intervalos otimista e conservador Como os dois intervalos calculados se comparam 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑜𝑡𝑖𝑚𝑖𝑠𝑡𝑎 Ƹ𝑝 160 200 08 𝑛 200 𝑝𝑎𝑐𝑖𝑒𝑛𝑡𝑒𝑠 𝐼𝐶 99 99 1 𝛼 100 𝛼 001 1 𝑧 𝛼 2 𝑧 001 2 𝑧0005 𝑧0005 2575 𝑧0005 2575 𝐼𝐶 Ƹ𝑝 𝑧 𝛼 2 Ƹ𝑝1 Ƹ𝑝 𝑛 Ƹ𝑝 𝑧 𝛼 2 Ƹ𝑝1 Ƹ𝑝 𝑛 𝐼𝐶 99 08 2575 08 1 08 200 08 2575 08 1 08 200 𝐼𝐶 99 07279 08721 EXEMPLO 4 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑐𝑜𝑛𝑠𝑒𝑟𝑣𝑎𝑑𝑜𝑟 Ƹ𝑝 160 200 08 𝑛 200 𝑝𝑎𝑐𝑖𝑒𝑛𝑡𝑒𝑠 𝐼𝐶 99 99 1 𝛼 100 𝛼 001 1 𝑧 𝛼 2 𝑧 001 2 𝑧0005 𝑧0005 2575 𝑧0005 2575 𝐼𝐶 Ƹ𝑝 𝑧 𝛼 2 1 4𝑛 Ƹ𝑝 𝑧 𝛼 2 1 4𝑛 𝐼𝐶 99 08 2575 1 4𝑥200 08 2575 1 4𝑥200 𝐼𝐶 99 071 089 𝑂 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑐𝑜𝑛𝑠𝑒𝑟𝑣𝑎𝑑𝑜𝑟 𝑝𝑜𝑟 𝑝𝑒𝑟𝑚𝑖𝑡𝑖𝑟 𝑎𝑚𝑜𝑠𝑡𝑟𝑎𝑠 𝑚𝑎𝑖𝑠 𝑣𝑎𝑟𝑖𝑎𝑑𝑎𝑠 𝑎𝑝𝑎𝑟𝑒𝑛𝑡𝑒𝑚𝑒𝑛𝑡𝑒 é 𝑚𝑎𝑖𝑠 𝑣𝑎𝑛𝑡𝑎𝑗𝑜𝑠𝑜 𝑞𝑢𝑒 𝑜 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑜𝑡𝑖𝑚𝑖𝑠𝑡𝑎 IC PARA VARIÂNCIA DESCONHECIDA Suponha que uma amostra aleatória 𝑋1 𝑋2 𝑋3 𝑋𝑛 obtida de uma população com distribuição normal com média e variância desconhecidas temos 𝑡 ത𝑋 𝜇 𝑠 𝑛 𝑡𝑛 1 t segue uma distribuição t de Student com n 1 graus de liberdade ത𝑋 representa a média amostral 𝜇 é a média que se deseja conhecer s é o desviopadrão amostral n é o tamanho amostral IC PARA VARIÂNCIA DESCONHECIDA Fixando o coeficiente de confiança 𝛼 0 𝛼 1 e utilizando a tabela da distribuição t de Student com n1 graus de liberdade podemos obter o valor 𝒕 Τ 𝜶 𝟐 tal que Logo o intervalo de confiança 1 𝛼 100 para 𝜇 com variância desconhecida será dada por S desviopadrão amostral EXEMPLO 5 Admitindo que a pressão sanguínea arterial em homens siga uma distribuição normal 7 pacientes foram sorteados e tiveram sua pressão medida em unidades arbitrárias com os seguintes resultados 84 81 77 85 69 80 79 Determine um intervalo de 98 de confiança para 𝜇 𝐶á𝑙𝑐𝑢𝑙𝑜 𝑑𝑎 𝑚é𝑑𝑖𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎𝑙 ത𝑋 84 81 77 85 69 80 79 7 ത𝑋 7929 𝑢𝑛𝑖𝑑𝑎𝑑𝑒𝑠 𝑎𝑟𝑏𝑖𝑡𝑟á𝑟𝑖𝑎𝑠 𝐶á𝑙𝑐𝑢𝑙𝑜 𝑑𝑜 𝑑𝑒𝑠𝑣𝑖𝑜 𝑝𝑎𝑑𝑟ã𝑜 𝑎𝑚𝑜𝑠𝑡𝑟𝑎𝑙 𝑆 1 𝑛 1 𝑖1 𝑛 𝑥𝑖 ҧ𝑥² unidades arbitrárias NOÇÕES SOBRE INFERÊNCIA ESTATÍSTICA TEOREMA CENTRAL DO LIMITE Professor Alan Corrêa Diniz INFERÊNCIA ESTATÍSTICA Conjunto de técnicas que tem por objetivo estudar a população através de uma amostra TERMINOLOGIA DA AMOSTRAGEM PopulaçãoAlvo População que se deseja descrever População de Estudo Subconjunto da populaçãoalvo do qual as amostras serão selecionadas Sistema de Referência Lista dos elementos pertencentes à população de estudo Amostra Todo o subconjunto não vazio e com um número menor de elementos do que o conjunto definido como população Unidade Amostral Cada elemento contido na amostra MANEIRAS DE SELECIONAR AMOSTRAS Amostragem Aleatória Simples Amostragem Sistemática Amostragem Estratificada Amostragem por Conglomerado AMOSTRAGEM ALEATÓRIA SIMPLES Mesma chance de seleção para todos os elementos da população Metodologia Listar ou numerar todos os elementos da população e sortear elementos ao acaso até que a amostra alcance o tamanho desejado Exemplo Suponha que tenham 5000 alunos no ensino médio na cidade na qual o estudo será feito Seriam dados números de 1 a 5000 a cada um dos alunos e depois 100 desses números seriam sorteados sem reposição Dessa maneira obteríamos uma amostra simples da população de estudo AMOSTRAGEM SISTEMÁTICA Utiliza um sistema imposto pelo pesquisador na seleção dos elementos que formarão a amostra Metodologia usual Tenho N elementos na população quero uma amostra de n elementos Utilizando o valor k Nn valor inteiro mais próximo faço a seleção dos elementos em uma lista selecionando aqueles nas posições b ak com a pertencente aos naturais e b sendo um número sorteado entre 1 e k Suponha que temos os mesmo 5000 alunos mencionados anteriormente e queremos uma amostra de 100 alunos Nesse caso teria que ser feita uma lista com os nomes de todos os alunos poderia ser em ordem alfabética e novamente numerálos k 5000100 50 Sortearíamos um número entre 1 e 50 considere que saiu o número 11 Pertenceriam à amostra sistemática os alunos que tivessem os números 116111116121149114961 respectivos à eles AMOSTRAGEM ESTRATIFICADA Coleta amostras de cada estrato de uma população A amostra final é o conjunto de todas as amostras tomadas O termo estrato simboliza divisões entre elementos como sexo classe social naturalidade idade entre outras Veja o exemplo abaixo AMOSTRAGEM POR CONGLOMERADO Considera uma amostra de conglomerados prédios escolas hospitais dentre todos os existentes na população Estuda todos os elementos dentro de cada conglomerado selecionado um estágio ou parte dos elementos dos conglomerados selecionados dois estágios Veja o exemplo AMOSTRAGEM VIESADA OU TENDENCIOSA Tende a representar parte de uma população e não o todo É gerado quando os dados são coletados de maneira inapropriada sem aleatoriedade Exemplos Amostra de resposta voluntária aquela na qual os respondentes decidem eles mesmos se serão incluídos na amostra pesquisas pela internet correio telefone Questões pessoaispolemicas o entrevistado se sente coagido e prefere não responder ou mentir ex Entrevista perguntando ao indivíduo se ele já foi traído ou sua opção sexual Amostras pequenas PARÂMETROS ESTIMADORES E ESTIMATIVAS Parâmetro As quantidades da população em geral desconhecidas sobre as quais temos interesse são denominadas parâmetros e usualmente representadas por letras gregas tais como 𝜃 𝜇 𝑒 𝜎 entre outras Estimador e Estimativa O estimador é a estatística da amostra utilizada para estimar um parâmetro da população Em geral denotamos os estimadores por símbolos com o acento circunflexo 𝜃 Ƹ𝜇 𝑒 𝜎 Aos valores numéricos assumidos pelos estimadores denominamos estimativas Amostra de tamanho n X1 X2 X3 Xn PARÂMETROS ESTIMADORES E ESTIMATIVAS Como escolher qual estimador utilizar Devese estudar as propriedades de um estimador Lembrando que para amostras diferentes de uma mesma população obteremos estimativas provavelmente diferentes EXEMPLO Considere que foram retiradas 10 amostras distintas de 10 alunos da UFJF com o objetivo de estudar a idade média dos alunos da UFJF Ao calcular as médias de cada uma dessas amostras temos Ou seja as estimativas de um parâmetro obtidas por um mesmo estimador podem variar de acordo com a amostra retirada ESTIMADORES PARA MÉDIA PROPORÇÃO E VARIÂNCIA DISTRIBUIÇÕES AMOSTRAIS Estimadores são funções de variáveis aleatórias sendo assim eles também são variáveis aleatórias Vamos estudar a distribuição de probabilidade de alguns dos estimadores mais utilizados Considere X como a variável aleatória que representa o peso em kg dos alunos da UFJF que consideraremos como nossa população alvo Suponha que X segue uma distribuição normal com média de 6342kg e variância igual a 15603 kg² Se forem retiradas 50 amostras dessa população e calculadas as médias para cada amostra teremos 50 valores distintos que poderiam ser considerados como estimativas da média da população DISTRIBUIÇÕES AMOSTRAIS Podemos considerar as médias obtidas como uma nova variável aleatória TEOREMA CENTRAL DO LIMITE PARA A MÉDIA AMOSTRAL Suponha uma amostra aleatória simples de tamanho retirada de uma população com média 𝜇 e variância 𝜎² note que a distribuição de probabilidade da variável aleatória não é especificada Representando tal amostra por n variáveis aleatórias independentes X1 X2 X3 Xn e denotando sua média por ത𝑋 temos que TEOREMA CENTRAL DO LIMITE PARA A MÉDIA AMOSTRAL Garante que para n grande a distribuição da média amostral devidamente padronizada segue uma distribuição Normal Padrão Esse teorema permite que utilizemos a distribuição Normal para estudar ഥ𝑿 probabilisticamente Estudos envolvendo simulações mostram que em muitos casos valores de n ao redor de 30 fornecem aproximações bastante boas para aplicações práticas TEOREMA CENTRAL DO LIMITE PARA A PROPORÇÃO Suponha que p represente a proporção de indivíduos com determinada característica em uma população valor desconhecido e que 𝒑 represente o estimador dessa proporção considerando uma amostra da tamanho n dado por Temse que Considerando o Teorema Central do Limite temse que para n suficientemente grande EXERCÍCIOS Uma variável assume os valores 3 6 e 8 com probabilidades 04 03 e 03 respectivamente Uma amostra com 40 observações é sorteada Qual a probabilidade da média amostral superar o valor 5 Suponha que a proporção de peças fora de especificação em um lote é de 40 Tomada uma amostra de tamanho 30 qual a probabilidade dessa amostra fornecer uma proporção de peças defeituosas menor que 050 Suponha que uma recente pesquisa indique que o brasileiro tenha estatura média de 170 m com desvio padrão de 05 Selecionando uma amostra de 40 pessoas qual a probabilidade da média amostral ser superior a 172 m A DISTRIBUIÇÃO NORMAL DE PROBABILIDADES Professor Alan Corrêa Diniz A DISTRIBUIÇÃO NORMAL Para início de conversa o que é uma distribuição Uma distribuição em estatística é uma função que define uma curva e a área sob essa curva determina a probabilidade de ocorrer o evento por ela correlacionado Uma das distribuições contínuas mais utilizadas é a distribuição Normal ou Gaussiana Ela explica o comportamento de uma variável que se distribui simetricamente em relação a sua média É uma das distribuições mais utilizadas na vida acadêmica A DISTRIBUIÇÃO NORMAL A figura abaixo representa a distribuição de notas de uma turma em um determinado teste A curva em azul representa um ajuste por uma distribuição normal enquanto que as barras verticais vermelhas representam a frequência das notas em cada faixa de acertos A DISTRIBUIÇÃO NORMAL Um outro exemplo interessante é a curva de distribuição normal para a pressão arterial Abaixo a curva de distribuição normal de resultados de pressão arterial diastólica para um adulto A DISTRIBUIÇÃO NORMAL Uma variável aleatória X tem distribuição normal com parâmetros μ e σ² X Nμ σ² se sua função de densidade de probabilidade é dada por Em que 𝑥 𝜇 𝑒 𝜎2 0 Observações A DISTRIBUIÇÃO NORMAL Variável estudada PROPRIEDADES DA DISTRIBUIÇÃO NORMAL A distribuição normal é unimodal e simétrica em torno da média μ O desvio padrão σ é uma medida de dispersão dos dados ao redor da média μ Para todas as distribuições normais Propriedades da distribuição normal EXEMPLO 1 Suponha que o comprimento de recémnascidos do sexo feminino não portadores de anomalias congênitas seja uma variável aleatória com distribuição aproximadamente normal de média 4854 cm e desviopadrão 25 cm 5104 CÁLCULO DA PROBABILIDADE DE X PERTENCER A UM DETERMINADO INTERVALO Basta calcular a área sob a curva normal relativa a fdp da variável aleatória X Para calcular a área sob um gráfico é necessário resolver uma integral nem sempre trivial Como fugir do cálculo de uma integral cada vez que quiser calcular uma probabilidade Como a construção de tabelas para todas as possíveis variáveis aleatórias pertencentes a uma distribuição normal é impossível existem infinitas combinações de médias e desvios padrão utilizase a tabela da distribuição normal padrão DISTRIBUIÇÃO NORMAL PADRÃO Dizse que uma variável aleatória Z segue uma distribuição normal padrão se ela segue uma distribuição normal com média 0 e desvio padrão 1 𝑍𝑁01 Na prática você irá calcular probabilidades em X utilizando a seguinte expressão 𝑍 𝑋𝜇 𝜎 Basicamente calculandose o valor de Z e utilizando uma tabela de probabilidades de Z encontrase X A TABELA DA DISTRIBUIÇÃO NORMAL PADRÃO a inteiro primeiro decimal primeiro número depois da vírgula de Z b segundo decimal segundo número depois da vírgula de Z Z𝜶 a b Probabilidades 𝜶 de cauda direita associadas a Z CALCULANDO PZ PELA TABELA DA NORMAL PADRÃO Efetue os cálculos listados abaixo consultando a Tabela de Probabilidades Associadas à Cauda Direita da Distribuição Normal Padronizada a PZ 06 b PZ 078 c PZ 153 d PZ 123 e PZ 15 f P1 Z 2 CALCULANDO Z PELA CALCULADORA DO PROFESSOR BERTOLO Podemos também utilizar uma calculadora específica para probabilidades da distribuição normal httpwwwbertoloprobrFinEstEstatisticaDistribuicaoProbabilidades2normalindex html Pergunta devo utilizar a tabela ou a calculadora do Prof Bertolo para fazer os exercícios Resposta tanto faz EXEMPLO 2 Suponha que o comprimento de recémnascidos do sexo feminino não portadores de anomalias congênitas seja uma variável aleatória com distribuição aproximadamente normal de média 4854 cm e desviopadrão 25 cm Calcule PX 4854 PX 4479 P4604 X 5104 EXEMPLO 3 Doentes sofrendo de certa moléstia são submetidos a um tratamento intensivo cujo tempo de cura foi modelado por uma distribuição normal de média 15 e desvio padrão 2 em dias Seja X o tempo de cura calcule EXEMPLO 4 As medidas de altura dos estudantes de uma universidade são normalmente distribuídas com média de 170 cm e desvio padrão σ Um estudante desta universidade com 165 cm corresponde ao segundo decil que equivale ao vigésimo percentil Com isso o valor da variância σ² em cm² será igual a LISTA Questão 1 Considere a seguinte afirmação Na maior parte das aplicações as variáveis aleatórias contínuas representam dados de contagem enquanto as discretas representam dados de medida Tal afirmação é verdadeira ou falsa Se falsa reescrevaa de maneira que fique verdadeira Resp só reescrever ao contrário Questão 2 Os prazos de duração de gravidez têm distribuição Gaussiana com média de 268 dias e desviopadrão de 15 dias Definindo como prematura uma criança que nascer com menos de 247 dias de gestação responda a Qual é a porcentagem de crianças nascidas prematuramente Resp 00808 b Se desejássemos mudar a definição de uma criança prematura como sendo aquela cujo o período de gestação está entre os 4 menores qual seria o tempo mínimo de gestação para que uma criança não fosse considerada prematura Resp 004 Questão 3 Suponhase que antes do início do ensino remoto em decorrência da pandemia o restaurante universitário da UFJF fosse frequentado em média por 315 pessoas por dia que consomem em média 600 gramas de alimentos cada Sabendo que o desvio padrão do consumo diário deste restaurante seja de 50 gramas e que a massa diária de alimentos consumida seja normalmente distribuída determine a probabilidade de que o consumo diário por aluno esteja entre 500 g e 650 g Resp 08185 Tabela de Probabilidades Associadas à Cauda Direita da Distribuição Normal Padronizada A DISTRIBUIÇÃO BINOMIAL DE PROBABILIDADES Professor Alan Corrêa Diniz A DISTRIBUIÇÃO DE BERNOULLI Dizemos que uma variável X segue uma distribuição de Bernoulli se atribui 0 ou 1 à ocorrência de fracasso ou sucesso respectivamente Com p representando a probabilidade de sucesso consequentemente 0 p 1 e sua distribuição de probabilidade é dada por Matematicamente falando Obs em que x 0 teremos a probabilidade 1 𝑝1𝑥 x 1 teremos a probabilidade 𝑝𝑥 A DISTRIBUIÇÃO BINOMIAL Considere a repetição de n ensaios de Bernoulli independentes e com a mesma probabilidade de sucesso p A variável aleatória X que conta o número total de sucessos é denominada Binomial com parâmetros n e p A probabilidade de X é dada por Onde A DISTRIBUIÇÃO BINOMIAL Usaremos a notação 𝑋𝐵𝑖𝑛 𝑛 𝑝 para indicar que a variável aleatória X segue uma distribuição binomial com parâmetros n e p Consequência para uma variável aleatória X com distribuição Binomial 𝑋𝐵𝑖𝑛 𝑛 𝑝 então o valor esperadomédiavalor médio EX e a variância 𝝈𝟐 são dadas por Em resumo a distribuição binomial identifica a probabilidade de ocorrência de determinado evento dentro de um sistema fechado e utilizando de uma sequência limitada de tentativas 𝐸 𝑋 𝑛𝑝 𝜎2 𝑛𝑝 1 𝑝 𝐷𝑒𝑠𝑣𝑖𝑜 𝑝𝑎𝑑𝑟ã𝑜 𝜎 𝜎2 EXEMPLO 1 Uma certa doença pode ser curada através de procedimento cirúrgico em 80 dos casos Dentre os que têm essa doença sorteamos 15 pacientes que serão submetidos à cirurgia Fazendo alguma suposição que julgar necessária responda a Qual a probabilidade de todos serem curados b Em média quantos pacientes serão curados c Qual a probabilidade de pelo menos dois não serem curados d Qual a probabilidade de ao menos 10 ficarem livres da doença EXEMPLO 2 Em um determinado bairro de Juiz de ForaMG 10 das pessoas não estão vacinadas não tomaram nenhuma dose de vacina contra o vírus corona Então a Secretaria Municipal de saúde almeja selecionar aleatoriamente neste bairro um grupo de 10 pessoas para avaliar a efetividade da produção de anticorpos em decorrência da vacina Desta forma qual é a probabilidade de que nesta amostra pelo menos duas pessoas não tomaram nenhuma dose de vacina E qual é o número esperado de pessoas vacinadas neste grupo EXEMPLO 3 Em uma determinada amostra de 4 pessoas a probabilidade de um indivíduo ter sangue Rh negativo é de 010 Qual é a probabilidade de todos os indivíduos dessa amostra apresentarem Rh negativo EXEMPLO 4 Em uma certa população a probabilidade de um menino ser daltônico é 008 Num grupo de 4 meninos vindos dessa população qual é a probabilidade de 3 não serem daltônicos Qual é o valor esperado do número de daltônicos E o valor esperado daqueles que não são daltônicos RECAPITULAÇÃO VALOR ESPERADO DE UMA VARIÁVEL ALEATÓRIA CONTÍNUA OPCIONAL A média de uma variável aleatória ou esperançavalor médio pode ser interpretada como a média dos valores assumidos pela variável aleatória e é também chamado de valor esperado Para VAs contínuas considere uma variável aleatória contínua com fdp f O valor esperado de X é definido como 𝐸𝑋 න 𝑎 𝑏 𝑥𝑓 𝑥 𝑑𝑥 com condição de que o resultado da integral abaixo seja finito ou seja irá convergir න 𝑥 𝑓 𝑥 𝑑𝑥 VALOR ESPERADO DE UMA VARIÁVEL ALEATÓRIA DISCRETA Seja uma variável aleatória discreta com valores possíveis x1 xn seja pxi PX xi com i 1 2 3 n então o valor esperado ou esperançavalor médio de X é definido como 𝐸𝑋 𝑖1 𝑥𝑖𝑝𝑥𝑖 A VARIÂNCIA DE UMA VARIÁVEL ALEATÓRIA Seja X uma variável aleatória Definimos a variância de X denotado por 𝝈² da seguinte maneira 𝜎² 𝐸 𝑋2 𝐸𝑋² A raiz quadrada positiva de 𝝈² é o desviopadrão da variável X designado por 𝝈 isto é 𝜎 𝜎² EXEMPLO 5 Uma variável X assume os seguintes valores 3 6 e 8 com as seguintes probabilidades respectivamente 04 03 e 03 Calcule a variância o valor esperado e o desviopadrão dessa amostra INTRODUÇÃO À PROBABILIDADE PARTE II Professor Alan Corrêa Diniz PARTIÇÃO DO ESPAÇO AMOSTRAL Uma partição do espaço amostral é dada por um conjunto de eventos mutuamente exclusivos que quando unidos formam o espaço amostral Ou S REGRA MULTIPLICATIVA Considere dois eventos A e B Diretamente da probabilidade condicional Essa regra é de grande utilidade na verificação de dependência entre os eventos envolvidos Falando em dependência caso os eventos A e B forem independentes Exemplo 1 Se denotarmos por A o evento o leite está adulterado temos EXEMPLO 1 TEOREMA DA PROBABILIDADE TOTAL Dado um evento A e uma partição do espaço amostral B1 B2 Bk temse Temos as seguintes informações do enunciado PF1 020 e PAF1 020 PF2 030 e PAF2 005 PF3 050 e PAF3 002 Queremos saber a probabilidade do evento A o leite está adulterado ocorrer PA PA F1 PA F2 PA F3 PA PAF1PF1 PAF2PF2 PAF3PF3 PA 020 020 005 030 002 050 PA 004 0015 001 PA 0065 Podemos ainda estar interessados em saber qual a probabilidade de que a amostra adulterada ter sido obtida do leite fornecido pela fazenda F1 ou seja PF1A PF1A PA F1 PA PF1A PAF1PF1 PAF1PF1 PAF2PF2 PAF3PF3 PF1A 020020 020020 005030 002050 PF1A 004 0065 TEOREMA DE BAYES Dado um evento A e uma partição do espaço amostral B1 B2 Bk temse PF1A 0615 VOLTANDO AO EXEMPLO 1 EXEMPLO 2 EXEMPLO 3 TABELA DE DUPLA ENTRADA Você entrega a seu amigo uma carta destinada à sua namorada para ser colocada no correio Entretanto ele pode se esquecer com probabilidade 01 Se ele não se esquecer a probabilidade de que o correio extravie a carta é de 01 Finalmente se foi enviada pelo correio a probabilidade de que a namorada não receba é de 01 Sua namorada não recebeu a carta qual a probabilidade de seu amigo ter esquecido de colocála no correio Avalie as possibilidades desse namoro continuar se a comunicação depender das cartas enviadas A tabela a seguir apresenta informações de alunos de uma universidade quanto às variáveis Período Sexo e Opinião sobre a Reforma Agrária Determine a probabilidade de escolhermos Uma pessoa do sexo masculino e sem opinião sobre a reforma agrária Uma mulher contrária a reforma agrária Dentre os estudantes do noturno um que seja a favor da reforma agrária Uma pessoa sem opinião sabendose que ela é do sexo feminino INTRODUÇÃO À PROBABILIDADE PARTE I Professor Alan Corrêa Diniz INTRODUÇÃO Onde usar a teoria das probabilidades Qual a chance de um paciente desenvolver câncer de pulmão dado que seus pais foram acometidos dessa terrível doença Uma farmacêutica informa que seu medicamento possui 85 de efetividade em cada paciente Qual a probabilidade de 7 em 10 pacientes serem curados devido a eficácia desse remédio Como verificar a efetividade do medicamento acima Qual a chance de uma criança nascer com olhos azuis dado que seus pais possuem olhos verdes pai e olhos azuis pai INTRODUÇÃO A probabilidade tem origem no século XVII motivada inicialmente pelos jogos de azar De maneira bastante informal referese à probabilidade como uma medida de chance de algum evento ocorrer Inicialmente vamos discutir sobre a importância de usar aleatorização na seleção de amostras ou execução de experimentos Dispondo de amostras ou experimentos aleatórios usaremos probabilidade para quantificar a chance de ocorrência dos possíveis resultados Com base no cálculo de probabilidades para diferentes resultados amostrais ou experimentais estaremos aptos a produzir inferências ELEMENTOS BÁSICOS DE PROBABILIDADE O espaço amostral é o conjunto de todos os possíveis resultados de um experimento Denotamos o espaço amostral pela letra S Um evento é qualquer subconjunto do espaço amostral Eventos são representados por letras maiúsculas usualmente as primeiras do alfabeto A B C Um evento simples é qualquer evento constituído por um único elemento do espaço amostral Exemplo lançamento de um dado Espaço amostral S 1 2 3 4 5 6 Evento A Somente resultados pares A 2 4 6 EXEMPLO 1 Um dado comum com seis faces numeradas de um a seis é lançado uma única vez Registrase o valor da face voltada para cima Represente o espaço amostral e os seguintes eventos a A sai o número 3 b B sai um número par c C sai um valor maior que 4 d Algum dos eventos solicitados configura um evento simples Justifique EXEMPLO 2 Um grupo é composto por cinco crianças Pedro João Maria Ana e Beatriz Duas dessas crianças serão sorteadas aleatoriamente para uma apresentação musical Considerando como resultado do sorteio o par crianças selecionadas a Represente o espaço amostral b Represente o evento A Pedro é um dos selecionados c Represente o evento B A dupla selecionada é composta por um menino e uma menina EXEMPLO 3 O tempo de vida em anos para um paciente com diagnóstico de câncer no pâncreas é observado Represente o espaço amostral e os seguintes eventos a A O paciente sobrevive por menos de três anos b B O paciente sobrevive por mais de dois mas por menos de cinco anos c C O paciente sobrevive por um ano ou mais RELAÇÕES E OPERAÇÕES ENTRE EVENTOS O DIAGRAMA DE VENN Diferentes eventos podem ser definidos com base num único espaço amostral Como dito anteriormente eventos são subconjuntos de resultados do espaço amostral correspondendo usando analogia com a teoria dos conjuntos ao conjunto universo O estudo da relação entre dois ou mais eventos fica facilitado utilizandose os chamados Diagramas de Venn RELAÇÕES E OPERAÇÕES ENTRE EVENTOS O DIAGRAMA DE VENN A união de dois eventos A e B representada por AUB é definida como o evento ocorre A ocorre B ou ocorrem ambos A e B RELAÇÕES E OPERAÇÕES ENTRE EVENTOS O DIAGRAMA DE VENN A intersecção de dois eventos A e B representada por AꓵB é definida como o evento ocorrem A e B RELAÇÕES E OPERAÇÕES ENTRE EVENTOS O DIAGRAMA DE VENN Dois eventos A e B são denominados disjuntos ou mutuamente exclusivos se eles não têm qualquer resultado em comum o que pode ser denotado por AꓵB RELAÇÕES E OPERAÇÕES ENTRE EVENTOS O DIAGRAMA DE VENN O complemento de um evento A denotado por 𝑨𝑪 ou ഥ𝑨 corresponde ao evento não ocorre A RELAÇÕES E OPERAÇÕES ENTRE EVENTOS O DIAGRAMA DE VENN Dizemos que um evento A está contido num evento B se todos os eventos simples pertencentes a A também pertencem a B Denotamos essa relação por A B NÚMERO DE ELEMENTOS DA UNIÃO Para conjuntos mutuamente exclusivos A e B acontece quando ocorre A ocorre B ou ambos 𝑛 𝐴𝑈𝐵 𝑛 𝐴 𝑛𝐵 NÚMERO DE ELEMENTOS DA UNIÃO Para conjuntos onde há intersecção A e B é necessário descontar os elementos de A e B 𝑛 𝐴𝑈𝐵 𝑛 𝐴 𝑛 𝐵 𝑛𝐴 𝐵 Obs Embora tenham sido apresentadas apenas ilustrações de operações envolvendo dois eventos todas elas se estendem para um número maior possivelmente até infinito de eventos ABORDAGEM CLÁSSICA DA PROBABILIDADE Suponha que o espaço amostral seja composto por um conjunto finito de n resultados eventos simples Considere adicionalmente que todos os resultados sejam equiprováveis Neste caso considerando A um evento qualquer do espaço amostral a probabilidade do evento A pode ser calculada por EXEMPLO 5 Em uma urna existem bolas enumeradas de 1 a 15 Qualquer uma delas possui a mesma chance de ser retirada Determine a probabilidade de se retirar uma bola com número nas seguintes condições a par b primo c par ou primo d par e primo AXIOMAS DA PROBABILIDADE Um axioma nada mais é que conceito matemático que não precisa de demonstração para ser verdadeiro isto é uma ideia óbvia por consenso Considere um experimento cujo espaço amostral é S Para cada evento E do espaço amostral S assumimos que um número PE seja definido e satisfaça os três axiomas a seguir Axioma 1 A probabilidade de um evento E ocorrer é quantificada por um número situado entre 0 e 1 para todo evento E pertencente ao espaço S 0 𝑃𝐸 1 Axioma 2 A probabilidade de ocorrer o evento espaço amostral S é igual a 1 PS 1 Axioma 3 Sejam E e F eventos pertencentes ao espaço amostral S Se EF então a probabilidade de ocorrência do evento E F é igual à probabilidade de ocorrência do evento E somada à probabilidade do evento F 𝑃 𝐸𝑈𝐹 𝑃 𝐸 𝑃𝐹 PROBABILIDADE CONDICIONAL Dado um espaço amostral S e os eventos E e F pertencentes a S Denominase probabilidade condicionada a probabilidade de E dado a ocorrência de F Basicamente isso significa que houve uma redução do espaço amostral de S para F Deste modo supondose a ocorrência de F calculase a probabilidade de E Essa situação pode ser representada pela expressão 𝑃 𝐸 𝐹 representada graficamente como E F 𝑃 𝐸 𝐹 𝑃𝐸 𝐹 𝑃𝐹 EVENTOS INDEPENDENTES Eventos independentes são definidos como aqueles em que a probabilidade de ocorrência de um evento não interfere na probabilidade de ocorrência de outro Dado um espaço amostral S e os eventos E e F tal que ambos pertencem a S podemos representar os eventos independentes como 𝑃 𝐸 𝑃 𝐸 𝐹 𝑒 𝑃 𝐹 𝑃 𝐹 𝐸 Temos então que 𝑃 𝐸 𝐹 𝑃𝐸 𝐹 𝑃𝐹 𝑃𝐸 A probabilidade condicional nos permite afirmar que 𝑃 𝐸 𝐹 𝑃 𝐸 𝑃𝐹 EXEMPLO 6 Antônio Bruno e Celso disputaram uma corrida Dadas as condições físicas e de preparo Bruno tem o triplo de chances de vencer Antônio e Celso tem o quádruplo de chances de vencer Bruno Dessa forma qual a probabilidade de Bruno vencer a corrida EXEMPLO 7 Suponhase que PA 14 e PB 18 Quanto é PAB se respectivamente a A e B são mutuamente exclusivos b A e B são independentes PARA CASA 1 Um dado comum justo todas as faces equiprováveis é lançado duas vezes A é o evento soma das jogadas é igual a 4 B é pelo menos uma das jogadas é 3 Quanto é PAB Resp 211 PARA CASA 2 Jorge leva dois livros para ler durante as férias A probabilidade de ele gostar do primeiro livro é de 05 de gostar do segundo livro é de 04 e de gostar de ambos os livros é de 03 Qual é a probabilidade de que ele não goste de nenhum dos livros Resp 04 OPCIONAL As probabilidades de um contador A demorar uma duas ou três horas para preencher uma declaração de imposto de renda são dadas respectivamente por 14 12 e 14 Dentre 5 declarações escolhidas aleatoriamente e com reposição das declarações que A deverá elaborar a probabilidade dele demorar para o preenchimento em três delas 1 hora em uma 2 horas e na restante 3 horas é igual a qual valor Dica revise arranjos e combinações Resp 5128
Envie sua pergunta para a IA e receba a resposta na hora
Texto de pré-visualização
INTRODUÇÃO AOS TESTES DE HIPÓTESE Professor Alan Corrêa Diniz INTRODUÇÃO Motivação Uma pesquisa deseja saber o efeito de um medicamento sobre uma determinada vitamina presente no sangue Suponha que a concentração dessa vitamina no sangue seja dada por uma distribuição normal DEFICIENTE NORMAL EXCESSO INTRODUÇÃO Situação 1 Amostra de pessoas com deficiência dessa vitamina Objetivo criar um medicamento que aumente a concentração dessa vitamina no sangue Concentração dessa vitamina no sangue aumentou Concentração dessa vitamina no sangue permaneceu a mesma INTRODUÇÃO Situação 2 Amostra de pessoas com excesso dessa vitamina Objetivo criar um medicamento que diminua a concentração dessa vitamina no sangue Concentração dessa vitamina no sangue diminuiu Concentração dessa vitamina no sangue permaneceu a mesma INTRODUÇÃO Situação 3 Amostra aleatória Amostra com deficiência dessa vitamina Amostra com excesso dessa vitamina Amostra com concentração dessa vitamina nos padrões normais DEFINIÇÕES Definição Uma hipótese estatística é uma afirmação acerca dos parâmetros de uma ou mais populações ou acerca da distribuição da população É uma afirmação sobre uma população e não sobre amostra Normalmente são formuladas duas hipóteses H0 hipótese nula ou conservadora que é a hipótese que não se quer testar aquilo que eu já tenho não desafia o que já sabe ou foi especificado Ha hipótese alternativa que será aceita se não for possível provar que H0 é verdadeira é inovador desafia o que se é conhecido objetivo de pesquisa VOLTANDO AO EXEMPLO Situação 1 H0 𝜇 10 unidadesml Ha 𝜇 10 unidadesml Situação 2 H0 𝜇 18 unidadesml Ha 𝜇 18 unidadesml Situação 3 H0 𝜇 10 unidadesml Ha 𝜇 14 unidadesml Se a população tiver deficiência da vitamina 𝜇 14 Se a população tiver excesso da vitamina 𝜇 14 HIPÓTESES DE INTERESSE Unilaterais H0 𝜇 a Ha 𝜇 a unilateral à esquerda ou H0 𝜇 a Ha 𝜇 a unilateral à direita Costumase utilizar a notação abaixo equivalentes H0 𝜇 a Ha 𝜇 a unilateral à esquerda ou H0 𝜇 a Ha 𝜇 a unilateral à direita Bilaterais H0 𝜇 a Ha 𝜇 a Aqui não precisa alterar a notação igualdade e diferença são complementares Identifique as hipóteses que estão sendo testadas em cada caso informando se são uni ou bilaterais A companhia de transporte afirma que em média o intervalo entre sucessivos ônibus é de 15 minutos Uma associação de usuários de transportes coletivos acha que a pontualidade é muito importante e pretende testar a afirmação da companhia Os amortecedores de automóveis que circulam entre cidades duram em média 30 mil quilômetros segundo informações de algumas oficinas especializadas Um proprietário de automóvel deseja testar essa informação Um veterinário conseguiu ganho médio diário de 3 litros de leite por vaca com uma nova composição de ração Um pecuarista acredita que o ganho não é tão grande assim ERROS Erro tipo I rejeitar H0 quando está verdadeira Erro tipo II não rejeitar H0 quando está falsa A probabilidade de cometer o erro tipo I é denominada nível de significância e é denotada por α A probabilidade de cometer erro tipo II é denotada por β Decisão H0 é verdadeira H0 é falsa Não rejeitar H0 Decisão Correta Erro tipo II Rejeitar H0 Erro tipo I Decisão Correta ERROS DE DECISÃO Na prática é especificado a probabilidade máxima permissível de se cometer o erro tipo I chamado nível de significância Escolhas comuns para o nível de significância são 005 5 e 001 1 Assim se a probabilidade de se cometer um erro Tipo I é controlada por selecionar um pequeno valor para o nível de significância temos um alto grau de confiança que a conclusão para rejeitar H0 está correta Em tais casos temos o suporte estatístico para concluir que H0 é falso e Ha é verdadeiro Qualquer hipótese sugerida para Ha é aceita ERROS DE DECISÃO Como na prática não se atenta para a probabilidade de se cometer o erro tipo II se decidimos aceitar H0 não podemos determinar quão confiantes podemos estar com aquela decisão Assim recomendase que seja usado a declaração não rejeitar H0 em vez de aceitar H0 ESTATÍSTICA DO TESTE Temos agora que escolher a estatística do teste isto é uma função dos dados da amostra na qual a decisão rejeitar H0 ou não rejeitar H0 se baseia 𝑍 ҧ𝑥𝜇 𝜎 𝑛 para a distribuição normal da média com 𝝈 conhecido 𝑡 ҧ𝑥𝜇 𝑠 𝑛 para a distribuição tStudent 𝝈 desconhecido grau de liberdade gl n 1 COMO REALIZAR TESTES DE HIPÓTESE Para amostras pequenas n 30 ou quando σ for desconhecido usamos s desviopadrão amostral ao invés de σ desviopadrão populacional e consideramos o grau de liberdade como n1 Para σ desconhecido a distribuição é uma t não uma normal mas para amostras de tamanho muito grandes as diferenças entre as distribuições normal e t são desprezíveis mas o uso da distribuição t dá melhores resultados TESTE DE HIPÓTESE UNILATERAL À DIREITA 𝐻0 𝜇 𝑎 𝐻𝑎 𝜇 𝑎 Não rejeitar H0 Rejeitar H0 TESTE DE HIPÓTESE UNILATERAL À ESQUERDA 𝐻0 𝜇 𝑎 𝐻𝑎 𝜇 𝑎 Rejeitar H0 Não rejeitar H0 TESTE DE HIPÓTESE BILATERAL 𝐻0 𝜇 𝑎 𝐻𝑎 𝜇 𝑎 α2 α2 Rejeitar H0 Rejeitar H0 Não rejeitar H0 TESTE DE HIPÓTESE UNILATERAL À ESQUERDA Exemplo Uma pesquisa feita em universidades mostrou que professores de Estatística ganham em média de R 4567800 por ano com um desvio padrão de R 700000 Uma amostra com 81 professores chegou à média de R 4800000 Construa um teste de hipótese verificando se o salário médio pode ser menor que o informado a um nível de significância de 5 𝐻0 𝜇 45678 𝐻𝑎𝜇 45678 𝑍 ҧ𝑥 𝜇 𝜎 𝑛 48000 45678 7000 81 2322 77777 298 Para 5 zc 165 Conclusão Não rejeitamos H0 O salário não é menor que R 4567800 considerando o nível de significância de 5 zc 165 TESTE DE HIPÓTESE BILATERAL Exemplo Um comprador de tijolos julga que a qualidade dos tijolos está deteriorando Sabese pela experiência passada que a média de resistência ao esmagamento destes tijolos é de 400 libras com desvio padrão de 20 libras Uma amostra de 100 tijolos deu uma média de 395 libras Teste a hipótese de que a qualidade média não se alterou contra a alternativa de que se tenha deteriorado considere o nível de significância de 5 Teste bilateral 𝐻0 𝜇 400 𝐻𝑎 𝜇 400 𝑍 ҧ𝑥 𝜇 𝜎 𝑛 395 400 20 100 5 2 25 Conclusão rejeitamos H0 isto é a resistência não é mais de 400 libras zc 196 zc 196 Para 5 zc 196 TESTE DE HIPÓTESE UNILATERAL À DIREITA Exemplo Um trecho de uma rodoviária quando é utilizado o radar são verificadas em média 7 infrações diárias por excesso de velocidade O chefe da polícia acredita que este número pode ter aumentado Para verificar isso o radar foi mantido por 10 dias consecutivos Os resultados foram 8 9 5 7 8 12 6 9 6 10 com desvio padrão de 21 Os dados trazem evidências do aumento das infrações a um nível de significância de 5 𝐻0 𝜇 7 𝐻𝑎 𝜇 7 Média amostral 895781269610 10 8 Usando tStudent 𝑡 ҧ𝑥𝜇 𝑠 𝑛 87 21 10 15 t 15 tc 183 Conclusão Não rejeitamos H0 o que implica que o número de infrações não teve um aumento significativo gl 10 1 9 INTERVALOS DE CONFIANÇA Professor Alan Corrêa Diniz INTERVALOS DE CONFIANÇA Até agora vimos estimadores pontuais que fornecem um único valor numérico para o parâmetro de interesse De agora em diante vamos usar os dados amostrais para calcular um intervalo de valores plausíveis de um parâmetro populacional desconhecido Como os estimadores são variáveis aleatórias podese apresentar uma estimativa mais informativa para o parâmetro de interesse uma que inclua uma medida de precisão do valor obtido Esse método é denominado por intervalos de confiança IC e incorpora à estimativa pontual do parâmetro informações a respeito de sua variabilidade INTERVALOS DE CONFIANÇA Podese utilizar o conhecimento da distribuição da média amostral para construir um intervalo de confiança para a média 𝝁 de uma população Dada uma variável aleatória X com média 𝜇 e variância 𝝈² conhecida temse que Dado que X siga uma distribuição normal ou que n seja suficientemente grande Teorema Central do Limite INTERVALOS DE CONFIANÇA Para a variável aleatória Z que segue uma distribuição normal padrão 95 das observações se encontram entre 196 e 196 Dado que As propriedades da distribuição normal permitem a manipulação da desigualdade dentro do parênteses sem alterar a afirmação da probabilidade INTERVALOS DE CONFIANÇA Ao multiplicar os três termos da desigualdade pelo erro padrão da média 𝜎 𝑛 temse Em seguida podese subtrair a média amostral ത𝑋 dos três termos da desigualdade Por fim podese multiplicar os três termos da desigualdade por 1 Ao rearranjarmos os termos da desigualdades temse INTERVALOS DE CONFIANÇA O intervalo anterior considera os valores inferior e superior que limitam 95 dos valores mais prováveis de representarem a média populacional As quantidades ത𝑋 196 𝜎 𝑛 e ത𝑋 196 𝜎 𝑛 limitam o intervalo de confiança de 95 para a média da população ou seja com 95 de confiança o intervalo ത𝑋 196 𝜎 𝑛 ത𝑋 196 𝜎 𝑛 conterá a média populacional 𝝁 Em outras palavras se forem retiradas 100 amostras independentes e construídos 100 intervalos de confiança 95 desses intervalos iriam conter o valor de 𝝁 e 5 deles não INTERVALOS DE CONFIANÇA É importante ressaltar que apesar de procurarmos tirar conclusões sobre a média populacional 𝜇 essa média é um valor fixo embora desconhecido e não uma variável aleatória O intervalo de confiança mais comum é o que considera um nível de confiança de 95 porém esse não é o único Podese montar intervalos de confiança de qualquer tamanho dependendo do interesse do pesquisador no entanto intervalos de menos de 90 de confiança são de pouca utilidade INTERVALOS DE CONFIANÇA Seja 𝑧𝛼2 o valor que limita uma área de 𝛼2 na extremidade superior da distribuição normal padrão e 𝑧𝛼2 o valor que limita uma área de 𝛼2 na extremidade inferior da distribuição normal padrão Então a forma geral para um intervalo de confiança de 1001 𝛼 para 𝜇 é dada por Se por exemplo tomarmos e 𝛼 005 teríamos Coeficiente de confiança EXEMPLO 1 Suponha que os comprimentos de jacarés adultos de uma certa raça siga uma distribuição normal com média 𝜇 e variância igual a 001 m² Uma amostra de dez animais foi sorteada e forneceu média de 169 m Encontre o intervalo de 95 de confiança para o parâmetro desconhecido 𝜇 𝜎 0012 𝑚² 001 𝑚 ത𝑋 169 𝑚 𝐼𝐶 95 𝑛 10 𝑗𝑎𝑐𝑎𝑟é𝑠 95 1 𝛼 100 𝛼 005 5 𝑧 𝛼 2 𝑧 005 2 𝑧0025 𝑧0025 196 𝑧0025 196 𝐼𝐶 ത𝑋 𝑧 𝛼 2 𝜎 𝑛 ത𝑋 𝑧 𝛼 2 𝜎 𝑛 𝐼𝐶 95 169 196 001 10 169 196 001 10 𝐼𝐶 95 157 181 𝑚 𝐼𝑠𝑡𝑜 é 𝑠𝑒 100 𝑎𝑚𝑜𝑠𝑡𝑟𝑎𝑠 𝑓𝑜𝑟𝑒𝑚 𝑟𝑒𝑡𝑖𝑟𝑎𝑑𝑎𝑠 𝑒𝑚 95 𝑑𝑒𝑙𝑎𝑠 𝑎 𝑚é𝑑𝑖𝑎 𝜇 𝑒𝑠𝑡𝑎𝑟á 𝑐𝑜𝑛𝑡𝑖𝑑𝑎 𝑛𝑜 𝐼𝐶 𝑎𝑐𝑖𝑚𝑎 𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 EXEMPLO 2 Um provedor de acesso à internet está monitorando a duração do tempo das conexões de seus clientes com o objetivo de dimensionar seus equipamentos São desconhecidas a média e a distribuição de probabilidade desse tempo mas o desvio padrão por analogia a outros serviços é considerado igual a 50 minutos Uma amostra de 500 conexões resultou num valor médio observado de 25 minutos O que dizer da verdadeira média com confiança 92 𝜎 50 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 𝑛 500 𝑐𝑜𝑛𝑒𝑥õ𝑒𝑠 𝐼𝐶 92 ത𝑋 25 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 92 1 𝛼 100 𝛼 008 8 𝑧 𝛼 2 𝑧 008 2 𝑧004 𝑧004 175 𝑧004 175 𝐼𝐶 ത𝑋 𝑧 𝛼 2 𝜎 𝑛 ത𝑋 𝑧 𝛼 2 𝜎 𝑛 𝐼𝐶 92 25 175 50 500 25 175 50 500 𝐼𝐶 92 2444 2556 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 𝐼𝑠𝑡𝑜 é 𝑠𝑒 100 𝑎𝑚𝑜𝑠𝑡𝑟𝑎𝑠 𝑓𝑜𝑟𝑒𝑚 𝑟𝑒𝑡𝑖𝑟𝑎𝑑𝑎𝑠 𝑒𝑚 92 𝑑𝑒𝑙𝑎𝑠 𝑎 𝑚é𝑑𝑖𝑎 𝜇 𝑒𝑠𝑡𝑎𝑟á 𝑐𝑜𝑛𝑡𝑖𝑑𝑎 𝑛𝑜 𝐼𝐶 𝑎𝑐𝑖𝑚𝑎 𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 INTERVALOS DE CONFIANÇA O tamanho de um intervalo de confiança varia de acordo com o nível de confiança do mesmo ou de acordo com o tamanho da amostra Para uma amostra de tamanho n fixo INTERVALOS DE CONFIANÇA Para 𝛼 005 EXEMPLO 3 A vida média de baterias automotivas de uma certa marca está sendo estudada Baseado em estudos similares com outras marcas é possível admitir que a vida dessas baterias segue a distribuição normal com desvio padrão de 45 meses De qual tamanho deverá ser a amostra para que a amplitude do intervalo de 90 de confiança para a vida média seja de 3 meses 𝜎 45 𝑚𝑒𝑠𝑒𝑠 𝑛 𝐼𝐶 90 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑𝑒 3 𝑚𝑒𝑠𝑒𝑠 90 1 𝛼 100 𝛼 01 10 𝑧 𝛼 2 𝑧 01 2 𝑧005 𝑧005 1645 𝑧005 1645 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑𝑒 ത𝑋 𝑧 𝛼 2 𝜎 𝑛 ത𝑋 𝑧 𝛼 2 𝜎 𝑛 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑𝑒 2𝑧 𝛼 2 𝜎 𝑛 3 21645 45 𝑛 𝑛 2435 24 𝑏𝑎𝑡𝑒𝑟𝑖𝑎𝑠 𝑎𝑝𝑟𝑜𝑥𝑖𝑚𝑎𝑑𝑎𝑚𝑒𝑛𝑡𝑒 INTERVALOS DE CONFIANÇA O Teorema Central do Limite diz que a distribuição de probabilidade do estimador da proporção de determinada característica quando n é grande o suficiente se aproxima de uma distribuição normal padrão Logo analogamente ao que foi feito para a média podese construir um intervalo de confiança para a proporção em uma população com base na proporção amostral Mas temos um problema aqui INTERVALOS DE CONFIANÇA Não é possível utilizar o intervalo de confiança encontrado já que não conhecemos o valor de p Sendo assim são propostas as soluções abaixo Substituir p por Ƹ𝑝 intervalo otimista Substituir p1p por 14 valor máximo que p1 p pode alcançar intervalo conservador EXEMPLO 4 Pretendese estimar a proporção p de cura através do uso de um certo medicamento em doentes contaminados com cercária que é uma das formas do verme da esquistossomose Um experimento consistiu em aplicar o medicamento em 200 pacientes escolhidos ao acaso e observar que 160 deles foram curados O que podemos dizer da proporção p na população em geral a um nível de 99 de confiança utilize ambos os intervalos otimista e conservador Como os dois intervalos calculados se comparam 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑜𝑡𝑖𝑚𝑖𝑠𝑡𝑎 Ƹ𝑝 160 200 08 𝑛 200 𝑝𝑎𝑐𝑖𝑒𝑛𝑡𝑒𝑠 𝐼𝐶 99 99 1 𝛼 100 𝛼 001 1 𝑧 𝛼 2 𝑧 001 2 𝑧0005 𝑧0005 2575 𝑧0005 2575 𝐼𝐶 Ƹ𝑝 𝑧 𝛼 2 Ƹ𝑝1 Ƹ𝑝 𝑛 Ƹ𝑝 𝑧 𝛼 2 Ƹ𝑝1 Ƹ𝑝 𝑛 𝐼𝐶 99 08 2575 08 1 08 200 08 2575 08 1 08 200 𝐼𝐶 99 07279 08721 EXEMPLO 4 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑐𝑜𝑛𝑠𝑒𝑟𝑣𝑎𝑑𝑜𝑟 Ƹ𝑝 160 200 08 𝑛 200 𝑝𝑎𝑐𝑖𝑒𝑛𝑡𝑒𝑠 𝐼𝐶 99 99 1 𝛼 100 𝛼 001 1 𝑧 𝛼 2 𝑧 001 2 𝑧0005 𝑧0005 2575 𝑧0005 2575 𝐼𝐶 Ƹ𝑝 𝑧 𝛼 2 1 4𝑛 Ƹ𝑝 𝑧 𝛼 2 1 4𝑛 𝐼𝐶 99 08 2575 1 4𝑥200 08 2575 1 4𝑥200 𝐼𝐶 99 071 089 𝑂 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑐𝑜𝑛𝑠𝑒𝑟𝑣𝑎𝑑𝑜𝑟 𝑝𝑜𝑟 𝑝𝑒𝑟𝑚𝑖𝑡𝑖𝑟 𝑎𝑚𝑜𝑠𝑡𝑟𝑎𝑠 𝑚𝑎𝑖𝑠 𝑣𝑎𝑟𝑖𝑎𝑑𝑎𝑠 𝑎𝑝𝑎𝑟𝑒𝑛𝑡𝑒𝑚𝑒𝑛𝑡𝑒 é 𝑚𝑎𝑖𝑠 𝑣𝑎𝑛𝑡𝑎𝑗𝑜𝑠𝑜 𝑞𝑢𝑒 𝑜 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑜𝑡𝑖𝑚𝑖𝑠𝑡𝑎 IC PARA VARIÂNCIA DESCONHECIDA Suponha que uma amostra aleatória 𝑋1 𝑋2 𝑋3 𝑋𝑛 obtida de uma população com distribuição normal com média e variância desconhecidas temos 𝑡 ത𝑋 𝜇 𝑠 𝑛 𝑡𝑛 1 t segue uma distribuição t de Student com n 1 graus de liberdade ത𝑋 representa a média amostral 𝜇 é a média que se deseja conhecer s é o desviopadrão amostral n é o tamanho amostral IC PARA VARIÂNCIA DESCONHECIDA Fixando o coeficiente de confiança 𝛼 0 𝛼 1 e utilizando a tabela da distribuição t de Student com n1 graus de liberdade podemos obter o valor 𝒕 Τ 𝜶 𝟐 tal que Logo o intervalo de confiança 1 𝛼 100 para 𝜇 com variância desconhecida será dada por S desviopadrão amostral EXEMPLO 5 Admitindo que a pressão sanguínea arterial em homens siga uma distribuição normal 7 pacientes foram sorteados e tiveram sua pressão medida em unidades arbitrárias com os seguintes resultados 84 81 77 85 69 80 79 Determine um intervalo de 98 de confiança para 𝜇 𝐶á𝑙𝑐𝑢𝑙𝑜 𝑑𝑎 𝑚é𝑑𝑖𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎𝑙 ത𝑋 84 81 77 85 69 80 79 7 ത𝑋 7929 𝑢𝑛𝑖𝑑𝑎𝑑𝑒𝑠 𝑎𝑟𝑏𝑖𝑡𝑟á𝑟𝑖𝑎𝑠 𝐶á𝑙𝑐𝑢𝑙𝑜 𝑑𝑜 𝑑𝑒𝑠𝑣𝑖𝑜 𝑝𝑎𝑑𝑟ã𝑜 𝑎𝑚𝑜𝑠𝑡𝑟𝑎𝑙 𝑆 1 𝑛 1 𝑖1 𝑛 𝑥𝑖 ҧ𝑥² unidades arbitrárias NOÇÕES SOBRE INFERÊNCIA ESTATÍSTICA TEOREMA CENTRAL DO LIMITE Professor Alan Corrêa Diniz INFERÊNCIA ESTATÍSTICA Conjunto de técnicas que tem por objetivo estudar a população através de uma amostra TERMINOLOGIA DA AMOSTRAGEM PopulaçãoAlvo População que se deseja descrever População de Estudo Subconjunto da populaçãoalvo do qual as amostras serão selecionadas Sistema de Referência Lista dos elementos pertencentes à população de estudo Amostra Todo o subconjunto não vazio e com um número menor de elementos do que o conjunto definido como população Unidade Amostral Cada elemento contido na amostra MANEIRAS DE SELECIONAR AMOSTRAS Amostragem Aleatória Simples Amostragem Sistemática Amostragem Estratificada Amostragem por Conglomerado AMOSTRAGEM ALEATÓRIA SIMPLES Mesma chance de seleção para todos os elementos da população Metodologia Listar ou numerar todos os elementos da população e sortear elementos ao acaso até que a amostra alcance o tamanho desejado Exemplo Suponha que tenham 5000 alunos no ensino médio na cidade na qual o estudo será feito Seriam dados números de 1 a 5000 a cada um dos alunos e depois 100 desses números seriam sorteados sem reposição Dessa maneira obteríamos uma amostra simples da população de estudo AMOSTRAGEM SISTEMÁTICA Utiliza um sistema imposto pelo pesquisador na seleção dos elementos que formarão a amostra Metodologia usual Tenho N elementos na população quero uma amostra de n elementos Utilizando o valor k Nn valor inteiro mais próximo faço a seleção dos elementos em uma lista selecionando aqueles nas posições b ak com a pertencente aos naturais e b sendo um número sorteado entre 1 e k Suponha que temos os mesmo 5000 alunos mencionados anteriormente e queremos uma amostra de 100 alunos Nesse caso teria que ser feita uma lista com os nomes de todos os alunos poderia ser em ordem alfabética e novamente numerálos k 5000100 50 Sortearíamos um número entre 1 e 50 considere que saiu o número 11 Pertenceriam à amostra sistemática os alunos que tivessem os números 116111116121149114961 respectivos à eles AMOSTRAGEM ESTRATIFICADA Coleta amostras de cada estrato de uma população A amostra final é o conjunto de todas as amostras tomadas O termo estrato simboliza divisões entre elementos como sexo classe social naturalidade idade entre outras Veja o exemplo abaixo AMOSTRAGEM POR CONGLOMERADO Considera uma amostra de conglomerados prédios escolas hospitais dentre todos os existentes na população Estuda todos os elementos dentro de cada conglomerado selecionado um estágio ou parte dos elementos dos conglomerados selecionados dois estágios Veja o exemplo AMOSTRAGEM VIESADA OU TENDENCIOSA Tende a representar parte de uma população e não o todo É gerado quando os dados são coletados de maneira inapropriada sem aleatoriedade Exemplos Amostra de resposta voluntária aquela na qual os respondentes decidem eles mesmos se serão incluídos na amostra pesquisas pela internet correio telefone Questões pessoaispolemicas o entrevistado se sente coagido e prefere não responder ou mentir ex Entrevista perguntando ao indivíduo se ele já foi traído ou sua opção sexual Amostras pequenas PARÂMETROS ESTIMADORES E ESTIMATIVAS Parâmetro As quantidades da população em geral desconhecidas sobre as quais temos interesse são denominadas parâmetros e usualmente representadas por letras gregas tais como 𝜃 𝜇 𝑒 𝜎 entre outras Estimador e Estimativa O estimador é a estatística da amostra utilizada para estimar um parâmetro da população Em geral denotamos os estimadores por símbolos com o acento circunflexo 𝜃 Ƹ𝜇 𝑒 𝜎 Aos valores numéricos assumidos pelos estimadores denominamos estimativas Amostra de tamanho n X1 X2 X3 Xn PARÂMETROS ESTIMADORES E ESTIMATIVAS Como escolher qual estimador utilizar Devese estudar as propriedades de um estimador Lembrando que para amostras diferentes de uma mesma população obteremos estimativas provavelmente diferentes EXEMPLO Considere que foram retiradas 10 amostras distintas de 10 alunos da UFJF com o objetivo de estudar a idade média dos alunos da UFJF Ao calcular as médias de cada uma dessas amostras temos Ou seja as estimativas de um parâmetro obtidas por um mesmo estimador podem variar de acordo com a amostra retirada ESTIMADORES PARA MÉDIA PROPORÇÃO E VARIÂNCIA DISTRIBUIÇÕES AMOSTRAIS Estimadores são funções de variáveis aleatórias sendo assim eles também são variáveis aleatórias Vamos estudar a distribuição de probabilidade de alguns dos estimadores mais utilizados Considere X como a variável aleatória que representa o peso em kg dos alunos da UFJF que consideraremos como nossa população alvo Suponha que X segue uma distribuição normal com média de 6342kg e variância igual a 15603 kg² Se forem retiradas 50 amostras dessa população e calculadas as médias para cada amostra teremos 50 valores distintos que poderiam ser considerados como estimativas da média da população DISTRIBUIÇÕES AMOSTRAIS Podemos considerar as médias obtidas como uma nova variável aleatória TEOREMA CENTRAL DO LIMITE PARA A MÉDIA AMOSTRAL Suponha uma amostra aleatória simples de tamanho retirada de uma população com média 𝜇 e variância 𝜎² note que a distribuição de probabilidade da variável aleatória não é especificada Representando tal amostra por n variáveis aleatórias independentes X1 X2 X3 Xn e denotando sua média por ത𝑋 temos que TEOREMA CENTRAL DO LIMITE PARA A MÉDIA AMOSTRAL Garante que para n grande a distribuição da média amostral devidamente padronizada segue uma distribuição Normal Padrão Esse teorema permite que utilizemos a distribuição Normal para estudar ഥ𝑿 probabilisticamente Estudos envolvendo simulações mostram que em muitos casos valores de n ao redor de 30 fornecem aproximações bastante boas para aplicações práticas TEOREMA CENTRAL DO LIMITE PARA A PROPORÇÃO Suponha que p represente a proporção de indivíduos com determinada característica em uma população valor desconhecido e que 𝒑 represente o estimador dessa proporção considerando uma amostra da tamanho n dado por Temse que Considerando o Teorema Central do Limite temse que para n suficientemente grande EXERCÍCIOS Uma variável assume os valores 3 6 e 8 com probabilidades 04 03 e 03 respectivamente Uma amostra com 40 observações é sorteada Qual a probabilidade da média amostral superar o valor 5 Suponha que a proporção de peças fora de especificação em um lote é de 40 Tomada uma amostra de tamanho 30 qual a probabilidade dessa amostra fornecer uma proporção de peças defeituosas menor que 050 Suponha que uma recente pesquisa indique que o brasileiro tenha estatura média de 170 m com desvio padrão de 05 Selecionando uma amostra de 40 pessoas qual a probabilidade da média amostral ser superior a 172 m A DISTRIBUIÇÃO NORMAL DE PROBABILIDADES Professor Alan Corrêa Diniz A DISTRIBUIÇÃO NORMAL Para início de conversa o que é uma distribuição Uma distribuição em estatística é uma função que define uma curva e a área sob essa curva determina a probabilidade de ocorrer o evento por ela correlacionado Uma das distribuições contínuas mais utilizadas é a distribuição Normal ou Gaussiana Ela explica o comportamento de uma variável que se distribui simetricamente em relação a sua média É uma das distribuições mais utilizadas na vida acadêmica A DISTRIBUIÇÃO NORMAL A figura abaixo representa a distribuição de notas de uma turma em um determinado teste A curva em azul representa um ajuste por uma distribuição normal enquanto que as barras verticais vermelhas representam a frequência das notas em cada faixa de acertos A DISTRIBUIÇÃO NORMAL Um outro exemplo interessante é a curva de distribuição normal para a pressão arterial Abaixo a curva de distribuição normal de resultados de pressão arterial diastólica para um adulto A DISTRIBUIÇÃO NORMAL Uma variável aleatória X tem distribuição normal com parâmetros μ e σ² X Nμ σ² se sua função de densidade de probabilidade é dada por Em que 𝑥 𝜇 𝑒 𝜎2 0 Observações A DISTRIBUIÇÃO NORMAL Variável estudada PROPRIEDADES DA DISTRIBUIÇÃO NORMAL A distribuição normal é unimodal e simétrica em torno da média μ O desvio padrão σ é uma medida de dispersão dos dados ao redor da média μ Para todas as distribuições normais Propriedades da distribuição normal EXEMPLO 1 Suponha que o comprimento de recémnascidos do sexo feminino não portadores de anomalias congênitas seja uma variável aleatória com distribuição aproximadamente normal de média 4854 cm e desviopadrão 25 cm 5104 CÁLCULO DA PROBABILIDADE DE X PERTENCER A UM DETERMINADO INTERVALO Basta calcular a área sob a curva normal relativa a fdp da variável aleatória X Para calcular a área sob um gráfico é necessário resolver uma integral nem sempre trivial Como fugir do cálculo de uma integral cada vez que quiser calcular uma probabilidade Como a construção de tabelas para todas as possíveis variáveis aleatórias pertencentes a uma distribuição normal é impossível existem infinitas combinações de médias e desvios padrão utilizase a tabela da distribuição normal padrão DISTRIBUIÇÃO NORMAL PADRÃO Dizse que uma variável aleatória Z segue uma distribuição normal padrão se ela segue uma distribuição normal com média 0 e desvio padrão 1 𝑍𝑁01 Na prática você irá calcular probabilidades em X utilizando a seguinte expressão 𝑍 𝑋𝜇 𝜎 Basicamente calculandose o valor de Z e utilizando uma tabela de probabilidades de Z encontrase X A TABELA DA DISTRIBUIÇÃO NORMAL PADRÃO a inteiro primeiro decimal primeiro número depois da vírgula de Z b segundo decimal segundo número depois da vírgula de Z Z𝜶 a b Probabilidades 𝜶 de cauda direita associadas a Z CALCULANDO PZ PELA TABELA DA NORMAL PADRÃO Efetue os cálculos listados abaixo consultando a Tabela de Probabilidades Associadas à Cauda Direita da Distribuição Normal Padronizada a PZ 06 b PZ 078 c PZ 153 d PZ 123 e PZ 15 f P1 Z 2 CALCULANDO Z PELA CALCULADORA DO PROFESSOR BERTOLO Podemos também utilizar uma calculadora específica para probabilidades da distribuição normal httpwwwbertoloprobrFinEstEstatisticaDistribuicaoProbabilidades2normalindex html Pergunta devo utilizar a tabela ou a calculadora do Prof Bertolo para fazer os exercícios Resposta tanto faz EXEMPLO 2 Suponha que o comprimento de recémnascidos do sexo feminino não portadores de anomalias congênitas seja uma variável aleatória com distribuição aproximadamente normal de média 4854 cm e desviopadrão 25 cm Calcule PX 4854 PX 4479 P4604 X 5104 EXEMPLO 3 Doentes sofrendo de certa moléstia são submetidos a um tratamento intensivo cujo tempo de cura foi modelado por uma distribuição normal de média 15 e desvio padrão 2 em dias Seja X o tempo de cura calcule EXEMPLO 4 As medidas de altura dos estudantes de uma universidade são normalmente distribuídas com média de 170 cm e desvio padrão σ Um estudante desta universidade com 165 cm corresponde ao segundo decil que equivale ao vigésimo percentil Com isso o valor da variância σ² em cm² será igual a LISTA Questão 1 Considere a seguinte afirmação Na maior parte das aplicações as variáveis aleatórias contínuas representam dados de contagem enquanto as discretas representam dados de medida Tal afirmação é verdadeira ou falsa Se falsa reescrevaa de maneira que fique verdadeira Resp só reescrever ao contrário Questão 2 Os prazos de duração de gravidez têm distribuição Gaussiana com média de 268 dias e desviopadrão de 15 dias Definindo como prematura uma criança que nascer com menos de 247 dias de gestação responda a Qual é a porcentagem de crianças nascidas prematuramente Resp 00808 b Se desejássemos mudar a definição de uma criança prematura como sendo aquela cujo o período de gestação está entre os 4 menores qual seria o tempo mínimo de gestação para que uma criança não fosse considerada prematura Resp 004 Questão 3 Suponhase que antes do início do ensino remoto em decorrência da pandemia o restaurante universitário da UFJF fosse frequentado em média por 315 pessoas por dia que consomem em média 600 gramas de alimentos cada Sabendo que o desvio padrão do consumo diário deste restaurante seja de 50 gramas e que a massa diária de alimentos consumida seja normalmente distribuída determine a probabilidade de que o consumo diário por aluno esteja entre 500 g e 650 g Resp 08185 Tabela de Probabilidades Associadas à Cauda Direita da Distribuição Normal Padronizada A DISTRIBUIÇÃO BINOMIAL DE PROBABILIDADES Professor Alan Corrêa Diniz A DISTRIBUIÇÃO DE BERNOULLI Dizemos que uma variável X segue uma distribuição de Bernoulli se atribui 0 ou 1 à ocorrência de fracasso ou sucesso respectivamente Com p representando a probabilidade de sucesso consequentemente 0 p 1 e sua distribuição de probabilidade é dada por Matematicamente falando Obs em que x 0 teremos a probabilidade 1 𝑝1𝑥 x 1 teremos a probabilidade 𝑝𝑥 A DISTRIBUIÇÃO BINOMIAL Considere a repetição de n ensaios de Bernoulli independentes e com a mesma probabilidade de sucesso p A variável aleatória X que conta o número total de sucessos é denominada Binomial com parâmetros n e p A probabilidade de X é dada por Onde A DISTRIBUIÇÃO BINOMIAL Usaremos a notação 𝑋𝐵𝑖𝑛 𝑛 𝑝 para indicar que a variável aleatória X segue uma distribuição binomial com parâmetros n e p Consequência para uma variável aleatória X com distribuição Binomial 𝑋𝐵𝑖𝑛 𝑛 𝑝 então o valor esperadomédiavalor médio EX e a variância 𝝈𝟐 são dadas por Em resumo a distribuição binomial identifica a probabilidade de ocorrência de determinado evento dentro de um sistema fechado e utilizando de uma sequência limitada de tentativas 𝐸 𝑋 𝑛𝑝 𝜎2 𝑛𝑝 1 𝑝 𝐷𝑒𝑠𝑣𝑖𝑜 𝑝𝑎𝑑𝑟ã𝑜 𝜎 𝜎2 EXEMPLO 1 Uma certa doença pode ser curada através de procedimento cirúrgico em 80 dos casos Dentre os que têm essa doença sorteamos 15 pacientes que serão submetidos à cirurgia Fazendo alguma suposição que julgar necessária responda a Qual a probabilidade de todos serem curados b Em média quantos pacientes serão curados c Qual a probabilidade de pelo menos dois não serem curados d Qual a probabilidade de ao menos 10 ficarem livres da doença EXEMPLO 2 Em um determinado bairro de Juiz de ForaMG 10 das pessoas não estão vacinadas não tomaram nenhuma dose de vacina contra o vírus corona Então a Secretaria Municipal de saúde almeja selecionar aleatoriamente neste bairro um grupo de 10 pessoas para avaliar a efetividade da produção de anticorpos em decorrência da vacina Desta forma qual é a probabilidade de que nesta amostra pelo menos duas pessoas não tomaram nenhuma dose de vacina E qual é o número esperado de pessoas vacinadas neste grupo EXEMPLO 3 Em uma determinada amostra de 4 pessoas a probabilidade de um indivíduo ter sangue Rh negativo é de 010 Qual é a probabilidade de todos os indivíduos dessa amostra apresentarem Rh negativo EXEMPLO 4 Em uma certa população a probabilidade de um menino ser daltônico é 008 Num grupo de 4 meninos vindos dessa população qual é a probabilidade de 3 não serem daltônicos Qual é o valor esperado do número de daltônicos E o valor esperado daqueles que não são daltônicos RECAPITULAÇÃO VALOR ESPERADO DE UMA VARIÁVEL ALEATÓRIA CONTÍNUA OPCIONAL A média de uma variável aleatória ou esperançavalor médio pode ser interpretada como a média dos valores assumidos pela variável aleatória e é também chamado de valor esperado Para VAs contínuas considere uma variável aleatória contínua com fdp f O valor esperado de X é definido como 𝐸𝑋 න 𝑎 𝑏 𝑥𝑓 𝑥 𝑑𝑥 com condição de que o resultado da integral abaixo seja finito ou seja irá convergir න 𝑥 𝑓 𝑥 𝑑𝑥 VALOR ESPERADO DE UMA VARIÁVEL ALEATÓRIA DISCRETA Seja uma variável aleatória discreta com valores possíveis x1 xn seja pxi PX xi com i 1 2 3 n então o valor esperado ou esperançavalor médio de X é definido como 𝐸𝑋 𝑖1 𝑥𝑖𝑝𝑥𝑖 A VARIÂNCIA DE UMA VARIÁVEL ALEATÓRIA Seja X uma variável aleatória Definimos a variância de X denotado por 𝝈² da seguinte maneira 𝜎² 𝐸 𝑋2 𝐸𝑋² A raiz quadrada positiva de 𝝈² é o desviopadrão da variável X designado por 𝝈 isto é 𝜎 𝜎² EXEMPLO 5 Uma variável X assume os seguintes valores 3 6 e 8 com as seguintes probabilidades respectivamente 04 03 e 03 Calcule a variância o valor esperado e o desviopadrão dessa amostra INTRODUÇÃO À PROBABILIDADE PARTE II Professor Alan Corrêa Diniz PARTIÇÃO DO ESPAÇO AMOSTRAL Uma partição do espaço amostral é dada por um conjunto de eventos mutuamente exclusivos que quando unidos formam o espaço amostral Ou S REGRA MULTIPLICATIVA Considere dois eventos A e B Diretamente da probabilidade condicional Essa regra é de grande utilidade na verificação de dependência entre os eventos envolvidos Falando em dependência caso os eventos A e B forem independentes Exemplo 1 Se denotarmos por A o evento o leite está adulterado temos EXEMPLO 1 TEOREMA DA PROBABILIDADE TOTAL Dado um evento A e uma partição do espaço amostral B1 B2 Bk temse Temos as seguintes informações do enunciado PF1 020 e PAF1 020 PF2 030 e PAF2 005 PF3 050 e PAF3 002 Queremos saber a probabilidade do evento A o leite está adulterado ocorrer PA PA F1 PA F2 PA F3 PA PAF1PF1 PAF2PF2 PAF3PF3 PA 020 020 005 030 002 050 PA 004 0015 001 PA 0065 Podemos ainda estar interessados em saber qual a probabilidade de que a amostra adulterada ter sido obtida do leite fornecido pela fazenda F1 ou seja PF1A PF1A PA F1 PA PF1A PAF1PF1 PAF1PF1 PAF2PF2 PAF3PF3 PF1A 020020 020020 005030 002050 PF1A 004 0065 TEOREMA DE BAYES Dado um evento A e uma partição do espaço amostral B1 B2 Bk temse PF1A 0615 VOLTANDO AO EXEMPLO 1 EXEMPLO 2 EXEMPLO 3 TABELA DE DUPLA ENTRADA Você entrega a seu amigo uma carta destinada à sua namorada para ser colocada no correio Entretanto ele pode se esquecer com probabilidade 01 Se ele não se esquecer a probabilidade de que o correio extravie a carta é de 01 Finalmente se foi enviada pelo correio a probabilidade de que a namorada não receba é de 01 Sua namorada não recebeu a carta qual a probabilidade de seu amigo ter esquecido de colocála no correio Avalie as possibilidades desse namoro continuar se a comunicação depender das cartas enviadas A tabela a seguir apresenta informações de alunos de uma universidade quanto às variáveis Período Sexo e Opinião sobre a Reforma Agrária Determine a probabilidade de escolhermos Uma pessoa do sexo masculino e sem opinião sobre a reforma agrária Uma mulher contrária a reforma agrária Dentre os estudantes do noturno um que seja a favor da reforma agrária Uma pessoa sem opinião sabendose que ela é do sexo feminino INTRODUÇÃO À PROBABILIDADE PARTE I Professor Alan Corrêa Diniz INTRODUÇÃO Onde usar a teoria das probabilidades Qual a chance de um paciente desenvolver câncer de pulmão dado que seus pais foram acometidos dessa terrível doença Uma farmacêutica informa que seu medicamento possui 85 de efetividade em cada paciente Qual a probabilidade de 7 em 10 pacientes serem curados devido a eficácia desse remédio Como verificar a efetividade do medicamento acima Qual a chance de uma criança nascer com olhos azuis dado que seus pais possuem olhos verdes pai e olhos azuis pai INTRODUÇÃO A probabilidade tem origem no século XVII motivada inicialmente pelos jogos de azar De maneira bastante informal referese à probabilidade como uma medida de chance de algum evento ocorrer Inicialmente vamos discutir sobre a importância de usar aleatorização na seleção de amostras ou execução de experimentos Dispondo de amostras ou experimentos aleatórios usaremos probabilidade para quantificar a chance de ocorrência dos possíveis resultados Com base no cálculo de probabilidades para diferentes resultados amostrais ou experimentais estaremos aptos a produzir inferências ELEMENTOS BÁSICOS DE PROBABILIDADE O espaço amostral é o conjunto de todos os possíveis resultados de um experimento Denotamos o espaço amostral pela letra S Um evento é qualquer subconjunto do espaço amostral Eventos são representados por letras maiúsculas usualmente as primeiras do alfabeto A B C Um evento simples é qualquer evento constituído por um único elemento do espaço amostral Exemplo lançamento de um dado Espaço amostral S 1 2 3 4 5 6 Evento A Somente resultados pares A 2 4 6 EXEMPLO 1 Um dado comum com seis faces numeradas de um a seis é lançado uma única vez Registrase o valor da face voltada para cima Represente o espaço amostral e os seguintes eventos a A sai o número 3 b B sai um número par c C sai um valor maior que 4 d Algum dos eventos solicitados configura um evento simples Justifique EXEMPLO 2 Um grupo é composto por cinco crianças Pedro João Maria Ana e Beatriz Duas dessas crianças serão sorteadas aleatoriamente para uma apresentação musical Considerando como resultado do sorteio o par crianças selecionadas a Represente o espaço amostral b Represente o evento A Pedro é um dos selecionados c Represente o evento B A dupla selecionada é composta por um menino e uma menina EXEMPLO 3 O tempo de vida em anos para um paciente com diagnóstico de câncer no pâncreas é observado Represente o espaço amostral e os seguintes eventos a A O paciente sobrevive por menos de três anos b B O paciente sobrevive por mais de dois mas por menos de cinco anos c C O paciente sobrevive por um ano ou mais RELAÇÕES E OPERAÇÕES ENTRE EVENTOS O DIAGRAMA DE VENN Diferentes eventos podem ser definidos com base num único espaço amostral Como dito anteriormente eventos são subconjuntos de resultados do espaço amostral correspondendo usando analogia com a teoria dos conjuntos ao conjunto universo O estudo da relação entre dois ou mais eventos fica facilitado utilizandose os chamados Diagramas de Venn RELAÇÕES E OPERAÇÕES ENTRE EVENTOS O DIAGRAMA DE VENN A união de dois eventos A e B representada por AUB é definida como o evento ocorre A ocorre B ou ocorrem ambos A e B RELAÇÕES E OPERAÇÕES ENTRE EVENTOS O DIAGRAMA DE VENN A intersecção de dois eventos A e B representada por AꓵB é definida como o evento ocorrem A e B RELAÇÕES E OPERAÇÕES ENTRE EVENTOS O DIAGRAMA DE VENN Dois eventos A e B são denominados disjuntos ou mutuamente exclusivos se eles não têm qualquer resultado em comum o que pode ser denotado por AꓵB RELAÇÕES E OPERAÇÕES ENTRE EVENTOS O DIAGRAMA DE VENN O complemento de um evento A denotado por 𝑨𝑪 ou ഥ𝑨 corresponde ao evento não ocorre A RELAÇÕES E OPERAÇÕES ENTRE EVENTOS O DIAGRAMA DE VENN Dizemos que um evento A está contido num evento B se todos os eventos simples pertencentes a A também pertencem a B Denotamos essa relação por A B NÚMERO DE ELEMENTOS DA UNIÃO Para conjuntos mutuamente exclusivos A e B acontece quando ocorre A ocorre B ou ambos 𝑛 𝐴𝑈𝐵 𝑛 𝐴 𝑛𝐵 NÚMERO DE ELEMENTOS DA UNIÃO Para conjuntos onde há intersecção A e B é necessário descontar os elementos de A e B 𝑛 𝐴𝑈𝐵 𝑛 𝐴 𝑛 𝐵 𝑛𝐴 𝐵 Obs Embora tenham sido apresentadas apenas ilustrações de operações envolvendo dois eventos todas elas se estendem para um número maior possivelmente até infinito de eventos ABORDAGEM CLÁSSICA DA PROBABILIDADE Suponha que o espaço amostral seja composto por um conjunto finito de n resultados eventos simples Considere adicionalmente que todos os resultados sejam equiprováveis Neste caso considerando A um evento qualquer do espaço amostral a probabilidade do evento A pode ser calculada por EXEMPLO 5 Em uma urna existem bolas enumeradas de 1 a 15 Qualquer uma delas possui a mesma chance de ser retirada Determine a probabilidade de se retirar uma bola com número nas seguintes condições a par b primo c par ou primo d par e primo AXIOMAS DA PROBABILIDADE Um axioma nada mais é que conceito matemático que não precisa de demonstração para ser verdadeiro isto é uma ideia óbvia por consenso Considere um experimento cujo espaço amostral é S Para cada evento E do espaço amostral S assumimos que um número PE seja definido e satisfaça os três axiomas a seguir Axioma 1 A probabilidade de um evento E ocorrer é quantificada por um número situado entre 0 e 1 para todo evento E pertencente ao espaço S 0 𝑃𝐸 1 Axioma 2 A probabilidade de ocorrer o evento espaço amostral S é igual a 1 PS 1 Axioma 3 Sejam E e F eventos pertencentes ao espaço amostral S Se EF então a probabilidade de ocorrência do evento E F é igual à probabilidade de ocorrência do evento E somada à probabilidade do evento F 𝑃 𝐸𝑈𝐹 𝑃 𝐸 𝑃𝐹 PROBABILIDADE CONDICIONAL Dado um espaço amostral S e os eventos E e F pertencentes a S Denominase probabilidade condicionada a probabilidade de E dado a ocorrência de F Basicamente isso significa que houve uma redução do espaço amostral de S para F Deste modo supondose a ocorrência de F calculase a probabilidade de E Essa situação pode ser representada pela expressão 𝑃 𝐸 𝐹 representada graficamente como E F 𝑃 𝐸 𝐹 𝑃𝐸 𝐹 𝑃𝐹 EVENTOS INDEPENDENTES Eventos independentes são definidos como aqueles em que a probabilidade de ocorrência de um evento não interfere na probabilidade de ocorrência de outro Dado um espaço amostral S e os eventos E e F tal que ambos pertencem a S podemos representar os eventos independentes como 𝑃 𝐸 𝑃 𝐸 𝐹 𝑒 𝑃 𝐹 𝑃 𝐹 𝐸 Temos então que 𝑃 𝐸 𝐹 𝑃𝐸 𝐹 𝑃𝐹 𝑃𝐸 A probabilidade condicional nos permite afirmar que 𝑃 𝐸 𝐹 𝑃 𝐸 𝑃𝐹 EXEMPLO 6 Antônio Bruno e Celso disputaram uma corrida Dadas as condições físicas e de preparo Bruno tem o triplo de chances de vencer Antônio e Celso tem o quádruplo de chances de vencer Bruno Dessa forma qual a probabilidade de Bruno vencer a corrida EXEMPLO 7 Suponhase que PA 14 e PB 18 Quanto é PAB se respectivamente a A e B são mutuamente exclusivos b A e B são independentes PARA CASA 1 Um dado comum justo todas as faces equiprováveis é lançado duas vezes A é o evento soma das jogadas é igual a 4 B é pelo menos uma das jogadas é 3 Quanto é PAB Resp 211 PARA CASA 2 Jorge leva dois livros para ler durante as férias A probabilidade de ele gostar do primeiro livro é de 05 de gostar do segundo livro é de 04 e de gostar de ambos os livros é de 03 Qual é a probabilidade de que ele não goste de nenhum dos livros Resp 04 OPCIONAL As probabilidades de um contador A demorar uma duas ou três horas para preencher uma declaração de imposto de renda são dadas respectivamente por 14 12 e 14 Dentre 5 declarações escolhidas aleatoriamente e com reposição das declarações que A deverá elaborar a probabilidade dele demorar para o preenchimento em três delas 1 hora em uma 2 horas e na restante 3 horas é igual a qual valor Dica revise arranjos e combinações Resp 5128