• Home
  • Chat IA
  • Recursos
  • Guru IA
  • Professores
Home
Recursos
Chat IA
Professores

·

Matemática Industrial ·

Introdução à Estatística

· 2021/2

Envie sua pergunta para a IA e receba a resposta na hora

Texto de pré-visualização

Exercícios da Unidade 1 Estatística Descritiva Os exercícios foram extraídos de seções do livro: Magalhães, MN; Lima, ACP. Noções de Probabilidade e Estatística. São Paulo: EDUSP, 2008. 1. Classifique cada uma das variáveis abaixo em qualitiva (nominal / ordinal) ou quantitativa (discreta / contínua). a) Ocorrência de hipertensão pré-natal em grávidas com mais de 35 anos (sim ou não são possíveis respostas para esta variável). b) Intenção de voto para presidente (possíveis respostas são os nomes dos candidatos ou não sei). c) Perda de peso de maratonistas na Corrida de São Silvestre, em gramas. d) Intensidade da perda de peso de maratonistas na Corrida de São Silvestre (leve, moderada, forte). e) Grau de satisfação da população brasileira com relação ao trabalho de seu presidente (valores de 0 a 5, com 0 indicando totalmente insatisfeito e 5 totalmente satisfeito). 2. Um grupo de 84 estudantes do ensino médio foi submetido a um teste de matemática resultando em: Nota Frequência [0; 2) 14 [2; 4) 28 [4; 6) 27 [6; 8) 11 [8; 10) 4 a) Construa o histograma. b) Se a nota mínima para aprovação é 5, qual será a porcentagem de aprovação? c) Obtenha o gráfico de caixa e bigodes (box-plot). 3. Responda certo ou errado, justificando: a) Suponha duas amostras colhidas de uma mesma população, sendo uma delas de tamanho 100 e outra de tamanho 200. Então, a amostra de tamanho maior é mais representativa da população. b) Duas variáveis diferentes podem apresentar histogramas idênticos. c) Duas variáveis com gráficos de caixas e bigodes (box-plot) iguais não podem ter valores diferentes. 4. Uma pesquisa com usuários de transporte coletivo na cidade de São Paulo indagou sobre os diferentes tipos nas suas locomoções diárias. Dentre ônibus, metrô e trem o número de diferentes meios de transporte foi o seguinte: 2, 3, 2, 1, 2, 1, 2, 1, 2, 3, 1, 1, 1, 2, 2, 3, 1, 1, 1, 1, 2, 1, 1, 2, 2, 1, 2, 1, 2 e 3. a) Organize uma tabela de frequência. b) Faça uma representação gráfica. c) Admitindo que essa amostra represente bem o comportamento do usuário paulistano, você acha que a porcentagem dos usuários que utilizam mais de um tipo de transporte é grande? 5. Um novo medicamento para cicatrização está sendo testado e um experimento é feito para estudar o tempo (em dias) de completo fechamento em cortes provenientes de cirurgia. Uma amostra em trinta cobaias forneceu os valores: 15, 17, 16, 15, 17, 14, 17, 16, 16, 17, 15, 18, 14, 17, 15, 14, 15, 16, 17, 18, 18, 17, 15, 16, 14, 18, 18, 16, 15 e 14. a) Organize uma tabela de frequência. b) Que porcentagem das observações estão abaixo de 16 dias? c) Classifique como rápida as cicatrizações iguais ou inferiores a 15 dias e como lenta as demais. Faça um gráfico de setores indicando as porcentagens para cada classificação. 6. Um grupo de pedagogos estuda a influência da troca de escolas no desempenho de alunos do ensino fundamental. Como parte do levantamento realizado, foi anotado o número de escolas cursadas pelos alunos participantes do estudo. Escolas Cursadas Frequência 1 46 2 57 3 21 4 15 5 4 a) Qual é a porcentagem dos alunos que cursaram mais de uma escola? b) Construa o gráfico de barras. c) Classifique os alunos em dois grupos segundo a rotatividade: alta para alunos com mais de 2 escolas e baixa para os demais. Obtenha a tabela de frequência dessa variável. 7. Alunos da Escola de Educação Física foram submetidos a um teste de resistência quanto ao número de quilômetros que conseguiram correr sem parar. Os dados estão apresentados a seguir. Classes Frequência [0; 4) 438 [4; 8) 205 [8; 12) 125 [12; 16) 22 [16; 20) 9 a) Qual é a variável em estudo? b) Construa o histograma. c) Obtenha o gráfico de caixa e bigodes (box-plot). 8. Foram feitas medidas em operários da construção civil a respeito da taxa de hemoglobina no sangue em gramas por centímetros cúbicos, apresentando os seguintes resultados: 11.1, 12.2, 11.7, 12.5, 13.9, 12.3, 14.4, 13.6, 12.7, 12.6, 11.3, 11.7, 12.6, 13.4, 15.2, 13.2, 13.0, 16.9, 15.8, 14.7, 13.5, 12.7, 12.3, 13.5, 15.4, 16.3, 15.2, 12.3, 13.7 e 14.1. a) Organize os dados em classes de tamanho 1 a partir do 11. b) Construa o histograma. c) Determine o terceiro quartil e a mediana. d) Taxas abaixo de 12 ou acima de 16 são consideradas alteradas e requerem acompanhamento médico. Obtenha a tabela de frequência da variável Acompanhamento Médico com duas opções: sim ou não. 9. Num estudo sobre rotatividade da mão-de-obra na indústria, anotou-se o número de empregos nos últimos 3 meses para operários especializados e não especializados. Os dados estão apresentados abaixo. a) Construa o gráfico de barras correspondente a cada tabela usando a porcentagem no eixo das ordenadas. b) Junte as informações das duas tabelas em uma só e obtenha um gráfico de barras da rotatividade de mão-de-obra na indústria (sem diferenciar a especialização). c) Você acha que os trabalhadores especializados trocam menos de emprego? Justifique. 2 Não Especializados Empregos freq. 1 106 2 222 3 338 4 292 5 164 total 1122 Especializados Empregos freq. 1 210 2 342 3 109 4 91 5 35 total 787 10. Um exame vestibular para uma faculdade tem 80 questões, sendo 40 de português e 40 de matemática. Para os 20 melhores classificados, apresentamos o número de acertos em cada disciplina, em ordem decrescente do total de pontos. aluno 1 2 3 4 5 6 7 8 9 10 Português 35 35 34 32 31 30 26 26 24 23 Matemática 31 29 27 28 28 26 30 28 25 23 aluno 11 12 13 14 15 16 17 18 19 20 Português 23 12 11 20 17 12 14 20 8 10 Matemática 21 32 31 20 21 25 20 13 23 20 a) Calcule as medidas de centro: média, mediana e moda para cada grupo. b) Calcule as medidas de variabilidade: variância, desvio-padrão, e coeficiente de variação para cada grupo. c) Calcule o resumo dos cinco números (mínimo, Q1, Q2, Q3 e máximo) para cada grupo. d) Construa um gráfico de caixa e bigodes (box-plot) para cada grupo (em um mesmo gráfico para comparação). e) Com todos os resultados obtidos, descreva comparativamente estes dois grupos em termos de medidas de tendência central, variabilidade, amplitude e distribuição (simetria) dos dados. f) Você acha que os aprovados são melhores em português ou matemática? 11. Discuta quais medidas de posição seriam mais adequadas para os conjuntos de dados abaixo. Comente suas escolhas. a) Estão disponíveis dados mensais sobre a incidência de envenenamento por picada de cobra. Deseja- se planejar a compra mensal de antídoto. b) O número diário de usuários, entre 17 e 19 horas, de determinada linha de ônibus foi anotado. Pretende-se utilizar essa informação para dimensionar a frota em circulação. c) Um fabricante de baterias deseja divulgar a durabilidade do seu produto e coleta informação sobre a duração de 100 de suas baterias. d) Num voo internacional uma companhia serve dois tipos de pratos de jantar: peixe ou frango. Um banco de dados contém os pedidos feitos nos últimos 200 voos. Pretende-se planejar o número de cada tipo a ser colocado à disposição dos passageiros. 12. Vinte e cinco residências de um certo bairro foram sorteadas e visitadas por um entrevistador que, entre outras questões, perguntou sobre o número de televisores. Os dados foram os seguintes: 2, 2, 2, 3, 1, 2, 1, 1, 1, 1, 0, 1, 2, 2, 2, 2, 3, 1, 1, 3, 1, 2, 1, 0 e 2. Organize os dados numa tabela de frequências e determine as diversas medidas de posição. 13. Num experimento, 15 coelhos foram alimentados com uma nova ração e seu peso avaliado ao fim de um mês. Os dados referentes ao ganho de peso (em quilogramas) foram os seguintes: 1.5; 1.6; 2.3; 1.7; 1.5; 2.0; 1.5; 1.8; 2.1; 2.1; 1.9; 1.8; 1.7; 2.5 e 2.2. a) Utilizando os dados brutos, determine média, moda e mediana desse conjunto. 3 b) Organize uma tabela de frequência com classes de amplitude 0.2 a partir de 1.5. c) Calcule, a partir da tabela de frequências e com o ponto médio como representante de cada classe, a média, a moda e a mediana. Comente as diferenças encontradas com o item (a). d) Se ao invés de 15, fossem 500 coelhos, qual seria o procedimento mais conveniente: o do item (a) ou o de (c)? Ter acesso a computador faz diferença? 14. Você está indeciso em comprar uma televisão e decide avaliar algumas informações estatísticas fornecidas pelo fabricante, sobre a duração (em horas) do tubo de imagem. Marca da TV GA FB HW Média 8000 8200 8000 Mediana 8000 9000 7000 Desvio Padrão 600 1500 2500 Com que marca você ficaria? Justifique. 15. A pulsação de 10 estudantes no início de uma prova de estatística foram as seguintes (em batimentos por minuto): 80, 91, 84, 86, 93, 88, 80, 89, 85 e 86. Calcule a média e a variância desse conjunto de dados. 16. Estudando uma nova técnica de sutura, foram contados os dias necessários para a completa cicatrização de determinada cirurgia. Os resultados de 25 pacientes foram os seguintes: 6, 8, 9, 7, 8, 6, 6, 7, 8, 9, 10, 7, 8, 10, 9, 9, 9, 7, 6, 5, 7, 7, 8, 10 e 11. Organize os dados numa tabela de frequência e calcule a média e a variância. 17. As notas finais de estística para alunos de um curso de Administração foram as seguintes: 7, 5, 4, 5, 6, 3, 8, 4, 5, 4, 6, 4, 5, 6, 4, 6, 6, 3, 8, 4, 5, 4, 5, 5 e 6. a) Determine a mediana e a média. b) Separe o conjunto de dados em dois grupos denominados aprovados, com nota maior ou igual a 5, e reprovados para os demais. Compare a variância desses dois grupos. 18. Foram anotados os níveis de colesterol (em mg/100ml) par trinta pacientes de uma clínica cardíaca. As medidas se referem a homens entre 40 e 60 anos de idade que foram à clínica fazer um check-up. Paciente 1 2 3 4 5 6 7 8 9 10 Colesterol 160 160 161 163 167 170 172 172 173 177 Paciente 11 12 13 14 15 16 17 18 19 20 Colesterol 178 181 181 182 185 186 194 197 199 203 Paciente 21 22 23 24 25 26 27 28 29 30 Colesterol 203 205 206 206 208 209 211 214 218 225 a) Calcule a média, a moda e a variância a partir dos dados. b) Organize os dados em uma tabela de frequência com classes de tamanho de 10 a partir de 160. c) Refaça o item (a) usando a tabela de frequência obtida em (b). d) Comente as diferenças encontradas entre os valores das medidas calculadas em (a) e (c). 19. Seja o seguinte quadro da concentração de albumina (g%) e do hormônio do crescimento (mm/ml) no plasma de carneiros. Albumina 1.0 2.0 3.0 4.0 5.0 6.0 7.0 Hormônio 35.0 41.4 46.7 52.8 60.3 65.9 70.3 a) Faça um gráfico adequado para verificar se há uma relação linear entre a concentração de albumina e hormônio do crescimento. b) Quantifique o grau de associação linear entre essas duas variáveis? 4 Respostas 1. a) Qualitativa nominal. b) Qualitativa nominal. c) Quantitativa contínua. d) Qualitativa ordinal. e) Qualitativa ordinal. 2. a) Notas Frequência Absoluta 0 2 4 6 8 10 0 5 10 15 20 25 30 Q1 Q3 17% 33% 32% 13% 5% b) A nota mínima para aprovação é 5 e observando a tabela de frequências notamos que 5 está exatamente no centro do intervalo [4; 6) cuja frequência é 27. Para encontrar o percentual de estudantes aprovados vamos supor que as notas se distribuem de maneira uniforme dentro de cada intervalo e portanto esperamos que 50% das 27 notas do intervalo [4; 6) esteja no intervalo [5; 6), ou seja uma frequência de 27/2 = 13.5 no intervalo [5; 6). Assim, o percentual de aprovados será: (50% da frequência no intervalo [4; 6)+frequência no intervalo [6; 8)+frequência no intervalo [8; 10))/número total de estudantes ×100 = ((27×0.5)+11+4) 14+28+27+11+4 × 100 = 34%. c) Para obter box-plot precisamos de várias quantidades: mínimo = 0, máximo =10, Q1 = 2.50, Q2 = 4, Q3 = 5.56. 0 2 4 6 8 5 Como encontrar os valores de Q1, Q2 e Q3 a partir da tabela de frequências para dados agrupados em classes? i. Calcular as frequências relativas, as acumuladas e as relativas acumuladas; Nota Frequência Frequência Relativa Frequência Acumulada Frequência Relativa Acumulada [0; 2) 14 0.17 14 0.17 [2; 4) 28 0.33 42 0.5 [4; 6) 27 0.32 69 0.82 [6; 8) 11 0.13 80 0.95 [8; 10) 4 0.05 84 1 ii. Para calcular o quartil de interesse vamos usar a seguinte notação: • n é o número total de observações; • Qi(i = 1, 2, 3) é o quartil que desejamos obter; • (i · n/4) é a posição na qual se encontra o quartil Qi; • l é o limite inferior da classe que contem Qi; • f é a frequência na classe que contem Qi; • h é a amplitude na classe que contem Qi; • Fant é a frequência acumulada até a classe anterior à que contem Qi. O quartil Qi é obtido aplicando-se a seguinte foŕmula: Qi = l + (i · n/4 − Fant) f · h Por exemplo, o quartil Q1 é o valor que deixa 25% das observações abaixo dele. Para os dados deste exercício, observando a coluna de frequências relativas acumuladas, notamos que 17% das observações estão abaixo de 2 e 50% das observações estão abaixo de 4, então Q1 é algum valor no intervalo [2; 4): Q1 = 2 + (1 · 84/4 − 14) 28 · (4 − 2) = 2.5 De modo similar para Q3 temos: Q3 = 4 + (3 · 84/4 − 42) 27 · (6 − 4) = 5.56 Derivando a fórmula acima: A equação genérica acima é obtida por meio de interpolação linear de Qi entre os limites inferior e superior da classe que contem Qi. Esta interpolação na prática implica na seguinte regra de três: (Qi − l) está para i/4 − (Fant/n) assim como h está para (F/n) − (Fant/n), em que F é a frequência acumulada até a classe que contem Qi. Fazendo algumas manipulações matemáticas obtemos a fórmula apresentada acima. (Qi − l) i/4 − (Fant/n) = h (F/n) − (Fant/n) = h (F − Fant)/n = h f/n = n · h f (Qi − l) = (i/4 − (Fant/n)) · n · h f = (i · n/4 − Fant) · h f Qi = l + (i · n/4 − Fant) · h f 3. a) Errado. Nem sempre uma amostra maior irá representar melhor a população. Depende de como essa amostra foi coletada. Se as duas amostras forem coletadas com o mesmo cuidado usando o método de amostragem mais adequado, então a maior representará tão bem ou melhor do que a menor. 6 b) Certo. Se as duas variáveis em questão forem tão correlacionadas que suas frequências sejam as mesmas. c) Errado. Duas variáveis com boxplots iguais podem ter valores diferentes, bastando para isso este valor diferente não influenciar o cálculo dos quartis e nem os valores mínimo e máximo do conjunto de dados. 4. a) Num. Transp. 1 2 3 total frequência 14 12 4 30 freq. relativa 0.47 0.4 0.13 1 b) Esses dados podem ser representados com um gráfico de setores ou um gráfico de barras. c) Sim, é mais de 50%. 5. a) Cicatrização 14 15 16 17 18 total frequência 5 7 6 7 5 30 freq. relativa 0.167 0.233 0.2 0.233 0.167 1 b) 40%. c) Cicatrização rápida: 40% lenta: 60%. 6. a) 68% b) 1 2 3 4 5 Escolas cursadas Frequência 0 10 20 30 40 50 c) Rotatividade alta baixa total frequência 40 103 143 freq. relativa 0.28 0.72 1 7. a) Quilômetros percorridos sem parar. b) Construa o histograma. 7 Distância (km) Frequência Absoluta 0 5 10 15 20 0 100 200 300 400 Q1 Q2 Q3 55% 26% 16% 3% 1% Classes Frequência Frequência Relativa Frequência Acumulada Frequência Relativa Acumulada [0; 4) 438 0.55 438 0.55 [4; 8) 205 0.26 643 0.8 [8; 12) 125 0.16 768 0.96 [12; 16) 22 0.03 790 0.99 [16; 20) 9 0.01 799 1 c) Para o box-plot use mínimo = 0, Q1 = 1.82; Q2 = 3.65; Q3 = 7.15; máximo = 20. Q1 = 0 + (1 · 799/4 − 0) 438 · (4 − 0) = 1.82 Q2 = 0 + (2 · 799/4 − 0) 438 · (4 − 0) = 3.65 Q3 = 4 + (3 · 799/4 − 438) 205 · (8 − 4) = 7.15 8. ## Warning in hist.default(x, breaks = c(11:17), include.lowest = TRUE, plot = ## FALSE, : argument 'col' is not made use of a) Taxa de hemoglobina (g) [11; 12) [12; 13) [13; 14) [14; 15) [15; 16) [16; 17) total frequência 4 9 8 3 4 2 30 freq. relativa 0.13 0.3 0.27 0.1 0.13 0.07 1 b) 8 Taxa de hemoglobina (g) Frequência 11 12 13 14 15 16 17 0 2 4 6 8 10 c) Q2 = 13.3 e Q3 = 14.4. d) Acompanhamento médico Sim Não total frequência 6 24 30 freq. relativa 0.2 0.8 1 9 9. a) Não Especializados 1 2 3 4 5 Rotatividade Frequência (%) 0 5 10 15 20 25 30 Especializados 1 2 3 4 5 Rotatividade Frequência (%) 0 10 20 30 40 b) 1 2 3 4 5 Rotatividade de mão−de−obra Frequência (%) 0 5 10 15 20 25 30 c) Sim, 30% dos trabalhadores especializados tem rotatividade acima de 2 enquanto entre os não especial- izados este percentual é de 71%. 10. a) Medidas de centro Port Mat ¯y 22.15 25.05 md 23 25.5 mo c("12", "20", "23", "26", "35") c("20", "28") b) Medidas de dispersão Port Mat s2 80.13 23.84 s 8.95 4.88 CV 40.4 19.5 c) Medidas resumo Port Mat Min 8 13 Q1 13 21 Q2 23 25.5 Q3 30.5 28.5 Max 35 32 d) 10 mat port 10 15 20 25 30 35 Disciplina Notas e) (Exemplo de resposta) Em média, o número de acertos em matemática (¯ymat = 25.05) foi maior do que o número de acertos em português (¯yport = 22.15). A diferença entre os valores médios e a mediana mostra que existe uma leve assimetria negativa (ou à esquerda) para os dois casos (¯y < md), embora esta diferença seja mais pronuciada nas notas de português. A amplitude dos acertos em português foi de Aport = 35 − 8 = 27, maior do que a amplitude observada para o número de acertos em matemática, que foi de Amat = 32 − 13 = 19. A variabilidade dos acertos em torno da média também foi maior para as notas de português, com variância de s2 port = 80.13 e desvio-padrão de sport = 8.95. Já para a matemática, a variabilidade dos acertos em torno da média também foi menor, com s2 mat = 23.84 e desvio-padrão smat = 4.88. Resumindo estas informações sobre a variabilidade, nota-se que o coeficiente de variação para português foi de 40.4%, enquanto que para a matemática foi menor, com aproximadamente 19.5%. Através do resumo dos cinco múmeros e do gráfico de caixa, percebe-se que 50% dos acertos foram entre 13 e 30.5 em português (diferença entre Q1 e Q3), e entre 21 e 28.5 em matemática, mostrando novamente a menor variabilidade observada para a matemática. f) Use os resultados obtidos nos itens anteriores para formular sua resposta. 11. Este exercício é para possibilitar discussão entre os alunos sobre as várias formas de resumir a informação e portanto não existe uma resposta correta. a) O valor mediano deve ser suficiente em cerca de 50% dos meses. Se há meses com grande número de acidentes por questões sazonais como colheita ou enchentes, a média será afetada. É bom estar atento se a variabilidade dos dados não é grande. b) Para dimensionar a frota de ônibus podemos decidir do ponto de vista do usuário ou da empresa de ônibus. Do ponto de vista do usuário, pretende-se mais espaço sentado e ônibus não muito cheio; a empresa tentaria colocar o maior número de ônibus circulando. O número médio diário de passageiros nesse período pode ser dividido pelo número de assentos ou pela lotação total do ônibus dependendo de qual interesse pretende-se atender. c) A duração média é talvez a melhor medida a observar. Entretanto, se a moda for um valor alto (longa duração) pode ser útil utilizá-la como publicidade. d) Pode-se definir uma variável quantitativa indicando a proporção de quantos pedem frango (ou peixe) em cada voo. A moda dessa variável multiplicada pelo número total de passageiros no voo, poderia ser a quantidade de pratos colocados à disposição para tentar garantir o atendimento de todos os pedidos. 12. Tabela de frequência: TVs 0 1 2 3 total Freq. 2 10 10 3 25 11 ¯y = 1.56; md = 13o. termo em ordem crescente = 2; mo = 1 ou 2. 13. a) Com os dados brutos ¯y = 1.88; md = 1.8 (observação que ocupa a 8a. posição em ordem crescente); mo = 1.5. b) Tabela de frequência Ganho [1.5; 1.7) [1.7; 1.9) [1.9; 2.1) [2.1; 2.3) [2.3; 2.5] total Freq. 4 4 2 3 2 15 c) Com a tabela de frequência no item anterior e usando o ponto médio da faixa obtemos: ¯y = 1.933; md = 1.8 e mo = [1.5, 1.7); [1.7, 1.9). As diferenças entre as soluções de (a) e (c) não foram grandes nesse caso. A solução de (a) é mais exata. d) Os valores obtidos no item (a) possuem maior precisão, contudo, para um volume grande de dados, o cálculo fica muito trabalhoso para ser feito sem a ajuda de um computador. Notamos que a organização em classes é conveniente e os valores encontrados nas duas formas de calcular não diferem muito. 14. As médias são similares. A mediana de FB é mais alta, o que é um fator positivo. Por outro lado, HW tem a menor mediana e, portanto, essa marca deve ser desconsiderada. Notemos que o desvio de FB é duas vezes e meia maior do que o de GA. Como GA tem mediana não muito baixa e pouca variabilidade, parece ser a melhor opção. Portanto, recomendamos comprar a marca GA. 15. Utilizando as expressões para dados não agrupados, temos: ¯y = 86.20; s2 = 18.18. 16. Tabela de frequência: Dias para cicatrização 5 6 7 8 9 10 11 total Freq. 1 4 6 5 5 3 1 25 Utilizando as expressões para dados não agrupados, temos: ¯y = 7.88; s2 = 2.36. 17. a) md = 5 e ¯y = 5.12 b) s2 aprov. = 1.05 > s2 reprov. = 0.19 mas CVaprov. = 17% e CVreprov. = 12% são próximos. 18. a) ¯y = 188.87; md = 185.5; mo = 160, 172, 181, 203 ou 206 e s2 = 369.29. b) Tabela de frequência: Colesterol [160; 170) [170; 180) [180; 190) [190; 200) [200; 210) [210; 220) [220; 230) total Freq. 5 6 5 3 7 3 1 30 c) Com a tabela de frequência no item anterior e usando o ponto médio da faixa obtemos: ¯y = 189.67; s2 = 322.30; md = 185 e mo = 205. d) Os valores obtidos no item (a) são mais precisos, entretanto, para um grande número de dados, o cálculo fica muito trabalhoso para ser feito sem o auxílio de um computador. Notamos que, mesmo a variável sendo quantitativa discreta, a organização em classes é conveniente e os valores encontrados nas duas formas de calcular não são muito diferentes. 19. a) Um gráfico adequado para visualizar a relação entre duas variáveis quantitativas é o diagrama de dispersão. Neste caso, há uma clara relação linear entre as duas variáveis. 12 . roe *,sEstatistica . . UFPR rR ° Lo Oo Oo 3 ° 2 5 iB 5 5 8 e} 2 9 Oo 8 ° 1 2 3 4 5 6 7 Albumina b) Para o calculo do coeficiente de correlagao de Pearson precisamos de 5°; (yi; — 91) (Yai — Yo) = 168.5, (yi — 91)? = 28 e YD, (y2i — Y2)? = 1017. Assim o coeficiente é obtido por (Yi — Y iy 168.5 r- DeilY - 41) (Yai — Y2) — — 0.9985 VrualMi — 11)? Ji (y2 — Y2)?_ —-V28V'1017 que indica uma forte associacao positiva entre as varidveis. 13 Exercícios da Unidade 2 Probabilidades Os exercícios foram extraídos dos livros: Bussab, WO; Morettin, PA. Estatística Básica. São Paulo: Editora Saraiva, 2006 (5ª Edição). Magalhães, MN; Lima, ACP. Noções de Probabilidade e Estatística. São Paulo: EDUSP, 2008. 1. Para cada um dos casos abaixo, escreva o espaço amostral correspondente e conte seus elementos. a) Uma moeda é lançada duas vezes e observam-se as faces obtidas. b) Um dado é lançado duas vezes e a ocorrência de face par ou ímpar é observada. c) Uma urna contém 10 bolas azuis e 10 bolas vermelhas com dimensões rigorosamente iguais. Três bolas são selecionadas ao acaso com reposição e as cores são anotadas. d) Dois dados, com as faces enumeradas de 1 a 6, são lançados simultaneamente e estamos interessados na soma das faces observadas. e) Em uma cidade, famílias com três crianças são selecionadas ao acaso, anotando-se o sexo de cada uma. f) Uma máquina produz 20 peças por hora, escolhe-se um instante qualquer e observa-se o número de defeituosas na próxima hora. g) Uma moeda lançada consecutivamente até o aparecimento da primeira cara. 2. Sendo A e B dois eventos em um mesmo espaço amostral, “traduza” para a linguagem da teoria dos conjuntos as seguintes situações: a) Pelo menos um dos eventos ocorre. b) O evento A ocorre mas o evento B não. c) Nenhum deles ocorre. d) Exatamente um dos eventos ocorre. 3. Uma universidade tem 10000 alunos dos quais 4000 são considerados esportistas. Temos, ainda, que 500 alunos são do curso de biologia diurno, 700 da biologia noturno, 100 são esportistas e da biologia diurno e 200 são esportistas e da biologia noturno. Um aluno é escolhido, ao acaso, e pergunta-se a probabilidade de: a) Ser esportista. b) Ser esportista e aluno da biologia noturno. c) Não ser da biologia. d) Ser esportista ou aluno da biologia. e) Não ser esportista, nem aluno da biologia. 4. Sejam A e B dois eventos em um dado espaço amostral, tais que P(A) = 0.2, P(B) = p, P(A ∪ B) = 0.5 e P(A ∩ B) = 0.1. Determine o valor de p. 5. Dois processadores tipos A e B são colocados em teste por 50 mil horas. A probabilidade de que um erro de cálculo aconteça em um processador do tipo A é de 1/30, no tipo B, 1/80 e, em ambos, 1/1000. Qual a probabilidade de que: a) Pelo menos um dos processadores tenha apresentado erro? b) Nenhum processador tenha apresentado erro? c) Apenas o processador A tenha apresentado erro? 6. Considere dois eventos A e B, mutuamente exclusivos, com P(A) = 0.3 e P(B) = 0.5. Calcule: a) P(A ∩ B). b) P(A ∪ B). c) P(A|B). d) P(Ac). e) P((A ∪ B)c). 7. Se P(A ∪ B) = 0.8; P(A) = 0.5 e P(B) = x, determine o valor de x no caso de: a) A e B serem mutuamente exclusivos. b) A e B serem independentes. 8. Uma escola do ensino médio do interior de São Paulo tem 40% dos estudantes do sexo masculino. Entre estes, 20% nunca viram o mar, ao passo que, entre as meninas, essa porcentagem é de 50%. Qual a probabilidade de que um aluno selecionado ao acaso seja: a) Do sexo masculino e nunca tenha visto o mar? b) Do sexo feminino ou nunca tenha visto o mar? 9. Se P(B) = 0.4; P(A) = 0.7 e P(A ∩ B) = 0.3, calcule P(A|Bc). 10. O São Paulo Futebol Clube ganha com probabilidade 0.7 se chove e com 0.8 se não chove. Em Setembro, a probabilidade de chuva é de 0.3. Se o São Paulo ganhou uma partida em Setembro, qual a probabilidade de ter chovido nesse dia? 11. Uma moeda é viciada de modo que a probabilidade de sair cara é 4 vezes maior que a de sair coroa. Para 2 lançamentos independentes dessa moeda, determinar: a) O espaço amostral. b) A probabilidade de sair somente uma cara. c) A probabilidade de sair pelo menos uma cara. d) A probabilidade de sair dois resultados iguais. 12. Verifique se são válidas as afirmações: a) Se P(A) = 1/3 e P(B|A) = 3/5, então A e B não podem ser disjuntos. b) Se P(A) = 1/2, P(B|A) = 1 e P(A|B) = 1/2, então A não pode estar contido em B. 13. As preferências de homens e mulheres por cada gênero de filme alugado em uma locadora de vídeos estão apresentadas na próxima tabela. Sorteando-se, ao acaso, uma dessas locações de vídeo, pergunta-se a probabilidade de: a) Uma mulher ter alugado um filme policial. b) O filme alugado ser uma comédia. c) Um homem ter alugado ou o filme ser um romance. d) O filme ser policial dado que foi alugado por um homem. Sexo/Filme Comédia (C) Romance (R) Policial (P) Homens (H) 136 92 248 Mulheres (M) 102 195 62 14. Dois dados equilibrados são lançados. Calcule a probabilidade de: a) Obter os valores 3 e 4 (em qualquer ordem), sabendo-se que ocorreu face par no primeiro dado. b) Ocorrer face ímpar no segundo dado sabendo-se que ocorreu face par no primeiro dado. 15. Dois armários guardam as bolas de voleibol e basquete. O armário 1 tem 3 bolas de voleibol e 1 de basquete, enquanto o armário 2 tem 3 bolas de voleibol e 2 de basquete. Escolhendo-se, ao acaso, um armário e, em seguida, uma de suas bolas, calcule a probabilidade dela ser: a) De voleibol, sabendo-se que o armário 1 foi escolhido. 2 b) De basquete, sabendo-se que o armário 2 foi escolhido. c) De basquete. 16. A tabela a seguir apresenta informações de alunos de uma universidade quanto às variáveis: Período, Sexo e Opinião sobre a Reforma Agrária. Determine a probabilidade de escolhermos: a) Uma pessoa do sexo masculino e sem opinião sobre a reforma agrária. b) Uma mulher contrária a reforma agrária. c) Dentre os estudantes do noturno, um que seja a favor da reforma agrária. d) Uma pessoa sem opinião, sabendo-se que ela é do sexo feminino. Período Sexo Reforma Agrária Contra A Favor Sem opinião Diurno Feminino 2 8 2 Masculino 8 9 8 Noturno Feminino 4 8 2 Masculino 12 10 1 17. A tabela a seguir apresenta dados de 1000 ingressantes de uma universidade, com informações sobre área de estudo e classe sócio-econômica. Se um aluno ingressante é escolhido ao acaso, determine a probabilidade de: a) Ser da classe econômica mais alta. b) Estudar na área de exatas. c) Estudar na área de humanas, sendo de classe média. d) Ser de classe baixa, dado que estuda na área de biológicas. Área/Classe Alta (A) Média (M) Baixa (B) Exatas (Ex) 120 156 68 Humanas (Hu) 72 85 112 Biológicas (Bi) 169 145 73 18. Uma parte de um circuito elétrico é formada por 4 componentes conforme indicado no diagrama a seguir. Para o engenheiro avaliar a chance de falha do circuito completo, e talvez replanejá-lo, é preciso determinar a chance de falha dessa referida parte composta de 4 componentes. Dentro das caixas está a probabilidade de falha de cada elemento do circuito. Assuma que os elementos do circuito falhem de forma independente uns dos outros e calcule a proba- bilidade do circuito falhar. 19. Numa população sabe-se que 20% possuem certa doença. A probabilidade de uma pessoa sabiadamente doente (D) apresentar resultado positivo (T) num teste é de 80%, enquanto que a de uma pessoa sabidamente não doente (Dc) apresentar um resultado negativo (T c) é de 90%. Sabendo-se que os únicos resultados possíveis do teste são: positivo ou negativo, responda: a) Qual é a probabilidade de uma pessoa selecionada ao acaso da população apresentar um resultado positivo no teste? b) Qual é a probabilidade de uma pessoa ter um resultado negativo no teste sabendo-se que ela é doente? c) Qual é a probabilidade de uma pessoa testada como positivo de fato ter a doença? d) Os eventos T e D são mutuamente exclusivos? Justifique sua resposta. e) Os eventos T e D são independentes? Justifique sua resposta. 3 20. Três indivíduos tentam, de forma independente, resolver um problema. O primeiro tem 50% de chance de resolver, o segundo tem 65% e o terceiro tem 30%. Qual a probabilidade do problema ser resolvido? 21. Um candidato está fazendo uma prova de múltipla escolha com cinco alternativas das quais apenas uma é correta. A chance do candidato saber a solução de uma questão é de 40%. Quando ele sabe a solução ele sempre acerta a questão e quando não sabe ele escolhe uma das respostas ao acaso. Se o candidato acerta a questão, qual a probabilidade de ele saber resolver a questão? 4 Respostas 1. a) Ω = {CC, CR, RC, RR}, com C sendo face cara e R face coroa; contém 4 elementos. b) Ω = {PP, PI, IP, PP}, com P sendo face par e I face ímpar; contém 4 elementos. c) Ω = {AAA, AAV, AV A, V AA, AV V, V AV, V V A, V V V }, sendo A bola azul e V vermelha; contém 8 elementos. d) Ω = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}; contém 11 elementos. e) Ω = {MMM, MMF, . . . , FFF}, com M e F representando a escolha de uma criança do sexo masculino e feminino, respectivamente, contém 8 elementos. f) Ω = {0, 1, 2, . . . , 20}; contém 21 elementos. g) Ω = {C, RC, RRC, RRRC, RRRRC, . . .}, com C sendo cara e R coroa; contém um número infinito de elementos. 2. a) A ∪ B. b) A ∩ Bc. c) Ac ∩ Bc. d) (A ∩ Bc) ∪ (Ac ∩ B). 3. Os cálculos ficam facilitados com a tabela abaixo: Atividade Biol. Noite (N) Biol. Diuno (D) Outros (O) Total Esportista (E) 200 100 3700 4000 Não esportista (Ec) 500 400 5100 6000 Total 700 500 8800 10000 a) Ser esportista: P(E) = 4000 10000 = 0.4. b) Ser esportista e aluno da biologia noturno: P(E ∩ N) = 200 10000 = 0.02. c) Não ser da biologia: P(O) = 8800 10000 = 0.88. d) Ser esportista ou aluno da biologia: P(E ∪ N ∪ D) = P(E) + P(N) + P(D) − P(E ∩ N) − P(E ∩ D) = 0.49. e) Não ser esportista, nem aluno da biologia: P(Ec ∩ O) = 5100 10000 = 0.51. 4. Utilizando a regra da adição de probabilidade, temos P(A ∪ B) = P(A) + P(B) − P(A ∩ B) 0.5 = 0.2 + p − 0.1 → p = 0.4. 5. Dados do exercício: P(A) = 1/30 = 0.033, P(B) = 1/80 = 0.013, P(A ∩ B) = 1/1000 = 0.001. Então, a) Pelo menos um dos processadores tenha apresentado erro? P(A ∪ B) = P(A) + P(B) − P(A ∩ B) = 0.045. b) Nenhum processador tem apresentado erro? P(Ac ∩ Bc) = P((A ∪ B)c) = 1 − P(A ∪ B) = 1− 0.045= 0.955. c) Apenas o processador A tenha apresentado erro? P(A ∩ Bc) = P(A) − P(A ∩ B) = 0.032. 5 6. Considere dois eventos A e B, mutuamente exclusivos, com P(A) = 0.3 e P(B) = 0.5. Então, a) P(A ∩ B) = 0. b) P(A ∪ B) = 0.8. c) P(A|B) = 0. d) P(Ac) = 0.7. e) P((A ∪ B)c) = 0.2. 7. a) Sendo P(A ∩ B) = 0, P(A ∪ B) = P(A) + P(B) − P(A ∩ B) 0.8 = 0.5 + x − 0 → x = 0.3. b) Sendo P(A ∩ B) = P(A)P(B), P(A ∪ B) = P(A) + P(B) − P(A) · P(B) 0.8 = 0.5 + x − 0.5 · x → x = 0.3/0.5 = 0.6. 8. Uma escola de ensino médio do interior de São Paulo tem 40% de estudantes do sexo masculino. Entre estes, 20% nunca viram o mar, ao passo que, entre as meninas, essa porcentagem é de 50%. Seja M usado para denotar os alunos do sexo masculino, M c as alunas do sexo feminino, V para denotar se um aluno já viu o mar e V c se não viu. A partir do enunciado, temos P(M) = 0.4, P(V c|M) = 0.2 e P(V c|M c) = 0.5. a) A probabilidade de selecionar um aluno do sexo masculino e que nunca tenha visto o mar: P(M ∩ V c) = P(V c|M) · P(M) = 0.2 · 0.4= 0.08. b) A probabilidade de selecionar uma pessoa do sexo feminino ou que nunca tenha visto o mar: P(M c ∪ V c) = P((M ∩ V )c) = 1 − P(M ∩ V ) = 1 − (P(V |M) · P(M)) P(M c ∪ V c) = 1 − ((1 − P(V c|M)) · P(M)) = 1 − ((1− 0.2 )· 0.4 ) P(M c ∪ V c) = 0.68. 9. Calcule P(A|Bc). Se P(B) = 0.4, P(A) = 0.7 e P(A ∩ B) = 0.3, então P(A|Bc) = P (A∩Bc) P (Bc) = P (A)−P (A∩B) 1−P (B) = 0.7−0.3 1−0.4 = 0.67. 10. Sejam os eventos C: chove em setembro e G: o São Paulo ganha um jogo. A partir do enunciado, temos P(G|C) = 0.7, P(G|Cc) = 0.8 e P(C) = 0.3. Então P(G) = P(G ∩ C) + P(G ∩ Cc) = P(G|C)P(C) + P(G|Cc)P(Cc) = 0.7 · 0.3 + 0.8 · (1 − 0.3) = 0.77 P(C|G) = P (C∩G) P (G) = P (G|C)P (C) P (G) = 0.273. 11. Sejam os eventos C: sair a face cara e R: sair a face coroa. Então a) O espaço amostral. Ω = {CC, CR, RC, RR}. 6 b) A probabilidade de sair somente uma cara. P(CR ∪ RC) = P(CR) + P(RC) = P(C)P(R) + P(R)P(C) = 0.32. c) A probabilidade de sair pelo menos uma cara. P(CR ∪ RC ∪ CC) = P(C)P(R) + P(R)P(C) + P(C)P(C) = 0.96. d) A probabilidade de sair dois resultados iguais. P(CC ∪ RR) = P(C)P(C) + P(R)P(R) = 0.68. 12. a) Se P(A) = 1/3 e P(B|A) = 3/5, então A e B não podem ser disjuntos. A afirmação é correta, pois P(A ∩ B) = P(B|A) · P(A) = 3/5 · 1/3 = 1/5 ̸= 0. b) Se P(A) = 1/2, P(B|A) = 1 e P(A|B) = 1/2, então A não pode estar contido em B. A afirmação está incorreta, pois P(B|A) = P (B∩A) P (A) = P (B∩A) 1/2 = 1. Portanto, P(B ∩ A) = 1/2 = P(A) e P(A|B) = P (A∩B) P (B) = 1/2 P (B) = 1/2. Como P(B) = 1, então A está totalmente contido em B. 13. a) P(P|M) = 62 102+195+62 = 0.173. b) P(C) = 136+102 136+92+248+102+195+62 = 0.285. c) P(H ∪ R) = P(H) + P(R) − P(H ∩ R) = (136+92+248)+(92+195)−(92) 136+92+248+102+195+62 = 0.804. d) P(P|H) = 248 136+92+248 = 0.521. 14. a) Obter os valores 3 e 4 (em qualquer ordem), sabendo-se que ocorreu face par no primeiro dado. Ω = {(1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6), (2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (2, 6), (3, 1), (3, 2), (3, 3), (3, 4), (3, 5), (3, 6), (4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6), (5, 1), (5, 2), (5, 3), (5, 4), (5, 5), (5, 6), (6, 1), (6, 2), (6, 3), (6, 4), (6, 5), (6, 6)} Seja o evento A: {(3, 4); (4, 3)} e o evento B: face par no primeiro dado, então (A ∩ B) = {(4, 3)} e P(A ∩ B) = 1/36 e P(B) = 18/36. P(A|B) = P (A∩B) P (B) = 1 18 = 0.056. b) Ocorrer face ímpar no segundo dado sabendo-se que ocorreu face par no primeiro dado. Sejam os eventos I: face ímpar no segundo dado e B: face par no primeiro dado. Então P(I|B) = P (I∩B) P (B) = 9/36 18/36 = 9 18 = 0.5. 15. Sejam os eventos A1: ser do armário 1; A2: ser do armário 2; V : a bola ser de vôlei e B: a bola ser de basquete. Então 7 a) P(V |A1) = P (A1∩V ) P (A1) = 3 4 = 0.75. b) P(B|A2) = P (A2∩B) P (A2) = 2 5 = 0.40. c) P(B) = P(A1)P(B|A1) + P(A2)P(B|A2) = 1 2 · 1 4 + 1 2 · 2 5 = 0.33. 16. Defina os eventos C: ser contra a reforma agrária, A: ser a favor da reforma agrária, O: ser sem opinião quanto a reforma agrária, F: ser do sexo feminino, M: ser do sexo masculino, N: ser do noturno e D: ser do diurno. a) Uma pessoa do sexo masculino e sem opinião sobre a reforma agrária: P(M ∩ O) = 8 + 1 2 + 8 + 2 + 8 + 9 + 8 + 4 + 8 + 2 + 12 + 10 + 1 = 9 74 = 0.122. b) Uma mulher contrária à reforma agrária: P(F ∩ C) = 6 2 + 8 + 2 + 8 + 9 + 8 + 4 + 8 + 2 + 12 + 10 + 1 = 6 74 = 0.081. c) Dentre os estudantes do noturno, um que seja a favor da reforma agrária: P(A|N) = 8 + 10 4 + 8 + 2 + 12 + 10 + 1 = 18 37 = 0.486. d) Uma pessoa sem opinião, sabendo-se que ela é do sexo feminino: P(O|F) = 2 + 2 2 + 8 + 2 + 4 + 8 + 2 = 4 26 = 0.154. 17. Considere os dados apresentados na tabela. Então, calcule as probabilidades de a) Ser da classe econômica mais alta: P(A) = 120 + 72 + 169 120 + 72 + 169 + 156 + 85 + 145 + 68 + 112 + 73 = 0.361 . b) Estudar na área de exatas: P(Ex) = 120 + 156 + 68 120 + 72 + 169 + 156 + 85 + 145 + 68 + 112 + 73 = 0.344 . c) Estudar na área de humanas, sendo de classe média: P(Hu|M) = P(M ∩ Hu) P(M) = 85 156 + 85 + 145 = 0.22 . d) Ser de classe baixa, dado que estuda na área de biológicas: P(B|Bi) = P(B ∩ Bi) P(Bi) = 73 169 + 145 + 73 = 0.189 18. Denotemos por: A o evento com probabilidade de falha de 0.30 (P(A) = 0.30), B o evento com probabilidade de falha de 0.45 (P(B) = 0.45), C e D os eventos com probabilidade de falha de 0.25 (P(C) = P(D) = 0.25). O circuito falhará (F) se A ou C falhar e se B ou D falhar. Em notação de conjuntos, temos F = (A ∪ C) ∩ (B ∪ D). O cálculo da probabilidade fica mais simples usando o evento complentar de F, F c = (A ∪ C)c ∪ (B ∪ D)c = (Ac ∩ Cc) ∪ (Bc ∩ Dc) Então 8 P(F c) = P(Ac ∩ Cc) + P(Bc ∩ Dc) − P(Ac ∩ Cc ∩ Bc ∩ Dc) = P(Ac)P(Cc) + P(Bc)P(Dc) − P(Ac)P(Cc)P(Bc)P(Dc) = 0.7 · 0.75 + 0.55 · 0.75 − (0.70 · 0.75 · 0.55 · 0.75) = 0.721. Portanto, P(F) = 1 − P(F c) = 0.279. 19. São fornecidos no enunciado do exercício: P(D) = 0.2, P(T|D) = 0.8 e P(T c|Dc) = 0.9. a) P(T) = P[(T e D) ou (T e Dc)] = P[(T ∩ D) ∪ (T ∩ Dc)] = P(T ∩ D) + P(T ∩ Dc) = P(T|D)P(D) + P(T|Dc)P(Dc) = P(T|D)P(D) + (1 − P(T c|Dc))(1 − P(D)) = 0.8 ∗ 0.2 + (1 − 0.9) ∗ (1 − 0.2) = 0.24 b) P(T c|D) = 1 − P(T|D) = 0.2 c) Usando o Teorema de Bayes: P(D|T) = P(T|D)P(D) P(T) = 0.67 d) Não, porque o evento (T ∩ D) ̸= ∅. e) Não, porque P(T|D) ̸= P(T). 20. A : o primeiro resolve o problema P(A) = 0, 50 P(Ac) = 0, 50 B : o segundo resolve o problema P(B) = 0, 65 P(Bc) = 0, 35 C : o terceiro resolve o problema P(C) = 0, 30 P(Cc) = 0, 70 P(A ∪ B ∪ C) = 1 − P(Ac ∩ Bc ∩ Cc) ind = 1 − P(Ac) · P(Bc) · P(Cc) = 1 − (0, 50 · 0, 35 · 0, 70) = 0.878 21. Sejam os eventos: • S : o candidato sabe a questão • Sc : o candidato não sabe a questão • A : o candidato acerta a questão • Ac : o candidato não acerta a questão 9 P[S] = 0.40 ; P[Sc] = 0.60 P[A|S] = 1.00 ; P[Ac|S] = 0.00 P[S] = 0.40 ; P[Sc] = 0.60 P[A|Sc] = 0.20 ; P[Ac|Sc] = 0.80 P[S|A] =? P[S|A] = P[S ∩ A] P[A] = P[A|S] · P[S] P[A|S] · P[S] + P[A|Sc] · P[Sc] = 1 · 0.40 (1 · 0.40) + (0.20 · 0.60) = 0.40 0.52 = 0.769 10 Exercícios da Unidade 2 Probabilidades Os exercícios foram extraídos dos livros: Bussab, WO; Morettin, PA. Estatística Básica. São Paulo: Editora Saraiva, 2006 (5ª Edição). Magalhães, MN; Lima, ACP. Noções de Probabilidade e Estatística. São Paulo: EDUSP, 2008. 1. Para cada um dos casos abaixo, escreva o espaço amostral correspondente e conte seus elementos. a) Uma moeda é lançada duas vezes e observam-se as faces obtidas. b) Um dado é lançado duas vezes e a ocorrência de face par ou ímpar é observada. c) Uma urna contém 10 bolas azuis e 10 bolas vermelhas com dimensões rigorosamente iguais. Três bolas são selecionadas ao acaso com reposição e as cores são anotadas. d) Dois dados, com as faces enumeradas de 1 a 6, são lançados simultaneamente e estamos interessados na soma das faces observadas. e) Em uma cidade, famílias com três crianças são selecionadas ao acaso, anotando-se o sexo de cada uma. f) Uma máquina produz 20 peças por hora, escolhe-se um instante qualquer e observa-se o número de defeituosas na próxima hora. g) Uma moeda lançada consecutivamente até o aparecimento da primeira cara. 2. Sendo A e B dois eventos em um mesmo espaço amostral, “traduza” para a linguagem da teoria dos conjuntos as seguintes situações: a) Pelo menos um dos eventos ocorre. b) O evento A ocorre mas o evento B não. c) Nenhum deles ocorre. d) Exatamente um dos eventos ocorre. 3. Uma universidade tem 10000 alunos dos quais 4000 são considerados esportistas. Temos, ainda, que 500 alunos são do curso de biologia diurno, 700 da biologia noturno, 100 são esportistas e da biologia diurno e 200 são esportistas e da biologia noturno. Um aluno é escolhido, ao acaso, e pergunta-se a probabilidade de: a) Ser esportista. b) Ser esportista e aluno da biologia noturno. c) Não ser da biologia. d) Ser esportista ou aluno da biologia. e) Não ser esportista, nem aluno da biologia. 4. Sejam A e B dois eventos em um dado espaço amostral, tais que P(A) = 0.2, P(B) = p, P(A ∪ B) = 0.5 e P(A ∩ B) = 0.1. Determine o valor de p. 5. Dois processadores tipos A e B são colocados em teste por 50 mil horas. A probabilidade de que um erro de cálculo aconteça em um processador do tipo A é de 1/30, no tipo B, 1/80 e, em ambos, 1/1000. Qual a probabilidade de que: a) Pelo menos um dos processadores tenha apresentado erro? b) Nenhum processador tenha apresentado erro? c) Apenas o processador A tenha apresentado erro? 6. Considere dois eventos A e B, mutuamente exclusivos, com P(A) = 0.3 e P(B) = 0.5. Calcule: a) P(A ∩ B). b) P(A ∪ B). c) P(A|B). d) P(Ac). e) P((A ∪ B)c). 7. Se P(A ∪ B) = 0.8; P(A) = 0.5 e P(B) = x, determine o valor de x no caso de: a) A e B serem mutuamente exclusivos. b) A e B serem independentes. 8. Uma escola do ensino médio do interior de São Paulo tem 40% dos estudantes do sexo masculino. Entre estes, 20% nunca viram o mar, ao passo que, entre as meninas, essa porcentagem é de 50%. Qual a probabilidade de que um aluno selecionado ao acaso seja: a) Do sexo masculino e nunca tenha visto o mar? b) Do sexo feminino ou nunca tenha visto o mar? 9. Se P(B) = 0.4; P(A) = 0.7 e P(A ∩ B) = 0.3, calcule P(A|Bc). 10. O São Paulo Futebol Clube ganha com probabilidade 0.7 se chove e com 0.8 se não chove. Em Setembro, a probabilidade de chuva é de 0.3. Se o São Paulo ganhou uma partida em Setembro, qual a probabilidade de ter chovido nesse dia? 11. Uma moeda é viciada de modo que a probabilidade de sair cara é 4 vezes maior que a de sair coroa. Para 2 lançamentos independentes dessa moeda, determinar: a) O espaço amostral. b) A probabilidade de sair somente uma cara. c) A probabilidade de sair pelo menos uma cara. d) A probabilidade de sair dois resultados iguais. 12. Verifique se são válidas as afirmações: a) Se P(A) = 1/3 e P(B|A) = 3/5, então A e B não podem ser disjuntos. b) Se P(A) = 1/2, P(B|A) = 1 e P(A|B) = 1/2, então A não pode estar contido em B. 13. As preferências de homens e mulheres por cada gênero de filme alugado em uma locadora de vídeos estão apresentadas na próxima tabela. Sorteando-se, ao acaso, uma dessas locações de vídeo, pergunta-se a probabilidade de: a) Uma mulher ter alugado um filme policial. b) O filme alugado ser uma comédia. c) Um homem ter alugado ou o filme ser um romance. d) O filme ser policial dado que foi alugado por um homem. Sexo/Filme Comédia (C) Romance (R) Policial (P) Homens (H) 136 92 248 Mulheres (M) 102 195 62 14. Dois dados equilibrados são lançados. Calcule a probabilidade de: a) Obter os valores 3 e 4 (em qualquer ordem), sabendo-se que ocorreu face par no primeiro dado. b) Ocorrer face ímpar no segundo dado sabendo-se que ocorreu face par no primeiro dado. 15. Dois armários guardam as bolas de voleibol e basquete. O armário 1 tem 3 bolas de voleibol e 1 de basquete, enquanto o armário 2 tem 3 bolas de voleibol e 2 de basquete. Escolhendo-se, ao acaso, um armário e, em seguida, uma de suas bolas, calcule a probabilidade dela ser: a) De voleibol, sabendo-se que o armário 1 foi escolhido. 2 b) De basquete, sabendo-se que o armário 2 foi escolhido. c) De basquete. 16. A tabela a seguir apresenta informações de alunos de uma universidade quanto às variáveis: Período, Sexo e Opinião sobre a Reforma Agrária. Determine a probabilidade de escolhermos: a) Uma pessoa do sexo masculino e sem opinião sobre a reforma agrária. b) Uma mulher contrária a reforma agrária. c) Dentre os estudantes do noturno, um que seja a favor da reforma agrária. d) Uma pessoa sem opinião, sabendo-se que ela é do sexo feminino. Período Sexo Reforma Agrária Contra A Favor Sem opinião Diurno Feminino 2 8 2 Masculino 8 9 8 Noturno Feminino 4 8 2 Masculino 12 10 1 17. A tabela a seguir apresenta dados de 1000 ingressantes de uma universidade, com informações sobre área de estudo e classe sócio-econômica. Se um aluno ingressante é escolhido ao acaso, determine a probabilidade de: a) Ser da classe econômica mais alta. b) Estudar na área de exatas. c) Estudar na área de humanas, sendo de classe média. d) Ser de classe baixa, dado que estuda na área de biológicas. Área/Classe Alta (A) Média (M) Baixa (B) Exatas (Ex) 120 156 68 Humanas (Hu) 72 85 112 Biológicas (Bi) 169 145 73 18. Uma parte de um circuito elétrico é formada por 4 componentes conforme indicado no diagrama a seguir. Para o engenheiro avaliar a chance de falha do circuito completo, e talvez replanejá-lo, é preciso determinar a chance de falha dessa referida parte composta de 4 componentes. Dentro das caixas está a probabilidade de falha de cada elemento do circuito. Assuma que os elementos do circuito falhem de forma independente uns dos outros e calcule a proba- bilidade do circuito falhar. 19. Numa população sabe-se que 20% possuem certa doença. A probabilidade de uma pessoa sabiadamente doente (D) apresentar resultado positivo (T) num teste é de 80%, enquanto que a de uma pessoa sabidamente não doente (Dc) apresentar um resultado negativo (T c) é de 90%. Sabendo-se que os únicos resultados possíveis do teste são: positivo ou negativo, responda: a) Qual é a probabilidade de uma pessoa selecionada ao acaso da população apresentar um resultado positivo no teste? b) Qual é a probabilidade de uma pessoa ter um resultado negativo no teste sabendo-se que ela é doente? c) Qual é a probabilidade de uma pessoa testada como positivo de fato ter a doença? d) Os eventos T e D são mutuamente exclusivos? Justifique sua resposta. e) Os eventos T e D são independentes? Justifique sua resposta. 3 20. Três indivíduos tentam, de forma independente, resolver um problema. O primeiro tem 50% de chance de resolver, o segundo tem 65% e o terceiro tem 30%. Qual a probabilidade do problema ser resolvido? 21. Um candidato está fazendo uma prova de múltipla escolha com cinco alternativas das quais apenas uma é correta. A chance do candidato saber a solução de uma questão é de 40%. Quando ele sabe a solução ele sempre acerta a questão e quando não sabe ele escolhe uma das respostas ao acaso. Se o candidato acerta a questão, qual a probabilidade de ele saber resolver a questão? 4 Respostas 1. a) Ω = {CC, CR, RC, RR}, com C sendo face cara e R face coroa; contém 4 elementos. b) Ω = {PP, PI, IP, PP}, com P sendo face par e I face ímpar; contém 4 elementos. c) Ω = {AAA, AAV, AV A, V AA, AV V, V AV, V V A, V V V }, sendo A bola azul e V vermelha; contém 8 elementos. d) Ω = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}; contém 11 elementos. e) Ω = {MMM, MMF, . . . , FFF}, com M e F representando a escolha de uma criança do sexo masculino e feminino, respectivamente, contém 8 elementos. f) Ω = {0, 1, 2, . . . , 20}; contém 21 elementos. g) Ω = {C, RC, RRC, RRRC, RRRRC, . . .}, com C sendo cara e R coroa; contém um número infinito de elementos. 2. a) A ∪ B. b) A ∩ Bc. c) Ac ∩ Bc. d) (A ∩ Bc) ∪ (Ac ∩ B). 3. Os cálculos ficam facilitados com a tabela abaixo: Atividade Biol. Noite (N) Biol. Diuno (D) Outros (O) Total Esportista (E) 200 100 3700 4000 Não esportista (Ec) 500 400 5100 6000 Total 700 500 8800 10000 a) Ser esportista: P(E) = 4000 10000 = 0.4. b) Ser esportista e aluno da biologia noturno: P(E ∩ N) = 200 10000 = 0.02. c) Não ser da biologia: P(O) = 8800 10000 = 0.88. d) Ser esportista ou aluno da biologia: P(E ∪ N ∪ D) = P(E) + P(N) + P(D) − P(E ∩ N) − P(E ∩ D) = 0.49. e) Não ser esportista, nem aluno da biologia: P(Ec ∩ O) = 5100 10000 = 0.51. 4. Utilizando a regra da adição de probabilidade, temos P(A ∪ B) = P(A) + P(B) − P(A ∩ B) 0.5 = 0.2 + p − 0.1 → p = 0.4. 5. Dados do exercício: P(A) = 1/30 = 0.033, P(B) = 1/80 = 0.013, P(A ∩ B) = 1/1000 = 0.001. Então, a) Pelo menos um dos processadores tenha apresentado erro? P(A ∪ B) = P(A) + P(B) − P(A ∩ B) = 0.045. b) Nenhum processador tem apresentado erro? P(Ac ∩ Bc) = P((A ∪ B)c) = 1 − P(A ∪ B) = 1− 0.045= 0.955. c) Apenas o processador A tenha apresentado erro? P(A ∩ Bc) = P(A) − P(A ∩ B) = 0.032. 5 6. Considere dois eventos A e B, mutuamente exclusivos, com P(A) = 0.3 e P(B) = 0.5. Então, a) P(A ∩ B) = 0. b) P(A ∪ B) = 0.8. c) P(A|B) = 0. d) P(Ac) = 0.7. e) P((A ∪ B)c) = 0.2. 7. a) Sendo P(A ∩ B) = 0, P(A ∪ B) = P(A) + P(B) − P(A ∩ B) 0.8 = 0.5 + x − 0 → x = 0.3. b) Sendo P(A ∩ B) = P(A)P(B), P(A ∪ B) = P(A) + P(B) − P(A) · P(B) 0.8 = 0.5 + x − 0.5 · x → x = 0.3/0.5 = 0.6. 8. Uma escola de ensino médio do interior de São Paulo tem 40% de estudantes do sexo masculino. Entre estes, 20% nunca viram o mar, ao passo que, entre as meninas, essa porcentagem é de 50%. Seja M usado para denotar os alunos do sexo masculino, M c as alunas do sexo feminino, V para denotar se um aluno já viu o mar e V c se não viu. A partir do enunciado, temos P(M) = 0.4, P(V c|M) = 0.2 e P(V c|M c) = 0.5. a) A probabilidade de selecionar um aluno do sexo masculino e que nunca tenha visto o mar: P(M ∩ V c) = P(V c|M) · P(M) = 0.2 · 0.4= 0.08. b) A probabilidade de selecionar uma pessoa do sexo feminino ou que nunca tenha visto o mar: P(M c ∪ V c) = P((M ∩ V )c) = 1 − P(M ∩ V ) = 1 − (P(V |M) · P(M)) P(M c ∪ V c) = 1 − ((1 − P(V c|M)) · P(M)) = 1 − ((1− 0.2 )· 0.4 ) P(M c ∪ V c) = 0.68. 9. Calcule P(A|Bc). Se P(B) = 0.4, P(A) = 0.7 e P(A ∩ B) = 0.3, então P(A|Bc) = P (A∩Bc) P (Bc) = P (A)−P (A∩B) 1−P (B) = 0.7−0.3 1−0.4 = 0.67. 10. Sejam os eventos C: chove em setembro e G: o São Paulo ganha um jogo. A partir do enunciado, temos P(G|C) = 0.7, P(G|Cc) = 0.8 e P(C) = 0.3. Então P(G) = P(G ∩ C) + P(G ∩ Cc) = P(G|C)P(C) + P(G|Cc)P(Cc) = 0.7 · 0.3 + 0.8 · (1 − 0.3) = 0.77 P(C|G) = P (C∩G) P (G) = P (G|C)P (C) P (G) = 0.273. 11. Sejam os eventos C: sair a face cara e R: sair a face coroa. Então a) O espaço amostral. Ω = {CC, CR, RC, RR}. 6 b) A probabilidade de sair somente uma cara. P(CR ∪ RC) = P(CR) + P(RC) = P(C)P(R) + P(R)P(C) = 0.32. c) A probabilidade de sair pelo menos uma cara. P(CR ∪ RC ∪ CC) = P(C)P(R) + P(R)P(C) + P(C)P(C) = 0.96. d) A probabilidade de sair dois resultados iguais. P(CC ∪ RR) = P(C)P(C) + P(R)P(R) = 0.68. 12. a) Se P(A) = 1/3 e P(B|A) = 3/5, então A e B não podem ser disjuntos. A afirmação é correta, pois P(A ∩ B) = P(B|A) · P(A) = 3/5 · 1/3 = 1/5 ̸= 0. b) Se P(A) = 1/2, P(B|A) = 1 e P(A|B) = 1/2, então A não pode estar contido em B. A afirmação está incorreta, pois P(B|A) = P (B∩A) P (A) = P (B∩A) 1/2 = 1. Portanto, P(B ∩ A) = 1/2 = P(A) e P(A|B) = P (A∩B) P (B) = 1/2 P (B) = 1/2. Como P(B) = 1, então A está totalmente contido em B. 13. a) P(P|M) = 62 102+195+62 = 0.173. b) P(C) = 136+102 136+92+248+102+195+62 = 0.285. c) P(H ∪ R) = P(H) + P(R) − P(H ∩ R) = (136+92+248)+(92+195)−(92) 136+92+248+102+195+62 = 0.804. d) P(P|H) = 248 136+92+248 = 0.521. 14. a) Obter os valores 3 e 4 (em qualquer ordem), sabendo-se que ocorreu face par no primeiro dado. Ω = {(1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6), (2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (2, 6), (3, 1), (3, 2), (3, 3), (3, 4), (3, 5), (3, 6), (4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6), (5, 1), (5, 2), (5, 3), (5, 4), (5, 5), (5, 6), (6, 1), (6, 2), (6, 3), (6, 4), (6, 5), (6, 6)} Seja o evento A: {(3, 4); (4, 3)} e o evento B: face par no primeiro dado, então (A ∩ B) = {(4, 3)} e P(A ∩ B) = 1/36 e P(B) = 18/36. P(A|B) = P (A∩B) P (B) = 1 18 = 0.056. b) Ocorrer face ímpar no segundo dado sabendo-se que ocorreu face par no primeiro dado. Sejam os eventos I: face ímpar no segundo dado e B: face par no primeiro dado. Então P(I|B) = P (I∩B) P (B) = 9/36 18/36 = 9 18 = 0.5. 15. Sejam os eventos A1: ser do armário 1; A2: ser do armário 2; V : a bola ser de vôlei e B: a bola ser de basquete. Então 7 a) P(V |A1) = P (A1∩V ) P (A1) = 3 4 = 0.75. b) P(B|A2) = P (A2∩B) P (A2) = 2 5 = 0.40. c) P(B) = P(A1)P(B|A1) + P(A2)P(B|A2) = 1 2 · 1 4 + 1 2 · 2 5 = 0.33. 16. Defina os eventos C: ser contra a reforma agrária, A: ser a favor da reforma agrária, O: ser sem opinião quanto a reforma agrária, F: ser do sexo feminino, M: ser do sexo masculino, N: ser do noturno e D: ser do diurno. a) Uma pessoa do sexo masculino e sem opinião sobre a reforma agrária: P(M ∩ O) = 8 + 1 2 + 8 + 2 + 8 + 9 + 8 + 4 + 8 + 2 + 12 + 10 + 1 = 9 74 = 0.122. b) Uma mulher contrária à reforma agrária: P(F ∩ C) = 6 2 + 8 + 2 + 8 + 9 + 8 + 4 + 8 + 2 + 12 + 10 + 1 = 6 74 = 0.081. c) Dentre os estudantes do noturno, um que seja a favor da reforma agrária: P(A|N) = 8 + 10 4 + 8 + 2 + 12 + 10 + 1 = 18 37 = 0.486. d) Uma pessoa sem opinião, sabendo-se que ela é do sexo feminino: P(O|F) = 2 + 2 2 + 8 + 2 + 4 + 8 + 2 = 4 26 = 0.154. 17. Considere os dados apresentados na tabela. Então, calcule as probabilidades de a) Ser da classe econômica mais alta: P(A) = 120 + 72 + 169 120 + 72 + 169 + 156 + 85 + 145 + 68 + 112 + 73 = 0.361 . b) Estudar na área de exatas: P(Ex) = 120 + 156 + 68 120 + 72 + 169 + 156 + 85 + 145 + 68 + 112 + 73 = 0.344 . c) Estudar na área de humanas, sendo de classe média: P(Hu|M) = P(M ∩ Hu) P(M) = 85 156 + 85 + 145 = 0.22 . d) Ser de classe baixa, dado que estuda na área de biológicas: P(B|Bi) = P(B ∩ Bi) P(Bi) = 73 169 + 145 + 73 = 0.189 18. Denotemos por: A o evento com probabilidade de falha de 0.30 (P(A) = 0.30), B o evento com probabilidade de falha de 0.45 (P(B) = 0.45), C e D os eventos com probabilidade de falha de 0.25 (P(C) = P(D) = 0.25). O circuito falhará (F) se A ou C falhar e se B ou D falhar. Em notação de conjuntos, temos F = (A ∪ C) ∩ (B ∪ D). O cálculo da probabilidade fica mais simples usando o evento complentar de F, F c = (A ∪ C)c ∪ (B ∪ D)c = (Ac ∩ Cc) ∪ (Bc ∩ Dc) Então 8 P(F c) = P(Ac ∩ Cc) + P(Bc ∩ Dc) − P(Ac ∩ Cc ∩ Bc ∩ Dc) = P(Ac)P(Cc) + P(Bc)P(Dc) − P(Ac)P(Cc)P(Bc)P(Dc) = 0.7 · 0.75 + 0.55 · 0.75 − (0.70 · 0.75 · 0.55 · 0.75) = 0.721. Portanto, P(F) = 1 − P(F c) = 0.279. 19. São fornecidos no enunciado do exercício: P(D) = 0.2, P(T|D) = 0.8 e P(T c|Dc) = 0.9. a) P(T) = P[(T e D) ou (T e Dc)] = P[(T ∩ D) ∪ (T ∩ Dc)] = P(T ∩ D) + P(T ∩ Dc) = P(T|D)P(D) + P(T|Dc)P(Dc) = P(T|D)P(D) + (1 − P(T c|Dc))(1 − P(D)) = 0.8 ∗ 0.2 + (1 − 0.9) ∗ (1 − 0.2) = 0.24 b) P(T c|D) = 1 − P(T|D) = 0.2 c) Usando o Teorema de Bayes: P(D|T) = P(T|D)P(D) P(T) = 0.67 d) Não, porque o evento (T ∩ D) ̸= ∅. e) Não, porque P(T|D) ̸= P(T). 20. A : o primeiro resolve o problema P(A) = 0, 50 P(Ac) = 0, 50 B : o segundo resolve o problema P(B) = 0, 65 P(Bc) = 0, 35 C : o terceiro resolve o problema P(C) = 0, 30 P(Cc) = 0, 70 P(A ∪ B ∪ C) = 1 − P(Ac ∩ Bc ∩ Cc) ind = 1 − P(Ac) · P(Bc) · P(Cc) = 1 − (0, 50 · 0, 35 · 0, 70) = 0.878 21. Sejam os eventos: • S : o candidato sabe a questão • Sc : o candidato não sabe a questão • A : o candidato acerta a questão • Ac : o candidato não acerta a questão 9 P[S] = 0.40 ; P[Sc] = 0.60 P[A|S] = 1.00 ; P[Ac|S] = 0.00 P[S] = 0.40 ; P[Sc] = 0.60 P[A|Sc] = 0.20 ; P[Ac|Sc] = 0.80 P[S|A] =? P[S|A] = P[S ∩ A] P[A] = P[A|S] · P[S] P[A|S] · P[S] + P[A|Sc] · P[Sc] = 1 · 0.40 (1 · 0.40) + (0.20 · 0.60) = 0.40 0.52 = 0.769 10 Exercícios da Unidade 2 Probabilidades Os exercícios foram extraídos dos livros: Bussab, WO; Morettin, PA. Estatística Básica. São Paulo: Editora Saraiva, 2006 (5ª Edição). Magalhães, MN; Lima, ACP. Noções de Probabilidade e Estatística. São Paulo: EDUSP, 2008. 1. Para cada um dos casos abaixo, escreva o espaço amostral correspondente e conte seus elementos. a) Uma moeda é lançada duas vezes e observam-se as faces obtidas. b) Um dado é lançado duas vezes e a ocorrência de face par ou ímpar é observada. c) Uma urna contém 10 bolas azuis e 10 bolas vermelhas com dimensões rigorosamente iguais. Três bolas são selecionadas ao acaso com reposição e as cores são anotadas. d) Dois dados, com as faces enumeradas de 1 a 6, são lançados simultaneamente e estamos interessados na soma das faces observadas. e) Em uma cidade, famílias com três crianças são selecionadas ao acaso, anotando-se o sexo de cada uma. f) Uma máquina produz 20 peças por hora, escolhe-se um instante qualquer e observa-se o número de defeituosas na próxima hora. g) Uma moeda lançada consecutivamente até o aparecimento da primeira cara. 2. Sendo A e B dois eventos em um mesmo espaço amostral, “traduza” para a linguagem da teoria dos conjuntos as seguintes situações: a) Pelo menos um dos eventos ocorre. b) O evento A ocorre mas o evento B não. c) Nenhum deles ocorre. d) Exatamente um dos eventos ocorre. 3. Uma universidade tem 10000 alunos dos quais 4000 são considerados esportistas. Temos, ainda, que 500 alunos são do curso de biologia diurno, 700 da biologia noturno, 100 são esportistas e da biologia diurno e 200 são esportistas e da biologia noturno. Um aluno é escolhido, ao acaso, e pergunta-se a probabilidade de: a) Ser esportista. b) Ser esportista e aluno da biologia noturno. c) Não ser da biologia. d) Ser esportista ou aluno da biologia. e) Não ser esportista, nem aluno da biologia. 4. Sejam A e B dois eventos em um dado espaço amostral, tais que P(A) = 0.2, P(B) = p, P(A ∪ B) = 0.5 e P(A ∩ B) = 0.1. Determine o valor de p. 5. Dois processadores tipos A e B são colocados em teste por 50 mil horas. A probabilidade de que um erro de cálculo aconteça em um processador do tipo A é de 1/30, no tipo B, 1/80 e, em ambos, 1/1000. Qual a probabilidade de que: a) Pelo menos um dos processadores tenha apresentado erro? b) Nenhum processador tenha apresentado erro? c) Apenas o processador A tenha apresentado erro? 6. Considere dois eventos A e B, mutuamente exclusivos, com P(A) = 0.3 e P(B) = 0.5. Calcule: a) P(A ∩ B). b) P(A ∪ B). c) P(A|B). d) P(Ac). e) P((A ∪ B)c). 7. Se P(A ∪ B) = 0.8; P(A) = 0.5 e P(B) = x, determine o valor de x no caso de: a) A e B serem mutuamente exclusivos. b) A e B serem independentes. 8. Uma escola do ensino médio do interior de São Paulo tem 40% dos estudantes do sexo masculino. Entre estes, 20% nunca viram o mar, ao passo que, entre as meninas, essa porcentagem é de 50%. Qual a probabilidade de que um aluno selecionado ao acaso seja: a) Do sexo masculino e nunca tenha visto o mar? b) Do sexo feminino ou nunca tenha visto o mar? 9. Se P(B) = 0.4; P(A) = 0.7 e P(A ∩ B) = 0.3, calcule P(A|Bc). 10. O São Paulo Futebol Clube ganha com probabilidade 0.7 se chove e com 0.8 se não chove. Em Setembro, a probabilidade de chuva é de 0.3. Se o São Paulo ganhou uma partida em Setembro, qual a probabilidade de ter chovido nesse dia? 11. Uma moeda é viciada de modo que a probabilidade de sair cara é 4 vezes maior que a de sair coroa. Para 2 lançamentos independentes dessa moeda, determinar: a) O espaço amostral. b) A probabilidade de sair somente uma cara. c) A probabilidade de sair pelo menos uma cara. d) A probabilidade de sair dois resultados iguais. 12. Verifique se são válidas as afirmações: a) Se P(A) = 1/3 e P(B|A) = 3/5, então A e B não podem ser disjuntos. b) Se P(A) = 1/2, P(B|A) = 1 e P(A|B) = 1/2, então A não pode estar contido em B. 13. As preferências de homens e mulheres por cada gênero de filme alugado em uma locadora de vídeos estão apresentadas na próxima tabela. Sorteando-se, ao acaso, uma dessas locações de vídeo, pergunta-se a probabilidade de: a) Uma mulher ter alugado um filme policial. b) O filme alugado ser uma comédia. c) Um homem ter alugado ou o filme ser um romance. d) O filme ser policial dado que foi alugado por um homem. Sexo/Filme Comédia (C) Romance (R) Policial (P) Homens (H) 136 92 248 Mulheres (M) 102 195 62 14. Dois dados equilibrados são lançados. Calcule a probabilidade de: a) Obter os valores 3 e 4 (em qualquer ordem), sabendo-se que ocorreu face par no primeiro dado. b) Ocorrer face ímpar no segundo dado sabendo-se que ocorreu face par no primeiro dado. 15. Dois armários guardam as bolas de voleibol e basquete. O armário 1 tem 3 bolas de voleibol e 1 de basquete, enquanto o armário 2 tem 3 bolas de voleibol e 2 de basquete. Escolhendo-se, ao acaso, um armário e, em seguida, uma de suas bolas, calcule a probabilidade dela ser: a) De voleibol, sabendo-se que o armário 1 foi escolhido. 2 b) De basquete, sabendo-se que o armário 2 foi escolhido. c) De basquete. 16. A tabela a seguir apresenta informações de alunos de uma universidade quanto às variáveis: Período, Sexo e Opinião sobre a Reforma Agrária. Determine a probabilidade de escolhermos: a) Uma pessoa do sexo masculino e sem opinião sobre a reforma agrária. b) Uma mulher contrária a reforma agrária. c) Dentre os estudantes do noturno, um que seja a favor da reforma agrária. d) Uma pessoa sem opinião, sabendo-se que ela é do sexo feminino. Período Sexo Reforma Agrária Contra A Favor Sem opinião Diurno Feminino 2 8 2 Masculino 8 9 8 Noturno Feminino 4 8 2 Masculino 12 10 1 17. A tabela a seguir apresenta dados de 1000 ingressantes de uma universidade, com informações sobre área de estudo e classe sócio-econômica. Se um aluno ingressante é escolhido ao acaso, determine a probabilidade de: a) Ser da classe econômica mais alta. b) Estudar na área de exatas. c) Estudar na área de humanas, sendo de classe média. d) Ser de classe baixa, dado que estuda na área de biológicas. Área/Classe Alta (A) Média (M) Baixa (B) Exatas (Ex) 120 156 68 Humanas (Hu) 72 85 112 Biológicas (Bi) 169 145 73 18. Uma parte de um circuito elétrico é formada por 4 componentes conforme indicado no diagrama a seguir. Para o engenheiro avaliar a chance de falha do circuito completo, e talvez replanejá-lo, é preciso determinar a chance de falha dessa referida parte composta de 4 componentes. Dentro das caixas está a probabilidade de falha de cada elemento do circuito. Assuma que os elementos do circuito falhem de forma independente uns dos outros e calcule a proba- bilidade do circuito falhar. 19. Numa população sabe-se que 20% possuem certa doença. A probabilidade de uma pessoa sabiadamente doente (D) apresentar resultado positivo (T) num teste é de 80%, enquanto que a de uma pessoa sabidamente não doente (Dc) apresentar um resultado negativo (T c) é de 90%. Sabendo-se que os únicos resultados possíveis do teste são: positivo ou negativo, responda: a) Qual é a probabilidade de uma pessoa selecionada ao acaso da população apresentar um resultado positivo no teste? b) Qual é a probabilidade de uma pessoa ter um resultado negativo no teste sabendo-se que ela é doente? c) Qual é a probabilidade de uma pessoa testada como positivo de fato ter a doença? d) Os eventos T e D são mutuamente exclusivos? Justifique sua resposta. e) Os eventos T e D são independentes? Justifique sua resposta. 3 20. Três indivíduos tentam, de forma independente, resolver um problema. O primeiro tem 50% de chance de resolver, o segundo tem 65% e o terceiro tem 30%. Qual a probabilidade do problema ser resolvido? 21. Um candidato está fazendo uma prova de múltipla escolha com cinco alternativas das quais apenas uma é correta. A chance do candidato saber a solução de uma questão é de 40%. Quando ele sabe a solução ele sempre acerta a questão e quando não sabe ele escolhe uma das respostas ao acaso. Se o candidato acerta a questão, qual a probabilidade de ele saber resolver a questão? 4 Respostas 1. a) Ω = {CC, CR, RC, RR}, com C sendo face cara e R face coroa; contém 4 elementos. b) Ω = {PP, PI, IP, PP}, com P sendo face par e I face ímpar; contém 4 elementos. c) Ω = {AAA, AAV, AV A, V AA, AV V, V AV, V V A, V V V }, sendo A bola azul e V vermelha; contém 8 elementos. d) Ω = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}; contém 11 elementos. e) Ω = {MMM, MMF, . . . , FFF}, com M e F representando a escolha de uma criança do sexo masculino e feminino, respectivamente, contém 8 elementos. f) Ω = {0, 1, 2, . . . , 20}; contém 21 elementos. g) Ω = {C, RC, RRC, RRRC, RRRRC, . . .}, com C sendo cara e R coroa; contém um número infinito de elementos. 2. a) A ∪ B. b) A ∩ Bc. c) Ac ∩ Bc. d) (A ∩ Bc) ∪ (Ac ∩ B). 3. Os cálculos ficam facilitados com a tabela abaixo: Atividade Biol. Noite (N) Biol. Diuno (D) Outros (O) Total Esportista (E) 200 100 3700 4000 Não esportista (Ec) 500 400 5100 6000 Total 700 500 8800 10000 a) Ser esportista: P(E) = 4000 10000 = 0.4. b) Ser esportista e aluno da biologia noturno: P(E ∩ N) = 200 10000 = 0.02. c) Não ser da biologia: P(O) = 8800 10000 = 0.88. d) Ser esportista ou aluno da biologia: P(E ∪ N ∪ D) = P(E) + P(N) + P(D) − P(E ∩ N) − P(E ∩ D) = 0.49. e) Não ser esportista, nem aluno da biologia: P(Ec ∩ O) = 5100 10000 = 0.51. 4. Utilizando a regra da adição de probabilidade, temos P(A ∪ B) = P(A) + P(B) − P(A ∩ B) 0.5 = 0.2 + p − 0.1 → p = 0.4. 5. Dados do exercício: P(A) = 1/30 = 0.033, P(B) = 1/80 = 0.013, P(A ∩ B) = 1/1000 = 0.001. Então, a) Pelo menos um dos processadores tenha apresentado erro? P(A ∪ B) = P(A) + P(B) − P(A ∩ B) = 0.045. b) Nenhum processador tem apresentado erro? P(Ac ∩ Bc) = P((A ∪ B)c) = 1 − P(A ∪ B) = 1− 0.045= 0.955. c) Apenas o processador A tenha apresentado erro? P(A ∩ Bc) = P(A) − P(A ∩ B) = 0.032. 5 6. Considere dois eventos A e B, mutuamente exclusivos, com P(A) = 0.3 e P(B) = 0.5. Então, a) P(A ∩ B) = 0. b) P(A ∪ B) = 0.8. c) P(A|B) = 0. d) P(Ac) = 0.7. e) P((A ∪ B)c) = 0.2. 7. a) Sendo P(A ∩ B) = 0, P(A ∪ B) = P(A) + P(B) − P(A ∩ B) 0.8 = 0.5 + x − 0 → x = 0.3. b) Sendo P(A ∩ B) = P(A)P(B), P(A ∪ B) = P(A) + P(B) − P(A) · P(B) 0.8 = 0.5 + x − 0.5 · x → x = 0.3/0.5 = 0.6. 8. Uma escola de ensino médio do interior de São Paulo tem 40% de estudantes do sexo masculino. Entre estes, 20% nunca viram o mar, ao passo que, entre as meninas, essa porcentagem é de 50%. Seja M usado para denotar os alunos do sexo masculino, M c as alunas do sexo feminino, V para denotar se um aluno já viu o mar e V c se não viu. A partir do enunciado, temos P(M) = 0.4, P(V c|M) = 0.2 e P(V c|M c) = 0.5. a) A probabilidade de selecionar um aluno do sexo masculino e que nunca tenha visto o mar: P(M ∩ V c) = P(V c|M) · P(M) = 0.2 · 0.4= 0.08. b) A probabilidade de selecionar uma pessoa do sexo feminino ou que nunca tenha visto o mar: P(M c ∪ V c) = P((M ∩ V )c) = 1 − P(M ∩ V ) = 1 − (P(V |M) · P(M)) P(M c ∪ V c) = 1 − ((1 − P(V c|M)) · P(M)) = 1 − ((1− 0.2 )· 0.4 ) P(M c ∪ V c) = 0.68. 9. Calcule P(A|Bc). Se P(B) = 0.4, P(A) = 0.7 e P(A ∩ B) = 0.3, então P(A|Bc) = P (A∩Bc) P (Bc) = P (A)−P (A∩B) 1−P (B) = 0.7−0.3 1−0.4 = 0.67. 10. Sejam os eventos C: chove em setembro e G: o São Paulo ganha um jogo. A partir do enunciado, temos P(G|C) = 0.7, P(G|Cc) = 0.8 e P(C) = 0.3. Então P(G) = P(G ∩ C) + P(G ∩ Cc) = P(G|C)P(C) + P(G|Cc)P(Cc) = 0.7 · 0.3 + 0.8 · (1 − 0.3) = 0.77 P(C|G) = P (C∩G) P (G) = P (G|C)P (C) P (G) = 0.273. 11. Sejam os eventos C: sair a face cara e R: sair a face coroa. Então a) O espaço amostral. Ω = {CC, CR, RC, RR}. 6 b) A probabilidade de sair somente uma cara. P(CR ∪ RC) = P(CR) + P(RC) = P(C)P(R) + P(R)P(C) = 0.32. c) A probabilidade de sair pelo menos uma cara. P(CR ∪ RC ∪ CC) = P(C)P(R) + P(R)P(C) + P(C)P(C) = 0.96. d) A probabilidade de sair dois resultados iguais. P(CC ∪ RR) = P(C)P(C) + P(R)P(R) = 0.68. 12. a) Se P(A) = 1/3 e P(B|A) = 3/5, então A e B não podem ser disjuntos. A afirmação é correta, pois P(A ∩ B) = P(B|A) · P(A) = 3/5 · 1/3 = 1/5 ̸= 0. b) Se P(A) = 1/2, P(B|A) = 1 e P(A|B) = 1/2, então A não pode estar contido em B. A afirmação está incorreta, pois P(B|A) = P (B∩A) P (A) = P (B∩A) 1/2 = 1. Portanto, P(B ∩ A) = 1/2 = P(A) e P(A|B) = P (A∩B) P (B) = 1/2 P (B) = 1/2. Como P(B) = 1, então A está totalmente contido em B. 13. a) P(P|M) = 62 102+195+62 = 0.173. b) P(C) = 136+102 136+92+248+102+195+62 = 0.285. c) P(H ∪ R) = P(H) + P(R) − P(H ∩ R) = (136+92+248)+(92+195)−(92) 136+92+248+102+195+62 = 0.804. d) P(P|H) = 248 136+92+248 = 0.521. 14. a) Obter os valores 3 e 4 (em qualquer ordem), sabendo-se que ocorreu face par no primeiro dado. Ω = {(1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6), (2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (2, 6), (3, 1), (3, 2), (3, 3), (3, 4), (3, 5), (3, 6), (4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6), (5, 1), (5, 2), (5, 3), (5, 4), (5, 5), (5, 6), (6, 1), (6, 2), (6, 3), (6, 4), (6, 5), (6, 6)} Seja o evento A: {(3, 4); (4, 3)} e o evento B: face par no primeiro dado, então (A ∩ B) = {(4, 3)} e P(A ∩ B) = 1/36 e P(B) = 18/36. P(A|B) = P (A∩B) P (B) = 1 18 = 0.056. b) Ocorrer face ímpar no segundo dado sabendo-se que ocorreu face par no primeiro dado. Sejam os eventos I: face ímpar no segundo dado e B: face par no primeiro dado. Então P(I|B) = P (I∩B) P (B) = 9/36 18/36 = 9 18 = 0.5. 15. Sejam os eventos A1: ser do armário 1; A2: ser do armário 2; V : a bola ser de vôlei e B: a bola ser de basquete. Então 7 a) P(V |A1) = P (A1∩V ) P (A1) = 3 4 = 0.75. b) P(B|A2) = P (A2∩B) P (A2) = 2 5 = 0.40. c) P(B) = P(A1)P(B|A1) + P(A2)P(B|A2) = 1 2 · 1 4 + 1 2 · 2 5 = 0.33. 16. Defina os eventos C: ser contra a reforma agrária, A: ser a favor da reforma agrária, O: ser sem opinião quanto a reforma agrária, F: ser do sexo feminino, M: ser do sexo masculino, N: ser do noturno e D: ser do diurno. a) Uma pessoa do sexo masculino e sem opinião sobre a reforma agrária: P(M ∩ O) = 8 + 1 2 + 8 + 2 + 8 + 9 + 8 + 4 + 8 + 2 + 12 + 10 + 1 = 9 74 = 0.122. b) Uma mulher contrária à reforma agrária: P(F ∩ C) = 6 2 + 8 + 2 + 8 + 9 + 8 + 4 + 8 + 2 + 12 + 10 + 1 = 6 74 = 0.081. c) Dentre os estudantes do noturno, um que seja a favor da reforma agrária: P(A|N) = 8 + 10 4 + 8 + 2 + 12 + 10 + 1 = 18 37 = 0.486. d) Uma pessoa sem opinião, sabendo-se que ela é do sexo feminino: P(O|F) = 2 + 2 2 + 8 + 2 + 4 + 8 + 2 = 4 26 = 0.154. 17. Considere os dados apresentados na tabela. Então, calcule as probabilidades de a) Ser da classe econômica mais alta: P(A) = 120 + 72 + 169 120 + 72 + 169 + 156 + 85 + 145 + 68 + 112 + 73 = 0.361 . b) Estudar na área de exatas: P(Ex) = 120 + 156 + 68 120 + 72 + 169 + 156 + 85 + 145 + 68 + 112 + 73 = 0.344 . c) Estudar na área de humanas, sendo de classe média: P(Hu|M) = P(M ∩ Hu) P(M) = 85 156 + 85 + 145 = 0.22 . d) Ser de classe baixa, dado que estuda na área de biológicas: P(B|Bi) = P(B ∩ Bi) P(Bi) = 73 169 + 145 + 73 = 0.189 18. Denotemos por: A o evento com probabilidade de falha de 0.30 (P(A) = 0.30), B o evento com probabilidade de falha de 0.45 (P(B) = 0.45), C e D os eventos com probabilidade de falha de 0.25 (P(C) = P(D) = 0.25). O circuito falhará (F) se A ou C falhar e se B ou D falhar. Em notação de conjuntos, temos F = (A ∪ C) ∩ (B ∪ D). O cálculo da probabilidade fica mais simples usando o evento complentar de F, F c = (A ∪ C)c ∪ (B ∪ D)c = (Ac ∩ Cc) ∪ (Bc ∩ Dc) Então 8 P(F c) = P(Ac ∩ Cc) + P(Bc ∩ Dc) − P(Ac ∩ Cc ∩ Bc ∩ Dc) = P(Ac)P(Cc) + P(Bc)P(Dc) − P(Ac)P(Cc)P(Bc)P(Dc) = 0.7 · 0.75 + 0.55 · 0.75 − (0.70 · 0.75 · 0.55 · 0.75) = 0.721. Portanto, P(F) = 1 − P(F c) = 0.279. 19. São fornecidos no enunciado do exercício: P(D) = 0.2, P(T|D) = 0.8 e P(T c|Dc) = 0.9. a) P(T) = P[(T e D) ou (T e Dc)] = P[(T ∩ D) ∪ (T ∩ Dc)] = P(T ∩ D) + P(T ∩ Dc) = P(T|D)P(D) + P(T|Dc)P(Dc) = P(T|D)P(D) + (1 − P(T c|Dc))(1 − P(D)) = 0.8 ∗ 0.2 + (1 − 0.9) ∗ (1 − 0.2) = 0.24 b) P(T c|D) = 1 − P(T|D) = 0.2 c) Usando o Teorema de Bayes: P(D|T) = P(T|D)P(D) P(T) = 0.67 d) Não, porque o evento (T ∩ D) ̸= ∅. e) Não, porque P(T|D) ̸= P(T). 20. A : o primeiro resolve o problema P(A) = 0, 50 P(Ac) = 0, 50 B : o segundo resolve o problema P(B) = 0, 65 P(Bc) = 0, 35 C : o terceiro resolve o problema P(C) = 0, 30 P(Cc) = 0, 70 P(A ∪ B ∪ C) = 1 − P(Ac ∩ Bc ∩ Cc) ind = 1 − P(Ac) · P(Bc) · P(Cc) = 1 − (0, 50 · 0, 35 · 0, 70) = 0.878 21. Sejam os eventos: • S : o candidato sabe a questão • Sc : o candidato não sabe a questão • A : o candidato acerta a questão • Ac : o candidato não acerta a questão 9 P[S] = 0.40 ; P[Sc] = 0.60 P[A|S] = 1.00 ; P[Ac|S] = 0.00 P[S] = 0.40 ; P[Sc] = 0.60 P[A|Sc] = 0.20 ; P[Ac|Sc] = 0.80 P[S|A] =? P[S|A] = P[S ∩ A] P[A] = P[A|S] · P[S] P[A|S] · P[S] + P[A|Sc] · P[Sc] = 1 · 0.40 (1 · 0.40) + (0.20 · 0.60) = 0.40 0.52 = 0.769 10 Exercícios da Unidade 3 Variáveis Aleatórias Os exercícios foram extraídos dos livros: Bussab, WO; Morettin, PA. Estatística Básica. São Paulo: Editora Saraiva, 2006 (5ª Edição). Magalhães, MN; Lima, ACP. Noções de Probabilidade e Estatística. São Paulo: EDUSP, 2008. 1. Sendo Y uma variável aleatória com função de probabilidade dada a seguir, obtenha as medidas de posição média (µ), mediana (Md) e moda (Mo). Y -2 0 2 pi 1/3 1/3 1/3 2. Um atacadista recebe de vários fornecedores uma certa peça para revenda. A peça é produzida com material de qualidade diferente e, portanto, possui custo diferenciado. Levando em conta a proporção fornecida e o preço apresentado por cada fabricante, pode-se admitir que o custo de uma peça qualquer (em reais), escolhida ao acaso, é uma variável aleatória (C). Admita a seguinte função de probabilidade para C: C 1,00 1,10 1,20 1,30 1,40 pi 0,2 0,3 0,2 0,2 0,1 a) Determine as medidas de posição da variável C. b) Suponha que o atacadista revenda cada uma dessas peças acrescentado 50% sobre o custo da peça, além de um adicional de R$ 0,10 pelo frete. Calcule as medidas de posição da variável V : preço de revenda da peça. 3. Num certo bairro da cidade de São Paulo, as companhias de seguro estabeleceram o seguinte modelo para número de veículos furtados por semana: Furtos (F) 0 1 2 3 4 pi 1/4 1/2 1/8 1/16 1/16 Calcule a média e a variância do número de furtos semanais do bairro. 4. Num jogo de dados, um jogador paga R$ 5 para lançar um dado equilibrado e ganha R$ 10 se resultar na face 6, ganha R$ 5 se resultar na face 5 e não ganha nada com as outras faces. Defina a variável L: lucro por jogada como sendo o saldo que o jogador ganhou menos o pagamento inicial (prejuízo é lucro negativo). Construa a função de probabilidade e determine média, moda, mediana e variância dessa variável. 5. Num teste de digitação, o tempo em minutos (T) que os candidatos levaram para digitar um texto é modelado, de forma aproximada, pela seguinte função de probabilidade: T 3 4 5 6 7 8 9 pi 0,1 0,1 0,2 0,2 0,2 0,1 0,1 O candidato recebe 4 pontos se terminar a digitação em 9 minutos, 5 se terminar em 8 minutos e assim por diante. Determine a média e a variância da variável N: número de pontos obtidos no teste. 6. Um caminho para chegar a uma festa pode ser divido em três etapas. Sem enganos o trajeto é feito em 1 hora. Se enganos acontecerem na primeira etapa, acrescente 10 minutos ao tempo do trajeto. Para enganos na segunda etapa, o acréscimo é 20 e, para terceira, 30 minutos. Admita que a probabilidade de engano é 0.1, 0.2 e 0.3 para a primeira, segunda e terceira etapas, respectivamente. É provável haver atraso na chegada à festa? Determine a probabilidade de haver atraso, e o atraso não passar de 40 minutos. 7. Um pai leva o filho ao cinema e vai gastar nas duas entradas R$ 15. O filho vai pedir para comer pipoca com probabilidade 0.7 e, além disso, pode pedir bala com probabilidade 0.5, independentemente um do outro. Se a pipoca custa R$ 2 e a bala R$ 3, estude o gasto (G) efetuado com o passeio ao cinema. 8. Uma variável aleatória Y tem a seguinte função de distribuição: F(Y ) =            0 se y < 10 0.2 se 10 ≤ y < 12; 0.5 se 12 ≤ y < 13; 0.9 se 13 ≤ y < 25; 1 se y ≥ 25. Determine: a) A função de probabilidade de Y . b) P(Y ≤ 12). c) P(Y < 12). d) P(12 ≤ Y ≤ 20). e) P(Y > 18). 9. Um agricultor cultiva laranjas e também produz mudas para vender. Após alguns meses, a muda pode ser atacada por fungos com probabilidade 0.05 e, nesse caso, ela é escolhida para ser recuperada com probabilidade 0.5. Admita que o processo de recuperação é infalível. O custo de cada muda produzida é R$ 1.00, mas acrescido de mais 50 centavos se precisar ser recuperada. Cada muda é vendida a R$ 3.00 e são descartadas as mudas não recuperadas de ataque de fungos. Estude como se comporta o ganho por muda produzida. 10. Num certo restaurante, paga-se pelo almoço uma quantia fixa dependendo da escolha feita de prato e bebida. A carne de peixe tem 10% de preferência, enquanto o frango tem 40% e carne bovina 50% . As três escolhas de bebida estão condicionadas à opção do prato, segundo a tabela abaixo: Opção: Peixe Cerveja Água Vinho P(Bebida|Peixe) 0.4 0.3 0.3 Opção: Frango Cerveja Água Vinho P(Bebida|Frango) 0.3 0.5 0.2 Opção: Bovina Cerveja Água Vinho P(Bebida|Bovina) 0.6 0.3 0.1 Admita os seguintes preços: Pedido Peixe Frango Bovina Cerveja Água Vinho Preço 12 15 18 6 3 9 a) Dado que alguém escolhe peixe, qual a probabilidade de que escolha cerveja? b) Se escolhe carne bovina, qual a probabilidade de tomar vinho? c) Sabendo que tomou água, qual a chance de ter escolhido frango? 2 . poe *,sEstatistica . . UFPR d) Determine a fungao de probabilidade para cada uma das varidveis X: prego do almogo e Y: prego do almoco para aqueles que preferem cerveja. 11. A resisténcia (em toneladas) de vigas de concreto produzidas por uma empresa, comporta-se conforme a funcgao de probabilidade abaixo: Resisténcia (Y) | 2 3 4 5 6 Di 0.1 O01 O04 O02 0.2 Admita que essas vigas sao aprovadas para uso em construgdes se suportarem pelo menos 3 toneladas. De um grande lote fabricado pela empresa, escolhemos 15 vigas ao acaso. Qual sera a probabilidade de: a) Todas serem aptas para construgdes? b) No minimo 13 serem aptas? 12. Verifique se as expressOes a seguir séo fung6es densidade de probabilidade (assuma que elas se anulam fora dos intervalos especificados). a) f(y) = 3y,seO<y<1. b) f(y) = y?/2, se y = 0. c) fly) =(y—3)/2, se 3 <y <5. d) f(y) =2,se0<y<2. — f(2+y)/4, se -2<y<0; e) ry) = {orale sedQ<y<2. 13. O tempo, em minutos, de digitacéo de um texto por secretarias experientes é uma varidvel aleatéria continua Y. Sua densidade é apresentada a seguir. 1/4, seOQ<y<2; fy= 51/8, se2<y <6; 0, caso contrario. Determine: a) P(Y > 3). b) PO <Y <4). c) P(Y <3|Y > 1). d) Um nimero b tal que P(Y > b) = 0.6. e) O valor esperado, a variancia e a moda de Y. 14. A quantia gasta anualmente, em milhdes de reais, na manutencao do asfalto em uma cidade do interior é representada pela varidvel Y com densidade dada por: 8 4 _ 5-3: se 0.5 <y < 2; f(y) { 0, caso contrario. Obtenha: a) P(Y < 0.8). b) P(Y > 1.5/Y > 1). c) O valor esperado e a variancia de Y. d) A mediana de Y. 15. O grafico abaixo representa a densidade de uma varidvel aleatoria Y. 3 −2 0 2 4 y f(y) a 2a− a) Obtenha o valor de a. b) Determine P(Y > 0|Y < 3). c) Calcule Md(Y ), E(Y ) e V ar(Y ). 16. Numa certa região, fósseis de pequenos animais são frequentemente encontrados e um arqueólogo estabeleceu o seguinte modelo de probabilidade para o comprimento, em centímetros, desses fósseis: f(y) =        1 40y, 4 ≤ y ≤ 8; − 1 20y + 3 5, 8 ≤ y ≤ 10; 1 10, 10 ≤ y ≤ 11; 0, caso contrário. a) Faça um gráfico da função densidade. b) Para um fóssil encontrado nessa região, determine a probabilidade do comprimento ser inferior a 6 centímetros. Determine também a probabilidade de ser superior a 5 mas inferior a 10.5 cm. c) Encontre o valor esperado para o comprimento dos fósseis da região. 17. O setor de emergência de um Pronto Socorro Infantil anotou o número de crianças atendidas (C), de médicos (M) e de auxiliares (A) de plantão em 15 dias de atividade. Os dados são apresentados na tabela abaixo: Dia 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 C 5 7 5 6 5 5 7 5 6 6 7 5 5 6 6 M 1 1 2 2 2 1 2 1 1 2 2 2 2 2 2 A 4 4 5 6 7 7 6 5 5 6 7 7 6 6 7 a) Determine as tabelas de frequência marginais de C, M e A. b) Obtenha a tabela de frequência conjunta entre (C, M), (C, A) e (M, A). c) Represente a tabela de frequência conjunta de M e A, por meio de uma tabela de dupla entrada. d) Calcule a média das variáveis M e A. 18. Para famílias de um certo bairro de São Paulo, apresentamos abaixo a tabela de frequência das variáveis número de automóveis (A) e número de TVs (T). A \T 0 1 2 total 0 110 235 120 465 1 51 122 178 351 2 15 74 162 261 total 176 441 460 1077 a) Calcule as marginais de A e T. 4 b) Determine o valor esperado dessas variáveis. 19. Uma moeda equilibrada é lançada 2 vezes de forma independente. Ao final dos lançamentos, duas variáveis aleatórias são anotadas: o número total de caras (C) e o número de coroas no 2o. lançamento (K). a) Construa uma tabela com os possíveis eventos, as respectivas probabilidades e os valores de C e K. b) Apresente a tabela de dupla entrada com a função de probabilidade conjunta de ambas as variáveis aleatórias C e K. c) Determine o valor esperado de C. 20. Num estudo sobre o tratamento de crises asmáticas, estabeleceu-se a seguinte função conjunta de probabilidades entre o número de crises de asma (A) e o número de internações hospitalares (H). A \H 0 1 2 0 1/8 1/16 0 1 3/16 1/8 1/16 2 1/16 3/16 3/16 a) Determine as funções de probabilidade marginal das variáveis A e H. b) Calcule o valor esperado dessas variáveis. c) Obtenha a função de probabilidade da variável A + H. 21. A função conjunta de probabilidade entre as variáveis X e Y é apresentada abaixo, mas com algumas entradas faltando: X \Y -1 0 2 4 P(X = x) -2 3/64 1/32 5/16 -1 1/16 1/16 0 1 1/64 11/64 1/64 5/16 2 5/64 3/64 1/32 P(Y = y) 5/16 1/4 1 a) Complete a tabela. b) Obtenha as marginais de X e Y . c) Calcule a função de probabilidade da variável X · Y . 22. Na tabela a seguir, encontram-se os conceitos de história (H), matemática (M) e física (F) de alguns alunos do 3o. ano do ensino médio de uma escola: Aluno 1 2 3 4 5 6 7 8 9 10 11 12 H c c c c b b b b b b b a M c c d c b c a c c c c c F d c b c b c c b b c c b a) Construa as tabelas de frequência conjunta para H e M e para H e F. b) Calcule a proporção de alunos com “b” em física, dentre aqueles com pelo menos “c” em matemática. 23. Um levantamento obtido, junto aos funcionários de um pequeno escritório, busca relacionar as variáveis: anos de estudo (X) e número de diferentes emprego nos últimos 5 anos (Y ): X 8 9 10 11 12 Y 4 2 1 2 1 O que você pode dizer sobre os dados fornecidos? 24. Uma amostra de 220 clientes de uma clínica dentária foi selecionada. As variáveis tempo, em anos, decorridos desde a última visita ao dentista (V ) e o número de cáries encontradas (C) são apresentados 5 na tabela a seguir: V \C 0 1 2 1 18 16 10 2 34 45 38 3 12 16 31 Obtenha as tabelas marginais de frequência. 25. A função de probabilidade conjunta entre as variáveis aleatórias X e Y é apresentada a seguir: X \Y -2 0 2 4 -1 0.1 0.2 0.1 0.2 1 0.2 0 0.1 0.1 a) Obtenha as funções de probabilidade marginais das variáveis. b) X e Y são independentes? c) Calcule a covariância e a correlação entre X e Y . 26. Na caixa I existem duas bolas numeradas de 0 e 1, enquanto a caixa II contêm duas bolas numeradas de -1 e 0. Uma bola é retirada aleatoriamente de cada caixa, de forma independente uma da outra. A esse experimento, associamos as variáveis aleatórias: número da bola retirada da caixa I (X), soma dos valores das duas bolas retiradas (Y ) e a diferença, em módulo, desses valores (Z). a) Determine a função de probabilidade conjunta entre X e Y e entre Y e Z. b) Verifique se X e Y são independentes. Faça o mesmo para Y e Z. c) Calcule a covariância entre X e Y . d) Obtenha V ar(X + Y ). 6 Respostas 1. Sendo Y uma variável aleatória, então E(Y ) = −2 · 1/3 + 0 · 1/3 + 2 · 1/3 = 0 Md(Y ) = 0 pois P(Y ≥ 0) = 2/3 ≥ 0.5 e P(Y ≤ 0) = 2/3 ≥ 0.5. Quanto à moda, todos os valores da variável podem ser usados, uma vez que eles são equiprováveis. 2. Considerando os dados: a) Medidas de posição da variável custo (C): E(C) = 1.00 · 0.2 + 1.10 · 0.3 + 1.20 · 0.2 + 1.30 · 0.2 + 1.40 · 0.1 = 1.17 Md(C) = 1.15 pois P(C ≤ 1.10) = 0.50 e P(C ≥ 1.20) = 0.50 Mo(C) = 1.10 pois é o valor que aparece com maior probabilidade. b) Preço de revenda é dado pela função: V = 0.1 + 1.5 · C. Então, a variável pode ser representada em forma de tabela: V 1.6 1.75 1.9 2.05 2.2 pi 0,2 0,3 0,2 0,2 0,1 As medidas de posição de V : E(V ) = 1.86, Md(V ) = 1.83 e Mo(V ) = 1.75. 3. Num certo bairro da cidade de São Paulo, as companhias de seguro estabeleceram o seguinte modelo para número de veículos furtados por semana: Furtos (F) 0 1 2 3 4 pi 1/4 1/2 1/8 1/16 1/16 E(F) = 0 · 1/4 + 1 · 1/2 + 2 · 1/8 + 3 · 1/16 + 4 · 1/16 = 1.19. V (F) = (0−E(F))2·1/4+(1−E(F))2·1/2+(2−E(F))22·1/8+(3−E(F))2·1/16+(4−E(F))2·1/16 = 1.15. 4. Para a variável lucro temos: Lucro (L) -5 0 5 pi 4/6 1/6 1/6 E(L) = −2.5; Mo(L) = −5; V (L) = 14.6 e Md(L) = −5 porque P(L ≤ −5) = 4/6 ≥ 0.5. 5. O candidato recebe 4 pontos se terminar a digitação em 9 minutos, 5 se terminar em 8 minutos e assim por diante. Então, temos que a variável N é dada por: 7 N 10 9 8 7 6 5 4 pi 0,1 0,1 0,2 0,2 0,2 0,1 0,1 O número médio de pontos será: E(N) = 10 · 0.1 + 9 · 0.1 + · · · + 4 · 0.1 = 7. e a variância será: V (N) = (102 · 0.1 + 92 · 0.1 + · · · + 42 · 0.1) − 72 = 3. 6. Sejam os eventos E: engano na etapa. O espaço amostral será: Ω = {(E, E, E), (E, E, Ec), (E, Ec, E), (E, Ec, Ec), (Ec, E, E), (Ec, E, Ec), (Ec, Ec, E), (Ec, Ec, Ec)} Seja a variável aleatória T: tempo total gasto no trajeto. Cada elemento de Ω leva a um tempo total gasto no trajeto T. Ω (E, E, E) (E, E, Ec) (E, Ec, E) (E, Ec, Ec) (Ec, E, E) (Ec, E, Ec) (Ec, Ec, E) (Ec, Ec, Ec) T 120 90 100 70 110 80 90 60 pi 0.006 0.014 0.024 0.056 0.054 0.126 0.216 0.504 A distribuição de probabilidade de T é dada por: T 60 70 80 90 100 110 120 p(T) 0.504 0.056 0.126 0.230 0.024 0.054 0.006 P(atraso) = P(T > 60) = 1 − P(T ≤ 60) = 1 − 0.504 = 0.496. P(atraso ser de até 40 min) = P(60 < T ≤ 100) = 0.056 + 0.126 + 0.230 + 0.024 = 0.436. 7. Suponha que o pai não irá comer guloseimas e defina os eventos: P: o filho pede pipoca; B: o filho pede bala. Defina a variável aleatória G: Gasto efetuado. O espaço amostral deste exercício e a distribuição de probabilidade do gasto são: Ω (P, B) (P c, B) (P, Bc) (P c, Bc) g 20 18 17 15 p(g) 0.7 · 0.5 = 0.35 0.3 · 0.5 = 0.15 0.7 · 0.5 = 0.35 0.3 · 0.5 = 0.15 8. a) Baseado-se na definição de função de distribuição, temos que a função de probabilidades de Y é dada por: Y 10 12 13 25 P(Y = y) 0.2 0.3 0.4 0.1 8 b) P(Y ≤ 12) = F(12) = 0.5. c) P(Y < 12) = F(10) = 0.2. d) P(12 ≤ Y ≤ 20) = P(Y ≤ 20) − P(Y < 12) = F(13) − F(10) = 0.7 e) P(Y > 18) = 1 − P(Y ≤ 18) = 1 − F(18) = 1 − F(13) = 0.1. 9. Seja o evento A: muda atacada por fungos, então P(A) = 0.05. Seja E: muda é escolhida para ser recuperada, então P(E|A) = 0.5. Defina a variável aleatória G: ganho de cada muda produzida. G = 2 se não precisar ser recuperada e P(G = 2) = P(Ac) = 0.95. G = 1.5 se precisar ser recuperada e P(G = 1.5) = P(A ∩ E) = P(A)P(E|A) = 0.025. G = −1 se for descartada e P(G = −1) = P(A ∩ Ec) = P(A)P(Ec|A) = 0.025. Ganho (G) –1 1.5 2 pi 0.025 0.025 0.95 10. a) P(Cerveja|Peixe) = 0.4. b) P(Vinho|Carne Bovina) = 0.1. c) P(Frango|Água) = P (Água|Frango)P (Frango) P (Água) = 0.5·0.4 P (Água) = 0.53 P(Água) = P(Água∩Peixe)+P(Água∩Frango)+P(Água∩Carne Bovina) = 0.03+0.20+0.15 = 0.38. Logo, P(Frango|Água) = 0.2 0.38 = 0.53 d) Sejam os eventos P: a escolha é peixe; F: a escolha é frango e B: para escolha por carne bovina. Sejam os eventos C: a bebida é cerveja; A: a bebida é água e V : a bebida é vinho. Ω (P, C) (P, A) (P, V ) (F, C) (F, A) (F, V ) (B, C) (B, A) (B, V ) preço 18 15 21 21 18 24 24 21 27 p 0.04 0.03 0.03 0.12 0.2 0.08 0.3 0.15 0.05 Função de probabilidade de X: preço do almoço. x 15 18 21 24 27 p(x) 0.03 0.24 0.30 0.38 0.05 e função de probabilidade de Y : preço do almoço para aqueles que preferem cerveja. y = (18, 21, 24) e p(y) =? A probabilidade de uma pessoa escolher cerveja é: P(C) = P(C∩P)+P(C∩F)+P(C∩B) = 0.04+0.12+0.30 = 0.46 9 . poe *,sEstatistica . . UFPR So Cerveja 0.4 ——» R$18 + p=0.04 Peixe 0.1 —————» Agua0.3 ———» R$15 os p=0.03 NG Vinho 0.3 ———> R$21 + p=0.03 So Cerveja 0.3 oe R21 ——» p=0.12 . ———> Frango 0.4 ————> Agua0.5 oo R18 ——» p=0.20 NN Vinho 0.2 rs R24 ——» p=0.08 So Cerveja 0.6 ns R24 ——» p=0.30 Carne Bovina 0.5 ———» Agua0.3 oe R21 ——» p=0.15 NG Vinho 0.1 oe R27 ——» p=0.05 P(P|C) = P(PNC)/P(C) = 0.04/0.46 = 0.09 = P(Y = 18) P(F|C) = P(F NC)/P(C) = 0.12/0.46 = 0.26 = P(Y = 21) P(B\C) = P(BNC)/P(C) = 0.30/0.46 = 0.65 = P(Y = 24) y 18 21 24 p(y) 0.09 0.26 0.65 11. a) Uma viga esté apta para construgéo se suportar pelo menos 3 toneladas. Logo, a probabilidade de qualquer viga estar apta é dada por p = P(X = 3)4+ P(X = 4)4+ P(X =5)+ P(X = 6) = 0.1+0.4+0.2+0.2 = 0.9. Hé n = 15 vigas selecionadas de forma aleatéria na amostra. A probabilidade de todas as 15 (a = 15) vigas estarem aptas é dada pelo produto de estar apta e nao estar apta. Note que queremos 15 aptas, entao p-p...p = p® = 0.91° = 0.206. A probabilidade de nao estar apta é o ntimero total de vigas menos a quantidade de vigas que estéo aptas, entado (1 — p)"~* = (1—0.1)'°~!° =1. Portanto. P(X = 15) = p*(1—p)""* = 0.915(1 — 0.9)°-1> = 0.206 - 1 = 0.206. b) Para que no minimo 13 vigas estejam aptas, entaéo temos que calcular a P(X > 13) = P(X = 13) + P(X = 14) + P(X = 15). Devemos lembrar que a probabilidade de uma tinica viga qualquer estar apta é p= 0.9 e nao estar aptaé q=1—p=1-0.9=0.1. Note que, se queremos 13, 14 ou 15 vigas aptas, elas estarem ou nao aptas pode ocorrer por meio de diversas combinagoes. Logo, devemos levar em consideragéo a combinacéo de n vigas tomadas de x maneiras. A férmula da combinacaéo é dada por (7) = aay: 10 *,4|Estatistica A férmula genérica para o célculo é P(X = 2) = aay" (1 —p)"~*, Entao, P(X > 13) = P(X =13) + P(X = 14) + P(X =15) P(X > 13) = pt — 0.9) 15-13 4 moa (1 — 0.9) 15-14 4 mse — 0.9) 15-15 P(X > 13) = 0.267 + 0.343 + 0.206 P(X > 13) = 0.816. 12. Para ser uma funcaéo de densidade de probabilidade é necessario satisfazer duas propriedades: 1) f(y) 20 I) f° f(y)dy = 1. a) f(y) 20 Vy. Jo 3ydy = 8. b) fy) 20 Vy. Jo wv dy = diverge. c) f(y) 20 Vy. Js tidy = 1. d) f(y) 20 Vy. fo 2dy = 4. e) f(y) 20 Vy. [Py etdy + fo Ftdy = 9 +551 Portanto, temos uma fdp apenas nas letras c) e e). 13. f(y) 20 Vy. Io ryt fp ay = ata E uma funciio de densidade de probabilidade. a) P(Y >3) = fp tdy = 2. b) P(L<Y <4) =f? tdy+ fe tdy=t42=1. c) PY <3IY > 1) = (fp dy + So Say) /(p Gey + Jo tay) = (4 + 8)/G + 9) = 3: d) fy tdy =0.4. Entdo, 4} =0.4e 2 =0.4. Logo, b= 16. e) E(Y)= fo ytdy + Sy ykdy =3=25. V(Y) = E(Y?) - E(Y)?. E(Y?)= fe y? tdy + ft y? sdy = 8 = 9.33. V(Y) = 8 — (8)? = 3.08. Ha um intervalo modal dado em [0,2], sendo Mo(Y) = 1. 11 _ poe *,sEstatistica . . UFPR 14. f(y) 20 Wy. 2 Jos(Sy _ §)dy =1. E uma funciio de densidade de probabilidade. 0.8 a) P(Y <0.8) = fy (8y — §)dy = 0.04. 2 2 b) P(Y > 1.5IY > 1) = (fr 5(§¥ — §)dy)/Ch (Sy — §) dy) = Segaay = 0-625. 2 c) E(Y) = fos y(Sy — §)dy = 1.50. V(Y) = E(X?) —- E(x)? 2 E(Y?) = fou? (Sy — §)dy = 2.375. V(Y) = 2.375 — (1.5)? = 0.125. d) fos(5y — 5 )dy = 0.5. 2 m? m (Ge — o)lé's = (Sie — °°) — Gg — 5) = 0.5. m2 4m (Ai — gt) =0.5 — Fe 8m2—8m _ 7 1s ~ 18° 8m? — 8m = 7. m—-m= Z. m —m— z = 0. As raizes do polindmio sao r; = —0.56 e rg = 1.56. Note que r; esté fora do suporte da varidvel aleatéria. Portanto, a mediana é rg = Md(Y) = 1.56. 15. a se—-2<a”<2; a) f(w@)=< 2a se2<aK<4; 0 caso contrario. Por meio de integral, temos que 5 adx + fe 2adx = 1 az|* 5 + 2ax|§ =1 2a+2a+ 8a-—4da=1 a=. 2 3 2 3 b) P(X > 0|X <3) = (fo gda t+ fy 2dx)/(f7, gd + JS Zdx) = (G+ 5)/(G +5) =F c) E(X) = f?,akde + ff r2da = 15. V(X) = E(X?) — E(X)?. E(X?) = Mr, a? edax + fr a*idx = *2 V(X) = ® — (1.5)? = 3.08. Md(X)= J’, ada = 0.5 Md(X) = ah = 0.5 12 _ poe *,sEstatistica . . UFPR Md(X) = 2+2=0.5 Md(X)=#+2=05 Md(X) = %=0.5-2 Md(X)=F= + Md(X) =m=2. 16. a) oO ql R oO co ° gs co ~ oOo > D uy _ + o A Z o oO — G S ¢) o Po 4 5 6 7 8 g 10 11 y b) P(Y <6) =f? dydy = BiG =F —-£ = _ 1 _ WLI > 4 19 Y7Y = gol6 = 80 80 — 807 80 80~ 4 P(5<Y < 105) = fo? f(y)dy 8 10 10.5 P(5<Y < 10.5) = (fe goydy) + J (-a5y + 3)dy) + ho toy) P(5<Y < 10.5) = 8+ 3 +0.05 = 0.84. 8 10 11 c) EY] = (fp yapydy) + Js y(—aay + 3)dy) + ho Yin dy) = (48) + (8) + (35) = 7.45. < 2 we Min fi 4 |2 0.13 17. a) 6 5 0.33 1 5 0.33 5 3 0.20 , 7 3 0.20 2 10 0.67 6 5 0.33 total | 15 7 total | 15 1 7 5 0.34 total | 15 1 b) Para obter a tabela de frequéncia conjunta, contamos a frequéncia com que os pares de valores 13 aparecem. Temos: (C, M) ni (5, 1) 3 (5, 2) 4 (6, 1) 1 (6, 2) 4 (7, 1) 1 (7, 2) 2 total 15 (C, A) ni (5, 4) 1 (5, 5) 2 (5, 6) 1 (5, 7) 3 (6, 5) 1 (6, 6) 3 (6, 7) 1 (7, 4) 1 (7, 6) 1 (7, 7) 1 total 15 (M, A) ni (1, 4) 2 (1, 5) 2 (1, 7) 1 (2, 5) 1 (2, 6) 5 (2, 7) 4 total 15 c) As frequências conjuntas e marginais podem ser combinadas em uma única tabela de dupla entrada, conforme a tabela a seguir, para as variáveis M e A. M \A 4 5 6 7 total 1 2 2 0 1 5 2 0 1 5 4 10 total 2 3 5 5 15 d) ¯mobs = 1.67 e ¯aobs = 5.88. 18. a) As frequências marginais são dadas pelas margens da tabela de dupla entrada. Portanto, temos: A ni fi 0 465 0.43 1 351 0.33 2 261 0.24 total 1077 1 T ni fi 0 176 0.16 1 441 0.41 2 460 0.43 total 1077 1 b) ¯aobs = 0.81 e ¯tobs = 1.27. 19. a) Eventos Probabilidades C K (cara, cara) 1/4 2 0 (cara, coroa) 1/4 1 1 (coroa, cara) 1/4 1 0 (coroa, coroa) 1/4 0 1 total 1 b) Tabela de dupla entrada: C \K 0 1 P(C = c) 0 0 1/4 1/4 1 1/4 1/4 1/2 2 1/4 0 1/4 P(K = k) 1/2 1/2 1 c) E(C) = 0 × 1/4 + 1 × 1/2 + 2 × 1/4 = 1/2 + 1/2 = 1. 14 20. a) A 0 1 2 P(A = a) 3/16 6/16 7/16 H 0 1 2 P(H = h) 6/16 6/16 4/16 b) E(A) = 1.25 e E(H) = 0.88. c) Função de probabilidade de S = A + H: S 0 1 2 3 4 P(S = s) 1/8 1/4 3/16 4/16 3/16 Para obter a tabela acima pode ser útil construir uma tabela auxiliar com os eventos, probabilidades e valor da variável de interesse. 21. a) Após complementar a tabela temos: X \Y -1 0 2 4 P(X = x) -2 3/32 3/64 1/32 9/64 5/16 -1 1/16 1/16 0 1/16 3/16 1 1/64 11/64 7/64 1/64 5/16 2 5/64 1/32 3/64 1/32 3/16 P(Y = y) 1/4 5/16 3/16 1/4 1 b) Marginais: X -2 -1 1 2 pi 5/16 3/16 5/16 3/16 Y -1 0 2 4 pi 1/4 5/16 3/16 1/4 c) Seja M = X × Y : M -8 -4 -2 -1 0 1 2 4 8 pi 9/64 3/32 5/64 1/64 5/16 1/16 13/64 1/16 1/32 22. a) (H, M) (c, d) (c, c) (b, c) (b, b) (b, a) (a, c) total ni 1 3 5 1 1 1 12 (H, F) (c, d) (c, c) (c, b) (b, c) (b, b) (a, b) total ni 1 2 1 4 3 1 12 b) 4/11. 23. Existe associação. Faça um gráfico dos pares (X, Y ) e calcule ρ(X, Y ) = −0.775. 24. a) Efetuando a soma de linha e de coluna obtemos as marginais: V ni fi 1 44 0.20 2 117 0.53 3 59 0.27 total 220 1 C ni fi 0 64 0.29 1 77 0.35 2 79 0.36 total 220 1 25. a) X -1 1 pi 0.6 0.4 Y -2 0 2 4 pi 0.3 0.2 0.2 0.3 15 b) Para que X e Y sejam independentes, todas a probabilidades conjuntas devem ser iguais ao produto das correspondentes probabilidades marginais. Este não é o caso pois P(X = 1; Y = 0) = 0 ̸= 0.08 = 0.4 × 0.2 = P(X = 1)P(Y = 0). Logo, concluímos que as variáveis não são independentes. c) Para o cálculo de covariância, obtemos E(X) = −0.2; E(Y ) = 1; e E(XY ) = −0.6. Assim, Cov(X, Y ) = E(XY ) − E(X)E(Y ) = −0.4. Para o cálculo da correlação, precisamos obter V (X) e V (Y ). Temos V (X) = 0.96; V (Y ) = 5.8, e, então, ρ(X, Y ) = −0.17. 26. a) (X, Y ) pi (0, -1) 0.25 (0, 0) 0.25 (1, 0) 0.25 (1, 1) 0.25 total 1 (Y, Z) pi (-1, 1) 0.25 (0, 0) 0.25 (0, 2) 0.25 (1, 1) 0.25 total 1 b) X e Y não são independentes. Da mesma forma para Y e Z. Verifique que o produto das marginais não é a conjunta. c) E(X) = 0.5; E(Y ) = 0; E(XY ) = 0.25 e portanto Cov(X, Y ) = 0.25. d) V (X + Y ) = 1.25 (obtenha antes V (X) = 0.25 e V (Y ) = 0.5). 16 Exercícios da Unidade 4 Modelos Probabilísticos Os exercícios foram extraídos dos livros: Bussab, WO; Morettin, PA. Estatística Básica. São Paulo: Editora Saraiva, 2006 (5ª Edição). Magalhães, MN; Lima, ACP. Noções de Probabilidade e Estatística. São Paulo: EDUSP, 2008. 1. Sendo Y uma variável segundo o modelo Uniforme Discreto, com valores no conjunto {1, 2, 3, . . . , 10}, pergunta-se: a) P(Y ≥ 7). b) P(3 < Y ≤ 7). c) P(Y < 2 ou Y ≥ 8). d) P(Y ≥ 5 ou Y ≥ 8) e) P(Y > 3 e Y < 6). f) P(Y ≤ 9|Y ≥ 6). 2. Um usuário de transporte coletivo chega pontualmente às 8 horas para pegar o seu ônibus. Devido ao trânsito caótico, a demora pode ser qualquer tempo entre 1 e 20 minutos (admita que o relógio “pule” de minuto em minuto). Pergunta-se: a) Qual a probabilidade de demorar mais de 10 minutos? b) Qual a probabilidade de demorar pelo menos 5 mas não mais de 10 minutos? c) Qual a probabilidade da demora não chegar a 5 minutos? d) Se um amigo chegou 10 minutos atrasado e vai pegar o mesmo ônibus (que ainda não passou), qual a probabilidade do amigo atrasado esperar até 3 minutos? 3. Sendo Y uma variável aleatória segundo o modelo Binomial com parâmetros n = 15 e p = 0.4, pergunta-se: a) P(Y ≥ 14). b) P(8 < Y ≤ 10). c) P(Y < 2 ou Y ≥ 11). d) P(Y ≥ 11 ou Y > 13). e) P(Y > 3 e Y < 6). f) P(Y ≤ 13|Y ≥ 11). 4. Uma certa doença pode ser curada por meio de procedimento cirúrgico em 80% dos casos. Dentre os que têm essa doença, sorteamos 15 pacientes que serão submetidos à cirurgia. Fazendo alguma suposição adicional que julgar necessária, responda qual é a probabilidade de: a) Todos serem curados. b) Pelo menos dois não serem curados. c) Ao menos 10 ficarem livres da doença. 5. (OPCIONAL) Sendo Y ∼ G(0.4) Calcule: a) P(Y = 3). . poe *,sEstatistica . . UFPR b) P(2<Y <4). c) P(Y > 1Y <2). d) P(Y >1) 6. (OPCIONAL) Uma moeda equilibrada é langada sucessivamente, de modo independente, até que ocorra a primeira cara. Seja Y a varidvel aleatdéria que conta o numero de langamentos anteriores a ocorréncia de cara. Determine: a) P(Y <2). b) P(Y > 1). c) P8<Y <5). d) Quantas vezes deve, no minimo, ser langada a moeda para garantir a ocorréncia de cara com pelo menos 0.8 de probabilidade. 7. A varidvel aleatéria Y tem fungao de probabilidade Poisson com parémetro 4 = 2. Obtenha: a) P(Y <2). b) P(2<Y <4). c) P(Y > 0). d) P(Y =1|Y < 3). 8. A aplicagao de fundo anti-corrosivo em chapas de aco de 1 m? é feita mecanicamente e pode produzir defeitos (pequenas bolhas na pintura) de acordo com uma varidvel aleatéria Poisson de parametro \ = 1 por m*. Uma chapa é sorteada ao acaso para ser inspecionada, pergunta-se a probabilidade de: a) Encontrarmos pelo menos 1 defeito. b) No maximo 2 defeitos serem encontrados. c) Encontrarmos de 2 a 4 defeitos. d) Nao mais de 1 defeito ser encontrado. 9. (OPCIONAL) A varidvel H segue o modelo Hipergeométrico com parémetros n = 10, m=5er=4. Determine: a) P(H = 2). b) P(A <1). c) P(H > 0). 10. (OPCIONAL) Por engano 3 pegas defeituosas foram misturadas com boas formando um lote de 12 pecas no total. Escolhendo ao acaso 4 dessas pecas, determine a probabilidade de encontrar: a) Pelo menos 2 defeituosas. b) No maximo 1 defeituosa. c) No minimo 1 boa. 11. Um laboratério estuda a emissao de particulas de certo material radioativo. Seja: N: ntimero de particulas emitidas em 1 minuto. O laboratério admite que N tem funcaéo de probabilidade Poisson com pardmetro 5, isto é, e7°5k P(N=k)= RP? k =0,1,2,... a) Calcule a probabilidade de que em um minuto nao haja emiss6es de particulas. b) Determine a probabilidade de que pelo menos uma particulas seja emitida em um minuto. c) Qual a probabilidade que, em um minuto, o ntmero de particulas emitidas esteja entre 2 e 5 (inclusive)? 12. Uma vacina contra a gripe é eficiente em 70% dos casos. Sorteamos, ao acaso, 20 dos pacientes vacinados e pergunta-se a probabilidade de obter: a) Pelo menos 18 imunizados. b) No maximo 4 imunizados. c) Nao mais do que 3 imunizados. 2 13. Uma indústria de tintas recebe pedidos de seus vendedores através de fax, telefone e Internet. O número de pedidos que chegam por qualquer meio (no horário comercial) é uma variável aleatória discreta com distribuição Poisson com taxa de 5 pedidos por hora. a) Calcule a probabilidade de mais de 2 pedidos por hora. b) Em um dia de trabalho (8 horas), qual seria a probabilidade de haver 50 pedidos? c) Não haver nenhum pedido, em um dia de trabalho, é um evento raro? 14. (OPCIONAL) Em um estudo sobre o crescimento de jacarés, uma pequena lagoa contém 4 exemplares de espécie A e 5 da espécie B. A evolução de peso e tamanho dos 9 jacarés da lagoa é acompanhada pelos pesquisadores por meio de capturas periódicas. Determine a probabilidade de, em três jacarés capturados de uma vez, obtermos: a) Todos da espécie A. b) Nem todos serem da espécie B. c) A maioria ser da espécie A. 15. Sendo Y ∼ U(0; 4), calcule: a) P(Y > 2). b) P(Y ≥ 2). c) P(1 < Y < 2). d) P(1 < Y < 2|Y < 3). e) P(Y < 3|1 < Y < 2). 16. Admite-se que uma pane pode ocorrer em qualquer ponto de uma rede elétrica de 10 quilômetros. a) Qual é probabilidade da pane ocorrer nos primeiros 500 metros? E de ocorrer nos 3 quilômetros centrais da rede? b) O custo de reparo da rede depende da distância do centro de serviço ao local da pane. Considere que o centro de serviço está na origem da rede e que o custo é de R$ 200 para distâncias até 3 quilômetros, de R$ 400 entre 3 e 8 e de R$ 1000 para as distâncias acima de 8 quilômetros. Qual é o custo médio do conserto? 17. O tempo necessário para um medicamento contra dor fazer efeito foi modelado de acordo com a densidade Uniforme no intervalo de 5 a 15 (em minutos), tendo por base experimentos conduzidos em animais. Um paciente, que esteja sofrendo dor, recebe o remédio e, supondo válido o modelo mencionado acima, pergunta-se a probabilidade da dor: a) Cessar em até 10 minutos? b) Demorar pelo menos 12 minutos? c) Durar mais de 7 minutos, sabendo-se que durou menos de 10? 18. Suponha que o valor esperado de uma variável aleatória com distribuição Uniforme contínua é 1 e a variância é igual a 1/12. Encontre a probabilidade da variável assumir valores menores que 3/4. 19. Sendo Y ∼ Exp(1), determine: a) P(0 < Y < 2). b) P(Y < 2). c) P(1 < Y < 4). d) P(Y > 3). e) P(Y < 2|Y > 1). 20. Suponha que o tempo de vida T de um vírus exposto ao meio ambiente segue uma distribuição Exponencial com parâmetro λ = 1/20 s. Calcule a probabilidade condicional P(T > 15|T > 10). 21. Seja Y ∼ N(4, 1). Determine: a) P(Y ≤ 4). b) P(4 < Y < 5). 3 c) P(2 ≤ Y < 5). d) P(5 ≤ Y ≤ 7). e) P(Y ≤ 1). f) P(0 ≤ Y ≤ 2). 22. Um indivíduo vai participar de uma competição que consiste em responder questões que são apresentadas sequencialmente. Com o nível de conhecimento que possui, a chance de acertar uma questão escolhida ao acaso é de 75% . Neste contexto, para cada diferente situação apresentada a seguir, defina a variável aleatória, sua distribuição de probabilidades e calcule a probabilidade solicitada. Se preciso, faça suposições necessárias e adequadas em cada caso. a) (OPCIONAL) Se for responder até errar uma pergunta, qual a probabilidade de conseguir acertar quatro ou mais questões? b) Se for responder cinco perguntas, qual a probabilidade de acertar quatro ou mais? c) (OPCIONAL) Se for responder até acertar a terceira pergunta, qual a probabilidade de errar apenas uma? d) (OPCIONAL) Se o candidato selecionar aleatoriamente seis questões de um banco de 40 questões das quais o candidato sabe a resposta de 30 delas (75%), qual a probabilidade de acertar ao menos cinco delas. Ainda, neste contexto, considere que o candidato responde, em média, 1,8 questões por minuto. e) Qual a probabilidade de conseguir responder ao menos três questões em três minutos? f) Qual a probabilidade de que o tempo para resposta de uma questão seja superior a 40 segundos? 23. A durabilidade de um tipo de filtro é descrita por uma variável aleatória com distribuição normal de média 60.000 hrs de funcionamento e desvio padrão de 9.000 hrs. a) Se o fabricante garante a duração dos filtros pelas primeiras 47.500 hrs, qual a proporção de filtros que devem ser trocados pela garantia? b) O que aconteceria com a proporção do item anterior se a garantia fosse para as primeiras 45.000 hrs? c) Qual deveria ser a garantia (em hrs) de forma a assegurar que o fabricante trocaria sob garantia no máximo 4% dos filtros? d) Se uma indústria comprar cinco (5) filtros, qual será a probabilidade de utilizar a garantia (de 45.000 horas) para trocar ao menos um (1) dos filtros? 24. Na comunicação entre servidores, uma mensagem é dividida em n pacotes, os quais são enviados na forma de códigos. Pelo histórico da rede, sabe-se que cada pacote tem uma probabilidade de 0.01 de não chegar corretamente a seu destino e, além disto, assume-se que o fato de um pacote chegar ou não corretamente ao destino não altera a probabilidade de chegada correta de outros pacotes. Um programa corretivo garante o envio correto da mensagem quando o número de pacotes enviados erroneamente não passar de 10% do total de pacotes da mensagem. a) Qual a probabilidade de uma mensagem composta de 20 pacotes ser enviada corretamente? b) E para uma mensagem de 200 pacotes? 25. Em um laticínio, a temperatura ideal do pasteurizador deve ser de 75◦C. Se a temperatura ficar inferior a 70◦C, o leite poderá ficar com bactérias indesejáveis ao organismo humano. Observações do processo mostram que, na forma de operação atual, os valores da temperatura seguem uma distribuição normal com média de 74.2◦C e desvio padrão de 2.2◦C. a) Qual a probabilidade da temperatura ficar inferior a 70◦C? b) Qual a probabilidade da temperatura ultrapassar os 75◦C desejados? c) Qual a probabilidade de que, em 20 pasteurizações, alguma(s) dela(s) não atinja(m) a temperatura de 70◦C? d) Deseja-se regular equipamentos para alterar a temperatura média do processo para que a proba- bilidade de ficar inferior a 70◦C seja de, no máximo, 0.0005. Qual deveria ser a nova média de operação? 4 e) Suponha, agora, que a nova média de operação seja de 74.5◦C. Deseja-se alterar o desvio padrão para satisfazer as condições do item anterior. Qual deve ser o novo desvio padrão de operação? 26. Suponha que em uma linha de produção, a probabilidade de se obter uma peça defeituosa é igual a 0.1. Uma amostra de 10 peças foi retirada aleatoriamente para inspeção. a) Para responder aos próximos itens, defina a variável aleatória de interesse e identifique-a com alguma das principais distribuições de probabilidade; b) Qual a probabilidade de na inspeção encontrar 3 peças defeituosas? c) Qual a probabilidade de que, pelo menos, 9 peças sejam perfeitas? d) Qual o número esperado de peças defeituosas? E o desvio padrão do número de peças defeituosas? 27. A probabilidade de um atirador acertar em um alvo é 0.8. a) Se o atirador dispara 5 vezes, qual a probabilidade de acertar no alvo pelo menos 3 vezes? b) Em 7 disparos, calcule: i) o número mais provável de disparos certeiros; ii) o número esperado de disparos certeiros. 28. Seja Z uma variável aleatória com distribuição Normal(0,1). Encontre o valor de z tal que: a) P(Z > z) = 0.119 b) P(Z < z) = 0.8051 29. A vida média de um teodolito é de 3 anos com desvio padrão de 0.61. Supondo que a vida útil dos teodolitos siga uma distribuição Normal, é razoável um prazo de garantia de 2.5 anos para este aparelho? 30. A quantidade de urânio de uma formação argilosa possui média igual a 95 u.m. e desvio padrão igual a 7.5 u.m. Sabendo-se que Y (quantidade de urânio numa amostra aleatória dessa formação) é uma variável aleatória com distribuição Normal, ache a quantidade b tal que: a) P(Y > b) = 0.2611 b) P(Y < b) = 0.9750 31. O tempo de espera para cada cliente que entra na fila do caixa de uma loja, segue uma distribuição de probabilidade exponencial com taxa igual a 0.2 por minuto. Calcule: a) o tempo médio de espera e o desvio padrão do tempo de espera; b) a probabilidade de um cliente selecionado ao acaso, ficar até 20 minutos na fila; c) e a probabilidade dele ficar na fila mais tempo que a média. 32. É sabido que, para homens adultos com boa saúde, em certa população, a temperatura corporal segue uma distribuição normal com média 36.8o C e desvio padrão 0.15o C. a) Se considerarmos 1000 homens adultos sadios dessa população, esperaríamos quantos com temper- atura entre 36.8o C e 37.2o C? b) Em qual intervalo de temperaturas estão 98% dos homens adultos sadios dessa população? (considere intervalos simétricos em torno da média) 5 _ poe *,sEstatistica . . UFPR Respostas 1. Sendo Y uma varidvel segundo o modelo Uniforme Discreto, com valores no conjunto {1, 2, 3,... , 10}, pergunta-se: a) P(Y >7)=P(Y =7)4+P(Y =8)4+ P(Y =9)4+ P(Y = 10) =4- io = 0.4. b) P(8<Y <7)=P(¥Y =4)+P(Y =5)+P(Y =6)+ P(Y =7) =4: 7 = 04. c) P(Y <20uY >8)=P(Y < 2)+P(Y >8)=P(Y =1)+P(Y =8)+P(Y =9)+ P(Y = 10) = 0.4. d) P(Y >5ouY >8)=P(Y >5)= 7% =06. e) P(Y >3eY <6)=P(3<Y <6)=P(Y =4)+P(Y =5) = 4% =02. f) P(6<Y <9 P(Y <9|Y >6) = Seeeey _ P(Y =6)+P(Y=7)+P(Y=8)+P(Y=9) = PA SOF PO SD FPO =8)F PW =9)FP(V=10) = 5/10 = 0.8. 2. Um usuario de transporte coletivo chega pontualmente as 8 horas para pegar o seu 6nibus. Devido ao transito cadtico, a demora pode ser qualquer tempo entre 1 e 20 minutos (admita que o relégio “pule” de minuto em minuto). Pergunta-se: D : tempo de espera, D ~ Up(1, 20) dé {0,1,2,--- , 20} P(D =d) = 1/20 a) Qual a probabilidade de demorar mais de 10 minutos? P(D > 10) = P(D = 11) 4+---+ P(D = 20) = 10/20 = 0.5. b) Qual a probabilidade de demorar pelo menos 5 mas nao mais de 10 minutos? P(5< D< 10) = P(D =5)+P(D =6)+P(D = 7)+P(D = 8)+P(D = 9)+P(D = 10) = 6/20 = 0.3. c) Qual a probabilidade da demora nao chegar a 5 minutos? P(D <5) =P(D=1)4+---+ P(D = 4) = 4/20 = 0.2. d) Se um amigo chegou 10 minutos atrasado e vai pegar o mesmo 6nibus (que ainda nao passou), qual a probabilidade do amigo atrasado esperar até 3 minutos? P(10 < D< 13) 3/20 P(D < 13|D > 10) = —~———— _ = —— _ =0.3. (Ds 13 ) P(D > 10) 10/20 3. Sendo Y uma varidvel aleatéria segundo o modelo Binomial com parémetros n = 15 e p = 0.4, pergunta-se: Y ~ 0(15, 0.4). 15 15— P(Y =y)= -0.4¥ -0.6°°-¥, para y = 0,1,2,--- ,15. y a) P(Y > 14)= P(Y = 14) 4+ P(Y = 15) =0. b) P(8<Y <10) = P(Y =9)+P(Y = 10) = 0.086. 6 _ poe *,sEstatistica . . UFPR 9) P(Y <2o0uY > 11) = P(Y =0)+P(Y =1)4+P(Y =11)+P(Y = 12)4+.---+P(Y = 15) = 0.015. d) P(Y > 11 ou Y > 13) = P(Y > 11) = P(Y =11)+---+ P(Y = 15) = 0.009. e) P(Y >3eY <6)=P(3<Y <6)=P(Y =4)+P(Y =5) =0.313. f) PA1L<Y<1 P(Y < 13|Y > 11) = PL <¥Y < 13) P(Y > 11) _ P(Y =11)4+ P(Y = 12)4+ P(Y = 13) ~ P(Y =11)+ P(Y = 12)4+ P(Y =13) + P(Y = 14) + P(Y = 15) __ 0.00932 ~ 0.00935 = 0.9968. 4. Uma certa doenca pode ser curada através de procedimento cirtirgico em 80% dos casos. Dentre os que tém essa doeng¢a, sorteamos 15 pacientes que seréo submetidos a cirurgia. Fazendo alguma suposicaéo adicional que julgar necessdria, responda qual é a probabilidade de: Y : ntmero de pacientes curados p: probabilidade de um paciente curar p=0.8 n=15 Y ~ 0(15, 0.8). a) Todos serem curados? 15 15 15-15 P(Y =15)= 15 -0.8°° - 0.2 = 0.035. b) Pelo menos dois nao serem curados? P(Y <13)=1-—P(Y > 13) =1-(P(Y = 14)4+ P(Y = 15)) = 0.833. c) Ao menos 10 ficarem livres da doenga? P(Y > 10) = P(Y =10)4+---+ P(Y = 15) = 0.939. 5. (OPCIONAL) Uma varidvel aleatéria com distribuicgéo de probabilidades geométrica pode ser definida de duas maneiras alternativas na literatura e implementacgdes computacionais. E importante saber desta possibilidade para poder usar corretamente cada material. A primeira delas é: X :ntmero de “fracassos” até o primeiro “sucesso” X ~ G(p) em que p é a probabilidade do “sucesso” x € {0,1,2---}. Neste caso a distribuicaéo de probabilidades é dada por: P(X =x) =(1—p)*p. 7 A segunda é (para evitar confusão vamos denotar agora a variável aleatória por outra letra): Y : número total de “tentativas” até o primeiro “sucesso” Y ∼ G(p) em que p é a probabilidade do “sucesso” y ∈ {1, 2, · · · }. Neste caso a distribuição de probabilidades é dada por: P(Y = y) = (1 − p)y−1p. As duas levam aos mesmos resultados. Por exemplo, seja lançar um dado até obter a face 6 pela primeira vez. A probabilidade de se conseguir na terceira tentativa pode ser calculada definindo: (i) o número de “fracassos’ ’ seria então 2: P(X = 2) = (1 − 1/6)2(1/6). (ii) o número de “tentativas’ ’ seria então 3: P(Y = 3) = (1 − 1/6)3−1(1/6). e, portanto, a mesma resposta. O mesmo é válido na definição de uma variável com distribuição binomial negativa. Sendo uma variável aleatória Y ∼ G(0.4) definida como número de “fracassos” até o primeiro “sucesso”, calcule: a) P(Y = 3) = 0.4 · 0.63 = 0.0864. b) P(2 ≤ Y < 4) = P(Y = 2) + P(Y = 3) = 0.23. c) P(Y > 1|Y ≤ 2) = P(1 < Y ≤ 2) P(Y ≤ 2) = P(Y = 2) P(Y ≤ 2) = 0.184. d) P(Y ≥ 1) = 1 − P(Y = 0) = 0.6. 6. (OPCIONAL) Uma moeda equilibrada é lançada sucessivamente, de modo independente, até que ocorra a primeira cara. Seja Y a variável aleatória que conta o número de lançamentos anteriores à ocorrência de cara. Determine: Y : número de lançamentos anteriores à ocorrência de cara Y ∼ G(0.5), y = {0, 1, · · · } P(Y = y) = (1 − p)yp. a) P(Y ≤ 2) = P(Y = 0) + P(Y = 1) + P(Y = 2) = 0.5 · 0.50 + 0.5 · 0.51 + 0.5 · 0.52 = 0.875. b) P(Y > 1) = 1 − (P(Y = 0) + P(Y = 1)) = 0.25. c) P(3 < Y ≤ 5) = P(Y = 4) + P(Y = 5) = 0.047. d) Quantas vezes deve, no mínimo, ser lançada a moeda para garantir a ocorrência de cara com pelo menos 0.8 de probabilidade. L : número total de lançamentos até ocorrência de cara. l 1 2 3 4 · · · y 0 1 2 3 · · · py 0.5 0.25 0.12 0.06 · · · 8 _ poe *,sEstatistica . . UFPR Para obter o nimero minimo de langamentos da moeda para garantir a ocorréncia de cara com no minimo 0.8 de probabilidade, precisamos obter | = y +1 tal que P(Y < y) > 0.80. Temos que P(Y <1) =P(X =0)4+ P(X = 1) = 0.75 < 0.8, e que P(Y <2)=P(Y =0)4+ P(Y =1)4+ P(Y = 2) = 0.875. Logo, o nimero de langamentos minimos necessarios é 1 = y+ 1=3. 7. A varidvel aleatéria Y tem fungao de probabilidade Poisson com parémetro 4 = 2. Obtenha: Y ~ Po(A = 2). A\y 2.9Y P(Y =y)= — = — a) P(Y <2) =P(Y =0)+ PY =1) = 4+ 2 ' — 0.406. b) P(2<Y <4) =P(Y =2)+P(Y =3) =0.451. c) P(Y > 0) =1-—P(Y <0) =1-P(Y =0) = 0.865. P(Y=1 d) PY =1/Y <3) = py SR = 04. 8. A aplicacdo de fundo anti-corrosivo em chapas de aco de 1 m? é feita mecanicamente e pode produzir defeitos (pequenas bolhas na pintura), de acordo com uma varidvel aleatéria Poisson de parametro \ = 1 por m?. Uma chapa é sorteada ao acaso para ser inspecionada, pergunta-se a probabilidade de: Y ~ Po(A = 1). ely P(Y =y)= a) Encontrarmos pelo menos 1 defeito. el . 19 P(> 1) =1-PY <1)=1- PY =0)=1—- —— = 0.632. b) No maximo 2 defeitos serem encontrados. P(Y <2)=P(Y =0)4+ P(Y =1)4+ P(Y = 2) = 0.92. c) Encontrarmos de 2 a 4 defeitos. P(2<Y <4)=P(Y =2)+P(Y =3)+ P(Y =4) = 0.261. d) Nao mais de 1 defeito ser encontrado. P(Y <1)=P(Y =0)4+ P(Y = 1) = 0.736. NT OOO™~™~™~C— 9. (OPCIONAL) A varidvel H segue o modelo Hipergeométrico com pardmetros »#—5, n = 5er = 4. Determine: m=10 H ~ HG(m=5,n =5,r = 4). h = {mazx(0,4 —5),--- ,min(4,5)} = {0,--- , 4}. m n 5 10 5 pet =n) = lea) _ IN £0. (ty ("") 4 (a) 9 _ poe *,sEstatistica . . UFPR 5 (2) (22) a) P(H =2)= ee. rns) = 0.33 4 4 b) P(H <1) = P(H =0)+4+ P(A = 1) = Q262. 0.0769 c) P(H > 0) =1-—P(H =0) = 0-976. 0.996 10. (OPCIONAL) Por engano 3 pecas defeituosas foram misturadas com boas formando um lote de 12 pecas nos total. Escolhendo ao acaso 4 dessas pecas, determine a probabilidade de encontrar: D :ntmero de pecas defeituosas dentre as 4. Dw~ HG(n = 9,m = 3,r = 4), d = {0, 1, 2, 3, 4}. m n 3 9 pip a) ~ Nera) _ 2) ae) ow) a) Pelo menos 2 defeituosas. 3\/ 9 3\( 9 _ _ _ yy _ 1. Wed — MG2) _ P(D > 2) =1—P(D <2) =1-—(P(D=0) + P(D =1)) =1— >a - Sop = 0.236. Cr) Cr) b) No maximo 1 defeituosa. P(D <1) = P(D =0)+ P(D = 1) = 0.764. c) No minimo 1 boa. P(No minimo 1 boa) = P(D < 3) =1. 11. Um laboratério estuda a emissao de particulas de certo material radioativo. Seja: N: ntimero de particulas emitidas em 1 minuto. O laboratério admite que N tem funcaéo de probabilidade Poisson com pardmetro 5, isto é, e7O5* P(N=k)= ai k =0,1,2,... a) Calcule a probabilidade de que em um minuto nao haja emiss6es de particulas. —550 P(N =0)= > = 0.007. b) Determine a probabilidade de que pelo menos uma particula seja emitida em um minuto. P(N > 1) =1-— P(N = 0) = 0.993. c) Qual a probabilidade que, em um minuto, o ntmero de particulas emitidas esteja entre 2 e 5 (inclusive)? P(2<N<5)=P(N =2)+ P(N =3)4+ P(N =4)4+ P(N =5) = 0.576. 12. Uma vacina contra a gripe é eficiente em 70% dos casos. Sorteamos, ao acaso, 20 dos pacientes vacinados e pergunta-se a probabilidade de obter: Y : ntmero de pacientes imunizados dentre 20 pacientes vacinados. Y ~ W(n = 20, p = 0.7), y = {0,1,--- , 20}. 20 PY =y)= ( ) 0.7% + 0.37074, y 10 _ poe *,sEstatistica . . UFPR a) Pelo menos 18 imunizados. P(Y > 18) = P(Y = 18)4+ P(Y =19)+ P(Y = 20) = 0.0355. b) No maximo 4 imunizados. P(Y <4) =P(Y =0)+---+P(Y =4) =5.55 x 10°°. c) Nao mais do que 3 imunizados. P(Y <3) =P(Y =0)+---+P(Y =3) =5.43 x 1077. 13. Uma indistria de tintas recebe pedidos de seus vendedores através de fax, telefone e Internet. O nimero de pedidos que chegam por qualquer meio (no hordario comercial) é uma varidvel aleatéria discreta com distribuigéo Poisson com taxa de 5 pedidos por hora. Y : nimero de pedidos. Y ~ Po(5),y = {0,1,2,-+- }. e7°5Y P(Y =y)= a a) Calcule a probabilidade de mais de 2 pedidos por hora. P(Y >2)=1-P(Y <2) =1-(P(Y =0)4+ P(Y =1)+ P(Y = 2)) = 0.875. b) Em um dia de trabalho (8 horas), qual seria a probabilidade de haver 50 pedidos? Considere A=5-8=40. 404950 eo P(Y =50) = ——— =0.018. ( ) 50! Dica: para facilitar os cdlculos use a transformacao log (logaritmo natural) logP(Y =50) =log(e~*°) + log(40°°) — log(50 - 49 --- 1) = —4A0 - log(e) + 50 - log(40) — (log50 + log49 + --- + log1) = —40 + 50 - 3.69 — 148.48 = —3.98. Entao, P(Y = 50) = e~ 3-8 = 0.0187. c) Nao haver nenhum pedido, em um dia de trabalho, 6 um evento raro? Considere = 40. e—4040° P(Y =0)= a. = 0. 14. (OPCIONAL) Em um estudo sobre o crescimento de jacarés, uma pequena lagoa contém 4 exemplares de espécie A e 5 da espécie B. A evolugdo de peso e tamanho dos 9 jacarés da lagoa é acompanhada pelos pesquisadores através de capturas periddicas. Determine a probabilidade de, em trés jacarés capturados de uma vez, obtemos: Y : ntimero de jacarés da espécie A. Y ~ HG(m =4,n = 5,r = 3). 4\( 5 _ _ (,) (3°) _ P(Y =y)= sah ~—SCCépara yy = 0,1,2,3. ("5") a) Todos da espécie A. 4\( 5 P(X =3)= G(s) = 0.048. ("5") 11 _ poe *,sEstatistica . . UFPR b) Nem todos serem da espécie B. 4) (5 _ Ce P(X > 0) =1-— P(X =0) =1-— —j— = 0.881, (3) 4 5 que é equivalente a P(X° 4 3) =1— P(X° =3)=1- lfges) = 0.881. 3 c) A maioria ser da espécie A. 4) (5 4) (5 + P(X > 2) = P(X =2)+ P(X =3)= ()o°2) + (9) (03) = 0.405. (3) 15. Sendo Y ~ U(0;4), calcule: 1 4 a) P(Y > 2)= Jy f(y)dy = 4\2 = g(4— 2) = 1/2. b) P(Y >2)= P(Y > 2) =1/2. c) P< Y <2)= f? f(y)dy = ¥[? = 402-1) = 1/4. _ P(U<Y<2)_ 1/4 fd fh d) PL<Y <2\Y <3) = yay = Fr ranay ~ WA = aya = 1/3. ce) P(Y <3|/1< ¥ <2) = FESS gL 16. Admite-se que uma pane pode ocorrer em qualquer ponto de uma rede elétrica de 10 quilémetros. Y : ocorre a pane em qualquer ponto da rede. Y ~ U(0,10). 1 S-—- < < 1 . fy)=7p VSysl0 a) Qual é probabilidade da pane ocorrer nos primeiros 500 metros? E de ocorrer nos 3 quilémetros centrais da rede? 0.5 4 Y 08 P(Y <0.5) = —dy = —=|9° = 0.5/10 = 0. (Y < 0.5) [ 10 Y 19 (0 0.5/10 = 0.05 ° 4 P(3.5<Y <6.5) = | —dy = 3/10 3 10 b) O custo de reparo da rede depende da distancia do centro de servico ao local da pane. Considere que o centro de servico esta na origem da rede e que o custo é de R$ 200 para distancias até 3 quilémetros, de R$ 400 entre 3 e 8 e de R$ 1000 para as distancias acima de 8 quildmetros. Qual é o custo médio do conserto? Considere a varidvel C: Custo de reparo. Entao, C | 200 400 1000 Pe | Pi P2 P3 5 py = P(C = 200) = P(Y <3) = | 0 tv = 3/10 = 0.3. 0 S41 po = P(C = 400) = PB <¥ <8) = [ 9 ty = 8/10 = 0.5 3 p3 = P(C = 1000) = P(Y > 8) = | T0 = 2/10 =0.2 8 12 _ poe *,sEstatistica . . UFPR E(C) = 200- p; + 400 - po + 1000 - p3 = 460 17. O tempo necessario para um medicamento contra dor fazer efeito foi modelado de acordo com a densidade Uniforme no intervalo de 5 a 15 (em minutos), tendo por base experimentos conduzidos em animais. Um paciente, que esteja sofrendo dor, recebe 0 remédio e, supondo valido o modelo mencionado acima, pergunta-se a probabilidade da dor: T : tempo até medicamento fazer efeito. T ~ U(5, 15). 1 t) = ——,5<t< 15. MO = BESS a) Cessar em até 10 minutos? 10 10 1 PIT < 10) [ fiat = | —dt = 5/10 = 1/2. 5 5 10 b) Demorar pelo menos 12 minutos? P(T > 12)= / —dt = 3/10. 12 10 c) Durar mais de 7 minutos, sabendo-se que durou menos de 10? 10 P(7<T< 10 1/10dt 3/10 pr > rir < 10) = PUST<1) _ fy ANOdt _ 3/10 _ 5, P(T < 10) Jz 1/1odt 5/10 18. Suponha que o valor esperado de uma varidvel aleatéria com distribuicéo Uniforme continua é lea varidncia é igual a 1/12. Encontre a probabilidade da varidvel assumir valores menores que 3/4. Y ~ U(a, 6) b E(Y)=1= a (b— a)? 2 2 Var(Y) =1/12= 3 (2 — 2a)” = 1 > (4a* — 8a+ 3) =0 Resolvendo esta equacgaéo temos quea = 0.5eb=1.5 oua=1.5eb=0.5. Como (a < b) entao a solugdo é Y ~ U(0.5, 1.5). 0.75 1 PY <3/4)= ——— dy = 0.25. (¥ < 3/4) [. 15-05." 19. Sendo Y ~ Exp(1), determine: fy) =e", y 20 a) P(O<Y <2)= fee Ydy = —e7¥|3 = ec? + =1—e-? = 0.865. b) P(Y <2) = fo e%dy = e742 = —e~? + 1 = 0.865. c) PAL<Y <4)= fo e-Ydy = —e~¥|f = —e~4 + 7! = 0.35. d) P(Y >3)=1-P(Y <3) =0.05. P(1<Y e) P(Y <2 > 1) = 20552) = 0.632. 13 _ poe *,sEstatistica . . UFPR 20. Suponha que o tempo de vida T de um virus exposto ao meio ambiente segue uma distribuicaéo Exponencial com paraémetros \ = 1/20 s. Calcule a probabilidade condicional P(T > 15|T > 10). T ~ Exp(1/20) f(t) =1/20-e"F/% 4 >0 P(T>15) fie 1/20-e"9/?%'dt 0.472 P(T > 15|T > 10) = ————_~ = - 0.779 (T > 15|P > 10) = Ser S40) [= 1/20-e- C720" at — 0.607 21. Seja Y ~ N(4,1). Determine: F( ) 1 _ (y=n)? = ——eEe Qo2 y oV 2a a) PY <4) =f", f(y)dy = 05. b) P(4<Y <5)=P(Y <5)—P(Y <4) =0.341. c) P2<Y<5)=P(Y <5)—P(Y < 2) = 0.819. d) P(<Y <7)=P(Y <7)—P(Y <5) =0.157. e) P(Y <1) = 0.001. f) PO<Y <2) =0.023. 22. Um individuo vai participar de uma competicao que consiste em responder quest6es que séo apresentadas sequencialmente. Com o nivel de conhecimento que possui, a chance de acertar uma questao escolhida ao acaso é de 75% . Neste contexto, para cada diferente situacéo apresentada a seguir, defina a varidvel aleatéria, sua distribuigaéo de probabilidades e calcule a probabilidade solicitada. Se preciso, faca suposic6es necessaérias e adequadas em cada caso. a) (OPCIONAL) Se for responder até errar uma pergunta, qual a probabilidade de conseguir acertar quatro ou mais quest6es? Y : Numero de acertos até o primeiro erro. Y ~ G(0.25). 3 . P(Y >4)=1-P(Y <3) =1— 5 /(1—0.25)'(0.25) = 0.316. i=0 b) Se for responder cinco perguntas, qual a probabilidade de acertar quatro ou mais? Y : Numero de acertos em cinco perguntas. Y ~ b(n =5,p = 0.75). 5 5 , , P(Y >4)=P(Y =4)+P(Y =5)=)> (Fors — 0.75)°-? = 0.633. i=d c) (OPCIONAL) Se for responder até acertar a terceira pergunta, qual a probabilidade de errar apenas uma? Y : Numero de erros até o terceiro acerto. Y ~ BN(r = 3, p = 0.75). 34+1-1 P(Y =1)= ( 3 1 Jost — 0.75)! = 0.316. 14 _ poe *,sEstatistica . . UFPR d) (OPCIONAL) Se o candidato selecionar aleatoriamente seis quest6es de um banco de 40 questées das quais o candidato sabe a resposta de 30 delas (75%), qual a probabilidade de acertar ao menos cinco delas. Y : Numero de acertos nas seis questdes selecionadas. Y ~ HG(30, 10,6). OD (29) P(Y >5) = P(Y =5)+P(Y =6) => +48 = 0.526. i=5 ( 6 ) Ainda neste contexto considere que o candidato responde, em média, 1.8 quest6es por minuto. e) Qual a probabilidade de conseguir responder ao menos trés questées em trés minutos? Y : Numero de quest6es respondidas em 3 minutos. Y ~ Po(A = 3-1.8 = 5.4). *\ 0745.4) PIV 23) =1— PIV $2) = 1) 7 = 0.905 f) Qual a probabilidade de que o tempo para resposta de uma questdo seja superior a 40 segundos? Y : tempo (em min.) para responder uma questao. Y ~ Exp(A = 1.8). P(Y > 40/60) = | 1.8e7!8¥dy = 0.301. 40/60 23. A durabilidade de um tipo de filtro é descrita por uma varidvel aleatéria com distribuigéo normal de média 60.000 horas de funcionamento e desvio padrao de 9.000 horas. Y ~ N(60.000, 9.0007) a) Se o fabricante garante a duracao dos filtros pelas primeiras 47.500 horas, qual a propor¢ao de filtros que devem ser trocados pela garantia? 47500 — 60000 P(Y < 47500) = P(Z < —oo00 = P(Z < —1.389) = 0.082. b) O que aconteceria com a proporgao do item anterior se a garantia fosse para as primeiras 45.000 horas? 45000 — 60000 P(Y < 45000) = P(Z < —oo00 = P(Z < —1.667) = 0.048. c) Qual deveria ser a garantia (em hrs) de forma a assegurar que o fabricante trocaria sob garantia no maximo 4% dos filtros? P(Y <t)=0.04 ; t=? t — 60000 P(Z < ——— ) = 0.04 (2 < ~Go99) = 9° z= -1.751. t — 60000 —— = -1.751 9000 t = 60000 + 9000(—1.751) t = 4,4243825 x 104. 15 . poe *,sEstatistica . . UFPR d) Se uma indtstria comprar cinco (5) filtros, qual sera a probabilidade de utilizar a garantia (de 45.000 horas) para trocar ao menos um (1) dos filtros? Y : ntimero de trocados sob garantia dentre 5 comprados . Y ~ W(n =5,p = P(Y < 45000) = 0.048). P(Y >1)=1-P(Y =0) = 0.217. 24. Na comunicacéo entre servidores, uma mensagem é dividida em n pacotes, os quais séo enviados na forma de cdédigos. Pelo histérico da rede sabe-se que cada pacote tem uma probabilidade de 0.01 de nao chegar corretamente a seu destino, e além disto, assume-se que o fato de um pacote chegar ou nao corretamente ao destino nao altera a probabilidade de chegada correta de outros pacotes. Um programa corretivo garante o envio correto da mensagem quando o ntimero de pacotes enviados erroneamente nao passar de 10% do total de pacotes da mensagem. a) Qual a probabilidade de uma mensagem composta de 20 pacotes ser enviada corretamente? Y : ntimero de pacotes incorretos em 20 pacotes. Y ~ 0(n = 20, p = 0.01). limite : 10% de 20 pacotes = 2 pacotes. 2 20 P(Y <2)=P(¥Y =0) + P(Y =1)+ P(Y =2)=)> ( Joona — 0.01)?°-¥ = 0.999. y 0 b) E para uma mensagem de 200 pacotes? X ~ b(n = 200, p = 0.01) & P(A =n-p = 200- 0.01 = 2). x N(u=n-p=2,07 =n-p-(1—p) = 1.98). A aproximacéo normal nao é muito acurada pois np < 5, porém conveniente limite : 10% de 200 pacotes = 20 pacotes. P(Y < 20) = P(Y =0)+ P(Y =1)+...+P(Y = 20) = 20 20 200 ~2 Qu 20.5 — 2 => ( )oora — 0.01)? Y = S > ©" ~ P(Yy < 20.5) = P(Z < —2=*) 2x1. 0 NY 7 V1.98 25. Em um laticinio, a temperatura ideal do pasteurizador deve ser de 75°C. Se a temperatura ficar inferior a 70°C, o leite podera ficar com bactérias indesejaveis ao organismo humano. Observacées do processo mostram que na forma de operacéo atual os valores da temperatura seguem uma distribuigéo normal com média de 74.2°C e desvio padrao de 2.2°C. Y : temperatura do pasteurizador. Y ~ N(74.2; 2.27). a) Qual a probabilidade da temperatura ficar inferior a 70°C? P(Y < 70) = P(Z < (70 — 74.2) /2.2) = 0.0281. b) Qual a probabilidade da temperatura ultrapassar os 75°C desejados? P(Y > 75) = P(Z < (75 — 74.2) /2.2) = 0.3581. 16 c) Qual a probabilidade de que em 20 pasteurizações, alguma(s) dela(s) não atinja(m) a temperatura de 70◦C? Y : número de pasteurizações que não atingem 70◦C. Y ∼ b(20, p). p = P(Y < 70) = 0.0281. P(Y ≥ 1) = 1 − P(Y = 0) = 0.435. d) Deseja-se regular equipamentos para alterar a temperatura média do processo para que a prob- abilidade de ficar inferior a 70◦C seja de no máximo 0.0005. Qual deveria ser a nova média de operação? P(Y < 70|µ0) = 0.0005 z0.0005 = (y − µ0)/σ −3.291 = (70 − µ0)/2.2. µ0 = 70 − 2.2(−3.291) = 77.2402. e) Suponha agora que a nova média de operação seja de 74.5◦C. Deseja-se então alterar o desvio padrão para satisfazer as condições do item anterior. Qual deve ser o novo desvio padrão de operação? P(Y < 70|σ0) = 0.0005. z0.0005 = (y − 74.5)/σ0 −3.291 = (70 − 74.5)/σ0 σ0 = (70 − 74.5)/(−3.291) = 1.37. 26. a) Y : Número de peças defeituosas dentre 10 b) 0.0574 c) 0.7361 d) E(X) = 1 peça defeituosa; DP(X) = 0.9487 peça defeituosa 27. a) 0.94208 b) i) 6 acertos c) ii) 5.6 acertos 28. a) z = 1.18 b) z ≈ 0.86 29. Seja Y : vida útil (em anos) do aparelho, então: P(aparelho quebrar depois do prazo de garantia) = P(Y > 2.5) = P(Z > −0.82) = 0.79389 30. a) z ≈ 0.64 → b ≈ 99.8 b) z = 1.96 → b = 109.7 31. Seja T : tempo de espera (em minutos), então: a) E(T) = 5 minutos e DP(T) = 5 minutos 17 b) 0.9817 c) 0.3679 32. Seja Y : temperatura corporal de homens adultos sadios (em graus Celsius), então: a) aproximadamente 496 homens b) entre 36.45 e 37.15 graus 18 Exercícios da Unidade 5 Distribuição amostral 1. Um experimento genético envolve uma população de moscas de frutas que consiste em 1 macho (Mike) e 3 fêmeas, chamadas Ana, Bárbara e Cristina. Suponha que duas moscas de frutas sejam selecionadas aleatoriamente com reposição. a) Depois de listar as 16 diferentes amostras possíveis, ache a proporção de fêmeas em cada amostra e, então, use uma tabela para descrever a distribuição amostral da proporção de fêmeas. b) Ache a média da distribuição amostral. c) A média da distribuição amostral (item b) é igual à proporção populacional de fêmeas? 2. As idades (anos) dos quatro presidentes dos Estados Unidos quando foram assassinados no exercício do cargo são 56 (Lincoln), 49 (Garfield), 58 (McKinley) e 46 (Kennedy). a) Supondo que duas das idades sejam selecionadas com reposição, liste as 16 diferentes amostras possíveis. b) Ache a média de cada uma das 16 amostras e, então, resuma a distribuição amostral das médias no formato de uma tabela que represente uma distribuição de probabilidade. c) Compare a média populacional com a média das médias amostrais. 3. Repita o Exercício 2 usando a mediana no lugar da média. 4. Considere o seguinte problema (adaptado de Magalhães & Lima, 2006): Um fabricante afirma que sua vacina contra gripe imuniza em 80% dos casos. Uma amostra de 25 indivíduos entre os que tomaram a vacina foi sorteada e testes foram feitos para verificar a imunização ou não desses indivíduos. a) No contexto do problema identifique: • a população, • o parâmetro de interesse, • o estimador, • a estimativa, • a distribuição amostral. b) Se o fabricante estiver correto, qual é a probabilidade da proporção de imunizados na amostra ser inferior a 0.75? E superior a 0.85? 5. Uma variável aleatória Y tem distribuição normal, com média 100 e desvio padrão 10. a) Qual a P(90 < Y < 110)? b) Se ¯Y for a média de uma amostra de 16 elementos retirados dessa população, calcule P(90 < ¯Y < 110). 6. A máquina de empacotar um determinado produto o faz segundo uma distribuição normal, com média µ e desvio padrão 10 g. a) Em quanto deve ser regulado o peso médio µ para que apenas 10% dos pacotes tenham menos do que 500 g? b) Com a máquina assim regulada, qual a probabilidade de que o peso total de 4 pacotes escolhidos ao acaso seja inferior a 2 kg? 7. Utilizando algum recurso computacional ou tabela, calcule as probabilidades a seguir, conforme a distribuição da v.a. Y : Y ∼ t20 Y ∼ χ16 Y ∼ F(10,7) P(−2.85 ≤ Y ≤ 2.85) P(8.91 < Y < 32.85) P(Y > 3.18) P(Y < −2.85) P(Y > 8.91) P(Y > 0.15) P(Y > 2.85) P(Y > 32.85) P(Y > 5.35) P(Y > 2.12) P(Y > 22.80) P(Y < 7.41) P(Y < −3.01) P(Y < 10.12) P(Y < 1) 8. Para cada uma das 3 distribuições propostas no exercício anterior, encontre o valor de y tal que: a) P(Y < y) = 0.90 b) P(Y < y) = 0.025 c) P(Y < y) = 0.01 d) P(Y > y) = 0.975 9. Um estudo que investiga a relação entre idade e despesas médicas anuais amostra aleatoriamente 100 indivíduos em uma cidade da Califórnia. Espera-se que a amostra tenha uma média de idade semelhante à de toda a população. a) Se o desvio padrão das idades de todos os indivíduos em Davis for σ = 15, encontre a probabilidade de que a idade média dos indivíduos da amostra esteja dentro de dois anos da idade média de todos os indivíduos na cidade. (Dica: encontre a distribuição amostral da idade média da amostra e use o teorema do limite central. Você não precisa saber a média da população para responder, mas se isso facilitar, use um valor como µ = 30.) b) A probabilidade seria maior ou menor se σ = 10? Por quê? 10. O teste de conhecimentos gerais chamado Graduate Record Examination (GRE) tem componentes que medem o raciocínio verbal e o raciocínio quantitativo. O exame verbal e o exame quantitativo têm cada um uma pontuação mínima de 200 e máxima de 800. Nos últimos anos, a pontuação total nos dois exames teve aproximadamente uma distribuição normal com uma média de cerca de 1050 e desvio padrão de cerca de 200. a) Qual a probabilidade de obter pontuação total (i) abaixo de 1200 e (ii) acima de 1200? b) Dos participantes do teste GRE que pontuaram acima de 1.200, qual proporção deles teve pontuação acima de 1.400? c) Um grupo de 25 alunos formou um grupo de estudos para se preparar para o GRE. Para eles, a média de suas 25 pontuações totais é 1200. Se eles fossem uma amostra aleatória dos alunos que estão fazendo o exame, explique por que isso teria sido um resultado muito incomum. 11. Continuando o exercício 6, após a máquina estar regulada, programou-se uma carta de controle de qualidade. De hora em hora, será retirada uma amostra de quatro pacotes, os quais serão pesados. Se a média da amostra for inferior a 495 g ou superior a 520 g, encerra-se a produção para reajustar a máquina, isto é, reajustar o peso médio. a) Qual a probabilidade de ser feita uma parada desnecessária. b) Se o peso médio da máquina desregulou-se para 500 g, qual é a probabilidade de continuar a produção fora dos padrões desejados? 12. Um procedimento de controle de qualidade foi planejado para garantir um máximo de 10% de itens defeituosos na produção. A cada 6 horas sorteia-se uma amostra de 20 peças e, havendo mais de 15% 2 de defeituosas, encerra-se a produção para verificação do processo. Qual a probabilidadede uma parada desnecessária? 13. Supondo que a produção do exemplo anterior esteja sob controle, isto é, p = 0.1, e que os itens seja vendidos em caixas com 100 unidades, qual a probabilidade de que uma caixa: a) tenha mais do que 10% de defeituosos? b) não tenha itens defeituosos? 3 Respostas 1. a) Serão 16 pares possíveis, todos equiprováveis com probabilidade 1/16 e a distribuição da proporção amostral de fêmeas é: ˆp =prop(fêmeas) p 0 1/16 1/2 6/16 1 9/16 b) A média da proporção amostral é E(ˆp) = 0 · 1/16 + 1/2 · 6/16 + 1 · 9/16 = 0.75 c) A proporção populacional de fêmeas é 3/4=0.75 que é igual à média da proporção amostral. Este resultado indica que em média a proporção amostral é igual à proporção populacional. 2. a) As 16 amostras possíveis são todos os pares dois a dois das idades dos quatro presidentes. b) A distribuição amostral das médias ficará: Média P(Média) 46 1/16 47.5 2/16 49 1/16 51 2/16 52 2/16 52.5 2/16 53.5 2/16 56 1/16 57 2/16 58 1/16 c) A média populacional é 52.25 e a média das médias amostrais obtida usando a distribuição obtida no item b é: E( ¯X) = 46 · 1/16 + · · · + 58 · 1/16 = 52.25 notamos que ambas são iguais. 3. b) As medianas de amostras de tamanho dois são exatamente iguais às médias amostrais, então a distribuição das medianas será a mesma do exercício anterior. Mediana P(Mediana) 46 1/16 47.5 2/16 49 1/16 51 2/16 52 2/16 52.5 2/16 53.5 2/16 56 1/16 57 2/16 58 1/16 c) A mediana populacional é 52.5 e a média das medianas obtida usando a distribuição construída no item (b) é E(Mediana) = 52.25, observamos que elas são diferentes. 4 _ poe *,sEstatistica . . UFPR 4. a) Y : imunizado (0: nao, 1: sim) Y € {0,1} Y ~ Ber(p) e Os individuos que receberam a vacina. « A proporgao (p) de individuos imunizados entre todos os que receberam a vacina (na populagao). ¢ O calculo da proporgao de individuos imunizados na amostra p = )>""_, Y;/n. e A proporcéo observada em uma determinada amostra (no caso na amostra de n = 25 individuos). ¢ A distribuigéo amostral do estimador, ou seja, a distribuigéo que seria obtida caso fossem obtidas estimativas de diversas amostras. Distribuigéo amostral aproximada: - ia Yi p(l—p p= Dini Yi ~ N(p, pl =p), n n b) 1-— 0.80(1 — 0.80 pan (pao, MEP) _ 0:80(1 = 0.80) n 25 P(p < 0.75|p = 0.80) = 0.266 P(p > 0.85|p = 0.80) = 0.266 5. a) X ~ N(100, 107) 90-100 X-—yp | 110-100 P(90 < X < 110) = P(— 9 — < >| * —7? = P(-1<Z<1)=0.68 b) - X ~ N(100, (10/V/16)?) = 90-100 X-yp a) P(90 < X < 110) = P| ———~ < —= < — ( ) ( 10/Vi6 < o/vn ~ 10/vi6 = P(-4 < Z < 4) = 1.00. 6. Sabemos que X ~ N(p, 102). a) xXx P(X <500) = P(z < ~—*) = 0.10 a 500 — po = P| Z < ——]=0.1 ( < 10 ) 0.10 500 — pu —— = -1.2 > 10 8 — w =1.28-10+ 500 = 512.8. b) 5 _ poe *,sEstatistica . . UFPR Note que precisamos calcular a média de peso dos 4 pacotes com 4 kg no total. Logo, ~ ,X; — 2000 X= SS — = — = 500. 4 4 Portanto, - = X — 500 — 512.8 P(X <500) = (at < wa) a//n 10/V4 = P(Z < —2.56) = P(Z > 2.56) = 0.0052 Com a maquina regulada para 512.8 g, ha uma probabilidade de 0.0052 de que uma amostra de 4 pacotes apresente peso médio inferior a 500g. Note que com um pacote apenas, essa probabilidade é de 10%. Por isso, as inspecoes de controle de qualidade sio sempre feitas com base em amostras de tamanho n > 1. 7. Y ~ too Y ~ x16 Y¥ ~ Fao,7) P(—2.85 <Y < 2.85) =0.99 P(8.91<Y < 32.85) =0.909 P(Y > 3.18) = 0.069 P(Y < —2.85) = 0.005 P(Y > 8.91) = 0.917 P(Y > 0.15) = 0.996 P(Y > 2.85) = 0.005 P(Y > 32.85) = 0.008 P(Y > 5.35) = 0.018 P(Y > 2.12) = 0.023 P(Y > 22.80) = 0.119 P(Y < 7.41) = 0.993 P(Y < —3.01) = 0.003 P(Y < 10.12) = 0.14 P(Y <1) = 0.483 8. a) y=1.3253, y=23.5418 e y=2.703 b) y=-2.086, y=6.9077 e y=0.253 c) y=-2.528, y=5.8122 e y=0.192 d) y=-2.086, y=6.9077 e y=0.253 9. a) - / P(X —p) <2)=P(-2< X -p <2) —2 2 (sam ~ =m) = P(Z < 1.333) — P(Z < —1.333) = 0.9087 — 0.0913 = 0.8175 b) Seria 0.9545, portanto maior porque o desvio padrao da média amostral (também conhecido como erro padraéo da média amostral) diminui, ou seja, a distribuigéo é menos dispersa em torno da 6 _ poe *,sEstatistica . . UFPR média do que no item (a). P(X — pl < 2) = P(-2< X-p<2) —2 2 = P| —— < Z < — ~~ (alm OO aan) = P(Z < 2)— P(Z < —2) = 0.9772 — 0.0228 = 0.9545 10. a) i) P(X < 1200) =0.773 ii) P(X > 1200) = 0.227 b) P(X > 1400|X > 1200) = S250} = Fiza = 0.177 c) Pelo TCL, X ~ N(1050, (200/./25)?) e a probabilidade de uma amostra aleatéria de 25 alunos obter Adi ta ds _ 1200-1050 ) _ — 19-4 uma média de 1200 ou mais é: P(X > 1200) = P(z > S007 V 28 ) = P(Z > 3.75) = 10 11. a) Parada desnecessaria indica que 0 processo esta fora de controle (X < 495 ou X > 520) quando, na verdade, 0 processo esté ajustado e zs = 512.8. Nesse caso, X ~ N(512.8, 10/4) e a probabilidade desejada é : - X- 495 — 512.8 X — 520 — 512.8 P(X < 495) ou P(X > 520) = r(2t < oe") +p(=—4 > a) a/n ~~ 10/V4 o/n~ — 10/V4 = P(Z < —3.56) + P(Z > 1.44) =0+0.075 = 0.075 b) Agora, X ~ N(500, 10?/4) e o interesse esta na seguinte probabilidade: _ 495 — 20 — P(495 < X < 520) = P(e <Z< a) 10/V/4 10/V/4 = P(Z <4)—P(Z< -1) = 1-0.159 = 0.841. Note que a probabilidade de uma parada desnecessdria é pequena (item a), 4 custa de alta probabilidade de se operar fora de controle (item b). 12. Pelo Teorema Central do Limite temos que, a proporcéo amostral para amostras de tamanho 20 com a producao estando sob controle é p ~ N(0.1;0.1 - (1 — 0.1)/20) A probabilidade de parada desnecessaria é entaéo: 7 _ poe *,sEstatistica . . UFPR 0.15 — 0.1 P(p > 0.15) = P(z > an) = P(Z > 0.745) \/0.1- (1 — 0.1)/20 = 0.228. 13. a) p ~ N(0.1;0.1(1 — 0.1)/100) 0.1 —-0.1 P(p > 0.1) = P(z < ) ,/0.1- (1 — 0.1) /100 = P(Z >0)=0.5. b) Neste caso, a aproximacao Normal nao é recomendavel, pois o evento p < 0 nao faz sentido, e p = 0 tem probabilidade zero. No entanto, é possivel calcular a probabilidade exata de um evento equivalente, mas que tem distribuigaéo binomial. Logo, Y : Numero de itens defeituosos na caixa com 100 unidades Y ~ Bin(n = 100; p = 0.1) 1 P(Y =0)= (")vra — pr = ( 0) 0.1100 (4 — 9,1) 100-0 y = 0.9'°° = 2.65 - 107° = 0. 8 QA DEST eee ieee ~\ a Ss [Adee Sj" Departamento de Estatistica UFPR Exercicios da Unidade 6 Estimacdao pontual e intervalar 1. Para uma populagaéo normal com variancia conhecida o?, responda as seguintes questdes: (para resposta considere o arredondamento na terceira casa decimal e sempre que a resposta for porcentagem apresente o valor decimal entre 0 e 1) a) Qual é 0 nivel de confianga para o intervalo y —2.140//n<w<yt2.140/J/n b) Qual é 0 nivel de confianc¢a para o intervalo y — 2.490/./n < wp < y+2.49a//n c) Qual é 0 nivel de confianga para o intervalo y —1.850//n <u < y+1.850//n 2. Considere a seguinte equagéo aplicada para obter um intervalo de confianga bilateral de 100(1 — a)% para o parametro yp de uma distribuicéo normal com varidncia conhecida o? a partir de uma amostra aleatéria de n observacoes: y- Za/20/V/n SUS ¥ + Zaj20/V/n em que 2/2 € 0 ponto superior da distribuigdéo normal padrao que delimita a sua direita a/2 de area. Para as respostas considere 3 casas decimais. a) Qual é 0 valor de z,/2 nessa equagao que fornece 99% de confianga? b) Qual 6 0 valor de z,/2 nessa equagao que fornece 95% de confianga? c) Qual é 0 valor de zy/2 nessa equagao que fornece 90% de confianga? 3. (indicado como 13 no video de resolugaéo de exercicios) Considere a seguinte equacao aplicada para obter um intervalo de confianga bilateral de 100(1 — a)% para o parametro o? de uma distribuicdo normal a partir de uma amostra aleatéria de n observacoes: (n - 1)s? <o< (n= 1)s? Xo/2 X1-a/2 em que X29 © Xj_4/ SA0 pontos da distribuigdo x? com n—1 graus de liberdade, que delimita sua direita a/2 de area. Considerando uma amostra aleatéria de 15 elementos: (Para as respostas considere 3 casas decimais). a) Qual é 0 valor de yq/2 nessa equagado que fornece 99% de confianga? b) Qual 6 0 valor de x/2 nessa equagao que fornece 95% de confianga? c) Qual é o valor de x /2 nessa equagao que fornece 90% de confianga? 4. (indicado como 14 no video de resolugdo de exercicios) Considere um estudo no qual se deseja estimar a proporc¢aéo de solicitagdes atendidas e resolvidas de uma central do usuaério através de uma amostra aleatdéria simples. a) Se a amostra for de 4000 solicitagdes, qual serd a margem de erro (com confianga de 95%) para a estimacao da proporcaéo de resolvidas? b) Para este mesmo tamanho de amostra, qual seria a confiancga associada a uma margem de erro de +0.01 (1 %)? c) Qual deveria ser o tamanho da amostra para se obter a estimativa com uma margem de erro de 2.5% com 95% de confianga? d) E para uma margem de erro de 3% com 99% de confiança? 5. Antes de uma eleição, um determinado partido está interessado em estimar a probabilidade p de eleitores favoráveis ao seu candidato. Uma amostra piloto de tamanho 100 revelou que 60% dos eleitores eram favoráveis ao candidato. a) Utilizando a informação da amostra piloto, determine o tamanho da amostra para que, com 0.8 de probabilidade, o erro cometido na estimação seja de no máximo 0.05. b) Se na amostra final, com o tamanho obtido no item anterior, observou-se que 51% dos eleitores eram favoráveis ao candidato, construa um intervalo de confiança para p, com confiança de 95%. c) Decidiu-se coletar uma amostra de tamanho 150. Qual o erro máximo (margem de erro) que cometemos com probabilidade de 0.95 e p igual ao dado no item anterior? d) Qual a influência do tamanho da amostra na amplitude do intervalo de confiança, considerando fixados p = 0.51 e o nível de confiança em 0.95? 6. (indicado como 16 no vídeo de resolução de exercícios) Num grupo de pacientes, o nível de colestrol é uma variável aleatória Y com distribuição Normal de média desconhecida e variância 64 (mg/ml)2. a) Para uma amostra de 46 indivíduos, que forneceu um nível médio de colesterol de 120 mg/ml, calcule o intervalo com 95% de confiança para a média populacional. b) Para uma amostra de 100 indivíduos, que forneceu um nível médio de colesterol de 120 mg/ml, calcule o intervalo com 95% de confiança para a média populacional. c) Para uma amostra de 150 indivíduos, que forneceu um nível médio de colesterol de 120 mg/ml, calcule o intervalo com 95% de confiança para a média populacional. d) Qual a influência do tamanho da amostra na amplitude do intervalo de confiança, dado que fixamos σ = 8 e o nível de confiança em 0.95? 7. Um pesquisador está investigando o tempo de reação de um novo medicamento. Em sua pesquisa 20 pacientes foram sorteados ao acaso, receberam o medicamento e tiveram o seu tempo de reação anotado. Os dados coletados foram os seguintes (em minutos): 2.9; 3.4; 3.5; 4.1; 4.6; 4.7; 4.5; 3.8; 5.3; 4.9; 4.8; 5.7; 5.8; 5.0; 3.4; 5.9; 6.3; 4.6; 5.5; 6.2. a) Obtenha um intervalo de confiança de 90% para a verdadeira média populacional. b) Obtenha um intervalo de confiança (90% de confiança) para a variância dos tempos de reação. 8. Entre milhares de casos de pneumonia não tratada com sulfa, a porcentagem que desenvolveu com- plicações foi de 13%. Com o intuito de saber se o emprego da sulfa diminuiria essa porcentagem, 113 casos de pneumonia foram tratados com sulfapiridina e destes, 6 apresentaram complicações. Com base nesse resultado, o que você pode dizer sobre o emprego de sulfa na porcentagem de complicações em casos de pneumonia? Considere um nível de confiança de 90%. Justifique sua resposta. 9. A Leishmaniose Visceral é uma doença importante e que, se não for tratada corretamente, pode levar a óbito. Todo caso diagnosticado de Leishmaniose Visceral deve ser notificado às autoridades de saúde. Num estudo sobre o número de dias entre o início dos sintomas da Leishmaniose Visceral e a notificação do caso às autoridades, uma pesquisadora deseja estimar o número médio de dias entre os sintomas e a notificação usando um intervalo de 95% de confiança. Sabendo que ela gostaria que o erro de estimação fosse a metade do desvio-padrão do número de dias e supondo que o número de dias entre o início dos sintomas e a notificação tenha distribuição Gaussiana, responda: quantos casos de Leishmaniose Visceral, no mínimo, ela deve estudar? 10. A vida média de baterias automotivas de uma certa marca está sendo estudada. Baseado em estudos similares, com outras marcas, é possível admitir que a vida dessas baterias segue a distribuição Normal com desvio padrão de 4.5 meses. Qual tamanho deverá ter a amostra, para que a amplitude do intervalo de 90% de confiança para a vida média seja de 3 meses? 2 _ , oe *,sEstatistica . . UFPR Respostas 1. a) P(Z > 2.14) = 0.016 = a/2 entéo a = 0.032 e portanto o nivel de confianga é 1 — a = 0.968. b) P(Z > 2.49) = 0.006 = a/2 entéo a = 0.012 e portanto o nivel de confianga é 1 — a = 0.988. c) P(Z > 1.85) = 0.032 = a/2 entaéo a = 0.064 e portanto o nivel de confianga é 1 — a = 0.936. 2. a) Para um nivel de confianga de 99%, a = 0.01 entao P(Z > zq/2) = P(Z > 2.005) = P(Z > 2.576) = 0.005 portanto 20.005 — 2.576. b) Para um nivel de confianga de 95%, a = 0.05 entao P(Z > za/2) = P(Z > 2.025) = P(Z > 1.96) = 0.025 portanto 20.025 = 1.96. c) Para um nivel de confianga de 90%, a = 0.1 entéo P(Z > zq/2) = P(Z > 20.05) = P(Z > 1.645) = 0.05 portanto Z9.95 = 1.645. 3. a) Para 14 graus de liberdade: y? 995 = 31.319 porque P(x74 > 31.319) = 0.005. b) Para 14 graus de liberdade: y2 95 = 26.119 porque P(x74 > 26.119) = 0.025. c) Para 14 graus de liberdade: y2 9; = 23.685 porque P(y7, > 23.685) = 0.05. A. _ /0.50-0.5) _ _ _ [0.5+0.5 ortx _ 0.01 _ _ _ _ b) e = 0.01 = 2a/24/ ~qo9g~ Cntdo Za/2 = Jo.540.5/4000 1.265 ea = P(Z < —1.265) + P(Z > 1.265) = 0.206. Portanto, o nivel de confianga é (1 — a) x 100%=79.4%. c) Com margem de erro e = 0.025 e confianga de 95% entao a = 0.05 e za/2 = 20.025 = 1.96 temos n= (48%)*0.5(1 — 0.5) & 1537 d) Com margem de erro e = 0.03 e confianga de 99% entao a = 0.01 € 2/2 = 20.005 = 2.576 temos n = (2576)* 0.5(1 — 0.5) = 1844 5. a) Za 2 A A n= (4) pl — p) = € 1.282\7 =(—*) 061-0.) = (se) 0.6(1 — 0.6) & 158. b) - /pa-p ICo.95(p) = P + Za/2 ma?) = [0.510 — 0.51) =0.51+1. = 0.5 96 158 = [0.432; 0.590]. 3 _ poe *,sEstatistica . . UFPR c) _ [pl=p) € = 2q/2\| ——— = n /0.51(1 — 0.51) = 1.96,/ ———___——. = 150 = 0.080. d) Conforme aumentamos o tamanho da amostra, a amplitude do intervalo de confianga diminui. Hé mais informacao disponivel nos dados. 6. a) _ o _ a ICo.95(H) = (3 — Zq/2° vn << YF Za/2° <=) 8 8 = {| 120 — 1.96 - — < pw < 1204+ 1.96 - — ( vie va) = [117.69; 122.31]. b) _ a _ a ICo.95(t) = Y~ Pa/2* Fe SM SUF 20/2 Te 8 8 = {| 120 — 1.96 - —— <p < 120+1.96 -— ( vio0 7m) = [118.43; 121.57]. c) _ a _ a ICo.95(t) = YO Faja* SBS YT Za/a° Te 8 8 = {| 120— 1.96 - ——= < pw < 1204+ 1.96 -— ( vi50 7a) = [118.72; 121.28]. d) Conforme aumentamos o tamanho da amostra, a amplitude do intervalo de confianga diminui. Hé mais informacao disponivel nos dados. 7. a) A média amostral é obtida a partir da amostra coletada. Entao, y= dei Vi _ n — 294344 ..+6.2 =——3 = 4.745. A varidncia amostral é obtida a partir da amostra coletada é s? = 0.992. Assim, o intervalo de confianca é dado por _ s? ICo.90(H) = 9 tas ° 7 /0.992 = 4.745 + 1.729 - 4/ —— = 745 729 50 = (4.359; 5.131]. 4 . poe *,sEstatistica . . UFPR b) (n—1)S? (n—1)S? xe, /2 "Xie /2 (20 — 1)0.996? — (20-— 1)0.996? 30.1 , 10.1 [0.625 ; 1.86] 8. OIC de 90% para proporcao de complicacgées entre os pacientes na populacdéo que fazem uso de sulfa é: (0.053-1.645 - 0.021; 0.053+1.645 - 0.021]= [0.019; 0.088] Temos uma confiancga de 90% de que o intervalo acima cobre a verdadeira porcentagem de complicacées apos uso de sulfapiridina. Como o intervalo esta inteiramente abaixo de 13%, isso indica uma evidéncia estatistica a favor do uso do medicamento. 9. Y: numero de dias entre o inicio dos sintomas e a notificagao ~ N(p,¢). Y: numero médio de dias entre 0 inicio dos sintomas e a notificagaéo ~ N (1, 07/n). Deseja-se um erro de estimagéo e = 0/2 com confianga de 95%. 1.960\* (1.960 \7 n= (=) = (SF) = (1.96 x 2)? = 15.37 = 16 e€ a /2 10. Para calcular o tamanho de n, podemos considerar a equacéo a 2: fa/2" Fy = 3. Com os valores de 2,./2 = 20.05 = 1.645 e o = 4.5, temos que 2 2-1.645- 4.5 Vin = 220.080 _ fe SO = 4.935. 3 3 Como o valor de n deve ser um ntimero inteiro, escolhemos o menor inteiro superior a (4.935), obtendo n & 25. Dessa forma, a amplitude do intervalo sera ligeiramente menor que 3 e, portanto, o intervalo sera mais informativo. 5 Exercícios da Unidade 7 Testes de Hipóteses I Os exercícios foram extraídos dos livros: Bussab, WO; Morettin, PA. Estatística Básica. São Paulo: Editora Saraiva, 2006 (5ª Edição). Magalhães, MN; Lima, ACP. Noções de Probabilidade e Estatística. São Paulo: EDUSP, 2008. 1. O consumo médio de gasolina num certo tipo de automóvel é de 15 km por litro, segundo informações da montadora. Uma revista especializada verificou o consumo de 25 desses veículos, escolhidos ao acaso. Admita que o consumo siga o modelo Normal com variância igual a 9 (km por litro)2. a) Formule o problema como um teste de hipótese para verificar a afirmação da montadora. b) Qual seria a região crítica se α = 0.06? Encontre os valores de consumo médio de combustível que limitam a região crítica. c) Para uma amostra com ¯y = 17, o consumo difere ou não da afirmação da montadora? Justifique a sua resposta. 2. Uma máquina automática para encher pacotes de café enche-os segundo uma distribuição normal, com média µ e desvio padrão sempre igual a 20 gramas. A máquina foi regulada para µ = 500 gramas. Periodicamente, coletamos uma amostra de 16 pacotes e verificamos se a produção está sob controle. a) Formule o problema como um teste de hipótese. b) Defina a região crítica se α = 0.01. c) Se para a amostra coletada ¯y = 492 g, qual a conclusão a respeito da regulagem da máquina? 3. Uma máquina deve produzir peças com diâmetro de 2 centímetros. Entretanto, variações acontecem e vamos assumir que o diâmetro dessas peças siga o modelo Normal com variância igual a 0.09cm2. Para testar se a máquina está bem regulada, uma amostra de 100 peças é coletada. a) Formule o problema como um teste de hipótese. b) Qual seria a região crítica se α = 0.02? c) Se para essa amostra ¯y = 2.02, qual a conclusão a respeito da regulagem da máquina? d) Suspeita-se que a máquina esteja produzindo peças com variabilidade acima do estabelecido σ2 = 0.09cm2. Uma nova amostra de 100 peças resultou num desvio-padrão amostral de s = 0.33. Estabeleça e teste ao nível de 10% de significância a hipótese adequada. 4. O atual tempo de travessia com balsas entre Santos e Guarujá é considerado uma variável aleatória com distribuição Normal de média 10 minutos e desvio padrão de 3 minutos. Uma nova balsa vai entrar em operação e desconfia-se que será mais lenta que as anteriores, isto é, haverá aumento na média especificada pelo modelo acima. a) Especifique as hipóteses em discussão. b) Interprete os erros tipo I e tipo II no contexto do problema. c) Para uma amostra de 20 tempos de travessia com a nova balsa, obtenha a região crítica considerando um nível de 5%. d) Calcule a probabilidade do erro tipo II, se a nova balsa demora, em média, 2 minutos a mais que as anteriores para completar a travessia. Depois calcule para 3 e 4 minutos a mais. 5. Suponha que queiramos testar H0 : µ = 50 versus H1 : µ > 50, onde µ é a média de uma variável aleatória Normal com desvio padrão igual a 10. Extraída uma amostra de n = 36 elementos da população, observou-se ¯y = 53. Faça o teste utilizando os níveis 1%, 2% 5% e 10%. 6. Um criador tem constatado uma proporção de 10% do rebanho com verminose. O veterinário alterou a dieta dos animais e acredita que a doença diminuiu de intensidade. Um exame em 100 cabeças do rebanho, escolhidas ao acaso, indicou 8 delas com verminose. a) Formule o problema como um teste de hipótese para verificar a afirmação do veterinário. b) Qual a região crítica se α = 0.08? Encontre o(s) valor(es) de proporção que limita(m) a região crítica. c) Considere a amostra observada. A dieta proposta pelo veterinário tem efeito na redução da verminose do rebanho? Justifique a sua resposta. 7. Uma estação de televisão afirma que 60% dos televisores estavam ligados no seu programa especial da última segunda-feira. Uma rede competidora deseja contestar essa afirmação e decide usar uma amostra de 200 famílias para um teste. a) Formule o problema como um teste de hipótese para verificar a afirmação da estação de televisão. b) Qual a região crítica do teste para um nível de significância α = 5%? c) Admita que, com a pesquisa feita com as 200 pessoas, obtivemos 104 pessoas que estavam assistindo ao programa. O que podemos dizer a respeito da afirmação da estação de televisão? d) Calcule o p-valor do teste para o problema apresentado. 8. Um fabricante afirma que seus cigarros contêm não mais do que 30 mg de nicotina. Uma amostra de 25 cigarros fornece média de 31.5 mg e devio padrão de 3 mg. a) No nível de 5%, os dados refutam ou não a afirmação do fabricante? b) Calcule o p-valor do teste. 9. Os novos operários de uma empresa são treinados a operarem uma máquina, cujo tempo Y (em horas) de aprendizado é anotado. Observou-se que Y segue de perto a distribuição N(25, 100). Uma nova técnica de ensino, que deve melhorar o tempo de aprendizado, foi testada em 16 novos empregados, os quais apresentaram 20.5 horas como tempo médio de aprendizado. Usando o p-valor, você diria que a nova técnica é melhor que a anterior? 10. O consumidor de um certo produto acusou o fabricante, dizendo que mais de 20% da unidades fabricadas apresentam defeito. Para embasar sua acusação, ele usou uma amostra de tamanho n = 50 na qual 27% eram defeituosas. Mostre se o fabricante poderia refutar a acusação com um teste estatístico de hipótese. Use um nível de significância de 10%. 2 . poe *,sEstatistica . . UFPR Respostas 1. a) Hipdteses estabelecidas: Hyp: y= 15 H,:#415 (teste bilateral) b) Regiao critica na escala da varidvel resposta y: Yc —p _ oO Ct Ty KF => Cc C= %e = Gn Ye = WH 20 Yer = 15 — 1.88 3 = 13.87 Yel => . 25 => . 3 Ye2 = 15 + 1.88——= = 16.13 Yc2 7B A regiao critica na escala de y é dada por RC = {y € Rly < 13.87 ou y > 16.13}. Equivalentemente, a regiao critica na escala da estatistica de teste com a = 0.06 é dada por RC = {z < —Z0.03 = —1.88 ou z > 20.03 — 1.88}. c) O consumo difere, pois a média observada pertence a regido critica. Logo, rejeita-se a hipdtese nula de que o consumo de combustivel é de 15 km por litro, ao nivel de significancia de 6%. De maneira equivalente, podemos calcular a estatistica de teste M7] — Lo 17-15 Z= > = — _ = 3.88 o]Vn 3) V% Como z = 3.33 pertence a regiao critica na escala da estatistica de teste, entao rejeita-se a hipdtese nula ao nivel de significéncia de 6%. 2. a) Hipdteses estabelecidas: Hg : pp = 500 H,: 1 #500 (teste bilateral) b) Regiao critica na escala da varidvel resposta y: _ Yea _ oo me Gin Ue HY eT 20 Yer = 500 — 2.58 —— = 487.10 Yel 76 Yc2 = 500 + 2.58 20 = 512.90 Yc2 => . V6 => . A regiao critica é dada por RC = {y € R|y < 487.10 ou y > 512.90}. Equivalentemente, a regiao critica na escala da estatistica de teste com a = 0.01 é dada por RC = {z < —z0.005 = —2.58 ou z > 20.005 = 2.58}. c) Nao rejeitamos a hipdtese nula de que a mdquina esta produzindo pacotes com peso médio de 500 g, ao nivel de significéncia de 1%. 3 . poe *,sEstatistica . . UFPR De maneira equivalente, podemos calcular a estatistica de teste Y—po 492-500 16 a Oe a//n 20/V16 Como z = —1.6 nao pertence a regiao critica na escala da estatistica de teste, entao nao podemos rejeitar a hipdtese nula ao nivel de significancia de 1%. 3. a) Hipdteses estabelecidas: Ay: w=2 Hy: #2 (teste bilateral) b) Regiao critica na escala da varidvel resposta y: Yc —p _ oO — — = — %0 = Gn Ye = WH 20 0.3 Yor = 2 — 2.33——= = 1.93 Yel 700 0.3 Yo. = 2 + 2.33——— = 2.07 Yc2 700 A regiao critica na escala de y é dada por RC = {y € Rly < 1.93 ou y > 2.07}. A regiao critica na escala da estatistica de teste com a = 0.02 é dada por RC = {z < —20.91 = —2.33 ou z > 20.01 = 2.33}. c) Nao rejeitamos a hipdétese nula de que a madquina esta regulada e produzindo pegas dentro do padrao desejado, ao nivel de significdncia de 2%. Alternativamente, podemos calcular a estatistica de teste y — 2.02 — 2 po PF ML = = 067 a//n — ,/0.09/100 Como z = 0.67 nao pertence a regiao critica na escala da estatistica de teste, entao néo podemos rejeitar a hipdtese nula ao nivel de significancia de 2%. d) e Hipdteses estabelecidas: Ho : o? = 0.09 H,:07 > 0.09 (teste unilateral) ¢ Regiao critica para a = 0.1 na escala da estatistica de teste: RC = {x? > X6.1,99 = 117.41}. e Estatistica de teste: 2 5 2 n—1)s 99 - 0.33 = = ——— = 119.79 x op 0.09 ¢ Concluséo: Como x? = 119.79 pertence a regiao critica, rejeitamos a hipdtese nula de que a maquina esta regulada e produzindo pecas com variabilidade dentro do padrao desejado, ao nivel de 10% de significancia. 4 . poe *,sEstatistica . . UFPR 4. a) Hipdteses estabelecidas: Ho: = 10 H,:>10 (teste unilateral) b) Erro Tipo I: rejeitar Ho|Ho V, ou seja, nao rejeitar que a média de tempo para travessia aumentou, mas na verdade continua com média de 10 minutos. Erro Tipo II: nao rejeitar Ho|Ho F’, ou seja, nao rejeitar que a média de tempo para travessia nao aumentou, (= 10), mas na verdade ela aumentou. c) Yc —p _ oO C7 Ty KF => Cc C= %e = Gn Ye = WH 20 3 Ye. = 10+ 1.64 = Yel 7m = 11.10. A regiao critica é dada por RC = {y € R|y > 11.10}. Ja a regiao critica na escala da estatistica de teste com a = 5% é dada por RC = {z > 20.95 = 1.64} d) 8(12) = P(erro tipo IT) = P(nAo rejeitar Ho|Hpo falsa) = P(Y < 11.10|u = 12.0) ( Y-12 — 11.10- =) 4/37/20 4/3? /20 = P(Z < —1.34) = 0.090. Assim, em sendo yz = 12.0 estariamos concluindo de forma equivocada que Hp nao deveria ser rejeitada, com probabilidade de 0.090. Para 3 e 4 minutos a mais, temos que a probabilidade é 0.002 e = 0, respectivamente. 5. Sabemos que Y ~ N(u, 107/36). ¢ Para 1%: _ Ye — _ oO Ct Ty KF => Cc C= %0 = Gn Ye = WH 20 10 Yo = 50 + 2.33 —— = . 36 = 53.88. e Para 2%: Yo = 5042 06 2 = Ye . 36 = 53.43. e Para 5%: Yo = 50 + 1.64 WL Yc . /36 = 52.73. 5 . poe *,sEstatistica . . UFPR ¢ Para 10%: Yo = 50 + 1.28 8 ve e736 = 52.13. Nos niveis de 1% e 2% nao rejeitamos, mas rejeitamos nos niveis de 5% e 10%. Resolvendo a questao na escala da estatistica de teste, temos que a regido critica é dada por RC = {z > za}, em que para a = 0.01, 20.01 = 2.33; a = 0.02, 20.902 = 2.05; a = 0.05, 20.905 = 1.64 e a =0.1, 2.1 = 1.28. A estatistica de teste é 53 — 50 z= ——— = 1.8, 10/V36 portanto, z = 1.8 pertence as regi6es criticas com niveis de significancia de 5% e 10%, entao rejeitamos Ho a esses niveis. p(l=p) 6. Sabemos que p ~ N(p, “—**). a) Hipdteses estabelecidas: Hy :p = 0.10 Hy: p<0.10 (teste unilateral) b) Regiao critica na escala de p: Pe —P - [pl =p Ze = < > PeF=P— Ze ( ) / p(—p) n n Be = 0.10 — 1.414/ 0.101 — 0:19) _ 6.058 Pe =U. : 100 = 0. . A regiao critica na escala de p é dada por RC = {f € [0, 1]|p < 0.058}. Equivalentemente, a regiao critica na escala da estatistica de teste com a = 0.08 é dada por RC = {z < —Z0.08 = —1.41}. A estatistica de teste é . 0.08 0.1 7 PePo _ Ne _ 967 , / po=po) /91-0.9 100 100 c) Note que é necessdrio calcular a proporcgaéo amostral de animais com verminose como p = 5 = 0.08. Nao ha evidéncia suficiente para afirmar que a incidéncia diminuiu, uma vez que o valor de propor¢ao observado na amostra = 0.08 nao esta dentro da regiao de rejeicao da hipdtese nula. Na escala da estatistica de teste temos que z = —0.67 nao pertence a regiao critica e portanto, ao nivel de significancia de 8%, nao ha evidéncia suficiente para afirmar que a incidéncia diminuiu. A p(l=p) 7. Sabemos que p ~ N(p, ~~). a) Hipdteses estabelecidas: Ho : p = 0.60 Hy: p< 0.60 (teste unilateral) 6 . poe *,sEstatistica . . UFPR b) Regiao critica na escala de p: ~ . lL Ze = Pow? > ie =p + 20 P) /p(—p) n n 0, 60(1 — 0.60) De = 0.60 — 1.644 / ——-———— _ = 0.54. Pe V 200 A regiao critica é dada por RC = {p € [0, 1]|p < 0.54}. A regiao critica para a = 0.05 na escala da estatistica de teste 6 RC = {z < —z9.05 = —1.64}. c) Na amostra de tamanho n = 200, temos que p = aoa = 0.52. Assim, podemos notar que 0.52 € RC. Portanto, somos levados a rejeitar a hipdtese nula. Isto é, ha evidéncias de que a auséncia do programa de segunda-feira nao foi de 60%, mas inferior a esse numero. A estatistica de teste é 104/200 — 0.6 2 — 104/200= 0.6 _ 3) 0.6-0.4 \/ ~ 200 Assim, z € RC na escala da estatistica de teste, e portanto podemos rejeitar a hipdtese nula, ao nivel de 5% de significancia. d) Os passos para calcular o p-valor séio parecidos com aqueles jé apresentados, mas a principal diferenca esté em nao construir a regido critica. O que fazemos é apresentar a probabilidade de ocorrer valores da estatistica mais extremos do que o observado, sob a hipdtese nula ser verdadeira. Portanto, 0.52 — 0.60 P(p < 0.52|p = 0.60) = P(z < —— | /0.60(1—0.60) 200 = P(Z < —2.30) = 0.01 = 1%. 8. a) Note que foi obtida uma amostra de tamanho 25, onde a média (%) e o desvio padrao (s) amostral foram calculados. Assim, a varidvel padronizada segue uma distribuigéo t com n — 1 graus de liberdade. Isso quer dizer que Yau t= — = ~tn-1. s/J/n n—-1 As hipdéteses estabelecidas sao Ho: pp = 30 Hy: p> 30 (teste unilateral) Por ser um teste unilateral, devemos procurar o valor de t, tal que P(T >t.) = 0.05. A partir da tabela ¢ de Student, obtemos que t, = 1.711. Isso quer dizer que a regio critica para a estatistica t 6 RC = {t > 1.711}. O valor observado da estatistica é t= 31.5 — 30 3/V 25 = 2.5. Como t pertence a regiao critica, rejeitamos Ho, ou seja, ha evidéncias de que os cigarros contém mais de 30 g de nicotina. 7 . poe *,sEstatistica . . UFPR b) Para calcular 0 p-valor, considere que p—valor = P(T > t|Ho) = P(T > 2.5|Ho) = 0.01 O p— valor obtido esta abaixo do nivel de significéncia de 0.05 e portanto leva a rejeigao de Ho. 9. Considerando que Y ~ N(25, 100/16). As hipdéteses estabelecidas sao Ao: p= 25 Ay: j6< 25 (teste unilateral) Para calcular o p-valor, considere que a variancia dada é populacional. Entao, p—valor = P(Z < z) Y- 20.5 — 2 _p ( ee 0.5 >) a/V/n 10/V16 = P(Z < -1.8) = 0.036 Se adotarmos um nivel de significancia a = 0.05, como o p-valor 6 menor do que a entéo podemos rejeitar a hipotese nula e concluir que a nova técnica reduz 0 tempo médio de aprendizado ao nivel de significaéncia de a= 5%. Se, no entanto, adotassemos um nivel de 1% nao poderiamos rejeitar Ho. 10. Populagao: Y : presencga de defeito (0 - nao, 1 - sim) Y : B(p) Amostra: n = 50 50 p= Soy; =0.27 i=1 Teste de hipdtese: Ho: p=0.20 vs Hy: p> 0.20 (teste unilateral) a=0.10 > z. = 1.28 p — 27 —0.2 y= Paro _ 0277020 joy / po(1—=po) / 0.20(1—0.20) n 50 Concluséo: Como z < Z., ou, equivalentemente como o p-valor é 0.108, entaéo nao se rejeita Ho ao nivel de 10% de significAncia, ou seja, nao ha evidéncia suficiente na amostra para acusar o fabricante. 8 Exercícios da Unidade 8 Testes de Hipóteses II Os exercícios foram extraídos dos livros: Bussab, WO; Morettin, PA. Estatística Básica. São Paulo: Editora Saraiva, 2006 (5ª Edição). Magalhães, MN; Lima, ACP. Noções de Probabilidade e Estatística. São Paulo: EDUSP, 2008. 1. Queremos testar se existe ou não correlação entre o número de clientes e os anos de experiência de agentes de seguros. Sorteamos cinco agentes e observamos as duas variáveis. Qual seria a conclusão ao nível de 10% de significância baseada nos dados a seguir? Agente A B C D E Anos de Experiência 2 4 5 6 8 Número de Clientes 48 56 64 60 72 2. Deseja-se estudar a tolerância de um equipamento eletrônico ao número de impactos termoelétricos. Pelas características de fabricação do equipamento, é possível admitir que a probabilidade de falha seja constante, isto é, após cada impacto, existe uma probabilidade p de que ele falhe. Assim, Y é a variável aleatória número de impactos anteriores à falha. Uma amostra de 80 ensaios foi obtida, em que cada ensaio representa os testes feitos até a interrupção por falha no equipamento, resultando em 80 observações da variável de interesse. Na tabela a seguir, apresentamos as frequências esperadas e os valores que foram observados no teste de resistência realizado. Pretende-se verificar se o modelo geométrico com p = 0.4 é adequado ao nível de significância α = 0.05. Impactos (k) 0 1 2 3 4 Mais que 4 Freq. observada (ni) 30 26 10 5 5 4 Freq. esperada (E(ni)) 32.0 19.2 11.5 6.9 4.1 6.3 Como a categoria correspondente ao valor 4 tem frequência esperada igual a 4.1, que é menor que 5, é recomendado agregar as últimas duas categorias formando a dos maiores do que 3, a qual terá frequência observada 9 e esperada de 10.4. 3. A tabela abaixo contém os resultados obtidos por estudantes do ensino médio, em um exame com questões nas disciplinas de física e matemática. Deseja-se testar se existe dependência entre as notas dessas duas disciplinas que, para efeito de apresentação na tabela e análise de comportamento, foram classificadas nas categorias alta, média e baixa. Faça um teste adequado considerando nível de significância de α = 0.01. Física | Matemática Alta Média Baixa Total Alta 56 71 12 139 Média 47 163 38 248 Baixa 14 42 85 141 Total 117 276 135 528 4. Uma prova básica de Estatística foi aplicada a 100 alunos de Ciências Humanas e a 100 alunos de Ciências Biológicas. As notas são classificadas segundo os graus A, B, C, D e E (em que D significa que o aluno não recebe créditos e E indica que o aluno foi reprovado). Os resultados estão apresentados na . poe *,sEstatistica . . UFPR Tabela a seguir. Faca um teste adequado para testar se as distribuicdes das notas, para as diversas classes, sio as mesmas para os dois grupos de alunos. Considere nivel de significancia a = 0.05. Grau Aluno de JE Total C. Humanas 15 20 30 20 15 100 C. Biolégicas 8 23 18 34 17 100 Total 23 43 48 54 32 200 Média 11.5 21.5 24.0 27.0 16.0 200 5. Um instituto de pesquisa esta estudando a ocorréncia de doencas na populacaéo de uma cidade. Os pesquisadores do instituto encontraram 200 registros de individuos com doengas, sendo 50 pessoas com a doenga A, 70 com a doenga B, 30 com a doenga C e 50 com a doenga D. Cada doenga ocorre em apenas uma Unica pessoa e os pesquisadores assumiram que os registros sio uma amostra aleatéria da populacao de individuos com doengas. Estime a proporgao de individuos com os diferentes tipos de doengcas e faca um teste adequado para verificar se a proporcéo é a mesma. Considere nivel de significancia a = 0.05. 6. (indicado como 11 no video de resolugaéo de exercicios) Em um procedimento de avaliagéo um mesmo exame foi aplicado aos mesmos alunos quando estavam em periodos inicial e final de um curso. A varidvel D; corresponde a diferencga de notas de fim e inicio do curso. Faca um teste de comparacaéo de médias adequado considerando nivel de significancia a = 0.05. Inicio [37 | 57 [34] 40 [21 | W] 35 | 80 | GS | AT] Ww] OT] "Fim [65 [92/56 [70] 52 | 73 | 50 | 90 | 88 | 71 | 52 | 88 7. (enunciado e solugéo modificados) Dois tipos de pldsticos, I e II, sio adequados para uso na produgao de certo componente eletrénico. A tenséo de ruptura do material 6 uma caracteristica importante. Sabe-se que a7 = a7; = 1 psi. Uma amostra aleatéria com ny = 10 e ny; = 12 fornece Y, = 162.5 e y;, = 155.0. Por razoes de custo, a companhia nao ira adotar o plastico J a menos que este tenha uma resisténcia média que exceda a do plastico IJ. Proceda um teste de hipdtese adequado para saber se, baseando-se nas informag6es da amostra, a companhia deve adotar o plastico I (use a = 0.05). 8. (indicado como 13 no video de resolugao de exercicios) Um experimento foi feito para comparar os custos de reparo de dois tipos de bombas (A e B). Para isto registrou-se 0 custo para 16 bombas de cada tipo, ao longo de um ano de operagéo. Os custos anuais de reparo (em milhares de reais) foram os seguintes: Tipo A [04 [TS] A018] 2S [TO] OS [TA] —__[s4fro [20/0516 [39 [16] 18 | “TpoB [12 [os [27 [0s [os [ir] or] 13] [oo [3914] 2.606 [oe [15] 2.0 | Faca um teste de hipdtese adequado com nivel de significancia a = 0.05 para comparar os custos de reparo das duas bombas. Considere as seguintes informagoes: ya = 1.888 e 5% =1.168 e n4g=16 Yp =1413 e s%}=0.896 e ng =16 9. Duas técnicas de venda sao aplicadas por dois grupos de vendedores: a técnica A por 12 vendedores, a técnica B por 15 vendedores. Espera-se que a técnica B produza melhores resultados. No final de um més, obtiveram-se os resultados a seguir: ya =68 e 5% =50 e ng=12 Yp=76 e sp = 52 e np=15 2 . poe *,sEstatistica . . UFPR Vamos testar, para o nivel de significancia de 5%, se ha diferengas significativas entre as vendas médias resultantes das duas técnicas. Supondo que as vendas sejam normalmente distribuidas, faga um teste para igualdade de variancias e depois para a média populacional. 10. Queremos testar igualdade das resisténcias médias de dois tipos de vigas de aco, A e B. Tomando-se na = 15 vigas do tipo A e ng = 20 vigas do tipo B, obtemos os valores dados a seguir. ya = 70.5 e 34 =816 e nyg=15 Yp =845 e 5% =210.8 e ng =20 Conduza um teste de hipdtese adequado, considerando nivel de significancia de 10%. 11. Numa pesquisa de possuidores de carros numa universidade, entre homens e mulheres, foram obtidos: 24 de 100 homens possuem automdveis e 13 de 100 mulheres possuem automoveis. Baseado nestes resultados vocé afirmaria que a proporgao de homens e mulheres que possuem carros é a mesma na populacéo? Conduza um teste de hipétese adequado, considerando um nivel de significancia de 5%. 3 . poe *,sEstatistica . . UFPR Respostas 1. e Hipdtese: Ho: p=0 A, :p#0 e Estatistica de teste: n—-2 t=r T_p ~ t(n—2) e Regiao critica: RC ={t ER: t < —2.353 ou t > 2.353} e Calculo da estatistica de teste: / 5-2 t = 0.95, / ——— 1 — 0.952 = 5.270. e Concluséo: Como o t calculado esta na regiao critica, rejeitamos Ho, para a = 0.1, isto é, existe correlacao linear significativa entre anos de experiéncia e numero de clientes. 2. Note que as frequéncias esperadas foram obtidas para cada valor da varidvel aleatéria, usando a expresso da distribuicgéo Geométrica, uma vez que assumimos Y ~ G'eo(p) em que p é a probabilidade do evento que interrompe a sequéncia. Assim, P(Y =y) =0.6"-0.4 e Hipdtese: Hy: Y ~ G(0.4) A, :Y tem outra distribuicao e Estatistica de teste: k 2 2 (nj — E(ni)) 2 X= Dae OY XR 2 Bin) e Regiao critica: RC = {x? €R*: y? > 9.488} e Calculo da estatistica de teste: k vey (ni — E(ni))? i=1 E(ni) 30 — 32.0)? 9 — 10.4)? — BOAO" OO Lat. 32.0 10.4 ¢ Conclusdo: O valor de x? calculado néo esté na regido critica, para a = 0.05, entAo ndo rejeitamos Ho, isto é, nao rejeitamos o modelo proposto sob a hipdtese nula. 3. e Hipdtese: Hp : as notas de fisica e matematica séo independentes HT, : as notas nao séo independentes 4 . poe *,sEstatistica . . UFPR e Estatistica de teste: ek 2 (nij — Bij)” x = » » E.. ~ X(r—1)(e=1) i=1 j=l J e Regiao critica: RC = {y? ER*: y? > 13.277} e Calculo da estatistica de teste: Note que E;; = fetal de Une ciate ae colunad Entao, para a linha 1 e coluna 1, temos que 139 x 117 fu, = — 528 O procedimento é andlogo para as demais combinacoes. Tr Cc 2 2_ (niz — Eij) v= ae 4. aj w=1 g=1 __ (56 — 30.80)? 44 (85 — 36.05)? 7 30.80 ~ 36.05 = 145.78. ¢ Conclusd4o: O valor de x? calculado esté na regiao critica, para a = 0.01, entdo rejeitamos Hp, isto 6, as notas de matematica e fisica naéo sao independentes. 4. e Hipdtese: Podemos considerar P,; como a populacao de alunos de Ciéncias Humanas e P2 a dos alunos de Ciéncias Bioldgicas. Entao, podemos testar a hipdtese Ho : a distribuicgéo das notas séo as mesmas para os dois grupos > P; = P2 1, : a distribuigéo das notas nao séo as mesmas para os dois grupos + P; 4 P2 e Estatistica de teste: ek 2 (nij — Bij)” v= E.. ~ X(r—1)(e-1) i=1 j=l J e Regiao critica: RC = {x? €R*: y? > 9.488} Sob a suposicao da hipdtese nula Ho ser verdadeira, a distribuigaéo de probabilidade das duas turmas deveria ser a mesma e equivaleria a ter uma tinica populacéo P. A linha que representa os totais representaria uma amostra de 200 alunos da populacgéo. Ao considerar Ho verdadeira, entéo devemos encontrar os valores esperados com a finalidade de aplicar a formula de qui-quadrado. O valor esperado é dado E,;; = BiCy sendo R; e C; os totais de linha e coluna e n o tamanho da amostra. Dessa forma, as frequéncias absolutas esperadas sob Hp séo dadas por Grau C.Humanas 11.5 21.5 24.0 27.0 16.0 100 C. Bioldgicas 11.5 21.5 24.0 27.0 16.0 100 Total 23 43 48 54 32 200 5 . poe *,sEstatistica . . UFPR ¢ Calculo da estatistica de teste: Note que Ei; = se come Entao, para a linha 1 e coluna 1, temos que E.= 23 x 100 300 O procedimento é andlogo para as demais combinacoes. 2_ rye (ui — Eu) a = Xe) i=1 j=1 4 15 — 11.5)? 15 — 16.0)? 8 — 11.5)? 17 — 16.0)? — GS-15)" G5 = 16.0)" | (B= 15)" T= 16.0)" 11.5 16.0 11.5 16.0 = 9.09. ¢ Conclusao: O valor tabelado de x7 = 9.488, para a = 0.05. Logo, x? < x74, 0 que leva A nAo rejeigéo de Ho, ou seja, a distribuigao das notas é a mesma para as duas populacgoes, entaéo consideramos que ha uma populacgao homogénea. 5. e Proporcgaéo estimada de individuos com cada doenga: 50 70 Pa = ~~ =0.25; Dp = =~ = 0.35; PA 200 > Pp 200 ’ 30 50 Do = = = 0-15; Pp = =~ = 0.25. Po ~ 300 > PP ~ 500 e Hipdtese: Ho : a proporcéo é a mesma: pa = pp = Pc =Ppp A, : a proporcaéo nao é a mesma Em termos praticos, as hipdteses sugerem que npo; = 50 para qualquer 7. e Estatistica de teste: . 2 (ni — E(ni))? 2 xX = » E(n;) Xk-1 w=1 e Regiao critica: RC = {x7 €R*: y? > 7.815} ¢ Calculo da estatistica de teste: Note que E(n;) = npo;. Entao, para a doenga A, temos que E(n;) = 200 - 0.25 = 50. O procedimento é andlogo para as demais doengas. 50 — 50)? 70 — 50)? 30 — 50)? 50 — 50)? 2 — (0= 50 | (F0= 50)? | (80= 50)? | (50-50) 50 50 50 50 = 16.00. ¢ Conclusado: O valor tabelado de y3 = 7.815, para a = 0.05. Logo, x? > x3, 0 que leva A rejeicaéo de Ho, ou seja, a proporcao de individuos com as doengas nao é a mesma. 6 . poe *,sEstatistica . . UFPR 6. Ho :bfim = Minicio (A = 0) vs H1: fim 4 Minicio (d > 0) a = 0.05 d = 25.7 e S3 = 83.7 1- 25.7 —0 4\/83.7/12 = 9.72 RC :{t = 9.72 > t. = 1.796} te RC. Rejeita-se Hop, ou seja, rejeita-se que a diferenca das notas seja nula e considera-se que houve um aumento nas notas. 7. e Ho: wr — rr =O versus Ay : wy — wry > O ~ c= 1-11) — —(162.5-155) ___ 17.59 oS Vein +or Jan Vasoyrayiay © RC: {z> 2, = 1.645} ° p—valor = a* = P(Z > z) = P(Z > 17.52) = 0. e Rejeita Ho. Ha evidéncias (a = 0.05) de que a média do tipo I supera a do tipo II. 8. Primeiro, vamos testar a igualdade das variancias populacionais. No entanto, note que temos apenas as variancias amostrais, denotadas por S% e S?,. Podemos formular as hipéteses da seguinte forma: Ao: o% = on Hy: 0%, 402, Sob a suposicaéo de Ho ser verdadeira, temos que o valor calculado é F = $23,/S?2, ~ F(n4 —1,ng — 1). Portanto, F=S8%/S? = 1.168/0.896 = 1.304. Considerando a = 0.05, temos que os valores criticos da distribuigao F(15,15) sa0 fi; = 0.349 e fo = 2.862, isto é, a regido critica 6 dada por RC ={f € Rt: f < 0.349U f > 2.862}. Como F esta fora da regiao critica, nao rejeitamos a hipdtese nula de que as variancias nao diferem ao nfvel de significancia de 5%. Para ambas as populac6des, temos a mesma variancia. Suponha que temos o interesse em testar as hipdteses Ho : LA = LB A: wa F Llp A variancia comum combinada é dada por a _ (na = 1)s% + (np = Dish © (na —-1)+(np—-1) © 7 . poe *,sEstatistica . . UFPR Entao, 1, — Gi = Yo) — (Ha = bs) Se 1/na +1/np (1.888 — 1.413) 1.016,/1/16 + 1/16 = 1.322. Considerando que t possui uma distribuicgéo t-Student com n4-+np —2 graus de liberdade, a quantidade trad € obtida na tabela da distribuicgdéo t-Student. Entao, fixando a, encontramos o valor de tig, como a= P(t < —t.Ut > t.|Ho), com regiao critica dada por RC = {t € R: t < —2.042 ou t > 2.042}. Logo, concluimos que a hipétese Ho nao é rejeitada ao nivel de significancia de 5%, pois o valor t calculado nao pertence a regiao critica. 9. e Teste de hipdtese para variancia populacional: Ao: a7 = on Hy: 0% 40% Sob a suposicgéo de Ho ser verdadeira, temos que o valor calculado é F = $3/S% ~ F(ng —1,n4 —1). Portanto, F = sp/s4 = 52/50 = 1.040. Considerando a = 0.05, temos que os valores criticos da distribuigao F(14,11) sao fi = 0.323 e fo = 3.359, isto é, a regiao critica 6 dada por RC = {f € Rt: f < 0.323U f > 3.359}. Como F esta fora da regiao critica, nao rejeitamos a hipdétese nula de que as variancias nao diferem ao nivel de significdncia de 5%. e Teste de hipdtese para média populacional: Ho: MA = UB Ay: aA < MB A variancia comum combinada é dada por a _ (na 1)s8% + (np ~ sh © (na —1)+ (np —-1) — (12 —1)50 + (15 — 1)52 (12-1) + (15-1) = 51.12. Entao, ,— Yaa Yn) — (Ha ~ bs) Ser/1/na +1/nB _ (68 — 76) 7.15,/1/12 + 1/15 = —2.89. Considerando que t possui uma distribuicgéo t-Student com n4-+np —2 graus de liberdade, a quantidade t. é€ obtida na tabela da distribuicgdéo t-Student. Entao, fixando a, encontramos o valor de t. como a = P(t < —t.|Ho), com regiao critica dada por RC = {t € R: t < —1.708}. Logo, concluimos que a hipotese Ho é rejeitada ao nivel de significancia de 5%, pois o valor t calculado pertence a regiao critica. 8 . poe *,sEstatistica . . UFPR 10. e Teste de hipdtese para variancia populacional: Ao: a7 = on Hy: 0% 40% Sob a suposicgéo de Ho ser verdadeira, temos que o valor calculado é F = $3/S% ~ F(ng —1,n4 —1). Portanto, F = s%/s% = 210.8/81.6 = 2.583. Considerando a = 0.1, temos que os valores criticos da distribuigao F(19,14) sao fi = 0.443 e fo = 2.400, isto é, a regiao critica 6 dada por RC = {f € Rt: f < 0.443 ou f > 2.400}. Como F esté dentro da regiao critica, rejeitamos a hipdétese nula de que as variancias nao diferem ao nivel de significancia de 10%. e Teste de hipdtese para média populacional: Ho : HA = MB Ay: ba FB , — Ya — Ye) — (Ha = be) /s4/na + 8%/nB _ (70.5 — 84.5) \/81.6/15 + 210.8/20 = —3.502. Como as varidncias sao distintas, t possui uma distribuicaéo t-Student com v graus de liberdade dado por v= (wa + wp)? w4/(na — 1) +.w2/(ne — 1) _ (5.44 + 10.54)? ~ -5,.442/(15 — 1) + 10.542/(20 — 1) = 32.077. sendo wa = s4,/n4 = 81.6/15 = 5.44 e wg = w?,/ng = 210.8/20 = 10.54. A quantidade t, é obtida na tabela da distribuigéo t-Student. Entaéo, fixando a, encontramos o valor de t, para 32 graus de liberdade como a = P(t < —t. Ut > t.|Ho), com regiao critica dada por RC = {t ER: t< —1.694 ou t > 1.694}. Logo, concluimos que a hipétese Ho é rejeitada ao nivel de significdncia de 10%, pois o valor t calculado pertence a regiao critica. 11. ¢ Ho: py =pm versus Hy, : py # pm (teste bilateral) e Proporgdes 24 13 Pu ~ 700 © PM ™ 700 24+ 13 37 p= ————._ = —— = 0.185 P™ 100+ 100 200 9 _ poe *,sEstatistica . . UFPR e Estatistica de teste: Dy — Dp 0.24 — 0.13 - PH TPM _ __ = 2.9033. \/P(L—p)(a5 +a) 1 0-185(1 — 0.185)(=4, + 4) °° a=0.05 > RC = {z < —1.96 ou z > 1.96}. °¢ p—valor =a* = P(Z < —-z)+ P(Z > z) = 0.045. ¢ Rejeita-se Ho. Ha evidéncias suficientes (a = 0.05) de que as proporgdes populacionais de homens e mulheres com carro diferem. 10 C4 DEST ____ , . ae Sj" Departamento de Estatistica UFPR Exercicios da Unidade 9 Andlise de varidncia e Regressdo linear Os exercicios foram extraidos de segdes do livro: Magalhaes, MN; Lima, ACP. Nogoes de Probabilidade e Estatistica. SAo Paulo: EDUSP, 2008. 1. A quantidade de chuva é um fator importante na produtividade agricola. Para medir esse efeito, foram anotados, para 8 regides diferentes produtoras de soja, o indice pluviométrico e a produgao do ultimo ano, dados a seguir. Chuva (mm) 120 140 122 150 115 190 130 118 Produgao (ton) | 40 46 45 37 ~~ 25 54.333 30 & = 135.625; y = 38.75; S7°_, ay - yy = 43245; S78, a? = 151533. a) Encontre os pardmetros desconhecidos 3 e 3; do modelo de regressao linear simples E[Y;] = 80 + G1 - Xi. b) Interprete os parémetros ( e {4. c) Utilizando a reta ajustada no item anterior, encontre a producao esperada para uma regiaéo com {indice pluviométrico igual a 160 mm. d) Eadequado utilizar o modelo ajustado para calcular a produgaéo em uma regiao cujo indice pluviométrico é igual a 30 mm? 2. Um pesquisador acredita que o gado alimentado em um determinado pasto tem um ganho de peso maior que o usual. Estudos de laboratério detectaram uma substancia no pasto e deseja-se verificar se ela pode ser utilizada para melhorar o ganho de peso dos bovinos. Foram escolhidos 15 bois de mesma raca e idade, e cada animal recebeu uma determinada concentragaéo da substancia X (em mg/l). O ganho de peso apdés 30 dias, denotado por Y (em kg), foi anotado e os dados foram os seguintes: X[o2[ 0s [06] 07 [10] 1s [a0] 25] a0] 35] AO] AS] HO] 5s | OO | Resumo dos dados: Z = 2.70; ¥ = 16.14; 32, ei ys = 785.55; S22, 2? = 163.39. a) Encontre os pardmetros desconhecidos 3 e 3; do modelo de regressao linear simples E[Y;] = 80 + G1 - Xi. b) Interprete os parémetros ( e {4. c) Utilizando a reta ajustada no item anterior, encontre o ganho de peso esperado para uma concentracao de substancia igual a 3 (mg/l). 3. Um estudo foi conduzido pelo Instituto Politécnico e pela Universidade Estadual da Virgínia para determinar se certa medida estática da força do braço tem influência nas características da “suspensão dinâmica” de certo indivíduo. Vinte e cinco indivíduos foram submetidos a testes de força e, depois, desempenharam um teste de levantamento de peso no qual o peso foi levantado dinamicamente sobre a cabeça. Os dados são fornecidos a seguir. Indivíduo Força braçal: X Levantamento dinâmico: Y 1 17.3 71.7 2 19.3 48.3 3 19.5 88.3 4 19.7 75.0 5 22.9 91.7 6 23.1 100.0 7 26.4 73.3 8 26.8 65.0 9 27.6 75.0 10 28.1 88.3 11 28.2 68.3 12 28.7 96.7 13 29.0 76.7 14 29.6 78.3 15 29.9 60.0 16 29.9 71.7 17 30.3 85.0 18 31.3 85.0 19 36.0 88.3 20 39.5 100.0 21 40.4 100.0 22 44.3 100.0 23 44.6 91.7 24 50.4 100.0 25 55.9 71.7 a) Estime β0 e β1 para a reta de regressão linear E[Yi] = β0 + β1 · Xi. b) Determine uma estimativa pontual de µY |30, ou seja, o levantamento dinâmico esperado para uma força braçal de 30. 4. As notas de uma sala com nove estudantes em um relatório de meio de curso (X) e em um exame final (Y ) são dadas a seguir: x 77 50 71 72 81 94 96 99 67 y 82 66 78 34 47 85 99 99 68 a) Estime a reta de regressão linear. b) Estime a nota do exame final de um aluno que teve uma nota 85 no relatório de meio de curso. 5. Um estudo foi realizado sobre a quantidade de açúcar convertido em um processo em várias temperaturas. Os dados foram codificados e registrados a seguir: Temperatura: X Açúcar convertido: Y 1.0 8.1 1.1 7.8 1.2 8.5 1.3 9.8 1.4 9.5 1.5 8.9 1.6 8.6 1.7 10.2 1.8 9.3 1.9 9.2 2.0 10.5 a) Estime a reta de regressão linear. b) Estime a média da quantidade de açúcar convertido produzida quando a temperatura codificada é 1.75. c) Use uma abordagem da análise de variância para testar a hipótese de que β1 = 0 contra a hipótese alternativa de que β1 ̸= 0, no nível de significância de 0.05. 2 6. As quantidades de um composto químico, Y , dissolvido em cem gramas de água sob várias temperaturas, X, foram registradas a seguir: X Y (oC) (gramas) 0 8 6 8 15 12 10 14 30 25 21 24 45 31 33 28 60 44 39 42 75 48 51 44 a) Determine a equação do modelo de regressão linear simples. b) Desenhe a reta no diagrama de dispersão. c) Estime a quantidade de composto químico que se dissolverá em cem gramas de água a 50oC. 7. Um teste matemático de colocação é aplicado para todos os calouros que entram em uma pequena faculdade. Um estudante que recebe uma nota abaixo de 35 é recusado para o curso regular de Matemática e colocado em uma aula de reforço. As notas dos testes de colocação e as notas finais de 20 alunos que cursaram Matemática foram registradas como se segue: Teste de colocação Nota do curso 50 53 35 41 35 61 40 56 55 68 65 36 35 11 60 70 90 79 35 59 90 54 80 91 60 48 60 71 60 71 40 47 55 53 50 68 65 57 50 79 a) Faça um diagrama de dispersão. b) Determine a equação da reta de regressão para prever as notas de curso com base nas notas do teste de colocação. c) Represente a reta em um diagrama de dispersão. d) Se 60 é a nota mínima para passar, abaixo de qual nota do teste de colocação os alunos deveriam ser recusados para o curso no futuro? 3 . poe *,sEstatistica . . UFPR 8. Um estudo foi conduzido por um vendedor a varejo para determinar a relacao entre os gastos semanais com publicidade e as vendas. Os seguintes dados foram registrados: X: Gastos com publicidade ($) Y: Vendas ($) AO 385 20 400 25 395 20 365 30 AT5 50 440 AO 490 20 420 50 560 AO 525 25 480 50 510 a) Faga um diagrama de dispersao. b) Determine a equagéo da reta de regressio para prever as vendas semanais com base nos gastos com publicidade. c) Estime as vendas semanais quando os gastos de publicidade sao de R$ 35, 00. 9. Um estudo foi realizado para avaliar os efeitos da temperatura ambiente X no consumo de energia elétrica de uma industria quimica, Y. Outros fatores foram mantidos constantes e os dados foram coletados de uma fabrica experimental piloto. Y (BTU) X (°F)|Y (BTU) X (°F) 250 27 265 31 285 45 298 60 320 72 267 34 295 58 321 74 a) Facga um grafico dos dados. b) Estime a inclinagao e o intercepto em um modelo de regressao linear simples. c) Preveja o consumo de energia para uma temperatura ambiente de 65°F’. 10. Um professor em uma escola de negécios de uma universidade entrevistou uma dtzia de colegas sobre o numero de reunioes profissionais de que eles participaram nos tiltimos cinco anos (X) e o nimero de trabalhos enviados por eles a revistas especializadas (Y) durante o mesmo periodo. Um resumo dos dados é fornecido a seguir: n = 12, #=4, y=12, So a; = 232, So wivi = 318. Ajuste um modelo de regressao linear simples entre y e x determinando as estimativas do intercepto e da inclinagao. Comente se 0 comparecimento em reunioes profissionais resultaria em mais trabalhos publicados. 4 11. Deseja-se um modelo de regressão que relacione a temperatura e a proporção de impurezas de uma substância sólida que atravessa o hélio sólido. A temperatura é listada em graus centígrados. Os dados são apresentados aqui. Temperatura (C) Proporção de impurezas -260,5 0.425 -255,7 0.224 -264,6 0.453 -265,0 0.475 -270,0 0.705 -272,0 0.860 -272,5 0.935 -272,6 0.961 -272,8 0.979 -272,9 0.990 a) Ajuste um modelo de regressão linear. b) Parece que a proporção de impurezas que atravessam o hélio aumenta conforme a temperatura se aproxima de −273 graus centígrados? c) Determine R2. d) Com base nas informações dadas, o modelo linear parece apropriado? Quais informações adicionais seriam necessárias para melhor responder a essa questão? 12. Suponha, em um experimento industrial, que um engenheiro está interessado em saber como a absorção média de uma mistura em concreto varia entre cinco agregados de concreto. As amostras foram expostas à mistura por 48 horas. Decidiu-se que seis amostras seriam testadas para cada agregado, requerendo um total de 30 amostras para serem testadas. Os dados estão registrados na tabela a seguir. Teste a hipótese µ1 = µ2 = · · · = µ5, no nível de significância de 0.05, para os dados da Tabela sobre a absorção das misturas por vários tipos de agregados de cimento. Agregado: 1 2 3 4 5 551 595 639 417 563 457 580 615 449 631 450 508 511 517 522 731 583 573 438 613 499 633 648 415 656 632 517 677 555 679 Total 3320 3416 3663 2791 3664 16854 Média 553.33 569.33 610.5 465.17 610.67 561.8 13. Seis máquinas diferentes estão sendo consideradas para uso na fabricação de selos de borracha. As máquinas estão sendo comparadas em relação à resistência à tensão do produto. Uma amostra aleatória de quatro selos de cada máquina é utilizada para determinar se a resistência à tensão varia de máquina para máquina. A seguir, temos as medidas das resistências à tensão, em quilogramas por centímetro quadrado ×10−1. Máquina 1 2 3 4 5 6 17.5 16.4 20.3 14.6 17.5 18.2 16.9 19.2 15.7 16.7 19.2 16.2 15.8 17.7 17.8 20.8 16.5 17.5 18.6 15.4 18.9 18.9 20.5 20.1 Faça uma análise de variância, no nível de significância de 0.05, e indique se as resistências à tensão diferem 5 significativamente ou não entre as seis máquinas. 14. Os dados da tabela a seguir representam o número de horas de alívio para cinco marcas diferentes de comprimidos para dor de cabeça, administrados em 25 indivíduos com febre de 38oC ou mais. Faça uma análise de variância e teste a hipótese, no nível de significância de 0.05, de que a média do número de horas de alívio fornecidas pelos comprimidos é a mesma para todas as cinco marcas. Discuta os resultados. Comprimido A B C D E 5.2 9.1 3.2 2.4 7.1 4.7 7.1 5.8 3.4 6.6 8.1 8.2 2.2 4.1 9.3 6.2 6.0 3.1 1.0 4.2 3.0 9.1 7.2 4.0 7.6 15. Uma investigação foi conduzida para determinar a fonte de redução no rendimento de certo produto químico. Sabe-se que a perda no rendimento ocorreu no líquido mãe, ou seja, o material removido no estágio de filtragem. Percebeu-se que marcas diferentes do material original podem resultar em diferentes reduções no rendimento no estágio do líquido mãe. A seguir temos os resultados da redução percentual para os três lotes de cada uma das quatro marcas pré-selecionadas. Faça uma análise de variância no nível de significância α = 0.05. Marca 1 2 3 4 25.6 25.2 20.8 31.6 24.3 28.6 26.7 29.8 27.9 24.7 22.2 34.3 6 _ poe *,sEstatistica . . UFPR Respostas 1. a) A n wi CY 4 24 —_ . 1 . 2 . . b, = er ney 3245 — 8 - 135.625 38.75 _ 9 9743, pa &F — nz? 151533 — 8 - 135.6252 Bo = 9 — Bik = 38.7500 — 0.2743 - 135.625 = 1.548. b) O parametro {o é o intercepto da reta, isto é, 6 o valor de produgaéo esperado quando nao chove. Entretanto, a interpretacéo pode nao ter sentido pratico ou veracidade visto que o valor x = 0 esta distante dos dados. O parémetro 6; é o aumento da produgaéo quando aumentamos uma unidade de chuva. c) 9 = Po + Pix = 1.548 + 0.2743 - 160 = 45.436. d) Nao, pois 30 mm de chuva nao esta no intervalo de valores de chuva utilizados para o ajuste do modelo. 2. a ee EMT NET __785.55—15-2.70-16.14 a) P= one? . 163 50-16 2708 = 2.44. Bo = 9 — Bid = 16.14 — 2.44 - 2.70 = 9.55. § = 9.554 2.44. a;. b) O parametro (9 é 0 intercepto da reta, isto é, 6 o ganho de peso quando a concentracao da substancia é 0. O pardmetro 6, é o ganho de peso dos animais quando aumentamos uma unidade na concentracaéo da substancia. c) § = 8 + Gia = 9.55 + 2.44-3 = 16.87. 3. a) Soa; =778.7, Sy = 2050.0, S >a? = 26591.63, So aiy; = 65164.04, n = 25 Note que “ Yo; Leys — NEY By = > 2 _ nx ’ mas se multiplicarmos o numerador e 0 denominador da expresséo acima por n podemos re-escrever a equacao acima como _ , = MOL tive — NEY) _— MD Ti Vii Lie 1nd, 22 — nz?) nyo, a2—(d,"))2 | Portanto, - 25) (65164.04) — (778.7)(2050.0 4, = (25)(65164.04) ~ (778.7)(2050.0) _ 4 5699 (25)(26591.63) — (778.7)? ~ 2050 — (0.5609) (778.7 Po = 2050 ~ (0-5609)(778-7) _ 64 53. 25 b) Usando a equacéo § = 64.53 + 0.5609 - x, com x = 30, encontramos § = 64.53 + (0.5609)(30) = 81.40. 7 _ poe *,sEstatistica . . UFPR c) Os residuos parecem se distribuir de forma aleatéria, conforme desejado. A, a) Soa; = 707, Soy, = 658, Sa? = 57557, So aiy; = 538258 en =9. Usamos a igualdade 3 _ ei TY — NTY _ nde Tiyi — Vi Ti Di Yi ' ite — nz? n>,e7—(Y, ai)? Portanto, * (9)(53258) — (707)(658) Se = 0.7771 Pa (9) (57557) — (707)2 ’ * 658 — (0.7771) (707 Bo = os OTT TOT) = 12.0623. Portanto, 7 = 12.0623 + 0.7771 - x. b) Para x = 85, § = 12.0623 + (0.7771)(85) = 78. 5. a) Soa; =16.5, Soy; = 100.4, $0 ax? = 25.85, So ajy; = 152.59en=11 Usamos a igualdade a di Tiyi —NTY — MY TiYs — VTi DV Yi Dah one nya = (Lye Portanto, x 11)(152.59) — (16.5)(100.4 4, = (11)(152.59) — (16.5)(100.4) _ | gag) (11) (25.85) — (16.5)? x 100.4 — (1.8091) (16.5 By = 1d = 1-8091)(16:5) _ 6 1136. 11 Portanto, 7 = 6.4136 + 1.80912. b) Para x = 1.75, § = 6.4136 + (1.8091)(1.75) = 9.580. c) As hipdéteses saéo Ao: fi = 90, Ay : By x 0. Nivel de significancia: 0.05. Regiao critica: F > 5.12. Calculo: SQReg = 8? D,(a; — ®)? = (3.273)(1.1) = 3.60 e SQRes = SD, (yi — Bo — Bia)? = 3.60. Quadro da ANOVA 8 _ poe *,sEstatistica . . UFPR Fonte de Variagao 5.Q. GL. QM. Fo, Regressao | 3.60 1 3.60 9.00 Residual 3.60 9 0.40 Total 7.20 10 Decisao: Rejeita-se Ho. 6. a) Soa; = 675, Soy, = 488, S$) x? = 37125, S > aiy;, = 25005 e n = 18. Usamos a igualdade By = Lats — MEY _ ND TYE Vii LAM : bo 27 — nz? nyo, 27 — (Yi)? Portanto, 4 18) (25005) — (675)(488 4, = (§8)(25005) ~ (675)(488) _ 9 srg (18)(37125) — (675)? 4 488 — (0.5676) (675 Po = A88 ~ (0-5676)(675) _ 5 go54, 18 Portanto, § = 5.8254 + 0.5676 - x. b) O grafico de dispersao e a linha de regressao. c) Para x = 50, § = 5.8254 + (0.5676) (50) = 34.205 gramas. 7. a) O grafico de dispersao e a linha de regressao. b) So ai = 1110, Soy = 1173, Soa? = 67100, So wiv = 67690 en = 20 Usamos a igualdade By = Lats MEY _ RD TYE iL epone nD ya (Le)? Portanto, A 2 — (1110)(11738 4g, = (20)(67690) ~ (1110)(1173) _ you (20)(67100) — (1110)? 4 1173 — (0.4711)(1110 Po = U3 ~ ATION _ 39 5059. 20 Portanto, 7 = 32.5059 + 0.4711 - a. (c) Ver item (a). (d) Para § = 60, resolvemos 60 = 32.5059 + 0.4711 - a para obter x = 58.3659. Portanto, alunos com pontuacao abaixo de 58 devem ter sua admissao negada. 8. 9 _ poe *,sEstatistica . . UFPR a) O grafico de dispersao e a linha de regressao. b) Soa; = 410, Soy; = 5445, Soa? = 15650, $0 ay; = 191325 en = 12. Usamos a igualdade a ye tiyi — NTY _ nde iyi — Vi Vi Di Yi : do 27 — na? nda? -—(Y, ai)? Portanto, , 12)(191325) — (410) (5445 B, = (42)(191825) — (410)(5445) _ 3 ong, 12)(15650) — (410)? , 445 — (3.2208) (410 Po = DAMS ~ (8.2208)(410) _ 343 7056. 12 Portanto, 7 = 343.7056 + 3.2208 - x. (c) Quando x = $35, § = 343.7056 + (3.2208) (35) = 456.43. 9. a) O grafico de dispersao e a linha de regressao. b) Soa, = 401, Soy = 2301, Soa? = 22495, SO ays = 118652 en =8 Usamos a igualdade B _ i LiYys — NLY _ n> Lyi — i vi i Yi Dap ont nah = (Lye)? Portanto, 5 (8)(118652) — (401)(2301) a NNN = 1.3839 Pr (8) (22495) — (401)? 5 2301 — (1.3839) (401 Po = 2301 ~ (2.3839)(401) 3 491) _ 919,96. Portanto, 7 = 218.26 + 1.3839 - x. c) Para « = 65°F, § = 218.26 + (1.3839) (65) = 308.21. 10. A partir do resumo dos dados, obtemos , (12) (318) — [(4)(12)]10.2)2)) By = 5 = —6.45, (12) (232) — [(4)(12)] Bo = 12—(-6.45)(4) = 37.8. Portanto, 7 = 37.8 — 6.45. ax. Parece que participar de reunides profissionais nao resulta na publicacgéo de mais artigos. 11. (a) § = —11.3251 — 0.0449 temperatura. (b) Sim. 10 (c) 0.9355. (d) A proporção de impurezas depende da temperatura. No entanto, com base no gráfico, não parece que a dependência seja linear. Se houver réplicas, um teste de falta de ajuste pode ser realizado. 12. Hipóteses: H0 : µ1 = µ2 = · · · = µ5 H1 : pelo menos duas médias não são iguais, α = 0.05. Região crítica: (α = 0.05) : F > 2.76 com ν1 = 4 e ν2 = 25 graus de liberdade. Os cálculos das somas dos quadrados fornecem SQTotal= 209377, SQTrat = 85356, SQResíduo = 209377 - 85356 = 124021. Decisão: Rejeitar H0 e concluir que os agregados não têm a mesma média de absorção. O p-valor para F = 4.30 é menor que 0.05. GL SQ QM F p-valor Tratamento 4 85356.47 21339.12 4.30 0.0088 Resíduos 25 124020.33 4960.81 13. As hipóteses estatísticas são H0 : µ1 = µ2 = · · · = µ6 H1 : pelo menos duas médias não são iguais. α = 0.05. Região Crítica: F > 2.77 com ν1 = 5 and ν2 = 18 graus de liberdade. Cálculos: GL SQ QM F p-valor Tratamento 5 5.34 1.07 0.31 0.9024 Resíduos 18 62.64 3.48 com p-valor = 0.9024. Decisão: As médias de tratamento não diferem significativamente. 14. 11 As hipóteses estatísticas são H0 : µ1 = µ2 = · · · = µ5 H1 : pelo menos duas médias não são iguais. α = 0.05. Região Crítica: F > 2.87 com ν1 = 4 and ν2 = 20 graus de liberdade. Cálculos: GL SQ QM F p-valor Tratamento 4 78.422 19.605 6.59 0.0015 Resíduos 20 59.532 2.977 com p-valor = 0.0015. Decisão: Rejeitar H0. O número médio de horas de alívio difere significativamente. 15. As hipóteses estatísticas são H0 : µ1 = µ2 = µ3 = µ4 H1 : pelo menos duas médias não são iguais. α = 0.05. Cálculos: GL SQ QM F p-valor Tratamento 3 119.649 39.883 7.10 0.0121 Resíduos 8 44.920 5.615 com p-valor = 0.0121. Decisão: Rejeitar H0. Há uma diferença significativa na redução do rendimento médio para as 4 combinações pré-selecionadas. 12

Envie sua pergunta para a IA e receba a resposta na hora

Texto de pré-visualização

Exercícios da Unidade 1 Estatística Descritiva Os exercícios foram extraídos de seções do livro: Magalhães, MN; Lima, ACP. Noções de Probabilidade e Estatística. São Paulo: EDUSP, 2008. 1. Classifique cada uma das variáveis abaixo em qualitiva (nominal / ordinal) ou quantitativa (discreta / contínua). a) Ocorrência de hipertensão pré-natal em grávidas com mais de 35 anos (sim ou não são possíveis respostas para esta variável). b) Intenção de voto para presidente (possíveis respostas são os nomes dos candidatos ou não sei). c) Perda de peso de maratonistas na Corrida de São Silvestre, em gramas. d) Intensidade da perda de peso de maratonistas na Corrida de São Silvestre (leve, moderada, forte). e) Grau de satisfação da população brasileira com relação ao trabalho de seu presidente (valores de 0 a 5, com 0 indicando totalmente insatisfeito e 5 totalmente satisfeito). 2. Um grupo de 84 estudantes do ensino médio foi submetido a um teste de matemática resultando em: Nota Frequência [0; 2) 14 [2; 4) 28 [4; 6) 27 [6; 8) 11 [8; 10) 4 a) Construa o histograma. b) Se a nota mínima para aprovação é 5, qual será a porcentagem de aprovação? c) Obtenha o gráfico de caixa e bigodes (box-plot). 3. Responda certo ou errado, justificando: a) Suponha duas amostras colhidas de uma mesma população, sendo uma delas de tamanho 100 e outra de tamanho 200. Então, a amostra de tamanho maior é mais representativa da população. b) Duas variáveis diferentes podem apresentar histogramas idênticos. c) Duas variáveis com gráficos de caixas e bigodes (box-plot) iguais não podem ter valores diferentes. 4. Uma pesquisa com usuários de transporte coletivo na cidade de São Paulo indagou sobre os diferentes tipos nas suas locomoções diárias. Dentre ônibus, metrô e trem o número de diferentes meios de transporte foi o seguinte: 2, 3, 2, 1, 2, 1, 2, 1, 2, 3, 1, 1, 1, 2, 2, 3, 1, 1, 1, 1, 2, 1, 1, 2, 2, 1, 2, 1, 2 e 3. a) Organize uma tabela de frequência. b) Faça uma representação gráfica. c) Admitindo que essa amostra represente bem o comportamento do usuário paulistano, você acha que a porcentagem dos usuários que utilizam mais de um tipo de transporte é grande? 5. Um novo medicamento para cicatrização está sendo testado e um experimento é feito para estudar o tempo (em dias) de completo fechamento em cortes provenientes de cirurgia. Uma amostra em trinta cobaias forneceu os valores: 15, 17, 16, 15, 17, 14, 17, 16, 16, 17, 15, 18, 14, 17, 15, 14, 15, 16, 17, 18, 18, 17, 15, 16, 14, 18, 18, 16, 15 e 14. a) Organize uma tabela de frequência. b) Que porcentagem das observações estão abaixo de 16 dias? c) Classifique como rápida as cicatrizações iguais ou inferiores a 15 dias e como lenta as demais. Faça um gráfico de setores indicando as porcentagens para cada classificação. 6. Um grupo de pedagogos estuda a influência da troca de escolas no desempenho de alunos do ensino fundamental. Como parte do levantamento realizado, foi anotado o número de escolas cursadas pelos alunos participantes do estudo. Escolas Cursadas Frequência 1 46 2 57 3 21 4 15 5 4 a) Qual é a porcentagem dos alunos que cursaram mais de uma escola? b) Construa o gráfico de barras. c) Classifique os alunos em dois grupos segundo a rotatividade: alta para alunos com mais de 2 escolas e baixa para os demais. Obtenha a tabela de frequência dessa variável. 7. Alunos da Escola de Educação Física foram submetidos a um teste de resistência quanto ao número de quilômetros que conseguiram correr sem parar. Os dados estão apresentados a seguir. Classes Frequência [0; 4) 438 [4; 8) 205 [8; 12) 125 [12; 16) 22 [16; 20) 9 a) Qual é a variável em estudo? b) Construa o histograma. c) Obtenha o gráfico de caixa e bigodes (box-plot). 8. Foram feitas medidas em operários da construção civil a respeito da taxa de hemoglobina no sangue em gramas por centímetros cúbicos, apresentando os seguintes resultados: 11.1, 12.2, 11.7, 12.5, 13.9, 12.3, 14.4, 13.6, 12.7, 12.6, 11.3, 11.7, 12.6, 13.4, 15.2, 13.2, 13.0, 16.9, 15.8, 14.7, 13.5, 12.7, 12.3, 13.5, 15.4, 16.3, 15.2, 12.3, 13.7 e 14.1. a) Organize os dados em classes de tamanho 1 a partir do 11. b) Construa o histograma. c) Determine o terceiro quartil e a mediana. d) Taxas abaixo de 12 ou acima de 16 são consideradas alteradas e requerem acompanhamento médico. Obtenha a tabela de frequência da variável Acompanhamento Médico com duas opções: sim ou não. 9. Num estudo sobre rotatividade da mão-de-obra na indústria, anotou-se o número de empregos nos últimos 3 meses para operários especializados e não especializados. Os dados estão apresentados abaixo. a) Construa o gráfico de barras correspondente a cada tabela usando a porcentagem no eixo das ordenadas. b) Junte as informações das duas tabelas em uma só e obtenha um gráfico de barras da rotatividade de mão-de-obra na indústria (sem diferenciar a especialização). c) Você acha que os trabalhadores especializados trocam menos de emprego? Justifique. 2 Não Especializados Empregos freq. 1 106 2 222 3 338 4 292 5 164 total 1122 Especializados Empregos freq. 1 210 2 342 3 109 4 91 5 35 total 787 10. Um exame vestibular para uma faculdade tem 80 questões, sendo 40 de português e 40 de matemática. Para os 20 melhores classificados, apresentamos o número de acertos em cada disciplina, em ordem decrescente do total de pontos. aluno 1 2 3 4 5 6 7 8 9 10 Português 35 35 34 32 31 30 26 26 24 23 Matemática 31 29 27 28 28 26 30 28 25 23 aluno 11 12 13 14 15 16 17 18 19 20 Português 23 12 11 20 17 12 14 20 8 10 Matemática 21 32 31 20 21 25 20 13 23 20 a) Calcule as medidas de centro: média, mediana e moda para cada grupo. b) Calcule as medidas de variabilidade: variância, desvio-padrão, e coeficiente de variação para cada grupo. c) Calcule o resumo dos cinco números (mínimo, Q1, Q2, Q3 e máximo) para cada grupo. d) Construa um gráfico de caixa e bigodes (box-plot) para cada grupo (em um mesmo gráfico para comparação). e) Com todos os resultados obtidos, descreva comparativamente estes dois grupos em termos de medidas de tendência central, variabilidade, amplitude e distribuição (simetria) dos dados. f) Você acha que os aprovados são melhores em português ou matemática? 11. Discuta quais medidas de posição seriam mais adequadas para os conjuntos de dados abaixo. Comente suas escolhas. a) Estão disponíveis dados mensais sobre a incidência de envenenamento por picada de cobra. Deseja- se planejar a compra mensal de antídoto. b) O número diário de usuários, entre 17 e 19 horas, de determinada linha de ônibus foi anotado. Pretende-se utilizar essa informação para dimensionar a frota em circulação. c) Um fabricante de baterias deseja divulgar a durabilidade do seu produto e coleta informação sobre a duração de 100 de suas baterias. d) Num voo internacional uma companhia serve dois tipos de pratos de jantar: peixe ou frango. Um banco de dados contém os pedidos feitos nos últimos 200 voos. Pretende-se planejar o número de cada tipo a ser colocado à disposição dos passageiros. 12. Vinte e cinco residências de um certo bairro foram sorteadas e visitadas por um entrevistador que, entre outras questões, perguntou sobre o número de televisores. Os dados foram os seguintes: 2, 2, 2, 3, 1, 2, 1, 1, 1, 1, 0, 1, 2, 2, 2, 2, 3, 1, 1, 3, 1, 2, 1, 0 e 2. Organize os dados numa tabela de frequências e determine as diversas medidas de posição. 13. Num experimento, 15 coelhos foram alimentados com uma nova ração e seu peso avaliado ao fim de um mês. Os dados referentes ao ganho de peso (em quilogramas) foram os seguintes: 1.5; 1.6; 2.3; 1.7; 1.5; 2.0; 1.5; 1.8; 2.1; 2.1; 1.9; 1.8; 1.7; 2.5 e 2.2. a) Utilizando os dados brutos, determine média, moda e mediana desse conjunto. 3 b) Organize uma tabela de frequência com classes de amplitude 0.2 a partir de 1.5. c) Calcule, a partir da tabela de frequências e com o ponto médio como representante de cada classe, a média, a moda e a mediana. Comente as diferenças encontradas com o item (a). d) Se ao invés de 15, fossem 500 coelhos, qual seria o procedimento mais conveniente: o do item (a) ou o de (c)? Ter acesso a computador faz diferença? 14. Você está indeciso em comprar uma televisão e decide avaliar algumas informações estatísticas fornecidas pelo fabricante, sobre a duração (em horas) do tubo de imagem. Marca da TV GA FB HW Média 8000 8200 8000 Mediana 8000 9000 7000 Desvio Padrão 600 1500 2500 Com que marca você ficaria? Justifique. 15. A pulsação de 10 estudantes no início de uma prova de estatística foram as seguintes (em batimentos por minuto): 80, 91, 84, 86, 93, 88, 80, 89, 85 e 86. Calcule a média e a variância desse conjunto de dados. 16. Estudando uma nova técnica de sutura, foram contados os dias necessários para a completa cicatrização de determinada cirurgia. Os resultados de 25 pacientes foram os seguintes: 6, 8, 9, 7, 8, 6, 6, 7, 8, 9, 10, 7, 8, 10, 9, 9, 9, 7, 6, 5, 7, 7, 8, 10 e 11. Organize os dados numa tabela de frequência e calcule a média e a variância. 17. As notas finais de estística para alunos de um curso de Administração foram as seguintes: 7, 5, 4, 5, 6, 3, 8, 4, 5, 4, 6, 4, 5, 6, 4, 6, 6, 3, 8, 4, 5, 4, 5, 5 e 6. a) Determine a mediana e a média. b) Separe o conjunto de dados em dois grupos denominados aprovados, com nota maior ou igual a 5, e reprovados para os demais. Compare a variância desses dois grupos. 18. Foram anotados os níveis de colesterol (em mg/100ml) par trinta pacientes de uma clínica cardíaca. As medidas se referem a homens entre 40 e 60 anos de idade que foram à clínica fazer um check-up. Paciente 1 2 3 4 5 6 7 8 9 10 Colesterol 160 160 161 163 167 170 172 172 173 177 Paciente 11 12 13 14 15 16 17 18 19 20 Colesterol 178 181 181 182 185 186 194 197 199 203 Paciente 21 22 23 24 25 26 27 28 29 30 Colesterol 203 205 206 206 208 209 211 214 218 225 a) Calcule a média, a moda e a variância a partir dos dados. b) Organize os dados em uma tabela de frequência com classes de tamanho de 10 a partir de 160. c) Refaça o item (a) usando a tabela de frequência obtida em (b). d) Comente as diferenças encontradas entre os valores das medidas calculadas em (a) e (c). 19. Seja o seguinte quadro da concentração de albumina (g%) e do hormônio do crescimento (mm/ml) no plasma de carneiros. Albumina 1.0 2.0 3.0 4.0 5.0 6.0 7.0 Hormônio 35.0 41.4 46.7 52.8 60.3 65.9 70.3 a) Faça um gráfico adequado para verificar se há uma relação linear entre a concentração de albumina e hormônio do crescimento. b) Quantifique o grau de associação linear entre essas duas variáveis? 4 Respostas 1. a) Qualitativa nominal. b) Qualitativa nominal. c) Quantitativa contínua. d) Qualitativa ordinal. e) Qualitativa ordinal. 2. a) Notas Frequência Absoluta 0 2 4 6 8 10 0 5 10 15 20 25 30 Q1 Q3 17% 33% 32% 13% 5% b) A nota mínima para aprovação é 5 e observando a tabela de frequências notamos que 5 está exatamente no centro do intervalo [4; 6) cuja frequência é 27. Para encontrar o percentual de estudantes aprovados vamos supor que as notas se distribuem de maneira uniforme dentro de cada intervalo e portanto esperamos que 50% das 27 notas do intervalo [4; 6) esteja no intervalo [5; 6), ou seja uma frequência de 27/2 = 13.5 no intervalo [5; 6). Assim, o percentual de aprovados será: (50% da frequência no intervalo [4; 6)+frequência no intervalo [6; 8)+frequência no intervalo [8; 10))/número total de estudantes ×100 = ((27×0.5)+11+4) 14+28+27+11+4 × 100 = 34%. c) Para obter box-plot precisamos de várias quantidades: mínimo = 0, máximo =10, Q1 = 2.50, Q2 = 4, Q3 = 5.56. 0 2 4 6 8 5 Como encontrar os valores de Q1, Q2 e Q3 a partir da tabela de frequências para dados agrupados em classes? i. Calcular as frequências relativas, as acumuladas e as relativas acumuladas; Nota Frequência Frequência Relativa Frequência Acumulada Frequência Relativa Acumulada [0; 2) 14 0.17 14 0.17 [2; 4) 28 0.33 42 0.5 [4; 6) 27 0.32 69 0.82 [6; 8) 11 0.13 80 0.95 [8; 10) 4 0.05 84 1 ii. Para calcular o quartil de interesse vamos usar a seguinte notação: • n é o número total de observações; • Qi(i = 1, 2, 3) é o quartil que desejamos obter; • (i · n/4) é a posição na qual se encontra o quartil Qi; • l é o limite inferior da classe que contem Qi; • f é a frequência na classe que contem Qi; • h é a amplitude na classe que contem Qi; • Fant é a frequência acumulada até a classe anterior à que contem Qi. O quartil Qi é obtido aplicando-se a seguinte foŕmula: Qi = l + (i · n/4 − Fant) f · h Por exemplo, o quartil Q1 é o valor que deixa 25% das observações abaixo dele. Para os dados deste exercício, observando a coluna de frequências relativas acumuladas, notamos que 17% das observações estão abaixo de 2 e 50% das observações estão abaixo de 4, então Q1 é algum valor no intervalo [2; 4): Q1 = 2 + (1 · 84/4 − 14) 28 · (4 − 2) = 2.5 De modo similar para Q3 temos: Q3 = 4 + (3 · 84/4 − 42) 27 · (6 − 4) = 5.56 Derivando a fórmula acima: A equação genérica acima é obtida por meio de interpolação linear de Qi entre os limites inferior e superior da classe que contem Qi. Esta interpolação na prática implica na seguinte regra de três: (Qi − l) está para i/4 − (Fant/n) assim como h está para (F/n) − (Fant/n), em que F é a frequência acumulada até a classe que contem Qi. Fazendo algumas manipulações matemáticas obtemos a fórmula apresentada acima. (Qi − l) i/4 − (Fant/n) = h (F/n) − (Fant/n) = h (F − Fant)/n = h f/n = n · h f (Qi − l) = (i/4 − (Fant/n)) · n · h f = (i · n/4 − Fant) · h f Qi = l + (i · n/4 − Fant) · h f 3. a) Errado. Nem sempre uma amostra maior irá representar melhor a população. Depende de como essa amostra foi coletada. Se as duas amostras forem coletadas com o mesmo cuidado usando o método de amostragem mais adequado, então a maior representará tão bem ou melhor do que a menor. 6 b) Certo. Se as duas variáveis em questão forem tão correlacionadas que suas frequências sejam as mesmas. c) Errado. Duas variáveis com boxplots iguais podem ter valores diferentes, bastando para isso este valor diferente não influenciar o cálculo dos quartis e nem os valores mínimo e máximo do conjunto de dados. 4. a) Num. Transp. 1 2 3 total frequência 14 12 4 30 freq. relativa 0.47 0.4 0.13 1 b) Esses dados podem ser representados com um gráfico de setores ou um gráfico de barras. c) Sim, é mais de 50%. 5. a) Cicatrização 14 15 16 17 18 total frequência 5 7 6 7 5 30 freq. relativa 0.167 0.233 0.2 0.233 0.167 1 b) 40%. c) Cicatrização rápida: 40% lenta: 60%. 6. a) 68% b) 1 2 3 4 5 Escolas cursadas Frequência 0 10 20 30 40 50 c) Rotatividade alta baixa total frequência 40 103 143 freq. relativa 0.28 0.72 1 7. a) Quilômetros percorridos sem parar. b) Construa o histograma. 7 Distância (km) Frequência Absoluta 0 5 10 15 20 0 100 200 300 400 Q1 Q2 Q3 55% 26% 16% 3% 1% Classes Frequência Frequência Relativa Frequência Acumulada Frequência Relativa Acumulada [0; 4) 438 0.55 438 0.55 [4; 8) 205 0.26 643 0.8 [8; 12) 125 0.16 768 0.96 [12; 16) 22 0.03 790 0.99 [16; 20) 9 0.01 799 1 c) Para o box-plot use mínimo = 0, Q1 = 1.82; Q2 = 3.65; Q3 = 7.15; máximo = 20. Q1 = 0 + (1 · 799/4 − 0) 438 · (4 − 0) = 1.82 Q2 = 0 + (2 · 799/4 − 0) 438 · (4 − 0) = 3.65 Q3 = 4 + (3 · 799/4 − 438) 205 · (8 − 4) = 7.15 8. ## Warning in hist.default(x, breaks = c(11:17), include.lowest = TRUE, plot = ## FALSE, : argument 'col' is not made use of a) Taxa de hemoglobina (g) [11; 12) [12; 13) [13; 14) [14; 15) [15; 16) [16; 17) total frequência 4 9 8 3 4 2 30 freq. relativa 0.13 0.3 0.27 0.1 0.13 0.07 1 b) 8 Taxa de hemoglobina (g) Frequência 11 12 13 14 15 16 17 0 2 4 6 8 10 c) Q2 = 13.3 e Q3 = 14.4. d) Acompanhamento médico Sim Não total frequência 6 24 30 freq. relativa 0.2 0.8 1 9 9. a) Não Especializados 1 2 3 4 5 Rotatividade Frequência (%) 0 5 10 15 20 25 30 Especializados 1 2 3 4 5 Rotatividade Frequência (%) 0 10 20 30 40 b) 1 2 3 4 5 Rotatividade de mão−de−obra Frequência (%) 0 5 10 15 20 25 30 c) Sim, 30% dos trabalhadores especializados tem rotatividade acima de 2 enquanto entre os não especial- izados este percentual é de 71%. 10. a) Medidas de centro Port Mat ¯y 22.15 25.05 md 23 25.5 mo c("12", "20", "23", "26", "35") c("20", "28") b) Medidas de dispersão Port Mat s2 80.13 23.84 s 8.95 4.88 CV 40.4 19.5 c) Medidas resumo Port Mat Min 8 13 Q1 13 21 Q2 23 25.5 Q3 30.5 28.5 Max 35 32 d) 10 mat port 10 15 20 25 30 35 Disciplina Notas e) (Exemplo de resposta) Em média, o número de acertos em matemática (¯ymat = 25.05) foi maior do que o número de acertos em português (¯yport = 22.15). A diferença entre os valores médios e a mediana mostra que existe uma leve assimetria negativa (ou à esquerda) para os dois casos (¯y < md), embora esta diferença seja mais pronuciada nas notas de português. A amplitude dos acertos em português foi de Aport = 35 − 8 = 27, maior do que a amplitude observada para o número de acertos em matemática, que foi de Amat = 32 − 13 = 19. A variabilidade dos acertos em torno da média também foi maior para as notas de português, com variância de s2 port = 80.13 e desvio-padrão de sport = 8.95. Já para a matemática, a variabilidade dos acertos em torno da média também foi menor, com s2 mat = 23.84 e desvio-padrão smat = 4.88. Resumindo estas informações sobre a variabilidade, nota-se que o coeficiente de variação para português foi de 40.4%, enquanto que para a matemática foi menor, com aproximadamente 19.5%. Através do resumo dos cinco múmeros e do gráfico de caixa, percebe-se que 50% dos acertos foram entre 13 e 30.5 em português (diferença entre Q1 e Q3), e entre 21 e 28.5 em matemática, mostrando novamente a menor variabilidade observada para a matemática. f) Use os resultados obtidos nos itens anteriores para formular sua resposta. 11. Este exercício é para possibilitar discussão entre os alunos sobre as várias formas de resumir a informação e portanto não existe uma resposta correta. a) O valor mediano deve ser suficiente em cerca de 50% dos meses. Se há meses com grande número de acidentes por questões sazonais como colheita ou enchentes, a média será afetada. É bom estar atento se a variabilidade dos dados não é grande. b) Para dimensionar a frota de ônibus podemos decidir do ponto de vista do usuário ou da empresa de ônibus. Do ponto de vista do usuário, pretende-se mais espaço sentado e ônibus não muito cheio; a empresa tentaria colocar o maior número de ônibus circulando. O número médio diário de passageiros nesse período pode ser dividido pelo número de assentos ou pela lotação total do ônibus dependendo de qual interesse pretende-se atender. c) A duração média é talvez a melhor medida a observar. Entretanto, se a moda for um valor alto (longa duração) pode ser útil utilizá-la como publicidade. d) Pode-se definir uma variável quantitativa indicando a proporção de quantos pedem frango (ou peixe) em cada voo. A moda dessa variável multiplicada pelo número total de passageiros no voo, poderia ser a quantidade de pratos colocados à disposição para tentar garantir o atendimento de todos os pedidos. 12. Tabela de frequência: TVs 0 1 2 3 total Freq. 2 10 10 3 25 11 ¯y = 1.56; md = 13o. termo em ordem crescente = 2; mo = 1 ou 2. 13. a) Com os dados brutos ¯y = 1.88; md = 1.8 (observação que ocupa a 8a. posição em ordem crescente); mo = 1.5. b) Tabela de frequência Ganho [1.5; 1.7) [1.7; 1.9) [1.9; 2.1) [2.1; 2.3) [2.3; 2.5] total Freq. 4 4 2 3 2 15 c) Com a tabela de frequência no item anterior e usando o ponto médio da faixa obtemos: ¯y = 1.933; md = 1.8 e mo = [1.5, 1.7); [1.7, 1.9). As diferenças entre as soluções de (a) e (c) não foram grandes nesse caso. A solução de (a) é mais exata. d) Os valores obtidos no item (a) possuem maior precisão, contudo, para um volume grande de dados, o cálculo fica muito trabalhoso para ser feito sem a ajuda de um computador. Notamos que a organização em classes é conveniente e os valores encontrados nas duas formas de calcular não diferem muito. 14. As médias são similares. A mediana de FB é mais alta, o que é um fator positivo. Por outro lado, HW tem a menor mediana e, portanto, essa marca deve ser desconsiderada. Notemos que o desvio de FB é duas vezes e meia maior do que o de GA. Como GA tem mediana não muito baixa e pouca variabilidade, parece ser a melhor opção. Portanto, recomendamos comprar a marca GA. 15. Utilizando as expressões para dados não agrupados, temos: ¯y = 86.20; s2 = 18.18. 16. Tabela de frequência: Dias para cicatrização 5 6 7 8 9 10 11 total Freq. 1 4 6 5 5 3 1 25 Utilizando as expressões para dados não agrupados, temos: ¯y = 7.88; s2 = 2.36. 17. a) md = 5 e ¯y = 5.12 b) s2 aprov. = 1.05 > s2 reprov. = 0.19 mas CVaprov. = 17% e CVreprov. = 12% são próximos. 18. a) ¯y = 188.87; md = 185.5; mo = 160, 172, 181, 203 ou 206 e s2 = 369.29. b) Tabela de frequência: Colesterol [160; 170) [170; 180) [180; 190) [190; 200) [200; 210) [210; 220) [220; 230) total Freq. 5 6 5 3 7 3 1 30 c) Com a tabela de frequência no item anterior e usando o ponto médio da faixa obtemos: ¯y = 189.67; s2 = 322.30; md = 185 e mo = 205. d) Os valores obtidos no item (a) são mais precisos, entretanto, para um grande número de dados, o cálculo fica muito trabalhoso para ser feito sem o auxílio de um computador. Notamos que, mesmo a variável sendo quantitativa discreta, a organização em classes é conveniente e os valores encontrados nas duas formas de calcular não são muito diferentes. 19. a) Um gráfico adequado para visualizar a relação entre duas variáveis quantitativas é o diagrama de dispersão. Neste caso, há uma clara relação linear entre as duas variáveis. 12 . roe *,sEstatistica . . UFPR rR ° Lo Oo Oo 3 ° 2 5 iB 5 5 8 e} 2 9 Oo 8 ° 1 2 3 4 5 6 7 Albumina b) Para o calculo do coeficiente de correlagao de Pearson precisamos de 5°; (yi; — 91) (Yai — Yo) = 168.5, (yi — 91)? = 28 e YD, (y2i — Y2)? = 1017. Assim o coeficiente é obtido por (Yi — Y iy 168.5 r- DeilY - 41) (Yai — Y2) — — 0.9985 VrualMi — 11)? Ji (y2 — Y2)?_ —-V28V'1017 que indica uma forte associacao positiva entre as varidveis. 13 Exercícios da Unidade 2 Probabilidades Os exercícios foram extraídos dos livros: Bussab, WO; Morettin, PA. Estatística Básica. São Paulo: Editora Saraiva, 2006 (5ª Edição). Magalhães, MN; Lima, ACP. Noções de Probabilidade e Estatística. São Paulo: EDUSP, 2008. 1. Para cada um dos casos abaixo, escreva o espaço amostral correspondente e conte seus elementos. a) Uma moeda é lançada duas vezes e observam-se as faces obtidas. b) Um dado é lançado duas vezes e a ocorrência de face par ou ímpar é observada. c) Uma urna contém 10 bolas azuis e 10 bolas vermelhas com dimensões rigorosamente iguais. Três bolas são selecionadas ao acaso com reposição e as cores são anotadas. d) Dois dados, com as faces enumeradas de 1 a 6, são lançados simultaneamente e estamos interessados na soma das faces observadas. e) Em uma cidade, famílias com três crianças são selecionadas ao acaso, anotando-se o sexo de cada uma. f) Uma máquina produz 20 peças por hora, escolhe-se um instante qualquer e observa-se o número de defeituosas na próxima hora. g) Uma moeda lançada consecutivamente até o aparecimento da primeira cara. 2. Sendo A e B dois eventos em um mesmo espaço amostral, “traduza” para a linguagem da teoria dos conjuntos as seguintes situações: a) Pelo menos um dos eventos ocorre. b) O evento A ocorre mas o evento B não. c) Nenhum deles ocorre. d) Exatamente um dos eventos ocorre. 3. Uma universidade tem 10000 alunos dos quais 4000 são considerados esportistas. Temos, ainda, que 500 alunos são do curso de biologia diurno, 700 da biologia noturno, 100 são esportistas e da biologia diurno e 200 são esportistas e da biologia noturno. Um aluno é escolhido, ao acaso, e pergunta-se a probabilidade de: a) Ser esportista. b) Ser esportista e aluno da biologia noturno. c) Não ser da biologia. d) Ser esportista ou aluno da biologia. e) Não ser esportista, nem aluno da biologia. 4. Sejam A e B dois eventos em um dado espaço amostral, tais que P(A) = 0.2, P(B) = p, P(A ∪ B) = 0.5 e P(A ∩ B) = 0.1. Determine o valor de p. 5. Dois processadores tipos A e B são colocados em teste por 50 mil horas. A probabilidade de que um erro de cálculo aconteça em um processador do tipo A é de 1/30, no tipo B, 1/80 e, em ambos, 1/1000. Qual a probabilidade de que: a) Pelo menos um dos processadores tenha apresentado erro? b) Nenhum processador tenha apresentado erro? c) Apenas o processador A tenha apresentado erro? 6. Considere dois eventos A e B, mutuamente exclusivos, com P(A) = 0.3 e P(B) = 0.5. Calcule: a) P(A ∩ B). b) P(A ∪ B). c) P(A|B). d) P(Ac). e) P((A ∪ B)c). 7. Se P(A ∪ B) = 0.8; P(A) = 0.5 e P(B) = x, determine o valor de x no caso de: a) A e B serem mutuamente exclusivos. b) A e B serem independentes. 8. Uma escola do ensino médio do interior de São Paulo tem 40% dos estudantes do sexo masculino. Entre estes, 20% nunca viram o mar, ao passo que, entre as meninas, essa porcentagem é de 50%. Qual a probabilidade de que um aluno selecionado ao acaso seja: a) Do sexo masculino e nunca tenha visto o mar? b) Do sexo feminino ou nunca tenha visto o mar? 9. Se P(B) = 0.4; P(A) = 0.7 e P(A ∩ B) = 0.3, calcule P(A|Bc). 10. O São Paulo Futebol Clube ganha com probabilidade 0.7 se chove e com 0.8 se não chove. Em Setembro, a probabilidade de chuva é de 0.3. Se o São Paulo ganhou uma partida em Setembro, qual a probabilidade de ter chovido nesse dia? 11. Uma moeda é viciada de modo que a probabilidade de sair cara é 4 vezes maior que a de sair coroa. Para 2 lançamentos independentes dessa moeda, determinar: a) O espaço amostral. b) A probabilidade de sair somente uma cara. c) A probabilidade de sair pelo menos uma cara. d) A probabilidade de sair dois resultados iguais. 12. Verifique se são válidas as afirmações: a) Se P(A) = 1/3 e P(B|A) = 3/5, então A e B não podem ser disjuntos. b) Se P(A) = 1/2, P(B|A) = 1 e P(A|B) = 1/2, então A não pode estar contido em B. 13. As preferências de homens e mulheres por cada gênero de filme alugado em uma locadora de vídeos estão apresentadas na próxima tabela. Sorteando-se, ao acaso, uma dessas locações de vídeo, pergunta-se a probabilidade de: a) Uma mulher ter alugado um filme policial. b) O filme alugado ser uma comédia. c) Um homem ter alugado ou o filme ser um romance. d) O filme ser policial dado que foi alugado por um homem. Sexo/Filme Comédia (C) Romance (R) Policial (P) Homens (H) 136 92 248 Mulheres (M) 102 195 62 14. Dois dados equilibrados são lançados. Calcule a probabilidade de: a) Obter os valores 3 e 4 (em qualquer ordem), sabendo-se que ocorreu face par no primeiro dado. b) Ocorrer face ímpar no segundo dado sabendo-se que ocorreu face par no primeiro dado. 15. Dois armários guardam as bolas de voleibol e basquete. O armário 1 tem 3 bolas de voleibol e 1 de basquete, enquanto o armário 2 tem 3 bolas de voleibol e 2 de basquete. Escolhendo-se, ao acaso, um armário e, em seguida, uma de suas bolas, calcule a probabilidade dela ser: a) De voleibol, sabendo-se que o armário 1 foi escolhido. 2 b) De basquete, sabendo-se que o armário 2 foi escolhido. c) De basquete. 16. A tabela a seguir apresenta informações de alunos de uma universidade quanto às variáveis: Período, Sexo e Opinião sobre a Reforma Agrária. Determine a probabilidade de escolhermos: a) Uma pessoa do sexo masculino e sem opinião sobre a reforma agrária. b) Uma mulher contrária a reforma agrária. c) Dentre os estudantes do noturno, um que seja a favor da reforma agrária. d) Uma pessoa sem opinião, sabendo-se que ela é do sexo feminino. Período Sexo Reforma Agrária Contra A Favor Sem opinião Diurno Feminino 2 8 2 Masculino 8 9 8 Noturno Feminino 4 8 2 Masculino 12 10 1 17. A tabela a seguir apresenta dados de 1000 ingressantes de uma universidade, com informações sobre área de estudo e classe sócio-econômica. Se um aluno ingressante é escolhido ao acaso, determine a probabilidade de: a) Ser da classe econômica mais alta. b) Estudar na área de exatas. c) Estudar na área de humanas, sendo de classe média. d) Ser de classe baixa, dado que estuda na área de biológicas. Área/Classe Alta (A) Média (M) Baixa (B) Exatas (Ex) 120 156 68 Humanas (Hu) 72 85 112 Biológicas (Bi) 169 145 73 18. Uma parte de um circuito elétrico é formada por 4 componentes conforme indicado no diagrama a seguir. Para o engenheiro avaliar a chance de falha do circuito completo, e talvez replanejá-lo, é preciso determinar a chance de falha dessa referida parte composta de 4 componentes. Dentro das caixas está a probabilidade de falha de cada elemento do circuito. Assuma que os elementos do circuito falhem de forma independente uns dos outros e calcule a proba- bilidade do circuito falhar. 19. Numa população sabe-se que 20% possuem certa doença. A probabilidade de uma pessoa sabiadamente doente (D) apresentar resultado positivo (T) num teste é de 80%, enquanto que a de uma pessoa sabidamente não doente (Dc) apresentar um resultado negativo (T c) é de 90%. Sabendo-se que os únicos resultados possíveis do teste são: positivo ou negativo, responda: a) Qual é a probabilidade de uma pessoa selecionada ao acaso da população apresentar um resultado positivo no teste? b) Qual é a probabilidade de uma pessoa ter um resultado negativo no teste sabendo-se que ela é doente? c) Qual é a probabilidade de uma pessoa testada como positivo de fato ter a doença? d) Os eventos T e D são mutuamente exclusivos? Justifique sua resposta. e) Os eventos T e D são independentes? Justifique sua resposta. 3 20. Três indivíduos tentam, de forma independente, resolver um problema. O primeiro tem 50% de chance de resolver, o segundo tem 65% e o terceiro tem 30%. Qual a probabilidade do problema ser resolvido? 21. Um candidato está fazendo uma prova de múltipla escolha com cinco alternativas das quais apenas uma é correta. A chance do candidato saber a solução de uma questão é de 40%. Quando ele sabe a solução ele sempre acerta a questão e quando não sabe ele escolhe uma das respostas ao acaso. Se o candidato acerta a questão, qual a probabilidade de ele saber resolver a questão? 4 Respostas 1. a) Ω = {CC, CR, RC, RR}, com C sendo face cara e R face coroa; contém 4 elementos. b) Ω = {PP, PI, IP, PP}, com P sendo face par e I face ímpar; contém 4 elementos. c) Ω = {AAA, AAV, AV A, V AA, AV V, V AV, V V A, V V V }, sendo A bola azul e V vermelha; contém 8 elementos. d) Ω = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}; contém 11 elementos. e) Ω = {MMM, MMF, . . . , FFF}, com M e F representando a escolha de uma criança do sexo masculino e feminino, respectivamente, contém 8 elementos. f) Ω = {0, 1, 2, . . . , 20}; contém 21 elementos. g) Ω = {C, RC, RRC, RRRC, RRRRC, . . .}, com C sendo cara e R coroa; contém um número infinito de elementos. 2. a) A ∪ B. b) A ∩ Bc. c) Ac ∩ Bc. d) (A ∩ Bc) ∪ (Ac ∩ B). 3. Os cálculos ficam facilitados com a tabela abaixo: Atividade Biol. Noite (N) Biol. Diuno (D) Outros (O) Total Esportista (E) 200 100 3700 4000 Não esportista (Ec) 500 400 5100 6000 Total 700 500 8800 10000 a) Ser esportista: P(E) = 4000 10000 = 0.4. b) Ser esportista e aluno da biologia noturno: P(E ∩ N) = 200 10000 = 0.02. c) Não ser da biologia: P(O) = 8800 10000 = 0.88. d) Ser esportista ou aluno da biologia: P(E ∪ N ∪ D) = P(E) + P(N) + P(D) − P(E ∩ N) − P(E ∩ D) = 0.49. e) Não ser esportista, nem aluno da biologia: P(Ec ∩ O) = 5100 10000 = 0.51. 4. Utilizando a regra da adição de probabilidade, temos P(A ∪ B) = P(A) + P(B) − P(A ∩ B) 0.5 = 0.2 + p − 0.1 → p = 0.4. 5. Dados do exercício: P(A) = 1/30 = 0.033, P(B) = 1/80 = 0.013, P(A ∩ B) = 1/1000 = 0.001. Então, a) Pelo menos um dos processadores tenha apresentado erro? P(A ∪ B) = P(A) + P(B) − P(A ∩ B) = 0.045. b) Nenhum processador tem apresentado erro? P(Ac ∩ Bc) = P((A ∪ B)c) = 1 − P(A ∪ B) = 1− 0.045= 0.955. c) Apenas o processador A tenha apresentado erro? P(A ∩ Bc) = P(A) − P(A ∩ B) = 0.032. 5 6. Considere dois eventos A e B, mutuamente exclusivos, com P(A) = 0.3 e P(B) = 0.5. Então, a) P(A ∩ B) = 0. b) P(A ∪ B) = 0.8. c) P(A|B) = 0. d) P(Ac) = 0.7. e) P((A ∪ B)c) = 0.2. 7. a) Sendo P(A ∩ B) = 0, P(A ∪ B) = P(A) + P(B) − P(A ∩ B) 0.8 = 0.5 + x − 0 → x = 0.3. b) Sendo P(A ∩ B) = P(A)P(B), P(A ∪ B) = P(A) + P(B) − P(A) · P(B) 0.8 = 0.5 + x − 0.5 · x → x = 0.3/0.5 = 0.6. 8. Uma escola de ensino médio do interior de São Paulo tem 40% de estudantes do sexo masculino. Entre estes, 20% nunca viram o mar, ao passo que, entre as meninas, essa porcentagem é de 50%. Seja M usado para denotar os alunos do sexo masculino, M c as alunas do sexo feminino, V para denotar se um aluno já viu o mar e V c se não viu. A partir do enunciado, temos P(M) = 0.4, P(V c|M) = 0.2 e P(V c|M c) = 0.5. a) A probabilidade de selecionar um aluno do sexo masculino e que nunca tenha visto o mar: P(M ∩ V c) = P(V c|M) · P(M) = 0.2 · 0.4= 0.08. b) A probabilidade de selecionar uma pessoa do sexo feminino ou que nunca tenha visto o mar: P(M c ∪ V c) = P((M ∩ V )c) = 1 − P(M ∩ V ) = 1 − (P(V |M) · P(M)) P(M c ∪ V c) = 1 − ((1 − P(V c|M)) · P(M)) = 1 − ((1− 0.2 )· 0.4 ) P(M c ∪ V c) = 0.68. 9. Calcule P(A|Bc). Se P(B) = 0.4, P(A) = 0.7 e P(A ∩ B) = 0.3, então P(A|Bc) = P (A∩Bc) P (Bc) = P (A)−P (A∩B) 1−P (B) = 0.7−0.3 1−0.4 = 0.67. 10. Sejam os eventos C: chove em setembro e G: o São Paulo ganha um jogo. A partir do enunciado, temos P(G|C) = 0.7, P(G|Cc) = 0.8 e P(C) = 0.3. Então P(G) = P(G ∩ C) + P(G ∩ Cc) = P(G|C)P(C) + P(G|Cc)P(Cc) = 0.7 · 0.3 + 0.8 · (1 − 0.3) = 0.77 P(C|G) = P (C∩G) P (G) = P (G|C)P (C) P (G) = 0.273. 11. Sejam os eventos C: sair a face cara e R: sair a face coroa. Então a) O espaço amostral. Ω = {CC, CR, RC, RR}. 6 b) A probabilidade de sair somente uma cara. P(CR ∪ RC) = P(CR) + P(RC) = P(C)P(R) + P(R)P(C) = 0.32. c) A probabilidade de sair pelo menos uma cara. P(CR ∪ RC ∪ CC) = P(C)P(R) + P(R)P(C) + P(C)P(C) = 0.96. d) A probabilidade de sair dois resultados iguais. P(CC ∪ RR) = P(C)P(C) + P(R)P(R) = 0.68. 12. a) Se P(A) = 1/3 e P(B|A) = 3/5, então A e B não podem ser disjuntos. A afirmação é correta, pois P(A ∩ B) = P(B|A) · P(A) = 3/5 · 1/3 = 1/5 ̸= 0. b) Se P(A) = 1/2, P(B|A) = 1 e P(A|B) = 1/2, então A não pode estar contido em B. A afirmação está incorreta, pois P(B|A) = P (B∩A) P (A) = P (B∩A) 1/2 = 1. Portanto, P(B ∩ A) = 1/2 = P(A) e P(A|B) = P (A∩B) P (B) = 1/2 P (B) = 1/2. Como P(B) = 1, então A está totalmente contido em B. 13. a) P(P|M) = 62 102+195+62 = 0.173. b) P(C) = 136+102 136+92+248+102+195+62 = 0.285. c) P(H ∪ R) = P(H) + P(R) − P(H ∩ R) = (136+92+248)+(92+195)−(92) 136+92+248+102+195+62 = 0.804. d) P(P|H) = 248 136+92+248 = 0.521. 14. a) Obter os valores 3 e 4 (em qualquer ordem), sabendo-se que ocorreu face par no primeiro dado. Ω = {(1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6), (2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (2, 6), (3, 1), (3, 2), (3, 3), (3, 4), (3, 5), (3, 6), (4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6), (5, 1), (5, 2), (5, 3), (5, 4), (5, 5), (5, 6), (6, 1), (6, 2), (6, 3), (6, 4), (6, 5), (6, 6)} Seja o evento A: {(3, 4); (4, 3)} e o evento B: face par no primeiro dado, então (A ∩ B) = {(4, 3)} e P(A ∩ B) = 1/36 e P(B) = 18/36. P(A|B) = P (A∩B) P (B) = 1 18 = 0.056. b) Ocorrer face ímpar no segundo dado sabendo-se que ocorreu face par no primeiro dado. Sejam os eventos I: face ímpar no segundo dado e B: face par no primeiro dado. Então P(I|B) = P (I∩B) P (B) = 9/36 18/36 = 9 18 = 0.5. 15. Sejam os eventos A1: ser do armário 1; A2: ser do armário 2; V : a bola ser de vôlei e B: a bola ser de basquete. Então 7 a) P(V |A1) = P (A1∩V ) P (A1) = 3 4 = 0.75. b) P(B|A2) = P (A2∩B) P (A2) = 2 5 = 0.40. c) P(B) = P(A1)P(B|A1) + P(A2)P(B|A2) = 1 2 · 1 4 + 1 2 · 2 5 = 0.33. 16. Defina os eventos C: ser contra a reforma agrária, A: ser a favor da reforma agrária, O: ser sem opinião quanto a reforma agrária, F: ser do sexo feminino, M: ser do sexo masculino, N: ser do noturno e D: ser do diurno. a) Uma pessoa do sexo masculino e sem opinião sobre a reforma agrária: P(M ∩ O) = 8 + 1 2 + 8 + 2 + 8 + 9 + 8 + 4 + 8 + 2 + 12 + 10 + 1 = 9 74 = 0.122. b) Uma mulher contrária à reforma agrária: P(F ∩ C) = 6 2 + 8 + 2 + 8 + 9 + 8 + 4 + 8 + 2 + 12 + 10 + 1 = 6 74 = 0.081. c) Dentre os estudantes do noturno, um que seja a favor da reforma agrária: P(A|N) = 8 + 10 4 + 8 + 2 + 12 + 10 + 1 = 18 37 = 0.486. d) Uma pessoa sem opinião, sabendo-se que ela é do sexo feminino: P(O|F) = 2 + 2 2 + 8 + 2 + 4 + 8 + 2 = 4 26 = 0.154. 17. Considere os dados apresentados na tabela. Então, calcule as probabilidades de a) Ser da classe econômica mais alta: P(A) = 120 + 72 + 169 120 + 72 + 169 + 156 + 85 + 145 + 68 + 112 + 73 = 0.361 . b) Estudar na área de exatas: P(Ex) = 120 + 156 + 68 120 + 72 + 169 + 156 + 85 + 145 + 68 + 112 + 73 = 0.344 . c) Estudar na área de humanas, sendo de classe média: P(Hu|M) = P(M ∩ Hu) P(M) = 85 156 + 85 + 145 = 0.22 . d) Ser de classe baixa, dado que estuda na área de biológicas: P(B|Bi) = P(B ∩ Bi) P(Bi) = 73 169 + 145 + 73 = 0.189 18. Denotemos por: A o evento com probabilidade de falha de 0.30 (P(A) = 0.30), B o evento com probabilidade de falha de 0.45 (P(B) = 0.45), C e D os eventos com probabilidade de falha de 0.25 (P(C) = P(D) = 0.25). O circuito falhará (F) se A ou C falhar e se B ou D falhar. Em notação de conjuntos, temos F = (A ∪ C) ∩ (B ∪ D). O cálculo da probabilidade fica mais simples usando o evento complentar de F, F c = (A ∪ C)c ∪ (B ∪ D)c = (Ac ∩ Cc) ∪ (Bc ∩ Dc) Então 8 P(F c) = P(Ac ∩ Cc) + P(Bc ∩ Dc) − P(Ac ∩ Cc ∩ Bc ∩ Dc) = P(Ac)P(Cc) + P(Bc)P(Dc) − P(Ac)P(Cc)P(Bc)P(Dc) = 0.7 · 0.75 + 0.55 · 0.75 − (0.70 · 0.75 · 0.55 · 0.75) = 0.721. Portanto, P(F) = 1 − P(F c) = 0.279. 19. São fornecidos no enunciado do exercício: P(D) = 0.2, P(T|D) = 0.8 e P(T c|Dc) = 0.9. a) P(T) = P[(T e D) ou (T e Dc)] = P[(T ∩ D) ∪ (T ∩ Dc)] = P(T ∩ D) + P(T ∩ Dc) = P(T|D)P(D) + P(T|Dc)P(Dc) = P(T|D)P(D) + (1 − P(T c|Dc))(1 − P(D)) = 0.8 ∗ 0.2 + (1 − 0.9) ∗ (1 − 0.2) = 0.24 b) P(T c|D) = 1 − P(T|D) = 0.2 c) Usando o Teorema de Bayes: P(D|T) = P(T|D)P(D) P(T) = 0.67 d) Não, porque o evento (T ∩ D) ̸= ∅. e) Não, porque P(T|D) ̸= P(T). 20. A : o primeiro resolve o problema P(A) = 0, 50 P(Ac) = 0, 50 B : o segundo resolve o problema P(B) = 0, 65 P(Bc) = 0, 35 C : o terceiro resolve o problema P(C) = 0, 30 P(Cc) = 0, 70 P(A ∪ B ∪ C) = 1 − P(Ac ∩ Bc ∩ Cc) ind = 1 − P(Ac) · P(Bc) · P(Cc) = 1 − (0, 50 · 0, 35 · 0, 70) = 0.878 21. Sejam os eventos: • S : o candidato sabe a questão • Sc : o candidato não sabe a questão • A : o candidato acerta a questão • Ac : o candidato não acerta a questão 9 P[S] = 0.40 ; P[Sc] = 0.60 P[A|S] = 1.00 ; P[Ac|S] = 0.00 P[S] = 0.40 ; P[Sc] = 0.60 P[A|Sc] = 0.20 ; P[Ac|Sc] = 0.80 P[S|A] =? P[S|A] = P[S ∩ A] P[A] = P[A|S] · P[S] P[A|S] · P[S] + P[A|Sc] · P[Sc] = 1 · 0.40 (1 · 0.40) + (0.20 · 0.60) = 0.40 0.52 = 0.769 10 Exercícios da Unidade 2 Probabilidades Os exercícios foram extraídos dos livros: Bussab, WO; Morettin, PA. Estatística Básica. São Paulo: Editora Saraiva, 2006 (5ª Edição). Magalhães, MN; Lima, ACP. Noções de Probabilidade e Estatística. São Paulo: EDUSP, 2008. 1. Para cada um dos casos abaixo, escreva o espaço amostral correspondente e conte seus elementos. a) Uma moeda é lançada duas vezes e observam-se as faces obtidas. b) Um dado é lançado duas vezes e a ocorrência de face par ou ímpar é observada. c) Uma urna contém 10 bolas azuis e 10 bolas vermelhas com dimensões rigorosamente iguais. Três bolas são selecionadas ao acaso com reposição e as cores são anotadas. d) Dois dados, com as faces enumeradas de 1 a 6, são lançados simultaneamente e estamos interessados na soma das faces observadas. e) Em uma cidade, famílias com três crianças são selecionadas ao acaso, anotando-se o sexo de cada uma. f) Uma máquina produz 20 peças por hora, escolhe-se um instante qualquer e observa-se o número de defeituosas na próxima hora. g) Uma moeda lançada consecutivamente até o aparecimento da primeira cara. 2. Sendo A e B dois eventos em um mesmo espaço amostral, “traduza” para a linguagem da teoria dos conjuntos as seguintes situações: a) Pelo menos um dos eventos ocorre. b) O evento A ocorre mas o evento B não. c) Nenhum deles ocorre. d) Exatamente um dos eventos ocorre. 3. Uma universidade tem 10000 alunos dos quais 4000 são considerados esportistas. Temos, ainda, que 500 alunos são do curso de biologia diurno, 700 da biologia noturno, 100 são esportistas e da biologia diurno e 200 são esportistas e da biologia noturno. Um aluno é escolhido, ao acaso, e pergunta-se a probabilidade de: a) Ser esportista. b) Ser esportista e aluno da biologia noturno. c) Não ser da biologia. d) Ser esportista ou aluno da biologia. e) Não ser esportista, nem aluno da biologia. 4. Sejam A e B dois eventos em um dado espaço amostral, tais que P(A) = 0.2, P(B) = p, P(A ∪ B) = 0.5 e P(A ∩ B) = 0.1. Determine o valor de p. 5. Dois processadores tipos A e B são colocados em teste por 50 mil horas. A probabilidade de que um erro de cálculo aconteça em um processador do tipo A é de 1/30, no tipo B, 1/80 e, em ambos, 1/1000. Qual a probabilidade de que: a) Pelo menos um dos processadores tenha apresentado erro? b) Nenhum processador tenha apresentado erro? c) Apenas o processador A tenha apresentado erro? 6. Considere dois eventos A e B, mutuamente exclusivos, com P(A) = 0.3 e P(B) = 0.5. Calcule: a) P(A ∩ B). b) P(A ∪ B). c) P(A|B). d) P(Ac). e) P((A ∪ B)c). 7. Se P(A ∪ B) = 0.8; P(A) = 0.5 e P(B) = x, determine o valor de x no caso de: a) A e B serem mutuamente exclusivos. b) A e B serem independentes. 8. Uma escola do ensino médio do interior de São Paulo tem 40% dos estudantes do sexo masculino. Entre estes, 20% nunca viram o mar, ao passo que, entre as meninas, essa porcentagem é de 50%. Qual a probabilidade de que um aluno selecionado ao acaso seja: a) Do sexo masculino e nunca tenha visto o mar? b) Do sexo feminino ou nunca tenha visto o mar? 9. Se P(B) = 0.4; P(A) = 0.7 e P(A ∩ B) = 0.3, calcule P(A|Bc). 10. O São Paulo Futebol Clube ganha com probabilidade 0.7 se chove e com 0.8 se não chove. Em Setembro, a probabilidade de chuva é de 0.3. Se o São Paulo ganhou uma partida em Setembro, qual a probabilidade de ter chovido nesse dia? 11. Uma moeda é viciada de modo que a probabilidade de sair cara é 4 vezes maior que a de sair coroa. Para 2 lançamentos independentes dessa moeda, determinar: a) O espaço amostral. b) A probabilidade de sair somente uma cara. c) A probabilidade de sair pelo menos uma cara. d) A probabilidade de sair dois resultados iguais. 12. Verifique se são válidas as afirmações: a) Se P(A) = 1/3 e P(B|A) = 3/5, então A e B não podem ser disjuntos. b) Se P(A) = 1/2, P(B|A) = 1 e P(A|B) = 1/2, então A não pode estar contido em B. 13. As preferências de homens e mulheres por cada gênero de filme alugado em uma locadora de vídeos estão apresentadas na próxima tabela. Sorteando-se, ao acaso, uma dessas locações de vídeo, pergunta-se a probabilidade de: a) Uma mulher ter alugado um filme policial. b) O filme alugado ser uma comédia. c) Um homem ter alugado ou o filme ser um romance. d) O filme ser policial dado que foi alugado por um homem. Sexo/Filme Comédia (C) Romance (R) Policial (P) Homens (H) 136 92 248 Mulheres (M) 102 195 62 14. Dois dados equilibrados são lançados. Calcule a probabilidade de: a) Obter os valores 3 e 4 (em qualquer ordem), sabendo-se que ocorreu face par no primeiro dado. b) Ocorrer face ímpar no segundo dado sabendo-se que ocorreu face par no primeiro dado. 15. Dois armários guardam as bolas de voleibol e basquete. O armário 1 tem 3 bolas de voleibol e 1 de basquete, enquanto o armário 2 tem 3 bolas de voleibol e 2 de basquete. Escolhendo-se, ao acaso, um armário e, em seguida, uma de suas bolas, calcule a probabilidade dela ser: a) De voleibol, sabendo-se que o armário 1 foi escolhido. 2 b) De basquete, sabendo-se que o armário 2 foi escolhido. c) De basquete. 16. A tabela a seguir apresenta informações de alunos de uma universidade quanto às variáveis: Período, Sexo e Opinião sobre a Reforma Agrária. Determine a probabilidade de escolhermos: a) Uma pessoa do sexo masculino e sem opinião sobre a reforma agrária. b) Uma mulher contrária a reforma agrária. c) Dentre os estudantes do noturno, um que seja a favor da reforma agrária. d) Uma pessoa sem opinião, sabendo-se que ela é do sexo feminino. Período Sexo Reforma Agrária Contra A Favor Sem opinião Diurno Feminino 2 8 2 Masculino 8 9 8 Noturno Feminino 4 8 2 Masculino 12 10 1 17. A tabela a seguir apresenta dados de 1000 ingressantes de uma universidade, com informações sobre área de estudo e classe sócio-econômica. Se um aluno ingressante é escolhido ao acaso, determine a probabilidade de: a) Ser da classe econômica mais alta. b) Estudar na área de exatas. c) Estudar na área de humanas, sendo de classe média. d) Ser de classe baixa, dado que estuda na área de biológicas. Área/Classe Alta (A) Média (M) Baixa (B) Exatas (Ex) 120 156 68 Humanas (Hu) 72 85 112 Biológicas (Bi) 169 145 73 18. Uma parte de um circuito elétrico é formada por 4 componentes conforme indicado no diagrama a seguir. Para o engenheiro avaliar a chance de falha do circuito completo, e talvez replanejá-lo, é preciso determinar a chance de falha dessa referida parte composta de 4 componentes. Dentro das caixas está a probabilidade de falha de cada elemento do circuito. Assuma que os elementos do circuito falhem de forma independente uns dos outros e calcule a proba- bilidade do circuito falhar. 19. Numa população sabe-se que 20% possuem certa doença. A probabilidade de uma pessoa sabiadamente doente (D) apresentar resultado positivo (T) num teste é de 80%, enquanto que a de uma pessoa sabidamente não doente (Dc) apresentar um resultado negativo (T c) é de 90%. Sabendo-se que os únicos resultados possíveis do teste são: positivo ou negativo, responda: a) Qual é a probabilidade de uma pessoa selecionada ao acaso da população apresentar um resultado positivo no teste? b) Qual é a probabilidade de uma pessoa ter um resultado negativo no teste sabendo-se que ela é doente? c) Qual é a probabilidade de uma pessoa testada como positivo de fato ter a doença? d) Os eventos T e D são mutuamente exclusivos? Justifique sua resposta. e) Os eventos T e D são independentes? Justifique sua resposta. 3 20. Três indivíduos tentam, de forma independente, resolver um problema. O primeiro tem 50% de chance de resolver, o segundo tem 65% e o terceiro tem 30%. Qual a probabilidade do problema ser resolvido? 21. Um candidato está fazendo uma prova de múltipla escolha com cinco alternativas das quais apenas uma é correta. A chance do candidato saber a solução de uma questão é de 40%. Quando ele sabe a solução ele sempre acerta a questão e quando não sabe ele escolhe uma das respostas ao acaso. Se o candidato acerta a questão, qual a probabilidade de ele saber resolver a questão? 4 Respostas 1. a) Ω = {CC, CR, RC, RR}, com C sendo face cara e R face coroa; contém 4 elementos. b) Ω = {PP, PI, IP, PP}, com P sendo face par e I face ímpar; contém 4 elementos. c) Ω = {AAA, AAV, AV A, V AA, AV V, V AV, V V A, V V V }, sendo A bola azul e V vermelha; contém 8 elementos. d) Ω = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}; contém 11 elementos. e) Ω = {MMM, MMF, . . . , FFF}, com M e F representando a escolha de uma criança do sexo masculino e feminino, respectivamente, contém 8 elementos. f) Ω = {0, 1, 2, . . . , 20}; contém 21 elementos. g) Ω = {C, RC, RRC, RRRC, RRRRC, . . .}, com C sendo cara e R coroa; contém um número infinito de elementos. 2. a) A ∪ B. b) A ∩ Bc. c) Ac ∩ Bc. d) (A ∩ Bc) ∪ (Ac ∩ B). 3. Os cálculos ficam facilitados com a tabela abaixo: Atividade Biol. Noite (N) Biol. Diuno (D) Outros (O) Total Esportista (E) 200 100 3700 4000 Não esportista (Ec) 500 400 5100 6000 Total 700 500 8800 10000 a) Ser esportista: P(E) = 4000 10000 = 0.4. b) Ser esportista e aluno da biologia noturno: P(E ∩ N) = 200 10000 = 0.02. c) Não ser da biologia: P(O) = 8800 10000 = 0.88. d) Ser esportista ou aluno da biologia: P(E ∪ N ∪ D) = P(E) + P(N) + P(D) − P(E ∩ N) − P(E ∩ D) = 0.49. e) Não ser esportista, nem aluno da biologia: P(Ec ∩ O) = 5100 10000 = 0.51. 4. Utilizando a regra da adição de probabilidade, temos P(A ∪ B) = P(A) + P(B) − P(A ∩ B) 0.5 = 0.2 + p − 0.1 → p = 0.4. 5. Dados do exercício: P(A) = 1/30 = 0.033, P(B) = 1/80 = 0.013, P(A ∩ B) = 1/1000 = 0.001. Então, a) Pelo menos um dos processadores tenha apresentado erro? P(A ∪ B) = P(A) + P(B) − P(A ∩ B) = 0.045. b) Nenhum processador tem apresentado erro? P(Ac ∩ Bc) = P((A ∪ B)c) = 1 − P(A ∪ B) = 1− 0.045= 0.955. c) Apenas o processador A tenha apresentado erro? P(A ∩ Bc) = P(A) − P(A ∩ B) = 0.032. 5 6. Considere dois eventos A e B, mutuamente exclusivos, com P(A) = 0.3 e P(B) = 0.5. Então, a) P(A ∩ B) = 0. b) P(A ∪ B) = 0.8. c) P(A|B) = 0. d) P(Ac) = 0.7. e) P((A ∪ B)c) = 0.2. 7. a) Sendo P(A ∩ B) = 0, P(A ∪ B) = P(A) + P(B) − P(A ∩ B) 0.8 = 0.5 + x − 0 → x = 0.3. b) Sendo P(A ∩ B) = P(A)P(B), P(A ∪ B) = P(A) + P(B) − P(A) · P(B) 0.8 = 0.5 + x − 0.5 · x → x = 0.3/0.5 = 0.6. 8. Uma escola de ensino médio do interior de São Paulo tem 40% de estudantes do sexo masculino. Entre estes, 20% nunca viram o mar, ao passo que, entre as meninas, essa porcentagem é de 50%. Seja M usado para denotar os alunos do sexo masculino, M c as alunas do sexo feminino, V para denotar se um aluno já viu o mar e V c se não viu. A partir do enunciado, temos P(M) = 0.4, P(V c|M) = 0.2 e P(V c|M c) = 0.5. a) A probabilidade de selecionar um aluno do sexo masculino e que nunca tenha visto o mar: P(M ∩ V c) = P(V c|M) · P(M) = 0.2 · 0.4= 0.08. b) A probabilidade de selecionar uma pessoa do sexo feminino ou que nunca tenha visto o mar: P(M c ∪ V c) = P((M ∩ V )c) = 1 − P(M ∩ V ) = 1 − (P(V |M) · P(M)) P(M c ∪ V c) = 1 − ((1 − P(V c|M)) · P(M)) = 1 − ((1− 0.2 )· 0.4 ) P(M c ∪ V c) = 0.68. 9. Calcule P(A|Bc). Se P(B) = 0.4, P(A) = 0.7 e P(A ∩ B) = 0.3, então P(A|Bc) = P (A∩Bc) P (Bc) = P (A)−P (A∩B) 1−P (B) = 0.7−0.3 1−0.4 = 0.67. 10. Sejam os eventos C: chove em setembro e G: o São Paulo ganha um jogo. A partir do enunciado, temos P(G|C) = 0.7, P(G|Cc) = 0.8 e P(C) = 0.3. Então P(G) = P(G ∩ C) + P(G ∩ Cc) = P(G|C)P(C) + P(G|Cc)P(Cc) = 0.7 · 0.3 + 0.8 · (1 − 0.3) = 0.77 P(C|G) = P (C∩G) P (G) = P (G|C)P (C) P (G) = 0.273. 11. Sejam os eventos C: sair a face cara e R: sair a face coroa. Então a) O espaço amostral. Ω = {CC, CR, RC, RR}. 6 b) A probabilidade de sair somente uma cara. P(CR ∪ RC) = P(CR) + P(RC) = P(C)P(R) + P(R)P(C) = 0.32. c) A probabilidade de sair pelo menos uma cara. P(CR ∪ RC ∪ CC) = P(C)P(R) + P(R)P(C) + P(C)P(C) = 0.96. d) A probabilidade de sair dois resultados iguais. P(CC ∪ RR) = P(C)P(C) + P(R)P(R) = 0.68. 12. a) Se P(A) = 1/3 e P(B|A) = 3/5, então A e B não podem ser disjuntos. A afirmação é correta, pois P(A ∩ B) = P(B|A) · P(A) = 3/5 · 1/3 = 1/5 ̸= 0. b) Se P(A) = 1/2, P(B|A) = 1 e P(A|B) = 1/2, então A não pode estar contido em B. A afirmação está incorreta, pois P(B|A) = P (B∩A) P (A) = P (B∩A) 1/2 = 1. Portanto, P(B ∩ A) = 1/2 = P(A) e P(A|B) = P (A∩B) P (B) = 1/2 P (B) = 1/2. Como P(B) = 1, então A está totalmente contido em B. 13. a) P(P|M) = 62 102+195+62 = 0.173. b) P(C) = 136+102 136+92+248+102+195+62 = 0.285. c) P(H ∪ R) = P(H) + P(R) − P(H ∩ R) = (136+92+248)+(92+195)−(92) 136+92+248+102+195+62 = 0.804. d) P(P|H) = 248 136+92+248 = 0.521. 14. a) Obter os valores 3 e 4 (em qualquer ordem), sabendo-se que ocorreu face par no primeiro dado. Ω = {(1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6), (2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (2, 6), (3, 1), (3, 2), (3, 3), (3, 4), (3, 5), (3, 6), (4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6), (5, 1), (5, 2), (5, 3), (5, 4), (5, 5), (5, 6), (6, 1), (6, 2), (6, 3), (6, 4), (6, 5), (6, 6)} Seja o evento A: {(3, 4); (4, 3)} e o evento B: face par no primeiro dado, então (A ∩ B) = {(4, 3)} e P(A ∩ B) = 1/36 e P(B) = 18/36. P(A|B) = P (A∩B) P (B) = 1 18 = 0.056. b) Ocorrer face ímpar no segundo dado sabendo-se que ocorreu face par no primeiro dado. Sejam os eventos I: face ímpar no segundo dado e B: face par no primeiro dado. Então P(I|B) = P (I∩B) P (B) = 9/36 18/36 = 9 18 = 0.5. 15. Sejam os eventos A1: ser do armário 1; A2: ser do armário 2; V : a bola ser de vôlei e B: a bola ser de basquete. Então 7 a) P(V |A1) = P (A1∩V ) P (A1) = 3 4 = 0.75. b) P(B|A2) = P (A2∩B) P (A2) = 2 5 = 0.40. c) P(B) = P(A1)P(B|A1) + P(A2)P(B|A2) = 1 2 · 1 4 + 1 2 · 2 5 = 0.33. 16. Defina os eventos C: ser contra a reforma agrária, A: ser a favor da reforma agrária, O: ser sem opinião quanto a reforma agrária, F: ser do sexo feminino, M: ser do sexo masculino, N: ser do noturno e D: ser do diurno. a) Uma pessoa do sexo masculino e sem opinião sobre a reforma agrária: P(M ∩ O) = 8 + 1 2 + 8 + 2 + 8 + 9 + 8 + 4 + 8 + 2 + 12 + 10 + 1 = 9 74 = 0.122. b) Uma mulher contrária à reforma agrária: P(F ∩ C) = 6 2 + 8 + 2 + 8 + 9 + 8 + 4 + 8 + 2 + 12 + 10 + 1 = 6 74 = 0.081. c) Dentre os estudantes do noturno, um que seja a favor da reforma agrária: P(A|N) = 8 + 10 4 + 8 + 2 + 12 + 10 + 1 = 18 37 = 0.486. d) Uma pessoa sem opinião, sabendo-se que ela é do sexo feminino: P(O|F) = 2 + 2 2 + 8 + 2 + 4 + 8 + 2 = 4 26 = 0.154. 17. Considere os dados apresentados na tabela. Então, calcule as probabilidades de a) Ser da classe econômica mais alta: P(A) = 120 + 72 + 169 120 + 72 + 169 + 156 + 85 + 145 + 68 + 112 + 73 = 0.361 . b) Estudar na área de exatas: P(Ex) = 120 + 156 + 68 120 + 72 + 169 + 156 + 85 + 145 + 68 + 112 + 73 = 0.344 . c) Estudar na área de humanas, sendo de classe média: P(Hu|M) = P(M ∩ Hu) P(M) = 85 156 + 85 + 145 = 0.22 . d) Ser de classe baixa, dado que estuda na área de biológicas: P(B|Bi) = P(B ∩ Bi) P(Bi) = 73 169 + 145 + 73 = 0.189 18. Denotemos por: A o evento com probabilidade de falha de 0.30 (P(A) = 0.30), B o evento com probabilidade de falha de 0.45 (P(B) = 0.45), C e D os eventos com probabilidade de falha de 0.25 (P(C) = P(D) = 0.25). O circuito falhará (F) se A ou C falhar e se B ou D falhar. Em notação de conjuntos, temos F = (A ∪ C) ∩ (B ∪ D). O cálculo da probabilidade fica mais simples usando o evento complentar de F, F c = (A ∪ C)c ∪ (B ∪ D)c = (Ac ∩ Cc) ∪ (Bc ∩ Dc) Então 8 P(F c) = P(Ac ∩ Cc) + P(Bc ∩ Dc) − P(Ac ∩ Cc ∩ Bc ∩ Dc) = P(Ac)P(Cc) + P(Bc)P(Dc) − P(Ac)P(Cc)P(Bc)P(Dc) = 0.7 · 0.75 + 0.55 · 0.75 − (0.70 · 0.75 · 0.55 · 0.75) = 0.721. Portanto, P(F) = 1 − P(F c) = 0.279. 19. São fornecidos no enunciado do exercício: P(D) = 0.2, P(T|D) = 0.8 e P(T c|Dc) = 0.9. a) P(T) = P[(T e D) ou (T e Dc)] = P[(T ∩ D) ∪ (T ∩ Dc)] = P(T ∩ D) + P(T ∩ Dc) = P(T|D)P(D) + P(T|Dc)P(Dc) = P(T|D)P(D) + (1 − P(T c|Dc))(1 − P(D)) = 0.8 ∗ 0.2 + (1 − 0.9) ∗ (1 − 0.2) = 0.24 b) P(T c|D) = 1 − P(T|D) = 0.2 c) Usando o Teorema de Bayes: P(D|T) = P(T|D)P(D) P(T) = 0.67 d) Não, porque o evento (T ∩ D) ̸= ∅. e) Não, porque P(T|D) ̸= P(T). 20. A : o primeiro resolve o problema P(A) = 0, 50 P(Ac) = 0, 50 B : o segundo resolve o problema P(B) = 0, 65 P(Bc) = 0, 35 C : o terceiro resolve o problema P(C) = 0, 30 P(Cc) = 0, 70 P(A ∪ B ∪ C) = 1 − P(Ac ∩ Bc ∩ Cc) ind = 1 − P(Ac) · P(Bc) · P(Cc) = 1 − (0, 50 · 0, 35 · 0, 70) = 0.878 21. Sejam os eventos: • S : o candidato sabe a questão • Sc : o candidato não sabe a questão • A : o candidato acerta a questão • Ac : o candidato não acerta a questão 9 P[S] = 0.40 ; P[Sc] = 0.60 P[A|S] = 1.00 ; P[Ac|S] = 0.00 P[S] = 0.40 ; P[Sc] = 0.60 P[A|Sc] = 0.20 ; P[Ac|Sc] = 0.80 P[S|A] =? P[S|A] = P[S ∩ A] P[A] = P[A|S] · P[S] P[A|S] · P[S] + P[A|Sc] · P[Sc] = 1 · 0.40 (1 · 0.40) + (0.20 · 0.60) = 0.40 0.52 = 0.769 10 Exercícios da Unidade 2 Probabilidades Os exercícios foram extraídos dos livros: Bussab, WO; Morettin, PA. Estatística Básica. São Paulo: Editora Saraiva, 2006 (5ª Edição). Magalhães, MN; Lima, ACP. Noções de Probabilidade e Estatística. São Paulo: EDUSP, 2008. 1. Para cada um dos casos abaixo, escreva o espaço amostral correspondente e conte seus elementos. a) Uma moeda é lançada duas vezes e observam-se as faces obtidas. b) Um dado é lançado duas vezes e a ocorrência de face par ou ímpar é observada. c) Uma urna contém 10 bolas azuis e 10 bolas vermelhas com dimensões rigorosamente iguais. Três bolas são selecionadas ao acaso com reposição e as cores são anotadas. d) Dois dados, com as faces enumeradas de 1 a 6, são lançados simultaneamente e estamos interessados na soma das faces observadas. e) Em uma cidade, famílias com três crianças são selecionadas ao acaso, anotando-se o sexo de cada uma. f) Uma máquina produz 20 peças por hora, escolhe-se um instante qualquer e observa-se o número de defeituosas na próxima hora. g) Uma moeda lançada consecutivamente até o aparecimento da primeira cara. 2. Sendo A e B dois eventos em um mesmo espaço amostral, “traduza” para a linguagem da teoria dos conjuntos as seguintes situações: a) Pelo menos um dos eventos ocorre. b) O evento A ocorre mas o evento B não. c) Nenhum deles ocorre. d) Exatamente um dos eventos ocorre. 3. Uma universidade tem 10000 alunos dos quais 4000 são considerados esportistas. Temos, ainda, que 500 alunos são do curso de biologia diurno, 700 da biologia noturno, 100 são esportistas e da biologia diurno e 200 são esportistas e da biologia noturno. Um aluno é escolhido, ao acaso, e pergunta-se a probabilidade de: a) Ser esportista. b) Ser esportista e aluno da biologia noturno. c) Não ser da biologia. d) Ser esportista ou aluno da biologia. e) Não ser esportista, nem aluno da biologia. 4. Sejam A e B dois eventos em um dado espaço amostral, tais que P(A) = 0.2, P(B) = p, P(A ∪ B) = 0.5 e P(A ∩ B) = 0.1. Determine o valor de p. 5. Dois processadores tipos A e B são colocados em teste por 50 mil horas. A probabilidade de que um erro de cálculo aconteça em um processador do tipo A é de 1/30, no tipo B, 1/80 e, em ambos, 1/1000. Qual a probabilidade de que: a) Pelo menos um dos processadores tenha apresentado erro? b) Nenhum processador tenha apresentado erro? c) Apenas o processador A tenha apresentado erro? 6. Considere dois eventos A e B, mutuamente exclusivos, com P(A) = 0.3 e P(B) = 0.5. Calcule: a) P(A ∩ B). b) P(A ∪ B). c) P(A|B). d) P(Ac). e) P((A ∪ B)c). 7. Se P(A ∪ B) = 0.8; P(A) = 0.5 e P(B) = x, determine o valor de x no caso de: a) A e B serem mutuamente exclusivos. b) A e B serem independentes. 8. Uma escola do ensino médio do interior de São Paulo tem 40% dos estudantes do sexo masculino. Entre estes, 20% nunca viram o mar, ao passo que, entre as meninas, essa porcentagem é de 50%. Qual a probabilidade de que um aluno selecionado ao acaso seja: a) Do sexo masculino e nunca tenha visto o mar? b) Do sexo feminino ou nunca tenha visto o mar? 9. Se P(B) = 0.4; P(A) = 0.7 e P(A ∩ B) = 0.3, calcule P(A|Bc). 10. O São Paulo Futebol Clube ganha com probabilidade 0.7 se chove e com 0.8 se não chove. Em Setembro, a probabilidade de chuva é de 0.3. Se o São Paulo ganhou uma partida em Setembro, qual a probabilidade de ter chovido nesse dia? 11. Uma moeda é viciada de modo que a probabilidade de sair cara é 4 vezes maior que a de sair coroa. Para 2 lançamentos independentes dessa moeda, determinar: a) O espaço amostral. b) A probabilidade de sair somente uma cara. c) A probabilidade de sair pelo menos uma cara. d) A probabilidade de sair dois resultados iguais. 12. Verifique se são válidas as afirmações: a) Se P(A) = 1/3 e P(B|A) = 3/5, então A e B não podem ser disjuntos. b) Se P(A) = 1/2, P(B|A) = 1 e P(A|B) = 1/2, então A não pode estar contido em B. 13. As preferências de homens e mulheres por cada gênero de filme alugado em uma locadora de vídeos estão apresentadas na próxima tabela. Sorteando-se, ao acaso, uma dessas locações de vídeo, pergunta-se a probabilidade de: a) Uma mulher ter alugado um filme policial. b) O filme alugado ser uma comédia. c) Um homem ter alugado ou o filme ser um romance. d) O filme ser policial dado que foi alugado por um homem. Sexo/Filme Comédia (C) Romance (R) Policial (P) Homens (H) 136 92 248 Mulheres (M) 102 195 62 14. Dois dados equilibrados são lançados. Calcule a probabilidade de: a) Obter os valores 3 e 4 (em qualquer ordem), sabendo-se que ocorreu face par no primeiro dado. b) Ocorrer face ímpar no segundo dado sabendo-se que ocorreu face par no primeiro dado. 15. Dois armários guardam as bolas de voleibol e basquete. O armário 1 tem 3 bolas de voleibol e 1 de basquete, enquanto o armário 2 tem 3 bolas de voleibol e 2 de basquete. Escolhendo-se, ao acaso, um armário e, em seguida, uma de suas bolas, calcule a probabilidade dela ser: a) De voleibol, sabendo-se que o armário 1 foi escolhido. 2 b) De basquete, sabendo-se que o armário 2 foi escolhido. c) De basquete. 16. A tabela a seguir apresenta informações de alunos de uma universidade quanto às variáveis: Período, Sexo e Opinião sobre a Reforma Agrária. Determine a probabilidade de escolhermos: a) Uma pessoa do sexo masculino e sem opinião sobre a reforma agrária. b) Uma mulher contrária a reforma agrária. c) Dentre os estudantes do noturno, um que seja a favor da reforma agrária. d) Uma pessoa sem opinião, sabendo-se que ela é do sexo feminino. Período Sexo Reforma Agrária Contra A Favor Sem opinião Diurno Feminino 2 8 2 Masculino 8 9 8 Noturno Feminino 4 8 2 Masculino 12 10 1 17. A tabela a seguir apresenta dados de 1000 ingressantes de uma universidade, com informações sobre área de estudo e classe sócio-econômica. Se um aluno ingressante é escolhido ao acaso, determine a probabilidade de: a) Ser da classe econômica mais alta. b) Estudar na área de exatas. c) Estudar na área de humanas, sendo de classe média. d) Ser de classe baixa, dado que estuda na área de biológicas. Área/Classe Alta (A) Média (M) Baixa (B) Exatas (Ex) 120 156 68 Humanas (Hu) 72 85 112 Biológicas (Bi) 169 145 73 18. Uma parte de um circuito elétrico é formada por 4 componentes conforme indicado no diagrama a seguir. Para o engenheiro avaliar a chance de falha do circuito completo, e talvez replanejá-lo, é preciso determinar a chance de falha dessa referida parte composta de 4 componentes. Dentro das caixas está a probabilidade de falha de cada elemento do circuito. Assuma que os elementos do circuito falhem de forma independente uns dos outros e calcule a proba- bilidade do circuito falhar. 19. Numa população sabe-se que 20% possuem certa doença. A probabilidade de uma pessoa sabiadamente doente (D) apresentar resultado positivo (T) num teste é de 80%, enquanto que a de uma pessoa sabidamente não doente (Dc) apresentar um resultado negativo (T c) é de 90%. Sabendo-se que os únicos resultados possíveis do teste são: positivo ou negativo, responda: a) Qual é a probabilidade de uma pessoa selecionada ao acaso da população apresentar um resultado positivo no teste? b) Qual é a probabilidade de uma pessoa ter um resultado negativo no teste sabendo-se que ela é doente? c) Qual é a probabilidade de uma pessoa testada como positivo de fato ter a doença? d) Os eventos T e D são mutuamente exclusivos? Justifique sua resposta. e) Os eventos T e D são independentes? Justifique sua resposta. 3 20. Três indivíduos tentam, de forma independente, resolver um problema. O primeiro tem 50% de chance de resolver, o segundo tem 65% e o terceiro tem 30%. Qual a probabilidade do problema ser resolvido? 21. Um candidato está fazendo uma prova de múltipla escolha com cinco alternativas das quais apenas uma é correta. A chance do candidato saber a solução de uma questão é de 40%. Quando ele sabe a solução ele sempre acerta a questão e quando não sabe ele escolhe uma das respostas ao acaso. Se o candidato acerta a questão, qual a probabilidade de ele saber resolver a questão? 4 Respostas 1. a) Ω = {CC, CR, RC, RR}, com C sendo face cara e R face coroa; contém 4 elementos. b) Ω = {PP, PI, IP, PP}, com P sendo face par e I face ímpar; contém 4 elementos. c) Ω = {AAA, AAV, AV A, V AA, AV V, V AV, V V A, V V V }, sendo A bola azul e V vermelha; contém 8 elementos. d) Ω = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}; contém 11 elementos. e) Ω = {MMM, MMF, . . . , FFF}, com M e F representando a escolha de uma criança do sexo masculino e feminino, respectivamente, contém 8 elementos. f) Ω = {0, 1, 2, . . . , 20}; contém 21 elementos. g) Ω = {C, RC, RRC, RRRC, RRRRC, . . .}, com C sendo cara e R coroa; contém um número infinito de elementos. 2. a) A ∪ B. b) A ∩ Bc. c) Ac ∩ Bc. d) (A ∩ Bc) ∪ (Ac ∩ B). 3. Os cálculos ficam facilitados com a tabela abaixo: Atividade Biol. Noite (N) Biol. Diuno (D) Outros (O) Total Esportista (E) 200 100 3700 4000 Não esportista (Ec) 500 400 5100 6000 Total 700 500 8800 10000 a) Ser esportista: P(E) = 4000 10000 = 0.4. b) Ser esportista e aluno da biologia noturno: P(E ∩ N) = 200 10000 = 0.02. c) Não ser da biologia: P(O) = 8800 10000 = 0.88. d) Ser esportista ou aluno da biologia: P(E ∪ N ∪ D) = P(E) + P(N) + P(D) − P(E ∩ N) − P(E ∩ D) = 0.49. e) Não ser esportista, nem aluno da biologia: P(Ec ∩ O) = 5100 10000 = 0.51. 4. Utilizando a regra da adição de probabilidade, temos P(A ∪ B) = P(A) + P(B) − P(A ∩ B) 0.5 = 0.2 + p − 0.1 → p = 0.4. 5. Dados do exercício: P(A) = 1/30 = 0.033, P(B) = 1/80 = 0.013, P(A ∩ B) = 1/1000 = 0.001. Então, a) Pelo menos um dos processadores tenha apresentado erro? P(A ∪ B) = P(A) + P(B) − P(A ∩ B) = 0.045. b) Nenhum processador tem apresentado erro? P(Ac ∩ Bc) = P((A ∪ B)c) = 1 − P(A ∪ B) = 1− 0.045= 0.955. c) Apenas o processador A tenha apresentado erro? P(A ∩ Bc) = P(A) − P(A ∩ B) = 0.032. 5 6. Considere dois eventos A e B, mutuamente exclusivos, com P(A) = 0.3 e P(B) = 0.5. Então, a) P(A ∩ B) = 0. b) P(A ∪ B) = 0.8. c) P(A|B) = 0. d) P(Ac) = 0.7. e) P((A ∪ B)c) = 0.2. 7. a) Sendo P(A ∩ B) = 0, P(A ∪ B) = P(A) + P(B) − P(A ∩ B) 0.8 = 0.5 + x − 0 → x = 0.3. b) Sendo P(A ∩ B) = P(A)P(B), P(A ∪ B) = P(A) + P(B) − P(A) · P(B) 0.8 = 0.5 + x − 0.5 · x → x = 0.3/0.5 = 0.6. 8. Uma escola de ensino médio do interior de São Paulo tem 40% de estudantes do sexo masculino. Entre estes, 20% nunca viram o mar, ao passo que, entre as meninas, essa porcentagem é de 50%. Seja M usado para denotar os alunos do sexo masculino, M c as alunas do sexo feminino, V para denotar se um aluno já viu o mar e V c se não viu. A partir do enunciado, temos P(M) = 0.4, P(V c|M) = 0.2 e P(V c|M c) = 0.5. a) A probabilidade de selecionar um aluno do sexo masculino e que nunca tenha visto o mar: P(M ∩ V c) = P(V c|M) · P(M) = 0.2 · 0.4= 0.08. b) A probabilidade de selecionar uma pessoa do sexo feminino ou que nunca tenha visto o mar: P(M c ∪ V c) = P((M ∩ V )c) = 1 − P(M ∩ V ) = 1 − (P(V |M) · P(M)) P(M c ∪ V c) = 1 − ((1 − P(V c|M)) · P(M)) = 1 − ((1− 0.2 )· 0.4 ) P(M c ∪ V c) = 0.68. 9. Calcule P(A|Bc). Se P(B) = 0.4, P(A) = 0.7 e P(A ∩ B) = 0.3, então P(A|Bc) = P (A∩Bc) P (Bc) = P (A)−P (A∩B) 1−P (B) = 0.7−0.3 1−0.4 = 0.67. 10. Sejam os eventos C: chove em setembro e G: o São Paulo ganha um jogo. A partir do enunciado, temos P(G|C) = 0.7, P(G|Cc) = 0.8 e P(C) = 0.3. Então P(G) = P(G ∩ C) + P(G ∩ Cc) = P(G|C)P(C) + P(G|Cc)P(Cc) = 0.7 · 0.3 + 0.8 · (1 − 0.3) = 0.77 P(C|G) = P (C∩G) P (G) = P (G|C)P (C) P (G) = 0.273. 11. Sejam os eventos C: sair a face cara e R: sair a face coroa. Então a) O espaço amostral. Ω = {CC, CR, RC, RR}. 6 b) A probabilidade de sair somente uma cara. P(CR ∪ RC) = P(CR) + P(RC) = P(C)P(R) + P(R)P(C) = 0.32. c) A probabilidade de sair pelo menos uma cara. P(CR ∪ RC ∪ CC) = P(C)P(R) + P(R)P(C) + P(C)P(C) = 0.96. d) A probabilidade de sair dois resultados iguais. P(CC ∪ RR) = P(C)P(C) + P(R)P(R) = 0.68. 12. a) Se P(A) = 1/3 e P(B|A) = 3/5, então A e B não podem ser disjuntos. A afirmação é correta, pois P(A ∩ B) = P(B|A) · P(A) = 3/5 · 1/3 = 1/5 ̸= 0. b) Se P(A) = 1/2, P(B|A) = 1 e P(A|B) = 1/2, então A não pode estar contido em B. A afirmação está incorreta, pois P(B|A) = P (B∩A) P (A) = P (B∩A) 1/2 = 1. Portanto, P(B ∩ A) = 1/2 = P(A) e P(A|B) = P (A∩B) P (B) = 1/2 P (B) = 1/2. Como P(B) = 1, então A está totalmente contido em B. 13. a) P(P|M) = 62 102+195+62 = 0.173. b) P(C) = 136+102 136+92+248+102+195+62 = 0.285. c) P(H ∪ R) = P(H) + P(R) − P(H ∩ R) = (136+92+248)+(92+195)−(92) 136+92+248+102+195+62 = 0.804. d) P(P|H) = 248 136+92+248 = 0.521. 14. a) Obter os valores 3 e 4 (em qualquer ordem), sabendo-se que ocorreu face par no primeiro dado. Ω = {(1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6), (2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (2, 6), (3, 1), (3, 2), (3, 3), (3, 4), (3, 5), (3, 6), (4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6), (5, 1), (5, 2), (5, 3), (5, 4), (5, 5), (5, 6), (6, 1), (6, 2), (6, 3), (6, 4), (6, 5), (6, 6)} Seja o evento A: {(3, 4); (4, 3)} e o evento B: face par no primeiro dado, então (A ∩ B) = {(4, 3)} e P(A ∩ B) = 1/36 e P(B) = 18/36. P(A|B) = P (A∩B) P (B) = 1 18 = 0.056. b) Ocorrer face ímpar no segundo dado sabendo-se que ocorreu face par no primeiro dado. Sejam os eventos I: face ímpar no segundo dado e B: face par no primeiro dado. Então P(I|B) = P (I∩B) P (B) = 9/36 18/36 = 9 18 = 0.5. 15. Sejam os eventos A1: ser do armário 1; A2: ser do armário 2; V : a bola ser de vôlei e B: a bola ser de basquete. Então 7 a) P(V |A1) = P (A1∩V ) P (A1) = 3 4 = 0.75. b) P(B|A2) = P (A2∩B) P (A2) = 2 5 = 0.40. c) P(B) = P(A1)P(B|A1) + P(A2)P(B|A2) = 1 2 · 1 4 + 1 2 · 2 5 = 0.33. 16. Defina os eventos C: ser contra a reforma agrária, A: ser a favor da reforma agrária, O: ser sem opinião quanto a reforma agrária, F: ser do sexo feminino, M: ser do sexo masculino, N: ser do noturno e D: ser do diurno. a) Uma pessoa do sexo masculino e sem opinião sobre a reforma agrária: P(M ∩ O) = 8 + 1 2 + 8 + 2 + 8 + 9 + 8 + 4 + 8 + 2 + 12 + 10 + 1 = 9 74 = 0.122. b) Uma mulher contrária à reforma agrária: P(F ∩ C) = 6 2 + 8 + 2 + 8 + 9 + 8 + 4 + 8 + 2 + 12 + 10 + 1 = 6 74 = 0.081. c) Dentre os estudantes do noturno, um que seja a favor da reforma agrária: P(A|N) = 8 + 10 4 + 8 + 2 + 12 + 10 + 1 = 18 37 = 0.486. d) Uma pessoa sem opinião, sabendo-se que ela é do sexo feminino: P(O|F) = 2 + 2 2 + 8 + 2 + 4 + 8 + 2 = 4 26 = 0.154. 17. Considere os dados apresentados na tabela. Então, calcule as probabilidades de a) Ser da classe econômica mais alta: P(A) = 120 + 72 + 169 120 + 72 + 169 + 156 + 85 + 145 + 68 + 112 + 73 = 0.361 . b) Estudar na área de exatas: P(Ex) = 120 + 156 + 68 120 + 72 + 169 + 156 + 85 + 145 + 68 + 112 + 73 = 0.344 . c) Estudar na área de humanas, sendo de classe média: P(Hu|M) = P(M ∩ Hu) P(M) = 85 156 + 85 + 145 = 0.22 . d) Ser de classe baixa, dado que estuda na área de biológicas: P(B|Bi) = P(B ∩ Bi) P(Bi) = 73 169 + 145 + 73 = 0.189 18. Denotemos por: A o evento com probabilidade de falha de 0.30 (P(A) = 0.30), B o evento com probabilidade de falha de 0.45 (P(B) = 0.45), C e D os eventos com probabilidade de falha de 0.25 (P(C) = P(D) = 0.25). O circuito falhará (F) se A ou C falhar e se B ou D falhar. Em notação de conjuntos, temos F = (A ∪ C) ∩ (B ∪ D). O cálculo da probabilidade fica mais simples usando o evento complentar de F, F c = (A ∪ C)c ∪ (B ∪ D)c = (Ac ∩ Cc) ∪ (Bc ∩ Dc) Então 8 P(F c) = P(Ac ∩ Cc) + P(Bc ∩ Dc) − P(Ac ∩ Cc ∩ Bc ∩ Dc) = P(Ac)P(Cc) + P(Bc)P(Dc) − P(Ac)P(Cc)P(Bc)P(Dc) = 0.7 · 0.75 + 0.55 · 0.75 − (0.70 · 0.75 · 0.55 · 0.75) = 0.721. Portanto, P(F) = 1 − P(F c) = 0.279. 19. São fornecidos no enunciado do exercício: P(D) = 0.2, P(T|D) = 0.8 e P(T c|Dc) = 0.9. a) P(T) = P[(T e D) ou (T e Dc)] = P[(T ∩ D) ∪ (T ∩ Dc)] = P(T ∩ D) + P(T ∩ Dc) = P(T|D)P(D) + P(T|Dc)P(Dc) = P(T|D)P(D) + (1 − P(T c|Dc))(1 − P(D)) = 0.8 ∗ 0.2 + (1 − 0.9) ∗ (1 − 0.2) = 0.24 b) P(T c|D) = 1 − P(T|D) = 0.2 c) Usando o Teorema de Bayes: P(D|T) = P(T|D)P(D) P(T) = 0.67 d) Não, porque o evento (T ∩ D) ̸= ∅. e) Não, porque P(T|D) ̸= P(T). 20. A : o primeiro resolve o problema P(A) = 0, 50 P(Ac) = 0, 50 B : o segundo resolve o problema P(B) = 0, 65 P(Bc) = 0, 35 C : o terceiro resolve o problema P(C) = 0, 30 P(Cc) = 0, 70 P(A ∪ B ∪ C) = 1 − P(Ac ∩ Bc ∩ Cc) ind = 1 − P(Ac) · P(Bc) · P(Cc) = 1 − (0, 50 · 0, 35 · 0, 70) = 0.878 21. Sejam os eventos: • S : o candidato sabe a questão • Sc : o candidato não sabe a questão • A : o candidato acerta a questão • Ac : o candidato não acerta a questão 9 P[S] = 0.40 ; P[Sc] = 0.60 P[A|S] = 1.00 ; P[Ac|S] = 0.00 P[S] = 0.40 ; P[Sc] = 0.60 P[A|Sc] = 0.20 ; P[Ac|Sc] = 0.80 P[S|A] =? P[S|A] = P[S ∩ A] P[A] = P[A|S] · P[S] P[A|S] · P[S] + P[A|Sc] · P[Sc] = 1 · 0.40 (1 · 0.40) + (0.20 · 0.60) = 0.40 0.52 = 0.769 10 Exercícios da Unidade 3 Variáveis Aleatórias Os exercícios foram extraídos dos livros: Bussab, WO; Morettin, PA. Estatística Básica. São Paulo: Editora Saraiva, 2006 (5ª Edição). Magalhães, MN; Lima, ACP. Noções de Probabilidade e Estatística. São Paulo: EDUSP, 2008. 1. Sendo Y uma variável aleatória com função de probabilidade dada a seguir, obtenha as medidas de posição média (µ), mediana (Md) e moda (Mo). Y -2 0 2 pi 1/3 1/3 1/3 2. Um atacadista recebe de vários fornecedores uma certa peça para revenda. A peça é produzida com material de qualidade diferente e, portanto, possui custo diferenciado. Levando em conta a proporção fornecida e o preço apresentado por cada fabricante, pode-se admitir que o custo de uma peça qualquer (em reais), escolhida ao acaso, é uma variável aleatória (C). Admita a seguinte função de probabilidade para C: C 1,00 1,10 1,20 1,30 1,40 pi 0,2 0,3 0,2 0,2 0,1 a) Determine as medidas de posição da variável C. b) Suponha que o atacadista revenda cada uma dessas peças acrescentado 50% sobre o custo da peça, além de um adicional de R$ 0,10 pelo frete. Calcule as medidas de posição da variável V : preço de revenda da peça. 3. Num certo bairro da cidade de São Paulo, as companhias de seguro estabeleceram o seguinte modelo para número de veículos furtados por semana: Furtos (F) 0 1 2 3 4 pi 1/4 1/2 1/8 1/16 1/16 Calcule a média e a variância do número de furtos semanais do bairro. 4. Num jogo de dados, um jogador paga R$ 5 para lançar um dado equilibrado e ganha R$ 10 se resultar na face 6, ganha R$ 5 se resultar na face 5 e não ganha nada com as outras faces. Defina a variável L: lucro por jogada como sendo o saldo que o jogador ganhou menos o pagamento inicial (prejuízo é lucro negativo). Construa a função de probabilidade e determine média, moda, mediana e variância dessa variável. 5. Num teste de digitação, o tempo em minutos (T) que os candidatos levaram para digitar um texto é modelado, de forma aproximada, pela seguinte função de probabilidade: T 3 4 5 6 7 8 9 pi 0,1 0,1 0,2 0,2 0,2 0,1 0,1 O candidato recebe 4 pontos se terminar a digitação em 9 minutos, 5 se terminar em 8 minutos e assim por diante. Determine a média e a variância da variável N: número de pontos obtidos no teste. 6. Um caminho para chegar a uma festa pode ser divido em três etapas. Sem enganos o trajeto é feito em 1 hora. Se enganos acontecerem na primeira etapa, acrescente 10 minutos ao tempo do trajeto. Para enganos na segunda etapa, o acréscimo é 20 e, para terceira, 30 minutos. Admita que a probabilidade de engano é 0.1, 0.2 e 0.3 para a primeira, segunda e terceira etapas, respectivamente. É provável haver atraso na chegada à festa? Determine a probabilidade de haver atraso, e o atraso não passar de 40 minutos. 7. Um pai leva o filho ao cinema e vai gastar nas duas entradas R$ 15. O filho vai pedir para comer pipoca com probabilidade 0.7 e, além disso, pode pedir bala com probabilidade 0.5, independentemente um do outro. Se a pipoca custa R$ 2 e a bala R$ 3, estude o gasto (G) efetuado com o passeio ao cinema. 8. Uma variável aleatória Y tem a seguinte função de distribuição: F(Y ) =            0 se y < 10 0.2 se 10 ≤ y < 12; 0.5 se 12 ≤ y < 13; 0.9 se 13 ≤ y < 25; 1 se y ≥ 25. Determine: a) A função de probabilidade de Y . b) P(Y ≤ 12). c) P(Y < 12). d) P(12 ≤ Y ≤ 20). e) P(Y > 18). 9. Um agricultor cultiva laranjas e também produz mudas para vender. Após alguns meses, a muda pode ser atacada por fungos com probabilidade 0.05 e, nesse caso, ela é escolhida para ser recuperada com probabilidade 0.5. Admita que o processo de recuperação é infalível. O custo de cada muda produzida é R$ 1.00, mas acrescido de mais 50 centavos se precisar ser recuperada. Cada muda é vendida a R$ 3.00 e são descartadas as mudas não recuperadas de ataque de fungos. Estude como se comporta o ganho por muda produzida. 10. Num certo restaurante, paga-se pelo almoço uma quantia fixa dependendo da escolha feita de prato e bebida. A carne de peixe tem 10% de preferência, enquanto o frango tem 40% e carne bovina 50% . As três escolhas de bebida estão condicionadas à opção do prato, segundo a tabela abaixo: Opção: Peixe Cerveja Água Vinho P(Bebida|Peixe) 0.4 0.3 0.3 Opção: Frango Cerveja Água Vinho P(Bebida|Frango) 0.3 0.5 0.2 Opção: Bovina Cerveja Água Vinho P(Bebida|Bovina) 0.6 0.3 0.1 Admita os seguintes preços: Pedido Peixe Frango Bovina Cerveja Água Vinho Preço 12 15 18 6 3 9 a) Dado que alguém escolhe peixe, qual a probabilidade de que escolha cerveja? b) Se escolhe carne bovina, qual a probabilidade de tomar vinho? c) Sabendo que tomou água, qual a chance de ter escolhido frango? 2 . poe *,sEstatistica . . UFPR d) Determine a fungao de probabilidade para cada uma das varidveis X: prego do almogo e Y: prego do almoco para aqueles que preferem cerveja. 11. A resisténcia (em toneladas) de vigas de concreto produzidas por uma empresa, comporta-se conforme a funcgao de probabilidade abaixo: Resisténcia (Y) | 2 3 4 5 6 Di 0.1 O01 O04 O02 0.2 Admita que essas vigas sao aprovadas para uso em construgdes se suportarem pelo menos 3 toneladas. De um grande lote fabricado pela empresa, escolhemos 15 vigas ao acaso. Qual sera a probabilidade de: a) Todas serem aptas para construgdes? b) No minimo 13 serem aptas? 12. Verifique se as expressOes a seguir séo fung6es densidade de probabilidade (assuma que elas se anulam fora dos intervalos especificados). a) f(y) = 3y,seO<y<1. b) f(y) = y?/2, se y = 0. c) fly) =(y—3)/2, se 3 <y <5. d) f(y) =2,se0<y<2. — f(2+y)/4, se -2<y<0; e) ry) = {orale sedQ<y<2. 13. O tempo, em minutos, de digitacéo de um texto por secretarias experientes é uma varidvel aleatéria continua Y. Sua densidade é apresentada a seguir. 1/4, seOQ<y<2; fy= 51/8, se2<y <6; 0, caso contrario. Determine: a) P(Y > 3). b) PO <Y <4). c) P(Y <3|Y > 1). d) Um nimero b tal que P(Y > b) = 0.6. e) O valor esperado, a variancia e a moda de Y. 14. A quantia gasta anualmente, em milhdes de reais, na manutencao do asfalto em uma cidade do interior é representada pela varidvel Y com densidade dada por: 8 4 _ 5-3: se 0.5 <y < 2; f(y) { 0, caso contrario. Obtenha: a) P(Y < 0.8). b) P(Y > 1.5/Y > 1). c) O valor esperado e a variancia de Y. d) A mediana de Y. 15. O grafico abaixo representa a densidade de uma varidvel aleatoria Y. 3 −2 0 2 4 y f(y) a 2a− a) Obtenha o valor de a. b) Determine P(Y > 0|Y < 3). c) Calcule Md(Y ), E(Y ) e V ar(Y ). 16. Numa certa região, fósseis de pequenos animais são frequentemente encontrados e um arqueólogo estabeleceu o seguinte modelo de probabilidade para o comprimento, em centímetros, desses fósseis: f(y) =        1 40y, 4 ≤ y ≤ 8; − 1 20y + 3 5, 8 ≤ y ≤ 10; 1 10, 10 ≤ y ≤ 11; 0, caso contrário. a) Faça um gráfico da função densidade. b) Para um fóssil encontrado nessa região, determine a probabilidade do comprimento ser inferior a 6 centímetros. Determine também a probabilidade de ser superior a 5 mas inferior a 10.5 cm. c) Encontre o valor esperado para o comprimento dos fósseis da região. 17. O setor de emergência de um Pronto Socorro Infantil anotou o número de crianças atendidas (C), de médicos (M) e de auxiliares (A) de plantão em 15 dias de atividade. Os dados são apresentados na tabela abaixo: Dia 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 C 5 7 5 6 5 5 7 5 6 6 7 5 5 6 6 M 1 1 2 2 2 1 2 1 1 2 2 2 2 2 2 A 4 4 5 6 7 7 6 5 5 6 7 7 6 6 7 a) Determine as tabelas de frequência marginais de C, M e A. b) Obtenha a tabela de frequência conjunta entre (C, M), (C, A) e (M, A). c) Represente a tabela de frequência conjunta de M e A, por meio de uma tabela de dupla entrada. d) Calcule a média das variáveis M e A. 18. Para famílias de um certo bairro de São Paulo, apresentamos abaixo a tabela de frequência das variáveis número de automóveis (A) e número de TVs (T). A \T 0 1 2 total 0 110 235 120 465 1 51 122 178 351 2 15 74 162 261 total 176 441 460 1077 a) Calcule as marginais de A e T. 4 b) Determine o valor esperado dessas variáveis. 19. Uma moeda equilibrada é lançada 2 vezes de forma independente. Ao final dos lançamentos, duas variáveis aleatórias são anotadas: o número total de caras (C) e o número de coroas no 2o. lançamento (K). a) Construa uma tabela com os possíveis eventos, as respectivas probabilidades e os valores de C e K. b) Apresente a tabela de dupla entrada com a função de probabilidade conjunta de ambas as variáveis aleatórias C e K. c) Determine o valor esperado de C. 20. Num estudo sobre o tratamento de crises asmáticas, estabeleceu-se a seguinte função conjunta de probabilidades entre o número de crises de asma (A) e o número de internações hospitalares (H). A \H 0 1 2 0 1/8 1/16 0 1 3/16 1/8 1/16 2 1/16 3/16 3/16 a) Determine as funções de probabilidade marginal das variáveis A e H. b) Calcule o valor esperado dessas variáveis. c) Obtenha a função de probabilidade da variável A + H. 21. A função conjunta de probabilidade entre as variáveis X e Y é apresentada abaixo, mas com algumas entradas faltando: X \Y -1 0 2 4 P(X = x) -2 3/64 1/32 5/16 -1 1/16 1/16 0 1 1/64 11/64 1/64 5/16 2 5/64 3/64 1/32 P(Y = y) 5/16 1/4 1 a) Complete a tabela. b) Obtenha as marginais de X e Y . c) Calcule a função de probabilidade da variável X · Y . 22. Na tabela a seguir, encontram-se os conceitos de história (H), matemática (M) e física (F) de alguns alunos do 3o. ano do ensino médio de uma escola: Aluno 1 2 3 4 5 6 7 8 9 10 11 12 H c c c c b b b b b b b a M c c d c b c a c c c c c F d c b c b c c b b c c b a) Construa as tabelas de frequência conjunta para H e M e para H e F. b) Calcule a proporção de alunos com “b” em física, dentre aqueles com pelo menos “c” em matemática. 23. Um levantamento obtido, junto aos funcionários de um pequeno escritório, busca relacionar as variáveis: anos de estudo (X) e número de diferentes emprego nos últimos 5 anos (Y ): X 8 9 10 11 12 Y 4 2 1 2 1 O que você pode dizer sobre os dados fornecidos? 24. Uma amostra de 220 clientes de uma clínica dentária foi selecionada. As variáveis tempo, em anos, decorridos desde a última visita ao dentista (V ) e o número de cáries encontradas (C) são apresentados 5 na tabela a seguir: V \C 0 1 2 1 18 16 10 2 34 45 38 3 12 16 31 Obtenha as tabelas marginais de frequência. 25. A função de probabilidade conjunta entre as variáveis aleatórias X e Y é apresentada a seguir: X \Y -2 0 2 4 -1 0.1 0.2 0.1 0.2 1 0.2 0 0.1 0.1 a) Obtenha as funções de probabilidade marginais das variáveis. b) X e Y são independentes? c) Calcule a covariância e a correlação entre X e Y . 26. Na caixa I existem duas bolas numeradas de 0 e 1, enquanto a caixa II contêm duas bolas numeradas de -1 e 0. Uma bola é retirada aleatoriamente de cada caixa, de forma independente uma da outra. A esse experimento, associamos as variáveis aleatórias: número da bola retirada da caixa I (X), soma dos valores das duas bolas retiradas (Y ) e a diferença, em módulo, desses valores (Z). a) Determine a função de probabilidade conjunta entre X e Y e entre Y e Z. b) Verifique se X e Y são independentes. Faça o mesmo para Y e Z. c) Calcule a covariância entre X e Y . d) Obtenha V ar(X + Y ). 6 Respostas 1. Sendo Y uma variável aleatória, então E(Y ) = −2 · 1/3 + 0 · 1/3 + 2 · 1/3 = 0 Md(Y ) = 0 pois P(Y ≥ 0) = 2/3 ≥ 0.5 e P(Y ≤ 0) = 2/3 ≥ 0.5. Quanto à moda, todos os valores da variável podem ser usados, uma vez que eles são equiprováveis. 2. Considerando os dados: a) Medidas de posição da variável custo (C): E(C) = 1.00 · 0.2 + 1.10 · 0.3 + 1.20 · 0.2 + 1.30 · 0.2 + 1.40 · 0.1 = 1.17 Md(C) = 1.15 pois P(C ≤ 1.10) = 0.50 e P(C ≥ 1.20) = 0.50 Mo(C) = 1.10 pois é o valor que aparece com maior probabilidade. b) Preço de revenda é dado pela função: V = 0.1 + 1.5 · C. Então, a variável pode ser representada em forma de tabela: V 1.6 1.75 1.9 2.05 2.2 pi 0,2 0,3 0,2 0,2 0,1 As medidas de posição de V : E(V ) = 1.86, Md(V ) = 1.83 e Mo(V ) = 1.75. 3. Num certo bairro da cidade de São Paulo, as companhias de seguro estabeleceram o seguinte modelo para número de veículos furtados por semana: Furtos (F) 0 1 2 3 4 pi 1/4 1/2 1/8 1/16 1/16 E(F) = 0 · 1/4 + 1 · 1/2 + 2 · 1/8 + 3 · 1/16 + 4 · 1/16 = 1.19. V (F) = (0−E(F))2·1/4+(1−E(F))2·1/2+(2−E(F))22·1/8+(3−E(F))2·1/16+(4−E(F))2·1/16 = 1.15. 4. Para a variável lucro temos: Lucro (L) -5 0 5 pi 4/6 1/6 1/6 E(L) = −2.5; Mo(L) = −5; V (L) = 14.6 e Md(L) = −5 porque P(L ≤ −5) = 4/6 ≥ 0.5. 5. O candidato recebe 4 pontos se terminar a digitação em 9 minutos, 5 se terminar em 8 minutos e assim por diante. Então, temos que a variável N é dada por: 7 N 10 9 8 7 6 5 4 pi 0,1 0,1 0,2 0,2 0,2 0,1 0,1 O número médio de pontos será: E(N) = 10 · 0.1 + 9 · 0.1 + · · · + 4 · 0.1 = 7. e a variância será: V (N) = (102 · 0.1 + 92 · 0.1 + · · · + 42 · 0.1) − 72 = 3. 6. Sejam os eventos E: engano na etapa. O espaço amostral será: Ω = {(E, E, E), (E, E, Ec), (E, Ec, E), (E, Ec, Ec), (Ec, E, E), (Ec, E, Ec), (Ec, Ec, E), (Ec, Ec, Ec)} Seja a variável aleatória T: tempo total gasto no trajeto. Cada elemento de Ω leva a um tempo total gasto no trajeto T. Ω (E, E, E) (E, E, Ec) (E, Ec, E) (E, Ec, Ec) (Ec, E, E) (Ec, E, Ec) (Ec, Ec, E) (Ec, Ec, Ec) T 120 90 100 70 110 80 90 60 pi 0.006 0.014 0.024 0.056 0.054 0.126 0.216 0.504 A distribuição de probabilidade de T é dada por: T 60 70 80 90 100 110 120 p(T) 0.504 0.056 0.126 0.230 0.024 0.054 0.006 P(atraso) = P(T > 60) = 1 − P(T ≤ 60) = 1 − 0.504 = 0.496. P(atraso ser de até 40 min) = P(60 < T ≤ 100) = 0.056 + 0.126 + 0.230 + 0.024 = 0.436. 7. Suponha que o pai não irá comer guloseimas e defina os eventos: P: o filho pede pipoca; B: o filho pede bala. Defina a variável aleatória G: Gasto efetuado. O espaço amostral deste exercício e a distribuição de probabilidade do gasto são: Ω (P, B) (P c, B) (P, Bc) (P c, Bc) g 20 18 17 15 p(g) 0.7 · 0.5 = 0.35 0.3 · 0.5 = 0.15 0.7 · 0.5 = 0.35 0.3 · 0.5 = 0.15 8. a) Baseado-se na definição de função de distribuição, temos que a função de probabilidades de Y é dada por: Y 10 12 13 25 P(Y = y) 0.2 0.3 0.4 0.1 8 b) P(Y ≤ 12) = F(12) = 0.5. c) P(Y < 12) = F(10) = 0.2. d) P(12 ≤ Y ≤ 20) = P(Y ≤ 20) − P(Y < 12) = F(13) − F(10) = 0.7 e) P(Y > 18) = 1 − P(Y ≤ 18) = 1 − F(18) = 1 − F(13) = 0.1. 9. Seja o evento A: muda atacada por fungos, então P(A) = 0.05. Seja E: muda é escolhida para ser recuperada, então P(E|A) = 0.5. Defina a variável aleatória G: ganho de cada muda produzida. G = 2 se não precisar ser recuperada e P(G = 2) = P(Ac) = 0.95. G = 1.5 se precisar ser recuperada e P(G = 1.5) = P(A ∩ E) = P(A)P(E|A) = 0.025. G = −1 se for descartada e P(G = −1) = P(A ∩ Ec) = P(A)P(Ec|A) = 0.025. Ganho (G) –1 1.5 2 pi 0.025 0.025 0.95 10. a) P(Cerveja|Peixe) = 0.4. b) P(Vinho|Carne Bovina) = 0.1. c) P(Frango|Água) = P (Água|Frango)P (Frango) P (Água) = 0.5·0.4 P (Água) = 0.53 P(Água) = P(Água∩Peixe)+P(Água∩Frango)+P(Água∩Carne Bovina) = 0.03+0.20+0.15 = 0.38. Logo, P(Frango|Água) = 0.2 0.38 = 0.53 d) Sejam os eventos P: a escolha é peixe; F: a escolha é frango e B: para escolha por carne bovina. Sejam os eventos C: a bebida é cerveja; A: a bebida é água e V : a bebida é vinho. Ω (P, C) (P, A) (P, V ) (F, C) (F, A) (F, V ) (B, C) (B, A) (B, V ) preço 18 15 21 21 18 24 24 21 27 p 0.04 0.03 0.03 0.12 0.2 0.08 0.3 0.15 0.05 Função de probabilidade de X: preço do almoço. x 15 18 21 24 27 p(x) 0.03 0.24 0.30 0.38 0.05 e função de probabilidade de Y : preço do almoço para aqueles que preferem cerveja. y = (18, 21, 24) e p(y) =? A probabilidade de uma pessoa escolher cerveja é: P(C) = P(C∩P)+P(C∩F)+P(C∩B) = 0.04+0.12+0.30 = 0.46 9 . poe *,sEstatistica . . UFPR So Cerveja 0.4 ——» R$18 + p=0.04 Peixe 0.1 —————» Agua0.3 ———» R$15 os p=0.03 NG Vinho 0.3 ———> R$21 + p=0.03 So Cerveja 0.3 oe R21 ——» p=0.12 . ———> Frango 0.4 ————> Agua0.5 oo R18 ——» p=0.20 NN Vinho 0.2 rs R24 ——» p=0.08 So Cerveja 0.6 ns R24 ——» p=0.30 Carne Bovina 0.5 ———» Agua0.3 oe R21 ——» p=0.15 NG Vinho 0.1 oe R27 ——» p=0.05 P(P|C) = P(PNC)/P(C) = 0.04/0.46 = 0.09 = P(Y = 18) P(F|C) = P(F NC)/P(C) = 0.12/0.46 = 0.26 = P(Y = 21) P(B\C) = P(BNC)/P(C) = 0.30/0.46 = 0.65 = P(Y = 24) y 18 21 24 p(y) 0.09 0.26 0.65 11. a) Uma viga esté apta para construgéo se suportar pelo menos 3 toneladas. Logo, a probabilidade de qualquer viga estar apta é dada por p = P(X = 3)4+ P(X = 4)4+ P(X =5)+ P(X = 6) = 0.1+0.4+0.2+0.2 = 0.9. Hé n = 15 vigas selecionadas de forma aleatéria na amostra. A probabilidade de todas as 15 (a = 15) vigas estarem aptas é dada pelo produto de estar apta e nao estar apta. Note que queremos 15 aptas, entao p-p...p = p® = 0.91° = 0.206. A probabilidade de nao estar apta é o ntimero total de vigas menos a quantidade de vigas que estéo aptas, entado (1 — p)"~* = (1—0.1)'°~!° =1. Portanto. P(X = 15) = p*(1—p)""* = 0.915(1 — 0.9)°-1> = 0.206 - 1 = 0.206. b) Para que no minimo 13 vigas estejam aptas, entaéo temos que calcular a P(X > 13) = P(X = 13) + P(X = 14) + P(X = 15). Devemos lembrar que a probabilidade de uma tinica viga qualquer estar apta é p= 0.9 e nao estar aptaé q=1—p=1-0.9=0.1. Note que, se queremos 13, 14 ou 15 vigas aptas, elas estarem ou nao aptas pode ocorrer por meio de diversas combinagoes. Logo, devemos levar em consideragéo a combinacéo de n vigas tomadas de x maneiras. A férmula da combinacaéo é dada por (7) = aay: 10 *,4|Estatistica A férmula genérica para o célculo é P(X = 2) = aay" (1 —p)"~*, Entao, P(X > 13) = P(X =13) + P(X = 14) + P(X =15) P(X > 13) = pt — 0.9) 15-13 4 moa (1 — 0.9) 15-14 4 mse — 0.9) 15-15 P(X > 13) = 0.267 + 0.343 + 0.206 P(X > 13) = 0.816. 12. Para ser uma funcaéo de densidade de probabilidade é necessario satisfazer duas propriedades: 1) f(y) 20 I) f° f(y)dy = 1. a) f(y) 20 Vy. Jo 3ydy = 8. b) fy) 20 Vy. Jo wv dy = diverge. c) f(y) 20 Vy. Js tidy = 1. d) f(y) 20 Vy. fo 2dy = 4. e) f(y) 20 Vy. [Py etdy + fo Ftdy = 9 +551 Portanto, temos uma fdp apenas nas letras c) e e). 13. f(y) 20 Vy. Io ryt fp ay = ata E uma funciio de densidade de probabilidade. a) P(Y >3) = fp tdy = 2. b) P(L<Y <4) =f? tdy+ fe tdy=t42=1. c) PY <3IY > 1) = (fp dy + So Say) /(p Gey + Jo tay) = (4 + 8)/G + 9) = 3: d) fy tdy =0.4. Entdo, 4} =0.4e 2 =0.4. Logo, b= 16. e) E(Y)= fo ytdy + Sy ykdy =3=25. V(Y) = E(Y?) - E(Y)?. E(Y?)= fe y? tdy + ft y? sdy = 8 = 9.33. V(Y) = 8 — (8)? = 3.08. Ha um intervalo modal dado em [0,2], sendo Mo(Y) = 1. 11 _ poe *,sEstatistica . . UFPR 14. f(y) 20 Wy. 2 Jos(Sy _ §)dy =1. E uma funciio de densidade de probabilidade. 0.8 a) P(Y <0.8) = fy (8y — §)dy = 0.04. 2 2 b) P(Y > 1.5IY > 1) = (fr 5(§¥ — §)dy)/Ch (Sy — §) dy) = Segaay = 0-625. 2 c) E(Y) = fos y(Sy — §)dy = 1.50. V(Y) = E(X?) —- E(x)? 2 E(Y?) = fou? (Sy — §)dy = 2.375. V(Y) = 2.375 — (1.5)? = 0.125. d) fos(5y — 5 )dy = 0.5. 2 m? m (Ge — o)lé's = (Sie — °°) — Gg — 5) = 0.5. m2 4m (Ai — gt) =0.5 — Fe 8m2—8m _ 7 1s ~ 18° 8m? — 8m = 7. m—-m= Z. m —m— z = 0. As raizes do polindmio sao r; = —0.56 e rg = 1.56. Note que r; esté fora do suporte da varidvel aleatéria. Portanto, a mediana é rg = Md(Y) = 1.56. 15. a se—-2<a”<2; a) f(w@)=< 2a se2<aK<4; 0 caso contrario. Por meio de integral, temos que 5 adx + fe 2adx = 1 az|* 5 + 2ax|§ =1 2a+2a+ 8a-—4da=1 a=. 2 3 2 3 b) P(X > 0|X <3) = (fo gda t+ fy 2dx)/(f7, gd + JS Zdx) = (G+ 5)/(G +5) =F c) E(X) = f?,akde + ff r2da = 15. V(X) = E(X?) — E(X)?. E(X?) = Mr, a? edax + fr a*idx = *2 V(X) = ® — (1.5)? = 3.08. Md(X)= J’, ada = 0.5 Md(X) = ah = 0.5 12 _ poe *,sEstatistica . . UFPR Md(X) = 2+2=0.5 Md(X)=#+2=05 Md(X) = %=0.5-2 Md(X)=F= + Md(X) =m=2. 16. a) oO ql R oO co ° gs co ~ oOo > D uy _ + o A Z o oO — G S ¢) o Po 4 5 6 7 8 g 10 11 y b) P(Y <6) =f? dydy = BiG =F —-£ = _ 1 _ WLI > 4 19 Y7Y = gol6 = 80 80 — 807 80 80~ 4 P(5<Y < 105) = fo? f(y)dy 8 10 10.5 P(5<Y < 10.5) = (fe goydy) + J (-a5y + 3)dy) + ho toy) P(5<Y < 10.5) = 8+ 3 +0.05 = 0.84. 8 10 11 c) EY] = (fp yapydy) + Js y(—aay + 3)dy) + ho Yin dy) = (48) + (8) + (35) = 7.45. < 2 we Min fi 4 |2 0.13 17. a) 6 5 0.33 1 5 0.33 5 3 0.20 , 7 3 0.20 2 10 0.67 6 5 0.33 total | 15 7 total | 15 1 7 5 0.34 total | 15 1 b) Para obter a tabela de frequéncia conjunta, contamos a frequéncia com que os pares de valores 13 aparecem. Temos: (C, M) ni (5, 1) 3 (5, 2) 4 (6, 1) 1 (6, 2) 4 (7, 1) 1 (7, 2) 2 total 15 (C, A) ni (5, 4) 1 (5, 5) 2 (5, 6) 1 (5, 7) 3 (6, 5) 1 (6, 6) 3 (6, 7) 1 (7, 4) 1 (7, 6) 1 (7, 7) 1 total 15 (M, A) ni (1, 4) 2 (1, 5) 2 (1, 7) 1 (2, 5) 1 (2, 6) 5 (2, 7) 4 total 15 c) As frequências conjuntas e marginais podem ser combinadas em uma única tabela de dupla entrada, conforme a tabela a seguir, para as variáveis M e A. M \A 4 5 6 7 total 1 2 2 0 1 5 2 0 1 5 4 10 total 2 3 5 5 15 d) ¯mobs = 1.67 e ¯aobs = 5.88. 18. a) As frequências marginais são dadas pelas margens da tabela de dupla entrada. Portanto, temos: A ni fi 0 465 0.43 1 351 0.33 2 261 0.24 total 1077 1 T ni fi 0 176 0.16 1 441 0.41 2 460 0.43 total 1077 1 b) ¯aobs = 0.81 e ¯tobs = 1.27. 19. a) Eventos Probabilidades C K (cara, cara) 1/4 2 0 (cara, coroa) 1/4 1 1 (coroa, cara) 1/4 1 0 (coroa, coroa) 1/4 0 1 total 1 b) Tabela de dupla entrada: C \K 0 1 P(C = c) 0 0 1/4 1/4 1 1/4 1/4 1/2 2 1/4 0 1/4 P(K = k) 1/2 1/2 1 c) E(C) = 0 × 1/4 + 1 × 1/2 + 2 × 1/4 = 1/2 + 1/2 = 1. 14 20. a) A 0 1 2 P(A = a) 3/16 6/16 7/16 H 0 1 2 P(H = h) 6/16 6/16 4/16 b) E(A) = 1.25 e E(H) = 0.88. c) Função de probabilidade de S = A + H: S 0 1 2 3 4 P(S = s) 1/8 1/4 3/16 4/16 3/16 Para obter a tabela acima pode ser útil construir uma tabela auxiliar com os eventos, probabilidades e valor da variável de interesse. 21. a) Após complementar a tabela temos: X \Y -1 0 2 4 P(X = x) -2 3/32 3/64 1/32 9/64 5/16 -1 1/16 1/16 0 1/16 3/16 1 1/64 11/64 7/64 1/64 5/16 2 5/64 1/32 3/64 1/32 3/16 P(Y = y) 1/4 5/16 3/16 1/4 1 b) Marginais: X -2 -1 1 2 pi 5/16 3/16 5/16 3/16 Y -1 0 2 4 pi 1/4 5/16 3/16 1/4 c) Seja M = X × Y : M -8 -4 -2 -1 0 1 2 4 8 pi 9/64 3/32 5/64 1/64 5/16 1/16 13/64 1/16 1/32 22. a) (H, M) (c, d) (c, c) (b, c) (b, b) (b, a) (a, c) total ni 1 3 5 1 1 1 12 (H, F) (c, d) (c, c) (c, b) (b, c) (b, b) (a, b) total ni 1 2 1 4 3 1 12 b) 4/11. 23. Existe associação. Faça um gráfico dos pares (X, Y ) e calcule ρ(X, Y ) = −0.775. 24. a) Efetuando a soma de linha e de coluna obtemos as marginais: V ni fi 1 44 0.20 2 117 0.53 3 59 0.27 total 220 1 C ni fi 0 64 0.29 1 77 0.35 2 79 0.36 total 220 1 25. a) X -1 1 pi 0.6 0.4 Y -2 0 2 4 pi 0.3 0.2 0.2 0.3 15 b) Para que X e Y sejam independentes, todas a probabilidades conjuntas devem ser iguais ao produto das correspondentes probabilidades marginais. Este não é o caso pois P(X = 1; Y = 0) = 0 ̸= 0.08 = 0.4 × 0.2 = P(X = 1)P(Y = 0). Logo, concluímos que as variáveis não são independentes. c) Para o cálculo de covariância, obtemos E(X) = −0.2; E(Y ) = 1; e E(XY ) = −0.6. Assim, Cov(X, Y ) = E(XY ) − E(X)E(Y ) = −0.4. Para o cálculo da correlação, precisamos obter V (X) e V (Y ). Temos V (X) = 0.96; V (Y ) = 5.8, e, então, ρ(X, Y ) = −0.17. 26. a) (X, Y ) pi (0, -1) 0.25 (0, 0) 0.25 (1, 0) 0.25 (1, 1) 0.25 total 1 (Y, Z) pi (-1, 1) 0.25 (0, 0) 0.25 (0, 2) 0.25 (1, 1) 0.25 total 1 b) X e Y não são independentes. Da mesma forma para Y e Z. Verifique que o produto das marginais não é a conjunta. c) E(X) = 0.5; E(Y ) = 0; E(XY ) = 0.25 e portanto Cov(X, Y ) = 0.25. d) V (X + Y ) = 1.25 (obtenha antes V (X) = 0.25 e V (Y ) = 0.5). 16 Exercícios da Unidade 4 Modelos Probabilísticos Os exercícios foram extraídos dos livros: Bussab, WO; Morettin, PA. Estatística Básica. São Paulo: Editora Saraiva, 2006 (5ª Edição). Magalhães, MN; Lima, ACP. Noções de Probabilidade e Estatística. São Paulo: EDUSP, 2008. 1. Sendo Y uma variável segundo o modelo Uniforme Discreto, com valores no conjunto {1, 2, 3, . . . , 10}, pergunta-se: a) P(Y ≥ 7). b) P(3 < Y ≤ 7). c) P(Y < 2 ou Y ≥ 8). d) P(Y ≥ 5 ou Y ≥ 8) e) P(Y > 3 e Y < 6). f) P(Y ≤ 9|Y ≥ 6). 2. Um usuário de transporte coletivo chega pontualmente às 8 horas para pegar o seu ônibus. Devido ao trânsito caótico, a demora pode ser qualquer tempo entre 1 e 20 minutos (admita que o relógio “pule” de minuto em minuto). Pergunta-se: a) Qual a probabilidade de demorar mais de 10 minutos? b) Qual a probabilidade de demorar pelo menos 5 mas não mais de 10 minutos? c) Qual a probabilidade da demora não chegar a 5 minutos? d) Se um amigo chegou 10 minutos atrasado e vai pegar o mesmo ônibus (que ainda não passou), qual a probabilidade do amigo atrasado esperar até 3 minutos? 3. Sendo Y uma variável aleatória segundo o modelo Binomial com parâmetros n = 15 e p = 0.4, pergunta-se: a) P(Y ≥ 14). b) P(8 < Y ≤ 10). c) P(Y < 2 ou Y ≥ 11). d) P(Y ≥ 11 ou Y > 13). e) P(Y > 3 e Y < 6). f) P(Y ≤ 13|Y ≥ 11). 4. Uma certa doença pode ser curada por meio de procedimento cirúrgico em 80% dos casos. Dentre os que têm essa doença, sorteamos 15 pacientes que serão submetidos à cirurgia. Fazendo alguma suposição adicional que julgar necessária, responda qual é a probabilidade de: a) Todos serem curados. b) Pelo menos dois não serem curados. c) Ao menos 10 ficarem livres da doença. 5. (OPCIONAL) Sendo Y ∼ G(0.4) Calcule: a) P(Y = 3). . poe *,sEstatistica . . UFPR b) P(2<Y <4). c) P(Y > 1Y <2). d) P(Y >1) 6. (OPCIONAL) Uma moeda equilibrada é langada sucessivamente, de modo independente, até que ocorra a primeira cara. Seja Y a varidvel aleatdéria que conta o numero de langamentos anteriores a ocorréncia de cara. Determine: a) P(Y <2). b) P(Y > 1). c) P8<Y <5). d) Quantas vezes deve, no minimo, ser langada a moeda para garantir a ocorréncia de cara com pelo menos 0.8 de probabilidade. 7. A varidvel aleatéria Y tem fungao de probabilidade Poisson com parémetro 4 = 2. Obtenha: a) P(Y <2). b) P(2<Y <4). c) P(Y > 0). d) P(Y =1|Y < 3). 8. A aplicagao de fundo anti-corrosivo em chapas de aco de 1 m? é feita mecanicamente e pode produzir defeitos (pequenas bolhas na pintura) de acordo com uma varidvel aleatéria Poisson de parametro \ = 1 por m*. Uma chapa é sorteada ao acaso para ser inspecionada, pergunta-se a probabilidade de: a) Encontrarmos pelo menos 1 defeito. b) No maximo 2 defeitos serem encontrados. c) Encontrarmos de 2 a 4 defeitos. d) Nao mais de 1 defeito ser encontrado. 9. (OPCIONAL) A varidvel H segue o modelo Hipergeométrico com parémetros n = 10, m=5er=4. Determine: a) P(H = 2). b) P(A <1). c) P(H > 0). 10. (OPCIONAL) Por engano 3 pegas defeituosas foram misturadas com boas formando um lote de 12 pecas no total. Escolhendo ao acaso 4 dessas pecas, determine a probabilidade de encontrar: a) Pelo menos 2 defeituosas. b) No maximo 1 defeituosa. c) No minimo 1 boa. 11. Um laboratério estuda a emissao de particulas de certo material radioativo. Seja: N: ntimero de particulas emitidas em 1 minuto. O laboratério admite que N tem funcaéo de probabilidade Poisson com pardmetro 5, isto é, e7°5k P(N=k)= RP? k =0,1,2,... a) Calcule a probabilidade de que em um minuto nao haja emiss6es de particulas. b) Determine a probabilidade de que pelo menos uma particulas seja emitida em um minuto. c) Qual a probabilidade que, em um minuto, o ntmero de particulas emitidas esteja entre 2 e 5 (inclusive)? 12. Uma vacina contra a gripe é eficiente em 70% dos casos. Sorteamos, ao acaso, 20 dos pacientes vacinados e pergunta-se a probabilidade de obter: a) Pelo menos 18 imunizados. b) No maximo 4 imunizados. c) Nao mais do que 3 imunizados. 2 13. Uma indústria de tintas recebe pedidos de seus vendedores através de fax, telefone e Internet. O número de pedidos que chegam por qualquer meio (no horário comercial) é uma variável aleatória discreta com distribuição Poisson com taxa de 5 pedidos por hora. a) Calcule a probabilidade de mais de 2 pedidos por hora. b) Em um dia de trabalho (8 horas), qual seria a probabilidade de haver 50 pedidos? c) Não haver nenhum pedido, em um dia de trabalho, é um evento raro? 14. (OPCIONAL) Em um estudo sobre o crescimento de jacarés, uma pequena lagoa contém 4 exemplares de espécie A e 5 da espécie B. A evolução de peso e tamanho dos 9 jacarés da lagoa é acompanhada pelos pesquisadores por meio de capturas periódicas. Determine a probabilidade de, em três jacarés capturados de uma vez, obtermos: a) Todos da espécie A. b) Nem todos serem da espécie B. c) A maioria ser da espécie A. 15. Sendo Y ∼ U(0; 4), calcule: a) P(Y > 2). b) P(Y ≥ 2). c) P(1 < Y < 2). d) P(1 < Y < 2|Y < 3). e) P(Y < 3|1 < Y < 2). 16. Admite-se que uma pane pode ocorrer em qualquer ponto de uma rede elétrica de 10 quilômetros. a) Qual é probabilidade da pane ocorrer nos primeiros 500 metros? E de ocorrer nos 3 quilômetros centrais da rede? b) O custo de reparo da rede depende da distância do centro de serviço ao local da pane. Considere que o centro de serviço está na origem da rede e que o custo é de R$ 200 para distâncias até 3 quilômetros, de R$ 400 entre 3 e 8 e de R$ 1000 para as distâncias acima de 8 quilômetros. Qual é o custo médio do conserto? 17. O tempo necessário para um medicamento contra dor fazer efeito foi modelado de acordo com a densidade Uniforme no intervalo de 5 a 15 (em minutos), tendo por base experimentos conduzidos em animais. Um paciente, que esteja sofrendo dor, recebe o remédio e, supondo válido o modelo mencionado acima, pergunta-se a probabilidade da dor: a) Cessar em até 10 minutos? b) Demorar pelo menos 12 minutos? c) Durar mais de 7 minutos, sabendo-se que durou menos de 10? 18. Suponha que o valor esperado de uma variável aleatória com distribuição Uniforme contínua é 1 e a variância é igual a 1/12. Encontre a probabilidade da variável assumir valores menores que 3/4. 19. Sendo Y ∼ Exp(1), determine: a) P(0 < Y < 2). b) P(Y < 2). c) P(1 < Y < 4). d) P(Y > 3). e) P(Y < 2|Y > 1). 20. Suponha que o tempo de vida T de um vírus exposto ao meio ambiente segue uma distribuição Exponencial com parâmetro λ = 1/20 s. Calcule a probabilidade condicional P(T > 15|T > 10). 21. Seja Y ∼ N(4, 1). Determine: a) P(Y ≤ 4). b) P(4 < Y < 5). 3 c) P(2 ≤ Y < 5). d) P(5 ≤ Y ≤ 7). e) P(Y ≤ 1). f) P(0 ≤ Y ≤ 2). 22. Um indivíduo vai participar de uma competição que consiste em responder questões que são apresentadas sequencialmente. Com o nível de conhecimento que possui, a chance de acertar uma questão escolhida ao acaso é de 75% . Neste contexto, para cada diferente situação apresentada a seguir, defina a variável aleatória, sua distribuição de probabilidades e calcule a probabilidade solicitada. Se preciso, faça suposições necessárias e adequadas em cada caso. a) (OPCIONAL) Se for responder até errar uma pergunta, qual a probabilidade de conseguir acertar quatro ou mais questões? b) Se for responder cinco perguntas, qual a probabilidade de acertar quatro ou mais? c) (OPCIONAL) Se for responder até acertar a terceira pergunta, qual a probabilidade de errar apenas uma? d) (OPCIONAL) Se o candidato selecionar aleatoriamente seis questões de um banco de 40 questões das quais o candidato sabe a resposta de 30 delas (75%), qual a probabilidade de acertar ao menos cinco delas. Ainda, neste contexto, considere que o candidato responde, em média, 1,8 questões por minuto. e) Qual a probabilidade de conseguir responder ao menos três questões em três minutos? f) Qual a probabilidade de que o tempo para resposta de uma questão seja superior a 40 segundos? 23. A durabilidade de um tipo de filtro é descrita por uma variável aleatória com distribuição normal de média 60.000 hrs de funcionamento e desvio padrão de 9.000 hrs. a) Se o fabricante garante a duração dos filtros pelas primeiras 47.500 hrs, qual a proporção de filtros que devem ser trocados pela garantia? b) O que aconteceria com a proporção do item anterior se a garantia fosse para as primeiras 45.000 hrs? c) Qual deveria ser a garantia (em hrs) de forma a assegurar que o fabricante trocaria sob garantia no máximo 4% dos filtros? d) Se uma indústria comprar cinco (5) filtros, qual será a probabilidade de utilizar a garantia (de 45.000 horas) para trocar ao menos um (1) dos filtros? 24. Na comunicação entre servidores, uma mensagem é dividida em n pacotes, os quais são enviados na forma de códigos. Pelo histórico da rede, sabe-se que cada pacote tem uma probabilidade de 0.01 de não chegar corretamente a seu destino e, além disto, assume-se que o fato de um pacote chegar ou não corretamente ao destino não altera a probabilidade de chegada correta de outros pacotes. Um programa corretivo garante o envio correto da mensagem quando o número de pacotes enviados erroneamente não passar de 10% do total de pacotes da mensagem. a) Qual a probabilidade de uma mensagem composta de 20 pacotes ser enviada corretamente? b) E para uma mensagem de 200 pacotes? 25. Em um laticínio, a temperatura ideal do pasteurizador deve ser de 75◦C. Se a temperatura ficar inferior a 70◦C, o leite poderá ficar com bactérias indesejáveis ao organismo humano. Observações do processo mostram que, na forma de operação atual, os valores da temperatura seguem uma distribuição normal com média de 74.2◦C e desvio padrão de 2.2◦C. a) Qual a probabilidade da temperatura ficar inferior a 70◦C? b) Qual a probabilidade da temperatura ultrapassar os 75◦C desejados? c) Qual a probabilidade de que, em 20 pasteurizações, alguma(s) dela(s) não atinja(m) a temperatura de 70◦C? d) Deseja-se regular equipamentos para alterar a temperatura média do processo para que a proba- bilidade de ficar inferior a 70◦C seja de, no máximo, 0.0005. Qual deveria ser a nova média de operação? 4 e) Suponha, agora, que a nova média de operação seja de 74.5◦C. Deseja-se alterar o desvio padrão para satisfazer as condições do item anterior. Qual deve ser o novo desvio padrão de operação? 26. Suponha que em uma linha de produção, a probabilidade de se obter uma peça defeituosa é igual a 0.1. Uma amostra de 10 peças foi retirada aleatoriamente para inspeção. a) Para responder aos próximos itens, defina a variável aleatória de interesse e identifique-a com alguma das principais distribuições de probabilidade; b) Qual a probabilidade de na inspeção encontrar 3 peças defeituosas? c) Qual a probabilidade de que, pelo menos, 9 peças sejam perfeitas? d) Qual o número esperado de peças defeituosas? E o desvio padrão do número de peças defeituosas? 27. A probabilidade de um atirador acertar em um alvo é 0.8. a) Se o atirador dispara 5 vezes, qual a probabilidade de acertar no alvo pelo menos 3 vezes? b) Em 7 disparos, calcule: i) o número mais provável de disparos certeiros; ii) o número esperado de disparos certeiros. 28. Seja Z uma variável aleatória com distribuição Normal(0,1). Encontre o valor de z tal que: a) P(Z > z) = 0.119 b) P(Z < z) = 0.8051 29. A vida média de um teodolito é de 3 anos com desvio padrão de 0.61. Supondo que a vida útil dos teodolitos siga uma distribuição Normal, é razoável um prazo de garantia de 2.5 anos para este aparelho? 30. A quantidade de urânio de uma formação argilosa possui média igual a 95 u.m. e desvio padrão igual a 7.5 u.m. Sabendo-se que Y (quantidade de urânio numa amostra aleatória dessa formação) é uma variável aleatória com distribuição Normal, ache a quantidade b tal que: a) P(Y > b) = 0.2611 b) P(Y < b) = 0.9750 31. O tempo de espera para cada cliente que entra na fila do caixa de uma loja, segue uma distribuição de probabilidade exponencial com taxa igual a 0.2 por minuto. Calcule: a) o tempo médio de espera e o desvio padrão do tempo de espera; b) a probabilidade de um cliente selecionado ao acaso, ficar até 20 minutos na fila; c) e a probabilidade dele ficar na fila mais tempo que a média. 32. É sabido que, para homens adultos com boa saúde, em certa população, a temperatura corporal segue uma distribuição normal com média 36.8o C e desvio padrão 0.15o C. a) Se considerarmos 1000 homens adultos sadios dessa população, esperaríamos quantos com temper- atura entre 36.8o C e 37.2o C? b) Em qual intervalo de temperaturas estão 98% dos homens adultos sadios dessa população? (considere intervalos simétricos em torno da média) 5 _ poe *,sEstatistica . . UFPR Respostas 1. Sendo Y uma varidvel segundo o modelo Uniforme Discreto, com valores no conjunto {1, 2, 3,... , 10}, pergunta-se: a) P(Y >7)=P(Y =7)4+P(Y =8)4+ P(Y =9)4+ P(Y = 10) =4- io = 0.4. b) P(8<Y <7)=P(¥Y =4)+P(Y =5)+P(Y =6)+ P(Y =7) =4: 7 = 04. c) P(Y <20uY >8)=P(Y < 2)+P(Y >8)=P(Y =1)+P(Y =8)+P(Y =9)+ P(Y = 10) = 0.4. d) P(Y >5ouY >8)=P(Y >5)= 7% =06. e) P(Y >3eY <6)=P(3<Y <6)=P(Y =4)+P(Y =5) = 4% =02. f) P(6<Y <9 P(Y <9|Y >6) = Seeeey _ P(Y =6)+P(Y=7)+P(Y=8)+P(Y=9) = PA SOF PO SD FPO =8)F PW =9)FP(V=10) = 5/10 = 0.8. 2. Um usuario de transporte coletivo chega pontualmente as 8 horas para pegar o seu 6nibus. Devido ao transito cadtico, a demora pode ser qualquer tempo entre 1 e 20 minutos (admita que o relégio “pule” de minuto em minuto). Pergunta-se: D : tempo de espera, D ~ Up(1, 20) dé {0,1,2,--- , 20} P(D =d) = 1/20 a) Qual a probabilidade de demorar mais de 10 minutos? P(D > 10) = P(D = 11) 4+---+ P(D = 20) = 10/20 = 0.5. b) Qual a probabilidade de demorar pelo menos 5 mas nao mais de 10 minutos? P(5< D< 10) = P(D =5)+P(D =6)+P(D = 7)+P(D = 8)+P(D = 9)+P(D = 10) = 6/20 = 0.3. c) Qual a probabilidade da demora nao chegar a 5 minutos? P(D <5) =P(D=1)4+---+ P(D = 4) = 4/20 = 0.2. d) Se um amigo chegou 10 minutos atrasado e vai pegar o mesmo 6nibus (que ainda nao passou), qual a probabilidade do amigo atrasado esperar até 3 minutos? P(10 < D< 13) 3/20 P(D < 13|D > 10) = —~———— _ = —— _ =0.3. (Ds 13 ) P(D > 10) 10/20 3. Sendo Y uma varidvel aleatéria segundo o modelo Binomial com parémetros n = 15 e p = 0.4, pergunta-se: Y ~ 0(15, 0.4). 15 15— P(Y =y)= -0.4¥ -0.6°°-¥, para y = 0,1,2,--- ,15. y a) P(Y > 14)= P(Y = 14) 4+ P(Y = 15) =0. b) P(8<Y <10) = P(Y =9)+P(Y = 10) = 0.086. 6 _ poe *,sEstatistica . . UFPR 9) P(Y <2o0uY > 11) = P(Y =0)+P(Y =1)4+P(Y =11)+P(Y = 12)4+.---+P(Y = 15) = 0.015. d) P(Y > 11 ou Y > 13) = P(Y > 11) = P(Y =11)+---+ P(Y = 15) = 0.009. e) P(Y >3eY <6)=P(3<Y <6)=P(Y =4)+P(Y =5) =0.313. f) PA1L<Y<1 P(Y < 13|Y > 11) = PL <¥Y < 13) P(Y > 11) _ P(Y =11)4+ P(Y = 12)4+ P(Y = 13) ~ P(Y =11)+ P(Y = 12)4+ P(Y =13) + P(Y = 14) + P(Y = 15) __ 0.00932 ~ 0.00935 = 0.9968. 4. Uma certa doenca pode ser curada através de procedimento cirtirgico em 80% dos casos. Dentre os que tém essa doeng¢a, sorteamos 15 pacientes que seréo submetidos a cirurgia. Fazendo alguma suposicaéo adicional que julgar necessdria, responda qual é a probabilidade de: Y : ntmero de pacientes curados p: probabilidade de um paciente curar p=0.8 n=15 Y ~ 0(15, 0.8). a) Todos serem curados? 15 15 15-15 P(Y =15)= 15 -0.8°° - 0.2 = 0.035. b) Pelo menos dois nao serem curados? P(Y <13)=1-—P(Y > 13) =1-(P(Y = 14)4+ P(Y = 15)) = 0.833. c) Ao menos 10 ficarem livres da doenga? P(Y > 10) = P(Y =10)4+---+ P(Y = 15) = 0.939. 5. (OPCIONAL) Uma varidvel aleatéria com distribuicgéo de probabilidades geométrica pode ser definida de duas maneiras alternativas na literatura e implementacgdes computacionais. E importante saber desta possibilidade para poder usar corretamente cada material. A primeira delas é: X :ntmero de “fracassos” até o primeiro “sucesso” X ~ G(p) em que p é a probabilidade do “sucesso” x € {0,1,2---}. Neste caso a distribuicaéo de probabilidades é dada por: P(X =x) =(1—p)*p. 7 A segunda é (para evitar confusão vamos denotar agora a variável aleatória por outra letra): Y : número total de “tentativas” até o primeiro “sucesso” Y ∼ G(p) em que p é a probabilidade do “sucesso” y ∈ {1, 2, · · · }. Neste caso a distribuição de probabilidades é dada por: P(Y = y) = (1 − p)y−1p. As duas levam aos mesmos resultados. Por exemplo, seja lançar um dado até obter a face 6 pela primeira vez. A probabilidade de se conseguir na terceira tentativa pode ser calculada definindo: (i) o número de “fracassos’ ’ seria então 2: P(X = 2) = (1 − 1/6)2(1/6). (ii) o número de “tentativas’ ’ seria então 3: P(Y = 3) = (1 − 1/6)3−1(1/6). e, portanto, a mesma resposta. O mesmo é válido na definição de uma variável com distribuição binomial negativa. Sendo uma variável aleatória Y ∼ G(0.4) definida como número de “fracassos” até o primeiro “sucesso”, calcule: a) P(Y = 3) = 0.4 · 0.63 = 0.0864. b) P(2 ≤ Y < 4) = P(Y = 2) + P(Y = 3) = 0.23. c) P(Y > 1|Y ≤ 2) = P(1 < Y ≤ 2) P(Y ≤ 2) = P(Y = 2) P(Y ≤ 2) = 0.184. d) P(Y ≥ 1) = 1 − P(Y = 0) = 0.6. 6. (OPCIONAL) Uma moeda equilibrada é lançada sucessivamente, de modo independente, até que ocorra a primeira cara. Seja Y a variável aleatória que conta o número de lançamentos anteriores à ocorrência de cara. Determine: Y : número de lançamentos anteriores à ocorrência de cara Y ∼ G(0.5), y = {0, 1, · · · } P(Y = y) = (1 − p)yp. a) P(Y ≤ 2) = P(Y = 0) + P(Y = 1) + P(Y = 2) = 0.5 · 0.50 + 0.5 · 0.51 + 0.5 · 0.52 = 0.875. b) P(Y > 1) = 1 − (P(Y = 0) + P(Y = 1)) = 0.25. c) P(3 < Y ≤ 5) = P(Y = 4) + P(Y = 5) = 0.047. d) Quantas vezes deve, no mínimo, ser lançada a moeda para garantir a ocorrência de cara com pelo menos 0.8 de probabilidade. L : número total de lançamentos até ocorrência de cara. l 1 2 3 4 · · · y 0 1 2 3 · · · py 0.5 0.25 0.12 0.06 · · · 8 _ poe *,sEstatistica . . UFPR Para obter o nimero minimo de langamentos da moeda para garantir a ocorréncia de cara com no minimo 0.8 de probabilidade, precisamos obter | = y +1 tal que P(Y < y) > 0.80. Temos que P(Y <1) =P(X =0)4+ P(X = 1) = 0.75 < 0.8, e que P(Y <2)=P(Y =0)4+ P(Y =1)4+ P(Y = 2) = 0.875. Logo, o nimero de langamentos minimos necessarios é 1 = y+ 1=3. 7. A varidvel aleatéria Y tem fungao de probabilidade Poisson com parémetro 4 = 2. Obtenha: Y ~ Po(A = 2). A\y 2.9Y P(Y =y)= — = — a) P(Y <2) =P(Y =0)+ PY =1) = 4+ 2 ' — 0.406. b) P(2<Y <4) =P(Y =2)+P(Y =3) =0.451. c) P(Y > 0) =1-—P(Y <0) =1-P(Y =0) = 0.865. P(Y=1 d) PY =1/Y <3) = py SR = 04. 8. A aplicacdo de fundo anti-corrosivo em chapas de aco de 1 m? é feita mecanicamente e pode produzir defeitos (pequenas bolhas na pintura), de acordo com uma varidvel aleatéria Poisson de parametro \ = 1 por m?. Uma chapa é sorteada ao acaso para ser inspecionada, pergunta-se a probabilidade de: Y ~ Po(A = 1). ely P(Y =y)= a) Encontrarmos pelo menos 1 defeito. el . 19 P(> 1) =1-PY <1)=1- PY =0)=1—- —— = 0.632. b) No maximo 2 defeitos serem encontrados. P(Y <2)=P(Y =0)4+ P(Y =1)4+ P(Y = 2) = 0.92. c) Encontrarmos de 2 a 4 defeitos. P(2<Y <4)=P(Y =2)+P(Y =3)+ P(Y =4) = 0.261. d) Nao mais de 1 defeito ser encontrado. P(Y <1)=P(Y =0)4+ P(Y = 1) = 0.736. NT OOO™~™~™~C— 9. (OPCIONAL) A varidvel H segue o modelo Hipergeométrico com pardmetros »#—5, n = 5er = 4. Determine: m=10 H ~ HG(m=5,n =5,r = 4). h = {mazx(0,4 —5),--- ,min(4,5)} = {0,--- , 4}. m n 5 10 5 pet =n) = lea) _ IN £0. (ty ("") 4 (a) 9 _ poe *,sEstatistica . . UFPR 5 (2) (22) a) P(H =2)= ee. rns) = 0.33 4 4 b) P(H <1) = P(H =0)+4+ P(A = 1) = Q262. 0.0769 c) P(H > 0) =1-—P(H =0) = 0-976. 0.996 10. (OPCIONAL) Por engano 3 pecas defeituosas foram misturadas com boas formando um lote de 12 pecas nos total. Escolhendo ao acaso 4 dessas pecas, determine a probabilidade de encontrar: D :ntmero de pecas defeituosas dentre as 4. Dw~ HG(n = 9,m = 3,r = 4), d = {0, 1, 2, 3, 4}. m n 3 9 pip a) ~ Nera) _ 2) ae) ow) a) Pelo menos 2 defeituosas. 3\/ 9 3\( 9 _ _ _ yy _ 1. Wed — MG2) _ P(D > 2) =1—P(D <2) =1-—(P(D=0) + P(D =1)) =1— >a - Sop = 0.236. Cr) Cr) b) No maximo 1 defeituosa. P(D <1) = P(D =0)+ P(D = 1) = 0.764. c) No minimo 1 boa. P(No minimo 1 boa) = P(D < 3) =1. 11. Um laboratério estuda a emissao de particulas de certo material radioativo. Seja: N: ntimero de particulas emitidas em 1 minuto. O laboratério admite que N tem funcaéo de probabilidade Poisson com pardmetro 5, isto é, e7O5* P(N=k)= ai k =0,1,2,... a) Calcule a probabilidade de que em um minuto nao haja emiss6es de particulas. —550 P(N =0)= > = 0.007. b) Determine a probabilidade de que pelo menos uma particula seja emitida em um minuto. P(N > 1) =1-— P(N = 0) = 0.993. c) Qual a probabilidade que, em um minuto, o ntmero de particulas emitidas esteja entre 2 e 5 (inclusive)? P(2<N<5)=P(N =2)+ P(N =3)4+ P(N =4)4+ P(N =5) = 0.576. 12. Uma vacina contra a gripe é eficiente em 70% dos casos. Sorteamos, ao acaso, 20 dos pacientes vacinados e pergunta-se a probabilidade de obter: Y : ntmero de pacientes imunizados dentre 20 pacientes vacinados. Y ~ W(n = 20, p = 0.7), y = {0,1,--- , 20}. 20 PY =y)= ( ) 0.7% + 0.37074, y 10 _ poe *,sEstatistica . . UFPR a) Pelo menos 18 imunizados. P(Y > 18) = P(Y = 18)4+ P(Y =19)+ P(Y = 20) = 0.0355. b) No maximo 4 imunizados. P(Y <4) =P(Y =0)+---+P(Y =4) =5.55 x 10°°. c) Nao mais do que 3 imunizados. P(Y <3) =P(Y =0)+---+P(Y =3) =5.43 x 1077. 13. Uma indistria de tintas recebe pedidos de seus vendedores através de fax, telefone e Internet. O nimero de pedidos que chegam por qualquer meio (no hordario comercial) é uma varidvel aleatéria discreta com distribuigéo Poisson com taxa de 5 pedidos por hora. Y : nimero de pedidos. Y ~ Po(5),y = {0,1,2,-+- }. e7°5Y P(Y =y)= a a) Calcule a probabilidade de mais de 2 pedidos por hora. P(Y >2)=1-P(Y <2) =1-(P(Y =0)4+ P(Y =1)+ P(Y = 2)) = 0.875. b) Em um dia de trabalho (8 horas), qual seria a probabilidade de haver 50 pedidos? Considere A=5-8=40. 404950 eo P(Y =50) = ——— =0.018. ( ) 50! Dica: para facilitar os cdlculos use a transformacao log (logaritmo natural) logP(Y =50) =log(e~*°) + log(40°°) — log(50 - 49 --- 1) = —4A0 - log(e) + 50 - log(40) — (log50 + log49 + --- + log1) = —40 + 50 - 3.69 — 148.48 = —3.98. Entao, P(Y = 50) = e~ 3-8 = 0.0187. c) Nao haver nenhum pedido, em um dia de trabalho, 6 um evento raro? Considere = 40. e—4040° P(Y =0)= a. = 0. 14. (OPCIONAL) Em um estudo sobre o crescimento de jacarés, uma pequena lagoa contém 4 exemplares de espécie A e 5 da espécie B. A evolugdo de peso e tamanho dos 9 jacarés da lagoa é acompanhada pelos pesquisadores através de capturas periddicas. Determine a probabilidade de, em trés jacarés capturados de uma vez, obtemos: Y : ntimero de jacarés da espécie A. Y ~ HG(m =4,n = 5,r = 3). 4\( 5 _ _ (,) (3°) _ P(Y =y)= sah ~—SCCépara yy = 0,1,2,3. ("5") a) Todos da espécie A. 4\( 5 P(X =3)= G(s) = 0.048. ("5") 11 _ poe *,sEstatistica . . UFPR b) Nem todos serem da espécie B. 4) (5 _ Ce P(X > 0) =1-— P(X =0) =1-— —j— = 0.881, (3) 4 5 que é equivalente a P(X° 4 3) =1— P(X° =3)=1- lfges) = 0.881. 3 c) A maioria ser da espécie A. 4) (5 4) (5 + P(X > 2) = P(X =2)+ P(X =3)= ()o°2) + (9) (03) = 0.405. (3) 15. Sendo Y ~ U(0;4), calcule: 1 4 a) P(Y > 2)= Jy f(y)dy = 4\2 = g(4— 2) = 1/2. b) P(Y >2)= P(Y > 2) =1/2. c) P< Y <2)= f? f(y)dy = ¥[? = 402-1) = 1/4. _ P(U<Y<2)_ 1/4 fd fh d) PL<Y <2\Y <3) = yay = Fr ranay ~ WA = aya = 1/3. ce) P(Y <3|/1< ¥ <2) = FESS gL 16. Admite-se que uma pane pode ocorrer em qualquer ponto de uma rede elétrica de 10 quilémetros. Y : ocorre a pane em qualquer ponto da rede. Y ~ U(0,10). 1 S-—- < < 1 . fy)=7p VSysl0 a) Qual é probabilidade da pane ocorrer nos primeiros 500 metros? E de ocorrer nos 3 quilémetros centrais da rede? 0.5 4 Y 08 P(Y <0.5) = —dy = —=|9° = 0.5/10 = 0. (Y < 0.5) [ 10 Y 19 (0 0.5/10 = 0.05 ° 4 P(3.5<Y <6.5) = | —dy = 3/10 3 10 b) O custo de reparo da rede depende da distancia do centro de servico ao local da pane. Considere que o centro de servico esta na origem da rede e que o custo é de R$ 200 para distancias até 3 quilémetros, de R$ 400 entre 3 e 8 e de R$ 1000 para as distancias acima de 8 quildmetros. Qual é o custo médio do conserto? Considere a varidvel C: Custo de reparo. Entao, C | 200 400 1000 Pe | Pi P2 P3 5 py = P(C = 200) = P(Y <3) = | 0 tv = 3/10 = 0.3. 0 S41 po = P(C = 400) = PB <¥ <8) = [ 9 ty = 8/10 = 0.5 3 p3 = P(C = 1000) = P(Y > 8) = | T0 = 2/10 =0.2 8 12 _ poe *,sEstatistica . . UFPR E(C) = 200- p; + 400 - po + 1000 - p3 = 460 17. O tempo necessario para um medicamento contra dor fazer efeito foi modelado de acordo com a densidade Uniforme no intervalo de 5 a 15 (em minutos), tendo por base experimentos conduzidos em animais. Um paciente, que esteja sofrendo dor, recebe 0 remédio e, supondo valido o modelo mencionado acima, pergunta-se a probabilidade da dor: T : tempo até medicamento fazer efeito. T ~ U(5, 15). 1 t) = ——,5<t< 15. MO = BESS a) Cessar em até 10 minutos? 10 10 1 PIT < 10) [ fiat = | —dt = 5/10 = 1/2. 5 5 10 b) Demorar pelo menos 12 minutos? P(T > 12)= / —dt = 3/10. 12 10 c) Durar mais de 7 minutos, sabendo-se que durou menos de 10? 10 P(7<T< 10 1/10dt 3/10 pr > rir < 10) = PUST<1) _ fy ANOdt _ 3/10 _ 5, P(T < 10) Jz 1/1odt 5/10 18. Suponha que o valor esperado de uma varidvel aleatéria com distribuicéo Uniforme continua é lea varidncia é igual a 1/12. Encontre a probabilidade da varidvel assumir valores menores que 3/4. Y ~ U(a, 6) b E(Y)=1= a (b— a)? 2 2 Var(Y) =1/12= 3 (2 — 2a)” = 1 > (4a* — 8a+ 3) =0 Resolvendo esta equacgaéo temos quea = 0.5eb=1.5 oua=1.5eb=0.5. Como (a < b) entao a solugdo é Y ~ U(0.5, 1.5). 0.75 1 PY <3/4)= ——— dy = 0.25. (¥ < 3/4) [. 15-05." 19. Sendo Y ~ Exp(1), determine: fy) =e", y 20 a) P(O<Y <2)= fee Ydy = —e7¥|3 = ec? + =1—e-? = 0.865. b) P(Y <2) = fo e%dy = e742 = —e~? + 1 = 0.865. c) PAL<Y <4)= fo e-Ydy = —e~¥|f = —e~4 + 7! = 0.35. d) P(Y >3)=1-P(Y <3) =0.05. P(1<Y e) P(Y <2 > 1) = 20552) = 0.632. 13 _ poe *,sEstatistica . . UFPR 20. Suponha que o tempo de vida T de um virus exposto ao meio ambiente segue uma distribuicaéo Exponencial com paraémetros \ = 1/20 s. Calcule a probabilidade condicional P(T > 15|T > 10). T ~ Exp(1/20) f(t) =1/20-e"F/% 4 >0 P(T>15) fie 1/20-e"9/?%'dt 0.472 P(T > 15|T > 10) = ————_~ = - 0.779 (T > 15|P > 10) = Ser S40) [= 1/20-e- C720" at — 0.607 21. Seja Y ~ N(4,1). Determine: F( ) 1 _ (y=n)? = ——eEe Qo2 y oV 2a a) PY <4) =f", f(y)dy = 05. b) P(4<Y <5)=P(Y <5)—P(Y <4) =0.341. c) P2<Y<5)=P(Y <5)—P(Y < 2) = 0.819. d) P(<Y <7)=P(Y <7)—P(Y <5) =0.157. e) P(Y <1) = 0.001. f) PO<Y <2) =0.023. 22. Um individuo vai participar de uma competicao que consiste em responder quest6es que séo apresentadas sequencialmente. Com o nivel de conhecimento que possui, a chance de acertar uma questao escolhida ao acaso é de 75% . Neste contexto, para cada diferente situacéo apresentada a seguir, defina a varidvel aleatéria, sua distribuigaéo de probabilidades e calcule a probabilidade solicitada. Se preciso, faca suposic6es necessaérias e adequadas em cada caso. a) (OPCIONAL) Se for responder até errar uma pergunta, qual a probabilidade de conseguir acertar quatro ou mais quest6es? Y : Numero de acertos até o primeiro erro. Y ~ G(0.25). 3 . P(Y >4)=1-P(Y <3) =1— 5 /(1—0.25)'(0.25) = 0.316. i=0 b) Se for responder cinco perguntas, qual a probabilidade de acertar quatro ou mais? Y : Numero de acertos em cinco perguntas. Y ~ b(n =5,p = 0.75). 5 5 , , P(Y >4)=P(Y =4)+P(Y =5)=)> (Fors — 0.75)°-? = 0.633. i=d c) (OPCIONAL) Se for responder até acertar a terceira pergunta, qual a probabilidade de errar apenas uma? Y : Numero de erros até o terceiro acerto. Y ~ BN(r = 3, p = 0.75). 34+1-1 P(Y =1)= ( 3 1 Jost — 0.75)! = 0.316. 14 _ poe *,sEstatistica . . UFPR d) (OPCIONAL) Se o candidato selecionar aleatoriamente seis quest6es de um banco de 40 questées das quais o candidato sabe a resposta de 30 delas (75%), qual a probabilidade de acertar ao menos cinco delas. Y : Numero de acertos nas seis questdes selecionadas. Y ~ HG(30, 10,6). OD (29) P(Y >5) = P(Y =5)+P(Y =6) => +48 = 0.526. i=5 ( 6 ) Ainda neste contexto considere que o candidato responde, em média, 1.8 quest6es por minuto. e) Qual a probabilidade de conseguir responder ao menos trés questées em trés minutos? Y : Numero de quest6es respondidas em 3 minutos. Y ~ Po(A = 3-1.8 = 5.4). *\ 0745.4) PIV 23) =1— PIV $2) = 1) 7 = 0.905 f) Qual a probabilidade de que o tempo para resposta de uma questdo seja superior a 40 segundos? Y : tempo (em min.) para responder uma questao. Y ~ Exp(A = 1.8). P(Y > 40/60) = | 1.8e7!8¥dy = 0.301. 40/60 23. A durabilidade de um tipo de filtro é descrita por uma varidvel aleatéria com distribuigéo normal de média 60.000 horas de funcionamento e desvio padrao de 9.000 horas. Y ~ N(60.000, 9.0007) a) Se o fabricante garante a duracao dos filtros pelas primeiras 47.500 horas, qual a propor¢ao de filtros que devem ser trocados pela garantia? 47500 — 60000 P(Y < 47500) = P(Z < —oo00 = P(Z < —1.389) = 0.082. b) O que aconteceria com a proporgao do item anterior se a garantia fosse para as primeiras 45.000 horas? 45000 — 60000 P(Y < 45000) = P(Z < —oo00 = P(Z < —1.667) = 0.048. c) Qual deveria ser a garantia (em hrs) de forma a assegurar que o fabricante trocaria sob garantia no maximo 4% dos filtros? P(Y <t)=0.04 ; t=? t — 60000 P(Z < ——— ) = 0.04 (2 < ~Go99) = 9° z= -1.751. t — 60000 —— = -1.751 9000 t = 60000 + 9000(—1.751) t = 4,4243825 x 104. 15 . poe *,sEstatistica . . UFPR d) Se uma indtstria comprar cinco (5) filtros, qual sera a probabilidade de utilizar a garantia (de 45.000 horas) para trocar ao menos um (1) dos filtros? Y : ntimero de trocados sob garantia dentre 5 comprados . Y ~ W(n =5,p = P(Y < 45000) = 0.048). P(Y >1)=1-P(Y =0) = 0.217. 24. Na comunicacéo entre servidores, uma mensagem é dividida em n pacotes, os quais séo enviados na forma de cdédigos. Pelo histérico da rede sabe-se que cada pacote tem uma probabilidade de 0.01 de nao chegar corretamente a seu destino, e além disto, assume-se que o fato de um pacote chegar ou nao corretamente ao destino nao altera a probabilidade de chegada correta de outros pacotes. Um programa corretivo garante o envio correto da mensagem quando o ntimero de pacotes enviados erroneamente nao passar de 10% do total de pacotes da mensagem. a) Qual a probabilidade de uma mensagem composta de 20 pacotes ser enviada corretamente? Y : ntimero de pacotes incorretos em 20 pacotes. Y ~ 0(n = 20, p = 0.01). limite : 10% de 20 pacotes = 2 pacotes. 2 20 P(Y <2)=P(¥Y =0) + P(Y =1)+ P(Y =2)=)> ( Joona — 0.01)?°-¥ = 0.999. y 0 b) E para uma mensagem de 200 pacotes? X ~ b(n = 200, p = 0.01) & P(A =n-p = 200- 0.01 = 2). x N(u=n-p=2,07 =n-p-(1—p) = 1.98). A aproximacéo normal nao é muito acurada pois np < 5, porém conveniente limite : 10% de 200 pacotes = 20 pacotes. P(Y < 20) = P(Y =0)+ P(Y =1)+...+P(Y = 20) = 20 20 200 ~2 Qu 20.5 — 2 => ( )oora — 0.01)? Y = S > ©" ~ P(Yy < 20.5) = P(Z < —2=*) 2x1. 0 NY 7 V1.98 25. Em um laticinio, a temperatura ideal do pasteurizador deve ser de 75°C. Se a temperatura ficar inferior a 70°C, o leite podera ficar com bactérias indesejaveis ao organismo humano. Observacées do processo mostram que na forma de operacéo atual os valores da temperatura seguem uma distribuigéo normal com média de 74.2°C e desvio padrao de 2.2°C. Y : temperatura do pasteurizador. Y ~ N(74.2; 2.27). a) Qual a probabilidade da temperatura ficar inferior a 70°C? P(Y < 70) = P(Z < (70 — 74.2) /2.2) = 0.0281. b) Qual a probabilidade da temperatura ultrapassar os 75°C desejados? P(Y > 75) = P(Z < (75 — 74.2) /2.2) = 0.3581. 16 c) Qual a probabilidade de que em 20 pasteurizações, alguma(s) dela(s) não atinja(m) a temperatura de 70◦C? Y : número de pasteurizações que não atingem 70◦C. Y ∼ b(20, p). p = P(Y < 70) = 0.0281. P(Y ≥ 1) = 1 − P(Y = 0) = 0.435. d) Deseja-se regular equipamentos para alterar a temperatura média do processo para que a prob- abilidade de ficar inferior a 70◦C seja de no máximo 0.0005. Qual deveria ser a nova média de operação? P(Y < 70|µ0) = 0.0005 z0.0005 = (y − µ0)/σ −3.291 = (70 − µ0)/2.2. µ0 = 70 − 2.2(−3.291) = 77.2402. e) Suponha agora que a nova média de operação seja de 74.5◦C. Deseja-se então alterar o desvio padrão para satisfazer as condições do item anterior. Qual deve ser o novo desvio padrão de operação? P(Y < 70|σ0) = 0.0005. z0.0005 = (y − 74.5)/σ0 −3.291 = (70 − 74.5)/σ0 σ0 = (70 − 74.5)/(−3.291) = 1.37. 26. a) Y : Número de peças defeituosas dentre 10 b) 0.0574 c) 0.7361 d) E(X) = 1 peça defeituosa; DP(X) = 0.9487 peça defeituosa 27. a) 0.94208 b) i) 6 acertos c) ii) 5.6 acertos 28. a) z = 1.18 b) z ≈ 0.86 29. Seja Y : vida útil (em anos) do aparelho, então: P(aparelho quebrar depois do prazo de garantia) = P(Y > 2.5) = P(Z > −0.82) = 0.79389 30. a) z ≈ 0.64 → b ≈ 99.8 b) z = 1.96 → b = 109.7 31. Seja T : tempo de espera (em minutos), então: a) E(T) = 5 minutos e DP(T) = 5 minutos 17 b) 0.9817 c) 0.3679 32. Seja Y : temperatura corporal de homens adultos sadios (em graus Celsius), então: a) aproximadamente 496 homens b) entre 36.45 e 37.15 graus 18 Exercícios da Unidade 5 Distribuição amostral 1. Um experimento genético envolve uma população de moscas de frutas que consiste em 1 macho (Mike) e 3 fêmeas, chamadas Ana, Bárbara e Cristina. Suponha que duas moscas de frutas sejam selecionadas aleatoriamente com reposição. a) Depois de listar as 16 diferentes amostras possíveis, ache a proporção de fêmeas em cada amostra e, então, use uma tabela para descrever a distribuição amostral da proporção de fêmeas. b) Ache a média da distribuição amostral. c) A média da distribuição amostral (item b) é igual à proporção populacional de fêmeas? 2. As idades (anos) dos quatro presidentes dos Estados Unidos quando foram assassinados no exercício do cargo são 56 (Lincoln), 49 (Garfield), 58 (McKinley) e 46 (Kennedy). a) Supondo que duas das idades sejam selecionadas com reposição, liste as 16 diferentes amostras possíveis. b) Ache a média de cada uma das 16 amostras e, então, resuma a distribuição amostral das médias no formato de uma tabela que represente uma distribuição de probabilidade. c) Compare a média populacional com a média das médias amostrais. 3. Repita o Exercício 2 usando a mediana no lugar da média. 4. Considere o seguinte problema (adaptado de Magalhães & Lima, 2006): Um fabricante afirma que sua vacina contra gripe imuniza em 80% dos casos. Uma amostra de 25 indivíduos entre os que tomaram a vacina foi sorteada e testes foram feitos para verificar a imunização ou não desses indivíduos. a) No contexto do problema identifique: • a população, • o parâmetro de interesse, • o estimador, • a estimativa, • a distribuição amostral. b) Se o fabricante estiver correto, qual é a probabilidade da proporção de imunizados na amostra ser inferior a 0.75? E superior a 0.85? 5. Uma variável aleatória Y tem distribuição normal, com média 100 e desvio padrão 10. a) Qual a P(90 < Y < 110)? b) Se ¯Y for a média de uma amostra de 16 elementos retirados dessa população, calcule P(90 < ¯Y < 110). 6. A máquina de empacotar um determinado produto o faz segundo uma distribuição normal, com média µ e desvio padrão 10 g. a) Em quanto deve ser regulado o peso médio µ para que apenas 10% dos pacotes tenham menos do que 500 g? b) Com a máquina assim regulada, qual a probabilidade de que o peso total de 4 pacotes escolhidos ao acaso seja inferior a 2 kg? 7. Utilizando algum recurso computacional ou tabela, calcule as probabilidades a seguir, conforme a distribuição da v.a. Y : Y ∼ t20 Y ∼ χ16 Y ∼ F(10,7) P(−2.85 ≤ Y ≤ 2.85) P(8.91 < Y < 32.85) P(Y > 3.18) P(Y < −2.85) P(Y > 8.91) P(Y > 0.15) P(Y > 2.85) P(Y > 32.85) P(Y > 5.35) P(Y > 2.12) P(Y > 22.80) P(Y < 7.41) P(Y < −3.01) P(Y < 10.12) P(Y < 1) 8. Para cada uma das 3 distribuições propostas no exercício anterior, encontre o valor de y tal que: a) P(Y < y) = 0.90 b) P(Y < y) = 0.025 c) P(Y < y) = 0.01 d) P(Y > y) = 0.975 9. Um estudo que investiga a relação entre idade e despesas médicas anuais amostra aleatoriamente 100 indivíduos em uma cidade da Califórnia. Espera-se que a amostra tenha uma média de idade semelhante à de toda a população. a) Se o desvio padrão das idades de todos os indivíduos em Davis for σ = 15, encontre a probabilidade de que a idade média dos indivíduos da amostra esteja dentro de dois anos da idade média de todos os indivíduos na cidade. (Dica: encontre a distribuição amostral da idade média da amostra e use o teorema do limite central. Você não precisa saber a média da população para responder, mas se isso facilitar, use um valor como µ = 30.) b) A probabilidade seria maior ou menor se σ = 10? Por quê? 10. O teste de conhecimentos gerais chamado Graduate Record Examination (GRE) tem componentes que medem o raciocínio verbal e o raciocínio quantitativo. O exame verbal e o exame quantitativo têm cada um uma pontuação mínima de 200 e máxima de 800. Nos últimos anos, a pontuação total nos dois exames teve aproximadamente uma distribuição normal com uma média de cerca de 1050 e desvio padrão de cerca de 200. a) Qual a probabilidade de obter pontuação total (i) abaixo de 1200 e (ii) acima de 1200? b) Dos participantes do teste GRE que pontuaram acima de 1.200, qual proporção deles teve pontuação acima de 1.400? c) Um grupo de 25 alunos formou um grupo de estudos para se preparar para o GRE. Para eles, a média de suas 25 pontuações totais é 1200. Se eles fossem uma amostra aleatória dos alunos que estão fazendo o exame, explique por que isso teria sido um resultado muito incomum. 11. Continuando o exercício 6, após a máquina estar regulada, programou-se uma carta de controle de qualidade. De hora em hora, será retirada uma amostra de quatro pacotes, os quais serão pesados. Se a média da amostra for inferior a 495 g ou superior a 520 g, encerra-se a produção para reajustar a máquina, isto é, reajustar o peso médio. a) Qual a probabilidade de ser feita uma parada desnecessária. b) Se o peso médio da máquina desregulou-se para 500 g, qual é a probabilidade de continuar a produção fora dos padrões desejados? 12. Um procedimento de controle de qualidade foi planejado para garantir um máximo de 10% de itens defeituosos na produção. A cada 6 horas sorteia-se uma amostra de 20 peças e, havendo mais de 15% 2 de defeituosas, encerra-se a produção para verificação do processo. Qual a probabilidadede uma parada desnecessária? 13. Supondo que a produção do exemplo anterior esteja sob controle, isto é, p = 0.1, e que os itens seja vendidos em caixas com 100 unidades, qual a probabilidade de que uma caixa: a) tenha mais do que 10% de defeituosos? b) não tenha itens defeituosos? 3 Respostas 1. a) Serão 16 pares possíveis, todos equiprováveis com probabilidade 1/16 e a distribuição da proporção amostral de fêmeas é: ˆp =prop(fêmeas) p 0 1/16 1/2 6/16 1 9/16 b) A média da proporção amostral é E(ˆp) = 0 · 1/16 + 1/2 · 6/16 + 1 · 9/16 = 0.75 c) A proporção populacional de fêmeas é 3/4=0.75 que é igual à média da proporção amostral. Este resultado indica que em média a proporção amostral é igual à proporção populacional. 2. a) As 16 amostras possíveis são todos os pares dois a dois das idades dos quatro presidentes. b) A distribuição amostral das médias ficará: Média P(Média) 46 1/16 47.5 2/16 49 1/16 51 2/16 52 2/16 52.5 2/16 53.5 2/16 56 1/16 57 2/16 58 1/16 c) A média populacional é 52.25 e a média das médias amostrais obtida usando a distribuição obtida no item b é: E( ¯X) = 46 · 1/16 + · · · + 58 · 1/16 = 52.25 notamos que ambas são iguais. 3. b) As medianas de amostras de tamanho dois são exatamente iguais às médias amostrais, então a distribuição das medianas será a mesma do exercício anterior. Mediana P(Mediana) 46 1/16 47.5 2/16 49 1/16 51 2/16 52 2/16 52.5 2/16 53.5 2/16 56 1/16 57 2/16 58 1/16 c) A mediana populacional é 52.5 e a média das medianas obtida usando a distribuição construída no item (b) é E(Mediana) = 52.25, observamos que elas são diferentes. 4 _ poe *,sEstatistica . . UFPR 4. a) Y : imunizado (0: nao, 1: sim) Y € {0,1} Y ~ Ber(p) e Os individuos que receberam a vacina. « A proporgao (p) de individuos imunizados entre todos os que receberam a vacina (na populagao). ¢ O calculo da proporgao de individuos imunizados na amostra p = )>""_, Y;/n. e A proporcéo observada em uma determinada amostra (no caso na amostra de n = 25 individuos). ¢ A distribuigéo amostral do estimador, ou seja, a distribuigéo que seria obtida caso fossem obtidas estimativas de diversas amostras. Distribuigéo amostral aproximada: - ia Yi p(l—p p= Dini Yi ~ N(p, pl =p), n n b) 1-— 0.80(1 — 0.80 pan (pao, MEP) _ 0:80(1 = 0.80) n 25 P(p < 0.75|p = 0.80) = 0.266 P(p > 0.85|p = 0.80) = 0.266 5. a) X ~ N(100, 107) 90-100 X-—yp | 110-100 P(90 < X < 110) = P(— 9 — < >| * —7? = P(-1<Z<1)=0.68 b) - X ~ N(100, (10/V/16)?) = 90-100 X-yp a) P(90 < X < 110) = P| ———~ < —= < — ( ) ( 10/Vi6 < o/vn ~ 10/vi6 = P(-4 < Z < 4) = 1.00. 6. Sabemos que X ~ N(p, 102). a) xXx P(X <500) = P(z < ~—*) = 0.10 a 500 — po = P| Z < ——]=0.1 ( < 10 ) 0.10 500 — pu —— = -1.2 > 10 8 — w =1.28-10+ 500 = 512.8. b) 5 _ poe *,sEstatistica . . UFPR Note que precisamos calcular a média de peso dos 4 pacotes com 4 kg no total. Logo, ~ ,X; — 2000 X= SS — = — = 500. 4 4 Portanto, - = X — 500 — 512.8 P(X <500) = (at < wa) a//n 10/V4 = P(Z < —2.56) = P(Z > 2.56) = 0.0052 Com a maquina regulada para 512.8 g, ha uma probabilidade de 0.0052 de que uma amostra de 4 pacotes apresente peso médio inferior a 500g. Note que com um pacote apenas, essa probabilidade é de 10%. Por isso, as inspecoes de controle de qualidade sio sempre feitas com base em amostras de tamanho n > 1. 7. Y ~ too Y ~ x16 Y¥ ~ Fao,7) P(—2.85 <Y < 2.85) =0.99 P(8.91<Y < 32.85) =0.909 P(Y > 3.18) = 0.069 P(Y < —2.85) = 0.005 P(Y > 8.91) = 0.917 P(Y > 0.15) = 0.996 P(Y > 2.85) = 0.005 P(Y > 32.85) = 0.008 P(Y > 5.35) = 0.018 P(Y > 2.12) = 0.023 P(Y > 22.80) = 0.119 P(Y < 7.41) = 0.993 P(Y < —3.01) = 0.003 P(Y < 10.12) = 0.14 P(Y <1) = 0.483 8. a) y=1.3253, y=23.5418 e y=2.703 b) y=-2.086, y=6.9077 e y=0.253 c) y=-2.528, y=5.8122 e y=0.192 d) y=-2.086, y=6.9077 e y=0.253 9. a) - / P(X —p) <2)=P(-2< X -p <2) —2 2 (sam ~ =m) = P(Z < 1.333) — P(Z < —1.333) = 0.9087 — 0.0913 = 0.8175 b) Seria 0.9545, portanto maior porque o desvio padrao da média amostral (também conhecido como erro padraéo da média amostral) diminui, ou seja, a distribuigéo é menos dispersa em torno da 6 _ poe *,sEstatistica . . UFPR média do que no item (a). P(X — pl < 2) = P(-2< X-p<2) —2 2 = P| —— < Z < — ~~ (alm OO aan) = P(Z < 2)— P(Z < —2) = 0.9772 — 0.0228 = 0.9545 10. a) i) P(X < 1200) =0.773 ii) P(X > 1200) = 0.227 b) P(X > 1400|X > 1200) = S250} = Fiza = 0.177 c) Pelo TCL, X ~ N(1050, (200/./25)?) e a probabilidade de uma amostra aleatéria de 25 alunos obter Adi ta ds _ 1200-1050 ) _ — 19-4 uma média de 1200 ou mais é: P(X > 1200) = P(z > S007 V 28 ) = P(Z > 3.75) = 10 11. a) Parada desnecessaria indica que 0 processo esta fora de controle (X < 495 ou X > 520) quando, na verdade, 0 processo esté ajustado e zs = 512.8. Nesse caso, X ~ N(512.8, 10/4) e a probabilidade desejada é : - X- 495 — 512.8 X — 520 — 512.8 P(X < 495) ou P(X > 520) = r(2t < oe") +p(=—4 > a) a/n ~~ 10/V4 o/n~ — 10/V4 = P(Z < —3.56) + P(Z > 1.44) =0+0.075 = 0.075 b) Agora, X ~ N(500, 10?/4) e o interesse esta na seguinte probabilidade: _ 495 — 20 — P(495 < X < 520) = P(e <Z< a) 10/V/4 10/V/4 = P(Z <4)—P(Z< -1) = 1-0.159 = 0.841. Note que a probabilidade de uma parada desnecessdria é pequena (item a), 4 custa de alta probabilidade de se operar fora de controle (item b). 12. Pelo Teorema Central do Limite temos que, a proporcéo amostral para amostras de tamanho 20 com a producao estando sob controle é p ~ N(0.1;0.1 - (1 — 0.1)/20) A probabilidade de parada desnecessaria é entaéo: 7 _ poe *,sEstatistica . . UFPR 0.15 — 0.1 P(p > 0.15) = P(z > an) = P(Z > 0.745) \/0.1- (1 — 0.1)/20 = 0.228. 13. a) p ~ N(0.1;0.1(1 — 0.1)/100) 0.1 —-0.1 P(p > 0.1) = P(z < ) ,/0.1- (1 — 0.1) /100 = P(Z >0)=0.5. b) Neste caso, a aproximacao Normal nao é recomendavel, pois o evento p < 0 nao faz sentido, e p = 0 tem probabilidade zero. No entanto, é possivel calcular a probabilidade exata de um evento equivalente, mas que tem distribuigaéo binomial. Logo, Y : Numero de itens defeituosos na caixa com 100 unidades Y ~ Bin(n = 100; p = 0.1) 1 P(Y =0)= (")vra — pr = ( 0) 0.1100 (4 — 9,1) 100-0 y = 0.9'°° = 2.65 - 107° = 0. 8 QA DEST eee ieee ~\ a Ss [Adee Sj" Departamento de Estatistica UFPR Exercicios da Unidade 6 Estimacdao pontual e intervalar 1. Para uma populagaéo normal com variancia conhecida o?, responda as seguintes questdes: (para resposta considere o arredondamento na terceira casa decimal e sempre que a resposta for porcentagem apresente o valor decimal entre 0 e 1) a) Qual é 0 nivel de confianga para o intervalo y —2.140//n<w<yt2.140/J/n b) Qual é 0 nivel de confianc¢a para o intervalo y — 2.490/./n < wp < y+2.49a//n c) Qual é 0 nivel de confianga para o intervalo y —1.850//n <u < y+1.850//n 2. Considere a seguinte equagéo aplicada para obter um intervalo de confianga bilateral de 100(1 — a)% para o parametro yp de uma distribuicéo normal com varidncia conhecida o? a partir de uma amostra aleatéria de n observacoes: y- Za/20/V/n SUS ¥ + Zaj20/V/n em que 2/2 € 0 ponto superior da distribuigdéo normal padrao que delimita a sua direita a/2 de area. Para as respostas considere 3 casas decimais. a) Qual é 0 valor de z,/2 nessa equagao que fornece 99% de confianga? b) Qual 6 0 valor de z,/2 nessa equagao que fornece 95% de confianga? c) Qual é 0 valor de zy/2 nessa equagao que fornece 90% de confianga? 3. (indicado como 13 no video de resolugaéo de exercicios) Considere a seguinte equacao aplicada para obter um intervalo de confianga bilateral de 100(1 — a)% para o parametro o? de uma distribuicdo normal a partir de uma amostra aleatéria de n observacoes: (n - 1)s? <o< (n= 1)s? Xo/2 X1-a/2 em que X29 © Xj_4/ SA0 pontos da distribuigdo x? com n—1 graus de liberdade, que delimita sua direita a/2 de area. Considerando uma amostra aleatéria de 15 elementos: (Para as respostas considere 3 casas decimais). a) Qual é 0 valor de yq/2 nessa equagado que fornece 99% de confianga? b) Qual 6 0 valor de x/2 nessa equagao que fornece 95% de confianga? c) Qual é o valor de x /2 nessa equagao que fornece 90% de confianga? 4. (indicado como 14 no video de resolugdo de exercicios) Considere um estudo no qual se deseja estimar a proporc¢aéo de solicitagdes atendidas e resolvidas de uma central do usuaério através de uma amostra aleatdéria simples. a) Se a amostra for de 4000 solicitagdes, qual serd a margem de erro (com confianga de 95%) para a estimacao da proporcaéo de resolvidas? b) Para este mesmo tamanho de amostra, qual seria a confiancga associada a uma margem de erro de +0.01 (1 %)? c) Qual deveria ser o tamanho da amostra para se obter a estimativa com uma margem de erro de 2.5% com 95% de confianga? d) E para uma margem de erro de 3% com 99% de confiança? 5. Antes de uma eleição, um determinado partido está interessado em estimar a probabilidade p de eleitores favoráveis ao seu candidato. Uma amostra piloto de tamanho 100 revelou que 60% dos eleitores eram favoráveis ao candidato. a) Utilizando a informação da amostra piloto, determine o tamanho da amostra para que, com 0.8 de probabilidade, o erro cometido na estimação seja de no máximo 0.05. b) Se na amostra final, com o tamanho obtido no item anterior, observou-se que 51% dos eleitores eram favoráveis ao candidato, construa um intervalo de confiança para p, com confiança de 95%. c) Decidiu-se coletar uma amostra de tamanho 150. Qual o erro máximo (margem de erro) que cometemos com probabilidade de 0.95 e p igual ao dado no item anterior? d) Qual a influência do tamanho da amostra na amplitude do intervalo de confiança, considerando fixados p = 0.51 e o nível de confiança em 0.95? 6. (indicado como 16 no vídeo de resolução de exercícios) Num grupo de pacientes, o nível de colestrol é uma variável aleatória Y com distribuição Normal de média desconhecida e variância 64 (mg/ml)2. a) Para uma amostra de 46 indivíduos, que forneceu um nível médio de colesterol de 120 mg/ml, calcule o intervalo com 95% de confiança para a média populacional. b) Para uma amostra de 100 indivíduos, que forneceu um nível médio de colesterol de 120 mg/ml, calcule o intervalo com 95% de confiança para a média populacional. c) Para uma amostra de 150 indivíduos, que forneceu um nível médio de colesterol de 120 mg/ml, calcule o intervalo com 95% de confiança para a média populacional. d) Qual a influência do tamanho da amostra na amplitude do intervalo de confiança, dado que fixamos σ = 8 e o nível de confiança em 0.95? 7. Um pesquisador está investigando o tempo de reação de um novo medicamento. Em sua pesquisa 20 pacientes foram sorteados ao acaso, receberam o medicamento e tiveram o seu tempo de reação anotado. Os dados coletados foram os seguintes (em minutos): 2.9; 3.4; 3.5; 4.1; 4.6; 4.7; 4.5; 3.8; 5.3; 4.9; 4.8; 5.7; 5.8; 5.0; 3.4; 5.9; 6.3; 4.6; 5.5; 6.2. a) Obtenha um intervalo de confiança de 90% para a verdadeira média populacional. b) Obtenha um intervalo de confiança (90% de confiança) para a variância dos tempos de reação. 8. Entre milhares de casos de pneumonia não tratada com sulfa, a porcentagem que desenvolveu com- plicações foi de 13%. Com o intuito de saber se o emprego da sulfa diminuiria essa porcentagem, 113 casos de pneumonia foram tratados com sulfapiridina e destes, 6 apresentaram complicações. Com base nesse resultado, o que você pode dizer sobre o emprego de sulfa na porcentagem de complicações em casos de pneumonia? Considere um nível de confiança de 90%. Justifique sua resposta. 9. A Leishmaniose Visceral é uma doença importante e que, se não for tratada corretamente, pode levar a óbito. Todo caso diagnosticado de Leishmaniose Visceral deve ser notificado às autoridades de saúde. Num estudo sobre o número de dias entre o início dos sintomas da Leishmaniose Visceral e a notificação do caso às autoridades, uma pesquisadora deseja estimar o número médio de dias entre os sintomas e a notificação usando um intervalo de 95% de confiança. Sabendo que ela gostaria que o erro de estimação fosse a metade do desvio-padrão do número de dias e supondo que o número de dias entre o início dos sintomas e a notificação tenha distribuição Gaussiana, responda: quantos casos de Leishmaniose Visceral, no mínimo, ela deve estudar? 10. A vida média de baterias automotivas de uma certa marca está sendo estudada. Baseado em estudos similares, com outras marcas, é possível admitir que a vida dessas baterias segue a distribuição Normal com desvio padrão de 4.5 meses. Qual tamanho deverá ter a amostra, para que a amplitude do intervalo de 90% de confiança para a vida média seja de 3 meses? 2 _ , oe *,sEstatistica . . UFPR Respostas 1. a) P(Z > 2.14) = 0.016 = a/2 entéo a = 0.032 e portanto o nivel de confianga é 1 — a = 0.968. b) P(Z > 2.49) = 0.006 = a/2 entéo a = 0.012 e portanto o nivel de confianga é 1 — a = 0.988. c) P(Z > 1.85) = 0.032 = a/2 entaéo a = 0.064 e portanto o nivel de confianga é 1 — a = 0.936. 2. a) Para um nivel de confianga de 99%, a = 0.01 entao P(Z > zq/2) = P(Z > 2.005) = P(Z > 2.576) = 0.005 portanto 20.005 — 2.576. b) Para um nivel de confianga de 95%, a = 0.05 entao P(Z > za/2) = P(Z > 2.025) = P(Z > 1.96) = 0.025 portanto 20.025 = 1.96. c) Para um nivel de confianga de 90%, a = 0.1 entéo P(Z > zq/2) = P(Z > 20.05) = P(Z > 1.645) = 0.05 portanto Z9.95 = 1.645. 3. a) Para 14 graus de liberdade: y? 995 = 31.319 porque P(x74 > 31.319) = 0.005. b) Para 14 graus de liberdade: y2 95 = 26.119 porque P(x74 > 26.119) = 0.025. c) Para 14 graus de liberdade: y2 9; = 23.685 porque P(y7, > 23.685) = 0.05. A. _ /0.50-0.5) _ _ _ [0.5+0.5 ortx _ 0.01 _ _ _ _ b) e = 0.01 = 2a/24/ ~qo9g~ Cntdo Za/2 = Jo.540.5/4000 1.265 ea = P(Z < —1.265) + P(Z > 1.265) = 0.206. Portanto, o nivel de confianga é (1 — a) x 100%=79.4%. c) Com margem de erro e = 0.025 e confianga de 95% entao a = 0.05 e za/2 = 20.025 = 1.96 temos n= (48%)*0.5(1 — 0.5) & 1537 d) Com margem de erro e = 0.03 e confianga de 99% entao a = 0.01 € 2/2 = 20.005 = 2.576 temos n = (2576)* 0.5(1 — 0.5) = 1844 5. a) Za 2 A A n= (4) pl — p) = € 1.282\7 =(—*) 061-0.) = (se) 0.6(1 — 0.6) & 158. b) - /pa-p ICo.95(p) = P + Za/2 ma?) = [0.510 — 0.51) =0.51+1. = 0.5 96 158 = [0.432; 0.590]. 3 _ poe *,sEstatistica . . UFPR c) _ [pl=p) € = 2q/2\| ——— = n /0.51(1 — 0.51) = 1.96,/ ———___——. = 150 = 0.080. d) Conforme aumentamos o tamanho da amostra, a amplitude do intervalo de confianga diminui. Hé mais informacao disponivel nos dados. 6. a) _ o _ a ICo.95(H) = (3 — Zq/2° vn << YF Za/2° <=) 8 8 = {| 120 — 1.96 - — < pw < 1204+ 1.96 - — ( vie va) = [117.69; 122.31]. b) _ a _ a ICo.95(t) = Y~ Pa/2* Fe SM SUF 20/2 Te 8 8 = {| 120 — 1.96 - —— <p < 120+1.96 -— ( vio0 7m) = [118.43; 121.57]. c) _ a _ a ICo.95(t) = YO Faja* SBS YT Za/a° Te 8 8 = {| 120— 1.96 - ——= < pw < 1204+ 1.96 -— ( vi50 7a) = [118.72; 121.28]. d) Conforme aumentamos o tamanho da amostra, a amplitude do intervalo de confianga diminui. Hé mais informacao disponivel nos dados. 7. a) A média amostral é obtida a partir da amostra coletada. Entao, y= dei Vi _ n — 294344 ..+6.2 =——3 = 4.745. A varidncia amostral é obtida a partir da amostra coletada é s? = 0.992. Assim, o intervalo de confianca é dado por _ s? ICo.90(H) = 9 tas ° 7 /0.992 = 4.745 + 1.729 - 4/ —— = 745 729 50 = (4.359; 5.131]. 4 . poe *,sEstatistica . . UFPR b) (n—1)S? (n—1)S? xe, /2 "Xie /2 (20 — 1)0.996? — (20-— 1)0.996? 30.1 , 10.1 [0.625 ; 1.86] 8. OIC de 90% para proporcao de complicacgées entre os pacientes na populacdéo que fazem uso de sulfa é: (0.053-1.645 - 0.021; 0.053+1.645 - 0.021]= [0.019; 0.088] Temos uma confiancga de 90% de que o intervalo acima cobre a verdadeira porcentagem de complicacées apos uso de sulfapiridina. Como o intervalo esta inteiramente abaixo de 13%, isso indica uma evidéncia estatistica a favor do uso do medicamento. 9. Y: numero de dias entre o inicio dos sintomas e a notificagao ~ N(p,¢). Y: numero médio de dias entre 0 inicio dos sintomas e a notificagaéo ~ N (1, 07/n). Deseja-se um erro de estimagéo e = 0/2 com confianga de 95%. 1.960\* (1.960 \7 n= (=) = (SF) = (1.96 x 2)? = 15.37 = 16 e€ a /2 10. Para calcular o tamanho de n, podemos considerar a equacéo a 2: fa/2" Fy = 3. Com os valores de 2,./2 = 20.05 = 1.645 e o = 4.5, temos que 2 2-1.645- 4.5 Vin = 220.080 _ fe SO = 4.935. 3 3 Como o valor de n deve ser um ntimero inteiro, escolhemos o menor inteiro superior a (4.935), obtendo n & 25. Dessa forma, a amplitude do intervalo sera ligeiramente menor que 3 e, portanto, o intervalo sera mais informativo. 5 Exercícios da Unidade 7 Testes de Hipóteses I Os exercícios foram extraídos dos livros: Bussab, WO; Morettin, PA. Estatística Básica. São Paulo: Editora Saraiva, 2006 (5ª Edição). Magalhães, MN; Lima, ACP. Noções de Probabilidade e Estatística. São Paulo: EDUSP, 2008. 1. O consumo médio de gasolina num certo tipo de automóvel é de 15 km por litro, segundo informações da montadora. Uma revista especializada verificou o consumo de 25 desses veículos, escolhidos ao acaso. Admita que o consumo siga o modelo Normal com variância igual a 9 (km por litro)2. a) Formule o problema como um teste de hipótese para verificar a afirmação da montadora. b) Qual seria a região crítica se α = 0.06? Encontre os valores de consumo médio de combustível que limitam a região crítica. c) Para uma amostra com ¯y = 17, o consumo difere ou não da afirmação da montadora? Justifique a sua resposta. 2. Uma máquina automática para encher pacotes de café enche-os segundo uma distribuição normal, com média µ e desvio padrão sempre igual a 20 gramas. A máquina foi regulada para µ = 500 gramas. Periodicamente, coletamos uma amostra de 16 pacotes e verificamos se a produção está sob controle. a) Formule o problema como um teste de hipótese. b) Defina a região crítica se α = 0.01. c) Se para a amostra coletada ¯y = 492 g, qual a conclusão a respeito da regulagem da máquina? 3. Uma máquina deve produzir peças com diâmetro de 2 centímetros. Entretanto, variações acontecem e vamos assumir que o diâmetro dessas peças siga o modelo Normal com variância igual a 0.09cm2. Para testar se a máquina está bem regulada, uma amostra de 100 peças é coletada. a) Formule o problema como um teste de hipótese. b) Qual seria a região crítica se α = 0.02? c) Se para essa amostra ¯y = 2.02, qual a conclusão a respeito da regulagem da máquina? d) Suspeita-se que a máquina esteja produzindo peças com variabilidade acima do estabelecido σ2 = 0.09cm2. Uma nova amostra de 100 peças resultou num desvio-padrão amostral de s = 0.33. Estabeleça e teste ao nível de 10% de significância a hipótese adequada. 4. O atual tempo de travessia com balsas entre Santos e Guarujá é considerado uma variável aleatória com distribuição Normal de média 10 minutos e desvio padrão de 3 minutos. Uma nova balsa vai entrar em operação e desconfia-se que será mais lenta que as anteriores, isto é, haverá aumento na média especificada pelo modelo acima. a) Especifique as hipóteses em discussão. b) Interprete os erros tipo I e tipo II no contexto do problema. c) Para uma amostra de 20 tempos de travessia com a nova balsa, obtenha a região crítica considerando um nível de 5%. d) Calcule a probabilidade do erro tipo II, se a nova balsa demora, em média, 2 minutos a mais que as anteriores para completar a travessia. Depois calcule para 3 e 4 minutos a mais. 5. Suponha que queiramos testar H0 : µ = 50 versus H1 : µ > 50, onde µ é a média de uma variável aleatória Normal com desvio padrão igual a 10. Extraída uma amostra de n = 36 elementos da população, observou-se ¯y = 53. Faça o teste utilizando os níveis 1%, 2% 5% e 10%. 6. Um criador tem constatado uma proporção de 10% do rebanho com verminose. O veterinário alterou a dieta dos animais e acredita que a doença diminuiu de intensidade. Um exame em 100 cabeças do rebanho, escolhidas ao acaso, indicou 8 delas com verminose. a) Formule o problema como um teste de hipótese para verificar a afirmação do veterinário. b) Qual a região crítica se α = 0.08? Encontre o(s) valor(es) de proporção que limita(m) a região crítica. c) Considere a amostra observada. A dieta proposta pelo veterinário tem efeito na redução da verminose do rebanho? Justifique a sua resposta. 7. Uma estação de televisão afirma que 60% dos televisores estavam ligados no seu programa especial da última segunda-feira. Uma rede competidora deseja contestar essa afirmação e decide usar uma amostra de 200 famílias para um teste. a) Formule o problema como um teste de hipótese para verificar a afirmação da estação de televisão. b) Qual a região crítica do teste para um nível de significância α = 5%? c) Admita que, com a pesquisa feita com as 200 pessoas, obtivemos 104 pessoas que estavam assistindo ao programa. O que podemos dizer a respeito da afirmação da estação de televisão? d) Calcule o p-valor do teste para o problema apresentado. 8. Um fabricante afirma que seus cigarros contêm não mais do que 30 mg de nicotina. Uma amostra de 25 cigarros fornece média de 31.5 mg e devio padrão de 3 mg. a) No nível de 5%, os dados refutam ou não a afirmação do fabricante? b) Calcule o p-valor do teste. 9. Os novos operários de uma empresa são treinados a operarem uma máquina, cujo tempo Y (em horas) de aprendizado é anotado. Observou-se que Y segue de perto a distribuição N(25, 100). Uma nova técnica de ensino, que deve melhorar o tempo de aprendizado, foi testada em 16 novos empregados, os quais apresentaram 20.5 horas como tempo médio de aprendizado. Usando o p-valor, você diria que a nova técnica é melhor que a anterior? 10. O consumidor de um certo produto acusou o fabricante, dizendo que mais de 20% da unidades fabricadas apresentam defeito. Para embasar sua acusação, ele usou uma amostra de tamanho n = 50 na qual 27% eram defeituosas. Mostre se o fabricante poderia refutar a acusação com um teste estatístico de hipótese. Use um nível de significância de 10%. 2 . poe *,sEstatistica . . UFPR Respostas 1. a) Hipdteses estabelecidas: Hyp: y= 15 H,:#415 (teste bilateral) b) Regiao critica na escala da varidvel resposta y: Yc —p _ oO Ct Ty KF => Cc C= %e = Gn Ye = WH 20 Yer = 15 — 1.88 3 = 13.87 Yel => . 25 => . 3 Ye2 = 15 + 1.88——= = 16.13 Yc2 7B A regiao critica na escala de y é dada por RC = {y € Rly < 13.87 ou y > 16.13}. Equivalentemente, a regiao critica na escala da estatistica de teste com a = 0.06 é dada por RC = {z < —Z0.03 = —1.88 ou z > 20.03 — 1.88}. c) O consumo difere, pois a média observada pertence a regido critica. Logo, rejeita-se a hipdtese nula de que o consumo de combustivel é de 15 km por litro, ao nivel de significancia de 6%. De maneira equivalente, podemos calcular a estatistica de teste M7] — Lo 17-15 Z= > = — _ = 3.88 o]Vn 3) V% Como z = 3.33 pertence a regiao critica na escala da estatistica de teste, entao rejeita-se a hipdtese nula ao nivel de significéncia de 6%. 2. a) Hipdteses estabelecidas: Hg : pp = 500 H,: 1 #500 (teste bilateral) b) Regiao critica na escala da varidvel resposta y: _ Yea _ oo me Gin Ue HY eT 20 Yer = 500 — 2.58 —— = 487.10 Yel 76 Yc2 = 500 + 2.58 20 = 512.90 Yc2 => . V6 => . A regiao critica é dada por RC = {y € R|y < 487.10 ou y > 512.90}. Equivalentemente, a regiao critica na escala da estatistica de teste com a = 0.01 é dada por RC = {z < —z0.005 = —2.58 ou z > 20.005 = 2.58}. c) Nao rejeitamos a hipdtese nula de que a mdquina esta produzindo pacotes com peso médio de 500 g, ao nivel de significéncia de 1%. 3 . poe *,sEstatistica . . UFPR De maneira equivalente, podemos calcular a estatistica de teste Y—po 492-500 16 a Oe a//n 20/V16 Como z = —1.6 nao pertence a regiao critica na escala da estatistica de teste, entao nao podemos rejeitar a hipdtese nula ao nivel de significancia de 1%. 3. a) Hipdteses estabelecidas: Ay: w=2 Hy: #2 (teste bilateral) b) Regiao critica na escala da varidvel resposta y: Yc —p _ oO — — = — %0 = Gn Ye = WH 20 0.3 Yor = 2 — 2.33——= = 1.93 Yel 700 0.3 Yo. = 2 + 2.33——— = 2.07 Yc2 700 A regiao critica na escala de y é dada por RC = {y € Rly < 1.93 ou y > 2.07}. A regiao critica na escala da estatistica de teste com a = 0.02 é dada por RC = {z < —20.91 = —2.33 ou z > 20.01 = 2.33}. c) Nao rejeitamos a hipdétese nula de que a madquina esta regulada e produzindo pegas dentro do padrao desejado, ao nivel de significdncia de 2%. Alternativamente, podemos calcular a estatistica de teste y — 2.02 — 2 po PF ML = = 067 a//n — ,/0.09/100 Como z = 0.67 nao pertence a regiao critica na escala da estatistica de teste, entao néo podemos rejeitar a hipdtese nula ao nivel de significancia de 2%. d) e Hipdteses estabelecidas: Ho : o? = 0.09 H,:07 > 0.09 (teste unilateral) ¢ Regiao critica para a = 0.1 na escala da estatistica de teste: RC = {x? > X6.1,99 = 117.41}. e Estatistica de teste: 2 5 2 n—1)s 99 - 0.33 = = ——— = 119.79 x op 0.09 ¢ Concluséo: Como x? = 119.79 pertence a regiao critica, rejeitamos a hipdtese nula de que a maquina esta regulada e produzindo pecas com variabilidade dentro do padrao desejado, ao nivel de 10% de significancia. 4 . poe *,sEstatistica . . UFPR 4. a) Hipdteses estabelecidas: Ho: = 10 H,:>10 (teste unilateral) b) Erro Tipo I: rejeitar Ho|Ho V, ou seja, nao rejeitar que a média de tempo para travessia aumentou, mas na verdade continua com média de 10 minutos. Erro Tipo II: nao rejeitar Ho|Ho F’, ou seja, nao rejeitar que a média de tempo para travessia nao aumentou, (= 10), mas na verdade ela aumentou. c) Yc —p _ oO C7 Ty KF => Cc C= %e = Gn Ye = WH 20 3 Ye. = 10+ 1.64 = Yel 7m = 11.10. A regiao critica é dada por RC = {y € R|y > 11.10}. Ja a regiao critica na escala da estatistica de teste com a = 5% é dada por RC = {z > 20.95 = 1.64} d) 8(12) = P(erro tipo IT) = P(nAo rejeitar Ho|Hpo falsa) = P(Y < 11.10|u = 12.0) ( Y-12 — 11.10- =) 4/37/20 4/3? /20 = P(Z < —1.34) = 0.090. Assim, em sendo yz = 12.0 estariamos concluindo de forma equivocada que Hp nao deveria ser rejeitada, com probabilidade de 0.090. Para 3 e 4 minutos a mais, temos que a probabilidade é 0.002 e = 0, respectivamente. 5. Sabemos que Y ~ N(u, 107/36). ¢ Para 1%: _ Ye — _ oO Ct Ty KF => Cc C= %0 = Gn Ye = WH 20 10 Yo = 50 + 2.33 —— = . 36 = 53.88. e Para 2%: Yo = 5042 06 2 = Ye . 36 = 53.43. e Para 5%: Yo = 50 + 1.64 WL Yc . /36 = 52.73. 5 . poe *,sEstatistica . . UFPR ¢ Para 10%: Yo = 50 + 1.28 8 ve e736 = 52.13. Nos niveis de 1% e 2% nao rejeitamos, mas rejeitamos nos niveis de 5% e 10%. Resolvendo a questao na escala da estatistica de teste, temos que a regido critica é dada por RC = {z > za}, em que para a = 0.01, 20.01 = 2.33; a = 0.02, 20.902 = 2.05; a = 0.05, 20.905 = 1.64 e a =0.1, 2.1 = 1.28. A estatistica de teste é 53 — 50 z= ——— = 1.8, 10/V36 portanto, z = 1.8 pertence as regi6es criticas com niveis de significancia de 5% e 10%, entao rejeitamos Ho a esses niveis. p(l=p) 6. Sabemos que p ~ N(p, “—**). a) Hipdteses estabelecidas: Hy :p = 0.10 Hy: p<0.10 (teste unilateral) b) Regiao critica na escala de p: Pe —P - [pl =p Ze = < > PeF=P— Ze ( ) / p(—p) n n Be = 0.10 — 1.414/ 0.101 — 0:19) _ 6.058 Pe =U. : 100 = 0. . A regiao critica na escala de p é dada por RC = {f € [0, 1]|p < 0.058}. Equivalentemente, a regiao critica na escala da estatistica de teste com a = 0.08 é dada por RC = {z < —Z0.08 = —1.41}. A estatistica de teste é . 0.08 0.1 7 PePo _ Ne _ 967 , / po=po) /91-0.9 100 100 c) Note que é necessdrio calcular a proporcgaéo amostral de animais com verminose como p = 5 = 0.08. Nao ha evidéncia suficiente para afirmar que a incidéncia diminuiu, uma vez que o valor de propor¢ao observado na amostra = 0.08 nao esta dentro da regiao de rejeicao da hipdtese nula. Na escala da estatistica de teste temos que z = —0.67 nao pertence a regiao critica e portanto, ao nivel de significancia de 8%, nao ha evidéncia suficiente para afirmar que a incidéncia diminuiu. A p(l=p) 7. Sabemos que p ~ N(p, ~~). a) Hipdteses estabelecidas: Ho : p = 0.60 Hy: p< 0.60 (teste unilateral) 6 . poe *,sEstatistica . . UFPR b) Regiao critica na escala de p: ~ . lL Ze = Pow? > ie =p + 20 P) /p(—p) n n 0, 60(1 — 0.60) De = 0.60 — 1.644 / ——-———— _ = 0.54. Pe V 200 A regiao critica é dada por RC = {p € [0, 1]|p < 0.54}. A regiao critica para a = 0.05 na escala da estatistica de teste 6 RC = {z < —z9.05 = —1.64}. c) Na amostra de tamanho n = 200, temos que p = aoa = 0.52. Assim, podemos notar que 0.52 € RC. Portanto, somos levados a rejeitar a hipdtese nula. Isto é, ha evidéncias de que a auséncia do programa de segunda-feira nao foi de 60%, mas inferior a esse numero. A estatistica de teste é 104/200 — 0.6 2 — 104/200= 0.6 _ 3) 0.6-0.4 \/ ~ 200 Assim, z € RC na escala da estatistica de teste, e portanto podemos rejeitar a hipdtese nula, ao nivel de 5% de significancia. d) Os passos para calcular o p-valor séio parecidos com aqueles jé apresentados, mas a principal diferenca esté em nao construir a regido critica. O que fazemos é apresentar a probabilidade de ocorrer valores da estatistica mais extremos do que o observado, sob a hipdtese nula ser verdadeira. Portanto, 0.52 — 0.60 P(p < 0.52|p = 0.60) = P(z < —— | /0.60(1—0.60) 200 = P(Z < —2.30) = 0.01 = 1%. 8. a) Note que foi obtida uma amostra de tamanho 25, onde a média (%) e o desvio padrao (s) amostral foram calculados. Assim, a varidvel padronizada segue uma distribuigéo t com n — 1 graus de liberdade. Isso quer dizer que Yau t= — = ~tn-1. s/J/n n—-1 As hipdéteses estabelecidas sao Ho: pp = 30 Hy: p> 30 (teste unilateral) Por ser um teste unilateral, devemos procurar o valor de t, tal que P(T >t.) = 0.05. A partir da tabela ¢ de Student, obtemos que t, = 1.711. Isso quer dizer que a regio critica para a estatistica t 6 RC = {t > 1.711}. O valor observado da estatistica é t= 31.5 — 30 3/V 25 = 2.5. Como t pertence a regiao critica, rejeitamos Ho, ou seja, ha evidéncias de que os cigarros contém mais de 30 g de nicotina. 7 . poe *,sEstatistica . . UFPR b) Para calcular 0 p-valor, considere que p—valor = P(T > t|Ho) = P(T > 2.5|Ho) = 0.01 O p— valor obtido esta abaixo do nivel de significéncia de 0.05 e portanto leva a rejeigao de Ho. 9. Considerando que Y ~ N(25, 100/16). As hipdéteses estabelecidas sao Ao: p= 25 Ay: j6< 25 (teste unilateral) Para calcular o p-valor, considere que a variancia dada é populacional. Entao, p—valor = P(Z < z) Y- 20.5 — 2 _p ( ee 0.5 >) a/V/n 10/V16 = P(Z < -1.8) = 0.036 Se adotarmos um nivel de significancia a = 0.05, como o p-valor 6 menor do que a entéo podemos rejeitar a hipotese nula e concluir que a nova técnica reduz 0 tempo médio de aprendizado ao nivel de significaéncia de a= 5%. Se, no entanto, adotassemos um nivel de 1% nao poderiamos rejeitar Ho. 10. Populagao: Y : presencga de defeito (0 - nao, 1 - sim) Y : B(p) Amostra: n = 50 50 p= Soy; =0.27 i=1 Teste de hipdtese: Ho: p=0.20 vs Hy: p> 0.20 (teste unilateral) a=0.10 > z. = 1.28 p — 27 —0.2 y= Paro _ 0277020 joy / po(1—=po) / 0.20(1—0.20) n 50 Concluséo: Como z < Z., ou, equivalentemente como o p-valor é 0.108, entaéo nao se rejeita Ho ao nivel de 10% de significAncia, ou seja, nao ha evidéncia suficiente na amostra para acusar o fabricante. 8 Exercícios da Unidade 8 Testes de Hipóteses II Os exercícios foram extraídos dos livros: Bussab, WO; Morettin, PA. Estatística Básica. São Paulo: Editora Saraiva, 2006 (5ª Edição). Magalhães, MN; Lima, ACP. Noções de Probabilidade e Estatística. São Paulo: EDUSP, 2008. 1. Queremos testar se existe ou não correlação entre o número de clientes e os anos de experiência de agentes de seguros. Sorteamos cinco agentes e observamos as duas variáveis. Qual seria a conclusão ao nível de 10% de significância baseada nos dados a seguir? Agente A B C D E Anos de Experiência 2 4 5 6 8 Número de Clientes 48 56 64 60 72 2. Deseja-se estudar a tolerância de um equipamento eletrônico ao número de impactos termoelétricos. Pelas características de fabricação do equipamento, é possível admitir que a probabilidade de falha seja constante, isto é, após cada impacto, existe uma probabilidade p de que ele falhe. Assim, Y é a variável aleatória número de impactos anteriores à falha. Uma amostra de 80 ensaios foi obtida, em que cada ensaio representa os testes feitos até a interrupção por falha no equipamento, resultando em 80 observações da variável de interesse. Na tabela a seguir, apresentamos as frequências esperadas e os valores que foram observados no teste de resistência realizado. Pretende-se verificar se o modelo geométrico com p = 0.4 é adequado ao nível de significância α = 0.05. Impactos (k) 0 1 2 3 4 Mais que 4 Freq. observada (ni) 30 26 10 5 5 4 Freq. esperada (E(ni)) 32.0 19.2 11.5 6.9 4.1 6.3 Como a categoria correspondente ao valor 4 tem frequência esperada igual a 4.1, que é menor que 5, é recomendado agregar as últimas duas categorias formando a dos maiores do que 3, a qual terá frequência observada 9 e esperada de 10.4. 3. A tabela abaixo contém os resultados obtidos por estudantes do ensino médio, em um exame com questões nas disciplinas de física e matemática. Deseja-se testar se existe dependência entre as notas dessas duas disciplinas que, para efeito de apresentação na tabela e análise de comportamento, foram classificadas nas categorias alta, média e baixa. Faça um teste adequado considerando nível de significância de α = 0.01. Física | Matemática Alta Média Baixa Total Alta 56 71 12 139 Média 47 163 38 248 Baixa 14 42 85 141 Total 117 276 135 528 4. Uma prova básica de Estatística foi aplicada a 100 alunos de Ciências Humanas e a 100 alunos de Ciências Biológicas. As notas são classificadas segundo os graus A, B, C, D e E (em que D significa que o aluno não recebe créditos e E indica que o aluno foi reprovado). Os resultados estão apresentados na . poe *,sEstatistica . . UFPR Tabela a seguir. Faca um teste adequado para testar se as distribuicdes das notas, para as diversas classes, sio as mesmas para os dois grupos de alunos. Considere nivel de significancia a = 0.05. Grau Aluno de JE Total C. Humanas 15 20 30 20 15 100 C. Biolégicas 8 23 18 34 17 100 Total 23 43 48 54 32 200 Média 11.5 21.5 24.0 27.0 16.0 200 5. Um instituto de pesquisa esta estudando a ocorréncia de doencas na populacaéo de uma cidade. Os pesquisadores do instituto encontraram 200 registros de individuos com doengas, sendo 50 pessoas com a doenga A, 70 com a doenga B, 30 com a doenga C e 50 com a doenga D. Cada doenga ocorre em apenas uma Unica pessoa e os pesquisadores assumiram que os registros sio uma amostra aleatéria da populacao de individuos com doengas. Estime a proporgao de individuos com os diferentes tipos de doengcas e faca um teste adequado para verificar se a proporcéo é a mesma. Considere nivel de significancia a = 0.05. 6. (indicado como 11 no video de resolugaéo de exercicios) Em um procedimento de avaliagéo um mesmo exame foi aplicado aos mesmos alunos quando estavam em periodos inicial e final de um curso. A varidvel D; corresponde a diferencga de notas de fim e inicio do curso. Faca um teste de comparacaéo de médias adequado considerando nivel de significancia a = 0.05. Inicio [37 | 57 [34] 40 [21 | W] 35 | 80 | GS | AT] Ww] OT] "Fim [65 [92/56 [70] 52 | 73 | 50 | 90 | 88 | 71 | 52 | 88 7. (enunciado e solugéo modificados) Dois tipos de pldsticos, I e II, sio adequados para uso na produgao de certo componente eletrénico. A tenséo de ruptura do material 6 uma caracteristica importante. Sabe-se que a7 = a7; = 1 psi. Uma amostra aleatéria com ny = 10 e ny; = 12 fornece Y, = 162.5 e y;, = 155.0. Por razoes de custo, a companhia nao ira adotar o plastico J a menos que este tenha uma resisténcia média que exceda a do plastico IJ. Proceda um teste de hipdtese adequado para saber se, baseando-se nas informag6es da amostra, a companhia deve adotar o plastico I (use a = 0.05). 8. (indicado como 13 no video de resolugao de exercicios) Um experimento foi feito para comparar os custos de reparo de dois tipos de bombas (A e B). Para isto registrou-se 0 custo para 16 bombas de cada tipo, ao longo de um ano de operagéo. Os custos anuais de reparo (em milhares de reais) foram os seguintes: Tipo A [04 [TS] A018] 2S [TO] OS [TA] —__[s4fro [20/0516 [39 [16] 18 | “TpoB [12 [os [27 [0s [os [ir] or] 13] [oo [3914] 2.606 [oe [15] 2.0 | Faca um teste de hipdtese adequado com nivel de significancia a = 0.05 para comparar os custos de reparo das duas bombas. Considere as seguintes informagoes: ya = 1.888 e 5% =1.168 e n4g=16 Yp =1413 e s%}=0.896 e ng =16 9. Duas técnicas de venda sao aplicadas por dois grupos de vendedores: a técnica A por 12 vendedores, a técnica B por 15 vendedores. Espera-se que a técnica B produza melhores resultados. No final de um més, obtiveram-se os resultados a seguir: ya =68 e 5% =50 e ng=12 Yp=76 e sp = 52 e np=15 2 . poe *,sEstatistica . . UFPR Vamos testar, para o nivel de significancia de 5%, se ha diferengas significativas entre as vendas médias resultantes das duas técnicas. Supondo que as vendas sejam normalmente distribuidas, faga um teste para igualdade de variancias e depois para a média populacional. 10. Queremos testar igualdade das resisténcias médias de dois tipos de vigas de aco, A e B. Tomando-se na = 15 vigas do tipo A e ng = 20 vigas do tipo B, obtemos os valores dados a seguir. ya = 70.5 e 34 =816 e nyg=15 Yp =845 e 5% =210.8 e ng =20 Conduza um teste de hipdtese adequado, considerando nivel de significancia de 10%. 11. Numa pesquisa de possuidores de carros numa universidade, entre homens e mulheres, foram obtidos: 24 de 100 homens possuem automdveis e 13 de 100 mulheres possuem automoveis. Baseado nestes resultados vocé afirmaria que a proporgao de homens e mulheres que possuem carros é a mesma na populacéo? Conduza um teste de hipétese adequado, considerando um nivel de significancia de 5%. 3 . poe *,sEstatistica . . UFPR Respostas 1. e Hipdtese: Ho: p=0 A, :p#0 e Estatistica de teste: n—-2 t=r T_p ~ t(n—2) e Regiao critica: RC ={t ER: t < —2.353 ou t > 2.353} e Calculo da estatistica de teste: / 5-2 t = 0.95, / ——— 1 — 0.952 = 5.270. e Concluséo: Como o t calculado esta na regiao critica, rejeitamos Ho, para a = 0.1, isto é, existe correlacao linear significativa entre anos de experiéncia e numero de clientes. 2. Note que as frequéncias esperadas foram obtidas para cada valor da varidvel aleatéria, usando a expresso da distribuicgéo Geométrica, uma vez que assumimos Y ~ G'eo(p) em que p é a probabilidade do evento que interrompe a sequéncia. Assim, P(Y =y) =0.6"-0.4 e Hipdtese: Hy: Y ~ G(0.4) A, :Y tem outra distribuicao e Estatistica de teste: k 2 2 (nj — E(ni)) 2 X= Dae OY XR 2 Bin) e Regiao critica: RC = {x? €R*: y? > 9.488} e Calculo da estatistica de teste: k vey (ni — E(ni))? i=1 E(ni) 30 — 32.0)? 9 — 10.4)? — BOAO" OO Lat. 32.0 10.4 ¢ Conclusdo: O valor de x? calculado néo esté na regido critica, para a = 0.05, entAo ndo rejeitamos Ho, isto é, nao rejeitamos o modelo proposto sob a hipdtese nula. 3. e Hipdtese: Hp : as notas de fisica e matematica séo independentes HT, : as notas nao séo independentes 4 . poe *,sEstatistica . . UFPR e Estatistica de teste: ek 2 (nij — Bij)” x = » » E.. ~ X(r—1)(e=1) i=1 j=l J e Regiao critica: RC = {y? ER*: y? > 13.277} e Calculo da estatistica de teste: Note que E;; = fetal de Une ciate ae colunad Entao, para a linha 1 e coluna 1, temos que 139 x 117 fu, = — 528 O procedimento é andlogo para as demais combinacoes. Tr Cc 2 2_ (niz — Eij) v= ae 4. aj w=1 g=1 __ (56 — 30.80)? 44 (85 — 36.05)? 7 30.80 ~ 36.05 = 145.78. ¢ Conclusd4o: O valor de x? calculado esté na regiao critica, para a = 0.01, entdo rejeitamos Hp, isto 6, as notas de matematica e fisica naéo sao independentes. 4. e Hipdtese: Podemos considerar P,; como a populacao de alunos de Ciéncias Humanas e P2 a dos alunos de Ciéncias Bioldgicas. Entao, podemos testar a hipdtese Ho : a distribuicgéo das notas séo as mesmas para os dois grupos > P; = P2 1, : a distribuigéo das notas nao séo as mesmas para os dois grupos + P; 4 P2 e Estatistica de teste: ek 2 (nij — Bij)” v= E.. ~ X(r—1)(e-1) i=1 j=l J e Regiao critica: RC = {x? €R*: y? > 9.488} Sob a suposicao da hipdtese nula Ho ser verdadeira, a distribuigaéo de probabilidade das duas turmas deveria ser a mesma e equivaleria a ter uma tinica populacéo P. A linha que representa os totais representaria uma amostra de 200 alunos da populacgéo. Ao considerar Ho verdadeira, entéo devemos encontrar os valores esperados com a finalidade de aplicar a formula de qui-quadrado. O valor esperado é dado E,;; = BiCy sendo R; e C; os totais de linha e coluna e n o tamanho da amostra. Dessa forma, as frequéncias absolutas esperadas sob Hp séo dadas por Grau C.Humanas 11.5 21.5 24.0 27.0 16.0 100 C. Bioldgicas 11.5 21.5 24.0 27.0 16.0 100 Total 23 43 48 54 32 200 5 . poe *,sEstatistica . . UFPR ¢ Calculo da estatistica de teste: Note que Ei; = se come Entao, para a linha 1 e coluna 1, temos que E.= 23 x 100 300 O procedimento é andlogo para as demais combinacoes. 2_ rye (ui — Eu) a = Xe) i=1 j=1 4 15 — 11.5)? 15 — 16.0)? 8 — 11.5)? 17 — 16.0)? — GS-15)" G5 = 16.0)" | (B= 15)" T= 16.0)" 11.5 16.0 11.5 16.0 = 9.09. ¢ Conclusao: O valor tabelado de x7 = 9.488, para a = 0.05. Logo, x? < x74, 0 que leva A nAo rejeigéo de Ho, ou seja, a distribuigao das notas é a mesma para as duas populacgoes, entaéo consideramos que ha uma populacgao homogénea. 5. e Proporcgaéo estimada de individuos com cada doenga: 50 70 Pa = ~~ =0.25; Dp = =~ = 0.35; PA 200 > Pp 200 ’ 30 50 Do = = = 0-15; Pp = =~ = 0.25. Po ~ 300 > PP ~ 500 e Hipdtese: Ho : a proporcéo é a mesma: pa = pp = Pc =Ppp A, : a proporcaéo nao é a mesma Em termos praticos, as hipdteses sugerem que npo; = 50 para qualquer 7. e Estatistica de teste: . 2 (ni — E(ni))? 2 xX = » E(n;) Xk-1 w=1 e Regiao critica: RC = {x7 €R*: y? > 7.815} ¢ Calculo da estatistica de teste: Note que E(n;) = npo;. Entao, para a doenga A, temos que E(n;) = 200 - 0.25 = 50. O procedimento é andlogo para as demais doengas. 50 — 50)? 70 — 50)? 30 — 50)? 50 — 50)? 2 — (0= 50 | (F0= 50)? | (80= 50)? | (50-50) 50 50 50 50 = 16.00. ¢ Conclusado: O valor tabelado de y3 = 7.815, para a = 0.05. Logo, x? > x3, 0 que leva A rejeicaéo de Ho, ou seja, a proporcao de individuos com as doengas nao é a mesma. 6 . poe *,sEstatistica . . UFPR 6. Ho :bfim = Minicio (A = 0) vs H1: fim 4 Minicio (d > 0) a = 0.05 d = 25.7 e S3 = 83.7 1- 25.7 —0 4\/83.7/12 = 9.72 RC :{t = 9.72 > t. = 1.796} te RC. Rejeita-se Hop, ou seja, rejeita-se que a diferenca das notas seja nula e considera-se que houve um aumento nas notas. 7. e Ho: wr — rr =O versus Ay : wy — wry > O ~ c= 1-11) — —(162.5-155) ___ 17.59 oS Vein +or Jan Vasoyrayiay © RC: {z> 2, = 1.645} ° p—valor = a* = P(Z > z) = P(Z > 17.52) = 0. e Rejeita Ho. Ha evidéncias (a = 0.05) de que a média do tipo I supera a do tipo II. 8. Primeiro, vamos testar a igualdade das variancias populacionais. No entanto, note que temos apenas as variancias amostrais, denotadas por S% e S?,. Podemos formular as hipéteses da seguinte forma: Ao: o% = on Hy: 0%, 402, Sob a suposicaéo de Ho ser verdadeira, temos que o valor calculado é F = $23,/S?2, ~ F(n4 —1,ng — 1). Portanto, F=S8%/S? = 1.168/0.896 = 1.304. Considerando a = 0.05, temos que os valores criticos da distribuigao F(15,15) sa0 fi; = 0.349 e fo = 2.862, isto é, a regido critica 6 dada por RC ={f € Rt: f < 0.349U f > 2.862}. Como F esta fora da regiao critica, nao rejeitamos a hipdtese nula de que as variancias nao diferem ao nfvel de significancia de 5%. Para ambas as populac6des, temos a mesma variancia. Suponha que temos o interesse em testar as hipdteses Ho : LA = LB A: wa F Llp A variancia comum combinada é dada por a _ (na = 1)s% + (np = Dish © (na —-1)+(np—-1) © 7 . poe *,sEstatistica . . UFPR Entao, 1, — Gi = Yo) — (Ha = bs) Se 1/na +1/np (1.888 — 1.413) 1.016,/1/16 + 1/16 = 1.322. Considerando que t possui uma distribuicgéo t-Student com n4-+np —2 graus de liberdade, a quantidade trad € obtida na tabela da distribuicgdéo t-Student. Entao, fixando a, encontramos o valor de tig, como a= P(t < —t.Ut > t.|Ho), com regiao critica dada por RC = {t € R: t < —2.042 ou t > 2.042}. Logo, concluimos que a hipétese Ho nao é rejeitada ao nivel de significancia de 5%, pois o valor t calculado nao pertence a regiao critica. 9. e Teste de hipdtese para variancia populacional: Ao: a7 = on Hy: 0% 40% Sob a suposicgéo de Ho ser verdadeira, temos que o valor calculado é F = $3/S% ~ F(ng —1,n4 —1). Portanto, F = sp/s4 = 52/50 = 1.040. Considerando a = 0.05, temos que os valores criticos da distribuigao F(14,11) sao fi = 0.323 e fo = 3.359, isto é, a regiao critica 6 dada por RC = {f € Rt: f < 0.323U f > 3.359}. Como F esta fora da regiao critica, nao rejeitamos a hipdétese nula de que as variancias nao diferem ao nivel de significdncia de 5%. e Teste de hipdtese para média populacional: Ho: MA = UB Ay: aA < MB A variancia comum combinada é dada por a _ (na 1)s8% + (np ~ sh © (na —1)+ (np —-1) — (12 —1)50 + (15 — 1)52 (12-1) + (15-1) = 51.12. Entao, ,— Yaa Yn) — (Ha ~ bs) Ser/1/na +1/nB _ (68 — 76) 7.15,/1/12 + 1/15 = —2.89. Considerando que t possui uma distribuicgéo t-Student com n4-+np —2 graus de liberdade, a quantidade t. é€ obtida na tabela da distribuicgdéo t-Student. Entao, fixando a, encontramos o valor de t. como a = P(t < —t.|Ho), com regiao critica dada por RC = {t € R: t < —1.708}. Logo, concluimos que a hipotese Ho é rejeitada ao nivel de significancia de 5%, pois o valor t calculado pertence a regiao critica. 8 . poe *,sEstatistica . . UFPR 10. e Teste de hipdtese para variancia populacional: Ao: a7 = on Hy: 0% 40% Sob a suposicgéo de Ho ser verdadeira, temos que o valor calculado é F = $3/S% ~ F(ng —1,n4 —1). Portanto, F = s%/s% = 210.8/81.6 = 2.583. Considerando a = 0.1, temos que os valores criticos da distribuigao F(19,14) sao fi = 0.443 e fo = 2.400, isto é, a regiao critica 6 dada por RC = {f € Rt: f < 0.443 ou f > 2.400}. Como F esté dentro da regiao critica, rejeitamos a hipdétese nula de que as variancias nao diferem ao nivel de significancia de 10%. e Teste de hipdtese para média populacional: Ho : HA = MB Ay: ba FB , — Ya — Ye) — (Ha = be) /s4/na + 8%/nB _ (70.5 — 84.5) \/81.6/15 + 210.8/20 = —3.502. Como as varidncias sao distintas, t possui uma distribuicaéo t-Student com v graus de liberdade dado por v= (wa + wp)? w4/(na — 1) +.w2/(ne — 1) _ (5.44 + 10.54)? ~ -5,.442/(15 — 1) + 10.542/(20 — 1) = 32.077. sendo wa = s4,/n4 = 81.6/15 = 5.44 e wg = w?,/ng = 210.8/20 = 10.54. A quantidade t, é obtida na tabela da distribuigéo t-Student. Entaéo, fixando a, encontramos o valor de t, para 32 graus de liberdade como a = P(t < —t. Ut > t.|Ho), com regiao critica dada por RC = {t ER: t< —1.694 ou t > 1.694}. Logo, concluimos que a hipétese Ho é rejeitada ao nivel de significdncia de 10%, pois o valor t calculado pertence a regiao critica. 11. ¢ Ho: py =pm versus Hy, : py # pm (teste bilateral) e Proporgdes 24 13 Pu ~ 700 © PM ™ 700 24+ 13 37 p= ————._ = —— = 0.185 P™ 100+ 100 200 9 _ poe *,sEstatistica . . UFPR e Estatistica de teste: Dy — Dp 0.24 — 0.13 - PH TPM _ __ = 2.9033. \/P(L—p)(a5 +a) 1 0-185(1 — 0.185)(=4, + 4) °° a=0.05 > RC = {z < —1.96 ou z > 1.96}. °¢ p—valor =a* = P(Z < —-z)+ P(Z > z) = 0.045. ¢ Rejeita-se Ho. Ha evidéncias suficientes (a = 0.05) de que as proporgdes populacionais de homens e mulheres com carro diferem. 10 C4 DEST ____ , . ae Sj" Departamento de Estatistica UFPR Exercicios da Unidade 9 Andlise de varidncia e Regressdo linear Os exercicios foram extraidos de segdes do livro: Magalhaes, MN; Lima, ACP. Nogoes de Probabilidade e Estatistica. SAo Paulo: EDUSP, 2008. 1. A quantidade de chuva é um fator importante na produtividade agricola. Para medir esse efeito, foram anotados, para 8 regides diferentes produtoras de soja, o indice pluviométrico e a produgao do ultimo ano, dados a seguir. Chuva (mm) 120 140 122 150 115 190 130 118 Produgao (ton) | 40 46 45 37 ~~ 25 54.333 30 & = 135.625; y = 38.75; S7°_, ay - yy = 43245; S78, a? = 151533. a) Encontre os pardmetros desconhecidos 3 e 3; do modelo de regressao linear simples E[Y;] = 80 + G1 - Xi. b) Interprete os parémetros ( e {4. c) Utilizando a reta ajustada no item anterior, encontre a producao esperada para uma regiaéo com {indice pluviométrico igual a 160 mm. d) Eadequado utilizar o modelo ajustado para calcular a produgaéo em uma regiao cujo indice pluviométrico é igual a 30 mm? 2. Um pesquisador acredita que o gado alimentado em um determinado pasto tem um ganho de peso maior que o usual. Estudos de laboratério detectaram uma substancia no pasto e deseja-se verificar se ela pode ser utilizada para melhorar o ganho de peso dos bovinos. Foram escolhidos 15 bois de mesma raca e idade, e cada animal recebeu uma determinada concentragaéo da substancia X (em mg/l). O ganho de peso apdés 30 dias, denotado por Y (em kg), foi anotado e os dados foram os seguintes: X[o2[ 0s [06] 07 [10] 1s [a0] 25] a0] 35] AO] AS] HO] 5s | OO | Resumo dos dados: Z = 2.70; ¥ = 16.14; 32, ei ys = 785.55; S22, 2? = 163.39. a) Encontre os pardmetros desconhecidos 3 e 3; do modelo de regressao linear simples E[Y;] = 80 + G1 - Xi. b) Interprete os parémetros ( e {4. c) Utilizando a reta ajustada no item anterior, encontre o ganho de peso esperado para uma concentracao de substancia igual a 3 (mg/l). 3. Um estudo foi conduzido pelo Instituto Politécnico e pela Universidade Estadual da Virgínia para determinar se certa medida estática da força do braço tem influência nas características da “suspensão dinâmica” de certo indivíduo. Vinte e cinco indivíduos foram submetidos a testes de força e, depois, desempenharam um teste de levantamento de peso no qual o peso foi levantado dinamicamente sobre a cabeça. Os dados são fornecidos a seguir. Indivíduo Força braçal: X Levantamento dinâmico: Y 1 17.3 71.7 2 19.3 48.3 3 19.5 88.3 4 19.7 75.0 5 22.9 91.7 6 23.1 100.0 7 26.4 73.3 8 26.8 65.0 9 27.6 75.0 10 28.1 88.3 11 28.2 68.3 12 28.7 96.7 13 29.0 76.7 14 29.6 78.3 15 29.9 60.0 16 29.9 71.7 17 30.3 85.0 18 31.3 85.0 19 36.0 88.3 20 39.5 100.0 21 40.4 100.0 22 44.3 100.0 23 44.6 91.7 24 50.4 100.0 25 55.9 71.7 a) Estime β0 e β1 para a reta de regressão linear E[Yi] = β0 + β1 · Xi. b) Determine uma estimativa pontual de µY |30, ou seja, o levantamento dinâmico esperado para uma força braçal de 30. 4. As notas de uma sala com nove estudantes em um relatório de meio de curso (X) e em um exame final (Y ) são dadas a seguir: x 77 50 71 72 81 94 96 99 67 y 82 66 78 34 47 85 99 99 68 a) Estime a reta de regressão linear. b) Estime a nota do exame final de um aluno que teve uma nota 85 no relatório de meio de curso. 5. Um estudo foi realizado sobre a quantidade de açúcar convertido em um processo em várias temperaturas. Os dados foram codificados e registrados a seguir: Temperatura: X Açúcar convertido: Y 1.0 8.1 1.1 7.8 1.2 8.5 1.3 9.8 1.4 9.5 1.5 8.9 1.6 8.6 1.7 10.2 1.8 9.3 1.9 9.2 2.0 10.5 a) Estime a reta de regressão linear. b) Estime a média da quantidade de açúcar convertido produzida quando a temperatura codificada é 1.75. c) Use uma abordagem da análise de variância para testar a hipótese de que β1 = 0 contra a hipótese alternativa de que β1 ̸= 0, no nível de significância de 0.05. 2 6. As quantidades de um composto químico, Y , dissolvido em cem gramas de água sob várias temperaturas, X, foram registradas a seguir: X Y (oC) (gramas) 0 8 6 8 15 12 10 14 30 25 21 24 45 31 33 28 60 44 39 42 75 48 51 44 a) Determine a equação do modelo de regressão linear simples. b) Desenhe a reta no diagrama de dispersão. c) Estime a quantidade de composto químico que se dissolverá em cem gramas de água a 50oC. 7. Um teste matemático de colocação é aplicado para todos os calouros que entram em uma pequena faculdade. Um estudante que recebe uma nota abaixo de 35 é recusado para o curso regular de Matemática e colocado em uma aula de reforço. As notas dos testes de colocação e as notas finais de 20 alunos que cursaram Matemática foram registradas como se segue: Teste de colocação Nota do curso 50 53 35 41 35 61 40 56 55 68 65 36 35 11 60 70 90 79 35 59 90 54 80 91 60 48 60 71 60 71 40 47 55 53 50 68 65 57 50 79 a) Faça um diagrama de dispersão. b) Determine a equação da reta de regressão para prever as notas de curso com base nas notas do teste de colocação. c) Represente a reta em um diagrama de dispersão. d) Se 60 é a nota mínima para passar, abaixo de qual nota do teste de colocação os alunos deveriam ser recusados para o curso no futuro? 3 . poe *,sEstatistica . . UFPR 8. Um estudo foi conduzido por um vendedor a varejo para determinar a relacao entre os gastos semanais com publicidade e as vendas. Os seguintes dados foram registrados: X: Gastos com publicidade ($) Y: Vendas ($) AO 385 20 400 25 395 20 365 30 AT5 50 440 AO 490 20 420 50 560 AO 525 25 480 50 510 a) Faga um diagrama de dispersao. b) Determine a equagéo da reta de regressio para prever as vendas semanais com base nos gastos com publicidade. c) Estime as vendas semanais quando os gastos de publicidade sao de R$ 35, 00. 9. Um estudo foi realizado para avaliar os efeitos da temperatura ambiente X no consumo de energia elétrica de uma industria quimica, Y. Outros fatores foram mantidos constantes e os dados foram coletados de uma fabrica experimental piloto. Y (BTU) X (°F)|Y (BTU) X (°F) 250 27 265 31 285 45 298 60 320 72 267 34 295 58 321 74 a) Facga um grafico dos dados. b) Estime a inclinagao e o intercepto em um modelo de regressao linear simples. c) Preveja o consumo de energia para uma temperatura ambiente de 65°F’. 10. Um professor em uma escola de negécios de uma universidade entrevistou uma dtzia de colegas sobre o numero de reunioes profissionais de que eles participaram nos tiltimos cinco anos (X) e o nimero de trabalhos enviados por eles a revistas especializadas (Y) durante o mesmo periodo. Um resumo dos dados é fornecido a seguir: n = 12, #=4, y=12, So a; = 232, So wivi = 318. Ajuste um modelo de regressao linear simples entre y e x determinando as estimativas do intercepto e da inclinagao. Comente se 0 comparecimento em reunioes profissionais resultaria em mais trabalhos publicados. 4 11. Deseja-se um modelo de regressão que relacione a temperatura e a proporção de impurezas de uma substância sólida que atravessa o hélio sólido. A temperatura é listada em graus centígrados. Os dados são apresentados aqui. Temperatura (C) Proporção de impurezas -260,5 0.425 -255,7 0.224 -264,6 0.453 -265,0 0.475 -270,0 0.705 -272,0 0.860 -272,5 0.935 -272,6 0.961 -272,8 0.979 -272,9 0.990 a) Ajuste um modelo de regressão linear. b) Parece que a proporção de impurezas que atravessam o hélio aumenta conforme a temperatura se aproxima de −273 graus centígrados? c) Determine R2. d) Com base nas informações dadas, o modelo linear parece apropriado? Quais informações adicionais seriam necessárias para melhor responder a essa questão? 12. Suponha, em um experimento industrial, que um engenheiro está interessado em saber como a absorção média de uma mistura em concreto varia entre cinco agregados de concreto. As amostras foram expostas à mistura por 48 horas. Decidiu-se que seis amostras seriam testadas para cada agregado, requerendo um total de 30 amostras para serem testadas. Os dados estão registrados na tabela a seguir. Teste a hipótese µ1 = µ2 = · · · = µ5, no nível de significância de 0.05, para os dados da Tabela sobre a absorção das misturas por vários tipos de agregados de cimento. Agregado: 1 2 3 4 5 551 595 639 417 563 457 580 615 449 631 450 508 511 517 522 731 583 573 438 613 499 633 648 415 656 632 517 677 555 679 Total 3320 3416 3663 2791 3664 16854 Média 553.33 569.33 610.5 465.17 610.67 561.8 13. Seis máquinas diferentes estão sendo consideradas para uso na fabricação de selos de borracha. As máquinas estão sendo comparadas em relação à resistência à tensão do produto. Uma amostra aleatória de quatro selos de cada máquina é utilizada para determinar se a resistência à tensão varia de máquina para máquina. A seguir, temos as medidas das resistências à tensão, em quilogramas por centímetro quadrado ×10−1. Máquina 1 2 3 4 5 6 17.5 16.4 20.3 14.6 17.5 18.2 16.9 19.2 15.7 16.7 19.2 16.2 15.8 17.7 17.8 20.8 16.5 17.5 18.6 15.4 18.9 18.9 20.5 20.1 Faça uma análise de variância, no nível de significância de 0.05, e indique se as resistências à tensão diferem 5 significativamente ou não entre as seis máquinas. 14. Os dados da tabela a seguir representam o número de horas de alívio para cinco marcas diferentes de comprimidos para dor de cabeça, administrados em 25 indivíduos com febre de 38oC ou mais. Faça uma análise de variância e teste a hipótese, no nível de significância de 0.05, de que a média do número de horas de alívio fornecidas pelos comprimidos é a mesma para todas as cinco marcas. Discuta os resultados. Comprimido A B C D E 5.2 9.1 3.2 2.4 7.1 4.7 7.1 5.8 3.4 6.6 8.1 8.2 2.2 4.1 9.3 6.2 6.0 3.1 1.0 4.2 3.0 9.1 7.2 4.0 7.6 15. Uma investigação foi conduzida para determinar a fonte de redução no rendimento de certo produto químico. Sabe-se que a perda no rendimento ocorreu no líquido mãe, ou seja, o material removido no estágio de filtragem. Percebeu-se que marcas diferentes do material original podem resultar em diferentes reduções no rendimento no estágio do líquido mãe. A seguir temos os resultados da redução percentual para os três lotes de cada uma das quatro marcas pré-selecionadas. Faça uma análise de variância no nível de significância α = 0.05. Marca 1 2 3 4 25.6 25.2 20.8 31.6 24.3 28.6 26.7 29.8 27.9 24.7 22.2 34.3 6 _ poe *,sEstatistica . . UFPR Respostas 1. a) A n wi CY 4 24 —_ . 1 . 2 . . b, = er ney 3245 — 8 - 135.625 38.75 _ 9 9743, pa &F — nz? 151533 — 8 - 135.6252 Bo = 9 — Bik = 38.7500 — 0.2743 - 135.625 = 1.548. b) O parametro {o é o intercepto da reta, isto é, 6 o valor de produgaéo esperado quando nao chove. Entretanto, a interpretacéo pode nao ter sentido pratico ou veracidade visto que o valor x = 0 esta distante dos dados. O parémetro 6; é o aumento da produgaéo quando aumentamos uma unidade de chuva. c) 9 = Po + Pix = 1.548 + 0.2743 - 160 = 45.436. d) Nao, pois 30 mm de chuva nao esta no intervalo de valores de chuva utilizados para o ajuste do modelo. 2. a ee EMT NET __785.55—15-2.70-16.14 a) P= one? . 163 50-16 2708 = 2.44. Bo = 9 — Bid = 16.14 — 2.44 - 2.70 = 9.55. § = 9.554 2.44. a;. b) O parametro (9 é 0 intercepto da reta, isto é, 6 o ganho de peso quando a concentracao da substancia é 0. O pardmetro 6, é o ganho de peso dos animais quando aumentamos uma unidade na concentracaéo da substancia. c) § = 8 + Gia = 9.55 + 2.44-3 = 16.87. 3. a) Soa; =778.7, Sy = 2050.0, S >a? = 26591.63, So aiy; = 65164.04, n = 25 Note que “ Yo; Leys — NEY By = > 2 _ nx ’ mas se multiplicarmos o numerador e 0 denominador da expresséo acima por n podemos re-escrever a equacao acima como _ , = MOL tive — NEY) _— MD Ti Vii Lie 1nd, 22 — nz?) nyo, a2—(d,"))2 | Portanto, - 25) (65164.04) — (778.7)(2050.0 4, = (25)(65164.04) ~ (778.7)(2050.0) _ 4 5699 (25)(26591.63) — (778.7)? ~ 2050 — (0.5609) (778.7 Po = 2050 ~ (0-5609)(778-7) _ 64 53. 25 b) Usando a equacéo § = 64.53 + 0.5609 - x, com x = 30, encontramos § = 64.53 + (0.5609)(30) = 81.40. 7 _ poe *,sEstatistica . . UFPR c) Os residuos parecem se distribuir de forma aleatéria, conforme desejado. A, a) Soa; = 707, Soy, = 658, Sa? = 57557, So aiy; = 538258 en =9. Usamos a igualdade 3 _ ei TY — NTY _ nde Tiyi — Vi Ti Di Yi ' ite — nz? n>,e7—(Y, ai)? Portanto, * (9)(53258) — (707)(658) Se = 0.7771 Pa (9) (57557) — (707)2 ’ * 658 — (0.7771) (707 Bo = os OTT TOT) = 12.0623. Portanto, 7 = 12.0623 + 0.7771 - x. b) Para x = 85, § = 12.0623 + (0.7771)(85) = 78. 5. a) Soa; =16.5, Soy; = 100.4, $0 ax? = 25.85, So ajy; = 152.59en=11 Usamos a igualdade a di Tiyi —NTY — MY TiYs — VTi DV Yi Dah one nya = (Lye Portanto, x 11)(152.59) — (16.5)(100.4 4, = (11)(152.59) — (16.5)(100.4) _ | gag) (11) (25.85) — (16.5)? x 100.4 — (1.8091) (16.5 By = 1d = 1-8091)(16:5) _ 6 1136. 11 Portanto, 7 = 6.4136 + 1.80912. b) Para x = 1.75, § = 6.4136 + (1.8091)(1.75) = 9.580. c) As hipdéteses saéo Ao: fi = 90, Ay : By x 0. Nivel de significancia: 0.05. Regiao critica: F > 5.12. Calculo: SQReg = 8? D,(a; — ®)? = (3.273)(1.1) = 3.60 e SQRes = SD, (yi — Bo — Bia)? = 3.60. Quadro da ANOVA 8 _ poe *,sEstatistica . . UFPR Fonte de Variagao 5.Q. GL. QM. Fo, Regressao | 3.60 1 3.60 9.00 Residual 3.60 9 0.40 Total 7.20 10 Decisao: Rejeita-se Ho. 6. a) Soa; = 675, Soy, = 488, S$) x? = 37125, S > aiy;, = 25005 e n = 18. Usamos a igualdade By = Lats — MEY _ ND TYE Vii LAM : bo 27 — nz? nyo, 27 — (Yi)? Portanto, 4 18) (25005) — (675)(488 4, = (§8)(25005) ~ (675)(488) _ 9 srg (18)(37125) — (675)? 4 488 — (0.5676) (675 Po = A88 ~ (0-5676)(675) _ 5 go54, 18 Portanto, § = 5.8254 + 0.5676 - x. b) O grafico de dispersao e a linha de regressao. c) Para x = 50, § = 5.8254 + (0.5676) (50) = 34.205 gramas. 7. a) O grafico de dispersao e a linha de regressao. b) So ai = 1110, Soy = 1173, Soa? = 67100, So wiv = 67690 en = 20 Usamos a igualdade By = Lats MEY _ RD TYE iL epone nD ya (Le)? Portanto, A 2 — (1110)(11738 4g, = (20)(67690) ~ (1110)(1173) _ you (20)(67100) — (1110)? 4 1173 — (0.4711)(1110 Po = U3 ~ ATION _ 39 5059. 20 Portanto, 7 = 32.5059 + 0.4711 - a. (c) Ver item (a). (d) Para § = 60, resolvemos 60 = 32.5059 + 0.4711 - a para obter x = 58.3659. Portanto, alunos com pontuacao abaixo de 58 devem ter sua admissao negada. 8. 9 _ poe *,sEstatistica . . UFPR a) O grafico de dispersao e a linha de regressao. b) Soa; = 410, Soy; = 5445, Soa? = 15650, $0 ay; = 191325 en = 12. Usamos a igualdade a ye tiyi — NTY _ nde iyi — Vi Vi Di Yi : do 27 — na? nda? -—(Y, ai)? Portanto, , 12)(191325) — (410) (5445 B, = (42)(191825) — (410)(5445) _ 3 ong, 12)(15650) — (410)? , 445 — (3.2208) (410 Po = DAMS ~ (8.2208)(410) _ 343 7056. 12 Portanto, 7 = 343.7056 + 3.2208 - x. (c) Quando x = $35, § = 343.7056 + (3.2208) (35) = 456.43. 9. a) O grafico de dispersao e a linha de regressao. b) Soa, = 401, Soy = 2301, Soa? = 22495, SO ays = 118652 en =8 Usamos a igualdade B _ i LiYys — NLY _ n> Lyi — i vi i Yi Dap ont nah = (Lye)? Portanto, 5 (8)(118652) — (401)(2301) a NNN = 1.3839 Pr (8) (22495) — (401)? 5 2301 — (1.3839) (401 Po = 2301 ~ (2.3839)(401) 3 491) _ 919,96. Portanto, 7 = 218.26 + 1.3839 - x. c) Para « = 65°F, § = 218.26 + (1.3839) (65) = 308.21. 10. A partir do resumo dos dados, obtemos , (12) (318) — [(4)(12)]10.2)2)) By = 5 = —6.45, (12) (232) — [(4)(12)] Bo = 12—(-6.45)(4) = 37.8. Portanto, 7 = 37.8 — 6.45. ax. Parece que participar de reunides profissionais nao resulta na publicacgéo de mais artigos. 11. (a) § = —11.3251 — 0.0449 temperatura. (b) Sim. 10 (c) 0.9355. (d) A proporção de impurezas depende da temperatura. No entanto, com base no gráfico, não parece que a dependência seja linear. Se houver réplicas, um teste de falta de ajuste pode ser realizado. 12. Hipóteses: H0 : µ1 = µ2 = · · · = µ5 H1 : pelo menos duas médias não são iguais, α = 0.05. Região crítica: (α = 0.05) : F > 2.76 com ν1 = 4 e ν2 = 25 graus de liberdade. Os cálculos das somas dos quadrados fornecem SQTotal= 209377, SQTrat = 85356, SQResíduo = 209377 - 85356 = 124021. Decisão: Rejeitar H0 e concluir que os agregados não têm a mesma média de absorção. O p-valor para F = 4.30 é menor que 0.05. GL SQ QM F p-valor Tratamento 4 85356.47 21339.12 4.30 0.0088 Resíduos 25 124020.33 4960.81 13. As hipóteses estatísticas são H0 : µ1 = µ2 = · · · = µ6 H1 : pelo menos duas médias não são iguais. α = 0.05. Região Crítica: F > 2.77 com ν1 = 5 and ν2 = 18 graus de liberdade. Cálculos: GL SQ QM F p-valor Tratamento 5 5.34 1.07 0.31 0.9024 Resíduos 18 62.64 3.48 com p-valor = 0.9024. Decisão: As médias de tratamento não diferem significativamente. 14. 11 As hipóteses estatísticas são H0 : µ1 = µ2 = · · · = µ5 H1 : pelo menos duas médias não são iguais. α = 0.05. Região Crítica: F > 2.87 com ν1 = 4 and ν2 = 20 graus de liberdade. Cálculos: GL SQ QM F p-valor Tratamento 4 78.422 19.605 6.59 0.0015 Resíduos 20 59.532 2.977 com p-valor = 0.0015. Decisão: Rejeitar H0. O número médio de horas de alívio difere significativamente. 15. As hipóteses estatísticas são H0 : µ1 = µ2 = µ3 = µ4 H1 : pelo menos duas médias não são iguais. α = 0.05. Cálculos: GL SQ QM F p-valor Tratamento 3 119.649 39.883 7.10 0.0121 Resíduos 8 44.920 5.615 com p-valor = 0.0121. Decisão: Rejeitar H0. Há uma diferença significativa na redução do rendimento médio para as 4 combinações pré-selecionadas. 12

Sua Nova Sala de Aula

Sua Nova Sala de Aula

Empresa

Contato Blog

Legal

Termos de uso Política de privacidade Política de cookies Código de honra

Baixe o app

4,8
(35.000 avaliações)
© 2026 Meu Guru® • 42.269.770/0001-84