·
Ciências Contábeis ·
Estatística 2
Envie sua pergunta para a IA e receba a resposta na hora
Recomendado para você
16
Slide - Revisão - Estatística 2 - 2024-1
Estatística 2
UFMG
42
Slide - Aula 22 - Regressão Linear Simples - Estatística 2 - 2024-1
Estatística 2
UFMG
5
Lista - Regressão Linear Simples 2021-2
Estatística 2
UFMG
1
Exercícios - Estatística 2 2021 2
Estatística 2
UFMG
58
Projeto - Estatística 2 - 2024-1
Estatística 2
UFMG
3
Prova - Estatística 2 - 2023-2
Estatística 2
UFMG
60
Slide - Aula 23 - Teste de Significância da Reg - Estatística 2 - 2024-1
Estatística 2
UFMG
40
Slide - Aula 15 - Teste Qui-quadrado de Indepenência - 2024-1
Estatística 2
UFMG
7
Prova - Estatística 2 - 2023-1
Estatística 2
UFMG
21
Lista - Estatística 2 2021 2
Estatística 2
UFMG
Texto de pré-visualização
1 DISCIPLINA: ESTATÍSTICA II (EST002) 2ª SEM./2021 Metaturma Módulo 4 PROF.: THIAGO REZENDE DEPTO. ESTATÍSTICA – UFMG DATA DE ENTREGA: 25/01/2022 Lista de Exercícios Exercício 1: Sabe-se que o tempo de vida de certo equipamento na indústria automobilística tem distribuição Gaussiana com média e variância populacionais desconhecidas. Uma amostra de 31 equipamentos forneceu ∑ 31 (𝑋𝑖 − 𝑋̅)2 𝑖=1 = 30,30. Construa um intervalo de confiança de 95% e 98% para a variância populacional. Exercício 2: Considere os seguintes resultados, referentes a duas amostras aleatórias independentes tomadas de duas populações: AMOSTRA 1 𝑛1 = 50 𝑋̅1 = 13,6 𝜎1 = 2,2 AMOSTRA 2 𝑛2 = 35 𝑋̅2 = 11,6 𝜎2 = 3,0 a. Qual é a estimação pontual da diferença entre as duas médias populacionais? b. Construa um intervalo de confiança de 90% relativo à diferença entre as duas médias populacionais; c. Construa um intervalo de confiança de 95% relativo à diferença entre as duas médias populacionais. Use o software R! Exercício 3: Um estudo realizado pela Cornell University dos diferenciais de salário entre homens e mulheres relatou que uma das razões pelas quais os salários dos homens são mais altos que os das mulheres é o fato de os homens tenderem a ter mais anos de experiência no trabalho que as mulheres (Bussiness Week, agosto de 2000). Suponha que os seguintes resumos amostrais apresentem os anos de experiência correspondentes a cada grupo: HOMENS 𝑛𝐻 = 100 𝑋̅𝐻 = 14,9 𝑎𝑛𝑜𝑠 𝜎𝐻 = 5,2 𝑎𝑛𝑜𝑠 MULHERES 𝑛𝑀 = 85 𝑋̅𝑀 = 10,3 𝑎𝑛𝑜𝑠 𝜎𝑀 = 3,8 𝑎𝑛𝑜𝑠 a. Qual a estimação pontual da diferença entre as duas médias populacionais? b. Com 95% de confiança, qual é a margem de erro? c. Qual é a estimação por intervalo de confiança da diferença entre as duas médias populacionais? d. Pode-se concluir que os homens apresentam salários mais altos que as mulheres? 2 Use o software R! Exercício 4: Considere os seguintes resultados, referentes a duas amostras aleatórias independentes tomadas de duas populações: AMOSTRA 1 𝑛1 = 20 𝑋̅1 = 22,5 𝑆1 = 2,5 AMOSTRA 2 𝑛2 = 30 𝑋̅2 = 20,1 𝑆2 = 4,8 a. Qual é a estimação pontual da diferença entre as duas médias populacionais? b. Construa um intervalo de confiança de 95% relativo à diferença entre as duas médias populacionais, considerando 𝜎1 2 = 𝜎2 2. c. Construa um intervalo de confiança de 95% relativo à diferença entre as duas médias populacionais, considerando 𝜎1 2 ≠ 𝜎2 2. Exercício 5: Periodicamente, os clientes da Merrill Lynch são solicitados a avaliar os consultores e os serviços financeiros dessa empresa (2000 Merrill Lynch Client Satisfaction Survey). Avaliações mais elevadas sobre a satisfação do cliente indicam um atendimento melhor, sendo 7 a classificação máxima para os serviços. Amostras independentes de avaliações do serviço prestado por dois consultores financeiros estão resumidos na tabela abaixo. Os consultores 𝐴 tem dez anos de experiência, ao passo que os consultores 𝐵 tem um ano de experiência. CONSULTOR A 𝑛𝐴 = 16 𝑋̅𝐴 = 6,82 𝑆𝐴 = 0,64 CONSULTOR B 𝑛𝐵 = 10 𝑋̅𝐵 = 6,25 𝑆𝐵 = 0,75 a. Qual é a estimação pontual da diferença entre as duas médias populacionais? b. Construa um intervalo de confiança de 95% relativo à diferença entre as duas médias populacionais, considerando 𝜎1 2 = 𝜎2 2. c. Construa um intervalo de confiança de 95% relativo à diferença entre as duas médias populacionais, considerando 𝜎1 2 ≠ 𝜎2 2. d. Pode-se concluir que os consultores com mais experiência apresentam uma melhor avaliação do serviço prestado? Exercício 6: A fim de fazer um levantamento da disponibilidades de vagas para a 1ª série do ensino médio, a secretaria de educação de Minas Gerais sorteou 50 escolas por todo o estado e observou o número de alunos matriculados nessa série em cada uma delas. Os resultados foram: 77, 60, 78, 75, 148, 93, 129, 141, 81, 64, 102, 56, 136, 22, 124, 37, 89, 62, 24, 41, 112, 103, 116, 148, 60, 32, 50, 115, 49, 81, 31, 75, 81, 31, 33, 29, 22, 48, 25, 121, 101, 23, 36, 54, 43, 86, 142, 65, 114 e 135. Construa um intervalo de confiança de 95% para a média e variância do número de vagas. Use o software R! Exercício 7: Sendo 𝑋 uma variável aleatória com distribuição de probabilidade Bernoulli com 𝑝 = 0,7, para uma amostra de tamanho 4, determine a função de probabilidade da média amostral. 3 Exercício 8: Deseja-se coletar uma amostra de uma variável aleatória 𝑋 com distribuição Normal de média desconhecida e variância 30. Qual deve ser o tamanho da amostra para que, com 0,92 de probabilidade, a média amostral não seja diferente da média da população por mais de 3 unidades. Exercício 9: Em um levantamento preliminar feito em uma grande favela à pergunta "Quantas pessoas residem no barraco?" obteve-se a seguinte distribuição de respostas: Nº de residências 𝟐 𝟑 𝟒 𝟓 𝟔 𝟕 𝟖 Frequência 5 280 517 683 418 103 24 Calcule a média e o desvio padrão da variável "número de residentes no barraco" e, com base nesta amostra obtenha um intervalo de confiança de 95% para a média populacional. Use o software R! Exercício 10: Numa pesquisa de mercado, deseja-se estimar a proporção de pessoas que compram o sabonete Bom-cheiro. a. A partir da informação adicional de que a aceitação do sabonete Bom-cheiro é no mínimo 0,8, qual deve ser o tamanho da amostra? b. Decide-se colher uma amostra de tamanho 81. Qual o erro máximo que comete-se com probabilidade 0,9? c. Para a amostra de tamanho 81, qual a probabilidade de que o erro máximo seja 0,08? Exercício 11: Sabe-se que em indivíduos sadios quanto à visão, a pressão intra-ocular (em mmHg) pode ser aproximada por uma distribuição Normal com média 20 e desvio-padrão 2. Um pesquisador, desejando comprovar se há alteração na pressão intra-ocular em pacientes com glaucoma, seleciona uma amostra aleatória simples de 25 indivíduos portadores do problema. Obtém, com base nessa amostra, uma média igual a 21,5mmHg. (Considere que o desvio-padrão não é alterado e conhecido). Os dados apoiam a conjectura do pesquisador? a) Formule as hipóteses, calcule a estatística de teste e tire as conclusões ao nível = 5%. b) Calcule também um Intervalo de 95% de Confiança para a pressão intra-ocular média em indivíduos com glaucoma, interprete este intervalo e utilize-o para verificar novamente se a conjectura do pesquisador estava correta. Exercício 12: Num estudo comparativo do desenvolvimento motor de crianças filhas de mães chagásicas, observou-se que o tempo médio ao sentar, com base em uma amostra aleatória simples de 50 dessas crianças, foi de 6,6 meses. O desvio-padrão é de 0,95 meses. Sabe-se que na população em geral, uma criança senta, em média, aos 6 meses. Com base nessas informações, pode-se concluir que crianças filhas de mães chagásicas demoram mais a sentar? Faça o teste ao nível de 5%. Exercício 13: Em um estudo para detectar as características de recém-nascidos que podem desenvolver a síndrome da morte súbita, um estudo prospectivo foi realizado em Oakland, Califórnia, entre 1960 e 1967. Uma das características estudadas foi a idade da mãe. Sabendo que aproximadamente 39% das mulheres desta região dão à luz com menos de 25 anos de idade, teste a hipótese de que a baixa idade materna pode ser um fator de risco para morte 4 súbita se, neste estudo, de uma amostra aleatória simples de 44 bebês que tiveram morte súbita, 29 provinham de mães com menos de 25 anos de idade. Use = 1%. Exercício 14: “Os espectadores leigos fazem ressuscitação cardiopulmonar corretamente menos da metade das vezes” de acordo com um artigo na USA Today, que observou que, em 662 casos, 278 foram feitos corretamente. Teste a afirmação do artigo, ao nível de 5% de significância. Exercício 15: Para se avaliar o nível de tensão ocasionada por exames escolares, doze alunos foram escolhidos e sua pulsação medida antes e depois do exame. Instante da medição Estudantes 1 2 3 4 5 6 7 8 9 10 11 12 Antes 87 78 85 93 76 80 82 77 91 74 76 79 Depois 83 84 79 88 75 81 74 71 78 73 76 71 Faça um teste, com nível de significância de 1%, para verificar se existe maior tensão (isto é, maior pulsação) antes da realização dos exames. Indique as suposições necessárias. Use o software R! Exercício 16: Para verificar se duas populações têm a mesma média, amostras independentes foram retiradas. Sabendo que a população I é 𝑁𝑜𝑟𝑚𝑎𝑙(𝜇1, 25) e a população II 𝑁𝑜𝑟𝑚𝑎𝑙(𝜇1, 40), que conclusão pode ser tirada, ao nível de 2%? Os valores obtidos foram: População Dados I 12 14 15 14 13 17 14 13 II 13 17 14 13 16 17 18 16 Use o software R! Exercício 17: Para comparar as médias de duas populações Normais, amostras aleatórias foram obtidas. Sabe-se que as variâncias populacionais são diferentes, sendo seus valores desconhecidos. Amostra I 7 9 3 8 11 5 9 Amostra II 2 7 5 15 9 16 8 O que pode ser dito a respeito das médias das populações, com 𝛼 = 0,05? Use o software R! Exercício 18: Supondo que 𝑋~𝐹(𝑎, 𝑏), encontre 𝑥𝑐 tal que: a. 𝑃(𝑋 ≥ 𝑥𝑐) = 0,05 com 𝑎 = 18 e 𝑏 = 3. b. 𝑃(𝑋 > 𝑥𝑐) = 0,05 com 𝑎 = 3 e 𝑏 = 18. c. 𝑃(𝑋 > 𝑥𝑐) = 0,05 com 𝑎 = 180 e 𝑏 = 192. d. 𝑃(𝑋 ≥ 𝑥𝑐) = 0,95 com 𝑎 = 5 e 𝑏 = 12. e. 𝑃(𝑋 ≥ 𝑥𝑐) = 0,95 com 𝑎 = 30 e 𝑏 = 40. 5 Use o software R! Exercício 19: Uma panificadora produz determinado tipo de pão, cujo peso médio é de 190 gramas, com desvio padrão de 18 gramas. Devido a mudanças na política cambial, que ocasionou aumento no preço do trigo, alguns ingredientes da receita foram substituídos. Uma equipe do governo resolveu verificar se a variabilidade no peso do produto aumentou e escolheu, aleatoriamente, 16 unidades, medindo o peso de cada uma. O peso médio obtido da amostra foi de 102 gramas e o desvio padrão foi de 24,5 gramas. Qual a conclusão para 𝛼 = 10%? Nas questões NÃO NUMÉRICAS verifique, de acordo com a instrução de cada uma delas, se os itens são VERDADEIROS ou FALSOS. Exercício 20: Considere as seguintes afirmativas acerca de um teste de hipótese: Ⓞ O erro tipo I é definido como a probabilidade de não rejeitar a hipótese nula quando a hipótese nula é falsa. Ⓞ O poder do teste é definido como a probabilidade de não rejeitar a hipótese nula quando a hipótese nula é verdadeira. Ⓞ O erro tipo II é definido como a probabilidade de não rejeitar a hipótese nula quando a hipótese alternativa é verdadeira. Ⓞ O p-valor de um teste é a probabilidade, sob a hipótese nula, de obter um valor da estatística pelo menos tão extremo quanto o valor observado. Ⓞ Se um intervalo de confiança de 95% para a média amostral, calculado a partir de uma amostra aleatória, excluir o valor 0, pode-se rejeitar a hipótese de que a média populacional seja igual a 0 ao nível de significância de 5%. Exercício 21: Com relação a testes de hipóteses, julgue as afirmativas: Ⓞ Em um teste de hipóteses, comete-se um erro do tipo I quando se rejeita uma hipótese nula verdadeira. Ⓞ O poder de um teste de hipóteses é medido pela probabilidade de se cometer o erro tipo II. Ⓞ A soma das probabilidades dos erros tipo I e tipo II é igual a 1. Ⓞ Quanto maior for o nível de significância de um teste de hipóteses maior será o valor- p a ele associado. Ⓞ Se o valor-p de um teste de hipóteses for igual 0,015, a hipótese nula será rejeitada a 5%, mas não a 1%. Exercício 22: Seja Xn X X X ,........, , , 3 2 1 uma amostra aleatória de tamanho n de uma população normal com média e variância 2 . Julgue as afirmativas: Ⓞ A probabilidade de a média populacional, , estar contida no intervalo de confiança ] ,196 , ,196 [ n X n X é igual a 95%. 6 Ⓞ Se a variância 2 é desconhecida, o intervalo de confiança de 95% para a média será ] , [ n s t X n s t X c c , em que s é o desvio padrão da amostra, ct é calculado de forma que ,0 95 ) (| | ct P t , e t segue uma distribuição de Student com 𝑛 − 1 graus de liberdade. Ⓞ Se construirmos vários intervalos de confiança para a média com amostras de idêntico tamanho, mesma variância 2 e mesma margem de confiança, estes terão extremos aleatórios, mas todos terão a mesma amplitude. Ⓞ Num teste de hipótese: 0 0 : H contra 0 : Ha , se o intervalo de confiança estimado para a média não contiver o valor de 0 , então deve-se aceitar a hipótese de que 0 . Ⓞ Se a amostra aleatória Xn X X X ,........, , , 3 2 1 não provém de uma distribuição normal, não se pode construir um intervalo de confiança para a média , ainda que a amostra seja muito grande. Exercício 23: Seja 𝑋 uma variável aleatória normalmente distribuída com média e variância conhecida 2 =1, da qual se obtém a amostra aleatória X1, X2, ..., Xn (com n observações). É correto afirmar que: Ⓞ A média amostral é uma variável aleatória normalmente distribuída com média e variância 1/n. Ⓞ A probabilidade de o intervalo de confiança ] ,196/ , ,196/ [ n n X X conter a média da população, , é de 95%. Ⓞ A probabilidade de o intervalo de confiança ] ,196/ , ,196/ [ n n X X conter a média amostral é de 95%. Ⓞ O intervalo de 95% para a média populacional independe do tamanho da amostra. Ⓞ Em um intervalo de confiança de 95% para a média populacional, μ, espera-se que, extraindo-se todas as amostras de mesmo tamanho dessa população, esse intervalo conterá μ 95% das vezes. Exercício 24: Indique se as seguintes considerações sobre a teoria dos testes de hipótese são verdadeiras (V) ou falsas (F). Ⓞ O erro do tipo II é definido como a probabilidade de não se rejeitar uma hipótese nula quando esta for falsa e o erro do tipo I é definido como a probabilidade de se rejeitar a hipótese nula quando esta for verdadeira. Ⓞ No teste de hipótese para proporções, se a variância da proporção populacional for desconhecida, a estatística t de Student com 𝑛 − 1 graus de liberdade (𝑛 é o tamanho da amostra) é a indicada para o teste. Ⓞ Num teste de hipótese bi-caudal, o valor-p (ou valor de probabilidade) é igual a duas vezes a probabilidade da região extrema delimitada pelo valor calculado da estatística do teste. 7 Ⓞ Não se pode realizar um teste de hipótese para a variância populacional pois a estatística do teste, que segue uma distribuição Qui-quadrado com n -1 graus de liberdade (𝑛 é tamanho da amostra), não é simétrica. Ⓞ No teste de hipótese para a média (H0: = 0 contra Ha: 0), ao nível de significância , se o intervalo de confiança com 1- de probabilidade não contiver = 0, não se poderá rejeitar H0. Exercício 25: Uma máquina está sendo examinada com o objetivo de substituir a máquina antiga de certa indústria. Segundo o fabricante da nova máquina, a proporção (P) de peças defeituosas produzida é de 3% ou menos. Uma amostra de 2.000 peças foi examinada e foram encontradas 74 peças defeituosas. Ⓞ As hipóteses para um teste estatístico de hipóteses devem ser H0: P = 0,03 e HA: P < 0,03. Ⓞ Ao realizarmos o teste de hipóteses para o problema, ao nível de significância de 5%, a hipótese nula deve ser rejeitada. Ⓞ Utilizando a proporção de peças defeituosas encontradas na amostra, a estimativa por intervalo para a verdadeira proporção de peças defeituosas produzida pela nova máquina, utilizando uma confiança de 95%, é ( 2,87%; 4,53%). Ⓞ Admitindo que a verdadeira proporção de peças defeituosas seja 3%, seria necessário uma amostra de 3.000 peças para que o erro máximo admissível entre a proporção estimada e a verdadeira não excedesse a 1%, com probabilidade de 95%. Ⓞ Se as probabilidade de que um intervalo de confiança contenha o verdadeiro parâmetro populacional é igual a (1 - ), isto significa que se retirássemos um número infinito de amostras da população em estudo e se para cada uma das amostras calculássemos o intervalo de confiança do parâmetro , então em (1 - )% destes intervalos conteriam o verdadeiro parâmetro . Exercício 26: A vida útil de um tubo de televisão tem distribuição Normal com desvio padrão (conhecido) de 500 horas. O fabricante afirma que a vida útil média dos tubos é de, no mínimo, 9.000 horas. Sabendo-se que a vida útil média encontrada para uma amostra aleatória de 16 tubos foi de 8.800 horas, podemos afirmar que: Ⓞ Para verificar a veracidade da informação do fabricante através de um teste estatístico de hipóteses, as hipóteses são: Hipótese nula: H0: = 9.000 horas Hipótese alternativa : H1: > 9.000 horas Ⓞ Ao nível de significância de 5%, não podemos contestar a afirmação do fabricante. Ⓞ Se a informação amostral fosse obtida de uma amostra de 36 tubos, ao nível de significância de 2,5% também não podemos contestar a afirmação do fabricante. Ⓞ O tamanho mínimo da amostra para uma estimativa por intervalo da vida média dos tubos deveria ser de 50 tubos, de modo que o erro da estimativa não excedesse a 100 horas, com uma probabilidade de 95%. Ⓞ Caso desconheçamos o desvio padrão populacional é impossível testar a validade da afirmação do fabricante. 8 Exercício 27: O representante de um grupo comunitário informa a uma pessoa interessada em estabelecer um centro comercial que a renda média familiar na área é de R$ 15.000. Suponha que, para a área em questão, seja possível admitir que a renda média familiar tem distribuição aproximadamente normal, e que se possa aceitar o desvio-padrão como sendo R$ 2.000 (com base em um estudo anterior). Para uma amostra aleatória de 16 famílias, a renda média familiar foi de R$ 15.500. O centro comercial só será construído se o nível médio de renda familiar () for maior que o informado. Ⓞ A hipótese nula deve ser H R 0 000 : $15. . Ⓞ A hipótese alternativa deve ser H R 1 000 : $15. . Ⓞ Não pode ser realizado qualquer teste pois o número de elementos da amostra é pequeno. Ⓞ A estatística que deve ser utilizada para a elaboração do teste é a Z, que tem distribuição N(0,1). Ⓞ Um teste feito ao nível de significância de 5% permite concluir que a condição para a construção do centro será satisfeita. Exercício 28: Com respeito aos testes de hipóteses pode-se afirmar que: Ⓞ O nível de significância de um teste é a probabilidade de cometer erro do tipo I, isto é, a probabilidade de aceitar a hipótese nula, quando ela é falsa. Ⓞ O valor 1 - é o poder do teste, onde é a probabilidade do erro do tipo II, isto é, a probabilidade de rejeitar a hipótese nula quando ela é verdadeira. Ⓞ Se x 1,...,xn é uma amostra aleatória de uma população normal com média e variância conhecida 2, para testar H0 : 0 contra H1 : 0 usa-se a distribuição t de Student. Ⓞ Dada uma população de indivíduos de tamanho n, deseja-se verificar se a população de empregados é de 0,5. Esta verificação pode ser feita através do teste de hipóteses: H0 : p 1 2 / contra H1 : p 1 2 / usando-se, para tanto, a distribuição normal como aproximação da binomial. Ⓞ Uma empresa afirma que 60% dos seus empregados são ligados à produção. Para verificar esta afirmativa, o sindicato decide usar uma amostra de 200 trabalhadores e observa que 105 deles estão ligados à produção. Ao nível de significância de 5% pode-se afirmar que o número de empregados ligados à produção é inferior a 60%. Exercício 29: Suponha que tenhamos razões para crer que as notas obtidas por estudantes de escolas públicas sejam menores que as notas obtidas por estudantes de escolas particulares, ao tomarem o exame vestibular para uma Universidade. Para testar essa hipótese, foram selecionadas duas amostras de estudantes que prestaram o vestibular, suas médias gerais foram anotadas e obteve-se a tabela a seguir. 9 Teste a hipótese que as duas populações são homogêneas, para o nível de significância 𝛼 = 0,01. Obtenha o valor-p. Exercício 30: Duas novas drogas vão ser testadas em 160 pessoas portadoras de rinite alérgica. Metade das pessoas recebe a droga A e a outra metade recebe a droga B. Obtém-se a tabela abaixo. Teste a hipótese de que as duas drogas são igualmente eficazes para tratar a doença. Use o software R! Exercício 31: Investigando a “fidelidade” de consumidores de um produto, obteve-se uma amostra de 200 homens e 200 mulheres. Foram classificados como tendo alto grau de fidelidade 100 homens e 120 mulheres. Os dados fornecem evidência de possíveis diferenças de grau de fidelidade entre sexos? Exercício 32: Uma pesquisa sobre a qualidade de certo produto foi realizada enviando-se questionários a donas-de-casa pelo correio. Aventando-se a possibilidade de que os respondentes voluntários tenham um particular viés de respostas, fizeram-se mais duas tentativas com os não-respondentes. Os resultados estão indicados abaixo. Você acha que existe relação entre a resposta e o número de tentativas? Use o software R! 1 DISCIPLINA: ESTATÍSTICA II (EST002) 2ª SEM./2021 Metaturma Módulo 4 PROF.: THIAGO REZENDE DEPTO. ESTATÍSTICA – UFMG Gabarito Lista de Exercícios Exercício 1: Sabe-se que o tempo de vida de certo equipamento na indústria automobilística tem distribuição Gaussiana com média e variância populacionais desconhecidas. Uma amostra de 31 equipamentos forneceu ∑ 31 (𝑋𝑖 − 𝑋̅)2 𝑖=1 = 30,30. Construa um intervalo de confiança de 95% e 98% para a variância populacional. Exercício 2: Considere os seguintes resultados, referentes a duas amostras aleatórias independentes tomadas de duas populações: AMOSTRA 1 𝑛1 = 50 𝑋̅1 = 13,6 𝜎1 = 2,2 AMOSTRA 2 𝑛2 = 35 𝑋̅2 = 11,6 𝜎2 = 3,0 a. Qual é a estimação pontual da diferença entre as duas médias populacionais? 2. b. Construa um intervalo de confiança de 90% relativo à diferença entre as duas médias populacionais; 1,348. c. Construa um intervalo de confiança de 95% relativo à diferença entre as duas médias populacionais. [0,652; 3,348]. Exercício 3: Um estudo realizado pela Cornell University dos diferenciais de salário entre homens e mulheres relatou que uma das razões pelas quais os salários dos homens são mais altos que os das mulheres é o fato de os homens tenderem a ter mais anos de experiência no trabalho que as mulheres (Bussiness Week, agosto de 2000). Suponha que os seguintes resumos amostrais apresentem os anos de experiência correspondentes a cada grupo: HOMENS 𝑛𝐻 = 100 𝑋̅𝐻 = 14,9 𝑎𝑛𝑜𝑠 𝜎𝐻 = 5,2 𝑎𝑛𝑜𝑠 MULHERES 𝑛𝑀 = 85 𝑋̅𝑀 = 10,3 𝑎𝑛𝑜𝑠 𝜎𝑀 = 3,8 𝑎𝑛𝑜𝑠 a. Qual a estimação pontual da diferença entre as duas médias populacionais? 4,6. b. Com 95% de confiança, qual é a margem de erro? 1,827. 2 Qual é a estimação por intervalo de confiança da diferença entre as duas médias populacionais? [2,773; 6,427]. c. Pode-se concluir que os homens apresentam salários mais altos que as mulheres? Sim. Exercício 4: Considere os seguintes resultados, referentes a duas amostras aleatórias independentes tomadas de duas populações: AMOSTRA 1 𝑛1 = 20 𝑋̅1 = 22,5 𝑆1 = 2,5 AMOSTRA 2 𝑛2 = 30 𝑋̅2 = 20,1 𝑆2 = 4,8 a. Qual é a estimação pontual da diferença entre as duas médias populacionais? 2,4. b. Construa um intervalo de confiança de 95% relativo à diferença entre as duas médias populacionais, considerando 𝜎1 2 = 𝜎2 2. [-0,599; 5,399]. c. Construa um intervalo de confiança de 95% relativo à diferença entre as duas médias populacionais, considerando 𝜎1 2 ≠ 𝜎2 2. 0 Exercício 5: Periodicamente, os clientes da Merrill Lynch são solicitados a avaliar os consultores e os serviços financeiros dessa empresa (2000 Merrill Lynch Client Satisfaction Survey). Avaliações mais elevadas sobre a satisfação do cliente indicam um atendimento melhor, sendo 7 a classificação máxima para os serviços. Amostras independentes de avaliações do serviço prestado por dois consultores financeiros estão resumidos na tabela abaixo. Os consultores 𝐴 tem dez anos de experiência, ao passo que os consultores 𝐵 tem um ano de experiência. CONSULTOR A 𝑛𝐴 = 16 𝑋̅𝐴 = 6,82 𝑆𝐴 = 0,64 CONSULTOR B 𝑛𝐵 = 10 𝑋̅𝐵 = 6,25 𝑆𝐵 = 0,75 a. Qual é a estimação pontual da diferença entre as duas médias populacionais? b. Construa um intervalo de confiança de 95% relativo à diferença entre as duas médias populacionais, considerando 𝜎1 2 = 𝜎2 2. c. Construa um intervalo de confiança de 95% relativo à diferença entre as duas médias populacionais, considerando 𝜎1 2 ≠ 𝜎2 2. d. Pode-se concluir que os consultores com mais experiência apresentam uma melhor avaliação do serviço prestado? Exercício 6: A fim de fazer um levantamento da disponibilidades de vagas para a 1ª série do ensino médio, a secretaria de educação de Minas Gerais sorteou 50 escolas por todo o estado e observou o número de alunos matriculados nessa série em cada uma delas. Os resultados foram: 77, 60, 78, 75, 148, 93, 129, 141, 81, 64, 102, 56, 136, 22, 124, 37, 89, 62, 24, 41, 112, 103, 116, 148, 60, 32, 50, 115, 49, 81, 31, 75, 81, 31, 33, 29, 22, 48, 25, 121, 101, 23, 36, 54, 43, 86, 142, 65, 114 e 135. Construa um intervalo de confiança de 95% para a média e variância do número de vagas. 3 Exercício 7: Sendo 𝑋 uma variável aleatória com distribuição de probabilidade Bernoulli com 𝑝 = 0,7, para uma amostra de tamanho 4, determine a função de probabilidade da média amostral. 𝑿̅~𝑵(𝟎, 𝟕; 𝟎, 𝟎𝟓𝟐𝟓). Exercício 8: Deseja-se coletar uma amostra de uma variável aleatória 𝑋 com distribuição Normal de média desconhecida e variância 30. Qual deve ser o tamanho da amostra para que, com 0,92 de probabilidade, a média amostral não seja diferente da média da população por mais de 3 unidades. 11. Exercício 9: Em um levantamento preliminar feito em uma grande favela à pergunta "Quantas pessoas residem no barraco?" obteve-se a seguinte distribuição de respostas: Nº de residências 𝟐 𝟑 𝟒 𝟓 𝟔 𝟕 𝟖 Frequência 5 280 517 683 418 103 24 Calcule a média e o desvio padrão da variável "número de residentes no barraco" e, com base nesta amostra obtenha um intervalo de confiança de 95% para a média populacional. Exercício 10: Numa pesquisa de mercado, deseja-se estimar a proporção de pessoas que compram o sabonete Bom-cheiro. a. A partir da informação adicional de que a aceitação do sabonete Bom-cheiro é no mínimo 0,8 e de que a margem de erro é de, no máximo, 5%, qual deve ser o tamanho da amostra? 173. b. Decide-se colher uma amostra de tamanho 81. Qual o erro máximo que comete- se com probabilidade 0,9? 0,091. c. Para a amostra de tamanho 81, qual a probabilidade de que o erro máximo seja 0,08? 0,964. Exercício 11: Sabe-se que em indivíduos sadios quanto à visão, a pressão intra-ocular (em mmHg) pode ser aproximada por uma distribuição Normal com média 20 e desvio- padrão 2. Um pesquisador, desejando comprovar se há alteração na pressão intra-ocular em pacientes com glaucoma, seleciona uma amostra aleatória simples de 25 indivíduos portadores do problema. Obtém, com base nessa amostra, uma média igual a 21,5mmHg. (Considere que o desvio-padrão não é alterado e conhecido). Os dados apoiam a conjectura do pesquisador? a) Formule as hipóteses, calcule a estatística de teste e tire as conclusões ao nível = 5%. b) Calcule também um Intervalo de 95% de Confiança para a pressão intra-ocular média em indivíduos com glaucoma, interprete este intervalo e utilize-o para verificar novamente se a conjectura do pesquisador estava correta. Exercício 12: Num estudo comparativo do desenvolvimento motor de crianças filhas de mães chagásicas, observou-se que o tempo médio ao sentar, com base em uma amostra aleatória simples de 50 dessas crianças, foi de 6,6 meses. O desvio-padrão é de 0,95 meses. Sabe-se que na população em geral, uma criança senta, em média, aos 6 meses. Com base nessas informações, pode-se concluir que crianças filhas de mães chagásicas demoram mais a sentar? Faça o teste ao nível de 5%. 4 Exercício 13: Em um estudo para detectar as características de recém-nascidos que podem desenvolver a síndrome da morte súbita, um estudo prospectivo foi realizado em Oakland, Califórnia, entre 1960 e 1967. Uma das características estudadas foi a idade da mãe. Sabendo que aproximadamente 39% das mulheres desta região dão à luz com menos de 25 anos de idade, teste a hipótese de que a baixa idade materna pode ser um fator de risco para morte súbita se, neste estudo, de uma amostra aleatória simples de 44 bebês que tiveram morte súbita, 29 provinham de mães com menos de 25 anos de idade. Use = 1%. Exercício 14: “Os espectadores leigos fazem ressuscitação cardiopulmonar corretamente menos da metade das vezes,” de acordo com um artigo na USA Today, que observou que, em 662 casos, 278 foram feitos corretamente. Teste a afirmação do artigo, ao nível de 5% de significância. prop.test(x=278, n=662, p = 0.5,alternative = "less", conf.level = 1- 0.05) Código Extra Fictício para duas proporções: # colocar em “x” o número de “sucessos” das amostras I e II # colocar em n os tamanhos das amostras I e II prop.test(x=c(278,662-278), n=c(662,662), p = NULL, alternative = "less", conf.level = 1-0.05) Exercício 15: Para se avaliar o nível de tensão ocasionada por exames escolares, doze alunos foram escolhidos e sua pulsação medida antes e depois do exame Instante da medição Estudantes 1 2 3 4 5 6 7 8 9 10 11 12 Antes 87 78 85 93 76 80 82 77 91 74 76 79 Depois 83 84 79 88 75 81 74 71 78 73 76 71 Faça um teste, com nível de significância de 1%, para verificar se existe maior tensão (isto é, maior pulsação) antes da realização dos exames. Indique as suposições necessárias. instanteA<-c(87,78,85,93,76,80,82,77,91,74,76,79) instanteD<-c(83,84,79,88,75,81,74,71,78,73,76,71) instanteDif<-instanteA-instanteD 5 t.test(instanteA,instanteD,alternative="less",paired=TRUE,conf.level=1 -0.01) # duas amostras antes e depois t.test(instanteDif,alternative="less",conf.level=1-0.01) # uma amostra das diferenças Exercício 16: Para verificar se duas populações têm a mesma média, amostras independentes foram retiradas. Sabendo que a população I é 𝑁𝑜𝑟𝑚𝑎𝑙(𝜇1, 25) e a população II 𝑁𝑜𝑟𝑚𝑎𝑙(𝜇1, 40), que conclusão pode ser tirada, ao nível de 2%? Os valores obtidos foram: População Dados I 12 14 15 14 13 17 14 13 II 13 17 14 13 16 17 18 16 𝑯𝟎: 𝝁𝑫 = 𝟎 contra 𝑯𝟏: 𝝁𝑫 ≠ 𝟎 e 𝑹𝑪 = {𝒅 ∈ ℝ: 𝒅 < −𝟔, 𝟔𝟒 𝒐𝒖 𝒅 > 𝟔, 𝟔𝟒}. 𝑪𝒐𝒎𝒐 𝒅𝒐𝒃𝒔 = −𝟏, 𝟓𝟎 ∉ 𝑹𝑪, 𝒏ã𝒐 𝒓𝒆𝒋𝒆𝒊𝒕𝒆 𝑯𝟎. Exercício 17: Para comparar as médias de duas populações Normais, amostras aleatórias foram obtidas. Sabe-se que as variâncias populacionais são diferentes, sendo seus valores desconhecidos. Amostra I 7 9 3 8 11 5 9 Amostra II 2 7 5 15 9 16 8 O que pode ser dito a respeito das médias das populações, com 𝛼 = 0,05? Teste bilateral. Pela expressão dada no texto obtemos que o teste envolve a distribuição t-Student com 9 graus de liberdade, de tal forma que 𝑹𝑪 = {𝒕 ∈ ℝ: 𝒕 < −𝟐, 𝟐𝟔𝟐 𝒐𝒖 𝒕 > 𝟐, 𝟐𝟔𝟐}, 𝑪𝒐𝒎𝒐 𝒕𝒐𝒃𝒔 = −𝟎, 𝟔𝟔 ∉ 𝑹𝑪, 𝒏ã𝒐 𝒓𝒆𝒋𝒆𝒊𝒕𝒆 𝑯𝟎. Isto é, há evidências nos dados que as médias populacionais são iguais. # Teste para 2 medias variancias diferentes: t.test(AmostraI,AmostraII,alternative="two.sided",conf.level=1- 0.05,var.equal=FALSE) # duas amostras antes e depois Código Extra: # Testar para ver se a suposição de variancias diferentes é satisfatoria. 6 # Teste para 2 variancias: var.test(AmostraI, AmostraII, alternative = "two.sided",conf.level=1- 0.05) # Teste para 2 medias variancias iguais: t.test(AmostraI,AmostraII,alternative="two.sided",conf.level=1- 0.05,var.equal=TRUE) # duas amostras I e II Exercício 18: Supondo que 𝐹~(𝑎, 𝑏), encontre 𝑥𝑐 tal que: 𝑃(𝑋 ≥ 𝑥𝑐) = 0,05 com 𝑎 = 18 e 𝑏 = 3. a. 𝑃(𝑋 > 𝑥𝑐) = 0,05 com 𝑎 = 3 e 𝑏 = 18. 3,16. b. 𝑃(𝑋 > 𝑥𝑐) = 0,05 com 𝑎 = 180 e 𝑏 = 192. 1,97. c. 𝑃(𝑋 ≥ 𝑥𝑐) = 0,95 com 𝑎 = 5 e 𝑏 = 12. 0,21. d. 𝑃(𝑋 ≥ 𝑥𝑐) = 0,95 com 𝑎 = 30 e 𝑏 = 40. 0,56. Exercício 19: Uma panificadora produz determinado tipo de pão, cujo peso médio é de 190 gramas, com desvio padrão de 18 gramas. Devido a mudanças na política cambial, que ocasionou aumento no preço do trigo, alguns ingredientes da receita foram substituídos. Uma equipe do governo resolveu verificar se a variabilidade no peso do produto aumentou e escolheu, aleatoriamente, 16 unidades, medindo o peso de cada uma. O peso médio obtido da amostra foi de 102 gramas e o desvio padrão foi de 24,5 gramas. Qual a conclusão para 𝛼 = 10%? 𝑯𝟎: 𝝈𝟐 = 𝟑𝟐𝟒 contra 𝑯𝟏: 𝝈𝟐 > 𝟑𝟐𝟒. Use qui-quadrado com 15 graus de liberdade para obter 𝑹𝑪 = {𝒗 ∈ ℝ: 𝒗 > 𝟐𝟐, 𝟑𝟏}. 𝑪𝒐𝒎𝒐 𝒗𝒐𝒃𝒔 = 𝟐𝟕, 𝟕𝟗 ∈ 𝑹𝑪, 𝒏ã𝒐 𝒂𝒄𝒆𝒊𝒕𝒆 𝑯𝟎. Ou seja, os dados fornecem evidências que a heterogeneidade aumentou. Nas questões NÃO NUMÉRICAS verifique, de acordo com a instrução de cada uma delas, se os itens são VERDADEIROS ou FALSOS. Exercício 20: Considere as seguintes afirmativas acerca de um teste de hipótese: Ⓞ O erro tipo I é definido como a probabilidade de não rejeitar a hipótese nula quando a hipótese nula é falsa. F. Ⓞ O poder do teste é definido como a probabilidade de não rejeitar a hipótese nula quando a hipótese nula é verdadeira. F. 7 Ⓞ O erro tipo II é definido como a probabilidade de não rejeitar a hipótese nula quando a hipótese alternativa é verdadeira. V. Ⓞ O p-valor de um teste é a probabilidade, sob a hipótese nula, de obter um valor da estatística ser, pelo menos, tão extremo quanto o valor observado. V. Ⓞ Se um intervalo de confiança de 95% para a média amostral, calculado a partir de uma amostra aleatória, excluir o valor 0, pode-se rejeitar a hipótese de que a média populacional seja igual a 0 ao nível de significância de 5%. F. Exercício 21: Com relação a testes de hipóteses, julgue as afirmativas: Ⓞ Em um teste de hipóteses, comete-se um erro do tipo I quando se rejeita uma hipótese nula verdadeira. V. Ⓞ O poder de um teste de hipóteses é medido pela probabilidade de se cometer o erro tipo II. F. Ⓞ A soma das probabilidades dos erros tipo I e tipo II é igual a 1. F. Ⓞ Quanto maior for o nível de significância de um teste de hipóteses maior será o valor- p a ele associado. F. Ⓞ Se o valor-p de um teste de hipóteses for igual 0,015, a hipótese nula será rejeitada a 5%, mas não a 1%. V. Exercício 22: Seja Xn X X X ,........, , , 3 2 1 uma amostra aleatória de tamanho n de uma população normal com média e variância 2 . Julgue as afirmativas: Ⓞ A probabilidade de a média populacional, , estar contida no intervalo de confiança ] ,196 , ,196 [ n X n X é igual a 95%. Ⓞ Se a variância 2 é desconhecida, o intervalo de confiança de 95% para a média será ] , [ n s t X n s t X c c , em que s é o desvio padrão da amostra, ct é calculado de forma que ,0 95 ) (| | ct P t , e t segue uma distribuição de Student com n -1 graus de liberdade. 8 Ⓞ Se construirmos vários intervalos de confiança para a média com amostras de idêntico tamanho, mesma variância 2 e mesma margem de confiança, estes terão extremos aleatórios, mas todos terão a mesma amplitude. Ⓞ Num teste de hipótese: 0 0 : H contra 0 : Ha , se o intervalo de confiança estimado para a média não contiver o valor de 0 , então deve-se aceitar a hipótese de que 0 . Ⓞ Se a amostra aleatória Xn X X X ,........, , , 3 2 1 não provém de uma distribuição normal, não se pode construir um intervalo de confiança para a média , ainda que a amostra seja muito grande. Exercício 23: Seja X uma variável aleatória normalmente distribuída com média e variância conhecida 2 =1, da qual se obtém a amostra aleatória X1, X2, ..., Xn (com n observações). É correto afirmar que: Ⓞ A média amostral é uma variável aleatória normalmente distribuída com média e variância 1/n. Ⓞ A probabilidade de o intervalo de confiança ] ,196/ , ,196/ [ n n X X conter a média da população, , é de 95%. Ⓞ A probabilidade de o intervalo de confiança ] ,196/ , ,196/ [ n n X X conter a média amostral é de 95%. Ⓞ O intervalo de 95% para a média populacional independe do tamanho da amostra. Ⓞ Em um intervalo de confiança de 95% para a média populacional, μ, espera-se que, extraindo-se todas as amostras de mesmo tamanho dessa população, esse intervalo conterá μ 95% das vezes. Exercício 24: Indique se as seguintes considerações sobre a teoria dos testes de hipótese são verdadeiras (V) ou falsas (F). Ⓞ O erro do tipo II é definido como a probabilidade de não se rejeitar uma hipótese nula quando esta for falsa e o erro do tipo I é definido como a probabilidade de se rejeitar a hipótese nula quando esta for verdadeira. V. 9 Ⓞ No teste de hipótese para proporções, se a variância da proporção populacional for desconhecida, a estatística t de Student com 𝑛 − 1 graus de liberdade (n é o tamanho da amostra) é a indicada para o teste. V. Ⓞ Num teste de hipótese bi-caudal, o valor-p (ou valor de probabilidade) é igual a duas vezes a probabilidade da região extrema delimitada pelo valor calculado da estatística do teste. V. Ⓞ Não se pode realizar um teste de hipótese para a variância populacional pois a estatística do teste, que segue uma distribuição Qui-quadrado com n -1 graus de liberdade (n é tamanho da amostra), não é simétrica. F. Ⓞ No teste de hipótese para a média (H0: 𝜇 = 0 contra Ha: : 𝜇 ≠ 0), ao nível de significância , se o intervalo de confiança com 1- de probabilidade não contiver 𝜇 = 0, não se poderá rejeitar H0. . F. Exercício 25: Uma máquina está sendo examinada com o objetivo de substituir a máquina antiga de certa indústria. Segundo o fabricante da nova máquina, a proporção (P) de peças defeituosas produzida é de 3% ou menos. Uma amostra de 2.000 peças foi examinada e foram encontradas 74 peças defeituosas. Ⓞ As hipóteses para um teste estatístico de hipóteses devem ser H0: P = 0,03 e HA: P < 0,03. Ⓞ Ao realizarmos o teste de hipóteses para o problema, ao nível de significância de 5%, a hipótese nula deve ser rejeitada. Ⓞ Utilizando a proporção de peças defeituosas encontradas na amostra, a estimativa por intervalo para a verdadeira proporção de peças defeituosas produzida pela nova máquina, utilizando uma confiança de 95%, é ( 2,87%; 4,53%). Ⓞ Admitindo que a verdadeira proporção de peças defeituosas seja 3%, seria necessário uma amostra de 3.000 peças para que o erro máximo admissível entre a proporção estimada e a verdadeira não excedesse a 1%, com probabilidade de 95%. Ⓞ Se as probabilidade de que um intervalo de confiança contenha o verdadeiro parâmetro populacional é igual a (1 - ), isto significa que se retirássemos um número infinito de amostras da população em estudo e se para cada uma das amostras 10 calculássemos o intervalo de confiança do parâmetro , então em (1 - )% destes intervalos conteriam o verdadeiro parâmetro . Exercício 26: A vida útil de um tubo de televisão tem distribuição Normal com desvio padrão (conhecido) de 500 horas. O fabricante afirma que a vida útil média dos tubos é de, no mínimo, 9.000 horas. Sabendo-se que a vida útil média encontrada para uma amostra aleatória de 16 tubos foi de 8.800 horas, podemos afirmar que: Ⓞ Para verificar a veracidade da informação do fabricante através de um teste estatístico de hipóteses, as hipóteses são: Hipótese nula: H0: = 9.000 horas Hipótese alternativa : H1: > 9.000 horas Ⓞ Ao nível de significância de 5%, não podemos contestar a afirmação do fabricante. Ⓞ Se a informação amostral fosse obtida de uma amostra de 36 tubos, ao nível de significância de 2,5% também não podemos contestar a afirmação do fabricante. Ⓞ O tamanho mínimo da amostra para uma estimativa por intervalo da vida média dos tubos deveria ser de 50 tubos, de modo que o erro da estimativa não excedesse a 100 horas, com uma probabilidade de 95%. Ⓞ Caso desconheçamos o desvio padrão populacional é impossível testar a validade da afirmação do fabricante. Exercício 27: O representante de um grupo comunitário informa a uma pessoa interessada em estabelecer um centro comercial que a renda média familiar na área é de R$ 15.000. Suponha que, para a área em questão, seja possível admitir que a renda média familiar tem distribuição aproximadamente normal, e que se possa aceitar o desvio- padrão como sendo R$ 2.000 (com base em um estudo anterior). Para uma amostra aleatória de 16 famílias, a renda média familiar foi de R$ 15.500. O centro comercial só será construído se o nível médio de renda familiar () for maior que o informado. Ⓞ A hipótese nula deve ser H R 0 000 : $15. . Ⓞ A hipótese alternativa deve ser H R 1 000 : $15. . Ⓞ Não pode ser realizado qualquer teste pois o número de elementos da amostra é pequeno. 11 Ⓞ A estatística que deve ser utilizada para a elaboração do teste é a Z, que tem distribuição N(0,1). Ⓞ Um teste feito ao nível de significância de 5% permite concluir que a condição para a construção do centro será satisfeita. Exercício 28: Com respeito aos testes de hipóteses pode-se afirmar que: Ⓞ O nível de significância de um teste é a probabilidade de cometer erro do tipo I, isto é, a probabilidade de aceitar a hipótese nula, quando ela é falsa. . F. Ⓞ O valor 1 - é o poder do teste, onde é a probabilidade do erro do tipo II, isto é, a probabilidade de rejeitar a hipótese nula quando ela é verdadeira. . F. Ⓞ Se x 1,...,xn é uma amostra aleatória de uma população normal com média e variância conhecida 2, para testar H0 : 0 contra H1 : 0 usa-se a distribuição t de Student. . F. Ⓞ Dada uma população de indivíduos de tamanho 𝑛, deseja-se verificar se a população de empregados é de 0,5. Esta verificação pode ser feita através do teste de hipóteses: H0 : p 1 2 / contra H1 : p 1 2 / usando-se, para tanto, a distribuição normal como aproximação da binomial. V. Ⓞ Uma empresa afirma que 60% dos seus empregados são ligados à produção. Para verificar esta afirmativa, o sindicato decide usar uma amostra de 200 trabalhadores e observa que 105 deles estão ligados à produção. Ao nível de significância de 5% pode-se afirmar que o número de empregados ligados à produção é inferior a 60%. V. Exercício 29: Exercício 30: Exercício 31: 12 Exercício 32: -
Envie sua pergunta para a IA e receba a resposta na hora
Recomendado para você
16
Slide - Revisão - Estatística 2 - 2024-1
Estatística 2
UFMG
42
Slide - Aula 22 - Regressão Linear Simples - Estatística 2 - 2024-1
Estatística 2
UFMG
5
Lista - Regressão Linear Simples 2021-2
Estatística 2
UFMG
1
Exercícios - Estatística 2 2021 2
Estatística 2
UFMG
58
Projeto - Estatística 2 - 2024-1
Estatística 2
UFMG
3
Prova - Estatística 2 - 2023-2
Estatística 2
UFMG
60
Slide - Aula 23 - Teste de Significância da Reg - Estatística 2 - 2024-1
Estatística 2
UFMG
40
Slide - Aula 15 - Teste Qui-quadrado de Indepenência - 2024-1
Estatística 2
UFMG
7
Prova - Estatística 2 - 2023-1
Estatística 2
UFMG
21
Lista - Estatística 2 2021 2
Estatística 2
UFMG
Texto de pré-visualização
1 DISCIPLINA: ESTATÍSTICA II (EST002) 2ª SEM./2021 Metaturma Módulo 4 PROF.: THIAGO REZENDE DEPTO. ESTATÍSTICA – UFMG DATA DE ENTREGA: 25/01/2022 Lista de Exercícios Exercício 1: Sabe-se que o tempo de vida de certo equipamento na indústria automobilística tem distribuição Gaussiana com média e variância populacionais desconhecidas. Uma amostra de 31 equipamentos forneceu ∑ 31 (𝑋𝑖 − 𝑋̅)2 𝑖=1 = 30,30. Construa um intervalo de confiança de 95% e 98% para a variância populacional. Exercício 2: Considere os seguintes resultados, referentes a duas amostras aleatórias independentes tomadas de duas populações: AMOSTRA 1 𝑛1 = 50 𝑋̅1 = 13,6 𝜎1 = 2,2 AMOSTRA 2 𝑛2 = 35 𝑋̅2 = 11,6 𝜎2 = 3,0 a. Qual é a estimação pontual da diferença entre as duas médias populacionais? b. Construa um intervalo de confiança de 90% relativo à diferença entre as duas médias populacionais; c. Construa um intervalo de confiança de 95% relativo à diferença entre as duas médias populacionais. Use o software R! Exercício 3: Um estudo realizado pela Cornell University dos diferenciais de salário entre homens e mulheres relatou que uma das razões pelas quais os salários dos homens são mais altos que os das mulheres é o fato de os homens tenderem a ter mais anos de experiência no trabalho que as mulheres (Bussiness Week, agosto de 2000). Suponha que os seguintes resumos amostrais apresentem os anos de experiência correspondentes a cada grupo: HOMENS 𝑛𝐻 = 100 𝑋̅𝐻 = 14,9 𝑎𝑛𝑜𝑠 𝜎𝐻 = 5,2 𝑎𝑛𝑜𝑠 MULHERES 𝑛𝑀 = 85 𝑋̅𝑀 = 10,3 𝑎𝑛𝑜𝑠 𝜎𝑀 = 3,8 𝑎𝑛𝑜𝑠 a. Qual a estimação pontual da diferença entre as duas médias populacionais? b. Com 95% de confiança, qual é a margem de erro? c. Qual é a estimação por intervalo de confiança da diferença entre as duas médias populacionais? d. Pode-se concluir que os homens apresentam salários mais altos que as mulheres? 2 Use o software R! Exercício 4: Considere os seguintes resultados, referentes a duas amostras aleatórias independentes tomadas de duas populações: AMOSTRA 1 𝑛1 = 20 𝑋̅1 = 22,5 𝑆1 = 2,5 AMOSTRA 2 𝑛2 = 30 𝑋̅2 = 20,1 𝑆2 = 4,8 a. Qual é a estimação pontual da diferença entre as duas médias populacionais? b. Construa um intervalo de confiança de 95% relativo à diferença entre as duas médias populacionais, considerando 𝜎1 2 = 𝜎2 2. c. Construa um intervalo de confiança de 95% relativo à diferença entre as duas médias populacionais, considerando 𝜎1 2 ≠ 𝜎2 2. Exercício 5: Periodicamente, os clientes da Merrill Lynch são solicitados a avaliar os consultores e os serviços financeiros dessa empresa (2000 Merrill Lynch Client Satisfaction Survey). Avaliações mais elevadas sobre a satisfação do cliente indicam um atendimento melhor, sendo 7 a classificação máxima para os serviços. Amostras independentes de avaliações do serviço prestado por dois consultores financeiros estão resumidos na tabela abaixo. Os consultores 𝐴 tem dez anos de experiência, ao passo que os consultores 𝐵 tem um ano de experiência. CONSULTOR A 𝑛𝐴 = 16 𝑋̅𝐴 = 6,82 𝑆𝐴 = 0,64 CONSULTOR B 𝑛𝐵 = 10 𝑋̅𝐵 = 6,25 𝑆𝐵 = 0,75 a. Qual é a estimação pontual da diferença entre as duas médias populacionais? b. Construa um intervalo de confiança de 95% relativo à diferença entre as duas médias populacionais, considerando 𝜎1 2 = 𝜎2 2. c. Construa um intervalo de confiança de 95% relativo à diferença entre as duas médias populacionais, considerando 𝜎1 2 ≠ 𝜎2 2. d. Pode-se concluir que os consultores com mais experiência apresentam uma melhor avaliação do serviço prestado? Exercício 6: A fim de fazer um levantamento da disponibilidades de vagas para a 1ª série do ensino médio, a secretaria de educação de Minas Gerais sorteou 50 escolas por todo o estado e observou o número de alunos matriculados nessa série em cada uma delas. Os resultados foram: 77, 60, 78, 75, 148, 93, 129, 141, 81, 64, 102, 56, 136, 22, 124, 37, 89, 62, 24, 41, 112, 103, 116, 148, 60, 32, 50, 115, 49, 81, 31, 75, 81, 31, 33, 29, 22, 48, 25, 121, 101, 23, 36, 54, 43, 86, 142, 65, 114 e 135. Construa um intervalo de confiança de 95% para a média e variância do número de vagas. Use o software R! Exercício 7: Sendo 𝑋 uma variável aleatória com distribuição de probabilidade Bernoulli com 𝑝 = 0,7, para uma amostra de tamanho 4, determine a função de probabilidade da média amostral. 3 Exercício 8: Deseja-se coletar uma amostra de uma variável aleatória 𝑋 com distribuição Normal de média desconhecida e variância 30. Qual deve ser o tamanho da amostra para que, com 0,92 de probabilidade, a média amostral não seja diferente da média da população por mais de 3 unidades. Exercício 9: Em um levantamento preliminar feito em uma grande favela à pergunta "Quantas pessoas residem no barraco?" obteve-se a seguinte distribuição de respostas: Nº de residências 𝟐 𝟑 𝟒 𝟓 𝟔 𝟕 𝟖 Frequência 5 280 517 683 418 103 24 Calcule a média e o desvio padrão da variável "número de residentes no barraco" e, com base nesta amostra obtenha um intervalo de confiança de 95% para a média populacional. Use o software R! Exercício 10: Numa pesquisa de mercado, deseja-se estimar a proporção de pessoas que compram o sabonete Bom-cheiro. a. A partir da informação adicional de que a aceitação do sabonete Bom-cheiro é no mínimo 0,8, qual deve ser o tamanho da amostra? b. Decide-se colher uma amostra de tamanho 81. Qual o erro máximo que comete-se com probabilidade 0,9? c. Para a amostra de tamanho 81, qual a probabilidade de que o erro máximo seja 0,08? Exercício 11: Sabe-se que em indivíduos sadios quanto à visão, a pressão intra-ocular (em mmHg) pode ser aproximada por uma distribuição Normal com média 20 e desvio-padrão 2. Um pesquisador, desejando comprovar se há alteração na pressão intra-ocular em pacientes com glaucoma, seleciona uma amostra aleatória simples de 25 indivíduos portadores do problema. Obtém, com base nessa amostra, uma média igual a 21,5mmHg. (Considere que o desvio-padrão não é alterado e conhecido). Os dados apoiam a conjectura do pesquisador? a) Formule as hipóteses, calcule a estatística de teste e tire as conclusões ao nível = 5%. b) Calcule também um Intervalo de 95% de Confiança para a pressão intra-ocular média em indivíduos com glaucoma, interprete este intervalo e utilize-o para verificar novamente se a conjectura do pesquisador estava correta. Exercício 12: Num estudo comparativo do desenvolvimento motor de crianças filhas de mães chagásicas, observou-se que o tempo médio ao sentar, com base em uma amostra aleatória simples de 50 dessas crianças, foi de 6,6 meses. O desvio-padrão é de 0,95 meses. Sabe-se que na população em geral, uma criança senta, em média, aos 6 meses. Com base nessas informações, pode-se concluir que crianças filhas de mães chagásicas demoram mais a sentar? Faça o teste ao nível de 5%. Exercício 13: Em um estudo para detectar as características de recém-nascidos que podem desenvolver a síndrome da morte súbita, um estudo prospectivo foi realizado em Oakland, Califórnia, entre 1960 e 1967. Uma das características estudadas foi a idade da mãe. Sabendo que aproximadamente 39% das mulheres desta região dão à luz com menos de 25 anos de idade, teste a hipótese de que a baixa idade materna pode ser um fator de risco para morte 4 súbita se, neste estudo, de uma amostra aleatória simples de 44 bebês que tiveram morte súbita, 29 provinham de mães com menos de 25 anos de idade. Use = 1%. Exercício 14: “Os espectadores leigos fazem ressuscitação cardiopulmonar corretamente menos da metade das vezes” de acordo com um artigo na USA Today, que observou que, em 662 casos, 278 foram feitos corretamente. Teste a afirmação do artigo, ao nível de 5% de significância. Exercício 15: Para se avaliar o nível de tensão ocasionada por exames escolares, doze alunos foram escolhidos e sua pulsação medida antes e depois do exame. Instante da medição Estudantes 1 2 3 4 5 6 7 8 9 10 11 12 Antes 87 78 85 93 76 80 82 77 91 74 76 79 Depois 83 84 79 88 75 81 74 71 78 73 76 71 Faça um teste, com nível de significância de 1%, para verificar se existe maior tensão (isto é, maior pulsação) antes da realização dos exames. Indique as suposições necessárias. Use o software R! Exercício 16: Para verificar se duas populações têm a mesma média, amostras independentes foram retiradas. Sabendo que a população I é 𝑁𝑜𝑟𝑚𝑎𝑙(𝜇1, 25) e a população II 𝑁𝑜𝑟𝑚𝑎𝑙(𝜇1, 40), que conclusão pode ser tirada, ao nível de 2%? Os valores obtidos foram: População Dados I 12 14 15 14 13 17 14 13 II 13 17 14 13 16 17 18 16 Use o software R! Exercício 17: Para comparar as médias de duas populações Normais, amostras aleatórias foram obtidas. Sabe-se que as variâncias populacionais são diferentes, sendo seus valores desconhecidos. Amostra I 7 9 3 8 11 5 9 Amostra II 2 7 5 15 9 16 8 O que pode ser dito a respeito das médias das populações, com 𝛼 = 0,05? Use o software R! Exercício 18: Supondo que 𝑋~𝐹(𝑎, 𝑏), encontre 𝑥𝑐 tal que: a. 𝑃(𝑋 ≥ 𝑥𝑐) = 0,05 com 𝑎 = 18 e 𝑏 = 3. b. 𝑃(𝑋 > 𝑥𝑐) = 0,05 com 𝑎 = 3 e 𝑏 = 18. c. 𝑃(𝑋 > 𝑥𝑐) = 0,05 com 𝑎 = 180 e 𝑏 = 192. d. 𝑃(𝑋 ≥ 𝑥𝑐) = 0,95 com 𝑎 = 5 e 𝑏 = 12. e. 𝑃(𝑋 ≥ 𝑥𝑐) = 0,95 com 𝑎 = 30 e 𝑏 = 40. 5 Use o software R! Exercício 19: Uma panificadora produz determinado tipo de pão, cujo peso médio é de 190 gramas, com desvio padrão de 18 gramas. Devido a mudanças na política cambial, que ocasionou aumento no preço do trigo, alguns ingredientes da receita foram substituídos. Uma equipe do governo resolveu verificar se a variabilidade no peso do produto aumentou e escolheu, aleatoriamente, 16 unidades, medindo o peso de cada uma. O peso médio obtido da amostra foi de 102 gramas e o desvio padrão foi de 24,5 gramas. Qual a conclusão para 𝛼 = 10%? Nas questões NÃO NUMÉRICAS verifique, de acordo com a instrução de cada uma delas, se os itens são VERDADEIROS ou FALSOS. Exercício 20: Considere as seguintes afirmativas acerca de um teste de hipótese: Ⓞ O erro tipo I é definido como a probabilidade de não rejeitar a hipótese nula quando a hipótese nula é falsa. Ⓞ O poder do teste é definido como a probabilidade de não rejeitar a hipótese nula quando a hipótese nula é verdadeira. Ⓞ O erro tipo II é definido como a probabilidade de não rejeitar a hipótese nula quando a hipótese alternativa é verdadeira. Ⓞ O p-valor de um teste é a probabilidade, sob a hipótese nula, de obter um valor da estatística pelo menos tão extremo quanto o valor observado. Ⓞ Se um intervalo de confiança de 95% para a média amostral, calculado a partir de uma amostra aleatória, excluir o valor 0, pode-se rejeitar a hipótese de que a média populacional seja igual a 0 ao nível de significância de 5%. Exercício 21: Com relação a testes de hipóteses, julgue as afirmativas: Ⓞ Em um teste de hipóteses, comete-se um erro do tipo I quando se rejeita uma hipótese nula verdadeira. Ⓞ O poder de um teste de hipóteses é medido pela probabilidade de se cometer o erro tipo II. Ⓞ A soma das probabilidades dos erros tipo I e tipo II é igual a 1. Ⓞ Quanto maior for o nível de significância de um teste de hipóteses maior será o valor- p a ele associado. Ⓞ Se o valor-p de um teste de hipóteses for igual 0,015, a hipótese nula será rejeitada a 5%, mas não a 1%. Exercício 22: Seja Xn X X X ,........, , , 3 2 1 uma amostra aleatória de tamanho n de uma população normal com média e variância 2 . Julgue as afirmativas: Ⓞ A probabilidade de a média populacional, , estar contida no intervalo de confiança ] ,196 , ,196 [ n X n X é igual a 95%. 6 Ⓞ Se a variância 2 é desconhecida, o intervalo de confiança de 95% para a média será ] , [ n s t X n s t X c c , em que s é o desvio padrão da amostra, ct é calculado de forma que ,0 95 ) (| | ct P t , e t segue uma distribuição de Student com 𝑛 − 1 graus de liberdade. Ⓞ Se construirmos vários intervalos de confiança para a média com amostras de idêntico tamanho, mesma variância 2 e mesma margem de confiança, estes terão extremos aleatórios, mas todos terão a mesma amplitude. Ⓞ Num teste de hipótese: 0 0 : H contra 0 : Ha , se o intervalo de confiança estimado para a média não contiver o valor de 0 , então deve-se aceitar a hipótese de que 0 . Ⓞ Se a amostra aleatória Xn X X X ,........, , , 3 2 1 não provém de uma distribuição normal, não se pode construir um intervalo de confiança para a média , ainda que a amostra seja muito grande. Exercício 23: Seja 𝑋 uma variável aleatória normalmente distribuída com média e variância conhecida 2 =1, da qual se obtém a amostra aleatória X1, X2, ..., Xn (com n observações). É correto afirmar que: Ⓞ A média amostral é uma variável aleatória normalmente distribuída com média e variância 1/n. Ⓞ A probabilidade de o intervalo de confiança ] ,196/ , ,196/ [ n n X X conter a média da população, , é de 95%. Ⓞ A probabilidade de o intervalo de confiança ] ,196/ , ,196/ [ n n X X conter a média amostral é de 95%. Ⓞ O intervalo de 95% para a média populacional independe do tamanho da amostra. Ⓞ Em um intervalo de confiança de 95% para a média populacional, μ, espera-se que, extraindo-se todas as amostras de mesmo tamanho dessa população, esse intervalo conterá μ 95% das vezes. Exercício 24: Indique se as seguintes considerações sobre a teoria dos testes de hipótese são verdadeiras (V) ou falsas (F). Ⓞ O erro do tipo II é definido como a probabilidade de não se rejeitar uma hipótese nula quando esta for falsa e o erro do tipo I é definido como a probabilidade de se rejeitar a hipótese nula quando esta for verdadeira. Ⓞ No teste de hipótese para proporções, se a variância da proporção populacional for desconhecida, a estatística t de Student com 𝑛 − 1 graus de liberdade (𝑛 é o tamanho da amostra) é a indicada para o teste. Ⓞ Num teste de hipótese bi-caudal, o valor-p (ou valor de probabilidade) é igual a duas vezes a probabilidade da região extrema delimitada pelo valor calculado da estatística do teste. 7 Ⓞ Não se pode realizar um teste de hipótese para a variância populacional pois a estatística do teste, que segue uma distribuição Qui-quadrado com n -1 graus de liberdade (𝑛 é tamanho da amostra), não é simétrica. Ⓞ No teste de hipótese para a média (H0: = 0 contra Ha: 0), ao nível de significância , se o intervalo de confiança com 1- de probabilidade não contiver = 0, não se poderá rejeitar H0. Exercício 25: Uma máquina está sendo examinada com o objetivo de substituir a máquina antiga de certa indústria. Segundo o fabricante da nova máquina, a proporção (P) de peças defeituosas produzida é de 3% ou menos. Uma amostra de 2.000 peças foi examinada e foram encontradas 74 peças defeituosas. Ⓞ As hipóteses para um teste estatístico de hipóteses devem ser H0: P = 0,03 e HA: P < 0,03. Ⓞ Ao realizarmos o teste de hipóteses para o problema, ao nível de significância de 5%, a hipótese nula deve ser rejeitada. Ⓞ Utilizando a proporção de peças defeituosas encontradas na amostra, a estimativa por intervalo para a verdadeira proporção de peças defeituosas produzida pela nova máquina, utilizando uma confiança de 95%, é ( 2,87%; 4,53%). Ⓞ Admitindo que a verdadeira proporção de peças defeituosas seja 3%, seria necessário uma amostra de 3.000 peças para que o erro máximo admissível entre a proporção estimada e a verdadeira não excedesse a 1%, com probabilidade de 95%. Ⓞ Se as probabilidade de que um intervalo de confiança contenha o verdadeiro parâmetro populacional é igual a (1 - ), isto significa que se retirássemos um número infinito de amostras da população em estudo e se para cada uma das amostras calculássemos o intervalo de confiança do parâmetro , então em (1 - )% destes intervalos conteriam o verdadeiro parâmetro . Exercício 26: A vida útil de um tubo de televisão tem distribuição Normal com desvio padrão (conhecido) de 500 horas. O fabricante afirma que a vida útil média dos tubos é de, no mínimo, 9.000 horas. Sabendo-se que a vida útil média encontrada para uma amostra aleatória de 16 tubos foi de 8.800 horas, podemos afirmar que: Ⓞ Para verificar a veracidade da informação do fabricante através de um teste estatístico de hipóteses, as hipóteses são: Hipótese nula: H0: = 9.000 horas Hipótese alternativa : H1: > 9.000 horas Ⓞ Ao nível de significância de 5%, não podemos contestar a afirmação do fabricante. Ⓞ Se a informação amostral fosse obtida de uma amostra de 36 tubos, ao nível de significância de 2,5% também não podemos contestar a afirmação do fabricante. Ⓞ O tamanho mínimo da amostra para uma estimativa por intervalo da vida média dos tubos deveria ser de 50 tubos, de modo que o erro da estimativa não excedesse a 100 horas, com uma probabilidade de 95%. Ⓞ Caso desconheçamos o desvio padrão populacional é impossível testar a validade da afirmação do fabricante. 8 Exercício 27: O representante de um grupo comunitário informa a uma pessoa interessada em estabelecer um centro comercial que a renda média familiar na área é de R$ 15.000. Suponha que, para a área em questão, seja possível admitir que a renda média familiar tem distribuição aproximadamente normal, e que se possa aceitar o desvio-padrão como sendo R$ 2.000 (com base em um estudo anterior). Para uma amostra aleatória de 16 famílias, a renda média familiar foi de R$ 15.500. O centro comercial só será construído se o nível médio de renda familiar () for maior que o informado. Ⓞ A hipótese nula deve ser H R 0 000 : $15. . Ⓞ A hipótese alternativa deve ser H R 1 000 : $15. . Ⓞ Não pode ser realizado qualquer teste pois o número de elementos da amostra é pequeno. Ⓞ A estatística que deve ser utilizada para a elaboração do teste é a Z, que tem distribuição N(0,1). Ⓞ Um teste feito ao nível de significância de 5% permite concluir que a condição para a construção do centro será satisfeita. Exercício 28: Com respeito aos testes de hipóteses pode-se afirmar que: Ⓞ O nível de significância de um teste é a probabilidade de cometer erro do tipo I, isto é, a probabilidade de aceitar a hipótese nula, quando ela é falsa. Ⓞ O valor 1 - é o poder do teste, onde é a probabilidade do erro do tipo II, isto é, a probabilidade de rejeitar a hipótese nula quando ela é verdadeira. Ⓞ Se x 1,...,xn é uma amostra aleatória de uma população normal com média e variância conhecida 2, para testar H0 : 0 contra H1 : 0 usa-se a distribuição t de Student. Ⓞ Dada uma população de indivíduos de tamanho n, deseja-se verificar se a população de empregados é de 0,5. Esta verificação pode ser feita através do teste de hipóteses: H0 : p 1 2 / contra H1 : p 1 2 / usando-se, para tanto, a distribuição normal como aproximação da binomial. Ⓞ Uma empresa afirma que 60% dos seus empregados são ligados à produção. Para verificar esta afirmativa, o sindicato decide usar uma amostra de 200 trabalhadores e observa que 105 deles estão ligados à produção. Ao nível de significância de 5% pode-se afirmar que o número de empregados ligados à produção é inferior a 60%. Exercício 29: Suponha que tenhamos razões para crer que as notas obtidas por estudantes de escolas públicas sejam menores que as notas obtidas por estudantes de escolas particulares, ao tomarem o exame vestibular para uma Universidade. Para testar essa hipótese, foram selecionadas duas amostras de estudantes que prestaram o vestibular, suas médias gerais foram anotadas e obteve-se a tabela a seguir. 9 Teste a hipótese que as duas populações são homogêneas, para o nível de significância 𝛼 = 0,01. Obtenha o valor-p. Exercício 30: Duas novas drogas vão ser testadas em 160 pessoas portadoras de rinite alérgica. Metade das pessoas recebe a droga A e a outra metade recebe a droga B. Obtém-se a tabela abaixo. Teste a hipótese de que as duas drogas são igualmente eficazes para tratar a doença. Use o software R! Exercício 31: Investigando a “fidelidade” de consumidores de um produto, obteve-se uma amostra de 200 homens e 200 mulheres. Foram classificados como tendo alto grau de fidelidade 100 homens e 120 mulheres. Os dados fornecem evidência de possíveis diferenças de grau de fidelidade entre sexos? Exercício 32: Uma pesquisa sobre a qualidade de certo produto foi realizada enviando-se questionários a donas-de-casa pelo correio. Aventando-se a possibilidade de que os respondentes voluntários tenham um particular viés de respostas, fizeram-se mais duas tentativas com os não-respondentes. Os resultados estão indicados abaixo. Você acha que existe relação entre a resposta e o número de tentativas? Use o software R! 1 DISCIPLINA: ESTATÍSTICA II (EST002) 2ª SEM./2021 Metaturma Módulo 4 PROF.: THIAGO REZENDE DEPTO. ESTATÍSTICA – UFMG Gabarito Lista de Exercícios Exercício 1: Sabe-se que o tempo de vida de certo equipamento na indústria automobilística tem distribuição Gaussiana com média e variância populacionais desconhecidas. Uma amostra de 31 equipamentos forneceu ∑ 31 (𝑋𝑖 − 𝑋̅)2 𝑖=1 = 30,30. Construa um intervalo de confiança de 95% e 98% para a variância populacional. Exercício 2: Considere os seguintes resultados, referentes a duas amostras aleatórias independentes tomadas de duas populações: AMOSTRA 1 𝑛1 = 50 𝑋̅1 = 13,6 𝜎1 = 2,2 AMOSTRA 2 𝑛2 = 35 𝑋̅2 = 11,6 𝜎2 = 3,0 a. Qual é a estimação pontual da diferença entre as duas médias populacionais? 2. b. Construa um intervalo de confiança de 90% relativo à diferença entre as duas médias populacionais; 1,348. c. Construa um intervalo de confiança de 95% relativo à diferença entre as duas médias populacionais. [0,652; 3,348]. Exercício 3: Um estudo realizado pela Cornell University dos diferenciais de salário entre homens e mulheres relatou que uma das razões pelas quais os salários dos homens são mais altos que os das mulheres é o fato de os homens tenderem a ter mais anos de experiência no trabalho que as mulheres (Bussiness Week, agosto de 2000). Suponha que os seguintes resumos amostrais apresentem os anos de experiência correspondentes a cada grupo: HOMENS 𝑛𝐻 = 100 𝑋̅𝐻 = 14,9 𝑎𝑛𝑜𝑠 𝜎𝐻 = 5,2 𝑎𝑛𝑜𝑠 MULHERES 𝑛𝑀 = 85 𝑋̅𝑀 = 10,3 𝑎𝑛𝑜𝑠 𝜎𝑀 = 3,8 𝑎𝑛𝑜𝑠 a. Qual a estimação pontual da diferença entre as duas médias populacionais? 4,6. b. Com 95% de confiança, qual é a margem de erro? 1,827. 2 Qual é a estimação por intervalo de confiança da diferença entre as duas médias populacionais? [2,773; 6,427]. c. Pode-se concluir que os homens apresentam salários mais altos que as mulheres? Sim. Exercício 4: Considere os seguintes resultados, referentes a duas amostras aleatórias independentes tomadas de duas populações: AMOSTRA 1 𝑛1 = 20 𝑋̅1 = 22,5 𝑆1 = 2,5 AMOSTRA 2 𝑛2 = 30 𝑋̅2 = 20,1 𝑆2 = 4,8 a. Qual é a estimação pontual da diferença entre as duas médias populacionais? 2,4. b. Construa um intervalo de confiança de 95% relativo à diferença entre as duas médias populacionais, considerando 𝜎1 2 = 𝜎2 2. [-0,599; 5,399]. c. Construa um intervalo de confiança de 95% relativo à diferença entre as duas médias populacionais, considerando 𝜎1 2 ≠ 𝜎2 2. 0 Exercício 5: Periodicamente, os clientes da Merrill Lynch são solicitados a avaliar os consultores e os serviços financeiros dessa empresa (2000 Merrill Lynch Client Satisfaction Survey). Avaliações mais elevadas sobre a satisfação do cliente indicam um atendimento melhor, sendo 7 a classificação máxima para os serviços. Amostras independentes de avaliações do serviço prestado por dois consultores financeiros estão resumidos na tabela abaixo. Os consultores 𝐴 tem dez anos de experiência, ao passo que os consultores 𝐵 tem um ano de experiência. CONSULTOR A 𝑛𝐴 = 16 𝑋̅𝐴 = 6,82 𝑆𝐴 = 0,64 CONSULTOR B 𝑛𝐵 = 10 𝑋̅𝐵 = 6,25 𝑆𝐵 = 0,75 a. Qual é a estimação pontual da diferença entre as duas médias populacionais? b. Construa um intervalo de confiança de 95% relativo à diferença entre as duas médias populacionais, considerando 𝜎1 2 = 𝜎2 2. c. Construa um intervalo de confiança de 95% relativo à diferença entre as duas médias populacionais, considerando 𝜎1 2 ≠ 𝜎2 2. d. Pode-se concluir que os consultores com mais experiência apresentam uma melhor avaliação do serviço prestado? Exercício 6: A fim de fazer um levantamento da disponibilidades de vagas para a 1ª série do ensino médio, a secretaria de educação de Minas Gerais sorteou 50 escolas por todo o estado e observou o número de alunos matriculados nessa série em cada uma delas. Os resultados foram: 77, 60, 78, 75, 148, 93, 129, 141, 81, 64, 102, 56, 136, 22, 124, 37, 89, 62, 24, 41, 112, 103, 116, 148, 60, 32, 50, 115, 49, 81, 31, 75, 81, 31, 33, 29, 22, 48, 25, 121, 101, 23, 36, 54, 43, 86, 142, 65, 114 e 135. Construa um intervalo de confiança de 95% para a média e variância do número de vagas. 3 Exercício 7: Sendo 𝑋 uma variável aleatória com distribuição de probabilidade Bernoulli com 𝑝 = 0,7, para uma amostra de tamanho 4, determine a função de probabilidade da média amostral. 𝑿̅~𝑵(𝟎, 𝟕; 𝟎, 𝟎𝟓𝟐𝟓). Exercício 8: Deseja-se coletar uma amostra de uma variável aleatória 𝑋 com distribuição Normal de média desconhecida e variância 30. Qual deve ser o tamanho da amostra para que, com 0,92 de probabilidade, a média amostral não seja diferente da média da população por mais de 3 unidades. 11. Exercício 9: Em um levantamento preliminar feito em uma grande favela à pergunta "Quantas pessoas residem no barraco?" obteve-se a seguinte distribuição de respostas: Nº de residências 𝟐 𝟑 𝟒 𝟓 𝟔 𝟕 𝟖 Frequência 5 280 517 683 418 103 24 Calcule a média e o desvio padrão da variável "número de residentes no barraco" e, com base nesta amostra obtenha um intervalo de confiança de 95% para a média populacional. Exercício 10: Numa pesquisa de mercado, deseja-se estimar a proporção de pessoas que compram o sabonete Bom-cheiro. a. A partir da informação adicional de que a aceitação do sabonete Bom-cheiro é no mínimo 0,8 e de que a margem de erro é de, no máximo, 5%, qual deve ser o tamanho da amostra? 173. b. Decide-se colher uma amostra de tamanho 81. Qual o erro máximo que comete- se com probabilidade 0,9? 0,091. c. Para a amostra de tamanho 81, qual a probabilidade de que o erro máximo seja 0,08? 0,964. Exercício 11: Sabe-se que em indivíduos sadios quanto à visão, a pressão intra-ocular (em mmHg) pode ser aproximada por uma distribuição Normal com média 20 e desvio- padrão 2. Um pesquisador, desejando comprovar se há alteração na pressão intra-ocular em pacientes com glaucoma, seleciona uma amostra aleatória simples de 25 indivíduos portadores do problema. Obtém, com base nessa amostra, uma média igual a 21,5mmHg. (Considere que o desvio-padrão não é alterado e conhecido). Os dados apoiam a conjectura do pesquisador? a) Formule as hipóteses, calcule a estatística de teste e tire as conclusões ao nível = 5%. b) Calcule também um Intervalo de 95% de Confiança para a pressão intra-ocular média em indivíduos com glaucoma, interprete este intervalo e utilize-o para verificar novamente se a conjectura do pesquisador estava correta. Exercício 12: Num estudo comparativo do desenvolvimento motor de crianças filhas de mães chagásicas, observou-se que o tempo médio ao sentar, com base em uma amostra aleatória simples de 50 dessas crianças, foi de 6,6 meses. O desvio-padrão é de 0,95 meses. Sabe-se que na população em geral, uma criança senta, em média, aos 6 meses. Com base nessas informações, pode-se concluir que crianças filhas de mães chagásicas demoram mais a sentar? Faça o teste ao nível de 5%. 4 Exercício 13: Em um estudo para detectar as características de recém-nascidos que podem desenvolver a síndrome da morte súbita, um estudo prospectivo foi realizado em Oakland, Califórnia, entre 1960 e 1967. Uma das características estudadas foi a idade da mãe. Sabendo que aproximadamente 39% das mulheres desta região dão à luz com menos de 25 anos de idade, teste a hipótese de que a baixa idade materna pode ser um fator de risco para morte súbita se, neste estudo, de uma amostra aleatória simples de 44 bebês que tiveram morte súbita, 29 provinham de mães com menos de 25 anos de idade. Use = 1%. Exercício 14: “Os espectadores leigos fazem ressuscitação cardiopulmonar corretamente menos da metade das vezes,” de acordo com um artigo na USA Today, que observou que, em 662 casos, 278 foram feitos corretamente. Teste a afirmação do artigo, ao nível de 5% de significância. prop.test(x=278, n=662, p = 0.5,alternative = "less", conf.level = 1- 0.05) Código Extra Fictício para duas proporções: # colocar em “x” o número de “sucessos” das amostras I e II # colocar em n os tamanhos das amostras I e II prop.test(x=c(278,662-278), n=c(662,662), p = NULL, alternative = "less", conf.level = 1-0.05) Exercício 15: Para se avaliar o nível de tensão ocasionada por exames escolares, doze alunos foram escolhidos e sua pulsação medida antes e depois do exame Instante da medição Estudantes 1 2 3 4 5 6 7 8 9 10 11 12 Antes 87 78 85 93 76 80 82 77 91 74 76 79 Depois 83 84 79 88 75 81 74 71 78 73 76 71 Faça um teste, com nível de significância de 1%, para verificar se existe maior tensão (isto é, maior pulsação) antes da realização dos exames. Indique as suposições necessárias. instanteA<-c(87,78,85,93,76,80,82,77,91,74,76,79) instanteD<-c(83,84,79,88,75,81,74,71,78,73,76,71) instanteDif<-instanteA-instanteD 5 t.test(instanteA,instanteD,alternative="less",paired=TRUE,conf.level=1 -0.01) # duas amostras antes e depois t.test(instanteDif,alternative="less",conf.level=1-0.01) # uma amostra das diferenças Exercício 16: Para verificar se duas populações têm a mesma média, amostras independentes foram retiradas. Sabendo que a população I é 𝑁𝑜𝑟𝑚𝑎𝑙(𝜇1, 25) e a população II 𝑁𝑜𝑟𝑚𝑎𝑙(𝜇1, 40), que conclusão pode ser tirada, ao nível de 2%? Os valores obtidos foram: População Dados I 12 14 15 14 13 17 14 13 II 13 17 14 13 16 17 18 16 𝑯𝟎: 𝝁𝑫 = 𝟎 contra 𝑯𝟏: 𝝁𝑫 ≠ 𝟎 e 𝑹𝑪 = {𝒅 ∈ ℝ: 𝒅 < −𝟔, 𝟔𝟒 𝒐𝒖 𝒅 > 𝟔, 𝟔𝟒}. 𝑪𝒐𝒎𝒐 𝒅𝒐𝒃𝒔 = −𝟏, 𝟓𝟎 ∉ 𝑹𝑪, 𝒏ã𝒐 𝒓𝒆𝒋𝒆𝒊𝒕𝒆 𝑯𝟎. Exercício 17: Para comparar as médias de duas populações Normais, amostras aleatórias foram obtidas. Sabe-se que as variâncias populacionais são diferentes, sendo seus valores desconhecidos. Amostra I 7 9 3 8 11 5 9 Amostra II 2 7 5 15 9 16 8 O que pode ser dito a respeito das médias das populações, com 𝛼 = 0,05? Teste bilateral. Pela expressão dada no texto obtemos que o teste envolve a distribuição t-Student com 9 graus de liberdade, de tal forma que 𝑹𝑪 = {𝒕 ∈ ℝ: 𝒕 < −𝟐, 𝟐𝟔𝟐 𝒐𝒖 𝒕 > 𝟐, 𝟐𝟔𝟐}, 𝑪𝒐𝒎𝒐 𝒕𝒐𝒃𝒔 = −𝟎, 𝟔𝟔 ∉ 𝑹𝑪, 𝒏ã𝒐 𝒓𝒆𝒋𝒆𝒊𝒕𝒆 𝑯𝟎. Isto é, há evidências nos dados que as médias populacionais são iguais. # Teste para 2 medias variancias diferentes: t.test(AmostraI,AmostraII,alternative="two.sided",conf.level=1- 0.05,var.equal=FALSE) # duas amostras antes e depois Código Extra: # Testar para ver se a suposição de variancias diferentes é satisfatoria. 6 # Teste para 2 variancias: var.test(AmostraI, AmostraII, alternative = "two.sided",conf.level=1- 0.05) # Teste para 2 medias variancias iguais: t.test(AmostraI,AmostraII,alternative="two.sided",conf.level=1- 0.05,var.equal=TRUE) # duas amostras I e II Exercício 18: Supondo que 𝐹~(𝑎, 𝑏), encontre 𝑥𝑐 tal que: 𝑃(𝑋 ≥ 𝑥𝑐) = 0,05 com 𝑎 = 18 e 𝑏 = 3. a. 𝑃(𝑋 > 𝑥𝑐) = 0,05 com 𝑎 = 3 e 𝑏 = 18. 3,16. b. 𝑃(𝑋 > 𝑥𝑐) = 0,05 com 𝑎 = 180 e 𝑏 = 192. 1,97. c. 𝑃(𝑋 ≥ 𝑥𝑐) = 0,95 com 𝑎 = 5 e 𝑏 = 12. 0,21. d. 𝑃(𝑋 ≥ 𝑥𝑐) = 0,95 com 𝑎 = 30 e 𝑏 = 40. 0,56. Exercício 19: Uma panificadora produz determinado tipo de pão, cujo peso médio é de 190 gramas, com desvio padrão de 18 gramas. Devido a mudanças na política cambial, que ocasionou aumento no preço do trigo, alguns ingredientes da receita foram substituídos. Uma equipe do governo resolveu verificar se a variabilidade no peso do produto aumentou e escolheu, aleatoriamente, 16 unidades, medindo o peso de cada uma. O peso médio obtido da amostra foi de 102 gramas e o desvio padrão foi de 24,5 gramas. Qual a conclusão para 𝛼 = 10%? 𝑯𝟎: 𝝈𝟐 = 𝟑𝟐𝟒 contra 𝑯𝟏: 𝝈𝟐 > 𝟑𝟐𝟒. Use qui-quadrado com 15 graus de liberdade para obter 𝑹𝑪 = {𝒗 ∈ ℝ: 𝒗 > 𝟐𝟐, 𝟑𝟏}. 𝑪𝒐𝒎𝒐 𝒗𝒐𝒃𝒔 = 𝟐𝟕, 𝟕𝟗 ∈ 𝑹𝑪, 𝒏ã𝒐 𝒂𝒄𝒆𝒊𝒕𝒆 𝑯𝟎. Ou seja, os dados fornecem evidências que a heterogeneidade aumentou. Nas questões NÃO NUMÉRICAS verifique, de acordo com a instrução de cada uma delas, se os itens são VERDADEIROS ou FALSOS. Exercício 20: Considere as seguintes afirmativas acerca de um teste de hipótese: Ⓞ O erro tipo I é definido como a probabilidade de não rejeitar a hipótese nula quando a hipótese nula é falsa. F. Ⓞ O poder do teste é definido como a probabilidade de não rejeitar a hipótese nula quando a hipótese nula é verdadeira. F. 7 Ⓞ O erro tipo II é definido como a probabilidade de não rejeitar a hipótese nula quando a hipótese alternativa é verdadeira. V. Ⓞ O p-valor de um teste é a probabilidade, sob a hipótese nula, de obter um valor da estatística ser, pelo menos, tão extremo quanto o valor observado. V. Ⓞ Se um intervalo de confiança de 95% para a média amostral, calculado a partir de uma amostra aleatória, excluir o valor 0, pode-se rejeitar a hipótese de que a média populacional seja igual a 0 ao nível de significância de 5%. F. Exercício 21: Com relação a testes de hipóteses, julgue as afirmativas: Ⓞ Em um teste de hipóteses, comete-se um erro do tipo I quando se rejeita uma hipótese nula verdadeira. V. Ⓞ O poder de um teste de hipóteses é medido pela probabilidade de se cometer o erro tipo II. F. Ⓞ A soma das probabilidades dos erros tipo I e tipo II é igual a 1. F. Ⓞ Quanto maior for o nível de significância de um teste de hipóteses maior será o valor- p a ele associado. F. Ⓞ Se o valor-p de um teste de hipóteses for igual 0,015, a hipótese nula será rejeitada a 5%, mas não a 1%. V. Exercício 22: Seja Xn X X X ,........, , , 3 2 1 uma amostra aleatória de tamanho n de uma população normal com média e variância 2 . Julgue as afirmativas: Ⓞ A probabilidade de a média populacional, , estar contida no intervalo de confiança ] ,196 , ,196 [ n X n X é igual a 95%. Ⓞ Se a variância 2 é desconhecida, o intervalo de confiança de 95% para a média será ] , [ n s t X n s t X c c , em que s é o desvio padrão da amostra, ct é calculado de forma que ,0 95 ) (| | ct P t , e t segue uma distribuição de Student com n -1 graus de liberdade. 8 Ⓞ Se construirmos vários intervalos de confiança para a média com amostras de idêntico tamanho, mesma variância 2 e mesma margem de confiança, estes terão extremos aleatórios, mas todos terão a mesma amplitude. Ⓞ Num teste de hipótese: 0 0 : H contra 0 : Ha , se o intervalo de confiança estimado para a média não contiver o valor de 0 , então deve-se aceitar a hipótese de que 0 . Ⓞ Se a amostra aleatória Xn X X X ,........, , , 3 2 1 não provém de uma distribuição normal, não se pode construir um intervalo de confiança para a média , ainda que a amostra seja muito grande. Exercício 23: Seja X uma variável aleatória normalmente distribuída com média e variância conhecida 2 =1, da qual se obtém a amostra aleatória X1, X2, ..., Xn (com n observações). É correto afirmar que: Ⓞ A média amostral é uma variável aleatória normalmente distribuída com média e variância 1/n. Ⓞ A probabilidade de o intervalo de confiança ] ,196/ , ,196/ [ n n X X conter a média da população, , é de 95%. Ⓞ A probabilidade de o intervalo de confiança ] ,196/ , ,196/ [ n n X X conter a média amostral é de 95%. Ⓞ O intervalo de 95% para a média populacional independe do tamanho da amostra. Ⓞ Em um intervalo de confiança de 95% para a média populacional, μ, espera-se que, extraindo-se todas as amostras de mesmo tamanho dessa população, esse intervalo conterá μ 95% das vezes. Exercício 24: Indique se as seguintes considerações sobre a teoria dos testes de hipótese são verdadeiras (V) ou falsas (F). Ⓞ O erro do tipo II é definido como a probabilidade de não se rejeitar uma hipótese nula quando esta for falsa e o erro do tipo I é definido como a probabilidade de se rejeitar a hipótese nula quando esta for verdadeira. V. 9 Ⓞ No teste de hipótese para proporções, se a variância da proporção populacional for desconhecida, a estatística t de Student com 𝑛 − 1 graus de liberdade (n é o tamanho da amostra) é a indicada para o teste. V. Ⓞ Num teste de hipótese bi-caudal, o valor-p (ou valor de probabilidade) é igual a duas vezes a probabilidade da região extrema delimitada pelo valor calculado da estatística do teste. V. Ⓞ Não se pode realizar um teste de hipótese para a variância populacional pois a estatística do teste, que segue uma distribuição Qui-quadrado com n -1 graus de liberdade (n é tamanho da amostra), não é simétrica. F. Ⓞ No teste de hipótese para a média (H0: 𝜇 = 0 contra Ha: : 𝜇 ≠ 0), ao nível de significância , se o intervalo de confiança com 1- de probabilidade não contiver 𝜇 = 0, não se poderá rejeitar H0. . F. Exercício 25: Uma máquina está sendo examinada com o objetivo de substituir a máquina antiga de certa indústria. Segundo o fabricante da nova máquina, a proporção (P) de peças defeituosas produzida é de 3% ou menos. Uma amostra de 2.000 peças foi examinada e foram encontradas 74 peças defeituosas. Ⓞ As hipóteses para um teste estatístico de hipóteses devem ser H0: P = 0,03 e HA: P < 0,03. Ⓞ Ao realizarmos o teste de hipóteses para o problema, ao nível de significância de 5%, a hipótese nula deve ser rejeitada. Ⓞ Utilizando a proporção de peças defeituosas encontradas na amostra, a estimativa por intervalo para a verdadeira proporção de peças defeituosas produzida pela nova máquina, utilizando uma confiança de 95%, é ( 2,87%; 4,53%). Ⓞ Admitindo que a verdadeira proporção de peças defeituosas seja 3%, seria necessário uma amostra de 3.000 peças para que o erro máximo admissível entre a proporção estimada e a verdadeira não excedesse a 1%, com probabilidade de 95%. Ⓞ Se as probabilidade de que um intervalo de confiança contenha o verdadeiro parâmetro populacional é igual a (1 - ), isto significa que se retirássemos um número infinito de amostras da população em estudo e se para cada uma das amostras 10 calculássemos o intervalo de confiança do parâmetro , então em (1 - )% destes intervalos conteriam o verdadeiro parâmetro . Exercício 26: A vida útil de um tubo de televisão tem distribuição Normal com desvio padrão (conhecido) de 500 horas. O fabricante afirma que a vida útil média dos tubos é de, no mínimo, 9.000 horas. Sabendo-se que a vida útil média encontrada para uma amostra aleatória de 16 tubos foi de 8.800 horas, podemos afirmar que: Ⓞ Para verificar a veracidade da informação do fabricante através de um teste estatístico de hipóteses, as hipóteses são: Hipótese nula: H0: = 9.000 horas Hipótese alternativa : H1: > 9.000 horas Ⓞ Ao nível de significância de 5%, não podemos contestar a afirmação do fabricante. Ⓞ Se a informação amostral fosse obtida de uma amostra de 36 tubos, ao nível de significância de 2,5% também não podemos contestar a afirmação do fabricante. Ⓞ O tamanho mínimo da amostra para uma estimativa por intervalo da vida média dos tubos deveria ser de 50 tubos, de modo que o erro da estimativa não excedesse a 100 horas, com uma probabilidade de 95%. Ⓞ Caso desconheçamos o desvio padrão populacional é impossível testar a validade da afirmação do fabricante. Exercício 27: O representante de um grupo comunitário informa a uma pessoa interessada em estabelecer um centro comercial que a renda média familiar na área é de R$ 15.000. Suponha que, para a área em questão, seja possível admitir que a renda média familiar tem distribuição aproximadamente normal, e que se possa aceitar o desvio- padrão como sendo R$ 2.000 (com base em um estudo anterior). Para uma amostra aleatória de 16 famílias, a renda média familiar foi de R$ 15.500. O centro comercial só será construído se o nível médio de renda familiar () for maior que o informado. Ⓞ A hipótese nula deve ser H R 0 000 : $15. . Ⓞ A hipótese alternativa deve ser H R 1 000 : $15. . Ⓞ Não pode ser realizado qualquer teste pois o número de elementos da amostra é pequeno. 11 Ⓞ A estatística que deve ser utilizada para a elaboração do teste é a Z, que tem distribuição N(0,1). Ⓞ Um teste feito ao nível de significância de 5% permite concluir que a condição para a construção do centro será satisfeita. Exercício 28: Com respeito aos testes de hipóteses pode-se afirmar que: Ⓞ O nível de significância de um teste é a probabilidade de cometer erro do tipo I, isto é, a probabilidade de aceitar a hipótese nula, quando ela é falsa. . F. Ⓞ O valor 1 - é o poder do teste, onde é a probabilidade do erro do tipo II, isto é, a probabilidade de rejeitar a hipótese nula quando ela é verdadeira. . F. Ⓞ Se x 1,...,xn é uma amostra aleatória de uma população normal com média e variância conhecida 2, para testar H0 : 0 contra H1 : 0 usa-se a distribuição t de Student. . F. Ⓞ Dada uma população de indivíduos de tamanho 𝑛, deseja-se verificar se a população de empregados é de 0,5. Esta verificação pode ser feita através do teste de hipóteses: H0 : p 1 2 / contra H1 : p 1 2 / usando-se, para tanto, a distribuição normal como aproximação da binomial. V. Ⓞ Uma empresa afirma que 60% dos seus empregados são ligados à produção. Para verificar esta afirmativa, o sindicato decide usar uma amostra de 200 trabalhadores e observa que 105 deles estão ligados à produção. Ao nível de significância de 5% pode-se afirmar que o número de empregados ligados à produção é inferior a 60%. V. Exercício 29: Exercício 30: Exercício 31: 12 Exercício 32: -