·

Sistemas de Informação ·

Introdução à Estatística

· 2023/1

Envie sua pergunta para a IA e receba a resposta na hora

Fazer Pergunta
Equipe Meu Guru

Prefere sua atividade resolvida por um tutor especialista?

  • Receba resolvida até o seu prazo
  • Converse com o tutor pelo chat
  • Garantia de 7 dias contra erros

Texto de pré-visualização

SME 0520: TESTES DE HIP´OTESES - 7a Lista de Exerc´ıcios Exerc´ıcio 1. Uma ind´ustria el´etrica fabrica lˆampadas cuja vida ´util tem distribui¸c˜ao aproximadamente normal com m´edia de 800 horas e desvio padr˜ao de 40 horas. Teste a hip´otese de que µ = 800 horas contra a alternativa µ ̸= 800 horas, se uma amostra aleat´oria de 30 lˆampadas tem m´edia de vida de 788 horas. Use um n´ıvel de significˆancia de 5%. Exerc´ıcio 2. A altura m´edia de estudantes calouras do sexo feminino de certa universidade ´e 162,5 cent´ımetros, com des- vio padr˜ao de 6,9 cent´ımetros. H´a alguma raz˜ao para acre- ditar que houve uma mudan¸ca na m´edia das alturas se uma amostra de 50 mo¸cas na atual classe de calouros tem altura m´edia de 165,2 cent´ımetros? Utilize um n´ıvel de significˆancia de 10%. Exerc´ıcio 3. Uma companhia de cigarros anuncia que o ´ındice m´edio de nicotina dos cigarros que fabrica apresenta- se abaixo de 23 mg por cigarro. Um laborat´orio realiza 6 an´alises desse ´ındice, obtendo: 27, 24, 21, 25, 26, 22. Sabe- se que o ´ındice de nicotina se distribui normalmente, com variˆancia igual a 4,86 mg2. Pode-se aceitar, ao n´ıvel de 10%, a afirma¸c˜ao do fabricante? Exerc´ıcio 4. De acordo com um estudo sobre dietas, uma alta ingest˜ao de s´odio pode estar relacionada a ´ulceras, cˆancer de estˆomago e enxaquecas. A necessidade humana de sal ´e de apenas 220 miligramas por dia, o que ´e ultrapassado na maioria das por¸c˜oes simples dos cereais prontos para servir. Se uma amostra aleat´oria de 20 por¸c˜oes similares de certo cereal tem m´edia de conte´udo de s´odio de 244 miligramas e desvio padr˜ao de 24,5 miligramas, isso sugere no n´ıvel de sig- nificˆancia 0,05, que a m´edia de s´odio contido em uma por¸c˜ao de tal cereal ´e maior que 220 miligramas? Exerc´ıcio 5. Estamos desconfiados de que a m´edia das re- ceitas municipais per capita das cidades pequenas ´e maior do que a das receitas do estado, que ´e de 1229 unidades. Para comprovar ou n˜ao essa hip´otese, sorteamos dez cidades pe- quenas, e obtivemos os seguintes resultados: 1230, 582, 576, 2093, 2621, 1045, 1439, 717, 1838, 1359. Mostre que o teste de hip´otese usado, com α = 0, 05, levar´a `a aceita¸c˜ao de que a m´edia das cidades pequenas ´e igual `a do estado. Exerc´ıcio 6. A precipita¸c˜ao pluviom´etrica anual numa certa regi˜ao tem desvio padr˜ao σ = 3, 1 e m´edia desconhecida. Para os ´ultimos 9 anos, foram obtidos os seguintes resultados: 30,5; 34,1; 27,9; 35,0; 26,9; 30,2; 28,3; 31,7; 25,8. (a) Construa um teste de hip´otese adequado para saber se a m´edia da precipita¸c˜ao pluviom´etrica anual ´e maior que 30,0 unidades. Utilize um n´ıvel de significˆancia α = 5%. (b) Discuta o mesmo problema, considerando σ desconhe- cido. Exerc´ıcio 7. Um fabricante garante que 90% dos equipamen- tos que fornece a uma f´abrica est˜ao de acordo com as espe- cifica¸c˜oes exigidas. O exame de uma amostra de 200 pe¸cas desse equipamento revelou 25 defeituosos. Teste a afirmativa do fabricante, nos n´ıveis 5% e 1%. Exerc´ıcio 8. Em uma faculdade, estima-se que 25% dos alu- nos v˜ao para as aulas de bicicleta. Parece ser uma estima¸c˜ao v´alida se, em uma amostra aleat´oria de 90 estudantes, 28 v˜ao de bicicleta para as aulas? Use um n´ıvel de significˆancia de 0,05. Exerc´ıcio 9. Entre 703 trabalhadores selecionado aleatoria- mente, 61% obtiveram seus empregos atrav´es de rede de ami- gos. Use os dados amostrais com um n´ıvel de significˆancia de 0,05 para testar a afirmativa de que a maioria dos traba- lhadores (mais de 50%) obt´em seus empregos atrav´es de rede de amigos. Exerc´ıcio 10. Em um estudo de 11000 acidentes de carro, encontrou-se que 5720 deles ocorreram a menos de 5 milhas de casa. Use um n´ıvel de significˆancia de 0,01 para testar a afirmativa de que mais de 50% dos acidentes de carro ocorrem a menos de 5 milhas de casa. Exerc´ıcio 11. Entre 734 usu´arios da Internet selecionados aleatoriamente, verificou-se que 360 deles usam a internet para fazerem planos de viagem. Use um n´ıvel de significˆancia de 0,01 para testar a afirmativa de que, entre os usu´arios da internet, menos de 50% usam-na para fazer planos de viagem. Exerc´ıcio 12. O gerente de uma empresa de t´axis est´a ten- tando decidir se ´e melhor utilizar pneus radiais em vez dos cinturados regulares para promover uma economia de com- bust´ıvel. Doze carros foram equipados com os radiais e diri- gidos em um percurso de teste prescrito. Sem trocar os moto- ristas, os mesmos carros foram equipados com os cinturados e dirigidos no mesmo percurso. O consumo da gasolina, em quilˆometros por litro, foi registrado como se segue: Carro Peneu radial Pneu cinturado 1 4,2 4,1 2 4,7 4,9 3 6,6 6,2 4 7,0 6,9 5 6,7 6,8 6 4,5 4,4 7 5,7 5,7 8 6,0 5,8 9 7,4 6,9 10 4,9 4,7 11 6,1 6,0 12 5,2 4,9 Podemos concluir que n˜ao h´a diferen¸ca na economia de com- bust´ıvel de carros equipados com os pneus radiais ou com pe- nus cinturados? Considere α = 10%. Exerc´ıcio 13. Cinco amostras de uma substˆancia ferrosa ser˜ao usadas para determinar se h´a uma diferen¸ca no conte´udo de ferro entre uma an´alise qu´ımica laboratorial e uma an´alise com raios X fluorescentes. Cada amostra foi dividida em duas subamostras e os dois tipos de an´alises foram aplicados. A se- guir temos os dados codificados que mostram as an´alises dos conte´udos de ferro. An´alise Amostra 1 2 3 4 5 Raios X 2,0 2,0 2,3 2,1 2,4 Qu´ımica 2,2 1,9 2,5 2,3 2,4 Assumindo que as popula¸c˜oes s˜ao normais, teste a um n´ıvel de significˆancia de 5% se os dois testes fornecem, em m´edia, os mesmos resultados. Exerc´ıcio 14. Um modelo gen´etico especifica que animais de certa popula¸c˜ao devam estar classificados em quatro catego- rias, com probabilidades p1 = 0, 656, p2 = 0, 093, p3 = 0, 093 e p4 = 0, 158. Dentre 197 animais, obtivemos as seguintes frequˆencias observadas: O1 = 125, O2 = 18, O3 = 20 e O4 = 34. Teste, ao n´ıvel de significˆancia de 5%, se esses dados est˜ao de acordo com o modelo gen´etico postulado. Exerc´ıcio 15. Um dado foi lan¸cado 1000 vezes, com os se- guintes resultados: Ocorrˆencia 1 2 3 4 5 6 Frequˆencia 158 186 179 161 141 175 Pode-se afirmar que este conjunto de dados s˜ao provenien- tes de uma distribui¸c˜ao uniforme discreta, Ud( 1 6)? Considere o n´ıvel de significˆancia de 5%. Exerc´ıcio 16. Um engenheiro de computa¸c˜ao tem desenvol- vido um algoritmo para gerar n´umeros aleat´orios inteiros no intervalo 0-9. Ao executar o algoritmo e gerar 1000 valores, ele obt´em observa¸c˜oes com as seguintes frequˆencias: N´umero 0 1 2 3 4 5 6 7 8 9 Frequˆencia 94 93 112 101 96 104 95 100 99 106 O gerador funciona? Isto ´e, ele gera valores com distri- bui¸c˜ao uniforme discreta em {0, 1, . . . , 9}? Considere o n´ıvel de significˆancia de 1%. Resolução Exercícios Lista 7 Quarto e R Utilizaremos o software R para resolução dos exercícios, e através do Quarto iremos fazer essa resolução Importanto os pacotes necessários library(readxl) library(tidyverse) library(DT) library(knitr) library(ggpubr) library(samplingbook) library(fBasics) library(summarytools) library(epiDisplay) Agora vamos as resoluções dos exercícios 2, 5, 6, 7, 12 e 16 Exercício 2 Questão se trata de teste de hipótese com desvio padrão populacional conhecido, portanto vamos armazenar nossas variáveis e realizar o código abaixo: Armazenando as nossas variáveis e realizando os cálculos # Informações n <- 50 sigma <- 6.9 1 mu0 <- 162.5 xb <- 165.5 alpha <- .1 # Cálculos zc <- sqrt(x = n) * (xb - mu0)/sigma zt <- qnorm(p = 1 - alpha) # Resultados D <- ifelse(test = zc > zt, yes = "Rejeitar H0", no = "Não Rejeitar H0") Portanto, com nossos resultados, concluímos que nosso Z tabelado é 1.2815516, e nossa es- tatística Z é 3.0743773‘, portanto, nossa conclusão é de Rejeitar H0, concluímos portanto que segundo os dados de nossa amostra, nossa média aumentou. Exercício 5 Questão se trata de teste de hipótese sem o desvio padrão populacional conhecido portanto vamos armazenar nossas variáveis e realizar o código abaixo: Armazenando as nossas variáveis e realizando os cálculos # Dados x <- c(1230, 582, 576,2093, 2621, 1045, 1439, 717, 1838, 1359) # Informações mu0 <- 1229 alpha <- .05 # Cálculos n <- length(x = x) xb <- mean(x = x) s <- sd(x = x) tc <- sqrt(x = n) * (xb - mu0)/s tt <- qt(p = alpha, df = n - 1) # Resultados (Função Específica) R <- t.test(x = x, mu = mu0, alt = "two.sided", conf = 1 - alpha) A média de nossa amostra de 10 elementos deu 1350, nosso T tabelado foi de -1.8331129 e nossa estatística t foi 0.5661759, portanto não rejeitamos H0. Abaixo temos o resultado da função própria do teste t. R 2 One Sample t-test data: x t = 0.56618, df = 9, p-value = 0.5851 alternative hypothesis: true mean is not equal to 1229 95 percent confidence interval: 866.5442 1833.4558 sample estimates: mean of x 1350 Exercício 6 Questão se trata de teste de hipótese com desvio padrão populacional conhecido. vamos armazenar nossas variáveis e realizar o código abaixo: Armazenando as nossas variáveis e realizando os cálculos letra a x <- c( 30.5, 34.1, 27.9, 35.0, 26.9, 30.2, 28.3, 31.7, 25.8) # Informações n <- length(x = x) xb <- mean(x = x) sigma <- 3.1 mu0 <- 30 alpha <- .05 # Cálculos zc <- sqrt(x = n) * (xb - mu0)/sigma zt <- qnorm(p = 1 - alpha) # Resultados D <- ifelse(test = zc > zt, yes = "Rejeitar H0", no = "Não Rejeitar H0") pv <- 1 - pnorm(q = zc) A média de nossa amostra de 9 elementos deu 30.0444444, nosso Z tabelado foi de 1.6448536 e nossa estatística z foi 0.0430108, portanto nossa decisão é de Não Rejeitar H0 3 letra b Considerando o desvio padrão desconhecido, temos os seguintes dados # Dados x <- c( 30.5, 34.1, 27.9, 35.0, 26.9, 30.2, 28.3, 31.7, 25.8) # Informações mu0 <- 30 alpha <- .05 # Cálculos n <- length(x = x) xb <- mean(x = x) s <- sd(x = x) tc <- sqrt(x = n) * (xb - mu0)/s tt <- qt(p = alpha, df = n - 1) # Resultados D <- ifelse(test = tc < tt, yes = "Rejeitar H0", no = "Não Rejeitar H0") A média de nossa amostra de 9 elementos deu 30.0444444, nosso t tabelado foi de -1.859548 e nossa estatística t foi 0.0422902, portanto nossa decisão é de Não Rejeitar H0 Semelhante a letra a, também não rejeitamos a hipótese nula, a média da amostra é bem próxima de 30 unidades. Exercício 7 Questão se trata de teste de hipótese para proporção vamos armazenar nossas variáveis e realizar o código abaixo: Armazenando as nossas variáveis e realizando os cálculos considerando 5% e 1% de confiança # Informações n <- 200 nc <- (25) p0 <- .9 alpha1 <- .01 4 alpha2 <- .05 # Cálculos y <- n - nc #vamos considerar as não defeituosas p.hat <- y/n zc <- sqrt(x = n) * (p.hat - p0)/sqrt(x = p0 * (1 - p0)) zt1 <- qnorm(p = alpha1) zt2 <- qnorm(p = alpha2) # Resultados D1 <- ifelse(test = zc < zt1, yes = "Rejeitar H0", no = "Não Rejeitar H0") D2 <- ifelse(test = zc < zt2, yes = "Rejeitar H0", no = "Não Rejeitar H0") pv <- pnorm(q = zc) Ao nível de 1% A nossa amostra de 200 elementos continha 25 elementos de acordo com as especificações exigidas, nosso Z tabelado ao nível de 0.01 foi -2.3263479 e nossa estatística z foi -1.1785113, portanto nossa decisão é de Não Rejeitar H0. Ao nível de 5% A nossa amostra de 200 elementos continha 25 elementos de acordo com as especificações exigidas, nosso Z tabelado ao nível de 0.05 foi -1.6448536 e nossa estatística z foi -1.1785113, portanto nossa decisão é de Não Rejeitar H0. Exercício 12 Questão se trata de teste de hipótese para dados pareados com desvio padrão desconhecido, vamos armazenar nossas variáveis e realizar o código abaixo: Armazenando as nossas variáveis e realizando os cálculos considerando 10% de confiança, testaremos as hipóteses se há ou não diferença entre cada tipo de pneu em relação a economia. # Dados x <- c(4.2,4.7,6.6,7,6.7,4.5,5.7,6,7.4,4.9,6.1,5.2) y <- c(4.1,4.9,6.2,6.9,6.8,4.4,5.7,5.8,6.9,4.7,6,4.9) # Informações alpha <- .1 5 # Cálculos n <- length(x = x) db <- mean(x = x - y) s_d <- sd(x = x - y) tc <- sqrt(x = n) * db/s_d tt <- qt(p = 1 - alpha, df = n - 1) # Resultados D <- ifelse(test = tc > tt, yes = "Rejeitar H0", no = "Não Rejeitar H0") pv <- 1 - pt(q = tc, df = n - 1) Podemos concluir que, ao nível de 0.1 de confiança, nosso t tabelado foi 1.3634303 e nossa estatística de teste t foi de 2.4845152, portanto nossao decisão é de Rejeitar H0, logo, há sim diferença na economia de combustível de carros equipados com peneus radiais x pneus cinturados. Exercício 16 Questão se trata de teste de aderência básico, onde queremos saber se de fato o algoritmo gerou numeros aleatórios na proporção certa, isso é, como foram 1000 números de 0 a 9, o valor esperado de cada número é 100, vamos armazenar nossas variáveis e realizar o código abaixo: Armazenando as nossas variáveis e realizando os cálculos considerando 1% de confiança, testeremos usando a função qchisq e chisq.test, pois o teste de aderência se trata de um teste qui-quadrado #dados f_obs = c(94,93,112,101,96,104,95,100,99,106) #valor esperado f_esp = c(100,100,100,100,100,100,100,100,100,100) q_obs = sum((f_obs-f_esp)^2)/50 #distribuição qui-quadrado q_c=qchisq(0.99,9) if(q_obs > q_c){ aa="Rejeito H0" }else aa="Aceito H0" chisq.test(f_obs) 6 Chi-squared test for given probabilities data: f_obs X-squared = 3.24, df = 9, p-value = 0.954 Podemos concluir que, ao nível de 1% de confiança, nosso qui-quadrado tabelada foi de 21.6659943 e nossa estatística de teste foi de 6.48, portanto nossao decisão é de Aceito H0, logo, o gerador de número está funcionando perfeitamente. 7