·

Ciências Contábeis ·

Estatística 2

Envie sua pergunta para a IA e receba a resposta na hora

Fazer Pergunta

Texto de pré-visualização

Lista – Regressão Linear Simples Entregar exercícios 1 e 4 1ª questão) Num processo industrial forma medidos as variáveis temperatura (oF) e quantidade de vapor liberada. Os valores são apresentados a seguir: Observação X Y Observação X Y Observação X Y 1 35.3 10.98 11 46.4 8.24 21 72.1 7.68 2 29.7 11.13 12 28.9 12.19 22 58.1 8.47 3 30.8 12.51 13 28.1 11.88 23 44.6 8.86 4 58.8 8.40 14 39.1 9.57 24 33.4 10.36 5 61.4 9.27 15 46.8 10.94 25 28.6 11.08 6 71.3 8.73 16 48.5 9.58 7 74.4 6.36 17 59.3 10.09 8 76.7 8.50 18 70.0 8.11 9 70.7 7.82 19 70.0 6.83 10 57.5 9.14 20 74.5 8.88 7154,42 x) x ( n 1 i 2 i     63,82 y) y ( n 1 i 2 i     23,80 y) x)(y x ( n 1 i i i       O engenheiro responsável pelo processo, interessado em predizer a quantidade de vapor em função da temperatura de realização do processo, ajustou um modelo de regressão linear simples. 1. Escreva a equação teórica do modelo de regressão linear simples para descrever a relação entre as variáveis acima. 2. Quais os pressupostos são necessários para a realização de inferências sobre o modelo? 3. O modelo foi ajustado no R, obtendo-se: Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 13.62299 0.58146 23.429 < 2e-16 *** x -0.07983 0.01052 -7.586 1.05e-07 *** i) Interprete as estimativas dos parâmetros do modelo? ii) Quais as hipóteses estão sendo testadas no teste de hipóteses sobre β0 dado acima? Ao nível de significância de 5%, qual a conclusão deste teste? iii) Construa um intervalo de 95% de confiança β1. Interprete-o. 4. Abaixo é dada a tabela de analise de variância. FV SQ GL QM F P-VALOR Temperatura 45,592 1 45,592 57.543 0,0000 Resíduo 18,223 23 0,7923 5. Quais hipóteses estão sendo testadas pelo teste F acima? Qual a conclusão deste teste ao nível de significância de 5%? 6. Calcule e interprete o coeficiente de determinação. 7. Para temperatura de 70 oF obtenha os resíduos e valores preditos para a quantidade de vapor liberada. 8. Obtenha intervalos de 95% de confiança para a quantidade média de vapor liberada para um processo realizado com temperatura a 70 oF. 9. Que conclusões sobre os pressupostos do modelo podem ser realizadas a partir dos seguintes gráficos. 2ª questão) É esperado que a massa muscular de uma pessoa diminua com a idade. Para explorar a relação destas variáveis em mulheres, um nutricionista selecionou ao acaso 14 mulheres com idade entre 40 e 79 anos. Os resultados observados para as variáveis X: idade e Y: massa muscular são dados abaixo: Mulher 1 2 3 4 5 6 7 8 9 10 11 12 13 14 X 71 64 43 67 56 73 68 56 76 65 45 58 45 53 Y 82 91 100 68 87 73 78 80 65 84 116 76 97 100 a) Construa um diagrama de dispersão. Comente. b) Escreva a equação teórica do modelo de regressão linear simples para o problema. Quais os pressupostos são necessários para a realização de inferências sobre o modelo. c) Ajuste o modelo de regressão linear simples. Interprete os coeficientes. d) Construa um gráfico com os dados e a equação de regressão estimada. Comente sobre a qualidade do ajuste. e) Obtenha para todos os valores de X os valores preditos pelo modelo e os resíduos. g) Construa um intervalo de 95% de confiança para β1 e interprete-o. h) Obtenha intervalos de confiança de 95% para massa muscular média das mulheres com: a) 50 anos b) 60 anos. Interprete os intervalos. Qual destes intervalos tem maior amplitude e porque? i) Verifique através de um teste de hipóteses ao nível de significância de 5% a existência de relação linear entre idade e massa muscular. j) Construa intervalos de 95% de confiança para predição de uma resposta individual para valores de x iguais a 50 e 60 anos. Compare com os resultados encontrados em 1-g. k) Construa a tabela de análise de variância. Compare o resultado do teste de hipótese com aquele obtido em 1- h l) Calcule o coeficiente de determinação e interprete-o. 3ª questão) O data.frame Diamonds disponibilizado no moodle possui 3 variáveis medidas para uma amostra de diamantes vendidos em leilão: weight – peso dos diamantes, clarity – variável numérica que mede a clareza da cor do diamante, color - com 2 categorias (com categorias: cor 4 e cor 6) e valor de venda da pedra. Salve esse arquivo numa pasta do seu computador e leia o no R. a) Construa os diagrama de dispersão do valor de venda versus peso do diamante, do valor de venda versus clareza da cor e o boxpplot do valor de venda versus cor. Comente os gráficos. b) Ajuste os modelos de regressão linear simples para descrever a relação entre valor de venda e peso do diamante. i) A partir do modelo ajustado, pode se concluir que o peso do diamante influencia no valor da venda? Justifique sua resposta. ii) Interprete as estimativas dos parâmetros do modelo. iii) Obtenha e interprete o coeficiente de determinação do modelo. iv) Verifique a validade dos pressupostos do modelo a partir da análise dos resíduos. v) Faça o gráfico dos resíduos do modelo versus a variável clareza do diamante. A partir desse gráfico, você consideraria a variável clareza é importante para explicar a variação no valor de venda não explicada pelo peso dos diamantes. Justifique. c) Ajuste os modelos de regressão linear simples para descrever a relação entre valor de venda e cor do diamante. i) A partir do modelo ajustado, pode se concluir que o peso do diamante influencia no valor de venda? Justifique sua resposta. ii) Interprete as estimativas dos parâmetros do modelo. iii) Obtenha e interprete o coeficiente de determinação do modelo. iv) Verifique a validade dos pressupostos do modelo. 4ª questão) O data frame cars, disponível no R, apresenta 2 variáveis, a velocidade do automóvel (SPEES) e a distância percorrida até a parada (DIST) após a frenagem medidas para 50 automóveis. Para carregar o data.frame execute o código data(cars) a) Construa o diagrama de dispersão das variáveis DIST versus SPEED. b) Ajuste, usando o R, um modelo de regressão tendo DIST como variável resposta e SPEED como variável explicativa. c) Interprete as estimativas dos parâmetros β0 e β1. d) Usando a função summary obtenha os resultados dos testes t sobre estes parâmetros. O que podemos concluir ao nível de significância de 5%? e) Obtenha a tabela de análise de variância para o modelo ajustado usando a função anova. Que hipóteses está sendo testada pelo teste F? A partir deste teste, pode-se concluir que a variável SPEED é importante para explicar a variável DIST? Justifique. f) Para os valores observados de SPEED, obtenha o gráfico com as predições para a resposta média e para a resposta individual. Comente o gráfico. g) Obtenha o gráfico dos resíduos versus valores preditos e o qqlopt dos resíduos. Quais pressupostos do modelo não são verificados? Justifique. 5ª questão) Um criminologista estudando a relação entre densidade populacional e taxa de roubos em cidades médias dos Estados Unidos coletou os seguintes dados para uma amostra de 16 cidades. Os resultados observados para as variáveis X: densidade populacional (número de pessoas por unidade de área) e Y: número de roubos por 100.000 habitantes foram: x 59 49 75 54 78 56 60 82 69 83 88 94 47 65 89 70 y 209 180 195 192 215 197 208 189 213 201 214 212 205 186 200 204 a) Construa um diagrama de dispersão. Comente. b) Ajuste o modelo de regressão linear simples. Interprete os coeficientes. c) Obtenha para todos os valores de X os valores preditos pelo modelo. d) Construa um gráfico com os dados e a equação de regressão estimada. e) Obtenha os resíduos. f) Construa um intervalo de 95% de confiança para β1 e interprete-o. g) Verifique, através de um teste de hipóteses ao nível de significância de 5%, a existência de relação linear entre idade e massa muscular. h) Construa intervalos de confiança de 95% para a taxa média de roubos quando a densidade populacional é igual a 55. b. i) Construa um intervalo de predição de 95% para a taxa de roubo para uma cidade com densidade populacional igual a 55. j) Construa a tabela de análise de variância. Escreva as hipóteses que estão sendo testadas e sua conclusão. k) Calcule o coeficiente de determinação e interprete-o.