·

Administração ·

Estatística 2

Envie sua pergunta para a IA e receba a resposta na hora

Fazer Pergunta

Texto de pré-visualização

Departamento de Estatística ICEx UFMG Disciplina Métodos Estatísticos Avançados em Epidemiologia EST815 Profa Edna Afonso Reis L01 1Enunciados 1ª Lista de Exercícios Parte 1 Exercício 1 a Comente sobre a relação entre as duas variáveis analisando a Figura 1 b Escreva a fórmula do modelo de regressão linear a ser ajustado neste caso c Escreva as suposições do modelo de regressão linear e diga se elas parecem ter sido violadas neste caso No quadro abaixo são mostrados alguns resultados do ajuste do modelo de regressão para estes dados d Desenhe a reta estimada na Figura 1 e Interprete os coeficientes do modelo f Interprete o resultado do Teste F da tabela ANOVA g Calcule e interprete o coeficiente de determinação h Forneça uma estimativa pontual e um intervalo de confiança de 95 para a média da massa muscular de indivíduos com idade igual a h1 40 anos h2 60 anos Compare a amplitude destes intervalos Não é necessário responder à parte riscada Não é necessário responder à parte riscada Departamento de Estatística ICEx UFMG Disciplina Métodos Estatísticos Avançados em Epidemiologia EST815 Profa Edna Afonso Reis L01 2Enunciados 1ª Lista de Exercícios Parte 2 Exercício 1 Em um estudo sobre a relação entre a quantidade de gordura corporal Y em Kg e as medidas de espessura da dobra do tríceps X1 em mm circunferência da coxa X2 em cm e circunferência do braço X3 em cm foram coletadas informações sobre essas variáveis em 20 indivíduos As Figuras 11 a 13 mostram os diagramas de dispersão da variável resposta versus cada uma das variáveis explicativas Os quadros 11 e 12 mostram respectivamente a tabela ANOVA e os resultados da inferência dos coeficientes do modelo de regressão envolvendo essas variáveis a Baseado nas informações disponíveis e outras que você pode calcular a partir dessas conclua sobre o ajuste do modelo de regressão proposto b Interprete o efeito na quantidade de gordura corporal das medidas de espessura da dobra do tríceps circunferência da coxa e circunferência do antebraço Figura 11 Figura 12 Figura 13 Quadro 11 Tabela de Análise de Variância do modelo dos itens a e b incompleta Quadro 12 Resultados da inferência dos coeficientes do modelo dos itens a e b Fonte de Variação GL SQ F Valor P Regressão 3 4015 228 0000005 Residual 16 939 Preditor Coef T Valor P Constante 3978 X1 030 25 0012 X2 112 19 0038 X3 036 06 0278 Departamento de Estatística ICEx UFMG Disciplina Métodos Estatísticos Avançados em Epidemiologia EST815 Profa Edna Afonso Reis L01 3Enunciados 1ª Lista de Exercícios Parte 3 Exercício 1 Continuação do Exercício 1 da Lista 012 Esudo sobre a relação entre a quantidade de gordura corporal Y em Kg e as medidas de espessura da dobra do tríceps X1 em mm circunferência da coxa X2 em cm e circunferência do braço X3 em cm A informação sobre a idade do indivíduo foi incluída no modelo na forma de faixa etária com as seguintes categorias em anos completos 20 a 30 31 a 40 41 a 50 resultando na seguinte equação estimada Y 30 022 X1 105 X2 033 X3 15 F1 35 F2 com F1 1 se idade entre 31 e 40 e F1 0 caso contrário e F2 1 se idade entre 41 e 50 e F2 0 caso contrário Interprete o efeito da idade na quantidade de gordura corporal Exercício 2 Um químico deseja saber se a quantidade de sólidos suspensos Y em um sistema de limpeza por carvão é influenciada pelo pH do sistema X e pelo tipo de polímero tipos 1 2 e 3 A Figura 21 mostra os dados coletados Quanto maior a quantidade de sólidos suspensos mais eficiente é o sistema de limpeza Figura 21 a Observe a Figura 21 e analise a relação entre a quantidade de sólidos suspensos e o pH do sistema e o tipo de polímero polímero 1 polímero 2 polímero 3 b O tipo de polímero foi introduzido no modelo através das variáveis indicadoras Z1 1 se polímero 1 0 cc e Z2 1 se polímero 2 0 cc O modelo ajustado foi Y 158 538 X 198 Z1 109 Z2 136 X Z1 Baseado nesse modelo ajustado analise os efeitos do pH do sistema e do tipo de polímero na quantidade de sólidos suspensos c Você acha que é necessário incluir interação entre as variáveis explicativas neste modelo Justifique Exercício 3 O gerente de uma rede de concessionárias de automóveis novos deseja estudar a relação entre o gasto com acessórios no ato da compra do automóvel Y em reais em função do valor do automóvel X1 em reais do sexo do comprador X2 0 se feminino X21 se masculino e da idade do comprador X3 em anos completos O estatístico consultado para resolver esse problema selecionou uma amostra aleatória de vendas ajustou um modelo de regressão linear usando as variáveis acima e apresentou ao gerente as conclusões I O gasto com acessórios cresce linearmente com o valor do automóvel II As mulheres gastam menos com acessórios do que os homens III O gasto com acessórios decresce linearmente com a idade do comprador IV O efeito linear do valor do automóvel no gasto com acessórios não é o mesmo nos dois sexos V O efeito linear do valor do automóvel no gasto com acessórios não é o mesmo para qualquer idade do comprador e viceversa VI O efeito linear da idade do comprador no gasto com acessórios é o mesmo nos dois sexos Considerando as conclusões acima o modelo final apresentado ao gerente foi do tipo escolha um a 3 3 2 2 1 1 0 erro X X X Y b 2 1 12 2 2 1 1 0 erro X X X X Y c 3 2 23 3 3 2 2 1 1 0 erro X X X X X Y d 3 1 13 2 1 12 3 3 2 2 1 1 0 erro X X X X X X X Y e 3 2 23 3 1 13 2 1 12 3 3 2 2 1 1 0 erro X X X X X X X X X Y Departamento de Estatística ICEx UFMG Disciplina Métodos Estatísticos Avançados em Epidemiologia EST815 Profa Edna Afonso Reis L011Soluções Soluções da 1ª Lista de Exercícios Parte 1 Exercício 1 a A relação entre a massa muscular e a idade de pessoas entre 40 e 80 anos mostrase aproximadamente linear decrescente com uma correlação bastante forte b c Relação linear entre Y e X não parece ter sido violada Variância constante de Y ao longo dos valores de X não parece ter sido violada Independência entre as observações não há motivos para suspeitar que foi violada Erros normais a ser verificada na análise dos resíduos d e f Como o valorp do Teste F da tabela ANOVA é pequeno 001 rejeitase a hipótese nula de que o coeficiente 1 é igual a zero o que leva à conclusão de que a variável idade tem efeito linear significante na variável massa muscular g Denote por μ₄₀ EY X40 ou seja a massa muscular média de pessoas com idade igual a 40 anos μ₆₀ EY X60 ou seja a massa muscular média de pessoas com idade igual a 60 anos Estimativas Pontuais μ₄₀ 14365 09427 40 10594 μ₆₀ 14365 09427 60 8709 Erros Padrão EPμ₄₀ 566 126 40598²332404 ¹² 2975 EPμ₆₀ 566 126 60598²332404 ¹² 1476 IC de 95 para μ₄₀ 10594 2064 2975 10594 614 998 1121 IC de 95 para μ₆₀ 8709 2064 1476 8709 305 840 901 Como esperado a amplitude do intervalo relativo à idade de 40 anos é maior do que a amplitude do intervalo relativo à idade de 60 anos pois esta última idade é mais próxima da média das idades na amostra Departamento de Estatística ICEx UFMG Disciplina Métodos Estatísticos Avançados em Epidemiologia EST815 Profa Edna Afonso Reis L012Soluções Soluções da 1ª Lista de Exercícios Parte 2 Exercício 1 Y quantidade de gordura corporal Kg X1 espessura da dobra do tríceps mm X2 circunferência da coxa cm X3 circunferência do braço cm a As figuras 11 a 13 mostram um relação linear crescente de moderada a forte entre a quantidade de gordura corporal e a espessura da dobra do tríceps e a circunferência da coxa e uma relação muito fraca ou mesmo inexistente entre a quantidade de gordura corporal e a circunferência do braço Na tabela ANOVA Quadro 11 o teste F da significância da regressão rejeita a hipótese nula valorp005 de que todos os coeficientes das variáveis X1 X2 e X3 são nulos Os teste T individuais Quadro 12 mostra como esperado que são significantes apenas os coeficientes das variáveis X1 e X2 Do Quadro 11 podemos calcular que SQT SQR SQE 4015 939 4954 o que permite calcular o coeficiente de determinação em R2 40154954 081 e o coeficiente de determinação ajustado em 0 77 3 1 20 20 1 0 81 1 1 2 Rajd o que indica que 77 da variabilidade total da quantidade de gordura corporal é explicada pela variação na espessura da dobra do tríceps na circunferência da coxa e na circunferência do braço b Modelo ajustado Y 3978 030 X1 112 X2 036 X3 Mantendose constantes os valores de circunferência da coxa e do antebraço estimase que a cada aumento de 1 mm na espessura da dobra do tríceps aumentase em 030 kg a média da quantidade de gordura corporal Mantendose constantes os valores de espessura da dobra do tríceps e da circunferência do braço estimase que a cada aumento de 1 cm na circunferência da coxa aumentase em 112 kg a média da quantidade de gordura corporal Mantendose constantes os valores de espessura da dobra do tríceps e da circunferência da coxa estimase que a cada aumento de 1 cm na circunferência do braço aumentase em 036 kg a média da quantidade de gordura corporal Entretanto este coeficiente não foi considerado significativo no modelo 3 1 13 2 1 12 3 3 2 2 1 1 erro X X X X X X X Y Departamento de Estatística ICEx UFMG Disciplina Métodos Estatísticos Avançados em Epidemiologia EST815 Profa Edna Afonso Reis L013Soluções Soluções da 1ª Lista de Exercícios Parte 3 Exercício 1 Y quantidade de gordura corporal Kg X1 espessura da dobra do tríceps mm X2 circunferência da coxa cm X3 circunferência do braço cm Modelo ajustado Y 30 022 X1 105 X2 033 X3 15 F1 35 F2 Para idade entre 20 e 30 anos Y 300 022 X1 105 X2 033 X3 Para idade entre 31 e 40 anos Y 285 022 X1 105 X2 033 X3 Para idade entre 41 e 50 anos Y 265 022 X1 105 X2 033 X3 Como não há neste modelo ajustado efeito de interação entre idade e as variáveis X1 X2 e X3 o efeito da idade na média da quantidade de gordura corporal é apenas no intercepto do modelo Isso significa que a média da quantidade de gordura corporal é maior para idades maiores há um acréscimo médio de 15 kg ao se passar da faixa de 2030 anos para a faixa de 3140 anos e um acréscimo médio de 35kg de 2030anos para 4150 anos consequentemente um acréscimo médio de 20kg da faixa etária de 3140 anos para 4150 anos embora sua taxa de crescimento com as demais variáveis seja a mesma em todas as idades Exercício 2 Y quantidade de sólidos suspensos em um sistema de limpeza por carvão X pH do sistema X e Z1 e Z2 tipo de polímero polímero 1 Z11 e Z20 polímero 2 Z10 e Z21 polímero 3 Z10 e Z20 a A relação entre Y e X mostrase linear crescente muito forte para os três tipos de polímero O efeito linear de X coeficiente 1 inclinação da reta parece ser o mesmo para os polímeros 2 e 3 e um pouco menor para o polímero 1 O intercepto da reta coeficiente 0 parece ser maior para o polímero 1 e quase o mesmo para os demais Para um pH fixo parece haver maior quantidade de sólidos suspensos para o polímero 1 do que para os outros dois compararandose os polímeros 2 e 3 a diferença na variável resposta é menor b Análise dos efeitos do pH do sistema e do tipo de polímero na quantidade de sólidos suspensos no modelo ajustado Y 158 538 X 198 Z1 109 Z2 136 X Z1 Polímero 1 Y 158 538X 1981 1090 136X1 158198 538136X 40 402X Polímero 2 Y 158 538X 1980 1091 136X0 158 109 538X 267 538X Polímero 3 Y 158 538X 1980 1090 136X0 158 538X Não interpretamos os coeficientes de intercepto nas três retas neste caso pois o intervalo de variação de X nesta amostra está muito distante do zero Quanto aos coeficientes de inclinação podemos dizer que a cada aumento de 1 unidade no pH do sistema estimase que a média da quantidade de sólidos suspensos aumenta em 402 unidades para o polímero 1 em 538 unidades para os polímeros 2 e 3 c Sim é necessário incluir interação entre as variáveis explicativas neste modelo pois o efeito de X em Y coeficiente linear não é o mesmo é menor para o polímero 1 em relação aos polímeros 2 e 3 A quantidade média de sólidos supensos cresce com o pH mais lentamente para o polímero 1 do que para os demais polímeros Exercício 3 Y gasto com acessórios no ato da compra do automóvel em reais X1 valor do automóvel em reais X2 sexo do comprador 0feminino 1masculino X3 idade do comprador em anos completos IO gasto com acessórios cresce linearmente com o valor do automóvel Incluir o termo linear 1X1 no modelo espera que 10 IIAs mulheres gastam menos com acessórios do que os homens Incluir o termo linear 2X2 no modelo espera que 20 IIIO gasto com acessórios decresce linearmente com a idade do comprador Incluir o termo linear 3X3 no modelo espera que 30 IVO efeito linear do valor do automóvel no gasto com acessórios não é o mesmo nos dois sexos Incluir o termo de interação 12X1X2 no modelo VO efeito linear do valor do automóvel no gasto com acessórios não é o mesmo para qualquer idade do comprador e viceversa Incluir o termo de interação 13X1X3 no modelo VIO efeito linear da idade do comprador no gasto com acessórios é o mesmo nos dois sexos Não incluir o termo de interação 23X2X3 no modelo O modelo final apresentado ao gerente foi do tipo d 3 1 13 2 1 12 3 3 2 2 1 1 erro X X X X X X X Y