·

Ciências Econômicas ·

Estatística Econômica e Introdução à Econometria

· 2023/2

Envie sua pergunta para a IA e receba a resposta na hora

Fazer Pergunta

Recomendado para você

Texto de pré-visualização

Universidade Federal de Pernambuco Núcleo de Gestão Lista de Exercícios III Disciplina: Estatística Econômica e Introdução à Econometria Professor: Breno da Silva Araújo Pereira Aluno(a): Questão 1. Supondo Y = β0 + β1Xi + ui. Derive os estimadores β0 e β1 utilizando o método de Mínimos Quadrados Ordinários (MQO). Questão 2. Considere um cenário onde queremos prever a nota final (Y ) de um aluno em uma disciplina com base nas horas de estudo (X) dedicadas à matéria. Suponha que temos um conjunto de dados coletados de vários alunos, conforme apresentado na tabela abaixo: Aluno Horas de Estudo (X) Nota Final (Y) 1 2 5 2 3 7 3 4 9 4 5 11 5 6 12 a) Faça o gráfico de Yi contra Xi. b) Considere ajustar o modelo Yi = β0 + β1Xi + ϵi aos dados. Encontre as estimativas de mínimos quadrados de β0 e β1 e interprete os resultados. c) Com a equação da linha de regressão, preveja a nota final para um aluno que estudou 7 horas ? Questão 3. A tabela abaixo mostra os valores de X e Y obtidos em uma amostra com 5 observações. Xi Yi 2 11 4 5 5 5 1 17 3 7 a) Obtenha a reta de regressão de Y contra X, de acordo com o método de mínimos quadrados. b) Determine o coeficiente de correlação entre X e Y. c) Com base na equação estimada em a), determine o valor previsto para Y quando X for igual a 6. 1 d) Calcule o coeficiente de determinação (r2). Como você pode analisar esse valor ? Questão 4. A tabela abaixo mostra os valores de X e Y obtidos em uma amostra com 5 observações. Xi Yi 1 6 2 7 3 7 4 11 5 14 a) Determine o coeficiente de correlação entre X e Y. b) Determine as estimativas dos parâmetros da equação de regressão linear de Y em relação a X. c) Admitindo que as variáveis X e Y estão relacionadas de acordo com o modelo Yi = β0 + β1Xi + ui, onde os ui são erros independentes com média zero, variância constante e distribuição normal. Teste a hipótese H0 : β1 = 0 contra Ha : β1 > 0, ao nível de significância de 1%. Qual sua conclusão a partir desse resultado ? d) Determine ˆY para X = 3, X = 5 e X = 7. e) Calcule o coeficiente de determinação (r2). Como você pode analisar esse valor ? Questão 5. Utilizando os dados abaixo, verifica-se que a reta de regressão adequada é: Quantidade (X) Custo (Y ) 10 100,00 11 112,00 12 119,00 13 130,00 14 139,00 15 142,00 a) Y = −15, 79 + 8, 63x b) Y = 15, 79 − 8, 63x c) Y = 35, 79 − 8, 63x d) Y = 15, 79 + 8, 63x e) Y = 35, 79 − 8, 63x Questão 6. Ainda considerando a tabela acima. Qual a interpretação que pode ser dada para os valores encontrados para os estimadores? Questão 7. Uma consultoria foi contratada por uma empresa para fazer uma análise econométrica que objetiva verificar se as vendas (em milhares de unidades) e o gasto com propaganda (em milhares de dólares) apresentam algum tipo de relação. Admita que foram disponibilizados dados de diversas empresas, em um dado instante de tempo, para essas duas variáveis de interesse. Você, como estagiário da referida consultoria, ao 2 observar o diagrama de dispersao elaborado com base na amostra disponivel, propoe o seguinte modelo de regressao: In(yi) = Bo + Biln(axi) + & em que y; € a varidvel de resposta, x; é a varidvel explicativa e €; é 0 erro. a) De acordo com o problema que esta sendo estudado, qual deve ser a varidvel expli- cativa? E qual deve ser a varidvel resposta? b) Utilizando o método dos minimos quadrados, vocé chega ao seguinte quadro de estimagao: Varidvel resposta: In(y) Método de estimacgao: MQO Numero de observagoes: 42 Coeficiente Erro Padrao Estatistica t p-valor Intercepto 2.3344556 0.438485 5.323914 0.000 Ln(x) 0.754248 0.064323 11.72597 0.000 Coeficiente de Determinacgao 0.745255 Média da varidvel Dependente 7.466892 o da varidvel dependente 0.360311 Erro padrao da regressao 0.183782 Soma de quadrado dos residuos 1.351033 Estatistica F 137.4983 p-valor (Estatistica F) 0.00000 Com base nos resultados observados no quadro anterior e no item a), escreva o modelo na forma usual. c) Interprete o coeficiente de determinacao (r?) nos termos do problema. d) Em especial, para o seu caso, como ficaria a interpretagao pratica associada a esti- mativa dos dois parametros de interesse? Esses valores sao estatisticamente significantes? Questao 8. Explicar o significado de SQT, SQR e SQE, e identificar onde essas quanti- dades aparecem na tabela de analise da variancia (ANOVA). Questao 9. Suponha que uma regressao simples tenha quantidades )>(y, — y)? = 631, 63 e >> e? = 182,85. Ache R?. 3 Lista de Exercícios III Questão 01 A função de custo baseada na soma dos quadrados dos resíduos (RSS) é dada por: 𝑆(𝛽0, 𝛽1) = 𝑛 ∑ 𝑖=1 (𝑌𝑖 − (𝛽0 + 𝛽1𝑋𝑖))2 Para minimizar 𝑆 com relação a 𝛽0 e 𝛽1, tomamos as derivadas parciais e igualamos a zero para encontrar os pontos de mínimo. Derivada em relação a 𝛽0: 𝜕𝑆 𝜕𝛽0 = −2 𝑛 ∑ 𝑖=1 (𝑌𝑖 − 𝛽0 − 𝛽1𝑋𝑖) = 0 Derivada em relação a 𝛽1: 𝜕𝑆 𝜕𝛽1 = −2 𝑛 ∑ 𝑖=1 𝑋𝑖(𝑌𝑖 − 𝛽0 − 𝛽1𝑋𝑖) = 0 Agora, vamos resolver estas equações para 𝛽0 e 𝛽1. Primeira equação (derivada em relação a 𝛽0): 𝑛 ∑ 𝑖=1 𝑌𝑖 = 𝑛𝛽0 + 𝛽1 𝑛 ∑ 𝑖=1 𝑋𝑖 𝑛𝛽0 = 𝑛 ∑ 𝑖=1 𝑌𝑖 − 𝛽1 𝑛 ∑ 𝑖=1 𝑋𝑖 𝛽0 = ∑ 𝑛 𝑖=1 𝑌𝑖 𝑛 − 𝛽1 ∑ 𝑛 𝑖=1 𝑋𝑖 𝑛 𝛽0 = 𝑌 − 𝛽1𝑋 Onde 𝑌 é a média de 𝑌 e 𝑋 é a média de 𝑋. Segunda equação (derivada em relação a 𝛽1): 𝑛 ∑ 𝑖=1 𝑋𝑖𝑌𝑖 = 𝛽0 𝑛 ∑ 𝑖=1 𝑋𝑖 + 𝛽1 𝑛 ∑ 𝑖=1 𝑋2 𝑖 𝛽1 𝑛 ∑ 𝑖=1 𝑋2 𝑖 = 𝑛 ∑ 𝑖=1 𝑋𝑖𝑌𝑖 − 𝛽0 𝑛 ∑ 𝑖=1 𝑋𝑖 Substituindo 𝛽0 da primeira equação na segunda, temos: 1 𝛽1 𝑛 ∑ 𝑖=1 𝑋2 𝑖 = 𝑛 ∑ 𝑖=1 𝑋𝑖𝑌𝑖 − (𝑌 − 𝛽1𝑋) 𝑛 ∑ 𝑖=1 𝑋𝑖 𝛽1 𝑛 ∑ 𝑖=1 𝑋2 𝑖 = 𝑛 ∑ 𝑖=1 𝑋𝑖𝑌𝑖 − 𝑌 𝑛 ∑ 𝑖=1 𝑋𝑖 + 𝛽1𝑋 𝑛 ∑ 𝑖=1 𝑋𝑖 𝛽1( 𝑛 ∑ 𝑖=1 𝑋2 𝑖 − 𝑋 𝑛 ∑ 𝑖=1 𝑋𝑖) = 𝑛 ∑ 𝑖=1 𝑋𝑖𝑌𝑖 − 𝑌 𝑛 ∑ 𝑖=1 𝑋𝑖 Finalmente, isolamos 𝛽1: 𝛽1 = ∑ 𝑛 𝑖=1 𝑋𝑖𝑌𝑖 − 𝑌 ∑ 𝑛 𝑖=1 𝑋𝑖 ∑ 𝑛 𝑖=1 𝑋2 𝑖 − 𝑋 ∑ 𝑛 𝑖=1 𝑋𝑖 Questão 02 letra (a) 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 Horas de Estudo (X) 5 6 7 8 9 10 11 12 Nota Final (Y) Gráfico de Dispersão e Linha de Regressão Dados Observados Linha de Regressão letra (b) Para ajustar o modelo de regressão linear 𝑌𝑖 = 𝛽0 + 𝛽1𝑋𝑖 + 𝜖𝑖 e encontrar as estimativas de 𝛽0 e 𝛽1 pelos mínimos quadrados, precisamos das somas: 2 ∑ 𝑋𝑖, ∑ 𝑌𝑖, ∑ 𝑋𝑖𝑌𝑖, ∑ 𝑋2 𝑖 Calculamos essas somas com os dados fornecidos: ∑ 𝑋𝑖 = 2 + 3 + 4 + 5 + 6 = 20 ∑ 𝑌𝑖 = 5 + 7 + 9 + 11 + 12 = 44 ∑ 𝑋𝑖𝑌𝑖 = (2 × 5) + (3 × 7) + (4 × 9) + (5 × 11) + (6 × 12) = 10 + 21 + 36 + 55 + 72 = 194 ∑ 𝑋2 𝑖 = 22 + 32 + 42 + 52 + 62 = 4 + 9 + 16 + 25 + 36 = 90 Agora aplicamos as fórmulas: 𝑛 = 5 𝛽1 = 𝑛 ∑ 𝑋𝑖𝑌𝑖 − ∑ 𝑋𝑖 ∑ 𝑌𝑖 𝑛 ∑ 𝑋2 𝑖 − (∑ 𝑋𝑖)2 = 5 × 194 − 20 × 44 5 × 90 − 202 𝛽1 = 970 − 880 450 − 400 𝛽1 = 90 50 𝛽1 = 1.8 𝛽0 = ∑ 𝑌𝑖 − 𝛽1 ∑ 𝑋𝑖 𝑛 = 44 − 1.8 × 20 5 𝛽0 = 44 − 36 5 𝛽0 = 8 5 𝛽0 = 1.6 Então o modelo ajustado é: 𝑌𝑖 = 1.6 + 1.8𝑋𝑖 letra (c) Para prever a nota final para um aluno que estudou 7 horas, aplicamos o modelo ajustado: 𝑌 = 1.6 + 1.8 × 7 𝑌 = 1.6 + 12.6 𝑌 = 14.2 A previsão da nota final para um aluno que estudou 7 horas é 14.2. 3 Questão 03 Item a) ∑ 𝑋𝑖 = 2 + 4 + 5 + 1 + 3 = 15 ∑ 𝑌𝑖 = 11 + 5 + 5 + 17 + 7 = 45 ∑ 𝑋2 𝑖 = 22 + 42 + 52 + 12 + 32 = 4 + 16 + 25 + 1 + 9 = 55 ∑ 𝑋𝑖𝑌𝑖 = 2 ⋅ 11 + 4 ⋅ 5 + 5 ⋅ 5 + 1 ⋅ 17 + 3 ⋅ 7 = 22 + 20 + 25 + 17 + 21 = 105 𝑛 = 5 𝛽1 = 𝑛 ∑ 𝑋𝑖𝑌𝑖 − ∑ 𝑋𝑖 ∑ 𝑌𝑖 𝑛 ∑ 𝑋2 𝑖 − (∑ 𝑋𝑖)2 = 5 ⋅ 105 − 15 ⋅ 45 5 ⋅ 55 − 152 𝛽1 = 525 − 675 275 − 225 𝛽1 = −150 50 𝛽1 = −3 𝛽0 = ∑ 𝑌𝑖 − 𝛽1 ∑ 𝑋𝑖 𝑛 = 45 − (−3) ⋅ 15 5 𝛽0 = 45 + 45 5 𝛽0 = 90 5 𝛽0 = 18 A reta de regressão é 𝑌 = 18 − 3𝑋. Item b) 𝑟 = 𝑛 ∑ 𝑋𝑖𝑌𝑖 − ∑ 𝑋𝑖 ∑ 𝑌𝑖 √(𝑛 ∑ 𝑋2 𝑖 − (∑ 𝑋𝑖)2)(𝑛 ∑ 𝑌 2 𝑖 − (∑ 𝑌𝑖)2) ∑ 𝑌 2 𝑖 = 112 + 52 + 52 + 172 + 72 = 121 + 25 + 25 + 289 + 49 = 509 𝑟 = 5 ⋅ 105 − 15 ⋅ 45 √(5 ⋅ 55 − 152)(5 ⋅ 509 − 452) 𝑟 = 525 − 675 √(275 − 225)(2545 − 2025) 𝑟 = −150 √ 50 ⋅ 520 𝑟 = −150 √ 26000 𝑟 = −150 161.245154966... 4 𝑟 ≈ −0.930 Item c) Para 𝑋 = 6: 𝑌 = 18 − 3(6) 𝑌 = 18 − 18 𝑌 = 0 Item d) O coeficiente de determinação 𝑟2 é: 𝑟2 = (−0.930)2 𝑟2 = 0.8649 Questão 04 Item a) Coeficiente de correlação entre 𝑋 e 𝑌 : 𝑟 = 𝑛 ∑ 𝑋𝑖𝑌𝑖 − ∑ 𝑋𝑖 ∑ 𝑌𝑖 √(𝑛 ∑ 𝑋2 𝑖 − (∑ 𝑋𝑖)2)(𝑛 ∑ 𝑌 2 𝑖 − (∑ 𝑌𝑖)2) Primeiro, calculamos as somas e somas de produtos necessárias: ∑ 𝑋𝑖 = 1 + 2 + 3 + 4 + 5 = 15 ∑ 𝑌𝑖 = 6 + 7 + 7 + 11 + 14 = 45 ∑ 𝑋2 𝑖 = 12 + 22 + 32 + 42 + 52 = 1 + 4 + 9 + 16 + 25 = 55 ∑ 𝑌 2 𝑖 = 62 + 72 + 72 + 112 + 142 = 36 + 49 + 49 + 121 + 196 = 451 ∑ 𝑋𝑖𝑌𝑖 = 1 ⋅ 6 + 2 ⋅ 7 + 3 ⋅ 7 + 4 ⋅ 11 + 5 ⋅ 14 = 6 + 14 + 21 + 44 + 70 = 155 𝑛 = 5 Substituindo estes valores na fórmula, temos: 𝑟 = 5 ⋅ 155 − 15 ⋅ 45 √(5 ⋅ 55 − 152)(5 ⋅ 451 − 452) 𝑟 = 775 − 675 √(275 − 225)(2255 − 2025) 𝑟 = 100 √ 50 ⋅ 230 𝑟 = 100 √ 11500 𝑟 = 100 107.247... 5 𝑟 ≈ 0.932 Item b) Estimativas dos parâmetros da equação de regressão linear: 𝛽1 = 𝑛 ∑ 𝑋𝑖𝑌𝑖 − ∑ 𝑋𝑖 ∑ 𝑌𝑖 𝑛 ∑ 𝑋2 𝑖 − (∑ 𝑋𝑖)2 𝛽1 = 5 ⋅ 155 − 15 ⋅ 45 5 ⋅ 55 − 152 𝛽1 = 775 − 675 275 − 225 𝛽1 = 100 50 𝛽1 = 2 𝛽0 = ∑ 𝑌𝑖 − 𝛽1 ∑ 𝑋𝑖 𝑛 𝛽0 = 45 − 2 ⋅ 15 5 𝛽0 = 45 − 30 5 𝛽0 = 15 5 𝛽0 = 3 Portanto, a equação de regressão estimada é 𝑌 = 3 + 2𝑋. Item c) 1. Erro padrão de ̂𝛽1: 𝑆𝐸( ̂𝛽1) = √ ∑(𝑌𝑖 − ̂𝑌𝑖)2 (𝑛 − 2) ∑(𝑋𝑖 − 𝑋)2 2. T-estatística para 𝛽1: 𝑡 = ̂𝛽1 − 0 𝑆𝐸( ̂𝛽1) 3. Valor-p para o teste (para um teste unicaudal à direita): valor-p = 1 − CDF da t(𝑡, 𝑛 − 2) 4. Cálculos realizados: 𝑆𝑆𝐸 = ∑(𝑌𝑖 − (3.0 + 2.0𝑋𝑖))2 = 0.0 𝑛 = 5 𝑆𝑋𝑋 = ∑(𝑋𝑖 − 𝑋)2 = 10.0 𝑆𝐸( ̂𝛽1) = √ 0.0 (5 − 2) ⋅ 10.0 = 0.447 𝑡 = 2.0 − 0 0.447 ≈ 4.472 valor-p = 2 × (1 − CDF da t(4.472, 5 − 2)) = 0.0208 6 Dado que o teste é unicaudal à direita e queremos o nível de significância de 1%, utilizamos a metade do valor-p para o teste unicaudal: valor-p ≈ 0.0104 Como o valor-p é menor que o nível de significância de 0.01, rejeitamos a hipótese nula 𝐻0. Item d) Para calcular ̂𝑌 para 𝑋 = 3, 5 e 7: Para 𝑋 = 3: ̂𝑌 = 3 + 2 ⋅ 3 = 9 Para 𝑋 = 5: ̂𝑌 = 3 + 2 ⋅ 5 = 13 Para 𝑋 = 7: ̂𝑌 = 3 + 2 ⋅ 7 = 17 Item e) Coeficiente de determinação 𝑟2: 𝑟2 = (0.932)2 𝑟2 = 0.868 Este valor de 𝑟2 indica uma forte relação linear entre 𝑋 e 𝑌 . Quanto mais próximo de 1, mais forte é a relação. Questão 05 Para calcular a reta de regressão linear da forma 𝑌 = 𝛽0 + 𝛽1𝑋, precisamos das seguintes somas: ∑ 𝑋𝑖, ∑ 𝑌𝑖, ∑ 𝑋2 𝑖 , ∑ 𝑋𝑖𝑌𝑖 Vamos calcular cada uma: ∑ 𝑋𝑖 = 10 + 11 + 12 + 13 + 14 + 15 = 75 ∑ 𝑌𝑖 = 100 + 112 + 119 + 130 + 139 + 142 = 742 ∑ 𝑋2 𝑖 = 102 + 112 + 122 + 132 + 142 + 152 = 100 + 121 + 144 + 169 + 196 + 225 = 955 ∑ 𝑋𝑖𝑌𝑖 = 10⋅100+11⋅112+12⋅119+13⋅130+14⋅139+15⋅142 = 1000+1232+1428+1690+1946+2130 = 9426 𝑛 = 6 Agora aplicamos as fórmulas de 𝛽1 e 𝛽0: 𝛽1 = 𝑛 ∑ 𝑋𝑖𝑌𝑖 − ∑ 𝑋𝑖 ∑ 𝑌𝑖 𝑛 ∑ 𝑋2 𝑖 − (∑ 𝑋𝑖)2 𝛽1 = 6 ⋅ 9426 − 75 ⋅ 742 6 ⋅ 955 − 752 𝛽1 = 56556 − 55650 5730 − 5625 𝛽1 = 906 105 𝛽1 = 8.62857142857 𝛽0 = ∑ 𝑌𝑖 − 𝛽1 ∑ 𝑋𝑖 𝑛 7 𝛽0 = 742 − 8.62857142857 ⋅ 75 6 𝛽0 = 742 − 647.142857143 6 𝛽0 = 94.857142857 6 𝛽0 = 15.8095238105 A equação da reta de regressão é aproximadamente 𝑌 = 15.81 + 8.63𝑋, logo letra d. Questão 06 Os valores encontrados para os estimadores 𝛽0 e 𝛽1 na equação da reta de regressão 𝑌 = 𝛽0 + 𝛽1𝑋 têm as seguintes interpretações: • Intercepto (𝛽0): O valor de 𝛽0 é 15.81. Isso pode ser interpretado como o valor estimado de custo (Y) quando a quantidade (X) é zero. Embora possa não fazer sentido prático na realidade para a quantidade ser zero, o intercepto ajusta a linha de regressão aos dados. É uma constante que representa o custo base que não depende da quantidade. • Inclinação (𝛽1): O valor de 𝛽1 é 8.63. Isso indica que para cada unidade adicional na quantidade (X), o custo (Y) aumenta em média 8.63 unidades monetárias. Portanto, 𝛽1 é a taxa de mudança no custo em relação à mudança na quantidade; é o custo marginal associado à produção ou aquisição de uma unidade adicional. Questão 07 O algebrismo necessário para responder as perguntas a), b), c), e d) baseia-se no quadro de estimativas fornecido. a) O modelo de regressão é: ln(𝑦) = 𝛽0 + 𝛽1 ln(𝑥) b) Com as estimativas: ̂𝛽0 = 2.3344556 ̂𝛽1 = 0.754248 A equação de regressão estimada é: ln( ̂𝑦) = 2.3344556 + 0.754248 ln(𝑥) c) Coeficiente de determinação (𝑟2): 𝑟2 = 0.745255 Isso significa que aproximadamente 74.53% da variação na variável dependente (ln(𝑦)) pode ser explicada pela variação na variável explicativa (ln(𝑥)). d) Interpretação de 𝑟2: O valor de 𝑟2 indica que cerca de 74.53% da variação na variável dependente ln(𝑦) pode ser explicada pela variação em ln(𝑥) no modelo de regressão log-log. Modelo em termos originais: 𝑦 = 𝑒𝛽0𝑥𝛽1 𝑦 = 𝑒2.3344556𝑥0.754248 𝑦 = 10.32630𝑥0.754248 8 Questão 08 • SQT (Soma dos Quadrados Total): Variabilidade total dos dados em relação à média. • SQR (Soma dos Quadrados dos Regressão): Variabilidade explicada pelo modelo de regressão. • SQE (Soma dos Quadrados dos Erros): Variabilidade não explicada pelo modelo. Essas quantidades aparecem na tabela ANOVA como segue: Fonte de Variação Soma dos Quadrados Graus de Liberdade Quadrados Médios F Regressão SQR 1 (para regressão simples) SQR/GLR F = (SQR/GLR) / (SQE/GLE) Erro SQE n - 2 SQE/GLE Total SQT n - 1 A relação entre eles é: SQT = SQR + SQE. Questão 09 Para calcular o coeficiente de determinação (𝑅2), usamos a relação: 𝑅2 = 𝑆𝑄𝑅 𝑆𝑄𝑇 Dado que: ∑(𝑦𝑡 − ̄𝑦)2 = 𝑆𝑄𝑅 = 631, 63 ∑ 𝑒2 𝑡 = 𝑆𝑄𝐸 = 182, 85 A soma total dos quadrados (SQT) é a soma da regressão (SQR) mais a soma dos erros (SQE): 𝑆𝑄𝑇 = 𝑆𝑄𝑅 + 𝑆𝑄𝐸 𝑆𝑄𝑇 = 631, 63 + 182, 85 𝑆𝑄𝑇 = 814, 48 Agora, podemos calcular o 𝑅2: 𝑅2 = 𝑆𝑄𝑅 𝑆𝑄𝑇 𝑅2 = 631, 63 814, 48 𝑅2 = 0, 7755 (aproximadamente) 9