·
Ciências Econômicas ·
Econometria
Envie sua pergunta para a IA e receba a resposta na hora
Recomendado para você
1
Prova Econometria - Análise de Regressão e Determinantes de Rendimentos
Econometria
PUC
1
Analise Graficos Distribuicao Probabilidade Estimadores Lineares - Escolha Estimador Ideal
Econometria
PUC
1
Análise de Vendas de Atum e Determinantes dos Rendimentos do Trabalho
Econometria
PUC
17
Resolução da Lista de Exercícios 01 - Modelo Econométrico da Equação de Demanda
Econometria
PUC
1
Análise de Regressão do Salário com Base na Educação
Econometria
PUC
1
Análise de Teste de Hipótese sobre a Variável Educ e Salário
Econometria
PUC
1
Primeira Avaliação de Econometria I
Econometria
PUC
1
Quiz Econometria I - Regressão Linear e Presença de Público em Jogos de Baseball
Econometria
PUC
12
Relatório de Análise e Modelagem de Variável: Exportações do Brasil
Econometria
PUC
97
Viés e Endogeneidade na Estimação de Modelos Econométricos
Econometria
PUC
Texto de pré-visualização
Multicolinearidade Prof Samira Schatzmann Leitura Wooldridge 24a Apêndice E E1 e E2 principais E3 complementar HGJ 87 Gujarati Cap 10 Apêndice C Sartoris 8B4 e 91 In a nutshell Derivamos o estimador de MQO a partir de uma regressão linear simples apenas uma variável exógena usando álgebra linear Para derivar o estimador de MQO de uma regressão múltipla é mais fácil utilizarmos álgebra matricial Ao fazer isso verificamos que obrigatoriamente uma das matrizes do sistema tem que ser inversível Para ser inversível todos os vetores da matriz devem ser linearmente independentes entre si caso contrário não conseguimos recuperar o parâmetro a ser estimado As variáveis econômicas quase sempre vão guardar alguma relação entre si Se essa relação for grande o suficiente a ponto de comprometer o estimador de MQO dizemos que o modelo sofre de multicolinearidade Não há um teste específico para verificar essa questão e nem há necessidade Podemos apenas verificar o grau de correlação entre as variáveis exógenas frequentemente representado na forma de uma matriz Vamos relembrar nossa trajetória Vimos durante a revisão na Aula 01 que o Teorema de Gauss Markov quando verificado diz que os estimadores de MQO são BLUE Estamos vendo agora o que acontece quando os pressupostos não se verificam Na Aula 02 vimos o que acontece quando a esperança condicional de u é diferente de zero Quais as implicações Viés no estimador de MQO Na Aula 03 vimos se nosso modelo está com a melhor especificação possível para estimar os impactos de X em Y Na Aula 04 vamos ver o que acontece se as variáveis do nosso modelo tiverem relações lineares exatas entre si Multicolinearidade Se enquadra como problema de especificação do modelo Em geral é associado a um problema amostral O melhor jeito de entender que tipo de problema a multicolinearidade pode trazer para um modelo de regressão linear é analisandoo sob a forma matricial REGRESSÃO LINEAR MÚLTIPLA Yi β0 β1X1i β2X2i βkXki ui Yi β0 β1X1i β2X2i βkXki ui i 1 2 n REGRESSÃO LINEAR MÚLTIPLA Podemos reescrever assim ou ainda assim Yn Y₁ β₀ β₁X₁₁ β₂X₂₁ βₖXₖ₁ u₁ Y₂ β₀ β₁X₁₂ β₂X₂₂ βₖXₖ₂ u₂ Y1 beta0 beta1 X11 beta2 X21 ldots betak Xk1 u1 Y2 beta0 beta1 X12 beta2 X22 ldots betak Xk2 u2 Yn beta0 beta1 Xin beta2 X2n ldots betak Xkn Y₁ β₀ β₁X₁₁ β₂X₂₁ βₖXₖ₁ u₁ Y₂ β₀ β₁X₁₂ β₂X₂₂ βₖXₖ₂ u₂ Yₙ β₀ β₁X₁ₙ β₂X₂ₙ βₖXₖₙ uₙ Y₁β₀β₁X₁₁β₂X₂₁βkXk₁u₁ Y₂β₀β₁X₁₂β₂X₂₂βkXk₂u₂ Podemos colocar esse sistema na forma matricial Reescrevendo as n equações em forma de matrizes teremos Reescrevendo as n equações em forma de matrizes teremos Reescrevendo as n equações em forma de matrizes teremos Reescrevendo as n equações em forma de matrizes teremos Reescrevendo as n equações em forma de matrizes teremos Reescrevendo as n equações em forma de matrizes teremos Reescrevendo as n equações em forma de matrizes teremos Reescrevendo as n equações em forma de matrizes teremos Reescrevendo as n equações em forma de matrizes teremos n1 Reescrevendo as n equações em forma de matrizes teremos Reescrevendo as n equações em forma de matrizes teremos constante B0 Reescrevendo as n equações em forma de matrizes teremos Reescrevendo as n equações em forma de matrizes teremos Reescrevendo as n equações em forma de matrizes teremos Esse conjunto de equações portanto pode ser reduzido a YXbu Esse conjunto de equações portanto pode ser reduzido a YXbu vetor matriz coluna que contém as observações da variável dependente Esse conjunto de equações portanto pode ser reduzido a YXbu matriz que inclui as diversas observações das variáveis independentes além de uma coluna de números 1 que correspondem ao intercepto β0 Esse conjunto de equações portanto pode ser reduzido a YXbu vetor com os coeficientes a serem estimados Esse conjunto de equações portanto pode ser reduzido a β XX¹XY β XX¹XY análogo a ΣXY ESTIMATIVA DOS PARÂMETROS ˆβ XX1XY ˆβ XX1XY hatbeta XX1XY Varu Eu2 rightarrow Eu cdot u Varu Eu2 rightarrow Eu cdot u ext Equivalente em termos de matriz Var u Eu² Eu u Var u Eu² Eu u vejamos Var u Eu² Eu u veamos u u u₁ u₁ u₂ uₙ u u u₁² u₁u₂ u₁uₙ uu u₁² u₁u₂ u₁uₙ u₂u₁ u₂² u₂uₙ uₙu₁ uₙu₂ uₙ² Euu σ² 0 0 0 0 0 σ² 0 0 0 0 σ² Euu σ² 0 0 0 0 0 σ² 0 0 0 0 σ² homocedástico uu w12 w1u2 w1un u2w1 w22 u2un unu1 unu2 wn2 Euu σ2 0 0 0 σ2 0 0 0 σ2 Euu σ2 0 0 0 σ2 0 0 0 σ2 colorar em evidência Euu σ² 0 0 0 0 σ² σ² 1 0 0 0 Ewu σ² 0 0 0 σ² 0 0 0 0 σ² 1 0 0 0 1 0 0 0 0 matriz identidade I Ewu σ² 0 0 0 σ² 0 0 0 0 Ewu σ² 1 0 0 0 1 0 0 0 1 ESTIMATIVA DOS PARÂMETROS ˆβ XX¹XY Varˆβ σ²XX¹ ESTIMATIVA VARIÂNCIA ERROS ˆσ² S² uw nk1 Vamos aos problemas da multicolinearidade MULTICOLINEARIDADE PERFEITA Posto Matricial A hipótese da não multicolinearidade perfeita em econometria avançada é chamada também de Condição de postoposto completo Corresponde ao número de linhas ou colunas linearmente independentes da matriz Resgatando o slide lá de trás Resgatando o slide lá de trás Duas ou colunas são combinações lineares perfeitas Vamos ver o que acon tece c os estimadores de MQO ˆβ XX1XY Varˆβ σ2XX1 ˆβ XX1XY Varˆβ σ2XX1 Quando há colinearidade perfeita na matriz X XX não é inversível ESTIMATIVA DOS PARÂMETROS MULTICOLINEARIDADE NÃO PERFEITA Resgatando o slide lá de trás beginbmatrix y1 y2 vdots ym endbmatrix beginbmatrix 1 x11 x12 ldots x1k 1 x21 x22 ldots x2k vdots vdots vdots ddots vdots 1 xn1 xn2 ldots xnk endbmatrix beginbmatrix beta0 beta1 vdots betak endbmatrix beginbmatrix u1 u2 vdots un endbmatrix não são combinações lineares perfeitas mas tem p alto Vamos ver o que acontece c os estimadores de MQO β XX¹XY Varβ σ²XX¹ Se p for alto perto de 1 ou 1 o valor do determinante dessa matriz será muito baixo β XX¹XY Varβ σ²XX¹ Portanto a variância do estimador será alta β XX¹XY Varβ σ²XX¹ Pensando em termos da RLS Varβ σ²x² ESTIMATIVA DOS PARÂMETROS ESTIMATIVA DOS PARÂMETROS Qual é mesmo o problema de aumentar a variância do estimador 1 Ele fica menos preciso tc b Varb tc b varb Teste de Hipóteses Teste de Hipóteses Teste de Hipóteses Teste de Hipóteses Enganoso Teste de Hipóteses Enganoso tc b Varb ou seja aumenta a chance de não rejeitar H0 falsa Erro tipo II Como identificar a multicolinearidade Podemos suspeitar que ela exista quando os testes t de significância individual dos parâmetros indicarem que eles não são significantes mas o teste F for significante eou o R² for alto Podemos investigar indícios visualmente com gráficos de dispersão entre as variáveis independentes Matriz de variância e covariância Podemos rodar regressões auxiliares das variáveis independentes contra as outras variáveis independentes O que fazer quando há multicolinearidade Podese retirar uma das variáveis correlacionadas do modelo Muitas vezes também é possível reduzir os efeitos da multicolinearidade por meio do aumento da amostra Isso porque a correlação alta pode ser decorrente da própria amostra isto é essa correlação pode não existir na população e um aumento das observações poderia refletir melhor esse fato Pode ser possível também reespecificar o modelo Há autores que não consideram a multicolinearidade um problema muito relevante Atividades extras dessa aula 1 Derivar o estimador de MQO na forma matricial apêndice cap 8 do Sartoris ou apêndice B do Wooldridge 2 Mostrar os impactos na variância do estimador de MQO na forma algébrica utilizar teorema 32 do Wooldridge e seção 34a EXERCÍCIOS Wooldridge 35 Em um estudo que relaciona a nota média em curso superior GPA ao tempo gasto em várias atividades você distribuiu uma pesquisa para vários estudantes Os estudantes devem responder quantas horas eles despendem em cada semana em quatro atividades estudo study sono sleep trabalho work e lazer leisure Toda atividade é colocada em uma das quatro categorias de modo que para cada estudante a soma das horas nas quatro atividades deve ser igual a 168 i No modelo colGPA β0 β1study β2sleep β3work β4leisure u faz sentido manter sleep work e leisure fixos enquanto study varia ii Explique a razão de esse modelo violar a Hipótese RLM3 iii Como você poderia reformular o modelo de modo que seus parâmetros tivessem uma interpretação útil e ele satisfaça a Hipótese RLM3 A seguinte equação representa os efeitos das receitas totais de impostos sobre o crescimento subsequente do emprego para a população de municípios dos Estados Unidos cresc β₀ β₁parcₚ β₂parcᵣ β₃parcᵜ outros fatores em que cresc é a variação percentual do emprego de 1980 a 1990 enquanto o total das receitas de impostos tem a seguinte distribuição parcₚ é a parcela dos impostos sobre a propriedade parcᵣ é a parcela das receitas de impostos sobre a renda e parcᵜ é a parcela das receitas de impostos sobre as vendas Todas essas variáveis estão mensuradas em 1980 A parcela omitida parcᵜ inclui taxas e impostos variados Por definição as quatro parcelas somam um Outros fatores incluiriam despesas com educação infraestrutura e assim por diante todos mensurados em 1980 i Por que devemos omitir uma das variáveis da parcela de impostos da equação ii Dê uma interpretação cuidadosa de β₁
Envie sua pergunta para a IA e receba a resposta na hora
Recomendado para você
1
Prova Econometria - Análise de Regressão e Determinantes de Rendimentos
Econometria
PUC
1
Analise Graficos Distribuicao Probabilidade Estimadores Lineares - Escolha Estimador Ideal
Econometria
PUC
1
Análise de Vendas de Atum e Determinantes dos Rendimentos do Trabalho
Econometria
PUC
17
Resolução da Lista de Exercícios 01 - Modelo Econométrico da Equação de Demanda
Econometria
PUC
1
Análise de Regressão do Salário com Base na Educação
Econometria
PUC
1
Análise de Teste de Hipótese sobre a Variável Educ e Salário
Econometria
PUC
1
Primeira Avaliação de Econometria I
Econometria
PUC
1
Quiz Econometria I - Regressão Linear e Presença de Público em Jogos de Baseball
Econometria
PUC
12
Relatório de Análise e Modelagem de Variável: Exportações do Brasil
Econometria
PUC
97
Viés e Endogeneidade na Estimação de Modelos Econométricos
Econometria
PUC
Texto de pré-visualização
Multicolinearidade Prof Samira Schatzmann Leitura Wooldridge 24a Apêndice E E1 e E2 principais E3 complementar HGJ 87 Gujarati Cap 10 Apêndice C Sartoris 8B4 e 91 In a nutshell Derivamos o estimador de MQO a partir de uma regressão linear simples apenas uma variável exógena usando álgebra linear Para derivar o estimador de MQO de uma regressão múltipla é mais fácil utilizarmos álgebra matricial Ao fazer isso verificamos que obrigatoriamente uma das matrizes do sistema tem que ser inversível Para ser inversível todos os vetores da matriz devem ser linearmente independentes entre si caso contrário não conseguimos recuperar o parâmetro a ser estimado As variáveis econômicas quase sempre vão guardar alguma relação entre si Se essa relação for grande o suficiente a ponto de comprometer o estimador de MQO dizemos que o modelo sofre de multicolinearidade Não há um teste específico para verificar essa questão e nem há necessidade Podemos apenas verificar o grau de correlação entre as variáveis exógenas frequentemente representado na forma de uma matriz Vamos relembrar nossa trajetória Vimos durante a revisão na Aula 01 que o Teorema de Gauss Markov quando verificado diz que os estimadores de MQO são BLUE Estamos vendo agora o que acontece quando os pressupostos não se verificam Na Aula 02 vimos o que acontece quando a esperança condicional de u é diferente de zero Quais as implicações Viés no estimador de MQO Na Aula 03 vimos se nosso modelo está com a melhor especificação possível para estimar os impactos de X em Y Na Aula 04 vamos ver o que acontece se as variáveis do nosso modelo tiverem relações lineares exatas entre si Multicolinearidade Se enquadra como problema de especificação do modelo Em geral é associado a um problema amostral O melhor jeito de entender que tipo de problema a multicolinearidade pode trazer para um modelo de regressão linear é analisandoo sob a forma matricial REGRESSÃO LINEAR MÚLTIPLA Yi β0 β1X1i β2X2i βkXki ui Yi β0 β1X1i β2X2i βkXki ui i 1 2 n REGRESSÃO LINEAR MÚLTIPLA Podemos reescrever assim ou ainda assim Yn Y₁ β₀ β₁X₁₁ β₂X₂₁ βₖXₖ₁ u₁ Y₂ β₀ β₁X₁₂ β₂X₂₂ βₖXₖ₂ u₂ Y1 beta0 beta1 X11 beta2 X21 ldots betak Xk1 u1 Y2 beta0 beta1 X12 beta2 X22 ldots betak Xk2 u2 Yn beta0 beta1 Xin beta2 X2n ldots betak Xkn Y₁ β₀ β₁X₁₁ β₂X₂₁ βₖXₖ₁ u₁ Y₂ β₀ β₁X₁₂ β₂X₂₂ βₖXₖ₂ u₂ Yₙ β₀ β₁X₁ₙ β₂X₂ₙ βₖXₖₙ uₙ Y₁β₀β₁X₁₁β₂X₂₁βkXk₁u₁ Y₂β₀β₁X₁₂β₂X₂₂βkXk₂u₂ Podemos colocar esse sistema na forma matricial Reescrevendo as n equações em forma de matrizes teremos Reescrevendo as n equações em forma de matrizes teremos Reescrevendo as n equações em forma de matrizes teremos Reescrevendo as n equações em forma de matrizes teremos Reescrevendo as n equações em forma de matrizes teremos Reescrevendo as n equações em forma de matrizes teremos Reescrevendo as n equações em forma de matrizes teremos Reescrevendo as n equações em forma de matrizes teremos Reescrevendo as n equações em forma de matrizes teremos n1 Reescrevendo as n equações em forma de matrizes teremos Reescrevendo as n equações em forma de matrizes teremos constante B0 Reescrevendo as n equações em forma de matrizes teremos Reescrevendo as n equações em forma de matrizes teremos Reescrevendo as n equações em forma de matrizes teremos Esse conjunto de equações portanto pode ser reduzido a YXbu Esse conjunto de equações portanto pode ser reduzido a YXbu vetor matriz coluna que contém as observações da variável dependente Esse conjunto de equações portanto pode ser reduzido a YXbu matriz que inclui as diversas observações das variáveis independentes além de uma coluna de números 1 que correspondem ao intercepto β0 Esse conjunto de equações portanto pode ser reduzido a YXbu vetor com os coeficientes a serem estimados Esse conjunto de equações portanto pode ser reduzido a β XX¹XY β XX¹XY análogo a ΣXY ESTIMATIVA DOS PARÂMETROS ˆβ XX1XY ˆβ XX1XY hatbeta XX1XY Varu Eu2 rightarrow Eu cdot u Varu Eu2 rightarrow Eu cdot u ext Equivalente em termos de matriz Var u Eu² Eu u Var u Eu² Eu u vejamos Var u Eu² Eu u veamos u u u₁ u₁ u₂ uₙ u u u₁² u₁u₂ u₁uₙ uu u₁² u₁u₂ u₁uₙ u₂u₁ u₂² u₂uₙ uₙu₁ uₙu₂ uₙ² Euu σ² 0 0 0 0 0 σ² 0 0 0 0 σ² Euu σ² 0 0 0 0 0 σ² 0 0 0 0 σ² homocedástico uu w12 w1u2 w1un u2w1 w22 u2un unu1 unu2 wn2 Euu σ2 0 0 0 σ2 0 0 0 σ2 Euu σ2 0 0 0 σ2 0 0 0 σ2 colorar em evidência Euu σ² 0 0 0 0 σ² σ² 1 0 0 0 Ewu σ² 0 0 0 σ² 0 0 0 0 σ² 1 0 0 0 1 0 0 0 0 matriz identidade I Ewu σ² 0 0 0 σ² 0 0 0 0 Ewu σ² 1 0 0 0 1 0 0 0 1 ESTIMATIVA DOS PARÂMETROS ˆβ XX¹XY Varˆβ σ²XX¹ ESTIMATIVA VARIÂNCIA ERROS ˆσ² S² uw nk1 Vamos aos problemas da multicolinearidade MULTICOLINEARIDADE PERFEITA Posto Matricial A hipótese da não multicolinearidade perfeita em econometria avançada é chamada também de Condição de postoposto completo Corresponde ao número de linhas ou colunas linearmente independentes da matriz Resgatando o slide lá de trás Resgatando o slide lá de trás Duas ou colunas são combinações lineares perfeitas Vamos ver o que acon tece c os estimadores de MQO ˆβ XX1XY Varˆβ σ2XX1 ˆβ XX1XY Varˆβ σ2XX1 Quando há colinearidade perfeita na matriz X XX não é inversível ESTIMATIVA DOS PARÂMETROS MULTICOLINEARIDADE NÃO PERFEITA Resgatando o slide lá de trás beginbmatrix y1 y2 vdots ym endbmatrix beginbmatrix 1 x11 x12 ldots x1k 1 x21 x22 ldots x2k vdots vdots vdots ddots vdots 1 xn1 xn2 ldots xnk endbmatrix beginbmatrix beta0 beta1 vdots betak endbmatrix beginbmatrix u1 u2 vdots un endbmatrix não são combinações lineares perfeitas mas tem p alto Vamos ver o que acontece c os estimadores de MQO β XX¹XY Varβ σ²XX¹ Se p for alto perto de 1 ou 1 o valor do determinante dessa matriz será muito baixo β XX¹XY Varβ σ²XX¹ Portanto a variância do estimador será alta β XX¹XY Varβ σ²XX¹ Pensando em termos da RLS Varβ σ²x² ESTIMATIVA DOS PARÂMETROS ESTIMATIVA DOS PARÂMETROS Qual é mesmo o problema de aumentar a variância do estimador 1 Ele fica menos preciso tc b Varb tc b varb Teste de Hipóteses Teste de Hipóteses Teste de Hipóteses Teste de Hipóteses Enganoso Teste de Hipóteses Enganoso tc b Varb ou seja aumenta a chance de não rejeitar H0 falsa Erro tipo II Como identificar a multicolinearidade Podemos suspeitar que ela exista quando os testes t de significância individual dos parâmetros indicarem que eles não são significantes mas o teste F for significante eou o R² for alto Podemos investigar indícios visualmente com gráficos de dispersão entre as variáveis independentes Matriz de variância e covariância Podemos rodar regressões auxiliares das variáveis independentes contra as outras variáveis independentes O que fazer quando há multicolinearidade Podese retirar uma das variáveis correlacionadas do modelo Muitas vezes também é possível reduzir os efeitos da multicolinearidade por meio do aumento da amostra Isso porque a correlação alta pode ser decorrente da própria amostra isto é essa correlação pode não existir na população e um aumento das observações poderia refletir melhor esse fato Pode ser possível também reespecificar o modelo Há autores que não consideram a multicolinearidade um problema muito relevante Atividades extras dessa aula 1 Derivar o estimador de MQO na forma matricial apêndice cap 8 do Sartoris ou apêndice B do Wooldridge 2 Mostrar os impactos na variância do estimador de MQO na forma algébrica utilizar teorema 32 do Wooldridge e seção 34a EXERCÍCIOS Wooldridge 35 Em um estudo que relaciona a nota média em curso superior GPA ao tempo gasto em várias atividades você distribuiu uma pesquisa para vários estudantes Os estudantes devem responder quantas horas eles despendem em cada semana em quatro atividades estudo study sono sleep trabalho work e lazer leisure Toda atividade é colocada em uma das quatro categorias de modo que para cada estudante a soma das horas nas quatro atividades deve ser igual a 168 i No modelo colGPA β0 β1study β2sleep β3work β4leisure u faz sentido manter sleep work e leisure fixos enquanto study varia ii Explique a razão de esse modelo violar a Hipótese RLM3 iii Como você poderia reformular o modelo de modo que seus parâmetros tivessem uma interpretação útil e ele satisfaça a Hipótese RLM3 A seguinte equação representa os efeitos das receitas totais de impostos sobre o crescimento subsequente do emprego para a população de municípios dos Estados Unidos cresc β₀ β₁parcₚ β₂parcᵣ β₃parcᵜ outros fatores em que cresc é a variação percentual do emprego de 1980 a 1990 enquanto o total das receitas de impostos tem a seguinte distribuição parcₚ é a parcela dos impostos sobre a propriedade parcᵣ é a parcela das receitas de impostos sobre a renda e parcᵜ é a parcela das receitas de impostos sobre as vendas Todas essas variáveis estão mensuradas em 1980 A parcela omitida parcᵜ inclui taxas e impostos variados Por definição as quatro parcelas somam um Outros fatores incluiriam despesas com educação infraestrutura e assim por diante todos mensurados em 1980 i Por que devemos omitir uma das variáveis da parcela de impostos da equação ii Dê uma interpretação cuidadosa de β₁