·
Economia ·
Econometria
Send your question to AI and receive an answer instantly
Recommended for you
17
Econometria - Modelos Probit, Logit, Tobit e Heckit - Análise da Participação Feminina no Mercado de Trabalho
Econometria
UFABC
13
Econometria II - Lista de Exercícios 2 - Heterocedasticidade Autocorrelação e Multicolinearidade
Econometria
UFABC
15
Anotações sobre Dados Empilhados e Dados em Painel em Econometria II
Econometria
UFABC
13
Notas de Aula: Econometria II - Equações Simultâneas
Econometria
UFABC
11
Notas de Aula - Econometria II: Dados Empilhados e Dados em Painel
Econometria
UFABC
818
Introdução à Econometria - Sixth Edition
Econometria
UFABC
1
Prova Econometria Series Temporais CPI Inflacao - Analise Dados R
Econometria
UFABC
1
Universidade Federal do ABC
Econometria
UFABC
13
Notas de Aula: Econometria II - Equações Simultâneas
Econometria
UFABC
14
Roteiro de Aula Econometria - Testes F e LM, Elasticidades e Operaçoes Matriciais
Econometria
UFABC
Preview text
Notas de aula para o curso de Econometria II Nota 7 variáveis explicativas endógenas 1 Introdução um pouco de inferência causal Esta nota de aula trata da violação da hipótese de exogeneidade a qual compõe o modelo clássico de regressão linear MCRL Tal desvio em relação ao modelo econométrico básico representa uma oportunidade para refletir em torno de uma questão crucial um modelo de regressão múltipla é capaz efetivamente de captar uma relação de causalidade entre uma variável explicativa causa e uma variável explica da consequência O exemplo a seguir é esclarecedor Possuir diversos livros em casa faz com que seus filhos tenham um bom desempenho na escola A análise de regressão não pode resp onder exatamente a esta questão mas sim a uma questão sutilmente distinta uma criança com diversos livros em casa tende a ter um melhor desempenho do que uma criança em cuja casa não há nenhum livro A diferença entre a primeira e a segunda questões é a diferença entre causalidade ques tão 1 e correlação questão 2 Levitt Dubner 2009 cap5 Para entender a última afirmação dos autores é preciso ter em conta as diversas maneiras p or meio das quais duas variáveis podem se relacionar e como esta diversidade dialoga com padrões revelados por um conjunto específico de dados Para tornar este diálogo mais claro são empregados dois termos para designar relações entre variáveis O primeiro relação aparente designa um padrão revelado a partir de uma análise simples de um conjunto de dados como a que toma por base a regressão múltipla O segundo relação de fundo se refere a como efetivamente as variáveis se relacionam Esta última geralmente não é observada diretamente S ua revelação requer o emprego de técnicas de análise de dados especiais como a apresentada nesta nota de aula Para os propósitos desta nota há três categorias básicas em que as r elações de fundo podem ser classificadas conforme os diagramas causais abaixo detalham Neles temse uma variável explicada y e uma variável explicativa x k O termo causação indica que há causalidade entre as variáveis Figura 1 Cau sação na direção explicativaexplicada Figura 2 C au sação re versa Figura 3 Compartilhamento de uma causa comum dependência mútua Se a partir de um conjunto de dados se observa um padrão entre os valores assumidos por duas variáveis seja ele o de uma relação aparente positiva ou negativa não é possível saber qual é exatamente a relação de fundo que está por trás deste padrão Colocando de outra maneira por trás da relação aparente pode haver qualquer uma das três relações de fundo básicas e até mesmo combinações d elas Não há porque portanto a priori clamar que é a causação na direção x k y que prevalece A menos que seja possível eliminar todas as outras relações de fundo exceto pela causação na direção x k y Esta maneira de proceder é de fato o caminho escolhido pela análise econométrica que procura mensurar com base nos conjuntos de dados geralmente disponíveis a intensidade com que a causação x k y se manifesta Para entender melhor como é possível avançar em tal direção cabe considerar as duas combinações mais relevantes de relações de fundo ilustradas nas figuras 4 e 5 Figura 4 Causação bilateral ou simultaneidade Figura 5 Causação e compartilhamento de causa comum efeito confundidor Em ambos os casos acima há causação na direção x k y mas porém a ocorrência de outra relação de fundo tende a fazer com a relação aparente entre x k e y capte o efeito combinado das duas relações Se pois com base nos dados disponíveis for calculada uma medida da causação pex uma estimativa pontual para o coeficiente de x k na regressão em que y é a variável explicada acabase obtendo uma medida para o efeito combinado Esta tende a não ser equivalente à magnitude do efeito da causação x k y As duas combinações das figuras 4 e 5 são recorrentes nos conjuntos de dados disponíveis para os economistas De fato a manifestação delas resulta na violação da hipótese de exogeneidade do MCRL A figura 4 compreende os casos de omissão de variáveis relevantes mas porém não observadas u e daí relegadas ao termo de perturbação Tais variáveis explicam y e também estão correlacionadas com x k dai a endogeneidade Na cadeia de causação bilateral d a figura 5 fatores que explicam uma das duas variáveis y por exemplo também expli cam a outra x k o que também vale para os termos omitidos Desta maneira y está correlacionado com termos omitidos que explicam x k e termos omitidos que explicam x k estão correlacionados com y É por isso que há endogeneidade Eliminar as relações de fundo indesejadas para isolar a causação x k y é equivalente a eliminar a endogeneidade das variáveis explicativas Voltando no exemplo de Levitt e Dubner o motivo pelo qual a regressão múltipla é incapaz de mensurar o efeito do tamanho da coleção de livros dos pais no desempenho escolar da criança está em que pode haver relações de compartilhamento de causa comum entre as duas variáveis Como os próprios autores mais à frente no texto colocam o tamanho da biblioteca dos pais pode ser uma medida para a importância que eles dão ao conhecimento e portanto à educação e é esta importância que explica o melhor desempenho de seus filhos a variável importância à educação desempenha o papel da variável u na figura 5 2 Determinantes da endogeneidade A endogeneidade de variáveis explicativas ie a existência de correlação significativa entre elas e o termo de perturbação viola uma das hipóteses do MCRL resultando na perda das propriedades de ausência de viés e consistência para os estimadores de todos os coeficientes O que significa que a inferência da função de expectativa condicional FEC Eyx se torna equivocada e que tal equívoco não pode ser nem mesmo atenuado por maior que seja o tamanho da amostra disponível inconsistência Infelizmente a natureza dos dados geralmente disponíveis para os economistas e para os cientistas sociais em geral é tal que a endogeneidade não é um fenômeno raro manifestandose muito pelo contrário na maioria dos estudos econométricos A gravidade das consequências da endogeneidade e sua recorrência justifica a atenção que tem sido dada na pesquisa científica em economia ao fenômeno De fato a elaboração de um argumento convincente para demonstrar que a endogeneidade é adequadamente contornada é prérequisito para que um estudo econométrico com dados transversais ou em painel seja aceito para publicação nas principais revistas de economia Há três motivos principais pelos quais a endogeneidade pode se manifestar 1 Omissão de variáveis relevantes algumas variáveis que segundo a teoria estão correlacionadas com a variável dependente e com pelo menos uma das explicativas podem não ser observadas É o caso por exemplo da habilidade ou produtividade dos trabalhadores na equação de Mincer para o salário recebido e das condições microclimáticas locais na equação que explica a produtividade agrícola A nãoobservação destas variáveis e consequente incorporação ao termo de perturbação faz com que este esteja correlacionado com pelo menos uma das variáveis explicativas A endogeneidade causada por omissão de variáveis relevantes resulta do fato de que as variáveis omitidas representam uma causa comum u compartilhada por pelo menos uma explicativa x k e pela variável dependente y ver figura 3 acima 2 Causação bilateral ou simultânea algumas relações causais propostas por teorias econômicas ou de outras ciências sociais podem ser bilaterais Cabe explicar com mais detalhe Seja a FEC objeto do analista EYx 1 x K i em que Y é assumida como a variável de resposta ou consequência e X toma a posição de causa Mas porém é possível com base na teoria que uma dada explicativa x k por exemplo seja causada por Y Neste caso pois as posições assumidas por Y e a késima explicativa na relação de causação são re vertidas o que pode ser representa do com base na FEC Ex k Y ii Tomandose aproximações lineares para as duas FECs i e ii temse Y Z 1 β γ x k u e x k Z 2 α δx k v em que Z 1 e Z 2 não contêm variáveis comuns Pela primeira regressão u explica Y e pela segunda Y explica x k de maneira que portanto u e x k estão correlacionados na primeira equação Um exemplo de causalidade bilateral é fornecido por estudos do efeito do policiamento sobre a incidência de crimes Em uma amostra de dados transversa is crosssection cujas unidades são diversas localidades de um determinado País municípios por exemplo a mensuração do efeito causal em questão é dificultada pelo fato de que tendem a ser contratados mais policiais nos locais em que a criminalidade é maior seja por conta de uma ordem de prioridade estabelecida por uma autoridade central da pressão imposta pela população aos governos locais ou por outros motivos Ou seja há causalidade em duas direções i do policiamento causa para o crime consequência esta a FEC que se deseja analisar e ii do crime causa para o policiamento consequência 3 Erros de medida a tentativa de criar medidas para variáveis não observadas tende a gerar regressores sujeitos a erros de medida correlacionados com variáveis explicativas É o que se tem quando a explicativa desejada tal como a teoria a especifica x k não sendo observada é substituída por uma medida imperfeita x k na FEC EYx 1 x k x K Esta última pode ser aproximada pela FRP linear y i x ik β δx ik u i a em que x ik é o vetor que contém todas as explicativas exceto a que é medida imperfeitamente x k A diferença entre a medida factível x k e a medida ideal x k pode ser expressa a partir de x ik x ik ϵ i em que ϵ i é o erro de medida Empregar a medida factível na estimação da FEC desejada é equivalente a estimar a y i x ik β δx ik u i assumindo que x ik x ik ϵ i o que resulta na regressão y i X i k β δx i k v i b em que v i u i δ ϵ i O erro de medida é pois automaticamente incorporado ao termo de perturbação Se ϵ i for correlacionado com a medida factível x ik a regressão b não verifica a hipótese de exogeneidade uma vez que covx ik v i 0 É apenas portanto quando há razões para acreditar que a diferença entre a medida ideal e a medida factível está correlacionada com a última é que o emprego da medida factível pode conduzir a estimativas pontuais não confiáveis U m exemplo para a ocorrência de erros de medida é o de estimação d a FEC que explica o investimento de uma empresa Segundo a macroeconomia neoclássica ver Romer 2012 p426 a principal variável explicativa é o q de Tobin um preço sombra e portanto não observado Um preço sombra é sempre um valor marginal infinitesimal e portanto o q de Tobin capta o retorno marginal do capital Dada a dificuldade de calcular o q de Tobin a partir dos dados geralmente disponíveis a lguns autores empregam como medida factível a razão entre o valor de mercado de uma empresa e o valor de seu estoque de capital o que corresponde a o retorno médio do capital Caso a diferença entre o retorno marginal e o médio seja correlacionado com o último a regressão em que o investimento é explicado em função de tal retorno médio estará sujeita à endogeneidade Nest a nota de aula é apresentado um método que produz estimadores não viesados e consistentes mesmo na presença da endogeneidade o método de va riáveis instrumentais MVI S ão focadas estruturas de dados transversais 3 O método de variáveis instrumentais MVI 31 Hipóteses fundamentais O MVI parte do princípio de que é possível decompor a explicativa correlacionada com o termo de perturbação denominada por explicativa endógena em i uma parte correlacionada com tal termo a parcela endógena e ii uma parte não correlacionada com o termo de perturbação a parcela exógena Se a primeira parcela for descartada e apenas a parcela exógena for utilizada na FEC de interesse a correlação entre explicativas e o termo de perturbação é eliminada de modo que o estimador de MQO será não viesado e consistente A dificuldade está em realizar a decomposição descrita uma vez que não há meios para identificar diretamente qual fração da informação referente à variação ao longo das unidades da variável endógena não é correlacionada com o termo de perturbação Uma possibilidade está em encontrar pelo menos uma variável não pertencente ao conjunto de explicativas para a variável dependente correlacionada apenas com a parcela exógena da explicativa endógena e utilizar tal correlação para identificar a parcela desejada Seja assumido que a variável w é correlacionada apenas com a parcela exógena de x k esta a explicativa endógena Deste modo x k pode ser decomposta em Ex k w e em um erro não correlacionado com x k ε ie x k Ex k w ξ A parte da parcela exógena da variável de x k que é possível identificar com base em w é portanto Ex k w e a identificação pode ser realizada com base na estimação por MQO dos coeficientes da aproximação linear a Ex k w Geralmente não há base convincente para argumentar que w está correlacionada apenas com a parcela exógena de x k por um motivo simples a parcela exógena não é uma variável em si ie uma medida para alguma característica das unidades mas apenas uma parte da informação contida na variável x k Se a parcela exógena não é em si uma variável não é possível construir um argumento com base na teoria que justifique a correlação entre ela e w Uma solução alternativa está em ao invés de procurar uma variável w correlacionada apenas com a parcela exógena de x k obter uma variável z 1 correlacionada com a informação completa de x k parcela exógena e endógena e não correlacionada com o termo de perturbação u da equação que explica a variável dependente qual seja Y EYx 1 x k x K u Uma variável z 1 que atenda a estes dois critérios é denominada por variável instrumental VI Há um terceiro critério geralmente implícito que é o de que z 1 não pertença ao esteja excluída do conjunto de explicativas sugerido pela teoria para a FEC de Y ou seja a variável instrumental não explica a variável dependente Daí porque se diz que z1 tem de estar excluída da equação para Y Uma condição deste gênero que exclui uma variável de uma determinada equação é denominada por restrição de exclusão termo empregado na teoria econométrica de equações simultâneas A figura 6 a seguir ilustra a relação de fundo garantida pela verificação dos dois critérios mencionados entre a variável instrumental z 1 e a explicativa endógena x k Estão também representadas as relações de fundo entre x k a variável dependente y e o conjunto de fatores não observados e pois omitidos relegados ao termo de perturbação u Figura 6 relação de fundo entre x k e a variável instrumental z É preciso compreender com detalhe o requerimento de que a variável instrumental VI não seja correlacionada com u Caso haja correlação entre z 1 e u a parcela de x k correlacionada com z 1 a qual pode ser representada por Ex k X k z 1 em que X k contém todas as explicativas exceto x k não pode ser empregada como medida para a parcela exógena de x k uma vez que Ex k X k z 1 estará correlacionada com u não sendo pois exógena Neste caso a relação de fundo z u e xk é tal como representada na figura 7 Figura 7 relação de fundo entre x k e uma variável instrumental endógena z Uma explicação mais clara é possível Seja tomada uma aproximação linear para a FEC EYX de modo que a equação de interesse para o analista seja Y β 0 β 1 x 1 β k x k β K x K u 1 Em que Eu X 0 pois covu x k 0 Esta equação é denominada por equação estrutural uma vez que representa o modelo completo especificado pela teoria Tomando uma aproximação linear para a FEC Ex k X k z 1 temse x k δ 0 δ 1 x 1 δ k1 x k1 δ k1 x k1 δ K x K θ z 1 v 2 Em que v é um termo de erro com média nula e nãocorrelacionado com nenhuma das explicativas da equação 2 Esta segunda equação é denominada por equação reduzida terminologia emprestada dos modelos de equações simultâneas tópico a ser visto na parte IV do curso O coeficiente θ capta a correlação de z 1 sobre x k líquida da influência das demais explicativas É assumido que há apenas uma explicativa endógena x k de maneira que todas as variáveis do lado direito da equação 2 são exógenas ie não correlacionadas com o termo de perturbação da equação 1 u Os coeficientes da equação 2 podem ser estimados consistentemente por MQO o que permite submeter a teste a hipótese de que a VI z 1 é correlacionada com x k Plugando 2 em 1 obtémse Y β 0 β 1 x 1 β k δ 0 δ 1 x 1 δ k1 x k1 δ k1 x k1 δ K x K θ z 1 v β K x K u Coletando os termos comuns Y α 0 α 1 x 1 α k1 x k1 α k1 x k1 α K x K λ z 1 ε 3 α s β s β k δ s s 0k1 k1K λ β k θ ε u β k v Se EuZ 0 ie resulta que z 1 é endógena na equação 3 uma vez que ε contém u Neste caso os estimadores de MQO obtidos de 3 serão inconsistentes mesmo após substituir x k p or sua projeção linear em todas as variáveis exógenas e z 1 Grosseiramente o que se tem é que substituir uma variável endógena x k por outra variável endógena Ex k X k z fX k z não pode ser uma solução para o problema de endogeneidade Ao contrário quando EuZ 0 o estimador de MQO é consistente na equação 3 e é possível recuperar através das estimativas para os coeficientes da equação 3 os coeficientes da equação 1 uma vez que são os últimos que interessam ao analista recordando que o objetivo da análise é sempre inferir a FEC para Y 32 O estimador de variáveis instrumentais EVI O estimador de variáveis instrumentais EVI procura obter diretamente os coeficientes da equação estrutural e não por meio da recuperação a partir de equações que relacionam os parâmetros desejados e os efetivamente estimados como o final da seção anterior sugere O caminho direto é possível a partir do procedimento descrito no que segue Seja Z X k z 1 ie Z 1 x 1 x k 1 x k 1 x K z 1 uma matriz N x K1 que contém todas as variáveis exógenas e a VI z 1 O termo 1 representa um vetor Nx1 de valores unitários o qual permite incorporar o termo de intercepto Cabe explicitar as duas hipóteses de exogeneidade tomadas por base sendo elas H exo 1 Covx j u 0 j 1k1k1K ie todas as explicativas exceto a késima são exógenas H exo 2 Cov z 1 u 0 ie a variável instrumental é exógena Destas hipóteses decorre que a matriz Z é exógena o que pode ser representado como CovZu 0 Empregando a definição de covariância a exogeneidade de Z pode ser expressa como CovZu EZEZuEu EZu ZEu EZu EZEu EZu EZEu EZEu EZEu EZu EZEu É de praxe assumir que o termo de perturbação tem expectativa nula ie Eu 0 o que se incorporado a resulta em CovZu EZu 0 Desta maneira pois das hipóteses de exogeneidade para todas as explicativas exceto x k e para z 1 decorre a condição EZu 0 a qual é conhecida como condição de ortogonalidade formulada para a população É a partir desta condição ie de sua verificação na população pela matriz de variáveis exógenas Z que se obtém o estimador de variáveis instrumentais EVI tal como o parágrafo a seguir detalha A equação estrutural em forma matricial pode ser escrita como Y Xβ u com β contendo o intercepto e portanto a primeira coluna de X é tem todos seus elementos iguais à unidade Podese escrever u Y Xβ e portanto a condição de ortogonalidade passa a EZu EZY Xβ 0 Do que decorre que EZY EZXβ 0 o que leva em conta o fato de que o vetor de coeficientes β é um conjunto de parâmetros populacionais e não uma variável aleatória Chegase a EZY EZXβ Prémultiplicando ambos os lados da equação pela inversa da matriz EZX sob a hipótese de que ela é invertível ie tem posto completo uma hipótese fundamental do EVI EZX 1 EZY EZX 1 EZXβ O que é equivalente a β EZX 1 EZY Para obter um estimador que com base na amostra gere uma estimativa pontual para o vetor populacional β é preciso recorrer ao princípio da analogia ie tomar as contrapartidas amostrais para os momentos populacionais EZX 1 e E ZY É desta maneira que o EVI é obtido Ele assume a seguinte forma β VI i1 N z i x i 1 i1 N z i y i Z X 1 Z Y Uma vez que o estimador foi obtido sob a hipótese de condição de ortogonalidade na população é intuitivo que caso tal hipótese seja falsa o EVI não tenha propriedades desejáveis De fato conforme já colocado anteriormente ele será inconsistente o que decorre diretamente de que EuZ 0 O EVI para o késimo coeficiente assume a forma abaixo β k covz y covz x 4 Viés do estimador de variáveis instrumentais EVI Há um detalhe crucial quanto às propriedades do EVI geralmente omitido da maioria dos livrostexto ele é viesado mesmo com a verificação da condição de ortogonalidade W P p101 e 104 O que pode ser indicado tal como segue ainda que de maneira estritamente intuitiva e não rigorosa não se tratando portanto de uma demonstração formal adaptado de Mcfadden 1999 p6 E β VI E E β VI ZX E E Z X 1 Z Y ZX E E Z X 1 Z Xβu ZX Ou seja E E β VI ZX βE Z X 1 E u ZX Uma vez que EuX 0 pois é exatamente por conta disso que o EVI é empregado ao invés do estimador de MQO então EuZX 0 mesmo com EuZ 0 vide Mcfadden 1999 p6 De fato há diversos artigos que procuraram calcular o viés do EVI vide por exemplo Angrist Pis chke seção 464 Bun Windmeijer 2010 Bound et al 1995 5 Mínimos quadrados de dois estágios Quando há mais de uma VI em potencial disponível para a explicativa endógena mantendo pois a hipótese de que há apenas uma explicativa endógena se coloca o problema de selecionar o instrumento De fato o princípio de otimização da informação disponível um dos pilares da análise econométrica mesmo que não obstante nem sempre seja explicitado recomenda que nenhuma das candidatas à VI seja descartada Para isso um princípio que parece adequado é o de tomar a melhor combinação linear dos instrumentos ie a combinação linear com maior correlação menor erro de aproximação linear com a variável endógena Esta é a ideiabase do estimador de mínimos quadrados de dois estágios MQ2E Cabe detalhar As equações 1 e 2 da seção anterior podem ser escritas em forma matricial mantendo a hipótese de que há apenas uma explicativa endógena em 1 Y X k β k β k x k u 1 x k Z δ v 2 Em que Z x 1 x k 1 x k 1 x K z 1 z M X k z z agora uma matriz com L colunas O estimador de MQO para δ na segunda equação é δ OLS Z Z 1 Z x k Este estimador pois gera uma previsão para x k que corresponde à melhor aproximação linear para a FEC Ex k Z o que quer dizer que a combinação linear entre as explicativas exógenas e os instrumentos tomada por base é tal que a soma dos quadrados do erro de previsão é minimizado A informação contida nos instrumentos é portanto otimizada A projeção linear de x k nas variáveis exógenas é x k Z δ OLS ZZ Z 1 Z x k Uma vez que X X k x k a matriz de explicativas em que x k toma o lugar de x k será denotada por X X k x k O estimador de MQO para os coeficientes da aproximação linear à FEC EY X é β MQ 2 E X X 1 X Y Este estimador é equivalente ao estimador de variáveis instrumentais que toma como instrumento para a matriz X sua projeção no hiperplano definido pelo conjunto de variáveis cuja composição conta com i as explicativas exógenas e ii as VIs O que resulta em X uma vez que a projeção das explicativas contra elas mesmas retorna as próprias variáveis inalteradas Algebricamente o estimador MQ2E pode ser obtido a partir de um procedimento de dois estágios em que i no primeiro estimase 2 a equação reduzida obtendose X e ii no segundo estimase a equação estrutural Este procedimento contudo raramente é utilizado na atualidade uma vez que tende a conduzir a erros de inferência O motivo está em que as estatísticas dos testes de significância para os coeficientes da equação estrutural apenas podem ser obtidas se o termo de perturbação da equação estrutural for estimado O que não pode ser rigorosamente feito a partir de Y X β MQ2E ie dos resultados do segundo estágio uma vez que com isso se obtém uma estimativa para o termo de perturbação da equação populacional que relaciona Y e X Ou seja assim se estima ε Y EY X mas porém como o objetivo da análise é fazer inferência sobre EYX é preciso calcular resíduos que estimem u Y EYX WP p95 Porém o procedimento de dois estágios se implementado a partir de um software econométrico estimandose sequencialmente as duas regressões retorna no segundo estágio valores para as estatísticas de teste e pvalores computados a partir de estimativas para ε A relação precisa entre ξ e u pode ser explicitada levandose em conta o fato de que x k Ex k Z v e observando que x k procura prever a FEC Ex k Z e por isso a FRP do segundo estágio assume a seguinte forma Y X k β k β k Ex k Z v u X k β k β k Ex k Z β k v u X k β k β k Ex k Z ε Esta equação portanto conforme já dito não representa a equação estrutural esta dada por 1 Mas porém é ela que é estimada no segundo estágio de modo que o resíduo calculado com base nela estima ε β k v u WP p527 Felizmente os principais softwares econométricos contêm rotinas préprogramadas que implementam diretamente o estimador de MQ2E não sendo necessário executar manualmente o procedimento de dois estágios Há também rotinas que executam procedimentos de dois estágios corrigindo porém os resíduos do segundo estágio de maneira a obter estimativas para u Y EYX 6 Propriedades do estimador de MQ2E O estimador MQ2E é consistente e eficiente de fato ele é o estimador mais eficiente na classe dos estimadores de VI que tomam por base alguma combinação das VIs disponíveis o MQ2E toma a combinação mais correlacionada com a explicativa endógena Tais propriedades são válidas apenas quando as hipóteses a seguir são verificadas 1 Condição de ortogonalidade EZu 0 2 As matrizes EZZ e EZK são invertíveis ie têm posto completo A homocedasticidade das perturbações e a ausência de autocorrelação entre elas garantem que as estatísticas para o teste de significância parcial e conjunta comumente utilizadas têm distribuições assintóticas conhecidas e padrão t de Student para o teste t e F de Snedecor para o teste F WP seção 522 É claro que heterocedasticidade e autocorrelação não impossibilitam a inferência conforme visto anteriormente parte I do curso mas apenas requerem a modificação das estatísticas do teste de maneira a incorporar a correta estrutura da matriz de variânciacovariância das perturbações O que é facilmente realizado a partir dos principais softwares econométricos 7 Inferência 7 1 Inferência básica Conforme já colocado as estatísticas t e F usuais podem ser empregadas para realizar respectivamente os testes de significância individual e conjunta para o vetor populacional β desde que incorporem a estrutura correta da matriz de variânciacovariância dos resíduos O EVI do qual o MQ2E é um caso particular exige um cuidado peculiar em relação ao estimador de MQO no cálculo das estimativas para as variâncias dos estimadores que é o de considerar os resíduos da equação estrutural u Y X β MQ2E e não os resíduos do segundo estágio ε Y X β MQ2E Reiterando os principais softwares calculam as estatísticas com base nos resíduos corretos desde que sejam empregadas rotinas de MQ2E Não se deve procurar implementar a partir de rotinas de MQO o procedimento de dois estágios 7 2 Teste de endogeneidade de Hausman Hausman 1978 apud WP p532 propôs um procedimento geral de teste para a especificação de um modelo econométrico o qual pode ser empregado para testar a hipótese de que há pelo menos uma explicativa endógena Antes de apresent á lo cabe destacar um ponto crucial e nem sempre claro Um teste de endogeneidade que tome por base a correlação entre o termo de perturbação e a explicativa potencialmente endógena é impossível A razão está em que sendo x k a explicativa sobre a qual recai a suspeita de endogeneidade a hipótese nula do teste seria a de que covx k u 0 de modo que a implementação do teste exige a observação de um elemento que nunca é observado o termo de perturbação u WP p86 Por mais que este termo possa ser estimado a partir dos resíduos da regressão o conteúdo informacional em que consistem os resíduos não compreende todo o conteúdo informacional do termo de perturbação sendo pois termo de perturbação e resíduos elementos distintos O teste de Hausman porém não procura estimar o termo de perturbação T ratase de um teste indiret o para endogeneidade Ele parte da percepção de que as estimativas de MQO e MVI ou MQ2E este um caso particular d o MVI tendem a diferir caso x k seja endógena uma vez que o estimador de MQO é inconsistente e o EVI é consistente Caso contrário ie com x k exógena as estimativas por MQO e MVI tendem a ser equivalentes A cada uma das duas possibilidades para a endogeneidade de x k corresponde uma possibilidade específica distinta para o comportamento comparado dos estimadores Há uma correspondência perfeita ver o quadro abaixo entre i a verdadeira situação quanto à endogeneidade da explicativa suspeita de endogeneidade e ii a discrepância entre as estimativas de MQO e MVI Desta maneira ii pode ser utilizado como evidência para indicar se x k é endógena ou não Tabela 1 Correspondência tomada por base no teste de endogeneidade Explicativa suspeita x k MQO MVI Estimativas comparadas Exógena Consistente Consistente Equivalentes Endógena Inconsistente Consistente Distintas Uma estatística de teste pertinente é a que toma por base a magnitude da discrepância entre as estimativas de MQO e MVI para um mesmo coeficiente Se esta discrepância for estatisticamente significativa há evidência estatisticamente válida de que os estimadores diferem e portanto há evidência de endogeneidade A hipótese nula do teste de Hausman é a de que a discrepância é nula na população ou seja a késima explicativa é exógena A obtenção da estatística do teste de Hausman parte do fato de que N β MVI β MQO a N 0 V q N 0 V β MVI V β MQO Em que a indica a distribuição assintótica e V é a vari ância assintótica do estimador Do que decorre H N β MVI β MQO V q 1 β MVI β MQO a χ K1 2 Esta sendo a estatística do teste e K1 o número de parâmetros a serem estimados intercepto e coeficientes angulares Há uma maneira alternativa de computar o teste de Hausman Ela se apoia na percepção de que segundo a equação reduzida para a explicativa endógena x k Z δ v tal variável apenas pode estar correlacionada com o termo de perturbação da equação estrutural u caso v esteja E isso pois Z é exógena por definição Assim sendo é possível escrever u Euv ξ em que ξ é um termo de perturbação não correlacionado com v Assumindo uma aproximação linear u ρv ξ o que se incorporado à equação estrutural resulta em Y X k β k β k x k ρv ξ 4 Esta equação é na prática a equação estrutural aumentada para conter v como regressor Os coeficientes desta equação podem ser consistentemente estimados por MQO Isso é verdade pois nenhum dos regressores está correlacionado com o termo de perturbação ξ Para compreender porque é preciso levar em conta que O vetor X k por ser composto por explicativas exógenas não está correlacionado com u e portanto com seu componente ξ O termo de perturbação ξ não está correlacionado com x k pois ξ é não correlacionado com v e é apenas por meio da correlação com v que ξ poderia estar correlacionado com x k uma vez que Z é não correlacionado com v O termo v não está correlacionado com ξ por conta da definição do último Uma dificuldade é colocada pelo fato de que v assim como u não é observado uma vez que se trata de um termo de perturbação Contudo o procedimento do teste obtém estimativas para v a partir de v x k Z δ MQO ie da regressão para a equação reduzida incorporandoo como substituto para v na equação 4 de modo a obter pois Y X k β k β k x k ρ v ϵ 4 O teste de Hausman se reduz a um teste de significância estatística para o parâmetro ρ na equação 4 mantendo como hipótese nula a de que x k é endógena Caso ρ se mostre estatisticamente significativo em 4 a hipótese é rejeita da e portanto há evidência a favor da endogeneidade de x k É preciso mais uma vez atentar para o fato de que inferência com base nos resíduos estimados a partir de 4 é equivocada uma vez que o termo de resíduo correto deve estimar ξ e não ϵ Isto pode ser corrigido estimandose a equação estrutural por MVI diretamente obtendo os resíduos u Y X β MQ2E e os considerando como base para cálculo das estimativas para a variância do estimador de MQO para ρ Os principais softwares de econometria possuem rotinas para a estimação do teste de Hausman recomendase a utilização de tais rotinas ao invés d a implementação manual do procedimento de dois estágios acima a partir de estimações por MQO sequenciais O teste de endogeneidade de Hausman é utilizado para verificar se é efetivamente necessário recorrer ao MVI devendo pois ser reportado sempre que houver razões para desconfiar da exogeneidade das explicativas ou seja de acordo com o observado na introdução o teste de Hausman deve ser reportado sempre que pelo menos uma VI estiver disponível 7 3 Teste de sobreidentificação Caso exista mais de um instrumento para a variável endógena é dito que o modelo econométrico está sobreidentificado um termo proveniente do estudo de modelos de equações simultâneas O teste de especificação de Hausman pode ser empregado para testar se a incorporação de mais instrumentos do que o necessário para identificar o modelo no caso mais do que um instrumento realmente contribui para a precisão dos estimadores De fato um caso extremo em que a inclusão de um instrumento adicional não contribui em tal sentido é aquele em ele é endógeno ie correlacionado com o termo de perturbação da equação estrutural Quando isso ocorre a contribuição do instrumento acaba sendo negativa e é interessante testar se este é o caso uma vez que o EVI será claramente inconsistente A lógica do teste de sobreidentificação é análoga à do teste de endogeneidade mas porém os estimadores a serem comparados são i o EVI exatamente identificado ie que incorpora um número de instrumentos equivalente ao número de explicativas endógenas um como assumido e ii o EVI sobreidentificado Caso entre os instrumentos disponíveis pelo menos seja exógeno o mesmo não podendo ser afirmado para todos os demais o EVI identificado será mesmo assim consistente quando calculado a partir do instrumento endógeno Já o EVI sobreidentificado que incorpora todos os instrumentos disponíveis será inconsistente A tabela a seguir detalha a lógica do teste de sobreidentificação Tabela 2 Correspondência tomada por base no teste de sobreidentificação Instrumentos adicionais MVI identificado MVI sobreidentificado Estimativas comparadas Exógenos Consistente Consistente Equivalentes Pelo menos um endógeno Consistente Inconsistente Distintas A estatística do teste portanto é obtida com base na diferença entre as estimativas geradas por MVI identificado e MVI sobreidentificado Wooldridge W p534 propõe uma alternativa para realizar o teste a partir de um procedimento de dois estágios sendo ele Estimar por MQO2E a equação principal e obter os resíduos denotandoos por u 1i Estimar a regressão em que os resíduos do passo anterior são a variável dependente e as variáveis independentes são os instrumentos e as variáveis exógenas Denotar o coeficiente de de terminação de tal regressão por R 2 1 Sob a hipótese nula de que os instrumentos e as exógenas são não correlacionadas com as perturbações da equação principal N R 2 1 tem distribuição quiquadrado com número de graus de liberdade igual a q Este é equivalente ao número de instrumentos extra Ou seja a diferença entre variáveis endógenas e instrumentos Se o valor observado da estatística for superior ao valor crítico ao nível de significância de 5 rejeitase correlação nula e afirmase que pelo menos um dos instrumentos é endógeno Ou seja concluise pela invalidade do conjunto de instrumentos O s principais softwares de econometria realizam o teste de sobreidentificação e o resultado deve sempre ser reportado quando há mais instrumentos do que explicativas endógenas O teste de sobreidentificação deve ser visto como um teste de que o modelo está corretamente especificado ie de que se adequa aos dados disponíveis No caso em que a evidência de sobreidentificação com VIs supostamente endógenas os resultados apontadas pela inferência não são confiáveis 7 4 Instrumentos fracos Já foi dito que o EVI do qual o estimador de MQ2E é um caso particular é viesado Este viés tende a ser tão maior quanto menos correlacionadas com a explicativa endógena forem as VIs O que no jargão da prática econométrica é indicado por meio da expressão VIs fracas entendendo aí por fraqueza uma correlação baixa ie nãoestatisticamente significativa das VIs com a explicativa endógena Além disso a variância do EVI é tão maior quanto mais fracos forem os instr umentos basta tomar em conta a fórmula para o estimador da variância assintótica do estimador de EVI para o késimo coeficiente WP102103 V β k σ 2 SQT K 1 R K 2 Em que SQT é uma medida para a variabilidade na amostra de x K esta representando o valor de x k previsto a partir da regressão contra as explicativas exógenas e os instrumentos estas últimas sendo denotadas por z De fato o que temos é SQT k i1 N x ik x k 2 i1 N β 0 j1 J β k z ij 1 N i1 N β 0 j1 J β k z ij 2 Uma vez que o estimador de MQO é tal que a soma de seus resíduos é equivalente a zero e portanto a média do valor previsto pela regressão x k é igual à média do valor observado x k temse que 1 N i1 N β 0 k1 K β k z ij 1 N i1 N x ik e daí SQT k i1 N x ik x k 2 i1 N x ik 1 N i1 N x ik 2 SQE z Is t o é a SQT de x k é equivalente à soma dos quadrados explicada na regressão de x k contra os instrumentos z e as explicativas exógenas Ou colocando de outra maneira a SQT da previsão para x k é a SQE da regressão de primeiro estágio Daí temse finalmente que V β k σ 2 SQE z 1 R K 2 Quanto mais fracos os instrumentos menor a parcela da variação de x k explicada pela regressão de primeiro estágio e portanto menor é a SQE z Quanto menor a SQE z maior a estimativa pontual para a variância do estimador O que tende a provocar erros do tipo II em testes de significância individual para o coeficiente da explicativa endógena após ter sido devidamente exogeneizada Em suma instrumentos fracos têm uma dupla contribuição para tornar a inferência equivocada As estimativas para os coeficientes tendem a se manter distantes dos valores populacionais o que resulta em uma inferência pontual equivocada ou viés Em segundo lugar as variâncias dos estimadores são infladas Com isso o s testes de significância estatística tomam por base tanto estimações pontuais erradas como desviospadrão equivocados o mesmo sendo verdadeiro para os intervalos de confiança W P p 104 A fraqueza dos instrumentos pode ser medida a partir de um teste de significância estatística para os coeficientes a eles associados na equação reduzida Tanto testes de significância individual para cada instrumento como um teste de significância conjunta para os instrumentos como um todo devem ser reportados Além disso há testes mais adequados como o de StockYogo para instrumentos fracos que estão disponíveis nos softwares econométricos A hipótese nula de tais testes é a de que os instrumentos são fracos este o caso do teste de Stock e Yogo e portanto apenas mediante rejeição da mesma é que as estimativas têm credibilidade 8 Argumentando em defesa da ex o geneidade do instrumento Um ponto importante é o de que enquanto a primeira propriedade de uma variável instrumental a correlação com a variável endógena pode ser efetivamente submetida à refutação empírica a segunda propriedade de não correlação com fatores omitidos da equação de interesse não pode ser testada O motivo pelo qual é impossível verificar a fidedignidade empírica da propriedade que mais claramente distingue uma variável instrumental de uma variável endógena pode ser encontrado na própria natureza do problema original O fato de os fatores omitidos serem nãoobserváveis impede que sua correlação com a variável instrumental seja mensurada De tal sorte a mesma desconfiança que tende a pairar sobre uma variável explicativa quanto à sua provável correlação com fatores omitidos pode ser direcionada para a variável instrumental com base na qual se procurar debelar tal desconfiança Este nó é superado pelos pesquisadores a partir do recurso à argumentação e assinalese não a evidências empíricas diretamente comprobatórias uma vez que estas não podem ser obtidas O objetivo das justificativas providas pelos pesquisadores sempre é o de defender a exogeneidade da variável instrumental apresentando razões pelas quais variáveis explicativas omitidas não podem estar correlacionadas com ela Ou seja tratase de defender que as relações de fundo entre i z e x k e entre ii z e u correspondem ao representado na figura 6 acima e não ao representado na figura 7 as duas figuras são reproduzidas abaixo Figura 6 relação de fundo entre x k e a variável instrumental z Figura 7 relação de fundo entre x k e uma variável instrumental endógena z 9 Exemplo de variável instrumental Angrist 1990 American Economic Review 91 Objetivo O objetivo do artigo de Angrist 1990 é determinar se veteranos da guerra do Vietnam obtinham no mercado de trabalho remuneração inferior a nãoveteranos E isso pois apenas em tal caso seriam justificados os múltiplos subsídios recebidos por tal grupo social dado que se trataria de compensálo por desvantagens frente ao mercado de trabalho A estimativa do efeito da variável binária que indica se um indivíduo é veterano é inconsistente uma vez que ela é correlacionada com fatores nãoobserváveis captados pelo termo de perturbação Um deles é o custo de oportunidade da atividade militar ie a maior remuneração obtenível com atividade civil Como diz o autor homens com relativamente poucas oportunidades civis têm maior probabilidade de alistaremse Tal inconsistência é mitigada recorrendose a uma variável instrumental bastante criativa Tratase do número aleatório atribuído a cada cidadão americano homem por s orteio nacional utilizado para determinar quem deveria se apresentar ao exército para ser ou não recrutado 92 A variável instrumental A maneira como tal número foi atribuído não é de primeira importância homens nascidos em um mesmo ano e pois com a mesma idade no ano de referência receberam cada um número de um a 365 sendo tal número aleatoriamente atribuído a um dos dias do ano O fundamental é tal número era no máximo 365 e foi estabelecido um número máximo ou teto inferior a 365 para convidar candidatos a apresentaremse Com isso quem foi ou não convidado foi determinado aleatoriamente Os convidados poderiam ou não ser selecionados a depender de exames mentais e físicos Como diz o autor mesmo com a seleção não tendo sido aleatória a prioridade para seleção foi aleatória Notese que o fato de ter sido convidado é i correlacionado com o fato de ter servido na guerra ii aleatório e portanto não correlacionado com o custo de oportunidade do serviço militar salário civil potencial não sendo um fator que segundo a teoria determina a remuneração diretamente está excluído da equação de remuneração Temse pois uma variável instrumental potencial 93 Descrição dos dados e equações Evidência visual da menor remuneração por veteranos selecionados pelos sorteios se encontra nos gráficos abaixo em que se exibe a diferença entre homens elegíveis para apresentação com numeração abaixo do teto e não elegíveis Cada gráfico se refere a um coorte ou geração grupo de indivíduos nascidos no mesmo ano Os grupos de pele branca e não branca estão separados à esquerda e direita Uma das razões para a ausência de diferença sistemática para homens nascidos em 1953 é que neste ano o sistema de sorteio aleatório começou a ser substituído pela apresentação voluntária A equação principal para o iésimo homem pertencente ao césimo coorte no tésimo instante é Remuneração c i t β 0 β 1 veteranoi β 2 coorte c tempoα uit Em que são usadas como variáveis de controle dummies de coorte coorte e dummies temporais tempo Já a equação de primeiro estágio poderia ser concebida como algo próximo a Veteranoi a 0 a 1 elegívelpara apresentação i ei Contudo a rigor é incorreto especificar tal equação uma vez que tanto a variável dependente como a única independente são binárias O essencial conforme esclarece o autor é que a abordagem de variáveis instrumentais ao invés de comparar veteranos com não veteranos compara homens elegíveis para apresentação com não elegíveis E isso pois enquanto a participação nas categorias veterano e nãoveterano é sujeita à endogeneidade o mesmo não pode ser dito quanto ao status em relação à eligibilidade O autor acrescenta que a estimativa de diferença é corrigida pelo fato de que alguns elegíveis não se tornaram veteranos e nãoelegíveis apresentaramse voluntariamente ver eq2 na p320 94 Resultados São utilizadas as cinco edições consecutivas do sorteio para dois grupos sociais definidos em função de cor de pele e coorte Os instrumentos também variam ao longo dos anos Além disso a variável instrumental foi definida não como uma binária indicando se o número recebido a partir do sorteio foi inferior ao teto mas sim faixas para o número cobrindo o intervalo de 1 a 365 Com isso um grande número de instrumentos estava disponível O teste de sobreidentificação não rejeitou a hipótese nula atestando exogeneidade das variáveis instrumentais como um todo O que pode ser visto na tabela 4 abaixo em que as estatísticas quiquadrado do teste de Hausman com a implementação a partir da estatística de forma quadrática a qual é interpretada como diretamente proporcional à correlação entre a regressão principal e os instrumentos pelo autor Comparar com o número de graus de liberdade é uma maneira rápida de indicar o resultado do teste a qual toma por base o fato de que a média populacional de uma variável quiquadrado é exatamente o número de graus de liberdade Com isso por mais que a distribuição seja assimétrica ela dificilmente teria probabilidade acima da média inferior a 5 e pois dificilmente um valor da estatística abaixo da média pertenceria à cauda superior da região crítica A tabela também reporta as estimativas pontuais em sua maioria negativas para o grupo de pele branca com exceção de 1953 O que está totalmente alinhado com os gráficos da seção anterior O autor apresenta uma extensão da equação principal em que em consonância com a equação de Mincer são incluídos os níveis de educação e experiência O objetivo é testar a hipótese de que parte da menor remuneração dos veteranos é devida à que experiência militar não é um substituto perfeito da experiência civil no mercado de trabalho Tal equação também é estimada com base nas mesmas variáveis instrumentais e à ela é aplicado um teste de sobreidentificação Resulta que de fato a menor experiência dos veteranos redundou em menor remuneração Em suma o resultado é o de que veteranos de pele branca recebiam remuneração 15 inferior mesmo dez anos depois do retorno da guerra Conforme analisado u ma explicação para tanto empiricamente sólida é a de que os veteranos possuíam menor experiência no mercado de trabalho civil De fato a perda de rendimento decorrente de menor experiência foi estimada como equivalente a dois anos a menos de experiência laboral civil Esta seção toma por base o cap 5 de Levitt Dubner 2009 Freakonomics e também o capítulo 3 de Morgan Winship Counterfactuals and Causal Inference Inferência causal é uma área da econometria e mais amplamente da análise estatística de dados não experimentais que tem conquistado cada vez mais adeptos entre os economistas Um estudo que alcançou grande projeção no meio científico e também na opinião pública em que a endogeneidade causada pela causalidade bilateral entre policiamento e incidência de crimes é o de Steven Levitt publicado na American Economic Review em 1997 e disponível no link httppricetheoryuchicagoedulevittPapersLevittUsingElectoralCycles1997pdf Segundo Levitt 1997 artigo referido na nota anterior quanto maior a incidência de crimes maior a produtividade marginal da polícia Da análise dos dados descritos com base na estimação por MQO da FEC Ecriminalidadepoliciamento outras variáveis nada pode ser concluído É o que a cautela recomenda Quanto a isso é pertinente a anedota contada por Levitt e Dubner Freakonomics 2005 introdução p9 segundo a qual um czar ao descobrir que a província de seu império com maior incidência de doenças era também a província em que trabalhava o maior número de médicos decretou como medida para conter a disseminação de doenças pena de morte para todos os médicos Romer D Advanced MacroeconomicsMcGrawHill quarta edição O q de Tobin rigorosamente mede o valor presente descontado do fluxo perpétuo de lucros proporcionado por um aumento infinitesimal no estoque de capital de uma empresa Romer 2012 p410411 Ou seja tratase do valor verdadeiro de acordo com a teoria de uma unidade adicional de capital fixo O que não é equivalente do ponto de vista conceitual ao preço de uma unidade de capital mesmo sendo que numericamente ambos podem coincidir Daí porque se utiliza o termo preço sombra no sentido de ser uma variável latente não observada diretamente De fato nos modelos de otimização da microeconomia no caso o modelo de maximização de lucro com uma restrição de capital fixo acumulado o preço sombra é equivalente ao multiplicador de Lagrange uma variável que não faz parte do problema a priori daí seu caráter latente mas procura auxiliar na resolução dele O argumento aqui desenvolvido para obter o EVI é uma adaptação da seção 511 de Wooldridge JM 2002 Econometric analysis of crosssection and panel data The MIT Press Cambridge Massachusetts US Nesta nota de aula fazse referência a outro livrotexto de Wooldrigde o denominado Econometric analysis of crosssection and panel data Este livro é denotado como WP em consonância com o programa da disciplina O livrotexto do curso Economia Introdutória do mesmo autor é indicado por W Tratase de uma nota de aula preparada por D Mcfadden a qual está disponível em httpelsaberkeleyeduusersmcfaddene240bf01ch4pdf Bound J Jaeger DA Baker RM 1995 Problems with instrumental variables estimation when the correlation between the instruments and the endogenous explanatory variable is weak Journal of the American Statistical Association 90 443450 É rigoroso denominar variáveis que teoricamente atendem às três condições fundamentais para serem denominadas VIs de VIs em potencial ou candidatas a VI enfatizando o fato de que não é possível a priori saber se tais condições são atendidas mas apenas a posteriori com procedimentos de inferência Tratase do livro Econometria introdutória Stock J H and M Yogo 2005 Testing for weak instruments in linear IV regression In I dentification and Inference for Econometric Models Essays in Honor of Thomas Rothenberg ed D W K A ndrews and J H Stock 80108 New York Cambridge University Press Quanto a isso cabe reiterar que o teste de Hausman para endogeneidade não parte do teste da significância estatística da correlação entre o termo de perturbação e a explicativa potencialmente endógena Ele toma por base outra estatística de testa qual seja a diferença entre os valores das estimativas pontuais gerados pelo MVI e pelo MQO Angrist J D 1990 Lifetime earnings and the Vietnam era draft lottery evidence from social security administrative records The american economic review 313336 24
Send your question to AI and receive an answer instantly
Recommended for you
17
Econometria - Modelos Probit, Logit, Tobit e Heckit - Análise da Participação Feminina no Mercado de Trabalho
Econometria
UFABC
13
Econometria II - Lista de Exercícios 2 - Heterocedasticidade Autocorrelação e Multicolinearidade
Econometria
UFABC
15
Anotações sobre Dados Empilhados e Dados em Painel em Econometria II
Econometria
UFABC
13
Notas de Aula: Econometria II - Equações Simultâneas
Econometria
UFABC
11
Notas de Aula - Econometria II: Dados Empilhados e Dados em Painel
Econometria
UFABC
818
Introdução à Econometria - Sixth Edition
Econometria
UFABC
1
Prova Econometria Series Temporais CPI Inflacao - Analise Dados R
Econometria
UFABC
1
Universidade Federal do ABC
Econometria
UFABC
13
Notas de Aula: Econometria II - Equações Simultâneas
Econometria
UFABC
14
Roteiro de Aula Econometria - Testes F e LM, Elasticidades e Operaçoes Matriciais
Econometria
UFABC
Preview text
Notas de aula para o curso de Econometria II Nota 7 variáveis explicativas endógenas 1 Introdução um pouco de inferência causal Esta nota de aula trata da violação da hipótese de exogeneidade a qual compõe o modelo clássico de regressão linear MCRL Tal desvio em relação ao modelo econométrico básico representa uma oportunidade para refletir em torno de uma questão crucial um modelo de regressão múltipla é capaz efetivamente de captar uma relação de causalidade entre uma variável explicativa causa e uma variável explica da consequência O exemplo a seguir é esclarecedor Possuir diversos livros em casa faz com que seus filhos tenham um bom desempenho na escola A análise de regressão não pode resp onder exatamente a esta questão mas sim a uma questão sutilmente distinta uma criança com diversos livros em casa tende a ter um melhor desempenho do que uma criança em cuja casa não há nenhum livro A diferença entre a primeira e a segunda questões é a diferença entre causalidade ques tão 1 e correlação questão 2 Levitt Dubner 2009 cap5 Para entender a última afirmação dos autores é preciso ter em conta as diversas maneiras p or meio das quais duas variáveis podem se relacionar e como esta diversidade dialoga com padrões revelados por um conjunto específico de dados Para tornar este diálogo mais claro são empregados dois termos para designar relações entre variáveis O primeiro relação aparente designa um padrão revelado a partir de uma análise simples de um conjunto de dados como a que toma por base a regressão múltipla O segundo relação de fundo se refere a como efetivamente as variáveis se relacionam Esta última geralmente não é observada diretamente S ua revelação requer o emprego de técnicas de análise de dados especiais como a apresentada nesta nota de aula Para os propósitos desta nota há três categorias básicas em que as r elações de fundo podem ser classificadas conforme os diagramas causais abaixo detalham Neles temse uma variável explicada y e uma variável explicativa x k O termo causação indica que há causalidade entre as variáveis Figura 1 Cau sação na direção explicativaexplicada Figura 2 C au sação re versa Figura 3 Compartilhamento de uma causa comum dependência mútua Se a partir de um conjunto de dados se observa um padrão entre os valores assumidos por duas variáveis seja ele o de uma relação aparente positiva ou negativa não é possível saber qual é exatamente a relação de fundo que está por trás deste padrão Colocando de outra maneira por trás da relação aparente pode haver qualquer uma das três relações de fundo básicas e até mesmo combinações d elas Não há porque portanto a priori clamar que é a causação na direção x k y que prevalece A menos que seja possível eliminar todas as outras relações de fundo exceto pela causação na direção x k y Esta maneira de proceder é de fato o caminho escolhido pela análise econométrica que procura mensurar com base nos conjuntos de dados geralmente disponíveis a intensidade com que a causação x k y se manifesta Para entender melhor como é possível avançar em tal direção cabe considerar as duas combinações mais relevantes de relações de fundo ilustradas nas figuras 4 e 5 Figura 4 Causação bilateral ou simultaneidade Figura 5 Causação e compartilhamento de causa comum efeito confundidor Em ambos os casos acima há causação na direção x k y mas porém a ocorrência de outra relação de fundo tende a fazer com a relação aparente entre x k e y capte o efeito combinado das duas relações Se pois com base nos dados disponíveis for calculada uma medida da causação pex uma estimativa pontual para o coeficiente de x k na regressão em que y é a variável explicada acabase obtendo uma medida para o efeito combinado Esta tende a não ser equivalente à magnitude do efeito da causação x k y As duas combinações das figuras 4 e 5 são recorrentes nos conjuntos de dados disponíveis para os economistas De fato a manifestação delas resulta na violação da hipótese de exogeneidade do MCRL A figura 4 compreende os casos de omissão de variáveis relevantes mas porém não observadas u e daí relegadas ao termo de perturbação Tais variáveis explicam y e também estão correlacionadas com x k dai a endogeneidade Na cadeia de causação bilateral d a figura 5 fatores que explicam uma das duas variáveis y por exemplo também expli cam a outra x k o que também vale para os termos omitidos Desta maneira y está correlacionado com termos omitidos que explicam x k e termos omitidos que explicam x k estão correlacionados com y É por isso que há endogeneidade Eliminar as relações de fundo indesejadas para isolar a causação x k y é equivalente a eliminar a endogeneidade das variáveis explicativas Voltando no exemplo de Levitt e Dubner o motivo pelo qual a regressão múltipla é incapaz de mensurar o efeito do tamanho da coleção de livros dos pais no desempenho escolar da criança está em que pode haver relações de compartilhamento de causa comum entre as duas variáveis Como os próprios autores mais à frente no texto colocam o tamanho da biblioteca dos pais pode ser uma medida para a importância que eles dão ao conhecimento e portanto à educação e é esta importância que explica o melhor desempenho de seus filhos a variável importância à educação desempenha o papel da variável u na figura 5 2 Determinantes da endogeneidade A endogeneidade de variáveis explicativas ie a existência de correlação significativa entre elas e o termo de perturbação viola uma das hipóteses do MCRL resultando na perda das propriedades de ausência de viés e consistência para os estimadores de todos os coeficientes O que significa que a inferência da função de expectativa condicional FEC Eyx se torna equivocada e que tal equívoco não pode ser nem mesmo atenuado por maior que seja o tamanho da amostra disponível inconsistência Infelizmente a natureza dos dados geralmente disponíveis para os economistas e para os cientistas sociais em geral é tal que a endogeneidade não é um fenômeno raro manifestandose muito pelo contrário na maioria dos estudos econométricos A gravidade das consequências da endogeneidade e sua recorrência justifica a atenção que tem sido dada na pesquisa científica em economia ao fenômeno De fato a elaboração de um argumento convincente para demonstrar que a endogeneidade é adequadamente contornada é prérequisito para que um estudo econométrico com dados transversais ou em painel seja aceito para publicação nas principais revistas de economia Há três motivos principais pelos quais a endogeneidade pode se manifestar 1 Omissão de variáveis relevantes algumas variáveis que segundo a teoria estão correlacionadas com a variável dependente e com pelo menos uma das explicativas podem não ser observadas É o caso por exemplo da habilidade ou produtividade dos trabalhadores na equação de Mincer para o salário recebido e das condições microclimáticas locais na equação que explica a produtividade agrícola A nãoobservação destas variáveis e consequente incorporação ao termo de perturbação faz com que este esteja correlacionado com pelo menos uma das variáveis explicativas A endogeneidade causada por omissão de variáveis relevantes resulta do fato de que as variáveis omitidas representam uma causa comum u compartilhada por pelo menos uma explicativa x k e pela variável dependente y ver figura 3 acima 2 Causação bilateral ou simultânea algumas relações causais propostas por teorias econômicas ou de outras ciências sociais podem ser bilaterais Cabe explicar com mais detalhe Seja a FEC objeto do analista EYx 1 x K i em que Y é assumida como a variável de resposta ou consequência e X toma a posição de causa Mas porém é possível com base na teoria que uma dada explicativa x k por exemplo seja causada por Y Neste caso pois as posições assumidas por Y e a késima explicativa na relação de causação são re vertidas o que pode ser representa do com base na FEC Ex k Y ii Tomandose aproximações lineares para as duas FECs i e ii temse Y Z 1 β γ x k u e x k Z 2 α δx k v em que Z 1 e Z 2 não contêm variáveis comuns Pela primeira regressão u explica Y e pela segunda Y explica x k de maneira que portanto u e x k estão correlacionados na primeira equação Um exemplo de causalidade bilateral é fornecido por estudos do efeito do policiamento sobre a incidência de crimes Em uma amostra de dados transversa is crosssection cujas unidades são diversas localidades de um determinado País municípios por exemplo a mensuração do efeito causal em questão é dificultada pelo fato de que tendem a ser contratados mais policiais nos locais em que a criminalidade é maior seja por conta de uma ordem de prioridade estabelecida por uma autoridade central da pressão imposta pela população aos governos locais ou por outros motivos Ou seja há causalidade em duas direções i do policiamento causa para o crime consequência esta a FEC que se deseja analisar e ii do crime causa para o policiamento consequência 3 Erros de medida a tentativa de criar medidas para variáveis não observadas tende a gerar regressores sujeitos a erros de medida correlacionados com variáveis explicativas É o que se tem quando a explicativa desejada tal como a teoria a especifica x k não sendo observada é substituída por uma medida imperfeita x k na FEC EYx 1 x k x K Esta última pode ser aproximada pela FRP linear y i x ik β δx ik u i a em que x ik é o vetor que contém todas as explicativas exceto a que é medida imperfeitamente x k A diferença entre a medida factível x k e a medida ideal x k pode ser expressa a partir de x ik x ik ϵ i em que ϵ i é o erro de medida Empregar a medida factível na estimação da FEC desejada é equivalente a estimar a y i x ik β δx ik u i assumindo que x ik x ik ϵ i o que resulta na regressão y i X i k β δx i k v i b em que v i u i δ ϵ i O erro de medida é pois automaticamente incorporado ao termo de perturbação Se ϵ i for correlacionado com a medida factível x ik a regressão b não verifica a hipótese de exogeneidade uma vez que covx ik v i 0 É apenas portanto quando há razões para acreditar que a diferença entre a medida ideal e a medida factível está correlacionada com a última é que o emprego da medida factível pode conduzir a estimativas pontuais não confiáveis U m exemplo para a ocorrência de erros de medida é o de estimação d a FEC que explica o investimento de uma empresa Segundo a macroeconomia neoclássica ver Romer 2012 p426 a principal variável explicativa é o q de Tobin um preço sombra e portanto não observado Um preço sombra é sempre um valor marginal infinitesimal e portanto o q de Tobin capta o retorno marginal do capital Dada a dificuldade de calcular o q de Tobin a partir dos dados geralmente disponíveis a lguns autores empregam como medida factível a razão entre o valor de mercado de uma empresa e o valor de seu estoque de capital o que corresponde a o retorno médio do capital Caso a diferença entre o retorno marginal e o médio seja correlacionado com o último a regressão em que o investimento é explicado em função de tal retorno médio estará sujeita à endogeneidade Nest a nota de aula é apresentado um método que produz estimadores não viesados e consistentes mesmo na presença da endogeneidade o método de va riáveis instrumentais MVI S ão focadas estruturas de dados transversais 3 O método de variáveis instrumentais MVI 31 Hipóteses fundamentais O MVI parte do princípio de que é possível decompor a explicativa correlacionada com o termo de perturbação denominada por explicativa endógena em i uma parte correlacionada com tal termo a parcela endógena e ii uma parte não correlacionada com o termo de perturbação a parcela exógena Se a primeira parcela for descartada e apenas a parcela exógena for utilizada na FEC de interesse a correlação entre explicativas e o termo de perturbação é eliminada de modo que o estimador de MQO será não viesado e consistente A dificuldade está em realizar a decomposição descrita uma vez que não há meios para identificar diretamente qual fração da informação referente à variação ao longo das unidades da variável endógena não é correlacionada com o termo de perturbação Uma possibilidade está em encontrar pelo menos uma variável não pertencente ao conjunto de explicativas para a variável dependente correlacionada apenas com a parcela exógena da explicativa endógena e utilizar tal correlação para identificar a parcela desejada Seja assumido que a variável w é correlacionada apenas com a parcela exógena de x k esta a explicativa endógena Deste modo x k pode ser decomposta em Ex k w e em um erro não correlacionado com x k ε ie x k Ex k w ξ A parte da parcela exógena da variável de x k que é possível identificar com base em w é portanto Ex k w e a identificação pode ser realizada com base na estimação por MQO dos coeficientes da aproximação linear a Ex k w Geralmente não há base convincente para argumentar que w está correlacionada apenas com a parcela exógena de x k por um motivo simples a parcela exógena não é uma variável em si ie uma medida para alguma característica das unidades mas apenas uma parte da informação contida na variável x k Se a parcela exógena não é em si uma variável não é possível construir um argumento com base na teoria que justifique a correlação entre ela e w Uma solução alternativa está em ao invés de procurar uma variável w correlacionada apenas com a parcela exógena de x k obter uma variável z 1 correlacionada com a informação completa de x k parcela exógena e endógena e não correlacionada com o termo de perturbação u da equação que explica a variável dependente qual seja Y EYx 1 x k x K u Uma variável z 1 que atenda a estes dois critérios é denominada por variável instrumental VI Há um terceiro critério geralmente implícito que é o de que z 1 não pertença ao esteja excluída do conjunto de explicativas sugerido pela teoria para a FEC de Y ou seja a variável instrumental não explica a variável dependente Daí porque se diz que z1 tem de estar excluída da equação para Y Uma condição deste gênero que exclui uma variável de uma determinada equação é denominada por restrição de exclusão termo empregado na teoria econométrica de equações simultâneas A figura 6 a seguir ilustra a relação de fundo garantida pela verificação dos dois critérios mencionados entre a variável instrumental z 1 e a explicativa endógena x k Estão também representadas as relações de fundo entre x k a variável dependente y e o conjunto de fatores não observados e pois omitidos relegados ao termo de perturbação u Figura 6 relação de fundo entre x k e a variável instrumental z É preciso compreender com detalhe o requerimento de que a variável instrumental VI não seja correlacionada com u Caso haja correlação entre z 1 e u a parcela de x k correlacionada com z 1 a qual pode ser representada por Ex k X k z 1 em que X k contém todas as explicativas exceto x k não pode ser empregada como medida para a parcela exógena de x k uma vez que Ex k X k z 1 estará correlacionada com u não sendo pois exógena Neste caso a relação de fundo z u e xk é tal como representada na figura 7 Figura 7 relação de fundo entre x k e uma variável instrumental endógena z Uma explicação mais clara é possível Seja tomada uma aproximação linear para a FEC EYX de modo que a equação de interesse para o analista seja Y β 0 β 1 x 1 β k x k β K x K u 1 Em que Eu X 0 pois covu x k 0 Esta equação é denominada por equação estrutural uma vez que representa o modelo completo especificado pela teoria Tomando uma aproximação linear para a FEC Ex k X k z 1 temse x k δ 0 δ 1 x 1 δ k1 x k1 δ k1 x k1 δ K x K θ z 1 v 2 Em que v é um termo de erro com média nula e nãocorrelacionado com nenhuma das explicativas da equação 2 Esta segunda equação é denominada por equação reduzida terminologia emprestada dos modelos de equações simultâneas tópico a ser visto na parte IV do curso O coeficiente θ capta a correlação de z 1 sobre x k líquida da influência das demais explicativas É assumido que há apenas uma explicativa endógena x k de maneira que todas as variáveis do lado direito da equação 2 são exógenas ie não correlacionadas com o termo de perturbação da equação 1 u Os coeficientes da equação 2 podem ser estimados consistentemente por MQO o que permite submeter a teste a hipótese de que a VI z 1 é correlacionada com x k Plugando 2 em 1 obtémse Y β 0 β 1 x 1 β k δ 0 δ 1 x 1 δ k1 x k1 δ k1 x k1 δ K x K θ z 1 v β K x K u Coletando os termos comuns Y α 0 α 1 x 1 α k1 x k1 α k1 x k1 α K x K λ z 1 ε 3 α s β s β k δ s s 0k1 k1K λ β k θ ε u β k v Se EuZ 0 ie resulta que z 1 é endógena na equação 3 uma vez que ε contém u Neste caso os estimadores de MQO obtidos de 3 serão inconsistentes mesmo após substituir x k p or sua projeção linear em todas as variáveis exógenas e z 1 Grosseiramente o que se tem é que substituir uma variável endógena x k por outra variável endógena Ex k X k z fX k z não pode ser uma solução para o problema de endogeneidade Ao contrário quando EuZ 0 o estimador de MQO é consistente na equação 3 e é possível recuperar através das estimativas para os coeficientes da equação 3 os coeficientes da equação 1 uma vez que são os últimos que interessam ao analista recordando que o objetivo da análise é sempre inferir a FEC para Y 32 O estimador de variáveis instrumentais EVI O estimador de variáveis instrumentais EVI procura obter diretamente os coeficientes da equação estrutural e não por meio da recuperação a partir de equações que relacionam os parâmetros desejados e os efetivamente estimados como o final da seção anterior sugere O caminho direto é possível a partir do procedimento descrito no que segue Seja Z X k z 1 ie Z 1 x 1 x k 1 x k 1 x K z 1 uma matriz N x K1 que contém todas as variáveis exógenas e a VI z 1 O termo 1 representa um vetor Nx1 de valores unitários o qual permite incorporar o termo de intercepto Cabe explicitar as duas hipóteses de exogeneidade tomadas por base sendo elas H exo 1 Covx j u 0 j 1k1k1K ie todas as explicativas exceto a késima são exógenas H exo 2 Cov z 1 u 0 ie a variável instrumental é exógena Destas hipóteses decorre que a matriz Z é exógena o que pode ser representado como CovZu 0 Empregando a definição de covariância a exogeneidade de Z pode ser expressa como CovZu EZEZuEu EZu ZEu EZu EZEu EZu EZEu EZEu EZEu EZu EZEu É de praxe assumir que o termo de perturbação tem expectativa nula ie Eu 0 o que se incorporado a resulta em CovZu EZu 0 Desta maneira pois das hipóteses de exogeneidade para todas as explicativas exceto x k e para z 1 decorre a condição EZu 0 a qual é conhecida como condição de ortogonalidade formulada para a população É a partir desta condição ie de sua verificação na população pela matriz de variáveis exógenas Z que se obtém o estimador de variáveis instrumentais EVI tal como o parágrafo a seguir detalha A equação estrutural em forma matricial pode ser escrita como Y Xβ u com β contendo o intercepto e portanto a primeira coluna de X é tem todos seus elementos iguais à unidade Podese escrever u Y Xβ e portanto a condição de ortogonalidade passa a EZu EZY Xβ 0 Do que decorre que EZY EZXβ 0 o que leva em conta o fato de que o vetor de coeficientes β é um conjunto de parâmetros populacionais e não uma variável aleatória Chegase a EZY EZXβ Prémultiplicando ambos os lados da equação pela inversa da matriz EZX sob a hipótese de que ela é invertível ie tem posto completo uma hipótese fundamental do EVI EZX 1 EZY EZX 1 EZXβ O que é equivalente a β EZX 1 EZY Para obter um estimador que com base na amostra gere uma estimativa pontual para o vetor populacional β é preciso recorrer ao princípio da analogia ie tomar as contrapartidas amostrais para os momentos populacionais EZX 1 e E ZY É desta maneira que o EVI é obtido Ele assume a seguinte forma β VI i1 N z i x i 1 i1 N z i y i Z X 1 Z Y Uma vez que o estimador foi obtido sob a hipótese de condição de ortogonalidade na população é intuitivo que caso tal hipótese seja falsa o EVI não tenha propriedades desejáveis De fato conforme já colocado anteriormente ele será inconsistente o que decorre diretamente de que EuZ 0 O EVI para o késimo coeficiente assume a forma abaixo β k covz y covz x 4 Viés do estimador de variáveis instrumentais EVI Há um detalhe crucial quanto às propriedades do EVI geralmente omitido da maioria dos livrostexto ele é viesado mesmo com a verificação da condição de ortogonalidade W P p101 e 104 O que pode ser indicado tal como segue ainda que de maneira estritamente intuitiva e não rigorosa não se tratando portanto de uma demonstração formal adaptado de Mcfadden 1999 p6 E β VI E E β VI ZX E E Z X 1 Z Y ZX E E Z X 1 Z Xβu ZX Ou seja E E β VI ZX βE Z X 1 E u ZX Uma vez que EuX 0 pois é exatamente por conta disso que o EVI é empregado ao invés do estimador de MQO então EuZX 0 mesmo com EuZ 0 vide Mcfadden 1999 p6 De fato há diversos artigos que procuraram calcular o viés do EVI vide por exemplo Angrist Pis chke seção 464 Bun Windmeijer 2010 Bound et al 1995 5 Mínimos quadrados de dois estágios Quando há mais de uma VI em potencial disponível para a explicativa endógena mantendo pois a hipótese de que há apenas uma explicativa endógena se coloca o problema de selecionar o instrumento De fato o princípio de otimização da informação disponível um dos pilares da análise econométrica mesmo que não obstante nem sempre seja explicitado recomenda que nenhuma das candidatas à VI seja descartada Para isso um princípio que parece adequado é o de tomar a melhor combinação linear dos instrumentos ie a combinação linear com maior correlação menor erro de aproximação linear com a variável endógena Esta é a ideiabase do estimador de mínimos quadrados de dois estágios MQ2E Cabe detalhar As equações 1 e 2 da seção anterior podem ser escritas em forma matricial mantendo a hipótese de que há apenas uma explicativa endógena em 1 Y X k β k β k x k u 1 x k Z δ v 2 Em que Z x 1 x k 1 x k 1 x K z 1 z M X k z z agora uma matriz com L colunas O estimador de MQO para δ na segunda equação é δ OLS Z Z 1 Z x k Este estimador pois gera uma previsão para x k que corresponde à melhor aproximação linear para a FEC Ex k Z o que quer dizer que a combinação linear entre as explicativas exógenas e os instrumentos tomada por base é tal que a soma dos quadrados do erro de previsão é minimizado A informação contida nos instrumentos é portanto otimizada A projeção linear de x k nas variáveis exógenas é x k Z δ OLS ZZ Z 1 Z x k Uma vez que X X k x k a matriz de explicativas em que x k toma o lugar de x k será denotada por X X k x k O estimador de MQO para os coeficientes da aproximação linear à FEC EY X é β MQ 2 E X X 1 X Y Este estimador é equivalente ao estimador de variáveis instrumentais que toma como instrumento para a matriz X sua projeção no hiperplano definido pelo conjunto de variáveis cuja composição conta com i as explicativas exógenas e ii as VIs O que resulta em X uma vez que a projeção das explicativas contra elas mesmas retorna as próprias variáveis inalteradas Algebricamente o estimador MQ2E pode ser obtido a partir de um procedimento de dois estágios em que i no primeiro estimase 2 a equação reduzida obtendose X e ii no segundo estimase a equação estrutural Este procedimento contudo raramente é utilizado na atualidade uma vez que tende a conduzir a erros de inferência O motivo está em que as estatísticas dos testes de significância para os coeficientes da equação estrutural apenas podem ser obtidas se o termo de perturbação da equação estrutural for estimado O que não pode ser rigorosamente feito a partir de Y X β MQ2E ie dos resultados do segundo estágio uma vez que com isso se obtém uma estimativa para o termo de perturbação da equação populacional que relaciona Y e X Ou seja assim se estima ε Y EY X mas porém como o objetivo da análise é fazer inferência sobre EYX é preciso calcular resíduos que estimem u Y EYX WP p95 Porém o procedimento de dois estágios se implementado a partir de um software econométrico estimandose sequencialmente as duas regressões retorna no segundo estágio valores para as estatísticas de teste e pvalores computados a partir de estimativas para ε A relação precisa entre ξ e u pode ser explicitada levandose em conta o fato de que x k Ex k Z v e observando que x k procura prever a FEC Ex k Z e por isso a FRP do segundo estágio assume a seguinte forma Y X k β k β k Ex k Z v u X k β k β k Ex k Z β k v u X k β k β k Ex k Z ε Esta equação portanto conforme já dito não representa a equação estrutural esta dada por 1 Mas porém é ela que é estimada no segundo estágio de modo que o resíduo calculado com base nela estima ε β k v u WP p527 Felizmente os principais softwares econométricos contêm rotinas préprogramadas que implementam diretamente o estimador de MQ2E não sendo necessário executar manualmente o procedimento de dois estágios Há também rotinas que executam procedimentos de dois estágios corrigindo porém os resíduos do segundo estágio de maneira a obter estimativas para u Y EYX 6 Propriedades do estimador de MQ2E O estimador MQ2E é consistente e eficiente de fato ele é o estimador mais eficiente na classe dos estimadores de VI que tomam por base alguma combinação das VIs disponíveis o MQ2E toma a combinação mais correlacionada com a explicativa endógena Tais propriedades são válidas apenas quando as hipóteses a seguir são verificadas 1 Condição de ortogonalidade EZu 0 2 As matrizes EZZ e EZK são invertíveis ie têm posto completo A homocedasticidade das perturbações e a ausência de autocorrelação entre elas garantem que as estatísticas para o teste de significância parcial e conjunta comumente utilizadas têm distribuições assintóticas conhecidas e padrão t de Student para o teste t e F de Snedecor para o teste F WP seção 522 É claro que heterocedasticidade e autocorrelação não impossibilitam a inferência conforme visto anteriormente parte I do curso mas apenas requerem a modificação das estatísticas do teste de maneira a incorporar a correta estrutura da matriz de variânciacovariância das perturbações O que é facilmente realizado a partir dos principais softwares econométricos 7 Inferência 7 1 Inferência básica Conforme já colocado as estatísticas t e F usuais podem ser empregadas para realizar respectivamente os testes de significância individual e conjunta para o vetor populacional β desde que incorporem a estrutura correta da matriz de variânciacovariância dos resíduos O EVI do qual o MQ2E é um caso particular exige um cuidado peculiar em relação ao estimador de MQO no cálculo das estimativas para as variâncias dos estimadores que é o de considerar os resíduos da equação estrutural u Y X β MQ2E e não os resíduos do segundo estágio ε Y X β MQ2E Reiterando os principais softwares calculam as estatísticas com base nos resíduos corretos desde que sejam empregadas rotinas de MQ2E Não se deve procurar implementar a partir de rotinas de MQO o procedimento de dois estágios 7 2 Teste de endogeneidade de Hausman Hausman 1978 apud WP p532 propôs um procedimento geral de teste para a especificação de um modelo econométrico o qual pode ser empregado para testar a hipótese de que há pelo menos uma explicativa endógena Antes de apresent á lo cabe destacar um ponto crucial e nem sempre claro Um teste de endogeneidade que tome por base a correlação entre o termo de perturbação e a explicativa potencialmente endógena é impossível A razão está em que sendo x k a explicativa sobre a qual recai a suspeita de endogeneidade a hipótese nula do teste seria a de que covx k u 0 de modo que a implementação do teste exige a observação de um elemento que nunca é observado o termo de perturbação u WP p86 Por mais que este termo possa ser estimado a partir dos resíduos da regressão o conteúdo informacional em que consistem os resíduos não compreende todo o conteúdo informacional do termo de perturbação sendo pois termo de perturbação e resíduos elementos distintos O teste de Hausman porém não procura estimar o termo de perturbação T ratase de um teste indiret o para endogeneidade Ele parte da percepção de que as estimativas de MQO e MVI ou MQ2E este um caso particular d o MVI tendem a diferir caso x k seja endógena uma vez que o estimador de MQO é inconsistente e o EVI é consistente Caso contrário ie com x k exógena as estimativas por MQO e MVI tendem a ser equivalentes A cada uma das duas possibilidades para a endogeneidade de x k corresponde uma possibilidade específica distinta para o comportamento comparado dos estimadores Há uma correspondência perfeita ver o quadro abaixo entre i a verdadeira situação quanto à endogeneidade da explicativa suspeita de endogeneidade e ii a discrepância entre as estimativas de MQO e MVI Desta maneira ii pode ser utilizado como evidência para indicar se x k é endógena ou não Tabela 1 Correspondência tomada por base no teste de endogeneidade Explicativa suspeita x k MQO MVI Estimativas comparadas Exógena Consistente Consistente Equivalentes Endógena Inconsistente Consistente Distintas Uma estatística de teste pertinente é a que toma por base a magnitude da discrepância entre as estimativas de MQO e MVI para um mesmo coeficiente Se esta discrepância for estatisticamente significativa há evidência estatisticamente válida de que os estimadores diferem e portanto há evidência de endogeneidade A hipótese nula do teste de Hausman é a de que a discrepância é nula na população ou seja a késima explicativa é exógena A obtenção da estatística do teste de Hausman parte do fato de que N β MVI β MQO a N 0 V q N 0 V β MVI V β MQO Em que a indica a distribuição assintótica e V é a vari ância assintótica do estimador Do que decorre H N β MVI β MQO V q 1 β MVI β MQO a χ K1 2 Esta sendo a estatística do teste e K1 o número de parâmetros a serem estimados intercepto e coeficientes angulares Há uma maneira alternativa de computar o teste de Hausman Ela se apoia na percepção de que segundo a equação reduzida para a explicativa endógena x k Z δ v tal variável apenas pode estar correlacionada com o termo de perturbação da equação estrutural u caso v esteja E isso pois Z é exógena por definição Assim sendo é possível escrever u Euv ξ em que ξ é um termo de perturbação não correlacionado com v Assumindo uma aproximação linear u ρv ξ o que se incorporado à equação estrutural resulta em Y X k β k β k x k ρv ξ 4 Esta equação é na prática a equação estrutural aumentada para conter v como regressor Os coeficientes desta equação podem ser consistentemente estimados por MQO Isso é verdade pois nenhum dos regressores está correlacionado com o termo de perturbação ξ Para compreender porque é preciso levar em conta que O vetor X k por ser composto por explicativas exógenas não está correlacionado com u e portanto com seu componente ξ O termo de perturbação ξ não está correlacionado com x k pois ξ é não correlacionado com v e é apenas por meio da correlação com v que ξ poderia estar correlacionado com x k uma vez que Z é não correlacionado com v O termo v não está correlacionado com ξ por conta da definição do último Uma dificuldade é colocada pelo fato de que v assim como u não é observado uma vez que se trata de um termo de perturbação Contudo o procedimento do teste obtém estimativas para v a partir de v x k Z δ MQO ie da regressão para a equação reduzida incorporandoo como substituto para v na equação 4 de modo a obter pois Y X k β k β k x k ρ v ϵ 4 O teste de Hausman se reduz a um teste de significância estatística para o parâmetro ρ na equação 4 mantendo como hipótese nula a de que x k é endógena Caso ρ se mostre estatisticamente significativo em 4 a hipótese é rejeita da e portanto há evidência a favor da endogeneidade de x k É preciso mais uma vez atentar para o fato de que inferência com base nos resíduos estimados a partir de 4 é equivocada uma vez que o termo de resíduo correto deve estimar ξ e não ϵ Isto pode ser corrigido estimandose a equação estrutural por MVI diretamente obtendo os resíduos u Y X β MQ2E e os considerando como base para cálculo das estimativas para a variância do estimador de MQO para ρ Os principais softwares de econometria possuem rotinas para a estimação do teste de Hausman recomendase a utilização de tais rotinas ao invés d a implementação manual do procedimento de dois estágios acima a partir de estimações por MQO sequenciais O teste de endogeneidade de Hausman é utilizado para verificar se é efetivamente necessário recorrer ao MVI devendo pois ser reportado sempre que houver razões para desconfiar da exogeneidade das explicativas ou seja de acordo com o observado na introdução o teste de Hausman deve ser reportado sempre que pelo menos uma VI estiver disponível 7 3 Teste de sobreidentificação Caso exista mais de um instrumento para a variável endógena é dito que o modelo econométrico está sobreidentificado um termo proveniente do estudo de modelos de equações simultâneas O teste de especificação de Hausman pode ser empregado para testar se a incorporação de mais instrumentos do que o necessário para identificar o modelo no caso mais do que um instrumento realmente contribui para a precisão dos estimadores De fato um caso extremo em que a inclusão de um instrumento adicional não contribui em tal sentido é aquele em ele é endógeno ie correlacionado com o termo de perturbação da equação estrutural Quando isso ocorre a contribuição do instrumento acaba sendo negativa e é interessante testar se este é o caso uma vez que o EVI será claramente inconsistente A lógica do teste de sobreidentificação é análoga à do teste de endogeneidade mas porém os estimadores a serem comparados são i o EVI exatamente identificado ie que incorpora um número de instrumentos equivalente ao número de explicativas endógenas um como assumido e ii o EVI sobreidentificado Caso entre os instrumentos disponíveis pelo menos seja exógeno o mesmo não podendo ser afirmado para todos os demais o EVI identificado será mesmo assim consistente quando calculado a partir do instrumento endógeno Já o EVI sobreidentificado que incorpora todos os instrumentos disponíveis será inconsistente A tabela a seguir detalha a lógica do teste de sobreidentificação Tabela 2 Correspondência tomada por base no teste de sobreidentificação Instrumentos adicionais MVI identificado MVI sobreidentificado Estimativas comparadas Exógenos Consistente Consistente Equivalentes Pelo menos um endógeno Consistente Inconsistente Distintas A estatística do teste portanto é obtida com base na diferença entre as estimativas geradas por MVI identificado e MVI sobreidentificado Wooldridge W p534 propõe uma alternativa para realizar o teste a partir de um procedimento de dois estágios sendo ele Estimar por MQO2E a equação principal e obter os resíduos denotandoos por u 1i Estimar a regressão em que os resíduos do passo anterior são a variável dependente e as variáveis independentes são os instrumentos e as variáveis exógenas Denotar o coeficiente de de terminação de tal regressão por R 2 1 Sob a hipótese nula de que os instrumentos e as exógenas são não correlacionadas com as perturbações da equação principal N R 2 1 tem distribuição quiquadrado com número de graus de liberdade igual a q Este é equivalente ao número de instrumentos extra Ou seja a diferença entre variáveis endógenas e instrumentos Se o valor observado da estatística for superior ao valor crítico ao nível de significância de 5 rejeitase correlação nula e afirmase que pelo menos um dos instrumentos é endógeno Ou seja concluise pela invalidade do conjunto de instrumentos O s principais softwares de econometria realizam o teste de sobreidentificação e o resultado deve sempre ser reportado quando há mais instrumentos do que explicativas endógenas O teste de sobreidentificação deve ser visto como um teste de que o modelo está corretamente especificado ie de que se adequa aos dados disponíveis No caso em que a evidência de sobreidentificação com VIs supostamente endógenas os resultados apontadas pela inferência não são confiáveis 7 4 Instrumentos fracos Já foi dito que o EVI do qual o estimador de MQ2E é um caso particular é viesado Este viés tende a ser tão maior quanto menos correlacionadas com a explicativa endógena forem as VIs O que no jargão da prática econométrica é indicado por meio da expressão VIs fracas entendendo aí por fraqueza uma correlação baixa ie nãoestatisticamente significativa das VIs com a explicativa endógena Além disso a variância do EVI é tão maior quanto mais fracos forem os instr umentos basta tomar em conta a fórmula para o estimador da variância assintótica do estimador de EVI para o késimo coeficiente WP102103 V β k σ 2 SQT K 1 R K 2 Em que SQT é uma medida para a variabilidade na amostra de x K esta representando o valor de x k previsto a partir da regressão contra as explicativas exógenas e os instrumentos estas últimas sendo denotadas por z De fato o que temos é SQT k i1 N x ik x k 2 i1 N β 0 j1 J β k z ij 1 N i1 N β 0 j1 J β k z ij 2 Uma vez que o estimador de MQO é tal que a soma de seus resíduos é equivalente a zero e portanto a média do valor previsto pela regressão x k é igual à média do valor observado x k temse que 1 N i1 N β 0 k1 K β k z ij 1 N i1 N x ik e daí SQT k i1 N x ik x k 2 i1 N x ik 1 N i1 N x ik 2 SQE z Is t o é a SQT de x k é equivalente à soma dos quadrados explicada na regressão de x k contra os instrumentos z e as explicativas exógenas Ou colocando de outra maneira a SQT da previsão para x k é a SQE da regressão de primeiro estágio Daí temse finalmente que V β k σ 2 SQE z 1 R K 2 Quanto mais fracos os instrumentos menor a parcela da variação de x k explicada pela regressão de primeiro estágio e portanto menor é a SQE z Quanto menor a SQE z maior a estimativa pontual para a variância do estimador O que tende a provocar erros do tipo II em testes de significância individual para o coeficiente da explicativa endógena após ter sido devidamente exogeneizada Em suma instrumentos fracos têm uma dupla contribuição para tornar a inferência equivocada As estimativas para os coeficientes tendem a se manter distantes dos valores populacionais o que resulta em uma inferência pontual equivocada ou viés Em segundo lugar as variâncias dos estimadores são infladas Com isso o s testes de significância estatística tomam por base tanto estimações pontuais erradas como desviospadrão equivocados o mesmo sendo verdadeiro para os intervalos de confiança W P p 104 A fraqueza dos instrumentos pode ser medida a partir de um teste de significância estatística para os coeficientes a eles associados na equação reduzida Tanto testes de significância individual para cada instrumento como um teste de significância conjunta para os instrumentos como um todo devem ser reportados Além disso há testes mais adequados como o de StockYogo para instrumentos fracos que estão disponíveis nos softwares econométricos A hipótese nula de tais testes é a de que os instrumentos são fracos este o caso do teste de Stock e Yogo e portanto apenas mediante rejeição da mesma é que as estimativas têm credibilidade 8 Argumentando em defesa da ex o geneidade do instrumento Um ponto importante é o de que enquanto a primeira propriedade de uma variável instrumental a correlação com a variável endógena pode ser efetivamente submetida à refutação empírica a segunda propriedade de não correlação com fatores omitidos da equação de interesse não pode ser testada O motivo pelo qual é impossível verificar a fidedignidade empírica da propriedade que mais claramente distingue uma variável instrumental de uma variável endógena pode ser encontrado na própria natureza do problema original O fato de os fatores omitidos serem nãoobserváveis impede que sua correlação com a variável instrumental seja mensurada De tal sorte a mesma desconfiança que tende a pairar sobre uma variável explicativa quanto à sua provável correlação com fatores omitidos pode ser direcionada para a variável instrumental com base na qual se procurar debelar tal desconfiança Este nó é superado pelos pesquisadores a partir do recurso à argumentação e assinalese não a evidências empíricas diretamente comprobatórias uma vez que estas não podem ser obtidas O objetivo das justificativas providas pelos pesquisadores sempre é o de defender a exogeneidade da variável instrumental apresentando razões pelas quais variáveis explicativas omitidas não podem estar correlacionadas com ela Ou seja tratase de defender que as relações de fundo entre i z e x k e entre ii z e u correspondem ao representado na figura 6 acima e não ao representado na figura 7 as duas figuras são reproduzidas abaixo Figura 6 relação de fundo entre x k e a variável instrumental z Figura 7 relação de fundo entre x k e uma variável instrumental endógena z 9 Exemplo de variável instrumental Angrist 1990 American Economic Review 91 Objetivo O objetivo do artigo de Angrist 1990 é determinar se veteranos da guerra do Vietnam obtinham no mercado de trabalho remuneração inferior a nãoveteranos E isso pois apenas em tal caso seriam justificados os múltiplos subsídios recebidos por tal grupo social dado que se trataria de compensálo por desvantagens frente ao mercado de trabalho A estimativa do efeito da variável binária que indica se um indivíduo é veterano é inconsistente uma vez que ela é correlacionada com fatores nãoobserváveis captados pelo termo de perturbação Um deles é o custo de oportunidade da atividade militar ie a maior remuneração obtenível com atividade civil Como diz o autor homens com relativamente poucas oportunidades civis têm maior probabilidade de alistaremse Tal inconsistência é mitigada recorrendose a uma variável instrumental bastante criativa Tratase do número aleatório atribuído a cada cidadão americano homem por s orteio nacional utilizado para determinar quem deveria se apresentar ao exército para ser ou não recrutado 92 A variável instrumental A maneira como tal número foi atribuído não é de primeira importância homens nascidos em um mesmo ano e pois com a mesma idade no ano de referência receberam cada um número de um a 365 sendo tal número aleatoriamente atribuído a um dos dias do ano O fundamental é tal número era no máximo 365 e foi estabelecido um número máximo ou teto inferior a 365 para convidar candidatos a apresentaremse Com isso quem foi ou não convidado foi determinado aleatoriamente Os convidados poderiam ou não ser selecionados a depender de exames mentais e físicos Como diz o autor mesmo com a seleção não tendo sido aleatória a prioridade para seleção foi aleatória Notese que o fato de ter sido convidado é i correlacionado com o fato de ter servido na guerra ii aleatório e portanto não correlacionado com o custo de oportunidade do serviço militar salário civil potencial não sendo um fator que segundo a teoria determina a remuneração diretamente está excluído da equação de remuneração Temse pois uma variável instrumental potencial 93 Descrição dos dados e equações Evidência visual da menor remuneração por veteranos selecionados pelos sorteios se encontra nos gráficos abaixo em que se exibe a diferença entre homens elegíveis para apresentação com numeração abaixo do teto e não elegíveis Cada gráfico se refere a um coorte ou geração grupo de indivíduos nascidos no mesmo ano Os grupos de pele branca e não branca estão separados à esquerda e direita Uma das razões para a ausência de diferença sistemática para homens nascidos em 1953 é que neste ano o sistema de sorteio aleatório começou a ser substituído pela apresentação voluntária A equação principal para o iésimo homem pertencente ao césimo coorte no tésimo instante é Remuneração c i t β 0 β 1 veteranoi β 2 coorte c tempoα uit Em que são usadas como variáveis de controle dummies de coorte coorte e dummies temporais tempo Já a equação de primeiro estágio poderia ser concebida como algo próximo a Veteranoi a 0 a 1 elegívelpara apresentação i ei Contudo a rigor é incorreto especificar tal equação uma vez que tanto a variável dependente como a única independente são binárias O essencial conforme esclarece o autor é que a abordagem de variáveis instrumentais ao invés de comparar veteranos com não veteranos compara homens elegíveis para apresentação com não elegíveis E isso pois enquanto a participação nas categorias veterano e nãoveterano é sujeita à endogeneidade o mesmo não pode ser dito quanto ao status em relação à eligibilidade O autor acrescenta que a estimativa de diferença é corrigida pelo fato de que alguns elegíveis não se tornaram veteranos e nãoelegíveis apresentaramse voluntariamente ver eq2 na p320 94 Resultados São utilizadas as cinco edições consecutivas do sorteio para dois grupos sociais definidos em função de cor de pele e coorte Os instrumentos também variam ao longo dos anos Além disso a variável instrumental foi definida não como uma binária indicando se o número recebido a partir do sorteio foi inferior ao teto mas sim faixas para o número cobrindo o intervalo de 1 a 365 Com isso um grande número de instrumentos estava disponível O teste de sobreidentificação não rejeitou a hipótese nula atestando exogeneidade das variáveis instrumentais como um todo O que pode ser visto na tabela 4 abaixo em que as estatísticas quiquadrado do teste de Hausman com a implementação a partir da estatística de forma quadrática a qual é interpretada como diretamente proporcional à correlação entre a regressão principal e os instrumentos pelo autor Comparar com o número de graus de liberdade é uma maneira rápida de indicar o resultado do teste a qual toma por base o fato de que a média populacional de uma variável quiquadrado é exatamente o número de graus de liberdade Com isso por mais que a distribuição seja assimétrica ela dificilmente teria probabilidade acima da média inferior a 5 e pois dificilmente um valor da estatística abaixo da média pertenceria à cauda superior da região crítica A tabela também reporta as estimativas pontuais em sua maioria negativas para o grupo de pele branca com exceção de 1953 O que está totalmente alinhado com os gráficos da seção anterior O autor apresenta uma extensão da equação principal em que em consonância com a equação de Mincer são incluídos os níveis de educação e experiência O objetivo é testar a hipótese de que parte da menor remuneração dos veteranos é devida à que experiência militar não é um substituto perfeito da experiência civil no mercado de trabalho Tal equação também é estimada com base nas mesmas variáveis instrumentais e à ela é aplicado um teste de sobreidentificação Resulta que de fato a menor experiência dos veteranos redundou em menor remuneração Em suma o resultado é o de que veteranos de pele branca recebiam remuneração 15 inferior mesmo dez anos depois do retorno da guerra Conforme analisado u ma explicação para tanto empiricamente sólida é a de que os veteranos possuíam menor experiência no mercado de trabalho civil De fato a perda de rendimento decorrente de menor experiência foi estimada como equivalente a dois anos a menos de experiência laboral civil Esta seção toma por base o cap 5 de Levitt Dubner 2009 Freakonomics e também o capítulo 3 de Morgan Winship Counterfactuals and Causal Inference Inferência causal é uma área da econometria e mais amplamente da análise estatística de dados não experimentais que tem conquistado cada vez mais adeptos entre os economistas Um estudo que alcançou grande projeção no meio científico e também na opinião pública em que a endogeneidade causada pela causalidade bilateral entre policiamento e incidência de crimes é o de Steven Levitt publicado na American Economic Review em 1997 e disponível no link httppricetheoryuchicagoedulevittPapersLevittUsingElectoralCycles1997pdf Segundo Levitt 1997 artigo referido na nota anterior quanto maior a incidência de crimes maior a produtividade marginal da polícia Da análise dos dados descritos com base na estimação por MQO da FEC Ecriminalidadepoliciamento outras variáveis nada pode ser concluído É o que a cautela recomenda Quanto a isso é pertinente a anedota contada por Levitt e Dubner Freakonomics 2005 introdução p9 segundo a qual um czar ao descobrir que a província de seu império com maior incidência de doenças era também a província em que trabalhava o maior número de médicos decretou como medida para conter a disseminação de doenças pena de morte para todos os médicos Romer D Advanced MacroeconomicsMcGrawHill quarta edição O q de Tobin rigorosamente mede o valor presente descontado do fluxo perpétuo de lucros proporcionado por um aumento infinitesimal no estoque de capital de uma empresa Romer 2012 p410411 Ou seja tratase do valor verdadeiro de acordo com a teoria de uma unidade adicional de capital fixo O que não é equivalente do ponto de vista conceitual ao preço de uma unidade de capital mesmo sendo que numericamente ambos podem coincidir Daí porque se utiliza o termo preço sombra no sentido de ser uma variável latente não observada diretamente De fato nos modelos de otimização da microeconomia no caso o modelo de maximização de lucro com uma restrição de capital fixo acumulado o preço sombra é equivalente ao multiplicador de Lagrange uma variável que não faz parte do problema a priori daí seu caráter latente mas procura auxiliar na resolução dele O argumento aqui desenvolvido para obter o EVI é uma adaptação da seção 511 de Wooldridge JM 2002 Econometric analysis of crosssection and panel data The MIT Press Cambridge Massachusetts US Nesta nota de aula fazse referência a outro livrotexto de Wooldrigde o denominado Econometric analysis of crosssection and panel data Este livro é denotado como WP em consonância com o programa da disciplina O livrotexto do curso Economia Introdutória do mesmo autor é indicado por W Tratase de uma nota de aula preparada por D Mcfadden a qual está disponível em httpelsaberkeleyeduusersmcfaddene240bf01ch4pdf Bound J Jaeger DA Baker RM 1995 Problems with instrumental variables estimation when the correlation between the instruments and the endogenous explanatory variable is weak Journal of the American Statistical Association 90 443450 É rigoroso denominar variáveis que teoricamente atendem às três condições fundamentais para serem denominadas VIs de VIs em potencial ou candidatas a VI enfatizando o fato de que não é possível a priori saber se tais condições são atendidas mas apenas a posteriori com procedimentos de inferência Tratase do livro Econometria introdutória Stock J H and M Yogo 2005 Testing for weak instruments in linear IV regression In I dentification and Inference for Econometric Models Essays in Honor of Thomas Rothenberg ed D W K A ndrews and J H Stock 80108 New York Cambridge University Press Quanto a isso cabe reiterar que o teste de Hausman para endogeneidade não parte do teste da significância estatística da correlação entre o termo de perturbação e a explicativa potencialmente endógena Ele toma por base outra estatística de testa qual seja a diferença entre os valores das estimativas pontuais gerados pelo MVI e pelo MQO Angrist J D 1990 Lifetime earnings and the Vietnam era draft lottery evidence from social security administrative records The american economic review 313336 24