·

Ciências Econômicas ·

Econometria

Send your question to AI and receive an answer instantly

Ask Question

Recommended for you

Preview text

1 ECONOMETRIA II 2 Modelos de Regressão com Dados em Painel 21 Introdução Até este momento usamos dois tipos de dados cortes transversais cross section e séries temporais No primeiro são coletados dados de algumas variáveis para várias unidades amostrais famílias empresas pessoas etc no mesmo período de tempo Já no segundo são coletados dados de várias variáveis ao longo do tempo Atualmente em econometria é cada vez mais comum encontrar análises de regressão que combinam tanto dados de crosssection como dados de séries temporais Basicamente temos dois tipos de conjuntos de dados que possuem essa combinação Agrupamento de Cortes Transversais e Dados em Painel Agrupamento de Cortes Transversais Um agrupamento independente de cortes transversais corresponde a uma amostra aleatória de dados de uma população grande em diferentes períodos de tempo Exemplo Preço de imóveis em função de algumas características Nº obs Ano Preço do imóvel Nº de Quartos Distância do Centro 1 2000 100000 2 5 2 2000 152000 4 10 3 2000 28000 1 30 4 2000 200000 4 7 100 2000 70000 3 3 101 2000 450000 5 7 102 2000 135000 3 15 103 2005 200000 3 3 200 2005 80000 2 3 No agrupamento de cortes transversais o nº de observações em cada ano pode ser diferente além é claro de não existir a necessidade de temos anos seqüências no conjunto dos dados 2 Neste caso a única exigência é que os dados sejam extraídos de maneira independente aleatória o que elimina a correlação nos erros entre as diferentes observações O uso do agrupamento de cortes transversais permite aumentar o tamanho da amostra já que com isso podemos obter estimadores mais precisos e estatísticas mais poderosas Dados em Painel Um conjunto de dados em painel ou dados longitudinais consiste em uma série de tempo para cada membro do corte transversal da base de dados Neste caso a principal diferença dos dados em painel em relação aos dados agrupados é que na primeira as mesmas unidades do corte transversal indivíduos famílias empresas etc são acompanhadas ao longo de um determinado período A tabela abaixo mostra um exemplo de dados em painel Estatísticas de crime para algumas cidades Nº obs Cidade Ano Nº hom População Taxa de desemprego Nº de policiais 1 1 1986 5 350000 84 550 2 1 2006 7 360000 74 850 3 2 1986 7 358000 85 700 4 2 2006 10 385000 81 900 5 3 1986 9 120000 131 350 6 3 2006 12 135000 9 450 397 199 1986 25 550000 72 1200 398 199 2006 32 640000 85 1550 399 200 1986 17 280000 92 600 400 200 2006 19 300000 97 680 A tabela acima mostra um exemplo de painel equilibrado ou seja é um conjunto de dados na qual as variáveis são observadas para cada unidade e cada período do tempo Já o painel desequilibrado ocorre quando se observa a falta de dados em pelo menos um período de tempo para uma das unidades da amostra A tabela acima foi modificada para gerar um painel desequilibrado Nº obs Cidade Ano Nº hom População Taxa de desemprego Nº de políciais 1 1 1986 5 350000 84 550 2 2 1986 7 358000 85 700 3 2 2006 10 385000 81 4 3 1986 9 120000 131 350 3 397 199 1986 25 600000 72 1200 398 199 2006 32 640000 85 1550 399 200 1986 17 275000 92 600 400 200 2006 19 300000 83 680 De acordo com Baltagi apud Gujarati 2006 pág 513 os dados em painel apresentam inúmeras vantagens em relação aos dados em crosssection e séries temporais Permite levar em conta as diferenças de heterogeneidade entre as unidades amostrais famílias empresas etc Os dados em painel proporcionam dados mais informativos mais variabilidade e menos colinearidade entre as variáveis além de gerar mais graus de liberdade e mais eficiência Os dados em painel são mais adequados para o estudo de dinâmicas de mudança períodos de desemprego rotatividade no emprego e impactos de políticas públicas 22 Estimações de Modelos de regressão com Agrupamentos de Cortes Transversais e Dados em Painel Existem várias maneiras de rodar modelos de regressão com o uso de Agrupamentos de Cortes Transversais ou Dados em Painel Nesta seção abordaremos algumas dessas maneiras 221 MQO Agrupados Pooled MQO Uma maneira simples de usar agrupamentos de cortes transversais ou dados em painel é desconsiderar as dimensões de tempo e espaço dos dados combinados e estimar a regressão usando MQO Neste caso empilhamos todas as observações como se fossem apenas uma crosssection Exemplo 1 Modelo de Investimento Gujarati pág 515 O arquivo de Excel exemplo painel gujarati mostra dados sobre investimento valor da empresa e estoque de quatro grandes empresas GE US GM e WEST 4 Os dados mostram para cada variável os dados relativos de cada uma dessas empresas no período de 19351954 Dessa forma temos 04 unidades de corte transversal as empresas e 20 unidades de séries temporais 20 anos O modelo teórico é dado abaixo 𝑌𝑖𝑡 𝛽1 𝛽2𝑋2𝑖𝑡 𝛽3𝑋3𝑖𝑡 1 Onde 𝑌𝑖𝑡 Investimento 𝑋2 Valor real da empresa 𝑋3 Estoque real de capital Observe que o subscrito i serve para indicar as empresas GM GE etc enquanto o subscrito t indica o tempo Inicialmente poderíamos rodar 20 regressões de corte transversal uma para cada ano embora neste caso ocorreria problemas com os graus de liberdade 4 obs e 3 variáveis O objetivo do método de MQO Agrupados é desconsiderar tanto as diferenças entre as unidades de corte transversal as empresas como as mudanças temporais Dessa forma a equação 1 passa a ser 𝑌𝑖 𝛽1 𝛽2𝑋2𝑖 𝛽3𝑖𝑋3𝑖 2 Com isso no exemplo ao empilhar os dados de cada empresa uma embaixo da outra passamos a ter 80 observações 20anos x 04 empresas Sendo que agora o subscrito i da equação 2 indica que temos 80 observações independentes Vamos inserir os dados no Gretl Abra o programa clique em Arquivo Abrir Dados Arquivo dos Usuários e selecione o arquivo Indique que a base de dados será no formato de Painel O Gretl vai abrir a seguinte tela de transição Selecione Usar variáveis índice e indique a opção de emp para variável unidade e ano para a variável tempo Teremos a seguinte tela 5 Vamos estimar por MQO a equação 2 Clique em Modelo Mínimo Quadrado Ordinário insira a equação 2 e dê ok A saída abaixo mostra os resultados Analisando a saída acima se observa que Os coeficientes são significativos O valor do R2 é 075 O valor da estatística de DW é baixo o que indica uma possível autocorrelação nos dados Com a saída de regressão acima podemos realizar diversos testes econométricos 6 1 Teste de Ramsey é um teste para verificar erros de especificações1 em modelos de regressão Clique no menu da saída em Teste Reset de Ramsey Selecione o tipo de especificação a ser testado quadrados e cubos e aperte ok Teremos a seguinte saída A hipótese nula do teste é que a especificação do modelo é adequada Como o pvalor é menor que o nível de significância 000932001 rejeitamos a hipótese nula 2 Teste JacqueBera usado para verificar se os resíduos apresentam uma distribuição Normal Clique no menu da saída em Teste Normalidade dos Resíduos O Gretl vai produzir uma saída com gráfico e outra com dados Olhando a saída com dados temos 1 Erros de especificações podem ocorrer omissão ou inclusão de variável relevante adoção de forma funcional errada ou erros de medida 7 Como o pvalor é maior que o nível de significância 06278001 aceitamos a hipótese nula ou seja os resíduos apresentam uma distribuição normal Atenção O problema do modelo MQO Agrupado é que a regressão considera que os oeficientes angulares das duas variáveis X 𝛽2 𝑒 𝛽3 são idênticos para as quatro empresas Além também de considerar que o valor do intercepto vertical é o mesmo para as quatro empresas Os gráficos abaixo mostram essa ideia 𝛽1𝑈𝑆 𝛽1𝑊𝐸𝑆𝑇 𝛽1𝐺𝐸 𝛽1𝐺𝑀 𝛽2𝑊𝐸𝑆𝑇 𝛽2𝑈𝑆 𝛽2𝐺𝑀 𝛽2𝐺𝐸 𝛽1𝐺𝐸 𝛽1𝐺𝑀 𝛽1𝑈𝑆 𝛽1𝑊𝐸𝑆𝑇 𝛽1𝐺𝐸 𝛽1𝐺𝑀 𝛽1𝑈𝑆 𝛽1𝑊𝐸𝑆𝑇 𝛽2𝐺𝐸 𝛽2𝐺𝑀 𝛽2𝑈𝑆 𝛽2𝑊𝐸𝑆𝑇 𝛽2𝑊𝐸𝑆𝑇 𝛽2𝑈𝑆 𝛽2𝐺𝑀 𝛽2𝐺𝐸 X2 y 𝛽1𝑊𝐸𝑆 𝛽1𝑈𝑆 𝛽1𝐺𝑀 𝛽1𝐺𝐸 y X2 011 a b y c X2 d X2 y 8 Observe que O gráfico a mostra os resultados da regressão por MQO Agrupados na qual o intercepto vertical é o mesmo para cada empresa 6330414 bem como o coeficiente angular para a variável X2 011 O gráfico b mostra como seria se tivéssemos o mesmo coeficiente angular para as quatro empresas porém com interceptos verticais diferentes O gráfico c mostra as empresas com o mesmo intercepto vertical mas com coeficientes angulares diferentes O gráfico d considera todas as diferenças possíveis entre as empresas ou seja interceptos verticais diferentes bem como coeficientes angulares diferentes Este gráfico incorpora toda heterogeneidade entre as empresas O próximo exemplo considera a possibilidade de que a população de dados possa ter distribuições diferentes em períodos de tempo diferentes ou seja considera interceptos verticais diferentes em cada período de tempo Exemplo 2 Retorno da Educação e a Diferença Salarial por Gênero Wooldridge pág406 O modelo teórico é dado abaixo log𝑠𝑎𝑙á𝑟𝑖𝑜 𝛽0 𝛽1𝑒𝑑𝑢𝑐 𝛽2𝑒𝑥𝑝 𝛽3𝑒𝑥𝑝2 𝛽4𝑠𝑖𝑛𝑑 𝛽5𝑓𝑒𝑚 3 Os dados correspondem a 551 observações do ano de 1978 e 534 observações do ano de 1985 O objetivo da análise é verificar se houve mudanças entre o retorno da educação entre os anos de 1978 e 1985 o retorno de gênero entre 1978 e 1985 Para tanto vamos abrir o arquivo exemplo wooldridge mqo para montar uma dummy do ano de 1985 d85 bem como dummies de interação d85educ e d85fem A figura abaixo mostra o arquivo em Excel 9 As fórmulas dessas dummies para o Excel são dadas abaixo Coluna d85 Preencha a coluna com o nº zero para o ano 78 e o nº 1 para o ano de 85 Coluna d85fem Use a fórmula M2L2D2 Coluna d85educ Use a fórmula N2 L2A2 Coluna d85sind Use a fórmula O2 L2H2 Vamos inserir as dummies diretamente no Gretl Clique em Arquivo Abrir Dados Arquivo dos Usuários e selecione o arquivo Lembre que a base é no formato de Dados Agrupados que nada mais é do que uma grande base no formato de CrossSection Observe que com a inclusão das dummies a equação 3 passa a ser log𝑠𝑎𝑙á𝑟𝑖𝑜 𝛽0 𝛽1𝐷85 𝛽2𝑒𝑑𝑢𝑐 𝛽3𝐷85𝑒𝑑𝑢𝑐 𝛽4𝑒𝑥𝑝 𝛽5𝑒𝑥𝑝2 𝛽6𝑠𝑖𝑛𝑑 𝛽7𝑓𝑒𝑚 𝛽8𝐷85𝑓𝑒𝑚 10 A dummy de ano vai assumir 1 se os dados forem do ano de 1985 e 0 se forem do ano de 1978 Clique na série chamada anos e observe que até a observação de número 550 se refere ao ano de 1978 Para inserir a dummy d85 clique em Acrescentar Dummies para o intervalo de observações Selecione o início para 551 e coloque o nome da variável As dummies de interação são criadas com o comando Acrescentar Definir nova variável Usamos as seguintes fórmulas D85educd85educ D85femd85fem Com as dummies criadas podemos rodar a equação abaixo log𝑠𝑎𝑙á𝑟𝑖𝑜 𝛽0 𝛽1𝐷85 𝛽2𝑒𝑑𝑢𝑐 𝛽3𝐷85𝑒𝑑𝑢𝑐 𝛽4𝑒𝑥𝑝 𝛽5𝑒𝑥𝑝2 𝛽6𝑠𝑖𝑛𝑑 𝛽7𝑓𝑒𝑚 𝛽8𝐷85𝑓𝑒𝑚 Lembrese que a variável sal já está no formato logarítmico Clique em Modelo Mínimos Quadrados Ordinários e rode a equação acima A saída abaixo mostra os resultados 11 Vamos analisar os resultados O retorno da educação em 1978 é de 74 ou seja um ano a mais de estudo aumenta o log do salário em 74 O retorno da educação em 1985 é de 935 747185 ou seja um ano a mais de estudo em 1985 aumenta o log do salário em 935 Uma mulher ganha em média 317 a menos que o homem em 1978 Uma mulher ganha em média 232 a menos que o homem em 1985 3170085 Uma pessoa sindicalizada ganha em média 202 a mais em relação a uma pessoa não sindicalizada A variável d85 não é significativa A variável d85educ é significativa a 5 de significância A variável d85fem é significativa ao nível de 10 de significância 4261 do modelo é explicado pela parte explicativa do modelo O teste DW indica o modelo não apresenta problemas de autocorrelação Rode agora o modelo sem a dummy de ano e sem as dummies de interação Compare os resultados Obs Rodar o modelo acima interagindo a dummy de ano d85 com cada variável independente é o mesmo que rodar duas equações separadas uma para 1978 e outra para 1985 Para comprovar essa ideiay vamos rodar uma equação para o ano de 1978 e outra para 1985 12 Para o ano de 1978 selecione Amostra Definir intervalo Selecione o intervalo de 01 a 550 1978 e rode sal em função de c educ exp01 exp2 sind e fem A saída abaixo mostra essa ideia Para o ano de 1985 rode a mesma equação alterando o período da amostra de 551 a 1084 Depois rode a mesma regressão A saída abaixo mostra os resultados Vamos agora interagir a variável d85 com cada variável independente e mostrar numa única saída tanto os valores de 1978 como os de 1985 13 Rode a regressão de sal em função de c d85 educ d85 educ exp01 d85 exp01 exp2 d85exp2 sind d85sind fem e d85fem Antes altere amostra para o período original 1 a 1084 Vamos criar cada dummy de interação que falta na própria tela que usamos pra rodar o MQO 14 Observe que As variáveis do ano de 1978 são c educ exp exp2 sind e fem Para achar as variáveis do ano de 1985 basta somar a variável do ano de 1978 com a respectiva dummy A educação de 1985 é de 00907418 00768148 00139270 Compare os resultados As estimativas dos coeficientes são iguais enquanto que os valores dos errospadrão são diferentes Normalmente a metodologia de Dados em Painel separa os fatores não observados que afetam a variável dependente em dois tipos os que são constantes e os que variam ao longo do tempo Genericamente temos 𝑌𝑖𝑡 𝛽0 𝛿0𝐷2𝑡 𝛽1𝑋𝑖𝑡 𝑎𝑖 𝑢𝑖𝑡 1 Onde na variável 𝑌𝑖𝑡 o i indica pessoa empresa etc Enquanto o t indica o período de tempo A variável D2 é uma dummy igual a zero quando t 1 e um quando t 2 15 O intercepto de t 1 é 𝛽0 e o intercepto de t 2 é 𝛽0 𝛿0 A variável 𝑎𝑖 capta todos os fatores não observados que são constantes ao longo do tempo e que afetam 𝑌𝑖𝑡 Essa variável é chamada de Efeito não observado Efeito Fixo Heterogeneidade Não Observada O termo do erro 𝑢𝑖𝑡 é chamado de erro idiossincrático Conforme já vimos uma maneira de estimar 𝛽1 é agrupar os dois anos e Usar MQO Agrupados Dessa forma a equação 1 passa a ser 𝑌𝑖𝑡 𝛽0 𝛿0𝐷2𝑡 𝛽1𝑋𝑖𝑡 𝑣𝑖𝑡 2 Onde 𝑣𝑖𝑡 𝑎𝑖 𝑢𝑖𝑡 e é chamado de erro de composição Para que o método de MQO Agrupados estime 𝛽1 consistentemente é preciso que tanto o erro idiossincrático como o termo de efeito fixo sejam não correlacionados com a variável 𝑋𝑖𝑡 𝑐𝑜𝑟𝑟 𝑋𝑖𝑡 𝑣𝑖𝑡 0 𝑜𝑢 𝑐𝑜𝑟𝑟 𝑋𝑖𝑡 𝑎𝑖 0 𝑒 𝑐𝑜𝑟𝑟 𝑋𝑖𝑡 𝑢𝑖𝑡 0 Quando essa hipótese não é válida dizemos que o MQO Agrupados produziu um 𝛽1 com viés de heterogeneidade que na verdade é um viés causado pela omissão de uma variável constante no tempo A abordagem de Dados em Painel possui alguns métodos que podem ser usados para estimar modelos que consideram a presença do efeito não observado que é fixo ao longo do tempo 𝑎𝑖 222 Estimador de Primeira Diferença PD O objetivo deste método é desaparecer com o efeito fixo 𝑎𝑖 por meio da primeira diferença das variáveis Para exemplificar vamos usar novamente a equação 1 𝑌𝑖𝑡 𝛽0 𝛿0𝐷2𝑡 𝛽1𝑋𝑖𝑡 𝑎𝑖 𝑢𝑖𝑡 1 Para t 2 temos 𝑌𝑖2 𝛽0 𝛿0 𝛽1𝑋𝑖2 𝑎𝑖 𝑢𝑖2 𝑎 Para t 1 temos 𝑌𝑖1 𝛽0 𝛽1𝑋𝑖1 𝑎𝑖 𝑢𝑖1 𝑏 Fazendo a b 16 𝑌𝑖2 𝑌𝑖1 𝛿0 𝛽1𝑋𝑖2 𝑋𝑖1 𝑢𝑖2 𝑢𝑖1 Que pode ser escrito como 𝑌𝑖 𝛿0 𝛽1𝑋𝑖 𝑢𝑖 𝑐 Observe que O intercepto em c representa a mudança no intercepto de t 1 para t 2 O efeito fixo 𝑎𝑖 desaparece no processo de diferenciação Na estimação em Primeira Diferença também precisamos assumir que 𝑢𝑖 seja não correlacionado com as variáveis explicativas em ambos os períodos de tempo O processo de diferenciação desaparece com todas as variáveis que são constantes ao longo do tempo Dessa forma não podemos incluir no modelo a ser estimado variáveis que são constantes ao longo do tempo ou que apresentam pouca variabilidade entre um ano e outro Ex Caso o exemplo 2 pág 07 fosse um painel equilibrado não poderíamos estimar uma equação de PD com a variável dummy Ferm A primeira diferença passa a considerar a heterogeneidade das observações o que não acontecia no método de MQO Agrupados Exemplo 03 Taxa de Criminalidade Wooldridge pág 414 O arquivo em Excel crime2 contém dados entre outras coisas sobre taxas de criminalidade e de desemprego de 46 cidades em 1982 e 1987 O modelo teórico é dado abaixo 𝑡𝑥𝑐𝑟𝑖𝑚𝑖𝑡 𝛽0 𝛽1𝑑𝑒𝑠𝑒𝑚𝑝𝑖𝑡 Inicialmente vamos inserir os dados no Gretl Use o comando Arquivo Abrir Dados Arquivo de Usuários Selecione a base no formato de painel indicando cidade como variável de crosssection e ano como de tempo 17 Antes de apresentar a regressão em primeira diferença vamos rodar uma equação apenas para o ano de 1987 conforme descrito na observação da pág 11 O modelo teórico seria uma regressão de Txcrim em função de c d87 d87desemp Para isso precisamos criar a dummy de 1987 1 1987 e 0 1982 Clique em Acrescentar Dummies Temporais Observe que o Gretl criou duas variáveis dummy Precisamos saber qual delas será a do 1987 Abra a série de Ano e uma das dummies Verifique a dummy dt2 se refere a dummy de 1987 Rode o modelo desejado Lembrese de criar a dummy de interação Teremos a seguinte saída Observe que 12838 é o coeficiente linear para o ano de 1987 97708903066922 18 A saída diz que um aumento da taxa de desemprego reduz a taxa de criminalidade o que não é lógico Porém como coeficiente não é significativo não podemos dizer nada sobre a relação entre taxa de criminalidade e desemprego Qual é o valor do coeficiente angular para o ano de 1985 A saída acima mostra esse coeficiente Agora vamos rodar o modelo pelo método de MQO Agrupados na qual o Gretl empilha as observações e não considera as diferenças entre as cidades Clique em Modelo Mínimos Quadrado Ordinários e rode Txcrim c d87 desemp A saída abaixo mostra os resultados Observe que O coeficiente desemp mudou o sinal em relação ao modelo com apenas uma equação porém contínua sendo não significativo Tanto o modelo de MQO Agrupados como o modelo de apenas uma equação sofrem do problema de variáveis omitidas A dummy de ano d87 permite interceptos lineares diferentes entre 1982 e 1987 veja gráfico b pág06 porém não considera as diferenças entre as cidades Vamos agora rodar o nosso modelo em Primeira Diferença ou seja vamos considerar que existem fatores não observados e que são constantes no tempo vide equação 01 pág 18 Para o nosso exemplo a equação em Primeira Diferença é dada por 𝑡𝑥𝑐𝑟𝑖𝑚𝑖 𝛽0 𝛽1𝑑𝑒𝑠𝑒𝑚𝑝𝑖 19 Ou seja com a diferenciação vamos eliminar os fatores não observados que são constantes no tempo 𝑎𝑖 Selecione com o mouse as variáveis txcrim e desemp Clique em Acrescentar Primeiras Diferenças das Variáveis Selecionadas Após criar as novas variáveis rode o modelo de interesse Clique em Modelo Mínimos Quadrado Ordinários e insira as variáveis Teremo a seguinte saída Observe que A relação entre taxa de criminalidade e desemprego é positiva e significante a 5 Mesmo que a variação na taxa de desemprego for zero entre 1982 e 1987 𝑑𝑒𝑠𝑒𝑚𝑝 0 a taxa de criminalidade aumentará 1540 crimes por mil hab Um aumento de um ponto na taxa desemprego aumenta a taxa de criminalidade em 222 O arquivo em Excel crime2 contém dados de localização das cidades região nordeste oeste e sul bem como o tamanho de cada cidade área Esses dados poderiam ser usados na regressão acima 20 Exemplo 04 Dormir x trabalhar Wooldridge pág 419 Wooldridge apresenta um exemplo de modelo de regressão que tenta estimar a substituição entre o tempo gasto dormindo e trabalhando Os dados se referem aos anos de 1975 e 1981 com um total de 239 pessoas O modelo teórico é dado abaixo 𝑑𝑜𝑟𝑚𝑖𝑟𝑖𝑡 𝛽0 𝛽1𝑑81 𝛽2𝑡𝑟𝑎𝑏𝑎𝑙ℎ𝑜𝑖𝑡 𝛽3𝑒𝑑𝑢𝑐𝑖𝑡 𝛽4𝑐𝑎𝑠𝑎𝑑𝑜𝑖𝑡 𝛽5𝑐𝑟𝑖𝑎𝑛ç𝑎𝑖𝑡 𝛽6𝑏𝑜𝑎𝑠𝑎ú𝑑𝑒𝑖𝑡 𝑎𝑖𝑡 𝑢𝑖𝑡 Onde Dormir tempo em minutos gasto dormindo por semana D81 dummy do ano de 1981 Trabalho tempo em minutos trabalhados por semana Educ anos de educação Casado dummy indicando estado civil Criança dummy indicando a presença de crianças menores de 3 anos Boasaúde dummy indicando se a pessoa goza de boa saúde A equação em Primeira Diferença é dada por 𝑑𝑜𝑟𝑚𝑖𝑟𝑖 𝛽0 𝛽1𝑡𝑟𝑎𝑏𝑎𝑙ℎ𝑜𝑖 𝛽2𝑒𝑑𝑢𝑐𝑖 𝛽3𝑐𝑎𝑠𝑎𝑑𝑜𝑖 𝛽4𝑐𝑟𝑖𝑎𝑛ç𝑎𝑖 𝛽5𝑏𝑜𝑎𝑠𝑎ú𝑑𝑒𝑖 𝑢𝑖 Para que o modelo em Primeira Diferença produza estimadores consistentes assumimos que o erro idiossincrático𝑢𝑖 seja não correlacionado com as mudanças em todas as variáveis explicativas Usando arquivo em Excel dormir coloque os dados no Gretl Antes de rodar a equação em Primeira Diferença observe os dados no Excel Nele cada linha representa uma unidade de corte transversal pessoa na qual cada variável possui duas colunas uma para o ano de 1975 e outra para o ano de 1981 Neste caso para rodar PD devemos montar as variáveis de variação entre 1975 e 1981 Selecione Modelo Mínimos Quadrados Ordinários e rode deltadomir em função de c deltatrab deltaedu deltacasado deltacrincas deltasaude A saída abaixo mostra os resultados 21 Observe que O coeficiente deltatrab é significativo ao nível de 1 Uma hora a mais de trabalho está associada a 1362 minutos 022760 a menos dormindo As variáveis deltaeduc deltacasado deltacrianças e delta saúde não são significativas O erro padrão de deltaeduc é alto em relação à estimativa Isso se deve ao fato de poucas pessoas apresentarem variação na educação entre 1975 e 1981 Dessa forma 𝛽2 não é um número preciso Vamos fazer um teste para verificar se podemos eliminar as variáveis não significativas Clique em Testes Omitir Variáveis Selecione as variáveis a serem omitidas todas menos deltatrab A saída abaixo mostra os resultados 22 Como o pvalor é igual a 04857 aceitamos a hipótese nula ou seja os coeficientes não são conjuntamente significativos Dessa forma vamos rodar mais uma vez a regressão em PD apenas com a variável explicativa deltatrab Abaixo temos a saída de regressão Análise os resultados Obs No estimador de Primeira Diferença precisamos tomar cuidado com a variabilidade de cada variável analisada Xs ou seja se para uma dada variável apenas uma pequena parte da amostra possui variação ao longo do tempo será difícil obter um estimador preciso de 𝛽 a menos que tenhamos uma amostra de tamanho bastante grande 223 Estimador de Efeitos Fixos O modelo de Efeitos Fixos também pretende controlar os efeitos das variáveis omitidas que variam entre os indivíduos e que são constantes ao longo do tempo Para tanto o modelo assume que os interceptos verticais são diferentes para cada indivíduo porém constantes ao longo do tempo Já os coeficientes angulares são constantes para todos os indivíduos em todos os períodos de tempo A estimação de Efeitos Fixos representa outra maneira de eliminar o efeito fixo 𝑎𝑖 Dessa forma seja a equação abaixo 𝑌𝑖𝑡 𝛽1𝑋𝑖𝑡 𝑎𝑖 𝑢𝑖𝑡 1 23 Vamos supor como no caso do método de Primeira Diferença que existe uma correlação arbitrária entre 𝑎𝑖 e a variável explicativa 𝑋𝑖𝑡 Dessa forma a estimação de 1 pelo método de MQO Agrupados produzirá estimadores viesados e inconsistentes Calculando a média de cada variável para cada observação i 𝑌𝑖 𝛽1𝑋𝑖 𝑎𝑖 𝑢𝑖 2 Onde 𝑌𝑖 𝑌𝑖𝑡 𝑡 𝑖0 𝑡 𝑒 𝑎𝑠𝑠𝑖𝑚 𝑝𝑜𝑟 𝑑𝑖𝑎𝑛𝑡𝑒 Fazendo 1 2 temos 𝑌𝑖𝑡 𝑌𝑖 𝛽1𝑋𝑖𝑡 𝑋𝑖 𝑢𝑖𝑡 𝑢𝑖 Que pode ser escrito como 𝑌𝑖𝑡 𝛽1𝑋𝑖𝑡 𝑢 𝑖𝑡 𝑝𝑎𝑟𝑎 𝑡 1 2 a O estimador de Efeitos Fixos calculados pelo método acima é chamado de Estimador Intragrupo2 ou estimador dentro do grupo já que a equação mostra a variação do tempo para cada grupo de observações subscrito i Observe que Na equação 1 o coeficiente 𝛽1 é constante entre os indivíduos subscrito i e no tempo subscrito t Dessa forma todas as diferenças de comportamento entre os indivíduos serão captadas pelo termo 𝑎𝑖 O termo 𝑎𝑖 representa fatores não observados que são fixos para cada indivíduo A equação a elimina os efeitos fixos 𝑎𝑖 e todas as variáveis fixas ao longo do tempo Dessa forma não podemos usar no modelo de Efeitos Fixos variáveis que são constantes ou que possuem pouca variabilidade Uma alternativa para o estimador Intragrupo é usar o estimador Entregrupo3 na qual utilizamos as médias de tempo de todas as variáveis x e y e depois executamos uma regressão de corte transversal 𝑌𝑖 𝛽0 𝛽1𝑋𝑖 𝑎𝑖 𝑢𝑖 O problema desse método é que o estimador é viesado quando 𝑎𝑖 é correlacionado com 𝑋𝑖 2 Do termo em inglês Whitin estimator 3 Do termo em inglês Between estimator 24 Regressão de variáveis Dummy Outra maneira de estimar o Modelo de Efeitos Fixos é usar variáveis dummies para captar as diferenças entre os indivíduos Exemplo 𝑌𝑖𝑡 𝛽0 𝛽1𝑋1𝑖𝑡 𝛽2𝑋2𝑖𝑡 𝛽3𝑋3𝑖𝑡 𝛽𝑘𝑋𝑘𝑖𝑡 𝛾2𝐷2𝑖 𝛾3𝐷3𝑖 𝛾𝑛𝐷𝑛𝑖 𝑢𝑖𝑡 𝑏 Onde 𝐷2𝑖 1 𝑝𝑎𝑟𝑎 𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎çã𝑜 2 0 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟á𝑟𝑖𝑜 𝑒 𝑎𝑠𝑠𝑖𝑚 𝑝𝑜𝑟 𝑑𝑖𝑎𝑛𝑡𝑒 Na equação b as diferenças entre as observações são captadas pela inclusão de variáveis dummies uma para cada indivíduo Dessa forma temos Para a observação 1 o intercepto vertical será 𝛽0 Para a observação 2 o intercepto vertical será 𝛽0 𝛾2 Para a observação 3 o intercepto vertical será 𝛽0 𝛾3 E assim sucessivamente Na equação b não temos a dummy 𝐷1𝑖 Por quê A estimação do Modelo de Variáveis Binárias produz os mesmos resultados da estimação do Modelo de Efeitos Fixos Porém o uso das dummies não é prático já que temos que inserir uma dummy para cada observação do modelo Ex Para o exemplo da pág 11 sobre criminalidade temos 46 cidades em dois anos 1982 e 1987 Assim a equação de regressão com o uso do modelo de variáveis binárias teria 45 dummies Exemplo 05 Vamos usar o modelo de investimento de Gujarati apresentado na pág 03 O arquivo de Excel exemplo painel gujarati mostra dados sobre investimento valor da empresa e estoque de quatro grandes empresas GE US GM e WEST Agora o exemplo passa a ser 𝑌𝑖𝑡 𝛽1 𝛽2𝑋2𝑖𝑡 𝛽3𝑋3𝑖𝑡 𝑎𝑖 𝑢𝑖𝑡 1 Onde 𝑌𝑖𝑡 Investimento 𝑋2 Valor real da empresa 25 𝑋3 Estoque real de capital 𝑎𝑖 Fatores não observados que são constantes no tempo Efeito Fixo Ex Tipo de investidor moderado ou agressivo Técnicas gerenciais etc Vamos inserir os dados no Gretl Clique em Arquivo Abrir dados Arquivo de Usuário Mude a base para o formato de painel Temos Vamos agora rodar o modelo de efeitos fixos Selecione Modelo Painel Efeitos Fixos ou Aleatórios e rode a regressão de Y sobre C X1 X2 26 Selecione Efeitos Fixos e aperte ok Temos Observe que As variáveis são significativas a 1 27 O aumento de uma unidade no valor da empresa aumenta 011 o seu investimento O aumento de uma unidade no estoque da empresa aumenta em 035 o seu investimento O Gretl apresenta dois valores para o R Quadrado R quadrado LSDV e R quadrado por dentro O R quadrado correto é o LSDV Dessa forma 9345 da variação de Y se deve a variação da parte explicativa A Hipótese nula do teste conjunto de regressores designados é de que o modelo adequado é aquele que excluímos uma das variáveis que foram usadas Neste caso rejeitamos a hipótese nula já que o pvalor é menor do que o nível de significância 380998e027 001 A saída também apresenta um teste para diferenciar interceptos de grupos Neste teste a hipótese nula é de que os interceptos verticais do modelo são iguais o que equivale a dizer o modelo correto seria MQO Agrupados Pooled MQO Sendo assim rejeitamos a hipótese nula 459178e021 001 Observe que este teste serve para fazer uma comparação entre MQO Agrupados x Efeitos Fixos O Gretl apresenta os interceptos verticais de cada empresa Clique em Salvar Contantes por unidade Selecione um nome e clique em ok Os resultados aparecem abaixo Assim temos os seguintes interceptos 28 Empresa GE 2457924 Empresa GM 842202 Empresa US 938404 Empresa WEST 592258 Dessa forma temos quatro variações para a equação 1 sendo uma para cada empresa 𝐼𝑛𝑣𝑒𝑠𝑡𝑖𝑚𝑒𝑛𝑡𝑜 𝐺𝐸 2457924 0107948 𝑉𝑎𝑙𝑜𝑟 𝑅𝑒𝑎𝑙 0346162 𝐸𝑠𝑡𝑜𝑞𝑢𝑒 𝐼𝑛𝑣𝑒𝑠𝑡𝑖𝑚𝑒𝑛𝑡𝑜 𝐺𝑀 842202 0107948 𝑉𝑎𝑙𝑜𝑟 𝑅𝑒𝑎𝑙 0346162 𝐸𝑠𝑡𝑜𝑞𝑢𝑒 𝐼𝑛𝑣𝑒𝑠𝑡𝑖𝑚𝑒𝑛𝑡𝑜 𝑈𝑆 938404 0107948 𝑉𝑎𝑙𝑜𝑟 𝑅𝑒𝑎𝑙 0346162 𝐸𝑠𝑡𝑜𝑞𝑢𝑒 𝐼𝑛𝑣𝑒𝑠𝑡𝑖𝑚𝑒𝑛𝑡𝑜 𝑊𝐸𝑆𝑇 592258 0107948 𝑉𝑎𝑙𝑜𝑟 𝑅𝑒𝑎𝑙 0346162 𝐸𝑠𝑡𝑜𝑞𝑢𝑒 O que está de acordo com o gráfico b pág 07 Vamos agora rodar o modelo com variáveis binárias Este modelo é aquele que você cria uma dummy para cada observação da sua amostra Sendo assim para o nosso exemplo seria uma dummy para cada empresa Caso você fosse fazer isso no Excel você teria a seguinte tela para inserir uma dummy para cada empresa No Gretl a criação das dummies é feita de maneira mais rápida Clique em Acrescentar Dummies Unitárias Temos a seguinte saída 29 Rode o modelo com as variáveis dummy Clique Modelo Mínimos Quadrados Ordinários e selecione Y d2 d3 d4 x2 x3 A saída abaixo mostra os resultados Compare os resultados com a estimação do modelo de efeitos fixos Observe que os resultados são iguais A saída acima tem a vantagem de trazer os interceptos verticais de cada empresa Empresa GE 2457924 Empresa GM 84220 24579241615722 Empresa US 93877424579243396328 Empresa WEST 592258 24579241865666 30 Graficamente esses resultados podem ser vistos com ajuda do gráfico b da pág 07 As diferenças nos valores dos interceptos podem ser devidas a características únicas de cada empresa tais como diferença no estilo gerencial ou no talento dos gestores Vamos verificar se os dados apresentam problema de multicolinearidade Clique em Análise Colinearidade Temos a seguinte saída Essa saída apresenta um indicador chamado de Fatores de Inflação da Variância FIV Caso o número o indicador seja maior do que 10 teria um indício de que a referida variável apresenta problemas de Multicolinearidade Observe que para todas as variáveis o resultado foi menor do que 10 Com esse Modelo de Regressão com Variáveis Dummy também podemos testar se os interceptos verticais do modelo são iguais e portanto o melhor modelo seria MQO Agrupados Clique em Testes Omitir Variáveis Selecione as variáveis a serem omitidas todas as dummies A tela apresenta três opções de como executar este teste Selecione o teste de Wald4 A saída abaixo mostra os resultados 4 Usamos este teste porque ele aparece em outros softwares econométricos 31 Como o pvalor é menor que o nível de significância 459178e021 001 rejeitamos a hipótese nula ou seja o melhor modelo é o de Efeitos Fixos Exemplo 06 Criminalidade x Desemprego Vamos usar o exemplo sobre criminalidade apresentado na pág 08 Abra o arquivo crime2alunos e insira os dados no Gretl Selecione Modelo Painel Efeitos Fixos Aleatórios e rode um modelo de regressão de tx crim sobre c desemp Selecione Efeitos Fixo Temos os seguintes resultados Observe que os resultados não foram animadores já que pelo modelo quanto maior a taxa de desemprego menor será a taxa de criminalidade o que não é lógico A variável desemprego não é significativa ao nível de 1 Rejeitamos a hipótese nula de que os interceptos verticais são iguais 330296e009 001 ou seja o melhor modelo é o de Efeitos Fixos 32 Vamos obter os coeficientes verticais de cada cidade Clique em Salvar Contantes por unidade Selecione um nome e clique em ok Os resultados aparecem abaixo Vamos rodar o modelo de Efeitos Fixos entregrupos Clique em Modelo Painel Modelo entregrupos Selecione a equação desejada e aperte ok Até agora os exemplos apresentados têm trabalhado com modelos cuja equação teórica é dada abaixo 𝑌𝑖𝑡 𝛽1𝑋𝑖𝑡 𝑎𝑖 𝑢𝑖𝑡 1 Onde o erro de composição é dado por 𝑣𝑖𝑡 𝑎𝑖 𝑢𝑖𝑡 sendo 𝑎𝑖 os fatores não observados invariantes no tempo e 𝑢𝑖𝑡 erro idiossincrático Neste caso modelos 33 que apresentam essa estrutura são chamados de Modelos de Componentes de Erro Unidirecionais Entretanto alguns econometristas preferem trabalhar com Modelos de Componentes de Erro Bidirecionais Com isso a equação 1 é alterada para incorporar um efeito de tempo 𝑌𝑖𝑡 𝛽1𝑋𝑖𝑡 𝑎𝑖 𝜆𝑡 𝑢𝑖𝑡 2 Neste caso o erro de composição passa a ser 𝑣𝑖𝑡 𝑎𝑖 𝜆𝑡 𝑢𝑖𝑡 onde 𝑎𝑖 continua sendo os fatores não observados invariantes no tempo e 𝑢𝑖𝑡 erro idiossincrático O novo termo 𝜆𝑡 corresponde ao efeito específico do tempo ou seja algum acontecimento ocorrido em um determinado t e que influencia nas mudanças de 𝑌𝑖𝑡 Para estimar a equação 2 podemos inserir dummies de tempo que farão o papel de 𝜆𝑡 Dessa forma a equação 2 passaria a ser 𝑌𝑖𝑡 𝛽1𝑋𝑖𝑡 𝛽2𝐷1 𝛽3𝐷2 𝛽4𝐷3 𝛽𝑘𝐷𝑘 𝑎𝑖 𝑢𝑖𝑡 3 Vamos usar essa ideia de modelos de componentes de erros bidirecionais para a estimação de Modelos de Efeitos Fixos no exemplo sobre criminalidade Selecione Modelo Painel Efeitos Fixos e Aleatórios e rode um modelo de regressão de tx crim sobre c desemp Selecione Efeitos Fixos e marque a caixa de Criar dummies temporais Abaixo segue a saída de regressão 34 Observe que um aumento de um ponto na taxa desemprego aumenta a taxa de criminalidade em 222 Rejeitamos a hipótese nula de que os interceptos verticais são iguais 121912e010 001 ou seja o melhor modelo é o de Efeitos Fixos O teste conjunto de dummies temporais apresenta a hipótese nula de que o modelo mais adequado não possui efeitos temporais o que equivale a dizer que o modelo correto é unidirecional Neste caso rejeitamos a hipótese nula 000105442 001 ou seja o modelo de Efeitos Fixos precisa dos efeitos de tempo Compare os resultados com as estimativas em Primeira Diferença pág 19 Quais são as semelhanças Na saída acima é viável usar o modelo de variáveis dummy Por quê Também neste caso podemos calcular os interceptos verticais Clique em Salvar Constantes por unidade Temos a seguinte saída Obs Efeitos Fixos ou Primeira Diferença Quando 𝑇 2 as estimativas de Efeitos Fixos e Primeira Diferença e todas as estatísticas de teste são idênticas Quando 𝑇 3 os estimadores de Efeitos Fixos e Primeira Diferença não são os mesmos Neste caso quando os 𝑢𝑖𝑡 são serialmente não correlacionados os estimadores de efeitos fixos serão mais eficientes que os estimadores de Primeira Diferença 35 224 Estimador de Efeitos Aleatórios5 O modelo de Efeitos Fixos considera que existe uma correlação entre o fator não observado 𝑎𝑖 e as variáveis explicativas Xs em todos os períodos de tempo ou seja temos que 𝑐𝑜𝑟𝑟𝑎𝑖 𝑋𝑖𝑡 0 A hipótese básica do modelo de Efeitos Aleatórios é considerar que o fator não observado 𝑎𝑖 não é correlacionado com as variáveis explicativas Xs ou seja 𝑐𝑜𝑟𝑟𝑎𝑖 𝑋𝑖𝑡 0 Dessa forma o modelo a ser estimado passa a ser 𝑌𝑖𝑡 𝛽0 𝛽1𝑋𝑖𝑡1 𝛽2𝑋𝑖𝑡2 𝛽3𝑋𝑖𝑡3 𝛽𝑘𝑋𝑖𝑡𝑘 𝑣𝑖𝑡 𝑎 Onde 𝑣𝑖𝑡 𝑎𝑖 𝑢𝑖𝑡 é o erro de composição Agora como 𝑎𝑖 aparece em cada período de tempo os 𝑣𝑖𝑡 serão serialmente correlacionados ao longo do tempo ou seja 𝐶𝑜𝑟𝑟𝑣𝑖𝑡 𝑣𝑖𝑠 𝜎𝑎 2 𝜎𝑎2 𝜎𝑢2 𝑝𝑎𝑟𝑎 𝑡 𝑠 Onde 𝜎𝑎2 variância de 𝑎𝑖 e 𝜎𝑢2 variância de 𝑢𝑖𝑡 Dessa forma usar MQO Agrupados produzirá estimadores viesados e não consistentes Uma maneira de resolver esse problema é usar Mínimos Quadrados Generalizados MQG para eliminar essa correlação serial Neste caso a equação a precisa ser corrigida pela seguinte equação de transformação 𝜆 1 𝜎𝑢2 𝜎𝑢2𝑇𝜎𝑎2 1 2 𝑠𝑒𝑛𝑑𝑜 0 𝜆 1 𝑏 Transformando a equação a temos 𝑌𝑖𝑡 𝜆𝑌𝑖 𝛽01 𝜆 𝛽1𝑋𝑖𝑡1 𝜆𝑋𝑖1 𝛽𝑘𝑋𝑖𝑡𝑘 𝑋𝑖𝑘 𝑣𝑖𝑡 𝜆𝑣𝑖 𝑐 5 Também conhecido como Modelo de Componentes de Erros MCE 36 A vantagem da equação c é que agora podemos incluir variáveis explicativas que são constantes ao longo do tempo dummies de sexo localização etc Sendo essa inclusão uma das principais vantagens dos efeitos aleatórios sobre os efeitos fixos ou sobre a primeira diferença Observe na equação c que Quando 𝜆 0 temos MQO Agrupados Quando 𝜆 1 temos o modelo de Efeitos Fixos Exemplo 07 Vamos usar o modelo de investimento de Gujarati apresentado nas pág 03 e 24 Abra o arquivo de Excel exemplo painel gujarati e jogue os dados para o Gretl Estime a equação de Efeitos Aleatórios Selecione Modelo Painel Efeitos Fixos e Aleatórios e rode um modelo de regressão de y sobre C X1 X2 Selecione a opção de Efeitos Aleatórios Abaixo segue a saída de regressão 37 Observe que A variância entre representa a variância do termo de crosssection ai A variância por dentro representa a variância do termo de idiossincrático Do total da variância dos componentes do erro 80336 se deve ao termo de crosssection e 1967 se deve ao termo idiossincrático O valor de 08033 também corresponde ao valor da correlação entre os resíduos O valor de 𝜆 se refere ao teta utilizado a quasedesmediação O valor de 𝜆 também poderia ser calculado a partir dos dados da saída 𝜆 1 𝜎𝑢2 𝜎𝑢2𝑇𝜎𝑎2 1 2 1 566842 566842202315210 1 2 1 566842 56684246304200 1 2 1 010997 089002 Ou seja esse modelo se aproxima do modelo de efeito fixo A saída apresenta três testes de Hipóteses Teste Conjunto dos Regressores Designados Hipótese nula o modelo adequado apresenta a exclusão de uma das variáveis utilizadas 6 Calculado da seguinte maneira 𝑣𝑎𝑟 𝑒𝑛𝑡𝑟𝑒 𝑣𝑎𝑟 𝑡𝑜𝑡𝑎𝑙 2315210 2315210566842 080332 8033 38 Análise Rejeitamos a hipótese nula 981373e070 001 Teste de BreuschPagan Pooled MQO x Efeitos Aleatórios Hipótese nula Variância do erro de unidade específica 0 varai0 Caso se aceite a Ho o modelo mais adequado seria MQO Agrupados Análise Rejeitamos a hipótese nula 197363e084 001 ou seja o modelo mais adequado seria de Efeitos Aleatórios Teste de Hausman Efeitos Fixos x Efeitos Aleatórios Hipótese nula O teste de Hausman 1978 consiste em verificar se existe correlação entre 𝑎𝑖 𝑒 𝑋𝑖𝑗 Caso se aceite a Ho o modelo mais eficiente seria o de Efeitos Aleatórios7 𝑐𝑜𝑟𝑟𝑎𝑖 𝑋𝑖𝑡 0 Análise Aceitamos a hipótese nula 0455561 001 ou seja o modelo mais adequado seria de Efeitos Aleatórios Podemos obter os interceptos para cada empresa Clique em Salvar Efeitos Individuais Os resultados aparecem abaixo 7O software Gretl indica como Ho que as estimativas GLS são consistentes 39 Obs A tabela acima não representa os interceptos verticais mas a diferença entre o intercepto da empresa e o intercepto comum Assim para GE temos 1699282 ou seja ele indica o quanto o intercepto da GE difere do intercepto comum Para calcularmos os interceptos de cada empresa devemos somar os dados da tabela acima com o valor do c da saída de regressão Ex para a empresa GE o intercepto vertical é de 2429635 1699282 7303531 O valor de 7303531 valor da constante c representa o valor médio do componente aleatório 𝑎𝑖 Vamos agora estimar o Modelo de Efeitos Aleatórios Bidirecional8 ou seja aquele que consideramos os efeitos de tempo no modelo Rode o modelo y 8 Existem várias possibilidades diferentes de como rodar os modelos Bidirecionais No Gretl rodar o modelo de Efeitos Aleatórios com dummies de tempo equivale a manter o efeito de grupo aleatório enquanto o efeito de tempo é fixo 40 sobre x2 x3 e marque a caixa de incluir as dummies temporais Teremos a seguinte saída Observe que a saída trouxe um teste a mais sobre o conjunto de dummies temporais que foram incluídas A hipótese nula desse teste de Wald é que não existe efeitos de tempos Neste caso aceitamos a hipótese nula 0703912 001 ou seja o modelo adequado não apresenta os efeitos de tempo 225 Modelo de Diferenças em Diferenças Dif Dif 41 O Modelo de Diferenças em Diferenças é utilizado para avaliação do impacto de um certo evento exógeno sobre um grupo de observações tais como avaliação de políticas públicas impacto de uma tecnologia etc A base de dados necessária para utilizar o modelo deve ser composta por dois grupos Grupo de Controle C formado pelas observações que não foram afetadas pelo evento Grupo de Tratamento T formado pelas observações que foram afetadas pelo evento exógeno A análise é feita utilizando dados desses dois grupos em dois momentos do tempo um antes da incidência do evento e outro depois Dessa forma a nossa amostra vai conter quatro grupos CA grupo de controle antes do evento CD grupo de controle depois do evento TA grupo de tratamento antes do evento TD grupo de tratamento depois do evento O método consiste em calcular duas diferenças seguidas9 No primeiro passo é calculado o valor médio da variável y que está sendo analisada para os quatro grupos acima 𝐶𝐴 𝑌𝐶𝐴 𝑛 𝑖0 𝑛 𝐶𝐷 𝑌𝐶𝐷 𝑛 𝑖0 𝑛 𝑇𝐴 𝑌𝑇𝐴 𝑛 𝑖0 𝑛 𝑇𝐷 𝑌𝑇𝐷 𝑛 𝑖0 𝑛 No segundo passo é calculada a diferença do valor médio para cada grupo C ou T considerando o antes e o depois do evento 𝐶 𝐶𝐷 𝐶𝐴 𝑇 𝑇𝐷 𝑇𝐴 No terceiro e último passo é calculada a diferença entre os dois valores calculados no segundo passo e com isso teremos o impacto do evento 𝐼𝑚𝑝𝑎𝑐𝑡𝑜 𝑇 𝐶 A tabela abaixo ilustra o método de Diferenças em Diferenças Tabela 1 Grupos Antes Depois Depois Antes C CA CD CD CA T TA TD TD TA T C TA CA TD CD TD TA CD CA 9 Por isso o nome Diferenças em Diferenças 42 Observe que CD CA e TD TA medem a diferença do antes e o depois da ocorrência do evento para os grupos de controle e tratamento Os resultados da tabela acima também podem ser obtidos com o uso de um modelo de regressão estimado por MQO 𝑌 𝛽0 𝛽1𝐷𝐷 𝛽2𝐷𝑇 𝛽3𝐷𝑇 𝐷𝐷 𝑢𝑖 1 Onde DD é uma variável dummy de tempo 1 se os dados são do período após a ocorrência do evento DT representa uma dummy para o grupo de tratamento 1 se os dados são do grupo de tratamento DD DT representa uma dummy de interação 1 se a observação foi afetada pelo evento e os dados são do período após a ocorrência do evento Observe que 𝛽0 é o valor médio de Y antes da ocorrência do evento para o grupo de controle 𝛽1 mede a diferença na variável Y entre o período depois do evento e antes da ocorrência do evento 𝛽2 mede a diferença do Y entre os grupos independentemente da ocorrência do evento 𝛽3 mede o impacto do evento ou seja representa o coeficiente de Diferenças em Diferenças Por quê 𝛽3 é o estimador de Diferenças em Diferenças Para responder essa pergunta precisamos calcular os dados da Tabela 1 usando a equação 1 Grupo de Tratamento 𝑇𝐴 𝛽0 𝛽1 0 𝛽2 1 𝛽31 0 𝑢𝑖 𝛽0 𝛽2 𝑇𝐷 𝛽0 𝛽1 1 𝛽2 1 𝛽31 1 𝑢𝑖 𝛽0 𝛽1 𝛽2 𝛽3 𝑇𝐷 𝑇𝐴 𝛽0 𝛽1 𝛽2 𝛽3 𝛽0 𝛽2 𝛽1 𝛽3 𝑎 Grupo de Controle 𝐶𝐴 𝛽0 𝛽1 0 𝛽2 0 𝛽30 0 𝑢𝑖 𝛽0 𝐶𝐷 𝛽0 𝛽1 1 𝛽2 0 𝛽31 0 𝑢𝑖 𝛽0 𝛽1 43 𝐶𝐷 𝐶𝐴 𝛽0 𝛽1 𝛽0 𝛽1 𝑏 Fazendo a b 𝑇𝐷 𝑇𝐴 𝐶𝐷 𝐶𝐴 𝛽1 𝛽3 𝛽1 𝛽3 Os resultados podem ser resumidos na tabela 2 Tabela 2 Grupos Antes Depois Depois Antes C 𝛽0 𝛽0 𝛽1 𝛽1 T 𝛽0 𝛽2 𝛽0 𝛽1 𝛽2 𝛽3 𝛽1 𝛽3 T C 𝛽2 𝛽2 𝛽3 𝛽3 Graficamente temos Observações gerais sobre o Modelo Dif Dif O valor do 𝛽3 também é chamado de Efeito Médio de Tratamento Para que o valor de 𝛽3 indique o impacto do evento exógeno é preciso que o modelo de regressão controle todas as variáveis que influenciam a variável analisada Dessa forma a equação 1 passaria a ser 𝑌 𝛽0 𝛽1𝐷𝐷 𝛽2𝐷𝑇 𝛽3𝐷𝑇 𝐷𝐷 𝛽4𝑋1 𝛽5𝑋2 𝛽𝑘𝑋𝑘 𝑢𝑖 2 Caso o modelo não controle todas as variáveis o estimador DifDif será viesado Y Grupo de Tratamento Grupo de Controle Média Estimada do efeito no grupo de Tratamento Antes Depois Intervenção Tempo 44 O tempo deve ser igual entre o grupo de tratamento e o grupo de controle O modelo DifDif considera que o grupo de controle e tratamento possuem tendência comum mesma inclinação das retas no gráfico Caso essa hipótese seja violada o estimador do modelo DifDif será viesado Exemplo 08 Efeito de um incinerador sobre o preço de imóveis Wooldridge pág 499 O arquivo Kielmc apresenta o efeito da inauguração de um incinerador de lixo sobre os preços de imóveis de uma certa cidade americana A base de dados é formada por preços de imóveis que foram vendidos em 1978 e em 1981 totalizando 321 observações no formado de Agrupamentos de Cortes Transversais O modelo teórico é dado abaixo 𝑟𝑝𝑟𝑖𝑐𝑒 𝛽0 𝛽1𝑌81 𝛽2𝑛𝑒𝑎𝑟𝑖𝑛𝑐 𝛽3𝑦81𝑛𝑟𝑖𝑛𝑐 𝑜𝑢𝑡𝑟𝑜𝑠 𝑓𝑎𝑡𝑜𝑟𝑒𝑠 𝑢𝑖 1 Onde rprice preço dos imóveis a preços constantes de 1981 y81 dummy de ano 1 se os dados são do ano de 1981 nearinc dummy de localização 1 se o imóvel é localizado perto do incinerador y81nrinc dummy de interação 1 se o imóvel está localizado perto do incinerador e foi vendido em 1981 Alguns dos outros fatores disponíveis na base de dados o Age idade do imóvel o Agesq idade do imóvel ao quadrado o Área metragem do imóvel o Baths número de banheiros Inicialmente vamos rodar alguns modelos com os dados Uma possibilidade é rodar uma equação usando os dados apenas do ano de 1981 𝑟𝑝𝑟𝑖𝑐𝑒 𝛽0 𝛽1𝑛𝑒𝑎𝑟𝑖𝑛𝑐 𝑢𝑖 45 Para rodar essa equação você deve limitar a amostra com os dados de 1981 Clique em Amostra e selecione o intervalo para 180 a 321 Rode o modelo acima clicando em Modelo Mínimos Quadrados Ordinários A saída abaixo mostra os resultados Observe que O valor da constante representa o valor médio do preço dos aluguéis dos imóveis afastados do incinerador A variável Nearinc representa que o preço médio dos imóveis localizados perto do incinerador foi 3068830 a menos que os localizados longe do incinerador Não podemos falar que o incinerador foi a única causa da queda do preço do imóvel Para demonstrar isso vamos rodar a mesma regressão para o ano de 1978 No Gretl clique em Amostra e selecione o intervalo de 1 a 179 Temos os seguintes resultados 46 Temos que O preço médio dos imóveis distantes do incinerador no ano de 1978 foi de 825172 O preço médio dos imóveis localizados perto do incinerador foi 188244 a menos que os localizados longe do incinerador Mesmo antes da construção do incinerador o preço médio dos imóveis localizados mais perto já eram inferiores aos preços dos imóveis distantes Para analisar se o incinerador causou uma queda do preço dos imóveis é preciso calcular a diferença dos coeficientes que foram estimados acima 𝛽3 3068830 1882440 1186390 Dessa forma 𝛽3 é o estimador DifDif Os mesmos resultados podem ser estimados usando a tabela 1 pág 40 na qual é calculado o valor médio da variável Y para cada grupo do experimento natural Dessa forma para o exemplo temos CA representa o preço médio dos imóveis distantes do incinerador no ano de 1978 No Gretl para calcular CA é preciso restringir a amostra da variável rprice Clique em Amostra Definir intervalo e selecione o intervalo de 01 a 179 Em seguida clique em Amostra Restringir Baseado a Critérios e selecione nearinc0 Dessa forma primeiro selecionamos os dados do ano de 1978 e depois restringimos a amostra apenas com imóveis localizados longe do incinerador Agora calculase o valor da média com o comando Ver Estatísticas Descritivas Temos os seguintes resultados 47 CD representa o preço médio dos imóveis distantes do incinerador no ano de 1981 No Gretl usamos o mesmo comando anterior mas mudamos o intervalo da amostra para 180 a 321 Antes é preciso restaurar a amostra original TA representa o preço médio dos imóveis localizados perto do incinerador no ano de 1978 No Gretl para calcular CA é preciso restringir a amostra da variável rprice Clique em Amostra Definir intervalo e selecione o intervalo de 1 a 179 Em seguida clique em Amostra Restringir Baseado a Critérios e selecione nearinc1 Dessa forma primeiro selecionamos os dados do ano de 1978 e depois restringimos a amostra apenas com imóveis localizados perto do incinerador Agora calculase o valor da média com o comando Ver Estatísticas Descritivas Temos os seguintes resultados 48 TD representa o preço médio dos imóveis localizados perto do incinerador no de 1981 No Gretl usamos o mesmo comando anterior mas mudamos o intervalo da amostra para 180 a 321 Antes é preciso restaurar a amostra original Agora com os valores médios podemos montar os dados da tabela 1 Grupos Antes Depois Depois Antes C 8251723 10130751 1879028 T 6369286 7061924 692638 T C TA CA TD CD 1186390 Uma outra maneira de estimar o Modelo DifDif é rodar por MQO a equação abaixo 𝑟𝑝𝑟𝑖𝑐𝑒 𝛽0 𝛽1𝑌81 𝛽2𝑛𝑒𝑎𝑟𝑖𝑛𝑐 𝛽3𝑦81𝑛𝑟𝑖𝑛𝑐 𝑢𝑖 No Gretl clique em Modelo Mínimos Quadrados Ordinários e coloque a equação acima Os resultados estão abaixo 49 Observe que O preço médio dos imóveis distantes do incinerador no ano de 1978 foi de 825172 Valor que foi calculado na saída da página 45 No ano de 1978 o preço médio dos imóveis localizados perto do incinerador foi 188244 a menos que os imóveis localizados longe do incinerador Portanto esse valor mede o efeito da localização que independe da presença do incinerador O estimador do modelo DifDif é representado pela dummy de interação Ele indica que no ano de 1981 o preço médio dos imóveis localizados perto do incinerador foi 1186390 inferior ao preço médio dos imóveis localizados longe do incinerador Neste modelo por hipótese estamos considerando que o grupo de tratamento imóveis de 81 e o grupo de controle imóveis de 1978 possuem características semelhantes ou seja estamos considerando que os dois grupos possuem tendência comum vide gráfico pág 42 Caso essa hipótese seja abandonada o estimador DifDif será viesado Para resolver esse problema o modelo DifDif precisa controlar outras variáveis que podem afetar o preço dos imóveis além da variável incinerador Isso pode ser feito incluindo novas variáveis Xs na equação 1 𝑟𝑝𝑟𝑖𝑐𝑒 𝛽0 𝛽1𝑌81 𝛽2𝑛𝑒𝑎𝑟𝑖𝑛𝑐 𝛽3𝑦81𝑛𝑟𝑖𝑛𝑐 𝛽4𝑖𝑛𝑡𝑠𝑡 𝛽5𝑙𝑎𝑛𝑑 𝛽6𝑎𝑟𝑒𝑎 𝛽7𝑟𝑜𝑜𝑚𝑠 𝛽8𝑏𝑎𝑡ℎ𝑠 𝛽9𝑎𝑔𝑒 𝛽10𝑎𝑔𝑒𝑠𝑞 𝑢𝑖 Onde rprice preço dos imóveis a preços constantes de 1981 y81 dummy de ano 1 se os dados são do ano de 1981 50 nearinc dummy de localização 1 se o imóvel é localizado perto do incinerador y81nrinc dummy de interação 1 se o imóvel está localizado perto do incinerador e foi vendido em 1981 Age idade do imóvel Agesq idade do imóvel ao quadrado Área área construída do imóvel Baths número de banheiros Intst distância do imóvel até a rodovia interestadual Land área do terreno Rooms número de quartos Estimando o modelo acima temos Observe que O valor do R2 subiu em comparação ao modelo mais simples O erro padrão do estimador DifDif y81nrinc caiu em comparação ao erro padrão do modelo mais simples O estimador DifDif agora não é significativo o que pode indicar que as variáveis inseridas tem um peso maior na determinação do preço médio dos imóveis do que a inauguração do incinerador na região f Exemplo 09 Efeito do aumento do salário mínimo sobre o emprego O arquivo njmin3gdt possui dados de 410 restaurantes de grandes redes de fast food localizados nas cidades de New Jersey e Pensilvânia O objetivo é verificar 51 o impacto do salário mínimo sobre o emprego ocorrido apenas em New Jersey em 1992 Dessa forma New Jersey é grupo de tratamento enquanto a Pensilvânia é o grupo de controle Os dados se referem a antes e depois da mudança da lei de salário mínimo A equação teórica é dada por 𝑓𝑡𝑒 𝛽0 𝛽1𝑑 𝛽2𝑛𝑗 𝛽3𝑑𝑛𝑗 𝑢𝑖 Onde Fte percentual de trabalhadores em regime de tempo integral D variável dummy de tempo 1 se a observação é de depois da mudança da lei Nj variável dummy de localização 1 se o restaurante é de New Jersey Dnj variável dummy de interação 1 se o restaurante é de New Jersey e a observação é de depois da mudança da lei Coloque os dados para dentro do Gretl e estime a equação acima A saída abaixo mostra os resultados Observe que A constante representa a taxa de emprego médio dos trabalhadores em tempo integral da cidade da Pensilvânia antes da mudança da lei O percentual de trabalhadores em tempo integral de New Jersey é 289 abaixo dos trabalhadores da Pensilvânia A taxa de emprego após a mudança da lei é 216 mais baixo do que antes da mudança O estimador DifDif não é significativo O que indica que o modelo precisa incorporar outros controles regressores 52 Para isso a equação teórica passaria a ser 𝑓𝑡𝑒 𝛽0 𝛽1𝑑 𝛽2𝑛𝑗 𝛽3𝑑𝑛𝑗 𝛽4𝑘𝑓𝑐 𝛽5𝑟𝑜𝑦𝑠 𝛽6𝑤𝑒𝑛𝑑𝑦𝑠 𝛽7𝑐𝑜𝑜𝑤𝑛𝑒𝑑 𝑢𝑖 Onde além das variáveis já mencionadas temos Kfc variável dummy de empresa 1 se o restaurante é da kfc Bk variável dummy de empresa 1 se o restaurante é do Burger King Roys variável dummy de empresa 1 se o restaurante é da Roy Rodgers Wendys variável dummy de empresa 1 se o restaurante é da Wendys Coowned variável dummy de tipo de administração 1 se o restaurante é administrado pela matriz ou seja não é franqueado Estimamos o modelo temos Observe que Agora a variável do modelo DifDif dnj é significativa a 10 O seu valor indica que a política de aumento do salário mínimo teve um impacto positivo sobre o nível do emprego Esse resultado é diferente do que fala a literatura Um restaurante do KFC possui uma taxa de trabalhadores em tempo integral 1045 inferior ao restaurante BK Um restaurante com administração própria da rede possui uma taxa de trabalhadores em tempo integral 116 inferior aos restaurantes administrados pelos franqueados 53 226 Regressões Aparentemente não Relacionadas SUR Um modelo de regressão aparentemente não relacionada SUR considera que os parâmetros da regressão βs diferem entre as diversas firmas mas são constantes no tempo ou seja o modelo a ser rodado tornase 𝑌𝑖𝑡 𝛽1𝑖 𝛽2𝑖𝑋2𝑖𝑡 𝛽3𝑖𝑋3𝑖𝑡 𝑒𝑖𝑡 Além disso o modelo SUR considera que existe uma correlação contemporânea entre os resíduos de cada grupo firmas pessoas etc de observações 𝑐𝑜𝑣𝑒𝑚𝑡 𝑒𝑛𝑡 𝜎𝑚𝑛 1 Ou seja a equação 1 indica que no ano t os mesmos fatores que influenciam os resíduos do grupo m também influenciam os resíduos do grupo n O objetivo da estimação SUR é produzir estimativas melhores considerando a correlação contemporânea entre os resíduos Em termos práticos o software econométrico segue os seguintes passos 1 Estimar as equações separadamente para cada grupo utilizando MQO 2 Usar os resíduos de mínimos quadrados do 1º passo para estimar 𝜎𝑚 2 𝜎𝑛 2 𝜎𝑚𝑛 variância do grupo m variância do grupo n e covariância entre m e n 3 Usar as estimativas do 2º passo para estimar as equações conjuntamente dentro do esquema de Mínimos Quadrados Generalizados MQG Exemplo 10 Modelo de investimento Livro Hill Judge e Griffiths pág 412 Considere abaixo o modelo de investimento para as empresas General Eletric G e Westinghouse W 𝐼𝑛𝑣𝐺𝑇 𝛽1𝐺 𝛽2𝐺𝑉𝐺𝑇 𝛽3𝐺𝐾𝐺𝑇 𝑒𝐺𝑇 𝐼𝑛𝑣𝑊𝑇 𝛽1𝑊 𝛽2𝑊𝑉𝑊𝑇 𝛽3𝑊𝐾𝑊𝑇 𝑒𝑊𝑇 Para esse exemplo a equação 1 tornase 𝑐𝑜𝑣𝑒𝐺𝑡 𝑒𝑊𝑡 𝜎𝐺𝑊 Para entender por que 𝑒𝐺𝑡 e 𝑒𝑊𝑡 podem ser correlacionados recorde que esses erros contêm a influência sobre o investimento de fatores que foram omitidos das equações Tais fatores podem incluir utilização da capacidade taxas de juros correntes e passadas liquidez e a situação geral da economia 54 Utilizando o arquivo tabela 93 insira os dados no Gretl A figura abaixo mostra as variáveis Para estimar o modelo SUR clique em Modelo e selecione Equações Simultâneas Na Caixa coloque as seguintes equações equation IGE const KGE VGE equation IWE const KWE VWE Selecione o modelo SUR e aperte ok A saída abaixo mostra os resultados 55 Observe que o modelo SUR roda duas equações separadas considerando a correlação contemporânea entre os resíduos 𝑐𝑜𝑣𝑒𝐺𝑡 𝑒𝑊𝑡 𝜎𝐺𝑊 Usando o mesmo sistema também podemos rodar as equações separadas através de MQO Para isso clique em Modelo Equações Simultâneas e selecione MQO A saída abaixo mostra os resultados 56 Compare os resultados Qual estimação é melhor MQO ou SUR A diferença entre as estimativas está no fato do modelo SUR considera a correlação contemporânea entre os resíduos de cada equação ou seja 𝑟𝑚𝑛 0 Dessa forma uma maneira simples é usar a seguinte hipótese nula 𝐻0 𝑟𝑚𝑛 0 𝑜 𝑚𝑒𝑙ℎ𝑜𝑟 𝑚𝑜𝑑𝑒𝑙𝑜 é 𝑀𝑄𝑂 Neste caso calculamos a seguinte equação 𝜆 𝑇𝑟𝑚𝑛 2 𝒳 𝑜𝑛𝑑𝑒 𝑇 é 𝑢𝑚 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑎𝑛𝑜𝑠𝑑𝑖𝑎𝑠 𝑚𝑒𝑠𝑒𝑠 𝑒𝑡𝑐 O valor de 𝑟𝑚𝑛 é dado pela seguinte fórmula 𝑟𝑚𝑛 𝜎𝑚𝑛 2 𝜎𝑚2 𝜎𝑛2 𝑐𝑜𝑣𝑎𝑟𝑖â𝑛𝑐𝑖𝑎 𝑒𝑛𝑡𝑟𝑒 𝑜𝑠 𝑔𝑟𝑢𝑝𝑜𝑠 𝑚 𝑒 𝑛 𝑣𝑎𝑟𝑖â𝑛𝑐𝑖𝑎 𝑑𝑜 𝑔𝑟𝑢𝑝𝑜 𝑚 𝑣𝑎𝑟𝑖â𝑛𝑐𝑖𝑎 𝑑𝑜 𝑔𝑟𝑢𝑝𝑜 𝑛 57 𝑟𝑔𝑒𝑤𝑒 𝜎𝑔𝑒𝑤𝑒 2 𝜎𝑔𝑒 2 𝜎𝑤𝑒 2 Para realizar este teste no Gretl rode o modelo MQO10 e analise a parte final da saída de regressão Temos 𝑟𝑔𝑒𝑤𝑒 𝜎𝑔𝑒𝑤𝑒 2 𝜎𝑔𝑒 2 𝜎𝑤𝑒 2 17645 66083 88662 072896 0729 O valor da correlação dos resíduos entre as duas equações é dado pelo termo entre parênteses da matriz de covariâncias 0729 Dessa forma temos 𝜆 𝑇𝑟𝑚𝑛 2 20 07292 106288 Como temos apenas uma correlação 𝑟𝐺𝐸𝑊𝐸 2 na tabela Quiquadrada procuramos o nível de significância com um grau de liberdade Clique em Ferramentas Tabelas Estatísticas Coloque 1 em gl e 005 probabilidade da cauda direita Temos os seguintes resultados Neste caso o valor crítico de uma distribuição quiquadrada com 5 de significância e um grau de liberdade é 384 Com isso rejeitamos a hipótese nula 1062 384 ou seja o melhor modelo é o SUR Os mesmos resultados podem ser obtidos com a análise do pvalor valor entre colchetes do teste de BreuschPagan da saída MQO Neste caso como o p valor é menor que o nível de significância 00011 005 rejeitamos a hipótese nula Exemplo 11 Taxa de crescimento Livro Hill Judge e Griffiths pág 419 exercício 172 10 O Gretl apresenta o mesmo teste na saída do modelo SUR Entretanto o teste correto é aquele produzido pela saída de MQO e portanto o teste da saída do modelo SUR está errado 58 Vamos rodar o modelo de crescimento proposto por Stengos apud Hill O modelo teórico é dado abaixo 𝐺60 𝛽1 𝛽260𝑃𝑂𝑃60 𝛽360𝐼𝑁𝑉60 𝛽460𝐼𝐺𝐷𝑃60 𝛽560𝑆𝐸𝐶60 𝑒60 𝐺70 𝛽1 𝛽270𝑃𝑂𝑃70 𝛽370𝐼𝑁𝑉70 𝛽460𝐼𝐺𝐷𝑃70 𝛽570𝑆𝐸𝐶70 𝑒70 𝐺80 𝛽1 𝛽280𝑃𝑂𝑃80 𝛽360𝐼𝑁𝑉80 𝛽460𝐼𝐺𝐷𝑃80𝛽580𝑆𝐸𝐶80 𝑒80 Onde G taxa de crescimento de cada país POP crescimento populacional INV parcela da produção destinada ao investimento IGDP índice inicial do PIB em 1960 em termos reais SEC capital humano medido em termos da taxa de matrícula no secundário Utilizando os dados da tabela 172 insira os dados no Gretl Vamos agora estimar o modelo SUR Clique em Modelo Equações Simultâneas Insira o sistema abaixo 59 Teremos a seguinte saída de regressão 60 Será que o impacto do investimento sobre a taxa de crescimento não seria o mesmo nos três anos ou seja𝛽𝐼𝑛𝑣60 𝛽𝐼𝑛𝑣70 𝛽𝐼𝑛𝑣80 Para realizar o teste clique em Testes Restrições Lineares e coloque a hipótese nula Neste caso o Gretl trabalha com formato bij onde i se refere ao número da equação e j ao número do 𝛽 iniciando em 1 Assim temos Observe que a primeira linha equivale a 𝛽𝐼𝑛𝑣60 𝛽𝐼𝑛𝑣70 enquanto a segunda linha seria 𝛽𝐼𝑛𝑣70 𝛽𝐼𝑛𝑣80 Abaixo temos os resultados do teste 61 Como o pvalor é maior que o nível de significância 02805001 aceitamos a hipótese nula ou seja os coeficientes são iguais Agora vamos rodar MQO 62 Teste a hipótese de qual é o melhor modelo SUR ou MQO Neste caso temos a seguinte hipótese nula 𝐻0 𝑟6070 𝑟6080 𝑟7080 0 Como temos três equações a fórmula do teste também muda 𝜆 𝑇𝑟6070 2 𝑟6080 2 𝑟7080 2 8600852 00872 03432 𝜆 1139 Observe que na saída de regressão de MQO os valores das correlações estão entre parênteses Além isso o valor do 𝜆 é dado no teste de BreuschPagan 11407211 Como temos três correlações 𝑟6070 𝑟6080 𝑟7080 na tabela Quiquadrada procuramos o nível de significância com três graus de liberdade Clique em Ferramentas Tabelas Estatísticas Coloque 3 em gl e 005 probabilidade da cauda direita Temos os seguintes resultados 11 O valor de 114072 é ligeiramente diferente do valor calculado de 1139 O motivo é uma simples questão de arredondamento já que o valor de 1139 foi calculado considerando apenas três casas decimais 63 Como o valor 𝜆 é maior que o valor tabelado 1139 7814 rejeitamos a hipótese nula ou seja o melhor modelo é o SUR O mesmo resultado é visto analisando o pvalor do teste Breusch Pagan 00097 001 Exemplo 12 Modelo de investimento Revisitado O arquivo Greene 131 apresenta os mesmos dados do exemplo 10 pág 52 com 05 empresas Tente executar os seguintes itens O modelo SUR O modelo MQO Teste a hipótese de que no modelo SUR 𝛽𝐹𝐺𝑀 𝛽𝐹𝑈𝑆 Qual o modelo é o melhor SUR ou MQO