·
Cursos Gerais ·
Econometria
Send your question to AI and receive an answer instantly
Preview text
10102022 1342 Capítulo 6 Regressão com Dados em Painel Software R curso avançado httpssmolskigithubiolivroavancadoregressaocomdadosempainelhtmltestandoraizesunitarias 117 Capítulo 6 Regressão com Dados em Painel Felipe Micail da Silva Smolski O modelo de regressão com dados em painel possui uma característica especial se constitui de uma dimensão temporal e outra espacial Isto porque a mesma unidade de corte transversal família países etc é acompanhada ao longo do tempo Por exemplo a produção industrial mensal dos Estados brasileiros em função da taxa de juros no período de 20152016 Têmse então a 624 26x24 observações combinadas de cada um dos 26 Estados exluindo o Distrito Federal e 24 observações para os meses Dentre os benefícios da regressão com dados em painel Gujarati e Porter 2011 Devido à heterogeneidade da análise entre indivíduos empresas estados países etc esta técnica pode levar em conta estas variáveis individuais específicas Maior informação maior variabilidade e menor colinearidade entre variáveis devido à combinaçãod e séries temporais e dados com corte transversal Dados em painel são mais adequados ao estudo da dinâmica da mudança emprego renda etc Detecta e mede melhor os efeitos em comparação aos estudos transversais puros ou em séries temporais puras Possibilidade de modelos comportamentais mais complexos Minimização do viés decorrente da agregação de pessoas eou empresas nos grandes conjuntos 61 Carregamento e transformação dos dados A base de dados utilizada neste exemplo Grunfeld é proveniente do pacote AER É constituída da variável dependente do nível de investimento invest de diversas empresas firm bem como das variáveis explicativas de seu valor de mercado value e do valor do 10102022 1342 Capítulo 6 Regressão com Dados em Painel Software R curso avançado httpssmolskigithubiolivroavancadoregressaocomdadosempainelhtmltestandoraizesunitarias 217 estoque de capital capital durante o período de 19351954 20 anos Portanto pretendese descobrir os determinantes do valor do nível investimento das firmas durente o período Após carregada a base para o estudo serão selecionadas quatro empresas General Electric General Motors US Steel e Westinghouse para fins de análise dos dados Utilizase o pacote plm e a função pdataframe para alocar a base de dados para a análise de regressão de dados em painel uma vez que é necessário definir o atributo individual firm e temporal year das observações Para isso utilizase o argumento index como segue invest value capital firm year General Motors1935 3176 3078 28 General Motors 1935 General Motors1936 3918 4662 526 General Motors 1936 General Motors1937 4106 5387 1569 General Motors 1937 General Motors1938 2577 2792 2092 General Motors 1938 General Motors1939 3308 4313 2034 General Motors 1939 General Motors1940 4612 4644 2072 General Motors 1940 requireAER dataGrunfeld packageAER requireplm GrunfeldsubsetGrunfeld firm in cGeneral Electric General Motors US Steel Westinghouse GrunfeldpdataframeGrunfeld indexcfirmyear headGrunfeld summaryGrunfeld 10102022 1342 Capítulo 6 Regressão com Dados em Painel Software R curso avançado httpssmolskigithubiolivroavancadoregressaocomdadosempainelhtmltestandoraizesunitarias 317 invest value capital firm Min 129 Min 192 Min 08 General Motors 20 1st Qu 553 1st Qu1192 1st Qu 1181 US Steel 20 Median 1998 Median 1971 Median 2547 General Electric20 Mean 2909 Mean 2229 Mean 3573 Westinghouse 20 3rd Qu 4598 3rd Qu2795 3rd Qu 3689 Max 14867 Max 6242 Max 22263 year 1935 4 1936 4 1937 4 1938 4 1939 4 1940 4 Other56 Notase que nesta base que será trabalhada os dados das empresas aparecem empilhados uma vez que a variável referente ao ano da observação year está repetida para cada observação da referida empresa corte transversal repetido em diversos períodos de tempo Desta forma a nossa base de dados possui igualmente 20 informações para cada empresa se constituindo em um painel equilibrado Caso o número de informações para cada empresa fossem desiguais teríamos um painel desequilibrado Uma questão interessante emerge para a análise de regressão de dados em painel em virtude da interação de variáveis individuais firm com a série temporal year a elevação da complexidade da análise Desta forma várias possibilidades de análise de modelos de regressão surgem dentre elas a regressão considerando que o intercepto do modelo e seus coeficientes angulares são constantes ao londo do tempo e no espaço sendo que o termo de erro capta a diferença no tempo e entre os indivíduos POOLED b regressão considerando que os coeficientes angulares são constantes e o intercepto varia entre os indivíduos EFEITOS FIXOS c regressão considerando que o intercepto assume um valor médio comum entre os indivíduos e os coeficientes angulares variam ao longo do tempo e também entre indivíduos EFEITOS ALEATÓRIOS 10102022 1342 Capítulo 6 Regressão com Dados em Painel Software R curso avançado httpssmolskigithubiolivroavancadoregressaocomdadosempainelhtmltestandoraizesunitarias 417 Abaixo é demonstrada a evolução do investimento de acordo com cada empresa estudada 62 Modelo Pooled Este modelo trata de empilhar todas as observações da base de dados ignorando a estrutura de dados em painel Desta forma todas as observações são tratadas como não correlacionadas para os indivíduos com erros homoscedásticos para com os indivíduos Tratase portanto da forma mais simplista e ingênua pois desconsidera as dimensões de tempo e espaço combinados ao mesmo tempo que estima a regressão pelo método dos Mínimos Quadrados Ordinários MQO Gujarati e Porter 2011 Desta forma em que corresponde à nésima unidade de corte transversal e o nésimo período de tempo Para executar este modelo de regressão é necessário utilizar a função plm juntamente com as variáveis dependente e independentes indicando a base de dados data e o tipo da regressão pooling coplotinvest yearfirm typeb dataGrunfeld Yit β1 β2X2it β3X3it uit i 1 2 3 4 t 1 2 20 i i t t 10102022 1342 Capítulo 6 Regressão com Dados em Painel Software R curso avançado httpssmolskigithubiolivroavancadoregressaocomdadosempainelhtmltestandoraizesunitarias 517 Pooling Model Call plmformula invest value capital data Grunfeld model pooling Balanced Panel n 4 T 20 N 80 Residuals Min 1st Qu Median 3rd Qu Max 31968 9995 196 6599 33621 Coefficients Estimate Std Error tvalue Prt Intercept 628318 297254 211 0038 value 01105 00138 802 92e12 capital 03005 00494 608 43e08 Signif codes 0 0001 001 005 01 1 Total Sum of Squares 6410000 Residual Sum of Squares 1570000 RSquared 0755 Adj RSquared 0748 Fstatistic 118424 on 2 and 77 DF pvalue 2e16 A estimação da regressão pooled averiguou alta significância estatística nas variáveis dependentes value e capital indicando sinal positivo para os coeficientes em consonância com a literatura bem como um valor de R alto Este tipo de modelo não faz diferenciação entre a influênciadiferença das empresas na variável investimento e nem se a resposta do investimento às variáveis explicativas é a mesma ao longo do tempo Isto faz regpooledplminvestvaluecapital dataGrunfeld modelpooling summaryregpooled 2 10102022 1342 Capítulo 6 Regressão com Dados em Painel Software R curso avançado httpssmolskigithubiolivroavancadoregressaocomdadosempainelhtmltestandoraizesunitarias 617 com que não se saiba se existe heterogeneidade entre as empresas A comparação do modelo pooled com as regressões de efeitos fixos e efeitos aleatórios que serão estimados na sequência servirá mostrar ao pesquisador qual é o melhor modelo dentre eles 63 Modelo Efeitos Fixos O modelo de regressão com efeitos fixos considera como visto anteriormente que os valores dos interceptos para cada regressão variam de acordo com o efeito de cada indivíduo firma e que os coeficientes de declividade das variáveis independentes value e capital para cada equação são os mesmos para cada empresa conforme equação abaixo em que painel balanceado Desta forma o intercepto da equação é diferente para cada empresa mas o efeito das variáveis independentes é o mesmo sobre a variável independente Isto indica que existe características especiais em cada empresa influenciando o investimento como por exemplo o estilo de gestão Gujarati e Porter 2011 Abaixo é montada a regressão de efeitos fixos αi investit value1it capital2it αi εit i 1 4 t 1 20 regefplminvestvaluecapital dataGrunfeld modelwithin summaryregef 10102022 1342 Capítulo 6 Regressão com Dados em Painel Software R curso avançado httpssmolskigithubiolivroavancadoregressaocomdadosempainelhtmltestandoraizesunitarias 717 Oneway individual effect Within Model Call plmformula invest value capital data Grunfeld model within Balanced Panel n 4 T 20 N 80 Residuals Min 1st Qu Median 3rd Qu Max 18466 4826 933 4055 19767 Coefficients Estimate Std Error tvalue Prt value 01084 00176 617 33e08 capital 03451 00267 1292 2e16 Signif codes 0 0001 001 005 01 1 Total Sum of Squares 2170000 Residual Sum of Squares 422000 RSquared 0806 Adj RSquared 0792 Fstatistic 153291 on 2 and 74 DF pvalue 2e16 Notase que o impacto do valor da empresa value e do capital capital é positivo sobre o investimento invest para todas as empresas como visto acima Inclusive há significância estatística para estas variáveis No entanto ainda resta definir o efeito dos interceptos de cada empresa como segue summaryfixefregef 10102022 1342 Capítulo 6 Regressão com Dados em Painel Software R curso avançado httpssmolskigithubiolivroavancadoregressaocomdadosempainelhtmltestandoraizesunitarias 817 Estimate Std Error tvalue Prt General Motors 855 735 116 02483 US Steel 950 367 259 00115 General Electric 2462 359 685 19e09 Westinghouse 594 202 294 00044 Signif codes 0 0001 001 005 01 1 Com este resultado é possível observar que o efeito das firmas sobre o investimento parece ser diferente para cada indivíduo Desta forma somente a empresa US Steel consta com efeito positivo sobre o investimento Por outo lado a fórmula da regressão é apresentada de maneira diversa por exemplo para a regressão considerando a General Motors considerando a firma US Steel e assim por diante Outra forma de visualizar a equação de efeitos fixos é utilizando a função lm para definir a regressão definindo a variável firm como um fator invest 85 515 0 108400value 0 345058capital invest 94988 0 108400value 0 345058capital summarylminvestvaluecapitalasfactorfirm dataGrunfeld 10102022 1342 Capítulo 6 Regressão com Dados em Painel Software R curso avançado httpssmolskigithubiolivroavancadoregressaocomdadosempainelhtmltestandoraizesunitarias 917 Call lmformula invest value capital asfactorfirm data Grunfeld Residuals Min 1Q Median 3Q Max 18466 4826 933 4055 19767 Coefficients Estimate Std Error t value Prt Intercept 855153 734898 116 024831 value 01084 00176 617 33e08 capital 03451 00267 1292 2e16 asfactorfirmUS Steel 1805029 457168 395 000018 asfactorfirmGeneral Electric 1607122 466224 345 000094 asfactorfirmWestinghouse 261296 649435 040 068859 Signif codes 0 0001 001 005 01 1 Residual standard error 755 on 74 degrees of freedom Multiple Rsquared 0934 Adjusted Rsquared 093 Fstatistic 210 on 5 and 74 DF pvalue 2e16 Note que o intercepto definido 8551533 referese à presença da empresa General Motors Caso seja evidenciada a presença da empresa US Steel o valor do intercepto passa para 94988 8551533 18050295 a mesma lógica vale para as demais empresas 64 Modelo Efeitos Aleatórios No modelo de regressão com efeitos aleatórios os efeitos individuais das firmas firms são considerados variáveis aleatórias ao contrário do modelo visto anteriormente Desta forma onde é variável aleatória com valor médio e o intercepto para a empresa individual é dado por Gujarati e Porter 2011 Y1i β1i β2X2it β3X3it uit β1i β1 β1i β1 εi i 1 2 N 10102022 1342 Capítulo 6 Regressão com Dados em Painel Software R curso avançado httpssmolskigithubiolivroavancadoregressaocomdadosempainelhtmltestandoraizesunitarias 1017 em que é um termo de erro de média zero e variânvia Assim as empresas possuem um valor médio para o intercepto sendo que as diferenças refletem o termo de erro Obtêmse O erro composto é formado por elemento de corte transversal dos indivíduos e que é o elemento da série temporal e do corte transversal Gujarati e Porter 2011 Desta forma assumese que os erros individuais não estão correlacionados entre si e também não estão correlacionados entre aquelas unidades de corte transversal e das séries temporais A montagem deste tipo de regressão é feita através da função plm incluindo como modelo random e como método walhus como segue εi σ2ε β1 εi Yit β1 β2X2it β3X3it wit wit εi uit wit εi uit regeaplminvestvaluecapital dataGrunfeld modelrandom randommethod walhus summaryregea 10102022 1342 Capítulo 6 Regressão com Dados em Painel Software R curso avançado httpssmolskigithubiolivroavancadoregressaocomdadosempainelhtmltestandoraizesunitarias 1117 Oneway individual effect Random Effect Model WallaceHussains transformation Call plmformula invest value capital data Grunfeld model random randommethod walhus Balanced Panel n 4 T 20 N 80 Effects var stddev share idiosyncratic 57865 761 029 individual 138726 1178 071 theta 0857 Residuals Min 1st Qu Median 3rd Qu Max 19389 4617 135 4198 19811 Coefficients Estimate Std Error zvalue Prz Intercept 726322 689083 105 029 value 01079 00167 648 93e11 capital 03443 00269 1281 2e16 Signif codes 0 0001 001 005 01 1 Total Sum of Squares 2260000 Residual Sum of Squares 446000 RSquared 0802 Adj RSquared 0797 Chisq 312731 on 2 DF pvalue 2e16 Os resultados corroboram com a direção dos sinais para as variáveis dependentes value e capital ambos positivos Por outro lado os resultados do modelo de efeitos aleatórios trazem os valores sobre a variância dos erros primeiramente voltado ao componente de corte 10102022 1342 Capítulo 6 Regressão com Dados em Painel Software R curso avançado httpssmolskigithubiolivroavancadoregressaocomdadosempainelhtmltestandoraizesunitarias 1217 transversal específico dos indivíduos denominado individual e outro fator idissiossincrático o qual varia com o tempo e também com o corte transversal denominado idiosyncratic 65 Comparação e escolha dos modelos Após a evidenciação dos modelos de regressão dos tipos agrupado pooled de efeitos fixos e de efeitos aleatórios é preciso efetuar os testes para definir qual é o melhor modelo e que por consequência deverá ser considerado Modelo Pooled x Modelo de Efeitos Fixos Inicialmente comparase o modelo Pooled com a regressão de Efeitos Fixos within Para isto utilizase o Teste F ou teste F de Chow A hipótese nula é de que há igualdade nos interceptos e nas inclinações para todos os indivíduos caracterizando o modelo de dados agrupados pooled A função utilizada é pFtest do pacote plm F test for individual effects data invest value capital F 67 df1 3 df2 74 pvalue 2e16 alternative hypothesis significant effects Como o valor p é inferior a 005 o modelo de Efeitos Fixos é melhor do que o modelo Pooled Modelo Pooled x Modelo de Efeitos Aleatórios O teste desenvolvido por Breusch e Pagan 1980 compara as estimativas entre os modelos verificando se sendo que Desta forma a aceitação da hipótese nula implica que o modelo de dados agrupados pooled é preferível A função plmtest efetua este teste requireplm pFtestregefregpooled σ2α 0 H0 σ2α 0 H1 σ2α 0 10102022 1342 Capítulo 6 Regressão com Dados em Painel Software R curso avançado httpssmolskigithubiolivroavancadoregressaocomdadosempainelhtmltestandoraizesunitarias 1317 Lagrange Multiplier Test BreuschPagan for balanced panels data invest value capital chisq 380 df 1 pvalue 2e16 alternative hypothesis significant effects Como o p valor foi inferior a 005 o modelo de Efeitos Aleatórios é superior ao modelo Pooled Modelo Efeitos Fixos x Modelo de Efeitos Aleatórios O teste de Hausmann Hausman 1978 efetua a especificação dos modelos de Efeito Fixo e de Efeitos Aleatórios sendo que se o teste rejeitar a hipótese nula o modelo de Efeitos Fixos é o mais adequado A função a ser utilizada para este teste é phtest Hausman Test data invest value capital chisq 0075 df 2 pvalue 1 alternative hypothesis one model is inconsistent Como o valor p foi superior a 005 o modelo de Efeitos Aleatórios foi considerado superior ao modelo de Efeitos Fixos 66 Alguns testes para os modelos plmtestregpooled typebp H0 αi não são correlacionados com Xit H1 αi são correlacionados com Xit phtestregefregea 10102022 1342 Capítulo 6 Regressão com Dados em Painel Software R curso avançado httpssmolskigithubiolivroavancadoregressaocomdadosempainelhtmltestandoraizesunitarias 1417 661 Testando dependência transversal crosssectional A dependência crosssectional se apresenta em panieis com longas séries de tempo A hipótese nula é de que os resíduos através dos indivíduos não estão correlacionados Como resultado nossa regressão aceita a hipótese nula do teste de Pesaran 2015 Pesaran CD test for crosssectional dependence in panels data invest value capital z 031 pvalue 08 alternative hypothesis crosssectional dependence 662 Normalidade dos resíduos Segue o já conhecido teste para verificar a normalidade dos resíduos Como resultado foi aprovada a hipótese nula H de normalidade nos resíduos da regressão ShapiroWilk normality test data regearesiduals W 099 pvalue 09 663 Homocedasticidade dos resíduos Abaixo o teste para homocedasticidade variância constante dos resíduos de BreuschPagan 1979 pcdtestregea testcd 0 shapirotestregearesiduals 10102022 1342 Capítulo 6 Regressão com Dados em Painel Software R curso avançado httpssmolskigithubiolivroavancadoregressaocomdadosempainelhtmltestandoraizesunitarias 1517 studentized BreuschPagan test data regea BP 76 df 2 pvalue 002 Como a hipótese nula é a de que não há homocedasticidade nos resíduos e o pvalue foi inferior a 005 há problemas nos resíduos da regressão portanto as veriáveis apresentam problemas de heterocedasticidade Algumas soluções são possíveis como a transformação das variáveis 664 Testando correlação serial A hipótese nula do teste de correlação serial do teste BreuschGodfreyWooldridge Breusch 1978 é a de que não se encontra esta característica na série Abaixo o resultado do teste sendo que aprovou a hipótese nula ou seja não há problemas de correlação serial nos dados pois o pvalue é superior a 005 BreuschGodfreyWooldridge test for serial correlation in panel models data invest value capital chisq 26 df 20 pvalue 02 alternative hypothesis serial correlation in idiosyncratic errors 665 Teste para efeitos individuais ou de tempo librarylmtest bptestregea teste BreuschGodfreyWooldridge EFEITOS ALEATÓRIOS pbgtestregea 10102022 1342 Capítulo 6 Regressão com Dados em Painel Software R curso avançado httpssmolskigithubiolivroavancadoregressaocomdadosempainelhtmltestandoraizesunitarias 1617 Pode ser efetuado o teste para verificar a presença de efeitos não observados de tempo ou individuais nos modelos de dados em painel Wooldridge 2010 A hipótse nula é a não correlação entre os erros do mesmo grupo Observase que para o efeito tempo time há aceitação da hipótese alternativa mostrando a correlação entre erros ao contrário do efeito individual Wooldridges test for unobserved individual effects data formula z 14 pvalue 02 alternative hypothesis unobserved effect Wooldridges test for unobserved time effects data formula z 32 pvalue 0001 alternative hypothesis unobserved effect 666 Testando raízes unitárias O teste de DickeyFuller prova se a série é estocástica sendo que a hipótese nula é de que a série possui raiz unitária nãoestacionaridade Abaixo o resultado do teste sendo que observouse que a série é não estacionária ou seja tem problemas para a regressão pois o pvalue aprovou a hipótese nula Desta forma algumas saídas são possíveis como a transformação da série ou mesmo a utilização da primeira diferença da série teste Wooldridge POOLED pwtestregpooled pwtestregpooled effect time requiretseries 10102022 1342 Capítulo 6 Regressão com Dados em Painel Software R curso avançado httpssmolskigithubiolivroavancadoregressaocomdadosempainelhtmltestandoraizesunitarias 1717 Carregando pacotes exigidos tseries Augmented DickeyFuller Test data Grunfeldinvest DickeyFuller 34 Lag order 2 pvalue 007 alternative hypothesis stationary Referências Breusch Trevor S 1978 Testing for autocorrelation in dynamic linear models Australian Economic Papers 17 31 33455 Breusch Trevor S e Adrian R Pagan 1979 A simple test for heteroscedasticity and random coefficient variation Econometrica Journal of the Econometric Society 128794 Breusch Trevor Stanley e Adrian Rodney Pagan 1980 The Lagrange multiplier test and its applications to model specification in econometrics The Review of Economic Studies 47 1 23953 Gujarati Damodar N e Down C Porter 2011 Econometria básica 5a ed New York Mc Graw Hill httpsdoiorg101126science1186874 Hausman Jerry A 1978 Specification tests in econometrics Econometrica Journal of the econometric society 125171 Pesaran M Hashem 2015 Testing weak crosssectional dependence in large panels Econometric Reviews 34 610 10891117 Wooldridge Jeffrey M 2010 Econometric analysis of cross section and panel data MIT Press adftestGrunfeldinvest k2
Send your question to AI and receive an answer instantly
Preview text
10102022 1342 Capítulo 6 Regressão com Dados em Painel Software R curso avançado httpssmolskigithubiolivroavancadoregressaocomdadosempainelhtmltestandoraizesunitarias 117 Capítulo 6 Regressão com Dados em Painel Felipe Micail da Silva Smolski O modelo de regressão com dados em painel possui uma característica especial se constitui de uma dimensão temporal e outra espacial Isto porque a mesma unidade de corte transversal família países etc é acompanhada ao longo do tempo Por exemplo a produção industrial mensal dos Estados brasileiros em função da taxa de juros no período de 20152016 Têmse então a 624 26x24 observações combinadas de cada um dos 26 Estados exluindo o Distrito Federal e 24 observações para os meses Dentre os benefícios da regressão com dados em painel Gujarati e Porter 2011 Devido à heterogeneidade da análise entre indivíduos empresas estados países etc esta técnica pode levar em conta estas variáveis individuais específicas Maior informação maior variabilidade e menor colinearidade entre variáveis devido à combinaçãod e séries temporais e dados com corte transversal Dados em painel são mais adequados ao estudo da dinâmica da mudança emprego renda etc Detecta e mede melhor os efeitos em comparação aos estudos transversais puros ou em séries temporais puras Possibilidade de modelos comportamentais mais complexos Minimização do viés decorrente da agregação de pessoas eou empresas nos grandes conjuntos 61 Carregamento e transformação dos dados A base de dados utilizada neste exemplo Grunfeld é proveniente do pacote AER É constituída da variável dependente do nível de investimento invest de diversas empresas firm bem como das variáveis explicativas de seu valor de mercado value e do valor do 10102022 1342 Capítulo 6 Regressão com Dados em Painel Software R curso avançado httpssmolskigithubiolivroavancadoregressaocomdadosempainelhtmltestandoraizesunitarias 217 estoque de capital capital durante o período de 19351954 20 anos Portanto pretendese descobrir os determinantes do valor do nível investimento das firmas durente o período Após carregada a base para o estudo serão selecionadas quatro empresas General Electric General Motors US Steel e Westinghouse para fins de análise dos dados Utilizase o pacote plm e a função pdataframe para alocar a base de dados para a análise de regressão de dados em painel uma vez que é necessário definir o atributo individual firm e temporal year das observações Para isso utilizase o argumento index como segue invest value capital firm year General Motors1935 3176 3078 28 General Motors 1935 General Motors1936 3918 4662 526 General Motors 1936 General Motors1937 4106 5387 1569 General Motors 1937 General Motors1938 2577 2792 2092 General Motors 1938 General Motors1939 3308 4313 2034 General Motors 1939 General Motors1940 4612 4644 2072 General Motors 1940 requireAER dataGrunfeld packageAER requireplm GrunfeldsubsetGrunfeld firm in cGeneral Electric General Motors US Steel Westinghouse GrunfeldpdataframeGrunfeld indexcfirmyear headGrunfeld summaryGrunfeld 10102022 1342 Capítulo 6 Regressão com Dados em Painel Software R curso avançado httpssmolskigithubiolivroavancadoregressaocomdadosempainelhtmltestandoraizesunitarias 317 invest value capital firm Min 129 Min 192 Min 08 General Motors 20 1st Qu 553 1st Qu1192 1st Qu 1181 US Steel 20 Median 1998 Median 1971 Median 2547 General Electric20 Mean 2909 Mean 2229 Mean 3573 Westinghouse 20 3rd Qu 4598 3rd Qu2795 3rd Qu 3689 Max 14867 Max 6242 Max 22263 year 1935 4 1936 4 1937 4 1938 4 1939 4 1940 4 Other56 Notase que nesta base que será trabalhada os dados das empresas aparecem empilhados uma vez que a variável referente ao ano da observação year está repetida para cada observação da referida empresa corte transversal repetido em diversos períodos de tempo Desta forma a nossa base de dados possui igualmente 20 informações para cada empresa se constituindo em um painel equilibrado Caso o número de informações para cada empresa fossem desiguais teríamos um painel desequilibrado Uma questão interessante emerge para a análise de regressão de dados em painel em virtude da interação de variáveis individuais firm com a série temporal year a elevação da complexidade da análise Desta forma várias possibilidades de análise de modelos de regressão surgem dentre elas a regressão considerando que o intercepto do modelo e seus coeficientes angulares são constantes ao londo do tempo e no espaço sendo que o termo de erro capta a diferença no tempo e entre os indivíduos POOLED b regressão considerando que os coeficientes angulares são constantes e o intercepto varia entre os indivíduos EFEITOS FIXOS c regressão considerando que o intercepto assume um valor médio comum entre os indivíduos e os coeficientes angulares variam ao longo do tempo e também entre indivíduos EFEITOS ALEATÓRIOS 10102022 1342 Capítulo 6 Regressão com Dados em Painel Software R curso avançado httpssmolskigithubiolivroavancadoregressaocomdadosempainelhtmltestandoraizesunitarias 417 Abaixo é demonstrada a evolução do investimento de acordo com cada empresa estudada 62 Modelo Pooled Este modelo trata de empilhar todas as observações da base de dados ignorando a estrutura de dados em painel Desta forma todas as observações são tratadas como não correlacionadas para os indivíduos com erros homoscedásticos para com os indivíduos Tratase portanto da forma mais simplista e ingênua pois desconsidera as dimensões de tempo e espaço combinados ao mesmo tempo que estima a regressão pelo método dos Mínimos Quadrados Ordinários MQO Gujarati e Porter 2011 Desta forma em que corresponde à nésima unidade de corte transversal e o nésimo período de tempo Para executar este modelo de regressão é necessário utilizar a função plm juntamente com as variáveis dependente e independentes indicando a base de dados data e o tipo da regressão pooling coplotinvest yearfirm typeb dataGrunfeld Yit β1 β2X2it β3X3it uit i 1 2 3 4 t 1 2 20 i i t t 10102022 1342 Capítulo 6 Regressão com Dados em Painel Software R curso avançado httpssmolskigithubiolivroavancadoregressaocomdadosempainelhtmltestandoraizesunitarias 517 Pooling Model Call plmformula invest value capital data Grunfeld model pooling Balanced Panel n 4 T 20 N 80 Residuals Min 1st Qu Median 3rd Qu Max 31968 9995 196 6599 33621 Coefficients Estimate Std Error tvalue Prt Intercept 628318 297254 211 0038 value 01105 00138 802 92e12 capital 03005 00494 608 43e08 Signif codes 0 0001 001 005 01 1 Total Sum of Squares 6410000 Residual Sum of Squares 1570000 RSquared 0755 Adj RSquared 0748 Fstatistic 118424 on 2 and 77 DF pvalue 2e16 A estimação da regressão pooled averiguou alta significância estatística nas variáveis dependentes value e capital indicando sinal positivo para os coeficientes em consonância com a literatura bem como um valor de R alto Este tipo de modelo não faz diferenciação entre a influênciadiferença das empresas na variável investimento e nem se a resposta do investimento às variáveis explicativas é a mesma ao longo do tempo Isto faz regpooledplminvestvaluecapital dataGrunfeld modelpooling summaryregpooled 2 10102022 1342 Capítulo 6 Regressão com Dados em Painel Software R curso avançado httpssmolskigithubiolivroavancadoregressaocomdadosempainelhtmltestandoraizesunitarias 617 com que não se saiba se existe heterogeneidade entre as empresas A comparação do modelo pooled com as regressões de efeitos fixos e efeitos aleatórios que serão estimados na sequência servirá mostrar ao pesquisador qual é o melhor modelo dentre eles 63 Modelo Efeitos Fixos O modelo de regressão com efeitos fixos considera como visto anteriormente que os valores dos interceptos para cada regressão variam de acordo com o efeito de cada indivíduo firma e que os coeficientes de declividade das variáveis independentes value e capital para cada equação são os mesmos para cada empresa conforme equação abaixo em que painel balanceado Desta forma o intercepto da equação é diferente para cada empresa mas o efeito das variáveis independentes é o mesmo sobre a variável independente Isto indica que existe características especiais em cada empresa influenciando o investimento como por exemplo o estilo de gestão Gujarati e Porter 2011 Abaixo é montada a regressão de efeitos fixos αi investit value1it capital2it αi εit i 1 4 t 1 20 regefplminvestvaluecapital dataGrunfeld modelwithin summaryregef 10102022 1342 Capítulo 6 Regressão com Dados em Painel Software R curso avançado httpssmolskigithubiolivroavancadoregressaocomdadosempainelhtmltestandoraizesunitarias 717 Oneway individual effect Within Model Call plmformula invest value capital data Grunfeld model within Balanced Panel n 4 T 20 N 80 Residuals Min 1st Qu Median 3rd Qu Max 18466 4826 933 4055 19767 Coefficients Estimate Std Error tvalue Prt value 01084 00176 617 33e08 capital 03451 00267 1292 2e16 Signif codes 0 0001 001 005 01 1 Total Sum of Squares 2170000 Residual Sum of Squares 422000 RSquared 0806 Adj RSquared 0792 Fstatistic 153291 on 2 and 74 DF pvalue 2e16 Notase que o impacto do valor da empresa value e do capital capital é positivo sobre o investimento invest para todas as empresas como visto acima Inclusive há significância estatística para estas variáveis No entanto ainda resta definir o efeito dos interceptos de cada empresa como segue summaryfixefregef 10102022 1342 Capítulo 6 Regressão com Dados em Painel Software R curso avançado httpssmolskigithubiolivroavancadoregressaocomdadosempainelhtmltestandoraizesunitarias 817 Estimate Std Error tvalue Prt General Motors 855 735 116 02483 US Steel 950 367 259 00115 General Electric 2462 359 685 19e09 Westinghouse 594 202 294 00044 Signif codes 0 0001 001 005 01 1 Com este resultado é possível observar que o efeito das firmas sobre o investimento parece ser diferente para cada indivíduo Desta forma somente a empresa US Steel consta com efeito positivo sobre o investimento Por outo lado a fórmula da regressão é apresentada de maneira diversa por exemplo para a regressão considerando a General Motors considerando a firma US Steel e assim por diante Outra forma de visualizar a equação de efeitos fixos é utilizando a função lm para definir a regressão definindo a variável firm como um fator invest 85 515 0 108400value 0 345058capital invest 94988 0 108400value 0 345058capital summarylminvestvaluecapitalasfactorfirm dataGrunfeld 10102022 1342 Capítulo 6 Regressão com Dados em Painel Software R curso avançado httpssmolskigithubiolivroavancadoregressaocomdadosempainelhtmltestandoraizesunitarias 917 Call lmformula invest value capital asfactorfirm data Grunfeld Residuals Min 1Q Median 3Q Max 18466 4826 933 4055 19767 Coefficients Estimate Std Error t value Prt Intercept 855153 734898 116 024831 value 01084 00176 617 33e08 capital 03451 00267 1292 2e16 asfactorfirmUS Steel 1805029 457168 395 000018 asfactorfirmGeneral Electric 1607122 466224 345 000094 asfactorfirmWestinghouse 261296 649435 040 068859 Signif codes 0 0001 001 005 01 1 Residual standard error 755 on 74 degrees of freedom Multiple Rsquared 0934 Adjusted Rsquared 093 Fstatistic 210 on 5 and 74 DF pvalue 2e16 Note que o intercepto definido 8551533 referese à presença da empresa General Motors Caso seja evidenciada a presença da empresa US Steel o valor do intercepto passa para 94988 8551533 18050295 a mesma lógica vale para as demais empresas 64 Modelo Efeitos Aleatórios No modelo de regressão com efeitos aleatórios os efeitos individuais das firmas firms são considerados variáveis aleatórias ao contrário do modelo visto anteriormente Desta forma onde é variável aleatória com valor médio e o intercepto para a empresa individual é dado por Gujarati e Porter 2011 Y1i β1i β2X2it β3X3it uit β1i β1 β1i β1 εi i 1 2 N 10102022 1342 Capítulo 6 Regressão com Dados em Painel Software R curso avançado httpssmolskigithubiolivroavancadoregressaocomdadosempainelhtmltestandoraizesunitarias 1017 em que é um termo de erro de média zero e variânvia Assim as empresas possuem um valor médio para o intercepto sendo que as diferenças refletem o termo de erro Obtêmse O erro composto é formado por elemento de corte transversal dos indivíduos e que é o elemento da série temporal e do corte transversal Gujarati e Porter 2011 Desta forma assumese que os erros individuais não estão correlacionados entre si e também não estão correlacionados entre aquelas unidades de corte transversal e das séries temporais A montagem deste tipo de regressão é feita através da função plm incluindo como modelo random e como método walhus como segue εi σ2ε β1 εi Yit β1 β2X2it β3X3it wit wit εi uit wit εi uit regeaplminvestvaluecapital dataGrunfeld modelrandom randommethod walhus summaryregea 10102022 1342 Capítulo 6 Regressão com Dados em Painel Software R curso avançado httpssmolskigithubiolivroavancadoregressaocomdadosempainelhtmltestandoraizesunitarias 1117 Oneway individual effect Random Effect Model WallaceHussains transformation Call plmformula invest value capital data Grunfeld model random randommethod walhus Balanced Panel n 4 T 20 N 80 Effects var stddev share idiosyncratic 57865 761 029 individual 138726 1178 071 theta 0857 Residuals Min 1st Qu Median 3rd Qu Max 19389 4617 135 4198 19811 Coefficients Estimate Std Error zvalue Prz Intercept 726322 689083 105 029 value 01079 00167 648 93e11 capital 03443 00269 1281 2e16 Signif codes 0 0001 001 005 01 1 Total Sum of Squares 2260000 Residual Sum of Squares 446000 RSquared 0802 Adj RSquared 0797 Chisq 312731 on 2 DF pvalue 2e16 Os resultados corroboram com a direção dos sinais para as variáveis dependentes value e capital ambos positivos Por outro lado os resultados do modelo de efeitos aleatórios trazem os valores sobre a variância dos erros primeiramente voltado ao componente de corte 10102022 1342 Capítulo 6 Regressão com Dados em Painel Software R curso avançado httpssmolskigithubiolivroavancadoregressaocomdadosempainelhtmltestandoraizesunitarias 1217 transversal específico dos indivíduos denominado individual e outro fator idissiossincrático o qual varia com o tempo e também com o corte transversal denominado idiosyncratic 65 Comparação e escolha dos modelos Após a evidenciação dos modelos de regressão dos tipos agrupado pooled de efeitos fixos e de efeitos aleatórios é preciso efetuar os testes para definir qual é o melhor modelo e que por consequência deverá ser considerado Modelo Pooled x Modelo de Efeitos Fixos Inicialmente comparase o modelo Pooled com a regressão de Efeitos Fixos within Para isto utilizase o Teste F ou teste F de Chow A hipótese nula é de que há igualdade nos interceptos e nas inclinações para todos os indivíduos caracterizando o modelo de dados agrupados pooled A função utilizada é pFtest do pacote plm F test for individual effects data invest value capital F 67 df1 3 df2 74 pvalue 2e16 alternative hypothesis significant effects Como o valor p é inferior a 005 o modelo de Efeitos Fixos é melhor do que o modelo Pooled Modelo Pooled x Modelo de Efeitos Aleatórios O teste desenvolvido por Breusch e Pagan 1980 compara as estimativas entre os modelos verificando se sendo que Desta forma a aceitação da hipótese nula implica que o modelo de dados agrupados pooled é preferível A função plmtest efetua este teste requireplm pFtestregefregpooled σ2α 0 H0 σ2α 0 H1 σ2α 0 10102022 1342 Capítulo 6 Regressão com Dados em Painel Software R curso avançado httpssmolskigithubiolivroavancadoregressaocomdadosempainelhtmltestandoraizesunitarias 1317 Lagrange Multiplier Test BreuschPagan for balanced panels data invest value capital chisq 380 df 1 pvalue 2e16 alternative hypothesis significant effects Como o p valor foi inferior a 005 o modelo de Efeitos Aleatórios é superior ao modelo Pooled Modelo Efeitos Fixos x Modelo de Efeitos Aleatórios O teste de Hausmann Hausman 1978 efetua a especificação dos modelos de Efeito Fixo e de Efeitos Aleatórios sendo que se o teste rejeitar a hipótese nula o modelo de Efeitos Fixos é o mais adequado A função a ser utilizada para este teste é phtest Hausman Test data invest value capital chisq 0075 df 2 pvalue 1 alternative hypothesis one model is inconsistent Como o valor p foi superior a 005 o modelo de Efeitos Aleatórios foi considerado superior ao modelo de Efeitos Fixos 66 Alguns testes para os modelos plmtestregpooled typebp H0 αi não são correlacionados com Xit H1 αi são correlacionados com Xit phtestregefregea 10102022 1342 Capítulo 6 Regressão com Dados em Painel Software R curso avançado httpssmolskigithubiolivroavancadoregressaocomdadosempainelhtmltestandoraizesunitarias 1417 661 Testando dependência transversal crosssectional A dependência crosssectional se apresenta em panieis com longas séries de tempo A hipótese nula é de que os resíduos através dos indivíduos não estão correlacionados Como resultado nossa regressão aceita a hipótese nula do teste de Pesaran 2015 Pesaran CD test for crosssectional dependence in panels data invest value capital z 031 pvalue 08 alternative hypothesis crosssectional dependence 662 Normalidade dos resíduos Segue o já conhecido teste para verificar a normalidade dos resíduos Como resultado foi aprovada a hipótese nula H de normalidade nos resíduos da regressão ShapiroWilk normality test data regearesiduals W 099 pvalue 09 663 Homocedasticidade dos resíduos Abaixo o teste para homocedasticidade variância constante dos resíduos de BreuschPagan 1979 pcdtestregea testcd 0 shapirotestregearesiduals 10102022 1342 Capítulo 6 Regressão com Dados em Painel Software R curso avançado httpssmolskigithubiolivroavancadoregressaocomdadosempainelhtmltestandoraizesunitarias 1517 studentized BreuschPagan test data regea BP 76 df 2 pvalue 002 Como a hipótese nula é a de que não há homocedasticidade nos resíduos e o pvalue foi inferior a 005 há problemas nos resíduos da regressão portanto as veriáveis apresentam problemas de heterocedasticidade Algumas soluções são possíveis como a transformação das variáveis 664 Testando correlação serial A hipótese nula do teste de correlação serial do teste BreuschGodfreyWooldridge Breusch 1978 é a de que não se encontra esta característica na série Abaixo o resultado do teste sendo que aprovou a hipótese nula ou seja não há problemas de correlação serial nos dados pois o pvalue é superior a 005 BreuschGodfreyWooldridge test for serial correlation in panel models data invest value capital chisq 26 df 20 pvalue 02 alternative hypothesis serial correlation in idiosyncratic errors 665 Teste para efeitos individuais ou de tempo librarylmtest bptestregea teste BreuschGodfreyWooldridge EFEITOS ALEATÓRIOS pbgtestregea 10102022 1342 Capítulo 6 Regressão com Dados em Painel Software R curso avançado httpssmolskigithubiolivroavancadoregressaocomdadosempainelhtmltestandoraizesunitarias 1617 Pode ser efetuado o teste para verificar a presença de efeitos não observados de tempo ou individuais nos modelos de dados em painel Wooldridge 2010 A hipótse nula é a não correlação entre os erros do mesmo grupo Observase que para o efeito tempo time há aceitação da hipótese alternativa mostrando a correlação entre erros ao contrário do efeito individual Wooldridges test for unobserved individual effects data formula z 14 pvalue 02 alternative hypothesis unobserved effect Wooldridges test for unobserved time effects data formula z 32 pvalue 0001 alternative hypothesis unobserved effect 666 Testando raízes unitárias O teste de DickeyFuller prova se a série é estocástica sendo que a hipótese nula é de que a série possui raiz unitária nãoestacionaridade Abaixo o resultado do teste sendo que observouse que a série é não estacionária ou seja tem problemas para a regressão pois o pvalue aprovou a hipótese nula Desta forma algumas saídas são possíveis como a transformação da série ou mesmo a utilização da primeira diferença da série teste Wooldridge POOLED pwtestregpooled pwtestregpooled effect time requiretseries 10102022 1342 Capítulo 6 Regressão com Dados em Painel Software R curso avançado httpssmolskigithubiolivroavancadoregressaocomdadosempainelhtmltestandoraizesunitarias 1717 Carregando pacotes exigidos tseries Augmented DickeyFuller Test data Grunfeldinvest DickeyFuller 34 Lag order 2 pvalue 007 alternative hypothesis stationary Referências Breusch Trevor S 1978 Testing for autocorrelation in dynamic linear models Australian Economic Papers 17 31 33455 Breusch Trevor S e Adrian R Pagan 1979 A simple test for heteroscedasticity and random coefficient variation Econometrica Journal of the Econometric Society 128794 Breusch Trevor Stanley e Adrian Rodney Pagan 1980 The Lagrange multiplier test and its applications to model specification in econometrics The Review of Economic Studies 47 1 23953 Gujarati Damodar N e Down C Porter 2011 Econometria básica 5a ed New York Mc Graw Hill httpsdoiorg101126science1186874 Hausman Jerry A 1978 Specification tests in econometrics Econometrica Journal of the econometric society 125171 Pesaran M Hashem 2015 Testing weak crosssectional dependence in large panels Econometric Reviews 34 610 10891117 Wooldridge Jeffrey M 2010 Econometric analysis of cross section and panel data MIT Press adftestGrunfeldinvest k2