·

Ciências Econômicas ·

Econometria

Send your question to AI and receive an answer instantly

Ask Question

Preview text

e Damodar N Gujarati Dawn C Porter Q u i n t a e d i ç ã o ECONOMETRIA BÁSICA Livrotexto referência na área adotado em cursos de graduação e de pósgraduação Econometria Básica chega à sua quinta edição revisado e atualizado A obra analisa os fundamentos deste tema complexo e faz um relato das suas abordagens mais recentes Gujarati e Porter trabalham álgebra matricial cálculo e estatística de forma mais didática e acessível do que outros livros da área Além disso os diversos estudos de caso apresentados auxiliam no entendimento e na aplicação dos conteúdos Privilegiando o ensino da econometria com ênfase em interpretação intuitiva a obra é essencial tanto para quem está iniciando no tema quanto para os já conhecedores sendo ferramenta indispensável para compreensão e aplicação dos conceitos da área Destaques Mais de 100 novos exercícios baseados em informações atuais permitem a aplicação do conteúdo ao cotidiano Resultados detalhados dos programas EViews STATA e MINITAB atestam a parte teórica Uma aprendizagem enriquecedora é obtida por meio de exercícios de classe diferenciados estimulando assim o uso da pesquisa Um capítulo revisado sobre modelos de regressão de painel de dados guia o aluno neste importante conceito O design diferenciado ressalta as informações de diagramas e gráficos Livrotexto para as disciplinas de econometria análise de regressão métodos quantitativos em economia e similares nos cursos de graduação e pósgraduação em economia administração e ciências contábeis e atuariais ECONOMETRIA BÁSICA Q u i n t a e d i ç ã o Damodar N Gujarati Dawn C Porter ECONOMETRIA BÁSICA Damodar N Gujarati Dawn C Porter Visite a área do professor no site wwwbookmancombr para acessar material exclusivo em inglês deste livro Q u i n t a e d i ç ã o ECONOMIA a b 93575 Econometria Básicaindd 1 1422011 135621 puTORI24 5 q f A ZEN F3 i re ASSOCIACAO BRASILEIRA DE DIRETTIOS REPROGRAFICOS SS pert EDITORA AFILIADA e e e e f geet 7 E GE 8 t Se S GZ f 69 6666 I EH ee eo TMS cee ee eG ge ee Baye mr ye Damodar N Gujarati Professor Emérito de Economia United States Military Academy West Point Dawn C Porter University of Southern California Tradução Denise Durante Mônica Rosemberg Maria Lúcia G L Rosa Revisão Técnica Claudio D Shikida Doutor em Economia pelo PPGEUFRGS professor do IBMECMG Ari Francisco de Araújo Júnior Mestre em Economia pela UFMG professor do IBMECMG Márcio Antônio Salvato Doutor em Economia pela FGVRJ professor do IBMECMG Versão impressa desta obra 2011 Econometria Básica Quinta Edição 2011 Obra originalmente publicada sob o título Basic Econometrics 5th edition ISBN 00733757729780073375779 2008 The McGrawHill Companies Inc New York NY EUA Editora sênior Luciana Salgado Guimarães Moreira Editora assistente Luciana Cruz Assistente editorial César Crivelaro Preparação do original Mônica de Aguiar Rocha Capa Triall Composição Editorial Ltda arte sobre capa original Diagramação Triall Composição Editorial Ltda Reservados todos os direitos de publicação em língua portuguesa à AMGH Editora Ltda AMGH Editora é uma parceria entre Artmed Editora SA e McGrawHill Education Av Jerônimo de Ornelas 670 Santana 90040340 Porto Alegre RS Fone 51 30277000 Fax 51 30277070 É proibida a duplicação ou reprodução deste volume no todo ou em parte sob quaisquer formas ou por quaisquer meios eletrônico mecânico gravação fotocópia distribuição na Web e outros sem permissão expressa da Editora SÃO PAULO Av Embaixador Macedo Soares 10735 Pavilhão 5 Cond Espace Center Vila Anastácio 05095035 São Paulo SP Fone 11 36651100 Fax 11 36671333 SAC 0800 7033444 IMPRESSO NO BRASIL PRINTED IN BRAZIL v Para Joan Gujarati Diane GujaratiChesnut Charles Chesnut e meus netos Tommy e Laura Chesnut DNG Para Judy Lee Brett Bryan Amy e Autumn Porter Especialmente para meu amado pai Terry DCP ECONOBOOKindb 5 23112010 070909 Sobre os autores Damodar N Gujarati Após lecionar por mais de 25 anos na Universidade da Cidade de Nova York e 17 no Departa mento de Ciências Sociais da Academia Militar de West Point Nova York Gujarati atualmente é professor emérito de economia na Academia Graduouse na Universidade de Bombaim em 1960 concluiu o MBA na Universidade de Chicago em 1963 e o doutorado na Universidade de Chicago em 1965 Gujarati tem um extenso número de publicações em periódicos renomados nos Estados Unidos e internacionalmente como Review of Economics and Statistics Economic Journal Journal of Financial and Quantitative Analysis e Journal of Business Foi membro do Conselho de Editores do Journal of Quantitative Economics veículo oficial da Journal of the Indian Econometric Society Também é autor dos títulos Pensions and the New York City fiscal crisis American Enterprise Institute 1978 Government and business McGrawHill 1984 e Essentials of econometrics McGrawHill 3 ed 2006 Seus livros sobre econometria foram traduzidos para vários idiomas Gujarati foi professor visitante na Universidade de Sheffield Reino Unido 19701971 em Fulbright Índia 19811982 na Escola de Administração da Universidade Nacional de Cingapura 19851986 e professor visitante de Econometria na Universidade de New South Wales Austrália verão de 1988 Lecionou extensivamente tópicos sobre micro e macroeconomia em países como Austrália China Bangladesh Alemanha Índia Israel Ilhas Mauricio e Coreia do Sul Dawn C Porter Dawn Porter é professora assistente do Departamento de Gestão de Informação e Operações da Marshall School of Business na University of Southern California desde 2006 É professora de esta tística tanto no curso de graduação quanto no curso de MBA na escola de administração Antes de juntarse ao corpo docente da USC de 20012006 foi professora assistente da McDonough School of Business na Universidade de Georgetown e anteriormente foi professora visitante do Departamento de Psicologia da Graduate School of Arts and Sciences da Universidade de Nova York NYU Na NYU lecionou diversos cursos sobre métodos estatísticos avançados e foi professora da Stern School of Business onde obteve o doutorado em Estatística Suas áreas de interesse em pesquisa incluem análise categórica medidas de acordo modelagem multivariada e aplicações no campo da psicologia Sua pesquisa atual ex amina modelos de leilão online sob uma perspectiva estatística Apresentou sua pesquisa na Joint Statistical Meetings no Decision Sciences Institute no International Conference on Information Systems em diversas uni versidades incluindo a London School of Economics e a NYU assim como em vários seminários de ecommerce e estatística É também coautora do livro Essentials of business statistics 2 ed McGrawHill Irwin 2008 Fora do mundo acadêmico Dawn trabalha como consultora estatística para a KPMG Inc Atuou ainda como consultora para muitas outras grandes empresas como Ginnie Mae Inc Toys R Us Corporation IBM Cosmaire Inc e para o Centro Médico da NYU ECONOBOOKindb 6 23112010 070909 vii Agradecimentos Desde a publicação da primeira edição deste livro em 1978 recebemos valiosos conselhos co mentários críticas e sugestões de diversas pessoas Gostaríamos de agradecer em especial a ajuda re cebida de Michael McAleer da University of Western Australia Peter Kennedy da Simon Frazer University Canadá de Kenneth White da University of British Columbia George K Zestos da Christopher Newport University Virginia e de Paul Offner da Georgetown University Washington DC Também somos gratos àqueles que nos influenciaram por sua erudição Gostaríamos de agradecer especialmente a Arthur Goldberger da University of Wisconsin William Greene da New York University e ao falecido G S Maddala Continuamos gratos aos seguintes revisores que ofereceram suas inestimáveis percepções críticas e sugestões nas edições anteriores deste texto Michael A Grove da University of Oregon Harumi Ito da Brown University Ham Kim da South Dakota University Phanindra V Wunnava do Middlebury College e Andrew Paizis da City University of New York Vários autores influenciaram a redação deste texto Em particular somos gratos aos seguintes Chandan Mukherjee diretor do Centro de Estudos do Desenvolvimento Trivandrum Índia Howard White e Marc Wuyts do Institute of Social Studies na Holanda Badi H Baltagi da Texas AM Uni versity B Bhaskara Rao da University of New South Wales Austrália R Carter Hill da Louisiana University William E Griffiths da University of New England George G Judge University of California Berkeley Mamo Verbeek do Centro de Estudos Econômicos da KU Leuven Jeffrey Wooldridge da Michigan State University Kerry Patterson da University of Reading Reino Unido Francis X Diebold da Wharton School University of Pennsylvania Wojciech W Charemza e Derek F Deadman da University of Leicester Reino Unido Gary Koop da University of Glasgow Diversos comentários e sugestões proporcionados pelos revisores da quarta edição trouxeram substanciais melhorias a esta edição Gostaríamos de agradecer a Valerie Bencivenga University of Texas Austin Andrew Economopoulos Ursinus College Eric Eide Brigham Young University Gary Ferrier University of Arkansas Fayetteville David Garman Tufts University David Harris Benedictine College Don Holley Boise State University George Jakubson Cornell University Bruce Johnson Centre College of Kentucky Duke Kao Syracuse University Gary Krueger Macalester College Subal Kumbhakar Binghamton University TaeHwy Lee University of California Riverside Solaiman Miah West Virginia State University Fabio Milani University of California Irvine Helen Naughton University of Oregon Solomon Smith Langston University Kay Strong Bowling Green State University Derek Tittle Georgia Institute of Technology Tiemen Woutersen Johns Hopkins University ECONOBOOKindb 7 23112010 070909 viii Agradecimentos Gostaríamos de agradecer ainda aos estudantes e professores de todo o mundo que não apenas utilizaram o livro mas entraram em contato conosco sobre vários aspectos de seu conteúdo Pelo seu apoio nos bastidores da McGrawHill agradecemos a Douglas Reiner Noelle Fox e a Anne Hilbert George F Watson o editor do texto que fez maravilhoso trabalho com um manuscrito longo e exigente Devo muito a ele Por fim mas não menos importante o dr Gujarati gostaria de agradecer a suas filhas Joan e Diane por seu constante apoio e incentivo na preparação desta e das edições anteriores Damodar N Gujarati Dawn C Porter ECONOBOOKindb 8 23112010 070909 ix Prefácio Objetivos do livro A primeira edição de Econometria básica foi publicada há 30 anos Ao longo desse período ocorreram avanços na teoria e na prática da econometria Em cada uma das edições subsequentes procurei incorporar os principais avanços nesta disciplina A quinta edição manteve essa tradição No entanto o que não mudou no decorrer desses anos foi minha firme convicção de que é possí vel ensinar econometria de maneira intuitiva e informativa sem recorrer à álgebra matricial ao cál culo ou à estatística em níveis além do elementar Alguns itens são inerentemente técnicos Nesses casos os incluí no apêndice apropriado ou indiquei fontes de referência Mesmo assim procurei simplificar a parte técnica para que o leitor possa desenvolver um entendimento intuitivo É uma surpresa agradável a longevidade deste livro bem como o fato de que é utilizado não apenas por estudantes de economia e administração mas por alunos e pesquisadores de várias outras disciplinas como ciências políticas relações internacionais agronomia e ciências da saúde Os estudan tes dessas áreas verão que o estudo expandido de vários tópicos e aplicações concretas é muito útil Nesta nova edição dei ainda mais atenção para a relevância e a propriedade dos dados reais usados no texto Na verdade acrescentei cerca de 15 exemplos ilustrativos e mais de 30 exer cícios de final de capítulo Além disso atualizei os dados de mais de 20 exemplos da edição anterior e de mais de 20 exercícios Embora esteja na oitava década de minha vida não perdi o amor pela econometria e continuo empenhando esforços para me manter atualizado nos avanços desta disciplina Para me auxiliar nesta empreitada é um prazer ter como coautor o dr Dawn Porter professor assistente de Estatística da Escola de Administração Marshall da University of Southern California em Los Angeles Ambos nos envolvemos profundamente na elaboração da quinta edição de Econometria básica Principais características da quinta edição Antes de discutir mudanças específicas nos diversos capítulos é importante ressaltar as seguintes características da nova edição 1 Praticamente todos os dados usados nos exemplos ilustrativos foram atualizados 2 Foram acrescentados diversos exemplos 3 Em vários capítulos incluímos exemplos finais estendidos que ilustram os diversos argumentos no texto 4 Incluíramse telas de computador de vários exemplos A maioria desses resultados baseiamse nos pacotes estatísticos EViews versão 6 e STATA versão 10 assim como MINITAB versão 15 5 Diversos diagramas e gráficos foram incluídos nos vários capítulos 6 Diversos exercícios de bancos de dados foram introduzidos nos vários capítulos 7 Dados de tamanho reduzido foram incluídos 8 Em alguns capítulos inserimos exercícios de classe em que os estudantes são encorajados a obter seus próprios dados e a implementar as várias técnicas discutidas no livro Algumas simulações Monte Carlo também foram incluídas ECONOBOOKindb 9 23112010 070909 x Prefácio Mudanças específicas da quinta edição Algumas mudanças específicas desta edição 1 As hipóteses que embasam o modelo clássico de regressão linear MCRL apresentadas no Capítulo 3 agora fazem uma distinção cuidadosa entre regressores fixos variáveis ex planatórias e regressores aleatórios Discutiremos a importância dessa distinção 2 O Apêndice do Capítulo 6 discute as propriedades dos logaritmos as transformações BoxCox e várias fórmulas de crescimento 3 O Capítulo 7 agora discute não só o impacto marginal de um regressor único sobre a variável dependente como também os impactos de mudanças simultâneas de todas as variáveis ex planatórias sobre a variável dependente Este capítulo também foi reorganizado utilizandose a mesma estrutura das hipóteses do Capítulo 3 4 O Capítulo 11 apresenta uma comparação entre os vários testes de heterocedasticidade 5 Há uma nova discussão do impacto de estruturas sobre a autocorrelação no Capítulo 12 6 Novos tópicos foram incluídos no Capítulo 13 dados ausentes termo de erro não normal e regressores estocásticos ou aleatórios 7 Um modelo de regressão não linear discutido no Capítulo 14 apresenta uma aplicação concreta da transformação BoxCox 8 O Capítulo 15 contém muitos exemplos novos que ilustram o uso dos modelos logit e probit em vários campos 9 O Capítulo 16 sobre modelos de regressão com dados em painel foi substancialmente revisto e ilustrado com várias aplicações 10 O Capítulo 17 agora examina extensamente o teste de causalidade de Sims e Granger 11 Séries temporais estacionárias e não estacionárias bem como alguns dos problemas associados aos testes de estacionariedade agora são extensamente abordadas no Capítulo 21 12 O capítulo 22 inclui uma discussão sobre por que eliminar as primeiras diferenças de uma série temporal com a finalidade de tornála estacionária pode não ser uma estratégia apropriada em algumas situações Além das mudanças específicas erros de conteúdo e ortografia das edições anteriores foram cor rigidos e a discussão sobre diversos tópicos em vários capítulos foi aprimorada Organização e opções A extensa cobertura desta edição propicia ao professor grande flexibilidade na escolha dos tópicos mais adequados aos alunos A seguir algumas sugestões para o uso do livro Curso de um semestre para não especialistas Apêndice A Capítulos de l a 9 e uma visão geral dos Capítulos 10 11 e 12 omitindo todas as demonstrações Curso de um semestre para estudantes de economia Apêndice A Capítulos l a 13 Curso de dois semestres para estudantes de economia Apêndices A B C Capítulos l a 22 Os Capítulos 14 e 16 podem ser opcionais Alguns dos apêndices técnicos podem ser omitidos Estudantes de mestrado e doutorado e pesquisadores Este livro é um manual de referência para os principais tópicos da econometria ECONOBOOKindb 10 23112010 070909 xi Sumário resumido PaRTe 1 Modelos de regressão com equação única 37 1 A natureza da análise de regressão 39 2 Análise de regressão com duas variáveis algumas ideias básicas 59 3 Modelo de regressão de duas variáveis o problema da estimação 78 4 Modelo clássico de regressão linear normal MCRLN 118 5 A regressão de duas variáveis estimação de intervalo e teste de hipóteses 128 6 Extensões do modelo de regressão linear de duas variáveis 165 7 Análise de regressão múltipla o problema da estimação 205 8 Análise da regressão múltipla o problema da inferência 246 9 Modelos de regressão com variáveis binárias dummies 288 PaRTe 2 Relaxamento das hipóteses do modelo clássico 325 10 Multicolinearidade o que acontece se os regressores estiverem correlacionados 329 11 Heterocedasticidade o que acontece se a variância do erro não é constante 370 12 Autocorrelação o que acontece se os termos de erro são correlacionados 415 13 Modelagem econométrica especificação de modelo e teste diagnóstico 466 PaRTe 3 Tópicos em econometria 521 14 Modelos de regressão não linear 523 15 Modelos de regressão de resposta qualitativa 538 16 Modelos de regressão com dados em painel 587 17 Modelos econométricos dinâmicos modelos autorregressivos e com defasagens distribuídas 614 PaRTe 4 Modelos de equações simultâneas e econometria de séries temporais 665 18 Modelos de equações simultâneas 667 19 O problema da identificação 683 20 Métodos de equações simultâneas 705 21 Econometria de séries temporais alguns conceitos básicos 731 22 Econometria de séries temporais previsão 767 aPêNDiCeS A Revisão de alguns conceitos estatísticos 796 B Rudimentos de álgebra matricial 834 C A abordagem matricial para o modelo de regressão linear 846 D Tabelas estatísticas 874 E Telas de resultado do EViews MINITAB Excel e STATA 891 F Dados econômicos na Internet 897 RefeRêNCiaS biblioGRáfiCaS 899 ECONOBOOKindb 11 23112010 070910 Introdução 25 i1 O que é econometria 25 i2 Por que uma disciplina separada 26 i3 A metodologia econométrica 26 1 Exposição da teoria ou hipótese 27 2 Especificação do modelo matemático da teoria 27 3 Especificação do modelo estatístico ou econométrico 28 4 Obtenção dos dados 28 5 Estimação dos parâmetros do modelo econométrico 29 6 Teste de hipóteses 31 7 Projeção ou previsão 31 8 Uso do modelo para fins de controle ou de política 32 Escolha do modelo 33 i4 Tipos de econometria 34 i5 Prérequisitos matemáticos e estatísticos 35 i6 O papel do computador 35 i7 Sugestões para leituras complementares 35 PaRTe 1 ModELos dE REgREssão CoM EquAção úNICA 37 CaPíTulo 1 A natureza da análise de regressão 39 11 Origem histórica do termo regressão 39 12 A interpretação moderna da regressão 39 Exemplos 39 13 Relações estatísticas versus determinísticas 42 14 Regressão versus causação 43 15 Regressão versus correlação 43 16 Terminologia e notação 44 17 Natureza e fonte dos dados para a análise econômica 45 Tipos de dados 45 As fontes de dados 48 A precisão dos dados 50 Uma nota sobre as escalas de medição das variáveis 51 Resumo e conclusões 51 Exercícios 52 CaPíTulo 2 Análise de regressão com duas variáveis algumas ideias básicas 59 21 Um exemplo hipotético 59 22 Conceito de função de regressão populacional FRP 62 23 O significado do termo linear 62 Linearidade nas variáveis 62 Linearidade nos parâmetros63 24 Especificação estocástica da FRP 64 25 O significado do termo erro estocástico 65 Sumário ECONOBOOKindb 12 23112010 070910 Sumário xiii 26 A função de regressão amostral FRA 66 27 Exemplos ilustrativos 69 Resumo e conclusões 71 Exercícios 71 CaPíTulo 3 Modelo de regressão de duas variáveis o problema da estimação 78 31 Método dos mínimos quadrados ordinários 78 32 O modelo clássico de regressão linear as hipóteses subjacentes ao método dos mínimos quadrados 84 Um comentário a respeito dessas hipóteses 90 33 Precisão ou erros padrão das estimativas de mínimos quadrados 91 34 Propriedades dos estimadores de mínimos quadrados o teorema de GaussMarkov 93 35 O coeficiente de determinação r 2 uma medida da qualidade do ajustamento 95 36 Um exemplo numérico 100 37 Exemplos ilustrativos 102 38 Uma nota sobre os experimentos de Monte Carlo 104 Resumo e conclusões 105 Exercícios 106 Apêndice 3A 112 3a1 Derivação dos estimadores de mínimos quadrados 112 3a2 Propriedades de linearidade e não tendenciosidade dos estimadores de mínimos quadrados 112 3a3 Variâncias e erros padrão dos estimadores de mínimos quadrados 113 3a4 Covariância entre ØO1 e ØO2 114 3a5 Estimador de mínimos quadrados de æ 2 114 3a6 Propriedade da variância mínima dos estimadores de mínimos quadrados 115 3a7 Consistência dos estimadores de mínimos quadrados 116 CaPíTulo 4 Modelo clássico de regressão linear normal MCRLN 118 41 A distribuição de probabilidade dos termos de erro ui 118 42 A hipótese de normalidade de ui 119 Por que utilizamos a hipótese de normalidade 119 43 Propriedades dos estimadores de MQO sob a hipótese de normalidade 120 44 O método da máxima verossimilhança MV 122 Resumo e conclusões 123 Apêndice 4A 124 4a1 Estimação de máxima verossimilhança de um modelo de regressão com duas variáveis 124 4a2 Estimação de máxima verossimilhança das despesas com alimentação na Índia 126 CaPíTulo 5 A regressão de duas variáveis estimação de intervalo e teste de hipóteses 128 51 Prérequisitos estatísticos 128 52 Estimativa de intervalo algumas ideias básicas 128 53 Intervalos de confiança para os coeficientes Ø1 e Ø2 da regressão130 Intervalo de confiança para Ø2 130 Intervalos de confiança simultâneos para Ø1 e Ø2 132 54 Intervalo de confiança para æ2 132 55 Teste de hipóteses comentários gerais 133 56 Teste de hipóteses a abordagem do intervalo de confiança 134 Teste bilateral ou bicaudal 134 Teste unilateral ou unicaudal 135 57 Teste de hipóteses a abordagem do teste de significância 135 Teste de significância dos coeficientes de regressão o teste t 135 Teste de significância para æ2 o teste de quiquadrado 2 138 ECONOBOOKindb 13 23112010 070910 xiv Sumário 58 Teste de hipóteses alguns aspectos práticos 139 O sentido de aceitar ou rejeitar uma hipótese 139 A hipótese nula zero e a regra prática 2t 139 Elaboração das hipóteses nula e alternativa 140 Escolhendo Æ o nível de significância 141 O nível de significância exato o valor p 142 Significância estatística versus significância prática 142 A escolha entre as abordagens do intervalo de confiança e do teste de significância no teste de hipóteses 143 59 Análise de regressão e análise de variância 144 510 Aplicação da análise de regressão o problema da previsão 145 Previsão média 146 Previsão individual 147 511 A apresentação dos resultados da análise de regressão 148 512 Avaliando os resultados da análise de regressão 149 Testes de normalidade 149 Resumo e conclusões 152 Exercícios 153 Apêndice 5A 161 5a1 Distribuições de probabilidade relacionadas à distribuição normal 161 5a2 Derivação da equação 532 162 5a3 Derivação da equação 591 163 5a4 Derivação das equações 5102 e 5106 163 Variância da previsão média 163 Variância da previsão individual164 CaPíTulo 6 Extensões do modelo de regressão linear de duas variáveis 165 61 A regressão que passa pela origem 165 Cálculo do r 2 para modelos que passam pela origem 168 62 Escalas e unidades de medida 172 Uma palavra sobre a interpretação 175 63 Regressão com variáveis padronizadas 175 64 Formas funcionais dos modelos de regressão 176 65 Como medir a elasticidade o modelo loglinear 177 66 Modelos semilogarítmicos loglin e linlog 179 Como medir a taxa de crescimento o modelo loglin 179 O modelo linlog 182 67 Modelos recíprocos 183 Modelo da hipérbole logarítmica ou modelo recíproco logarítmico 189 68 A escolha da forma funcional 189 69 Um comentário sobre a natureza do termo de erro estocásticotermo aditivo versus termo multiplicativo 190 Resumo e conclusões 191 Exercícios 192 Apêndice 6A 198 6a1 Derivação de estimadores de mínimos quadrados para regressões que passam pela origem 198 6a2 Demonstração de que uma variável padronizada tem média zero e variância igual a um 200 6a3 Logaritmos 200 6a4 Fórmulas de taxa de crescimento 202 6a5 O modelo de regressão BoxCox 203 CaPíTulo 7 Análise de regressão múltipla o problema da estimação 205 71 O modelo de três variáveis notação e hipóteses 205 72 Interpretação da equação de regressão múltipla 207 73 O significado dos coeficientes parciais de regressão 207 ECONOBOOKindb 14 23112010 070910 Sumário xv 74 Estimação dos coeficientes parciais de regressão por meio dos métodos de mínimos quadrados ordinários e de máxima verossimilhança 209 Estimadores de MQO 209 Variâncias e erros padrão dos estimadores de MQO 210 Propriedades dos estimadores de MQO 211 Estimadores de máxima verossimilhança 212 75 O coeficiente de determinação múltiplo R2 e o coeficiente de correlação múltiplo R 213 76 Exemplo ilustrativo214 Regressão com variáveis padronizadas 215 Impacto sobre a variável dependente da variação de uma unidade em mais de um regressor 215 77 Regressão simples no contexto da regressão múltipla uma introdução ao viés de especificação 216 78 R2 e R2 ajustado 217 Comparação de dois valores de R2 218 Distribuição de R2 entre os regressores 221 O jogo da maximização de R 2 221 79 A função de produção CobbDouglas mais sobre formas funcionais 222 710 Modelos de regressão polinomial 225 711 Coeficientes de correlação parcial 228 Explicação de coeficientes de correlação simples e parcial 228 Interpretação dos coeficientes de correlação simples e parcial229 Resumo e conclusões 230 Exercícios 230 Apêndice 7A 241 7a1 Derivação dos estimadores de MQO dados nas Equações 743 a 745 241 7a2 Igualdade dos coeficientes de PNBpc em 735 e 762 242 7a3 Derivação da Equação 7419 243 7a4 Estimação de máxima verossimilhança do modelo de regressão múltipla 243 7a5 Tela do resultado do EViews para a função de produção CobbDouglas 794 244 CaPíTulo 8 Análise da regressão múltipla o problema da inferência 246 81 Novamente a hipótese da normalidade 246 82 Teste de hipóteses na regressão múltipla comentários gerais 247 83 Testes de hipótese relativos aos coeficientes individuais de regressão 248 84 Teste da significância geral da regressão amostral 250 A abordagem da análise de variância para teste de significância geral de uma regressão múltipla observada o teste F 251 Verificação da significância geral de uma regressão múltipla o teste F 253 Uma relação importante entre R2 e F 254 Teste de significância geral em termos de R2 para uma regressão múltipla 255 A contribuição incremental ou marginal de uma variável explanatória 256 85 Teste da igualdade para dois coeficientes de regressão 259 86 Mínimos quadrados restritos teste de restrições de igualdade linear 261 A abordagem do teste t 261 A abordagem do teste F mínimos quadrados restritos262 Teste F geral 264 87 Teste da estabilidade estrutural ou dos parâmetros nos modelos de regressão o teste de Chow 266 88 Previsão com regressão múltipla 271 89 A trinca dos testes de hipótese a razão de verossimilhança RV o teste de Wald W e o multiplicador de Lagrange ML 271 810 Teste da forma funcional da regressão escolha entre modelos de regressão lineares e loglineares 272 Resumo e conclusões 274 Exercícios 274 Apêndice 8A Teste da razão de verossimilhança RV 286 ECONOBOOKindb 15 23112010 070911 xvi Sumário CaPíTulo 9 Modelos de regressão com variáveis binárias dummies 288 91 A natureza das variáveis dummies 288 92 Modelos ANOVA 289 Advertência quanto ao uso de variáveis dummies 292 93 Modelos ANOVA com duas variáveis qualitativas 293 94 Regressão com uma mistura de regressores quantitativos e qualitativos os modelos ANCOVA 294 95 A Variável binária alternativa ao teste de Chow 296 96 Efeitos de interação usando variáveis dummies 299 97 O uso de variáveis dummies na análise sazonal 300 98 Regressão linear segmentada 305 99 Modelos de regressão com dados em painel 307 910 Alguns aspectos técnicos do modelo de variáveis dummies 307 A interpretação de variáveis dummies em regressões semilogarítmicas 307 Variáveis dummies e heterocedasticidade 308 Variáveis binárias e autocorrelação 309 O que acontece se a variável dependente for uma variável dummy 309 911 Tópicos para estudos avançados 309 912 Um exemplo para concluir 310 Resumo e conclusões 314 Exercícios 314 Apêndice 9A Regressão semilogarítimica com regressor binário 323 PaRTe 2 RELAxAMENto dAs hIpótEsEs do ModELo CLássICo 325 CaPíTulo 10 Multicolinearidade o que acontece se os regressores estiverem correlacionados 329 101 A natureza da multicolinearidade 330 102 Estimação na presença de multicolinearidade perfeita 332 103 Estimação na presença de multicolinearidade alta mas imperfeita 334 104 Multicolinearidade muito barulho por nadaConsequências teóricas da multicolinearidade 334 105 Consequências práticas da multicolinearidade 336 Grandes variâncias e covariâncias dos estimadores de MQO 336 Intervalos de confiança mais amplos 338 Razões t insignificantes 338 Alto valor de R2 mas poucas razões t significativas 339 Sensibilidade dos estimadores de MQO e de seus erros padrão a pequenas alterações nos dados 339 Consequências da micronumerosidade 340 106 Um exemplo ilustrativo 341 107 Detecção da multicolinearidade 345 108 Medidas corretivas 349 Não fazer nada 349 Procedimentos 349 109 A multicolinearidade é um mal necessário Talvez não se o objetivo for apenas a previsão 353 1010 Um exemplo ampliado os dados de Longley 354 Resumo e conclusões 357 Exercícios 358 CaPíTulo 11 heterocedasticidade o que acontece se a variância do erro não é constante 370 111 A natureza da heterocedasticidade 370 112 Estimativa dos MQO na presença da heterocedasticidade 375 ECONOBOOKindb 16 23112010 070911 Sumário xvii 113 O método dos mínimos quadrados generalizados MQG 376 Diferença entre os MQO e os MQG 378 114 Consequências de usar MQO na presença de heterocedasticidade 379 Estimação de MQO admitindose a heterocedasticidade 379 Estimação de MQO desconsiderando a heterocedasticidade 379 Uma nota técnica380 115 Detecção da heterocedasticidade 380 Métodos informais 381 Métodos formais 383 Teste de correlação por ordem de Spearman 385 Teste geral de heterocedasticidade de White 391 116 Medidas corretivas 393 Quando Íi2 é conhecido o método de mínimos quadrados ponderados 393 Quando Íi2 não é conhecido 394 117 Exemplos finais399 118 Uma advertência sobre reações exageradas à heterocedasticidade 403 Resumo e conclusões 404 Exercícios 404 Apêndice 11A 412 11a1 Prova da Equação 1122 412 11a2 O método de mínimos quadrados ponderados 412 11a3 Prova que E Í2 Í2 na presença de heterocedasticidade 413 11a4 Erros padrão robustos de White 414 CaPíTulo 12 Autocorrelação o que acontece se os termos de erro são correlacionados 415 121 A natureza do problema 416 122 Estimativa de MQO na presença de autocorrelação 421 123 O estimador BLUE na presença de autocorrelação 424 124 Consequências do uso dos MQO na presença de autocorrelação 425 Estimação por meio de MQO considerando a autocorrelação 425 Estimação por meio de MQO não considerando a autocorrelação 425 125 Relação entre salários e produtividade no setor empresarial dos Estados Unidos 19602005 429 126 Detecção de autocorrelação 431 I Método gráfico 431 II O teste das carreiras 433 III O teste d de DurbinWatson 435 IV Um teste geral de autocorrelação o teste de BreuschGodfrey BG 439 Por que tantos testes de autocorrelação 441 127 O que fazer ao depararse com a autocorrelação medidas corretivas 441 128 Especificação equivocada do modelo versus autocorrelação pura 442 129 Correção da autocorrelação pura o método dos mínimos quadrados generalizados MQG 442 Quando Ω é conhecido 443 Quando Ω não é conhecido 443 1210 O método de NeweyWest para corrigir os erros padrão do MQO 448 1211 MQO versus MQGF e CHA 448 1212 Aspectos adicionais da autocorrelação 449 Variáveis binárias e autocorrelação 449 Modelos ARCH e GARCH 450 Coexistência de autocorrelação e heterocedasticidade 450 1213 Exemplo conclusivo 450 Resumo e conclusões 452 Exercícios 453 Apêndice 12A 465 12a1 Prova de que o erro no termo vt na equação 12111 está autocorrelacionado 465 12a2 Prova das equações 1223 1224 e 1225 465 ECONOBOOKindb 17 23112010 070911 xviii Sumário CaPíTulo 13 Modelagem econométrica especificação de modelo e teste diagnóstico 466 131 Critérios de seleção de modelos 467 132 Tipos de erros de especificação 467 133 Consequências dos modelos com erros de especificação 469 Omissão de uma variável relevante subespecificação 469 Inclusão de uma variável irrelevante sobreespecificação 472 134 Testes dos erros de especificação 473 Detectando a presença de variáveis desnecessárias 473 Testes para omissão de variáveis e forma funcional incorreta 475 135 Erros de medida 481 Erros de medida da variável dependente Y 481 Erros de medida na variável explanatória X 482 136 Especificação incorreta do termo de erro estocástico 485 137 Modelos aninhados nested versus não aninhados nonnested 485 138 Testes de hipóteses não aninhados nonnested 486 A abordagem discriminatória 486 A abordagem discernente 486 139 Critérios para seleção de modelos 491 O critério R2 491 R2 ajustado 492 Critério de informação de Akaike CIA 492 Critério de informação de Schwarz CIS 492 O critério Cp de Mallows 493 Uma advertência sobre os critérios de seleção de modelos 494 Previsão quiquadrado 2 494 1310 Tópicos adicionais sobre modelagem econométrica 494 Dados discrepantes alavancagem e influência 494 Mínimos quadrados recursivos 496 Teste de falhas de previsão de Chow 497 Dados faltantes 497 1311 Exemplos conclusivos 498 1 Um modelo para determinação de salário por hora 498 2 Função de consumo real para os Estados Unidos 19472000 503 1312 Erros não normais e regressores estocásticos 507 1 O que acontece se o termo de erro não tem distribuição normal 507 2 Variáveis explanatórias estocásticas 508 1313 Uma palavra ao pesquisador 509 Resumo e conclusões 509 Exercícios 510 Apêndice 13A 517 13a1 A prova de que Eb1 2 D Ø2 C Ø3 b3 2 517 13a2 Consequências de incluir uma variável irrelevante a propriedade de não tendenciosidade 517 13a3 A prova da equação 13510 518 13a4 A prova da equação 1362 519 PaRTe 3 tópICos EM ECoNoMEtRIA 521 CaPíTulo 14 Modelos de regressão não linear 523 141 Modelos de regressão intrinsecamente linear e não linear 523 142 Estimação dos modelos de regressão linear e não linear 524 143 Estimação de modelos de regressão não linear o método da tentativa e erro 525 ECONOBOOKindb 18 23112010 070911 Sumário xix 144 Abordagens para estimar modelos de regressão não linear MRNL 527 Método da busca direta ou da tentativa e erro ou método livre de derivada527 Otimização direta 527 Método da linearização iterativa 527 145 Exemplos ilustrativos 528 Resumo e conclusões 532 Exercícios 510 Apêndice 14A 534 14a1 Derivação de equações 1424 e 1425 534 14a2 O método de linearização 535 14a3 Aproximação linear à função exponencial dada em 1422 536 CaPíTulo 15 Modelos de regressão de resposta qualitativa 538 151 A natureza dos modelos de resposta qualitativa 538 152 O modelo de probabilidade linear MPL 540 Ausência de normalidade dos termos de erro ui 541 Variâncias heterocedásticas dos termos de erro 541 Impossibilidade de satisfazer 0 EYi Xi 1 542 O valor de R2 como medida de qualidade do ajustamento é questionável 542 153 Aplicações do modelo de probabilidade linear MPL 545 154 Alternativas ao MPL 549 155 O modelo logit 550 156 Estimação do modelo logit 552 Dados individuais 553 Dados agrupados ou replicados 553 157 O modelo logit agrupado Glogit um exemplo numérico 555 Interpretação do modelo logit estimado 555 158 O modelo logit para dados não agrupados ou individuais 558 159 O modelo probit 563 Estimação do probit com dados agrupados gprobit 564 O modelo probit para dados não agrupados ou individuais 567 O efeito marginal de uma variação unitária no valor de um regressor nos vários modelos de regressão 567 1510 Modelos logit e probit568 1511 O modelo tobit 570 Ilustração do modelo tobit o modelo de Ray Fair de casos extraconjugais 572 1512 Modelagem de dados contáveis o modelo de regressão de Poisson 573 1513 Outros tópicos sobre modelos de escolha qualitativa 576 Modelos logit e probit ordinais 576 Modelos logit e probit multinomiais 576 Modelos de duração 577 Resumo e conclusões 609 Exercícios 578 Apêndice 15A 585 15a1 Estimativa da máxima verossimilhança dos modelos logit e probit para dados individuais não agrupados 585 CaPíTulo 16 Modelos de regressão com dados em painel 587 161 Por que dados em painel 588 162 Dados em painel um exemplo ilustrativo 589 163 Modelo de regressão MQO para dados empilhados ou modelo de coeficientes constantes 590 164 O modelo de mínimos quadrados com variáveis dummy para efeitos fixos MQVD 592 Uma advertência quanto ao uso do modelo de efeitos fixos 594 165 O estimador de efeito fixo dentro do grupo DG 595 ECONOBOOKindb 19 23112010 070912 xx Sumário 166 O modelo de efeitos aleatórios MEA 598 Teste do multiplicador de Lagrange de Breusch e Pagan 601 167 Propriedades de vários estimadores 602 168 Modelo de efeitos fixos versus modelo de efeitos aleatórios algumas orientações 602 169 Regressão de dados em painel alguns comentários conclusivos 604 1610 Alguns exemplos ilustrativos604 Resumo e conclusões 609 Exercícios 610 CaPíTulo 17 Modelos econométricos dinâmicos modelos autorregressivos e com defasagens distribuídas 614 171 O papel do tempo ou defasagem em economia 614 172 A razão das defasagens 618 173 Estimação de modelos com defasagens distribuídas 619 Estimação ad hoc dos modelos de defasagens distribuídas 619 174 A abordagem de Koyck dos modelos de defasagens distribuídas 620 A defasagem mediana 623 A defasagem média 623 175 Racionalização do modelo de Koyck o modelo de expectativas adaptativas 625 176 Outra justificativa do modelo de Koyck o modelo de ajuste de estoques ou de ajustamento parcial 627 177 Combinação dos modelos de expectativas adaptativas e de ajustamento parcial 629 178 Estimação dos modelos autorregressivos 630 179 O método de variáveis instrumentais VI 632 1710 Detectando a autocorrelação em modelos autorregressivos o teste h de Durbin 633 1711 Um exemplo numérico a demanda por moeda no Canadá primeiro trimestre de 1979 ao quarto trimestre de 1988 635 1712 Exemplos ilustrativos 637 1713 A abordagem de Almon aos modelos de defasagens distribuídas a distribuição polinomial de defasagens ou de Almon 640 1714 Causalidade em economia o teste de causalidade de Granger 647 O teste de Granger 648 Uma observação sobre causalidade e exogeneidade 651 Resumo e conclusões 652 Exercícios 653 Apêndice 17A 663 17a1 O teste de Sargan para a validade dos instrumentos 663 PaRTe 4 ModELos dE EquAçõEs sIMuLtâNEAs E ECoNoMEtRIA dE séRIEs tEMpoRAIs 665 CaPíTulo 18 Modelos de equações simultâneas 667 181 A natureza dos modelos de equações simultâneas 667 182 Exemplos de modelos de equações simultâneas 668 183 O viés das equações simultâneas inconsistência dos estimadores de MQO 673 184 O viés das equações simultâneas um exemplo numérico 676 Resumo e conclusões 678 Exercícios 678 CaPíTulo 19 o problema da identificação 683 191 Notações e definições 683 192 O problema da identificação 686 ECONOBOOKindb 20 23112010 070912 Sumário xxi Subidentificação 686 Identificação precisa ou exata 688 Superidentificação 691 193 Regras para a identificação 692 A condição de posto de identificação 693 A condição de posto de identificação 694 194 Um teste de simultaneidade 697 Teste de especificação de Hausman 697 195 Testes de exogeneidade 699 Resumo e conclusões 700 exercícios 700 CaPíTulo 20 Métodos de equações simultâneas 705 201 Abordagens da estimação 705 202 Modelos recursivos e mínimos quadrados ordinários 706 203 Estimação de uma equação exatamente identificada o método de mínimos quadrados indiretos MQI 708 Um exemplo 709 Propriedades dos estimadores de MQI 711 204 Estimação de uma equação superindentificada o método dos mínimos quadrados em dois estágios MQ2E 712 205 MQ2E um exemplo numérico 715 206 Exemplos ilustrativos 717 Resumo e conclusões 723 Exercícios 724 Apêndice 20A 728 20a1 Viés nos estimadores de mínimos quadrados indiretos 728 20a2 Estimação de erros padrão dos estimadores de MQ2E 729 CaPíTulo 21 Econometria de séries temporais alguns conceitos básicos 731 211 Um olhar sobre algumas séries temporais da economia dos Estados Unidos 732 212 Conceitoschave 733 213 Processos estocásticos 734 Processos estocásticos estacionários 734 Processos estocásticos não estacionários 735 214 Processo estocástico de raiz unitária 738 215 Processos estocásticos de tendência estacionária TE e diferença estacionária DE 739 216 Processos estocásticos integrados 740 Propriedades das séries integradas 741 217 O fenômeno da regressão espúria 741 218 Testes de estacionariedade 742 1 Análise gráfica 743 2 Função de correlação FAC e correlograma 743 Significado estatístico dos coeficientes de correlação 746 219 O teste da raiz unitária 748 O teste DickeyFuller aumentado DFA 751 Testando a significância de mais de um coeficiente o teste F 751 Os testes de raiz unitária PhillipsPerron 752 Testando as mudanças estruturais752 Uma crítica aos testes de raiz unitária 752 2110 Transformando a série temporal não estacionária 753 Processos de diferença estacionária 753 Processo estacionário em tendência 754 2111 Cointegração regressão de uma série temporal com raiz unitária contra outra série temporal com raiz unitária 755 ECONOBOOKindb 21 23112010 070912 xxii Sumário Teste de cointegração 756 Cointegração e mecanismo de correção de erro MCE 757 2112 Algumas aplicações econômicas 759 Resumo e conclusões 762 Exercícios 762 CaPíTulo 22 Econometria de séries temporais previsão 767 221 Abordagens sobre a previsão econômica 767 Métodos de suavização exponencial 767 Modelos de regressão uniequacional 768 Modelos de regressão de equações simultâneas 768 Modelos ARIMA 768 Modelos VAR 769 222 Modelagem de séries temporais de acordo com os métodos autorregressivo das médias móveis e ARIMA 769 Um processo autorregressivo AR769 Processo de média móvel MA 770 Processo autorregressivo de médias móveis ARMA 770 Processo autorregressivo integrado de médias móveis ARIMA 770 223 A metodologia BoxJenkins BJ 771 224 Identificação 772 225 Estimação do modelo ARIMA 776 226 Verificação do diagnóstico 777 227 Previsão 777 228 Outros aspectos da metodologia BJ 778 229 Vetores autorregressivos VAR 778 Estimação do VAR 779 Previsão com VAR 780 VAR e casualidade 781 Alguns problemas da modelagem VAR 783 Uma aplicação de VAR um modelo VAR da economia do Texas 784 2210 Medindo a volatilidade na série temporal financeira os modelos ARCH e GARCH 784 O que fazer se o ARCH estiver presente790 Uma palavra sobre o d DurbinWatson e o efeito ARCH 790 Uma nota sobre o modelo GARCH 790 2211 Exemplos finais790 Resumo e conclusões 792 Exercícios 793 aPêNDiCe a 796 Revisão de alguns conceitos estatísticos 796 a1 Operadores somatório e de produto 796 a2 Espaço amostral pontos amostrais e eventos 797 a3 Probabilidade e variáveis aleatórias 797 Probabilidade 797 Variáveis aleatórias 798 a4 Função de densidade de probabilidade FDP 798 Função de densidade de probabilidade de uma variável aleatória discreta 798 Função de densidade de probabilidade de uma variável aleatória contínua 799 Funções de densidade de probabilidade conjunta 800 Função de densidade de probabilidade marginal 800 Independência estatística 802 a5 As características das distribuições de probabilidade 804 Valor esperado 804 Propriedades dos valores esperados 805 ECONOBOOKindb 22 23112010 070912 Sumário xxiii Variância 806 Propriedades da variância 807 Covariância 807 Propriedades da covariância 808 Coeficiente de correlação 808 Expectativa condicional e variância condicional 809 Propriedades da expectativa condicional e da variância condicional 810 Momentos de ordem superior das distribuições de probabilidade 811 a6 Algumas distribuições de probabilidade teóricas importantes 812 Distribuição normal 812 A distribuição 2 quiquadrado 815 Distribuição t de Student 816 A distribuição F 817 Distribuição binomial de Bernoulli 818 Distribuição binomial818 A distribuição de Poisson 819 a7 Inferência estatística estimação 819 Estimação pontual 819 Estimação intervalar 820 Métodos de estimação 821 Propriedades de pequenas amostras 822 Propriedades de grandes amostras 824 a8 Inferência estatística testando as hipóteses 827 A abordagem do intervalo de confiança 828 A abordagem do teste de significância 832 Referências 833 aPêNDiCe b Rudimentos de álgebra matricial 834 b1 Definições 834 Matriz 834 Vetor coluna 834 Vetor linha 835 Transposição 835 Submatriz 835 b2 Tipos de matrizes 835 Matriz quadrada 835 Matriz diagonal 836 Matriz escalar836 Matriz identidade ou unidade836 Matriz simétrica 836 Matriz nula 836 Vetor nulo 836 Matrizes iguais 837 b3 Operações com matrizes 837 Soma de matrizes 837 Subtração de matrizes 837 Multiplicação escalar 837 Multiplicação de matrizes 838 Propriedades da multiplicação de matrizes 838 Transposição de matrizes 839 Inversão de matrizes 840 b4 Determinantes 840 Avaliação de um determinante 840 Propriedades dos determinantes 841 Posto de uma matriz 842 ECONOBOOKindb 23 23112010 070913 xxiv Sumário Menor 842 Cofator 843 b5 Encontrando a inversa de uma matriz quadrada 843 b6 Diferenciação matricial 844 Referências 845 aPêNDiCe C A abordagem matricial para o modelo de regressão linear 846 C1 O modelo de regressão linear com k variáveis 846 C2 Hipóteses do modelo de regressão linear clássico em notação matricial 848 C3 Estimativa por mínimos quadrados ordinários MQO 850 Uma ilustração 852 Matriz de variâncias e covariâncias de b 853 Propriedades do vetor de MQO b 854 C4 O coeficiente de determinação R2 em notação matricial 854 C5 A matriz de correlações 855 C6 Teste de hipóteses sobre coeficientes de regressão individual em notação matricial 855 C7 Teste da significância geral da regressão análise de variância em notação matricial 856 C8 Teste de restrições lineares teste F geral por meio da notação matricial 857 C9 Previsão com o uso da regressão múltipla formulação matricial 858 Previsão da média 858 Variância da previsão da média 858 Previsão individual 859 Variância da previsão individual859 C10 Resumo da abordagem matricial um exemplo ilustrativo 859 C11 Mínimos quadrados generalizados MQG 863 C12 Resumo e conclusões 864 Exercícios 865 Ca1 Derivação de k equações normais ou simultâneas 871 Ca2 Derivação matricial de equações normais 871 Ca3 Matriz de variâncias e covariâncias de b 871 Ca4 Propriedade de melhor estimador linear não viesado MELNT dos estimadores de mínimos quadrados ordinários MQO 872 aPêNDiCe D tabelas estatísticas 874 aPêNDiCe e telas de resultado do EViews MINItAB Excel e stAtA 891 e1 EViews 891 e2 MINITAB 893 e3 Excel 894 e4 STATA 895 e5 Comentários finais 895 Referências 896 aPêNDiCe f dados econômicos na Internet 897 Referências bibliográficas 899 Índice 903 ECONOBOOKindb 24 23112010 070913 25 Introdução I1 O que é econometria Em uma interpretação literal econometria significa medição econômica Embora a medição seja uma parte importante da econometria seu escopo é muito mais amplo como mostram as se guintes citações A econometria resultado de determinada perspectiva sobre o papel da economia consiste na aplicação da estatística matemática a dados econômicos para dar suporte empírico aos modelos formulados pela economia matemática e obter resultados numéricos1 a econometria pode ser definida como a análise quantitativa dos fenômenos econômicos ocorridos com base no desenvolvimento paralelo da teoria e das observações e com o uso de métodos de inferên cia adequados2 A econometria pode ser definida como a ciência social em que as ferramentas da teoria econômica da matemática e da inferência estatística são aplicadas à análise dos fenômenos econômicos3 A econometria diz respeito à determinação empírica das leis econômicas4 A arte do econometrista está em encontrar o conjunto de hipóteses suficientemente específicas e realis tas que lhe permitam tirar o melhor proveito dos dados de que dispõe5 Os econometristas são um auxílio positivo na tentativa de dissipar a imagem pública negativa da economia seja ela quantitativa ou não como assunto em que caixas vazias são abertas supondose a existência de abridores de lata para revelar conteúdos que dez economistas interpretarão de 11 maneiras distintas6 O método da pesquisa econométrica visa essencialmente a conjugação da teoria econômica com me dições concretas usando a teoria e a técnica da inferência estatística como uma ponte7 1 TinTner Gerhard Methodology of mathematical economics and econometrics Chicago The University of Chica go Press 1968 p 74 2 SamUelSon P a KooPmanS T C STone J r n Report of the evaluative committee for econometrica Economé trica abr 1954 v 22 n 2 p 141146 3 GoldberGer arthur S Econometric theory nova York John Wiley Sons 1964 p 1 4 Theil h Principles of econometrics nova York John Wiley Sons 1971 p 1 5 malinvaUd e Statistical methods of econometrics Chicago rand mcnally 1966 p 514 6 darnell adrian C evanS J lynne The limits of econometrics rants inglaterra edward elgar Publishing 1990 p 54 7 haavelmo T The probability approach in econometrics Suplemento da Econometrica 1944 v 12 prefácio p iii ECONOBOOKindb 25 23112010 070913 26 econometria básica I2 Por que uma disciplina separada Como as definições apresentadas sugerem a econometria é um amálgama de teoria econômica economia matemática estatística econômica e estatística matemática Contudo o assunto merece ser estudado de modo independente pelas seguintes razões A teoria econômica faz declarações ou hipóteses principalmente de natureza qualitativa Por exem plo a teoria microeconômica afirma que tudo o mais permanecendo igual uma redução no preço de uma mercadoria deve resultar no aumento da quantidade demandada por esta mercadoria Por tanto a teoria econômica postula uma relação negativa ou inversa entre o preço e a quantidade de mandada de uma mercadoria Mas a teoria em si não oferece nenhuma medida quantitativa da relação entre as duas variáveis ela não nos informa quanto a quantidade aumentará ou diminuirá em consequência de determinada variação no preço da mercadoria Cabe ao econometrista oferecer es sas estimativas numéricas Em outras palavras o econometrista proporciona conteúdo prático à maior parte da teoria econômica A principal preocupação da economia matemática é expressar a teoria econômica de forma ma temática equações sem levar em conta se a teoria pode ser medida ou verificada empiricamente A econometria como já mencionado está principalmente interessada na verificação da teoria econômica Conforme veremos o econometrista frequentemente usa as equações matemáticas formuladas pelo economista matemático mas as aplica de forma que possam ser testadas na prática E essa conversão de equações matemáticas em equações econométricas requer bastante engenhosidade e habilidade A estatística econômica busca principalmente a coleta processamento e apresentação dos dados econômicos na forma de gráficos e tabelas Essa é a tarefa do estatístico econômico É ele o principal responsável por coletar dados sobre o produto nacional bruto PNB o emprego o desemprego os preços etc As informações coletadas constituem os dados brutos do trabalho econométrico Mas o tra balho do estatístico econômico não vai além disso seu foco não é usar os dados para testar as teorias econômicas É claro se fosse ele se tornaria um econometrista Embora a estatística matemática proporcione muitas das ferramentas usadas em sua atividade os econometristas em geral precisam de métodos especiais em vista da natureza específica da maioria dos dados econômicos isto é por serem dados que não foram gerados por meio de experimentos contro lados O econometrista como o meteorologista depende em geral de dados que não podem ser controlados diretamente Como Spanos observa corretamente Na econometria quem modela muitas vezes se depara com dados provenientes de observações em oposição aos dados experimentais Isso tem duas implicações importantes para a modelagem empírica na econometria Primeiro quem modela deve dominar habilidades muito diferentes das necessárias à análise de dados experimentais Segundo a diferença entre quem coleta dados e quem os analisa exige que quem modela esteja profundamente familiarizado com a natureza e a estrutura dos dados em questão8 I3 A metodologia econométrica Como fazem os econometristas para analisar um problema econômico Qual metodologia utili zam Embora existam várias escolas de pensamento sobre metodologia econométrica aqui apresen tamos a tradicional ou clássica que ainda domina a pesquisa na economia e em outras ciências sociais e comportamentais9 8 SPanoS aris Probability Theory and statistical inference econometric modfling with observational data reino Unido Cambridge Uni versity Press 1999 p 21 9 Para uma discussão esclarecedora embora avançada do método econométrico veja hendrY david F Dynamic econometrics nova York oxford University Press 1995 veja também SPanoS aris op cit ECONOBOOKindb 26 23112010 070913 introdução 27 Em termos gerais a metodologia econométrica tradicional segue os seguintes passos 1 Exposição da teoria ou hipótese 2 Especificação do modelo matemático da teoria 3 Especificação do modelo estatístico ou econométrico 4 Obtenção dos dados 5 Estimação dos parâmetros do modelo econométrico 6 Teste de hipóteses 7 Projeção ou previsão 8 Uso do modelo para fins de controle ou de política Para ilustrarmos esses passos vejamos a conhecida teoria do consumo keynesiana 1 exposição da teoria ou hipótese Keynes afirmou A lei psicológica fundamental é que os homens as mulheres estão dispostos como regra e em média a aumentar seu consumo conforme sua renda aumenta mas não na mesma proporção que o au mento na renda10 Em resumo Keynes postulava que a propensão marginal a consumir PMC a taxa de varia ção do consumo por variação de uma unidade digamos um dólar de renda é maior que zero mas menor que 1 2 especificação do modelo matemático da teoria Embora Keynes postulasse uma relação positiva entre consumo e renda ele não especificou a forma exata da relação funcional entre as duas variáveis Para simplificar um economista mate mático poderia sugerir a seguinte forma para a função de consumo keynesiana Y D Ø1 C Ø2X 0 Ø2 1 i31 em que Y D despesas de consumo e X D renda e Ø1 e Ø2 conhecidos como os parâmetros do modelo são respectivamente o intercepto e o coeficiente angular O coeficiente angular Ø2 mede a PMC A Figura 11 mostra a representação geométrica da Equação I31 Essa equação que especifica que o consumo se relaciona linearmente à renda é um exemplo de modelo matemático da relação entre consumo e renda e é conhecida como função consumo em economia O modelo é apenas um conjunto de equações matemáticas Se o modelo tem apenas uma equação como no apresentado denominase modelo uniequacional enquanto se tiver mais de uma equação será denominado modelo de múltiplas equações que veremos mais adiante Na Equação I31 a variável que aparece do lado esquerdo do sinal de igualdade é chama da de variável dependente e as variáveleis do lado direito ésão chamadas de variáveleis independentes ou explanatórias Assim na função consumo keynesiana o consumo despesa é a variável dependente e a renda é a variável explanatória 10 KeYneS John maynard The general theory of employment interest and money nova York harcourt brace Jova novich 1936 p 96 ECONOBOOKindb 27 23112010 070913 28 econometria básica 3 especificação do modelo estatístico ou econométrico O modelo puramente matemático da função consumo apresentado na Equação I31 é de inte resse limitado para o econometrista pois supõe que existe uma relação exata ou determinística entre o consumo e a renda Mas as relações entre variáveis econômicas são em geral inexatas Portanto se coletarmos dados sobre despesas de consumo e renda disponível a renda depois de descontados os impostos de uma amostragem de digamos 500 famílias americanas e traçarmos um gráfico em que o eixo vertical representa as despesas de consumo e o eixo horizontal a renda dispo nível não devemos esperar que as 500 observações se situem exatamente na reta dada pela Equação I31 Isso porque além da renda outras variáveis afetam as despesas de consumo O tamanho da família a idade de seus integrantes a religião etc por exemplo provavelmente exercem certa influ ência sobre o consumo Para levar em conta as relações inexatas entre as variáveis econômicas o econometrista deve modificar a função consumo determinística da Equação I31 do seguinte modo Y D Ø1 C Ø2X C u i32 em que u conhecido como distúrbio ou termo de erro é uma variável aleatória estocástica que tem propriedades probabilísticas conhecidas O termo de erro u pode representar bem todos esses fa tores que afetam o consumo mas que não são levados em conta explicitamente A Equação I32 é um exemplo de modelo econométrico Mais tecnicamente é um exemplo de modelo de regressão linear que é o principal tema deste livro A função consumo econométrica baseiase na hipótese de que a variável dependente Y o consumo se relaciona linearmente com a variável explanatória X a renda mas que a relação entre ambas não é exata está sujeita a varia ções individuais O modelo econométrico da função consumo pode ser representado pelo gráfico da Figura 12 4 obtenção dos dados Para estimarmos o modelo econométrico da Equação I32 isto é para obtermos os va lores numéricos de Ø1 e Ø2 precisamos de dados Embora no próximo capítulo falaremos mais sobre a importância crítica dos dados para a análise econômica por enquanto vamos examinar os dados apresentados na Tabela I1 que se refere à economia dos Estados Unidos fiGuRa i1 Função consumo keynesiana Despesa de consumo X Renda 1 2 PMC 1 Ø Y Ø ECONOBOOKindb 28 23112010 070914 introdução 29 no período 19602005 Na tabela a variável Y corresponde às despesas de consumo pessoal DCP agregada isto é para a economia como um todo e a variável X ao produto interno bruto PIB um in dicador de renda agregada ambas medidas em termos de bilhões de dólares de 2000 Portanto os dados são apresentados em termos reais isto é foram medidos a pre ços constantes de 2000 Os dados estão representados graficamente na Figura I3 compare com a Figura I2 Por enquanto deixemos de lado a linha traçada no gráfico 5 estimação dos parâmetros do modelo econométrico Agora que temos os dados nossa próxima tarefa é estimar os parâmetros da função consu mo A estimativa numérica dos parâmetros fornece conteúdo empírico à função consumo O mecanismo para estimar os pa râmetros será examinado no Capítulo 3 Por enquanto note que a técnica estatística da análise de regressão é a principal ferramenta para obter as estimativas Aplicando essa técnica aos dados da Tabela I1 obtemos as seguintes estimativas de Ø1 e Ø2 especificamente 2995913 e 07218 Portanto a função consumo estimada é YOt D 2995913 C 07218Xt i33 O acento circunflexo em cima do Y indica que se trata de uma estimativa11 A Figura I3 mostra a função consumo estimada isto é a linha de regressão Como indica a Figura I3 a linha de regressão ajustase bem aos dados no sentido de que os pontos no gráfico que representam os dados ficam muito próximos da linha de regressão A figura nos mostra que para o período 19602005 o coeficiente angular a PMC era de quase 072 indicando que no período amostrado um aumento de um dólar na renda real levava em média a um aumento de cerca de 72 centavos nas despesas reais de consumo12 Dizemos em média porque a relação entre consumo e renda é inexata como fica claro na Figura I3 nem todos os pontos dos dados estão exatamente sobre a linha de regressão Em termos simples podemos dizer que de acordo com nossos dados as despesas médias de consumo aumentam cerca de 70 centavos a cada aumento real de um dólar na renda real 11 o uso de um acento circunflexo sobre uma variável ou parâmetro indica por convenção que se trata de um valor estimado 12 Por enquanto não se preocupe sobre como esses valores foram obtidos Como mostraremos no Capítulo 3 essas estimativas foram obtidas através do método estatístico dos mínimos quadrados Também por enquan to não se preocupe com o valor negativo do intercepto Despesa de consumo X Y Renda u fiGuRa i2 Modelo econométrico da função consumo keynesiana ECONOBOOKindb 29 23112010 070914 30 econometria básica Tabela i1 Despesas de consumo pessoal Y e produto interno bruto X 19602005 em bilhões de dólares de 2000 Fonte Economics Report of the President 2007 Tabela B2 p 230 ano DCPY PibX 1960 15974 25018 1961 16303 25600 1962 17111 27152 1963 17816 28340 1964 18884 29986 1965 20077 31911 1966 21218 33991 1967 21850 34846 1968 23105 36527 1969 23964 37654 1970 24519 37719 1971 25455 38986 1972 27013 41050 1973 28338 43415 1974 28123 43196 1975 28769 43112 1976 30355 45409 1977 31641 47505 1978 33031 50150 1979 33834 51734 1980 33741 51617 1981 34222 52917 1982 34703 51893 1983 36686 54238 1984 38633 58136 1985 40640 60537 1986 42289 62636 1987 43698 64751 1988 45469 67427 1989 46750 69814 1990 47703 71125 1991 47784 71005 1992 49348 73366 1993 50998 75327 1994 52907 78355 1995 54335 80317 1996 56194 83289 1997 58318 87035 1998 61258 90669 1999 64386 94703 2000 67394 98170 2001 69104 98907 2002 70993 100488 2003 72953 103010 2004 75771 107035 2005 78412 110486 ECONOBOOKindb 30 23112010 070914 introdução 31 6 Teste de hipóteses Considerando que o modelo ajustado seja uma aproximação razoavelmente boa da realidade é preciso desenvolver critérios adequados para verificar se as estimativas obtidas digamos na Equa ção I33 estão de acordo com as expectativas da teoria que está sendo testada Segundo economis tas positivos como Milton Friedman uma teoria ou hipótese que não for verificável com evidências empíricas pode não ser admissível como parte de uma pesquisa científica13 Conforme observado anteriormente Keynes esperava que a PMC fosse positiva mas menor que 1 Em nosso exemplo a PMC é de cerca de 072 Entretanto antes de aceitarmos esse valor como uma confirmação da teoria do consumo keynesiana precisamos nos perguntar se essa estimativa está suficientemente abaixo da unidade para nos convencer de que não é um resultado devido ao aca so ou uma peculiaridade dos dados que utilizamos Em outras palavras 072 é estatisticamente menor que 1 Se for será um respaldo para a teoria de Keynes Tal confirmação ou refutação de teorias econômicas com base em evidências amostrais se alicer ça em um ramo da teoria estatística conhecido como inferência estatística teste de hipóteses Ao longo do livro veremos como esse processo é conduzido na prática 7 Projeção ou previsão Se o modelo escolhido não refutar a hipótese ou teoria considerada podemos utilizálo para prever os valores futuros da variável previsão Y ou variável dependente com base nos valores futuros conhecidos ou esperados da variável previsora X ou variável explanatória 13 veja Friedman milton The methodology of positive economics Essays in Positive Economcs Chicago University of Chicago Press 1953 fiGuRa i3 Despesas de consumo pessoal Y em relação ao PIB X 1960 2005 em bilhões dólares de 2000 12000 10000 8000 6000 4000 PIB X 2000 1000 2000 3000 4000 DCP Y 8000 7000 6000 5000 ECONOBOOKindb 31 23112010 070914 32 econometria básica Para fins de ilustração suponha que desejemos prever as despesas médias de consumo para 2006 O valor do PIB nesse ano foi de 113194 bilhão14 Colocando o valor do PIB no lado direito da Equação I33 obtemos OY2006 D 2995913 C 07218113194 D 78707516 i34 ou cerca de 7870 bilhões Assim dado o valor do PIB as despesas de consumo médias previstas são de cerca de 7870 bilhões O valor dessas despesas efetivamente registrado em 2006 foi de 8044 bilhões Portanto o modelo estimado I33 subestimou as despesas de consumo reais em cerca de 174 bilhões Podemos dizer que o erro de previsão é de cerca 174 bilhões que é aproxi madamente de 15 do valor do PIB registrado em 2006 Quando examinar mos mais a fundo o mo delo de regressão linear nos próximos capítulos tentaremos verificar se um erro desse tipo é pequeno ou grande Mas o importante agora é observar que esses erros de previsão são inevitáveis dada a natureza estatística de nossa análise Há outro uso para o modelo estimado na Equação I33 Suponha que o presidente decida pro por uma redução na alíquota do imposto de renda Qual seria o efeito dessa política sobre a renda e por conseguinte sobre as despesas de consumo e por fim sobre o emprego Suponha que como resultado da mudança proposta as despesas com investimento aumentem Qual seria o efeito sobre a economia Como mostra a teoria macroeconômica a mudança na renda que se segue digamos à variação de um dólar nas despesas com investimento é dada pelo multipli cador da renda M que é definido como M H 1 1 PMC i35 Se utilizarmos a PMC de 072 obtida na Equação I33 esse multiplicador será de cerca de M D 357 Isto é um aumento redução de um dólar no investimento levará por fim a um aumento redução de mais de três vezes na renda observe que o multiplicador demora a produzir seu efeito Um valor crítico nesses cálculos é a PMC pois o multiplicador depende dela E essa estimativa da PMC pode ser obtida por meio de modelos de regressão como o da Equação I33 As estimati vas quantitativas da PMC proporcionam informações valiosas para a formulação da política econô mica Conhecendo a PMC podemos prever o curso futuro da renda das despesas de con sumo e do emprego após uma alteração da política fiscal do governo 8 uso do modelo para fins de controle ou de política Suponha que tenhamos estimada a função consumo da Equação I33 Suponha ainda que o governo acredite que as despesas de consumo de cerca de 8750 bilhões em dólares de 2000 manterão a taxa de desemprego em seu nível atual de cerca de 42 no início de 2006 Que nível de renda garantirá o montante almejado meta de despesas de consumo Se os resultados da regressão da Equação I33 parecem razoáveis um cálculo aritmético sim ples mos trará que 8750 D 2995913 C 07218 PIB2006 i36 o que dá aproximadamente X D 12537 Ou seja um nível de renda de cerca de 12537 bilhões dada uma PMC de cerca de 072 gerará uma despesa de cerca de 8750bilhões 14 os dados do dCP e do Pib para 2006 estavam disponíveis mas os deixamos de lado propositadamente para ilustrar o tópico examinado nesta seção Como veremos em capítulos subsequentes é uma boa ideia guardar uma parte dos dados para veri ficar como o modelo ajustado prevê as observações que estão fora da amostra ECONOBOOKindb 32 23112010 070915 introdução 33 Como esses cálculos sugerem um modelo estimado pode ser usado para fins de controle ou de formulação de políticas Com uma combinação apropriada de políticas fiscais e monetárias o gover no pode manejar a variável de controle X para gerar o nível desejado da variável meta Y A Figura I4 resume a anatomia da modelagem econométrica clássica escolha do modelo Quando um órgão governamental por exemplo o Departamento de Comércio dos Estados Uni dos coleta dados como os apresentados na Tabela I1 não tem necessariamente uma teoria econô mica qualquer em mente Como sabemos então que os dados realmente confirmam a teoria do consumo keynesiana Seria porque a função consumo keynesiana a linha de regressão da Figura I3 está extremamente próxima dos dados disponíveis É possível que outro modelo teoria do con sumo se ajuste igualmente bem aos dados Por exemplo Milton Friedman desenvolveu um modelo de consumo chamado hipótese da renda permanente15 Robert Hall também formulou um mode lo de consumo conhecido como hipótese da renda permanente no ciclo de vida16 Algum desses modelos ou ambos também poderiam servir para os da Tabela I1 Em resumo a dúvida com que o pesquisador se depara na prática é como escolher entre as dife rentes hipóteses ou modelos para um dado fenômeno como a relação consumorenda Como Miller argumenta Nenhum encontro com os dados é uma etapa no sentido de confirmação autêntica a menos que a hi pótese lide melhor com os dados que algum rival natural O que fortalece uma hipótese nesse caso é a vitória que ao mesmo tempo é a derrota para outra hipótese plausível17 Como então escolher entre os diversos modelos ou hipóteses concorrentes Vale a pena ter em mente o conselho de Clive Granger18 15 Friedman miltonA theory of consumption function Princeton n J Princeton University Press 1957 16 hall r Stochastic implications of the life cycle permanent income hypothesis theory and evidence Journal of Political Economy 1978 v 86 p 971987 17 miller r W Fact and method explanation confirmation and reality in the natural and social sciences Prin ceton nJ Princetor University Press 1978 p 176 18 GranGer Clive W J Empirical modeling in economics reino Unido Cambridge University Press 1999 p 58 fiGuRa i4 Anatomia da modelagem econométrica Estimação do modelo econométrico Modelos econométricos da teoria Teoria econômica Dados Projeção ou previsão Usando o modelo para fins de controle ou de política Teste de hipóteses Modelo matemático da teoria ECONOBOOKindb 33 23112010 070915 34 econometria básica Gostaria de sugerir que no futuro você faça as seguintes perguntas quando lhe apresentarem uma nova teoria ou modelo empírico i Qual o propósito disto Para que decisão econômica contribuirá e ii Existe alguma prova que me permita avaliar sua qualidade em comparação com teorias ou modelos alternativos Penso que se for dada a devida atenção a essas perguntas a pesquisa e a discussão econômicas serão fortalecidas À medida que avançarmos no livro encontraremos várias hipóteses que concorrem para explicar os vários fenômenos econômicos Por exemplo os estudantes de economia conhecem bem o concei to da função de produção que é basicamente uma relação entre produto e insumos capital e traba lho Na literatura duas das mais conhecidas são as funções CobbDouglas e a da elasticidade de substituição constante Precisaremos descobrir em virtude dos dados de produção e de insu mos se alguma delas reflete melhor os dados O método econométrico clássico de oito etapas apresentado anteriormente é neutro no sentido de que pode ser usado para testar qualquer uma dessas hipóteses rivais É possível formular uma metodologia que seja suficientemente abrangente para incluir hipóteses concorrentes Esse é um tópico complexo e controverso que será discutido no Capítulo 13 depois que tivermos adquirido conhecimentos teóricos suficientes I4 Tipos de econometria Como sugere a estrutura classificatória da Figura I5 a econometria pode ser divida em duas categorias amplas econometria teórica e econometria aplicada Em cada categoria podemos abordar a disciplina segundo as tradições clássica e bayesiana Neste livro damos ênfase à clás sica Quanto à abordagem bayesiana o leitor pode consultar as referências indicadas no final do capítulo A econometria teórica trata do desenvolvimento de métodos adequados para medir as rela ções econômicas especificadas nos modelos econométricos Sob esse aspecto a econometria depende fortemente da estatística matemática Por exemplo um dos métodos mais usado neste livro é o dos mínimos quadrados A econometria teórica deve deixar claras as hipóteses deste método suas propriedades e o que acontece com elas quando uma ou mais hipóteses do método não são atendidas Na econometria aplicada utilizamos as ferramentas da econometria teórica para estudar um ou mais campos especiais da economia e dos negócios como a função de produção a função investi mento as funções de oferta e de demanda a teoria do portfólio etc Este livro trata em grande parte a formulação dos métodos econométricos suas hipóteses usos limitações Esses métodos são ilustrados com exemplos de várias áreas da economia e dos negócios No entanto este não é um livro de econometria aplicada no sentido de se aprofundar particularmente em quaisquer dos campos da aplicação econômica Essa tarefa cabe às obras es critas especificamente com esse fim Ao final do livro ofereceremos algumas referências biblio gráficas fiGuRa i5 Categorias da econometria Econometria Teórica Clássica Bayesiana Aplicada Clássica Bayesiana ECONOBOOKindb 34 23112010 070916 introdução 35 I5 Prérequisitos matemáticos e estatísticos Embora este livro seja escrito em um nível elementar o autor pressupõe que o leitor este ja familiarizado com os conceitos básicos da estimação estatística e do teste de hipóteses O Apêndice A oferece uma visão geral e não técnica dos conceitos estatísticos básicos emprega dos aqui para aqueles que desejam reciclar seus conhecimentos No que se refere à matemática é desejável ter uma noção sobre cálculo diferencial embora não seja essencial Apesar de a maioria dos livros de econometria voltados à pósgraduação utilizar amplamente a álgebra matricial quero deixar claro que ela não é necessária para tirar proveito deste livro Estou completamente convencido de que as ideias fundamentais da econometria podem ser trans mitidas sem recorrer à álgebra matricial No entanto para os estudantes mais inclinados à matemática o Apêndice C apresenta um resumo da teoria básica da regressão em notação matricial e o Apêndice B oferece um resumo dos principais resultados da álgebra matricial I6 O papel do computador A análise de regressão a principal ferramenta da econometria é impensável nos dias de hoje sem o computador e o acesso a alguns softwares estatísticos ou pacotes estatísticos Acreditem em mim sou da geração criada com a régua de cálculo Felizmente vários pacotes excelentes para regres sões estão disponíveis no mercado tanto para computadores de grande porte quanto para microcom putadores e a lista cresce a cada dia Softwares como ET LIMDEP SHAZAM MICRO TSP MINITAB EVIEWS SAS SPSS STATA Microfit PcGive e BMD atendem à maioria das téc nicas e testes econométricos examinados neste livro Ao longo do livro o leitor será convidado vez por outra a conduzir experimentos Monte Carlo com auxílio de um ou mais pacotes estatísticos Os experimentos Monte Carlo são divertidos e permitirão ao leitor apreciar as propriedades de vários métodos estatísticos utilizados aqui Os deta lhes dos experimentos Monte Carlo serão discutidos no momento apropriado I7 Sugestões para leituras complementares O tema metodologia econométrica é vasto e controverso Para os interessados sugiro os livros a seguir MARCHI Neil de GILBERT Christopher Eds History and methodology of econometrics Nova York Oxford University Press 1989 Esta coletânea de textos discute alguns trabalhos pioneiros em metodolo gia econométrica e examina extensamente a abordagem britânica da econometria e sua relação com sé ries temporais ou seja dados coletados ao longo do tempo CHAREMZA Wojciech W DEADMAN Derek F New directions in econometric practice gen eral to specific modelling cointegration and vector autogression 2 ed Hants Inglaterra Edward Elgar Publishing Ltd 1997 Os autores criticam a abordagem tradicional da econometria e apresentam uma exposição detalhada das novas abordagens ao método econométrico DARNELL Adrian C EVANS J Lynne The limits of econometrics Hants Inglaterra Edward Elgar Publishers Ltd 1990 Este livro oferece um exame bastante equilibrado das várias abordagens metodológicas econométricas com uma fidelidade renovada ao método tradicional MORGAN Mary S The history of econometric ideas Nova York Cambridge University Press 1990 A autora ofe rece uma excelente perspectiva histórica da teoria e da prática econométricas com um exame profundo das con tribuições iniciais de Haavelmo ganhador do Nobel de Economia de 1990 à econometria No mesmo es pírito o livro de David F Hendry e Mary S Morgan The foundation of econometric analysis Reino Unido Cambridge University Press 1995 reúne uma seleção de tex tos seminais para mostrar a evolução das ideias econométricas ao longo do tempo ECONOBOOKindb 35 23112010 070916 36 econometria básica COLANDER David BRENNER Reuven Eds Educating economists Ann Arbor Michigan University of Michigan Press 1992 O livro apresenta uma visão crítica às vezes agnóstica do ensino e da prática econômicos Para os interessados em estatística e econometria bayesianas os seguintes livros são muito úteis DEY John H Data in doubt Inglaterra Basil Blackwell Ltd Oxford University Press 1985 Peter M LEE Bayesian statistics an introduction Inglaterra Oxford University Press 1989 e PORIER Dale J Intermediate statistics and econometrics a comparative approach Cambridge Massachusetts MIT Press 1995 ZELLER Arnold An introduction to bayesian inference in econometrics Nova York John Wiley Sons 1971 este é um livro de referência avançado Outro livro de referência avançado é Palgrave handbook of econometrics volume 1 econometric theory editado por Terence C Mills e Kerry Patterson Nova York Palgrave Macmillan 2007 ECONOBOOKindb 36 23112010 070916 37 1 Parte Modelos de regressão com equação única A Parte I do livro apresenta modelos de regressão com equação única Nesses modelos uma variável chamada variável dependente é expressa como função linear de uma ou mais variáveis de nominadas variáveis explanatórias Em tais modelos supõese implicitamente que as relações causais se existirem entre a variável dependente e as explanatórias ocorrem apenas em uma direção especi ficamente das variáveis explanatórias para a dependente No Capítulo l discutimos a interpretação histórica assim como a moderna do termo regressão e ilustramos a diferença entre elas com vários exemplos da economia e de outros campos No Capítulo 2 apresentamos alguns conceitos fundamentais da análise de regressão com auxí lio de um modelo de regressão linear de duas variáveis um modelo em que a variável dependente é expres sa como função linear de uma única variável explanatória No Capítulo 3 continuamos abordando o modelo de duas variáveis e apresentamos o que é co nhecido como o modelo clássico de regressão linear um modelo que adota várias hipóteses simplificadoras Com essas premissas expomos o método dos mínimos quadrados ordinários MQO para estimar os parâ metros do modelo de regressão com duas variáveis A aplicação do método dos MQO é simples e tem algumas propriedades estatísticas muito desejáveis No Capítulo 4 apresentamos o modelo de regressão linear clássico normal com duas variáveis um modelo que pressupõe que a variável dependente estocástica siga a distribuição de proba bilidade normal Desse modo os estimadores de mínimos quadrados ordinários obtidos no Capítulo 3 adqui rem algumas propriedades estatísticas mais fortes do que o modelo de re gressão linear clássico não normal propriedades que nos permitem realizar a inferência es tatística isto é testar hipóteses O Capítulo 5 é dedicado ao tópico do teste de hipóteses Tentamos verificar se os coeficientes de regressão estimados são compatíveis com as hipóteses feitas em relação ao valor desses coeficientes sendo que os valores hipotéticos são sugeridos pela teoria eou por trab alhos empíricos anteriores O Capítulo 6 aborda algumas extensões do modelo de regressão com duas variáveis Em par ticular discute tópicos como 1 regressão que passa pela origem 2 escalas e unidades de medidas e 3 formas funcionais dos modelos de regressão tais como loglog semilog e mode los recíprocos No Capítulo 7 consideramos o modelo de regressão múltipla em que há mais de uma variável ex planatória e mostramos como o método dos mínimos quadrados ordinários pode ser ampliado para estimar os parâmetros de tais modelos No Capítulo 8 estendemos os conceitos apresentados no Capítulo 5 ao modelo de regressão múl tipla e destacamos algumas das complicações que surgem com a introdução de diversas variáveis ex planatórias O Capítulo 9 sobre variáveis explanatórias binárias dummy ou qualitativas conclui a primei ra parte do livro O capítulo ressalta que nem todas as variáveis explanatórias precisam ser quantitativas isto é ter escalas proporcionais Variáveis como gênero raça religião nacionali dade e região de re sidência não podem ser prontamente quantificadas contudo desempenham um papel importante para explicar vários fenômenos econômicos ECONOBOOKindb 37 23112010 070916 39 A natureza da análise de regressão Conforme mencionado na Introdução a regressão é a principal ferramenta da econometria e nes te capítulo examinaremos sucintamente sua natureza 11 Origem histórica do termo regressão O termo regressão foi criado por Francis Galton Em um artigo famoso Galton verificou que em bora existisse uma tendência de que pais altos tivessem filhos altos e pais baixos tivessem filhos bai xos a estatura média das crianças nascidas de pais com uma dada altura tendia a moverse ou re gredir à altura média da população como um todo1 Em outras palavras a altura dos fi lhos de pais mais altos ou mais baixos que o padrão tende a moverse no sentido da altura mé dia da popu lação A lei da regressão universal de Galton foi confirmada por seu amigo Karl Pearson que cole tou mais de mil registros de altura de membros de grupos familiares2 Ele constatou que a altura média dos filhos de um grupo de pais altos era menor do que a de seus pais e que a al tura média de um grupo de filhos de pais baixos era maior do que a de seus pais portanto filhos de pais altos e baixos regrediam igualmente à altura média de todos os homens Nas pa lavras de Galton isso era uma regressão à mediocridade 12 A interpretação moderna da regressão Contudo a interpretação moderna da regressão é bastante diferente De modo geral podemos dizer A análise de regressão diz respeito ao estudo da dependência de uma variável a variável dependen te em relação a uma ou mais variáveis as variáveis explanatórias visando estimar eou prever o valor médio da população da primeira em termos dos valores conhecidos ou fixados em amostra gens repetidas das segundas A importância desta visão da análise de regressão ficará mais clara à medida que avançarmos mas alguns exemplos simples podem esclarecer o conceito básico exemplos 1 Voltemos à lei da regressão universal de Galton Ele estava interessado em descobrir por que havia estabilidade na distribuição de alturas em uma população Mas na visão moderna nossa preocupação não é essa mas sim descobrir como a altura média dos filhos varia dada a altura dos pais Estamos interessados em prever a al tura média dos filhos com base no conhecimento da al tura dos pais Para melhor entender o conceito observe a Figura 11 um diagrama de dispersão 1 GalTon Francis Family likeness in stature Proceedings of Royal Society londres 1886 v 40 p 4272 2 PearSon K lee a on the laws of inheritance Biometrika nov 1903 v 2 p 357462 Capítulo 1 ECONOBOOKindb 39 23112010 070916 40 Parte Um Modelos de regressão com equação única A figura mostra a distribuição das alturas dos filhos em uma população hipotética correspon dentes aos valores dados ou fi xos da altura do pai Note que para cada altura do pai dada há uma faixa ou distribuição de alturas dos filhos Observe que apesar da variação da altura dos filhos para um dado valor da altu ra dos pais a altura média dos filhos em geral aumenta com o aumento da altura do pai As cruzes assinaladas com um círculo indicam a altura média dos filhos cor respondente a uma dada altura dos pais Conectando essas médias obtemos a linha mostrada na figura Essa linha como veremos é conhecida como linha de regressão Ela mostra como a altura média dos filhos aumenta com a altura dos pais3 2 Consideremos o diagrama de dispersão da Figura 12 que apresenta a distribuição em uma população hipotética das alturas de meninos em idades fixas Para cada idade temos uma faixa ou distribuição de alturas Obviamente nem todos os meninos de uma mesma idade terão uma altura idêntica Mas a altura em média aumenta com a idade até certa idade é claro o que pode ser visto claramente se traçarmos uma linha a de regressão que passe pelos pontos circulados que repre sentam a altura média em cada idade Conhecendo a idade podemos prever por meio da linha de regressão a altura média correspondente a essa idade 3 Passando a exemplos econômicos um economista poderia estar interessado em estudar a relação de dependência das despesas de consumo pessoal e a renda pessoal disponível após o paga mento de impostos Essa análise é útil para estimar a propensão marginal a consumir PMC isto é a variação média nas despesas de consumo para uma variação de um dólar na renda real 4 Um monopolista com possibilidade de fixar o preço ou a produção mas não ambos po de querer descobrir a resposta da demanda por um produto perante variações nos preços Isso nos permitiria estimar a elasticidadepreço isto é a resposta dos preços da demanda pelo produto e contribuiria para determinar o preço mais lucrativo 5 Um economista do trabalho pode querer estudar a relação entre a variação dos salários nominais e a taxa de desemprego O diagrama de dispersão da Figura 13 mostra os dados históricos A curva traçada é um exemplo da famosa curva de Phillips que relaciona as variações nos salários 3 neste estágio do desenvolvimento de nosso assunto chamaremos a linha de regressão de linha que conecta o valor médio da variável dependente altura dos filhos correspondente a um dado valor da variável explanatória altura dos pais note que essa linha tem uma inclinação positiva mas menor que 1 o que está de acordo com a regressão à mediocridade de Galton Por quê fiGuRa 11 Distribuição hipotética das alturas dos filhos em relação à altura dos pais Altura dos filhos em metros Altura dos pais em metros 190 177 165 150 150 165 177 190 Valor médio ECONOBOOKindb 40 23112010 070916 Capítulo 1 A natureza da análise de regressão 41 nominais com a taxa de desemprego Esse diagrama de dispersão permitiria ao economista pre ver a variação média dos salários para uma dada taxa de desemprego Tal conhecimento poderia contribuir para esclarecer o processo inflacionário de uma economia visto que o aumento dos salários nominais tende a refletirse em aumento de preços 6 A economia monetária diz que sendo tudo o mais constante quanto mais alta a taxa de inflação π menor a proporção k de sua renda que as pessoas desejarão manter sob forma monetária conforme mostra a Figura 14 A curva da linha representa a mudança em k em relação ao índice de inflação Uma análise quantitativa dessa relação permitiria ao economista prever a quantidade de moeda como proporção de sua renda que as pessoas desejariam manter sob diferentes taxas de inflação 7 O diretor de marketing de uma empresa pode querer saber como a demanda dos produtos de sua empresa relacionase com as despesas com publicidade Esse estudo seria de grande utilidade para determinar a elasticidade da demanda em relação às despesas com publicidade isto é a variação percentual da demanda em resposta a uma variação de 1 nas despesas com publicidade Essa in formação pode ser útil para determinar o orçamento de publicidade ideal Altura em metros 100 127 150 177 Idade em anos 10 11 12 13 14 Valor médio fiGuRa 12 Distribuição hipotética de alturas em relação a idades selecionadas Taxa de desemprego em Taxa de variação nos salários nominais 0 fiGuRa 13 Curva de Phillips hipotética ECONOBOOKindb 41 23112010 070917 42 Parte Um Modelos de regressão com equação única 8 Por fim um agrônomo pode estar interessado em estudar a dependência do rendimento de deter minada plantação em relação à temperatura à quantidade de chuva e de sol e à aplicação de fer tilizantes A análise de dependência permitiria a ele prever ou prognosticar o rendimento médio da lavoura dadas as informações sobre as variáveis explanatórias O leitor pode imaginar muitos outros exemplos da dependência de uma variável em relação a uma ou mais variáveis As técnicas de análise de regressão examinadas neste livro destinamse especial mente a estudar essa dependência entre variáveis 13 Relações estatísticas versus determinísticas Nos exemplos citados na Seção 12 o leitor notou que na análise de regressão esta mos preocu pados com o que é conhecido como dependência estatística e não funcional ou determinística entre as variáveis como aquelas da física clássica Nas relações estatísticas entre va riáveis lidamos essencial mente com variáveis aleatórias ou estocásticas4 isto é variáveis que têm distribuições probabilísticas Por outro lado na dependência funcional ou determinística também lidamos com variáveis mas estas não são aleatórias ou estocásticas A dependência do rendimento das lavouras em relação à temperatura pluviosidade luz solar ou fertilizante por exemplo é de natureza estatística no sentido de que as variáveis explanatórias embora importantes não permitirão ao agrônomo prever exatamente o rendimento devido aos erros envolvidos na medição dessas variáveis assim como a diversos outros fatores variáveis que coletivamente afetam o rendimento mas cuja identificação individual pode ser difícil Uma variabilidade intrínseca ou aleatória tende a existir na variável dependente rendimento da lavoura que não pode ser totalmente explicada independentemente do número de variáveis explanatórias consideradas Por outro lado nos fenômenos determinísticos lidamos com relações do tipo exibido pela lei da gravidade de Newton que diz cada partícula do universo atrai todas as outras partículas com uma força diretamente proporcional ao produto de suas massas e inversamente proporcional ao quadrado da distância entre elas Simbolicamente F kmlm2r2 em que F força m1 e m2 são as massas das duas partículas r é a distância entre elas e k constante de proporcionalidade Outro exemplo é a lei de Ohm 4 a palavra estocástica vem do grego stokhos que significa olho de boi ou centro do alvo em inglês o re sultado do lançamento de um dardo ao alvo é um processo estocástico isto é um processo em que nem sempre o centro do alvo é atingido 0 Taxa de inflação π k Moeda Renda fiGuRa 14 Saldos monetários em relação à taxa de inflação π ECONOBOOKindb 42 23112010 070917 Capítulo 1 A natureza da análise de regressão 43 que diz no caso de condutores metálicos dentro de certa faixa de temperatura a corrente C é propor cional à voltagem V isto é C 1 k V em que 1 k é a constante de proporcionalidade Outros exemplos dessas relações determinísticas são a lei de Boyle para o gás a lei de Kirchhoff para a eletricidade e a de Newton para o movimento Neste livro não nos preocupamos com essas relações determinísticas Obviamente se houver er ros de medição no k da lei da gravidade de Newton a relação determinística tornase uma relação estatística Nessa situação a força só pode ser prevista aproximadamente com base no valor de k e m1 m2 e r que contém erros A variável F nesse caso tornase uma variável aleatória 14 Regressão versus causação Embora a análise de regressão lide com a dependência de uma variável em relação a outras isso não implica necessariamente uma causação Nas palavras de Kendall e Stuart uma relação estatísti ca por mais forte e sugestiva que seja nunca pode estabelecer uma conexão causal nossas ideias de causação devem vir de fora da estatística em última análise de alguma teoria5 No exemplo do rendimento da lavoura citado anteriormente não há razão estatística para supor que a chu va não dependa do rendimento da lavoura O fato de tratarmos o rendimento da lavoura como dependente dentre outras coisas da chuva decorre de considerações não estatísticas o senso comum sugere que a relação não pode ser invertida pois não podemos controlar a pluviosidade por meio de uma variação no rendimento da lavoura Em todos os exemplos citados na Seção 12 é importante notar que uma relação estatísti ca por si própria não implica logicamente uma causação Para atribuir causação devemos recorrer a considerações a priori ou teóricas Portanto no terceiro exemplo citado podemos invocar a teoria econômica para dizer que as despesas de consumo dependem da renda real6 15 Regressão versus correlação A análise de correlação cujo principal objetivo é medir a força ou o grau de associação linear entre duas variáveis está estreitamente relacionada à análise de regressão mas conceitualmente é muito diferente O coeficiente de correlação que estudaremos em detalhe no Capítulo 3 mede a for ça dessa associação linear Por exemplo podemos estar interessados em determinar o coeficien te de correlação entre fumar e câncer de pulmão entre as notas obtidas nas provas de esta tística e de matemática entre as notas obtidas no ensino médio e na faculdade e assim por diante Na análise de regressão como já mencionamos não estamos interessados prioritariamente nessa medida Em vez disso buscamos estimar ou prever o valor médio de uma variável com base nos valores fixos de outras variáveis Portanto talvez queiramos saber se é possível prever a nota média de uma prova de estatística conhecendo as notas do estudante na prova de matemática A regressão e a correlação têm algumas diferenças fundamentais que vale a pena mencionar Na análise de regressão existe uma assimetria na maneira como as variáveis dependente e explanatória são tratadas Supomos que a variável dependente seja estatística aleatória ou estocástica isto é que tenha distribuição probabilística Por outro lado consideramos que as variáveis explanatórias têm valores fixos em amostras repetidas7 que foram explicitados na definição de regressão dada na Seção 12 Portanto na Figura 12 supusemos que a variável idade foi fixada em da dos níveis e 5 Kendall m G STUarT a The advanced theory of statistics nova York Charles Griffin Publishers 1961 v 2 cap 26 p 279 6 mas como veremos no Capítulo 3 a análise de regressão clássica se alicerça no pressuposto de que o mo delo utilizado na aná lise é o correto Portanto a direção da causalidade pode estar implícita no modelo postulado 7 É fundamental observar que as variáveis explanatórias podem ser intrinsecamente estocásticas mas para fins de análise de regres são pressupomos que seus valores são fixados em amostras repetidas isto é que X assume os mesmos valores em várias amostras tornandoas assim não aleatórias ou não estocásticas veremos esse as sunto com mais detalhes no Capítulo 3 Seção 32 ECONOBOOKindb 43 23112010 070919 44 Parte Um Modelos de regressão com equação única que as medições de altura foram obtidas nesses níveis Na análise de correlação por outro lado tratamos quaisquer duas variáveis simetricamente não há distinção entre as variáveis de pendente e explanatória Afinal a correlação entre as notas nas provas de matemática e de esta tística é a mes ma que aquela entre as notas das provas de estatística e de matemática Além disso supõese que as duas variáveis sejam aleatórias Como veremos a maior parte da teoria da correlação baseiase na premissa da aleatoriedade das variáveis enquanto boa parte da teo ria da regressão a ser exposta neste livro está condicionada à premissa de que a variável depen dente é estocástica mas as variáveis explanatórias são fixas ou não estocásticas8 16 Terminologia e notação Antes de prosseguirmos para a análise formal da teoria da regressão vejamos brevemente a termi nologia e a notação Na literatura os termos variável dependente e variável explanatória são descritos de vários modos Uma lista representativa é Variável dependente variável explicada variável prevista Regressando resposta variável endógena Saída variável controlada Variável explicativa variável independente Previsor Regressor estímulo variável exógena entrada variável de controle Embora seja uma questão de gosto pessoal e de tradição neste texto adotaremos a terminologia variável dependentevariável explanatória ou os termos mais neutros regressando e regressor Se estudamos a dependência de uma variável em relação a uma única variável explanatória como é o caso das despesas de consumo em relação à renda real esse estudo é conhe cido como análise de re gressão simples ou de duas variáveis No entanto se estudarmos a dependência de uma variável a mais de uma variável explanatória como no caso da relação entre rendimento da la voura e chuva temperatura luz do sol e fertilizantes será uma análise de regressão múltipla Em outras palavras em uma regressão de duas variáveis há somente uma única variável ex planatória enquanto na regressão múltipla há mais de uma variável explanatória O termo aleatório é sinônimo de estocástico Como já mencionado uma variável aleatória ou estocás tica é aquela que pode assumir qualquer valor positivo ou negativo dentro de um conjun to de valores com uma dada probabilidade9 8 no tratamento avançado da econometria podese relaxar a premissa do caráter não estocástico das variáveis explanatórias veja introdução à Parte 2 9 veja o apêndice a para uma definição formal e detalhes adicionais ECONOBOOKindb 44 23112010 070919 Capítulo 1 A natureza da análise de regressão 45 A menos que seja definido de outra forma a letra Y denotará a variável dependente e os X X1 X2 Xk representarão as variáveis explanatórias sendo Xk a késima variável explanatória os subscri tos i ou t denota rão a iésima ou tésima observação ou valor Xki ou Xkt denotará a iésima ou t ésima ob servação da variável Xk N ou T denotará o número total de observações ou valores da popu lação e n ou t o número total de observações de uma amostra Por convenção o subscrito i da observação será usado para dados de corte transversal isto é dados coletados em um ponto no tem po e o subscrito t para os dados de séries temporais isto é dados coletados ao longo de um intervalo de tempo A natureza dos dados de corte transversal e das séries temporais bem como o importante tópico da natureza e das fontes de dados para a análise empírica é exami nada a seguir 17 Natureza e fonte dos dados para a análise econômica10 O sucesso de qualquer análise econométrica depende em última instância da disponibilidade de dados adequados Portanto é essencial dedicarmos algum tempo examinando a natureza as fontes e as limitações dos dados que podem aparecer na análise empírica Tipos de dados Três tipos de dados podem estar disponíveis para a análise empírica dados de séries temporais de corte transversal e combinados isto é a combinação de séries temporais com os dados de corte trans versal Séries temporais Os dados apresentados na Tabela 11 da Introdução são um exemplo de da dos de séries temporais Uma série temporal é um conjunto de observações dos valores que uma variável assume em diferentes momentos do tempo Esses dados podem ser coletados a interva los regulares como diariamente preços das ações relatórios meteorológicos semanal mente informações sobre oferta de moeda mensalmente taxa de desemprego índice de preços ao consumidor IPC trimestralmente PIB anualmente orçamento do governo quinquenalmente isto é a cada cinco anos censo industrial dos Estados Unidos ou decenalmente censo demográfico Às vezes os dados estão disponí veis em séries trimestrais e anuais como no caso do PIB e das despesas de consumo Com o advento dos com putadores de alta velocidade os dados agora podem ser coletados a intervalos extremamente curtos como os relativos a preços das ações obtidos de forma praticamente contínua as chamadas cotações em tempo real Embora as séries temporais sejam muito usadas nos estudos econométricos apresentam proble mas especiais para o econometrista Como veremos mais adiante nos capítulos sobre econometria das séries temporais a maioria dos estudos empíricos embasados nesse tipo de dado pressupõe que a série temporal subjacente seja estacionária Embora ainda seja muito cedo para apresentar o signi ficado técnico preciso dessa característica de maneira geral uma série é estacionária se sua média e variância não variam sistematicamente ao longo do tem po Para entender o que isso significa con sidere a Figura 15 que ilustra o comportamento da oferta de moeda no seu conceito de Ml nos Esta dos Unidos de lo de janeiro de 1959 a setembro de 1999 Os dados numéricos são apresentados no Exercício 14 Como podemos ver na figura a oferta de moeda Ml mostra uma firme tendência ascen dente assim como uma variabilidade ao longo dos anos sugerindo que a série temporal de Ml não é estacionaria11 Exploraremos este tópico por completo no Capítulo 21 10 Para um relato informativo veja o livro de inTriliGaTor michael d Econometric models techniques and applications englewood Cliffs n J Prentice hall 1978 11 Para melhor entendermos dividimos os dados em quatro períodos de janeiro de 1951 a dezembro de 1962 de janeiro de 1963 a dezembro de 1974 de janeiro de 1975 a dezembro de 1986 e de janeiro de 1987 a setembro de 1999 os valores médios da oferta de moeda e seus desvios padrão entre parênteses foram de respectivamen te 16588 2327 32320 7266 78812 19543 e 1099 2784 todos os dados em bilhões de dólares isso é uma indicação grosseira do fato de que a oferta de moeda não foi estacionária durante todo o período ECONOBOOKindb 45 23112010 070919 46 Parte Um Modelos de regressão com equação única Dados em corte transversal Estes são dados em que uma ou mais variáveis foram coletadas no mesmo ponto do tempo como o censo demográfico que é feito a cada dez anos o mais recente é de 2000 as pesquisas de despesas do consumidor conduzidas pela Universidade de Michigan e naturalmente as pesquisas de opinião feitas pelo Gallup e inúmeras outras organizações A Tabela ll apresenta um exemplo concreto de dados em corte transversal Nela estão dados da produção e dos preços dos ovos nos 50 Estados americanos nos anos de 1990 e 1991 Para cada ano os dados dos 50 Estados são um corte transversal Portanto na Tabela 11 temos duas amostras em corte transversal Assim como as séries temporais têm problemas especiais devido à questão do caráter esta cionário os dados em corte transversal também têm seus problemas especificamente o da he terogeneidade Nos dados da Tabela 11 podemos ver que alguns estados produzem uma imensa quantidade de ovos por exemplo a Pensilvânia e outros muito pouco como o Alasca Quan do incluímos dados tão heterogêneos em uma análise estatística o efeito magnitude ou escala deve ser levado em conta a fim de não misturarmos maçãs com laranjas Para melhor entender mos na Figura 16 plotamos os dados sobre ovos produzidos e seus preços nos 50 Estados no ano de 1990 Esta figura mostra como as observações estão dispersas No Capítulo 11 veremos como o efeito escala pode ser um fator importante ao estimarmos relações entre variáveis eco nômicas Dados combinados Nos dados combinados há elementos tanto de séries temporais quanto de corte transversal Nos dados da Tabela 11 há um exemplo de dados combinados Para cada um dos anos temos 50 obser vações de corte transversal e para cada estado duas observações de séries temporais de preços e quantidade de ovos em um total de cem observações combinadas Do mesmo modo os dados no Exercício 11 são dados combinados pois o índice de Preços ao Consumidor IPC de cada país para o período 19802005 é uma série temporal enquanto os dados do IPC para os sete países em um único ano são de corte transversal Nos dados combinados temos um total de 182 observações 26 observações anuais para cada um dos sete países 55 0 60 65 70 75 80 85 90 95 200 400 600 800 1000 1200 fiGuRa 15 Oferta de moeda M1 nos Estados Unidos janeiro de 1951 a setembro de 1999 ECONOBOOKindb 46 23112010 070920 Capítulo 1 A natureza da análise de regressão 47 Dados em painel longitudinais ou de micropainel São um tipo especial de dados com binados nos quais a mesma unidade em corte transversal por exemplo uma família ou uma empre sa é pesquisada ao longo do tempo Por exemplo o Departa mento de Comércio dos Estados Unidos realiza periodicamente um censo habitacional Em cada levan tamento o mesmo domicílio ou as pessoas que moram no mesmo endereço é entrevistado para verificar se houve alguma alteração nas condições da residência e das finanças domiciliares desde o últi mo levantamento Ao entrevistarmos os mesmos domicílios periodicamente os dados em painel proporcionam informações muito úteis sobre a dinâmica do seu comportamento como veremos no Capítulo 16 Como um exemplo concreto considere os dados fornecidos na Tabela 12 Os dados da tabela coletados originalmente por Y Grunfeld referemse ao investimento ao valor da empresa e ao esto que de capital reais de quatro empresas americanas a saber General Electric GE US Steel US Tabela 11 Produção de ovos nos Estados Unidos estado Y1 Y2 X1 X2 estado Y1 Y2 X1 X2 al 2206 2186 927 914 mT 172 164 680 660 aK 07 07 1510 1490 ne 1202 1400 503 489 aZ 73 74 610 560 nv 22 18 539 527 ar 3620 3737 863 918 nh 43 49 1090 1040 Ca 7472 7444 634 584 nJ 442 491 850 830 Co 788 873 778 730 nm 283 302 740 700 CT 1029 948 1060 1040 nY 975 987 681 640 de 168 164 1170 1130 nC 3033 3045 828 787 Fl 2586 2537 620 572 nd 51 45 552 480 Ga 4302 4301 806 808 oh 4667 4637 591 547 hi 2275 2245 850 855 oK 869 830 1010 1000 id 187 203 791 729 or 652 686 770 746 il 793 809 650 705 Pa 4976 5130 610 520 in 5445 5290 627 601 ri 53 50 1020 990 ia 2151 2247 565 530 SC 1422 1420 701 659 KS 404 389 545 478 Sd 435 602 480 458 KY 412 483 677 735 Tn 277 279 710 807 la 273 254 1150 1150 TX 3317 3356 767 726 me 1069 1070 1010 970 UT 456 486 640 590 md 885 898 766 754 vT 31 30 1060 1020 ma 235 237 1050 1020 va 943 988 863 812 mi 1406 1396 580 538 Wa 1287 1313 741 715 mn 2499 2697 577 540 Wv 136 174 1040 1090 mS 1434 1468 878 867 Wi 910 873 601 540 mo 1580 1622 554 515 WY 17 17 830 830 Nota Y1 milhões de ovos produzidos em 1990 Y2 milhões de ovos produzidos em 1991 X1 preço dos ovos em 1990 centavos de dólar por dúzia X2 preço dos ovos em 1991 centavos de dólar por dúzia Fonte World Almanac 1993 p 119 Os dados são do Economic Research Service US Department of Agriculture ECONOBOOKindb 47 23112010 070920 48 Parte Um Modelos de regressão com equação única General Motors GM e Westinghouse WEST para o período de 1935195412 Como os dados fo ram coletados para diversas empresas ao longo de um número de anos este é um exemplo clássico de dados em painel Nessa tabela o número de observações para cada empresa é o mesmo mas nem sempre é esse o caso Se o número de observações for o mesmo para todas as empresas teremos um painel balanceado se o número de observações não for o mesmo para todas as empresas teremos um painel desbalanceado No Capítulo 16 Modelos de regressão de dados em painel examinare mos tais dados e mostraremos como estimar os modelos O propósito de Grunfeld ao coletar esses dados era verificar quanto o investimento bruto real I depende do valor real da empresa F no ano anterior e do estoque de capital real C no ano anterior Como as empresas incluídas no exemplo operam no mesmo mercado de capital ao estudálas juntas Grunfeld queria verificar se tinham as mesmas funções de investimento as fontes de dados13 Os dados utilizados para as análises empíricas podem ser coletados por órgãos do governo por exemplo Departamento de Comércio dos Estados Unidos organismos internacionais por exemplo Fundo Monetário Internacional FMI ou o Banco Mundial por organizações privadas por exemplo Standard Poors Corporation ou por pessoas físicas Há literalmente milhares dessas instituições coletando dados com diversas finalidades A Internet A Internet causou uma verdadeira revolução na coleta de dados Basta navegar na rede a partir de uma palavrachave como taxa de câmbio que você será soterrado por todo tipo de fonte de da dos No Apêndice E apresentamos uma seleção de sites frequentemente vi sitados que proporcio nam dados econômicos e financeiros de todos os tipos A maior parte dos da dos pode ser baixada sem grande custo Você pode incluir alguns desses sites que oferecem dados econômicos úteis em sua lista de favoritos Os dados coletados pelas várias instituições podem ser experimentais e não experimentais Os experimentais referemse em geral às ciências naturais e o pesquisador costuma coletálos mantendo 12 GrUnFeld Y The determinants of corporate investment 1958 Tese doutorado departmento de econo mia da Universidade de Chicago 1958 Trabalho não publicado esses dados se tornaram referência para ilus trar modelo de regressão de dados em painel 13 Para informações esclarecedoras veja SomerS albert T The US economy demystified What the major economic statistics mean and their significance for business lexington mass d C heath 1985 8000 6000 4000 Número de ovos produzidos em milhões de unidades 2000 0 40 60 80 100 Preço dos ovos em centavos de dólar por dúzia 120 140 160 fiGuRa 16 Relação entre quantidade e preços de ovos produzidos 1990 ECONOBOOKindb 48 23112010 070920 Capítulo 1 A natureza da análise de regressão 49 Tabela 12 Dados de investimentos para quatro empresas 19351954 observação I F1 C1 Ge 1935 331 11706 978 1936 450 20158 1044 1937 772 28033 1180 1938 446 20397 1562 1939 481 22562 1726 1940 744 21322 1866 1941 1130 18341 2209 1942 919 15880 2878 1943 613 17494 3199 1944 568 16872 3213 1945 936 20077 3196 1946 1599 22083 3460 1947 1472 16567 4564 1948 1463 16044 5434 1949 983 14318 6183 1950 935 16105 6474 1951 1352 18194 6713 1952 1573 20797 7261 1953 1795 23716 8003 1954 1896 27599 8889 GM 1935 3176 30785 28 1936 3918 46617 526 1937 4106 53871 1569 1938 2577 27922 2092 1939 3308 43132 2034 1940 4612 46439 2072 1941 5120 45512 2552 1942 4480 32441 3037 1943 4996 40537 2641 1944 5475 43793 2016 1945 5612 48409 2650 1946 6881 49000 4022 1947 5689 35265 7615 1948 5292 32457 9224 1949 5551 37002 10201 1950 6429 37556 10990 1951 7559 48330 12077 1952 8912 49249 14305 1953 13044 62417 17773 1954 14867 55936 22263 observação I F1 C1 uS 1935 2099 13624 538 1936 3553 18071 505 1937 4699 26733 1181 1938 2623 20397 2602 1939 2304 19573 3127 1940 3616 22029 2542 1941 4728 23805 2614 1942 4456 21686 2987 1943 3616 19851 3018 1944 2882 18139 2791 1945 2587 18502 2138 1946 4203 20677 2326 1947 4205 17967 2648 1948 4945 16258 3069 1949 4051 16670 3511 1950 4188 16774 3578 1951 5882 22895 3411 1952 6452 21594 4442 1953 6410 20313 6236 1954 4593 21155 6697 WeST 1935 1293 1915 18 1936 2590 5160 08 1937 3505 7290 74 1938 2289 5604 181 1939 1884 5199 235 1940 2857 6285 265 1941 4851 5371 362 1942 4334 5612 608 1943 3702 6172 844 1944 3781 6267 912 1945 3927 7372 924 1946 5346 7605 860 1947 5556 5814 1111 1948 4956 6623 1306 1949 3204 5838 1418 1950 3224 6352 1367 1951 5438 7328 1297 1952 7178 8641 1455 1953 9008 11935 1748 1954 6860 11889 2135 Notas Y I investimento bruto adições à planta e equipamentos mais manutenção e reparos em milhões de dólares deflacionados por P1 X2 F valor da empresa preço das ações ordinárias e preferenciais em 31 de dezembro ou preço médio em 31 de dezembro e 31 de janeiro do ano seguinte multiplicado pelo número de ações preferenciais em circulação mais o valor presente total da dívida em 31 de dezembro em milhões de dólares deflacionados por P2 X3 C estoque na planta e de equipamentos soma acumulada das adições líquidas à planta e aos equipamentos deflacionadas por P1 subtraída da provisão de depreciação deflacionada por P3 nessas definições P1 deflator de preço implícito dos equipamentos duráveis do produtor 1947 100 P2 deflator de preço implícito PIB 1947 100 P3 deflator de despesas de depreciação varição média em 10 anos do índice de preços no atacado dos metais e produtos metálicos 1947 100 Fonte reproduzido de VINOD H D ULLAH Aman Recent advances in regression methods Nova York Marcel Dekker 1981 p 259261 ECONOBOOKindb 49 23112010 070921 50 Parte Um Modelos de regressão com equação única certos fatores constantes para avaliar o impacto de outros aspectos sobre o fenômeno Por exemplo para avaliar o impacto da obesidade sobre a pressão sanguínea o pes quisador coletará dados para manter constantes os hábitos de alimen tação fumo e bebida das pessoas a fim de minimizar a influên cia dessas variáveis sobre a pressão sanguínea Nas ciências sociais os dados encontrados em geral são de natureza não experimental isto é não são controlados pelo pesquisador14 Por exemplo os dados relativos ao PIB ao desempre go aos preços das ações etc não estão sob o controle direto do pesquisador Como veremos a falta de controle geral mente cria problemas para o pesquisador que busca as causas exatas que afetam uma situação em particular Por exemplo é a oferta de moeda que de termina o PIB nominal ou é o inverso a precisão dos dados15 Embora haja fartura de dados disponíveis para a pesquisa econômica sua qualidade muitas ve zes deixa a desejar Há várias razões para tanto 1 Como já foi mencionado a maioria dos dados das ciências sociais são não experimentais por natureza Portanto há a possibilidade de ocorrerem erros de observação sejam intencionais ou não 2 Mesmo no caso dos dados expe rimentais erros de medição surgem em decorrência de apro ximações e arredondamentos 3 Nos levantamentos feitos por meio de questionários o problema da falta de respostas pode ser grave o pesquisador terá sorte se conseguir que 40 dos questionários sejam respondi dos Análises embasadas nessas respostas parciais podem não refletir verdadeiramente o comportamento dos 60 que não responderam levando assim ao que é conhecido como viés de seleção da amostra E há ainda o problema de que aqueles que respon dem ao questio nário não o fazem de forma completa especialmente pergun tas sobre tópicos financeiros delicados levando a novo viés de seleção 4 Os métodos de amostragem usados para a obtenção dos dados variam tanto que muitas vezes é difícil com parar os resultados obtidos em diversas amostras 5 Os dados econômicos em geral são apresentados em um nível muito agregado Por exemplo a maior parte dos macrodados por exemplo PIB emprego inflação desemprego só estão disponíveis para a economia como um todo ou para algumas grandes regiões geográficas Esses dados muito agregados pouco nos dizem sobre as microunidades individuais que po dem ser o objetivo final do estudo 6 Devido à confi dencialidade certos dados só são publicados em forma muito agregada A Receita Federal por exemplo não pode por lei revelar dados sobre declarações individuais só pode liberar al guns valores totais muito agregados Quem deseja saber quanto as pessoas com dado nível de renda gastam com saúde só pode verificar em nível muito agregado mas essa macroanálise muitas vezes deixa de revelar a dinâmica do comportamento das microuni dades Do mesmo modo o Departamento de Comércio que conduz um censo das em presas a cada cinco anos não pode revelar informações sobre produção emprego consumo de energia gastos com pesquisa e desenvolvimento etc em nível de empresa Portanto é difí cil estudar as diferenças entre empresas em relação a essas variáveis Como consequência desses e de muitos outros problemas o pesquisador sempre deve ter em men te que os resultados de sua pesquisa terão a mesma qualidade dos dados coletados Em certas situa ções quando os pesquisadores concluem que os resultados de seu trabalho são insatisfatórios a cau sa pode não estar no uso do modelo errado mas na má qualidade dos dados Infelizmente devido à natureza 14 nas ciências sociais às vezes também é possível fazer experimentos controlados no exercício 16 daremos um exemplo 15 Para uma revisão crítica veja morGenSTern o The accuracy of economic observations 2 ed Princeton n J Princeton University Press 1963 ECONOBOOKindb 50 23112010 070921 Capítulo 1 A natureza da análise de regressão 51 não experimental dos dados usados na maior parte dos estudos das ciências sociais os pesquisadores não têm outra opção senão depender daqueles disponíveis Mas devem ter sempre em mente que os dados empregados podem não ser os melhores e devem procurar não ser muito dogmáticos quanto aos resulta dos obtidos em determinado estudo especialmente quando a qualidade dos dados não é confiável uma nota sobre as escalas de medição das variáveis16 As variáveis que geralmente encontramos enquadramse em quatro categorias amplas escalas de razão de intervalo ordinal e nominal É importante entender o que cada uma delas representa Escala de razão Dada uma variável X que assume dois valores X1 e X2 a razão X1X2 e a dis tância X2 X1 são quantidades significativas Também há um ordenamento natural ascen dente ou descendente dos va lores ao longo da escala Portanto comparações como X2 X1 ou X2 X1 fazem sentido A maioria das variáveis econômicas pertence a esta categoria Faz sentido perguntar qual a diferença quantitativa entre o PIB deste ano e o do ano anterior A renda pessoal medida em dólares é uma escala de razão Alguém com um salário de 100 mil ganha duas vezes mais que alguém com um salário de 50 mil sem o desconto dos impostos é claro Escala de intervalo A escala de intervalo atende às duas últimas propriedades da escala de razão mas não à primeira A distância entre dois períodos de tempo por exemplo 20001995 é significativa mas não a razão entre eles 20001995 Às 11 horas horário local de 11 de agosto de 2007 a cidade de Portland em Oregon registrava uma temperatura de 60 oF enquanto que Talahasse na Flórida chegou a 90 oF A temperatura não é medida em uma escala de razão pois não faz sentido afirmar que Talahasse estava 50 mais quente que Portland Isso se deve principalmente ao fato de que a escala Fahrenheit não usa 0 grau como uma base natural Escala ordinal Uma variável se enquadra nesta categoria apenas se satisfaz à terceira proprie dade da escala de razão isto é o ordenamento natural Como exemplos podemos citar os sistemas de avaliação de alunos conceitos A B C ou as classes de renda alta média baixa No caso dessas variáveis há um ordena mento mas a distância entre as categorias não pode ser quan tificada Os estudantes de economia irão recordarse das curvas de indiferença entre dois bens em que cada curva mais elevada indica um nível mais alto de utilidade mas não se pode quantificar quanto uma curva de indiferença é superior a outras Escala nominal As variáveis desta categoria não têm nenhuma das características das variáveis da escala de razão Variáveis como gênero feminino masculino e estado civil solteiro casado divorciado separado apenas denotam categorias Pergunta por que essas variáveis não podem ser expressas em nenhuma das escalas anteriores Como veremos as técnicas econométricas que podem ser adequadas a variáveis com escala de razão podem não ser para as variáveis com escala nominal É importante ter em men te os quatro tipos de escalas de medida descritas acima Resumo e conclusões 1 A ideia principal por trás da análise de regressão é a dependência estatística de uma va riável a dependente a uma ou mais variáveis as explanatórias 2 O objetivo dessa análise é estimar eou prever o valor médio da variável dependente com base no valor conhecido ou fixado das variáveis explanatórias 16 as considerações a seguir baseiamse em SPanoS aris Probability theory and statistical inference econometric modeling with observational data nova York Cambridge University Press 1999 p 24 ECONOBOOKindb 51 23112010 070921 52 Parte Um Modelos de regressão com equação única 3 Na prática o sucesso da análise de regressão depende da disponibilidade de dados adequa dos Este capítulo discutiu a natureza as fontes e as limitações dos dados que em geral estão disponíveis para as pesquisas especialmente no campo das ciências sociais 4 Em qualquer pesquisa o pesquisador deve explicitar claramente as fontes dos dados usa dos na análise suas definições seus métodos de coleta e quaisquer lacunas ou omissões nos da dos bem como quaisquer revisões realizadas Não devemos esquecer que os dados macroeconômicos publicados pelo governo são revistos frequentemente 5 Como o leitor pode não ter tempo energia ou recursos para confirmar os dados ele tem o direito de acreditar que os dados usados pelo pesquisador foram coletados de forma adequa da e que os cálculos e análises estão corretos exeRCíCioS 11 A Tabela 13 apresenta dados relativos ao Índice de Preços ao Consumidor IPC de sete paí ses industrializados A base do índice é 19821984 100 Tabela 13 IPC em sete países industrializados 1980 2005 1982 1984 100 Fonte Economic Report of the President 2007 Tabela 108 p 354 ano eua Canadá Japão frança alemanha itália Reino unido 1980 824 761 910 722 867 639 785 1981 909 856 953 818 922 755 879 1982 965 949 981 917 970 878 954 1983 996 1004 998 1003 1003 1008 998 1984 1039 1047 1021 1080 1027 1114 1048 1985 1076 1090 1042 1143 1048 1217 1111 1986 1096 1135 1049 1172 1046 1289 1149 1987 1136 1184 1049 1211 1049 1351 1197 1988 1183 1232 1056 1243 1063 1419 1256 1989 1240 1293 1080 1287 1092 1507 1354 1990 1307 1355 1114 1329 1122 1604 1482 1991 1362 1431 1150 1372 1163 1705 1569 1992 1403 1453 1170 1404 1222 1795 1627 1993 1445 1479 1185 1434 1276 1877 1653 1994 1482 1482 1193 1458 1311 1953 1693 1995 1524 1514 1192 1484 1333 2056 1752 1996 1569 1538 1193 1514 1353 2138 1794 1997 1605 1563 1215 1532 1378 2182 1851 1998 1630 1578 1222 1542 1391 2225 1914 1999 1666 1605 1218 1550 1400 2262 1943 2000 1722 1649 1210 1576 1420 2319 2001 2001 1771 1691 1201 1602 1448 2383 2036 2002 1799 1729 1190 1633 1467 2443 2070 2003 1840 1777 1187 1667 1483 2508 2130 2004 1889 1810 1187 1703 1508 2563 2194 2005 1953 1849 1183 1732 1537 2613 2256 ECONOBOOKindb 52 23112010 070922 Capítulo 1 A natureza da análise de regressão 53 Tabela 14 Taxa de câmbio de nove países 19852006 ano austrália Canadá China Japão México Coreia do Sul Suécia Suíça Reino unido 1985 07003 13659 29434 23847 0257 87245 86032 24552 12974 1986 06709 13896 34616 16835 0612 88460 71273 17979 14677 1987 07014 13259 37314 14460 1378 82616 63469 14918 16398 1988 07841 12306 37314 12817 2273 73452 61370 14643 17813 1989 07919 11842 37673 13807 2461 67413 64559 16369 16382 1990 07807 11668 47921 14500 2813 71064 59231 13901 17841 1991 07787 11460 53337 13459 3018 73673 60521 14356 17674 1992 07352 12085 55206 12678 3095 78466 58258 14064 17663 1993 06799 12902 57795 11108 3116 80575 77956 14781 15016 1994 07316 13664 86397 10218 3385 80693 77161 13667 15319 1995 07407 13725 83700 9396 6447 77269 71406 11812 15785 1996 07828 13638 83389 10878 7600 80500 67082 12361 15607 1997 07437 13849 83193 12106 7918 95319 76446 14514 16376 1998 06291 14836 83008 13099 9152 140040 79522 14506 16573 1999 06454 14858 82783 11373 9553 118984 82740 15045 16172 2000 05815 14855 82784 10780 9459 113090 91735 16904 15156 2001 05169 15487 82770 12157 9337 129202 103425 16891 14396 2002 05437 15704 82771 12522 9663 125031 97233 15567 15025 2003 06524 14008 82772 11594 10793 119208 80787 13450 16347 2004 07365 13017 82768 10815 11290 114524 73480 12428 18330 2005 07627 12115 81936 11011 10894 102375 74710 12459 18204 2006 07535 11340 79723 11631 10906 95432 73718 12532 18434 Fonte Economic Report of The President 2007 Table B110 p 356 Capítulo 1 A natureza da análise de regressão 53 a Com base nos dados fornecidos calcule a taxa de inflação de cada país17 b Represente graficamente a taxa de inflação de cada país em relação ao tempo isto é use o eixo horizontal para o tempo e o eixo vertical para a taxa de inflação c Que conclusões gerais é possível tirar sobre a evolução da inflação nos sete países d Em que país a taxa de inflação parece ser a mais flutuante Há alguma explica ção para isso 12 a Usando a Tabela 13 represente as taxas de inflação do Canadá França Alemanha Itália Japão e Reino Unido em relação à taxa de inflação dos Estados Unidos b Faça um comentário geral sobre o comportamento das taxas de inflação dos seis países em relação à inflação dos Estados Unidos c Se você constatar que as taxas de inflação dos seis países evoluem no mesmo sentido que a dos Es tados Unidos isso sugere que a inflação dos Estados Unidos causa inflação nos outros paí ses Justifique 13 A Tabela 14 apresenta as taxas de câmbio em sete países industrializados no período 1985 2006 Exceto no caso do Reino Unido as taxas de câmbio estão definidas como unidades de moeda estrangeira por um dólar no caso do Reino Unido a taxa de câmbio é dada como o nú mero de dólares por uma libra esterlina 17 Subtraia do iPC do ano corrente o iPC do ano anterior divida a diferença pelo iPC do ano anterior e multiplique o resultado por 100 assim a taxa de inflação do Canadá em 1981 foi de 856 761761 x 100 1248 aproximadamente ECONOBOOKindb 53 23112010 070922 54 Parte Um Modelos de regressão com equação única 54 Parte Um Modelos de regressão com equação única 195901 1388900 1393900 1397400 1396900 1406800 1411700 195907 1417000 1419000 1410100 1404700 1403800 1399500 196001 1399800 1398700 1397500 1395600 1396100 1395800 196007 1401800 1413100 1411800 1409200 1408600 1406900 196101 1410600 1416000 1418700 1421300 1426600 1428800 196107 1429200 1434900 1437800 1441400 1447600 1452000 196201 1452400 1456600 1459600 1464000 1468400 1465800 196207 1464600 1465700 1463000 1467100 1472900 1478200 196301 1482600 1489000 1491700 1497000 1503900 1504300 196307 1513400 1517800 1519800 1525500 1536500 1532900 196401 1537400 1543100 1544800 1547700 1553300 1556200 196407 1568000 1578200 1587500 1592400 1599600 1603000 196501 1607100 1609400 1614700 1620300 1617000 1621900 196507 1630500 1636800 1648500 1659700 1667100 1678500 196601 1690800 1696200 1705100 1718100 1713300 1715700 196607 1703100 1708100 1719700 1711600 1713800 1720300 196701 1718600 1729900 1748100 1741700 1756800 1770200 196707 1781300 1797100 1806800 1816400 1823800 1832600 196801 1843300 1847100 1854700 1866000 1879900 1894200 196807 1904900 1918400 1927400 1940200 1960200 1974100 196901 1986900 1993500 2000200 2007100 2008100 2012700 196907 2016600 2017300 2021000 2029000 2035700 2038800 197001 2062200 2050000 2057500 2067200 2072200 2075400 197007 2079800 2099300 2118000 2128800 2136600 2144100 197101 2155400 2174200 2187700 2200000 2220200 2234500 197107 2248500 2255800 2264700 2271600 2277600 2283200 197201 2300900 2323200 2343000 2355800 2358900 2366200 197207 2387900 2409300 2431800 2450200 2464100 2492500 197301 2514700 2521500 2516700 2527400 2548900 2566900 197307 2575400 2577600 2578600 2590400 2609800 2628800 197401 2637600 2653100 2666800 2672000 2675600 2684400 197407 2692700 2701200 2710500 2723500 2737100 2742000 197501 2739000 2750000 2764200 2761700 2792000 2824300 197507 2836800 2841500 2856900 2853900 2868300 2870700 197601 2884200 2907600 2927000 2946600 2959300 2961600 197607 2972000 2990500 2996700 3020400 3035900 3062500 Continua a Represente graficamente a evolução das taxas de câmbio ao longo do tempo e comente sobre o comportamento geral dessa evolução b Dizse que o dólar apreciouse quando pode comprar mais unidades de moeda estrangeira Opostamente dizse que se depreciou quando compra menos unidades da moeda estran geira No período 19852006 qual foi o comportamento geral do dólar dos Estados Uni dos Aproveite para pesquisar em algum livro de macroeconomia ou de economia inter nacional os fatores que determinam a apreciação ou depreciação de uma moeda 14 A Tabela 15 apresenta os dados relativos à oferta monetária no conceito de M1 que aparecem na Figura 15 Você poderia apresentar razões para o aumento da oferta de moeda no período considerado Tabela 15 Oferta monetária ajustada no conceito de M1 janeiro de 1959 a julho de 1999 em bilhões de dólares Fonte Board of Governors Federal Reserve Bank Estados Unidos ECONOBOOKindb 54 23112010 070922 Capítulo 1 A natureza da análise de regressão 55 Capítulo 1 A natureza da análise de regressão 55 Continua Tabela 15 Continuação 197701 3082600 3115400 3139400 3160200 3171900 3187100 197707 3201900 3222700 3244800 3264000 3286400 3308700 197801 3344000 3353000 3369600 3399200 3448600 3468000 197807 3476300 3496600 3522600 3533500 3554100 3572800 197901 3586000 3599100 3624500 3680500 3695900 3733400 195901 1388900 1393900 1397400 1396900 1406800 1411700 195907 1417000 1419000 1410100 1404700 1403800 1399500 196001 1399800 1398700 1397500 1395600 1396100 1395800 196007 1401800 1413100 1411800 1409200 1408600 1406900 196101 1410600 1416000 1418700 1421300 1426600 1428800 196107 1429200 1434900 1437800 1441400 1447600 1452000 196201 1452400 1456600 1459600 1464000 1468400 1465800 196207 1464600 1465700 1463000 1467100 1472900 1478200 196301 1482600 1489000 1491700 1497000 1503900 1504300 196307 1513400 1517800 1519800 1525500 1536500 1532900 196401 1537400 1543100 1544800 1547700 1553300 1556200 196407 1568000 1578200 1587500 1592400 1599600 1603000 196501 1607100 1609400 1614700 1620300 1617000 1621900 196507 1630500 1636800 1648500 1659700 1667100 1678500 196601 1690800 1696200 1705100 1718100 1713300 1715700 196607 1703100 1708100 1719700 1711600 1713800 1720300 196701 1718600 1729900 1748100 1741700 1756800 1770200 196707 1781300 1797100 1806800 1816400 1823800 1832600 196801 1843300 1847100 1854700 1866000 1879900 1894200 196807 1904900 1918400 1927400 1940200 1960200 1974100 196901 1986900 1993500 2000200 2007100 2008100 2012700 196907 2016600 2017300 2021000 2029000 2035700 2038800 197001 2062200 2050000 2057500 2067200 2072200 2075400 197007 2079800 2099300 2118000 2128800 2136600 2144100 197101 2155400 2174200 2187700 2200000 2220200 2234500 197107 2248500 2255800 2264700 2271600 2277600 2283200 197201 2300900 2323200 2343000 2355800 2358900 2366200 197207 2387900 2409300 2431800 2450200 2464100 2492500 197301 2514700 2521500 2516700 2527400 2548900 2566900 197307 2575400 2577600 2578600 2590400 2609800 2628800 197401 2637600 2653100 2666800 2672000 2675600 2684400 197407 2692700 2701200 2710500 2723500 2737100 2742000 197501 2739000 2750000 2764200 2761700 2792000 2824300 197507 2836800 2841500 2856900 2853900 2868300 2870700 197601 2884200 2907600 2927000 2946600 2959300 2961600 197607 2972000 2990500 2996700 3020400 3035900 3062500 ECONOBOOKindb 55 23112010 070923 56 Parte Um Modelos de regressão com equação única 197701 3082600 3115400 3139400 3160200 3171900 3187100 197707 3201900 3222700 3244800 3264000 3286400 3308700 197801 3344000 3353000 3369600 3399200 3448600 3468000 197807 3476300 3496600 3522600 3533500 3554100 3572800 197901 3586000 3599100 3624500 3680500 3695900 3733400 197907 3772100 3788200 3792800 3808700 3808100 3817700 198001 3858500 3897000 3881300 3834400 3846000 3894600 198007 3949100 4000600 4053600 4090600 4103700 4080600 198101 4108300 4143800 4186900 4270600 4244300 4255000 198107 4279000 4278500 4274600 4284500 4308800 4361700 198201 4421300 4414900 4423700 4467800 4465300 4478900 198207 4490900 4524900 4575000 4645700 4711200 4743000 198301 4766800 4838500 4901800 4927700 4997800 5043500 198307 5089600 5116000 5134100 5172100 5185300 5207900 198401 5244000 5269900 5307800 5340300 5365900 5405400 198407 5421300 5423900 5438600 5438700 5473200 5511900 198501 5556600 5624800 5657400 5695500 5750700 5831700 198507 5908200 5980600 6044700 6079100 6118300 6193600 198601 6204000 6241400 6328100 6403500 6520100 6615200 198607 6722000 6807700 6885100 6952600 7052400 7242800 198701 7293400 7298400 7330100 7433900 7460000 7437200 198707 7449600 7469600 7486600 7565000 7528300 7496800 198801 7555500 7570700 7611800 7675700 7716800 7791000 198807 7834000 7850800 7848200 7836300 7844600 7862600 198901 7849200 7834000 7827400 7788200 7747900 7742200 198907 7797100 7811400 7822000 7870500 7879500 7925700 199001 7949300 7976500 8012500 8062400 8043600 8103300 199007 8118000 8178500 8218300 8203000 8220600 8245600 199101 8267300 8324000 8386200 8427300 8489600 8583300 199107 8629500 8686500 8715600 8784000 8879500 8967000 199201 9104900 9251300 9360000 9438900 9507800 9547100 199207 9646000 9757100 9888400 1004340 1016040 1024450 199301 1030900 1033150 1037990 1047470 1066220 1075610 199307 1085880 1095560 1105430 1113800 1123900 1129310 199401 1132200 1136130 1139910 1141420 1142850 1145650 199407 1151490 1151390 1152440 1150410 1150440 1149750 199501 1150640 1146740 1146520 1149480 1144650 1144240 199507 1146500 1146100 1142270 1136430 1133550 1126730 199601 1122580 1117530 1122590 1124520 1116300 1115470 199607 1112340 1102180 1095610 1082560 1080490 1081340 199701 1080520 1076200 1072420 1067450 1063370 1065990 Tabela 15 Continuação Continua ECONOBOOKindb 56 23112010 070923 Capítulo 1 A natureza da análise de regressão 57 empresa impressão em milhões Despesas em milhões de dólares de 1983 1 miller lite 321 501 2 Pepsi 996 741 3 Strohs 117 193 4 Fedl express 219 229 5 burger King 608 824 6 Coca Cola 786 401 7 mcdonalds 924 1859 8 mCi 507 269 9 diet Cola 214 204 10 Ford 401 1662 11 levis 408 270 12 bud lite 104 456 13 aTTbell 889 1549 14 Calvin Klein 120 50 15 Wendys 292 497 16 Polaroid 380 269 17 Shasta 100 57 18 meow mix 123 76 19 oscar meyer 234 92 20 Crest 711 324 21 Kibbles n bits 44 61 Tabela 16 Impacto das despesas com publicidade Fonte Disponível em httplibstartcmu edu DASLDatafilestvadsdat html 15 Suponha que você quisesse desenvolver um modelo econômico de atividades criminosas como as horas gastas nessas atividades por exemplo a venda de drogas ilegais Que variá veis consideraria Verifique se seu modelo combina com o desenvolvido pelo economista ganhador do Nobel Gary Becker18 16 Experimentos controlados de economia em 7 de abril de 2000 o presidente Clinton sancionou uma lei aprovada pelo Congresso que eliminava as restrições aos ganhos dos beneficiários da Previdência Social Até então os beneficiários com idade entre 65 e 69 anos que ganhassem mais de 17 mil ao ano perderiam o equivalente a 1 do benefício para cada 3 ganhos além daqueles 17 mil Como você conceberia um estudo visando avaliar o impacto dessa mudança legal Nota na lei antiga não havia nenhuma limitação de renda para os beneficiários com mais de 70 anos 17 Os dados apresentados na Tabela 16 foram divulgados na edição do The Wall Street Journal de lo de março de 1984 Relacionam o orçamento de publicidade em milhões de dólares de 18 beCKer G S Crime and punishment an economic approach Journal of Political Economy 1968 v 76 p 169217 199707 1067570 1072080 1064820 1062060 1067530 1074870 199801 1073810 1076020 1080650 1082090 1078170 1077780 199807 1075370 1072210 1074650 1080400 1088960 1093350 199901 1091000 1092650 1102010 1108400 1104750 1101110 199907 1099530 1102400 1093460 Tabela 15 Continuação ECONOBOOKindb 57 23112010 070923 58 Parte Um Modelos de regressão com equação única 21 em presas em 1983 com as impressões retidas semanalmente pelos que viram os produtos anun ciados por essas empresas Os dados foram obtidos em uma pesquisa realizada com 4 mil adultos em que foi pedido aos usuários dos produtos que citassem um comercial da catego ria do produto que tivessem assistido na semana anterior a Trace um gráfico com as impressões no eixo vertical e os gastos com publicidade no eixo horizontal b O que você poderia dizer sobre a natureza da relação entre as duas variáveis c Examinando o gráfico você acha que vale a pena anunciar Pense em todos os comerciais veiculados em finais de campeonatos de esportes ou no horário nobre Nota nos próximos capítulos exploraremos mais os dados da Tabela 16 58 Parte Um Modelos de regressão com equação única ECONOBOOKindb 58 23112010 070923 59 Análise de regressão com duas variáveis algumas ideias básicas No Capítulo l examinamos o conceito de regressão em termos gerais Neste trataremos o as sunto de maneira mais formal Especificamente aqui e nos três capítulos seguintes apresentaremos ao leitor a teoria que fundamenta a análise de regressão mais simples possível isto é a regressão bivariada ou com duas variáveis na qual a variável dependente regressando se relaciona a uma única variável explanatória regressor Esse caso é considerado primeiro não por ser mais prático mas porque apresenta as ideias fundamentais da análise de regressão da maneira mais simples pos sível e alguns desses conceitos podem ser ilustrados com gráficos bidimensionais Além disso como veremos a análise de regressão múltipla mais geral em que o regressando se relaciona a um ou mais regressores é sob muitos aspectos uma extensão lógica do caso de duas variáveis 21 Um exemplo hipotético1 Como observado na Seção 12 a análise de regressão trata em grande parte da estimação eou previ são do valor médio para a população da variável dependente com base nos valores conhecidos ou fixa dos da variável explanatória2 Para melhor entender considere os dados da Tabela 21 Eles se referem a uma população total de 60 famílias de uma comunidade hipotética e sua renda X e despesas de consu mo Y semanais ambas medidas em dólares As 60 famílias foram divididas em dez grupos de renda de 80 a 260 e as despesas semanais de cada família nos vários grupos são apresentadas na tabela Portanto temos dez valores fixados de X e os valores correspondentes de Y para cada um dos valores de X Então podemos dizer que há dez subpopulações de Y Existe uma variação considerável nas despesas de consumo semanais dentro de cada grupo de renda o que pode ser visto claramente na Figura 21 Mas de modo geral observase que a despeito da variabilidade dos gastos semanais de consumo em cada classe de renda as despesas aumentam em média com o aumento da renda Para facilitarmos o entendimento na Tabela 21 apresentamos o gas to de consumo médio de cada uma das dez classes de renda Para um nível de renda semanal de 80 as despesas de consumo médias são de 65 enquanto para um nível de renda de 200 são de 137 Ao todo temos dez valores médios para as dez subpopulações de Y Chamamos esses valores médios de valores esperados condicionais pois dependem dos valores dados da variável condicionante X 1 o leitor que considera seus conhecimentos estatísticos um tanto enferrujados pode atualizálos com a leitura do Apêndice A esta tístico antes de ler este capítulo 2 o valor esperado ou esperança ou média populacional de uma variável aleatória Y é denotado pelo símbolo EY Por outro lado o valor médio calculado com base nos valores de uma amostra da população Y é repre sentado como Y que se lê como Y barra Capítulo 2 ECONOBOOKindb 59 23112010 070923 60 Parte Um Modelos de regressão com equação única Tabela 21 Renda familiar semanal X em X Y 80 100 120 140 160 180 200 220 240 260 Despesas de consumo semanais das famílias Y em 55 65 79 80 102 110 120 135 137 150 60 70 84 93 107 115 136 137 145 152 65 74 90 95 110 120 140 140 155 175 70 80 94 103 116 130 144 152 165 178 75 85 98 108 118 135 145 157 175 180 88 113 125 140 160 189 185 115 162 191 Total 325 462 445 707 678 750 685 1043 966 1211 65 77 89 101 113 125 137 149 161 173 Médias condicionais de Y EY jX fiGuRa 21 Distribuição condicional das despesas para vários níveis de renda dados da Tabela 21 Despesas de consumo semanais em 100 150 200 Renda semanal em 80 100 120 140 160 180 200 220 240 260 50 EYX Simbolicamente são denotados como EY X que se lê como valor esperado de Y dado o valor de X veja também a Tabela 22 É importante distinguir esses valores esperados condicionais dos valores esperados incondicionais das despesas semanais de consumo EY Se somarmos as despesas de consumo semanais das 60 famí lias da população e dividirmos esse total por 60 obteremos o número 12120 727260 que é a média incondicional ou esperada das despesas de consumo semanais EY é incondicional no sentido de que para chegar a esse total desconsideramos a classe de renda das várias famílias3 Obvia mente os diversos valores esperados condicionais de Y fornecidos na Tabela 21 são diferentes do valor esperado incondicional de Y 12120 Quando perguntamos Qual o valor esperado das despesas de consumo semanais médias de uma família obtemos a resposta 12120 a média incondicional Mas se perguntarmos Qual o valor esperado das despesas de consumo semanais de uma família cuja renda mensal é de 140 a resposta será 101 a média condicional Em outras palavras se pergun tássemos Qual a melhor previsão média das despesas semanais de famílias com uma renda sema nal de 140 a resposta seria 101 Conhecer a classe de renda pode nos permitir prever melhor o valor médio das despesas de consumo do que se não tivermos esse dado4 Esta provavelmente é a essência da análise de regressão como descobriremos ao longo do livro 3 Conforme mostrado no Apêndice A em geral os valores das médias condicionais e incondicionais são diferentes 4 devo a James davidson esta perspectiva veja davidSon James Econometric theory oxford r U blackwell Publishers 2000 p 11 ECONOBOOKindb 60 23112010 070924 Capítulo 2 Análise de regressão com duas variáveis algumas ideias básicas 61 Na Figura 21 os pontos pretos circulados mostram os valores médios condicionais de Y para os diversos valores de X Se unirmos os valores médios condicionais obteremos o que é conhecido como linha de regressão populacional LRP ou de modo mais geral a curva de regressão po pulacional5 Simplificando é a regressão de Y contra X O qualificativo populacional expressa o fato de que neste exemplo estamos lidando com toda a população de 60 famílias Na realidade uma população tem muito mais famílias Em termos geométricos uma curva de regressão populacional é apenas o local geométrico das médias condicionais da variável dependente para os valores fixados das variávelis explanatórias De modo mais simples é a curva que conecta as médias das subpopulações de Y correspondentes aos valores dados do regressor X A Figura 22 ilustra a definição Essa figura mostra que para cada X isto é nível de renda há uma população de valores de Y despesas de consumo semanais que se espalham em torno da média condicional desses valores de Y Para simplificarmos pressupomos que esses valores de Y distribuemse simetri camente em torno de seus respectivos valores médios condicionais e que a linha ou curva passa por esses valores médios condicionais 5 no presente exemplo a lrP é uma linha reta mas também poderia ser uma curva veja a Figura 23 X pY jXi 80 100 120 140 160 180 200 220 240 260 Probabilidades condicionais 1 5 1 6 1 5 1 7 1 6 1 6 1 5 1 7 1 6 1 7 1 5 1 6 1 5 1 7 1 6 1 6 1 5 1 7 1 6 1 7 pYjXi 1 5 1 6 1 5 1 7 1 6 1 6 1 5 1 7 1 6 1 7 1 5 1 6 1 5 1 7 1 6 1 6 1 5 1 7 1 6 1 7 1 5 1 6 1 5 1 7 1 6 1 6 1 5 1 7 1 6 1 7 1 6 1 7 1 6 1 6 1 7 1 6 1 7 1 7 1 7 1 7 65 77 89 101 113 125 137 149 161 173 Média condicional de Y Tabela 22 Probabilidades condicionais pY Xi dos dados da Tabela 21 fiGuRa 22 Linha de regressão populacional dados da Tabela 21 Despesas de consumo semanais em Valores médios condicionais Y X EY Xi Distribuição de Y dado X 220 149 101 65 80 140 220 Renda semanal em ECONOBOOKindb 61 23112010 070925 62 Parte Um Modelos de regressão com equação única Com essa referência em mente talvez seja interessante ao leitor reler a definição de regressão dada na Seção 12 22 Conceito de função de regressão populacional FRP Do que foi dito anteriormente e das Figuras 21 e 22 fica claro que cada média condicional EY Xi é uma função de Xi em que Xi é um dado valor de X Simbolicamente EY j Xi D f Xi 221 em que fXi representa uma função da variável explanatória X Em nosso exemplo EY Xi é uma função linear de Xi A Equação 221 é conhecida como a função de esperança condicional FEC ou função de regressão populacional FRP ou resumidamente regressão populacional RP Ela afirma que o valor esperado da distribuição de Y dado Xi tem uma relação funcional com Xi Ou seja a resposta média de Y varia com X Qual é a forma assumida pela função fXi Essa é uma pergunta importante porque em situações reais não temos a população inteira disponível para examinar A forma funcional da FRP é portanto uma questão empírica embora em casos específicos a teoria tenha algo a dizer Por exemplo um economista poderia postular que a despesa de consumo tem uma relação linear com a renda Como primeira aproxi mação ou hipótese de trabalho podemos su por que a FRP EY Xi é uma função linear de Xi do tipo EY j Xi D Ø1 C Ø2Xi 222 em que Ø1 e Ø2 são parâmetros desconhecidos mas fixos chamados de coeficientes de regressão Ø1 e Ø2 também são conhecidos como intercepto e coeficiente angular respectivamente A Equação 221 é conhecida como função linear de regressão populacional Algumas ex pressões alternativas usadas na literatura são modelo linear de regressão populacional ou regressão linear populacional A partir de agora as expressões regressão equação de regressão e modelo de regressão serão usa das como sinônimos Na análise de regressão nosso interesse está em estimar funções de regressão populacional como a Equação 222 isto é estimar os valores de incógnitas como Ø1 e Ø2 com base nas observações de Y e X Esse tópico será visto em detalhe no Capítulo 3 23 O significado do termo linear Como este livro trata principalmente dos modelos lineares como a Equação 222 é essencial conhe cer qual o verdadeiro significado do termo linear pois pode ser interpretado de duas maneiras diferentes linearidade nas variáveis O primeiro e talvez o significado mais natural de linearidade é o caso em que a expecta tiva condicional de Y é uma função linear de Xi como por exemplo a Equação 2226 Em termos geométricos a curva de regressão nesse caso é uma reta Sob essa interpretação uma função de regressão como EY Xi Ø1 Ø2X i 2 não é uma função linear porque a variável X aparece com um expoente ou índice de 2 6 dizse que uma função Y f X é linear em X se X tiver um expoente ou índice de 1 isto é termos como X2 X e assim por diante estão excluídos e não estiver multiplicado ou dividido por qualquer outra variável por exemplo X Z ou XZ em que Z é outra variável Se Y depende apenas de X outra maneira de dizer que Y se relaciona linearmente com X é que a taxa de variação de Y em relação a X isto é a inclinação ou derivada de Y com relação a X dYdX independe do valor de X assim se Y 4X dYdX 4 que é independente do valor de X mas se Y 4X2 dYdX 8X que não é independente do valor assumido por X nesse caso a função não é linear em X ECONOBOOKindb 62 23112010 070926 Capítulo 2 Análise de regressão com duas variáveis algumas ideias básicas 63 linearidade nos parâmetros A segunda interpretação de linearidade é que a expectativa condicional de Y EY Xi é uma função linear dos parâmetros os Ø pode ou não ser linear na variável X7 De acordo com essa in terpretação EY Xi Ø1 Ø2X i 2 é um modelo de regressão linear nos parâmetros Para ver isto suponhamos que X assuma o valor 3 Portanto EY X 3 Ø1 9Ø2 que é obviamente linear em Ø1 e Ø2Todos os modelos da Figura 23 são portanto modelos de regressão linear isto é modelos lineares nos parâmetros Agora considere o modelo EY Xi Ø1 Ø2 2Xi Suponha que X 3 então teremos EY Xi Ø1 3Ø2 2 que é nãolinear no parâmetro Ø2 Esse modelo é um exemplo de modelo de regressão nãolinear nos parâmetros Examinaremos tais modelos no Capítulo 14 Das duas interpretações de linearidade a linearidade nos parâmetros é a relevante para a formu lação da teoria da regressão que apresentaremos em breve De agora em diante a expressão regres são linear significará sempre uma regressão linear nos parâmetros os Ø isto é os parâmetros são elevados apenas à primeira potência Podem ou não ser lineares nas variáveis explanatórias os X Na Tabela 23 mostramos isso esquematicamente Assim EY Xi Ø1 Ø2Xi que é linear tanto nos parâmetros quanto na variável é um modelo de regressão linear MRL assim como EY Xi Ø1 Ø2X i 2 que é linear nos parâmetros mas não na variável X 7 dizse que uma função é linear no parâmetro Ø1 se Ø1 só aparece com um expoente 1 e não está multiplicado ou dividido por nenhum outro parâmetro por exemplo Ø1Ø2 Ø2Ø1 e assim por diante Quadrática Y X Y X 1 2 X2 3 Y X β1 β2 β3 X2 X3 β4 Cúbica Y X Exponencial Y X Y e β1 β2 X Ø Ø Ø fiGuRa 23 Funções lineares nos parâmetros Tabela 23 Modelos de regressão linear Nota MRL Modelo de Regressão Linear MRNL Modelo de Regressão Não Linear Modelo linear nos parâmetros Modelo linar nas variáveis Sim Não Sim MRL MRL Não MRNL MRNL ECONOBOOKindb 63 23112010 070927 64 Parte Um Modelos de regressão com equação única 24 Especificação estocástica da FRP A Figura 21 deixa claro que à medida que a renda familiar aumenta em média as despesas de consumo das famílias aumentam Mas o que acontece com as despesas de consumo de uma família em relação ao nível fixado de sua renda A Tabela 21 e a Figura 21 mostram que as despesas de consumo de uma família não aumentam necessariamente quando aumenta seu nível de renda Por exemplo na Tabela 21 observamos que há uma família com um nível de renda de 100 cuja des pesa de consumo de 65 é menor que as despesas de consumo de duas outras famílias cuja renda semanal é de apenas 80 Mas observe que as despesas médias de consumo das famílias com renda se manal de 100 são maiores que as despesas médias das famílias cuja renda semanal é de 80 77 comparados a 65 O que podemos dizer sobre a relação entre as despesas de consumo de uma família e um nível de renda Vemos na Figura 21 que para um nível de renda Xi as despesas médias de consumo de uma família agrupamse em torno do consumo mé dio de todas as famílias deste nível Xi isto é em torno de sua esperança condicional Portanto podemos expressar o desvio individual de Yi em torno de seu valor esperado como a seguir ui D Yi EY j Xi ou Yi H EY j Xi C ui 241 em que o desvio ui é uma variável aleatória nãoobservável que assume valores positivos ou negati vos Tecnicamente ui é conhecida como distúrbio estocástico ou termo de erro estocástico Como interpretamos a Equação 241 Podemos dizer que a despesa de consumo de uma família individual dado seu nível de renda pode ser expressa como a soma de dois componen tes 1 EY Xi que é simplesmente o gasto médio em consumo de todas as famílias com o mesmo nível de renda esse componente é conhecido como sistemático ou determinístico e 2 ui que é o componente aleatório ou nãosistemático Examinaremos em breve a natureza do termo distúrbio estocástico mas no momento suporemos que seja um substituto ou represen tante proxy de todas as variáveis omitidas ou negligenciadas que podem afetar Y mas não fo ram ou não pude ram ser incluídas no modelos de regressão Se supomos que EY Xi é linear em Xi como na Equação 222 a Equação 241 pode ser escrita da seguinte maneira Yi D EY j Xi C ui H Ø1 C Ø2Xi C ui 242 A Equação 242 informa que as despesas de consumo de uma família relacionamse linearmente com sua renda mais o termo de erro estocástico Assim as despesas de consumo individuais dado X 80 veja a Tabela 21 podem ser expressas como Y1 H 55 H Ø1 C Ø280 C u1 Y2 H 60 H Ø1 C Ø280 C u2 Y3 H 65 H Ø1 C Ø280 C u3 Y4 H 70 H Ø1 C Ø280 C u4 Y5 H 75 H Ø1 C Ø280 C u5 243 ECONOBOOKindb 64 23112010 070929 Capítulo 2 Análise de regressão com duas variáveis algumas ideias básicas 65 Agora se tomarmos o valor esperado de 241 nos dois lados da equação obtemos EYi j Xi D EEY j Xi C Eui j Xi H EY j Xi C Eui j Xi 244 em que levamos em consideração o fato de que o valor esperado de uma constante é a própria constante8 Observe atentamente que na Equação 244 tomamos a esperança condicional condicionada a um dado X Como EYi Xi é o mesmo que EY Xi a Equação 244 implica que Eui j Xi D 0 245 Assim a suposição de que a linha de regressão passa pelas médias condicionais de Y veja a Figura 22 implica que os valores médios condicionais de ui condicionados a um dado X sejam iguais a zero Com base no que foi discutido é claro que as Equações 222 e 242 são formas equivalentes se Eui Xi 09 Mas a especificação estocástica na Equação 242 tem a vantagem de mostrar cla ramente que há outras variáveis além da renda que afetam as despesas de consumo e que os gastos de consumo de uma família não podem ser completamente explicados apenas pelas variáveis incluídas no modelo de regressão 25 O significado do termo erro estocástico Como observado na Seção 24 o termo de erro ui representa todas as variáveis omitidas no mo delo mas que coletivamente afetam Y A pergunta óbvia é por que não introduzir essas variáveis ex plicitamente no modelo Ou seja por que não formular um modelo de re gressão com o máximo de variáveis possíveis Há muitas razões 1 Caráter vago da teoria a teoria se existe alguma que explica o comportamento de Y pode ser e muitas vezes é incompleta Podemos saber com certeza que a renda semanal X influencia as despesas de consumo semanais Y mas podemos desconhecer ou não ter certeza de quais são as outras variáveis que afetam Y Portanto ui pode ser usado como um substituto para todas as variáveis excluídas ou omitidas do modelo 2 Indisponibilidade de dados mesmo se soubermos quais são algumas das variáveis excluídas e por tanto considerarmos uma regressão múltipla em vez da simples talvez não tenhamos informações quantitativas a respeito dessas variáveis É muito comum na análise empírica que os dados que gostaríamos idealmente de incluir não estejam disponíveis Por exemplo em princípio poderíamos incluir a riqueza da família além da renda como variável explanatória para explicar as despesas de consumo mas infelizmente essa informação não costuma estar disponível Podemos ser obriga dos a omitir a variável riqueza de nosso modelo apesar de sua grande relevância teórica para expli car as despesas de consumo 3 Variáveis essenciais versus variáveis periféricassecundárias suponha que no nosso exemplo de con sumo e renda além da renda X1 o número de filhos por família X2 o gênero X3 a religião X4 a escolaridade X5 e a região geográfica X6 também afetem as despesas de consumo Mas é bem pos sível que a influência conjunta de todas ou de algumas dessas variáveis seja tão pequena e seja na melhor das hipóteses nãosistemática ou aleatória que em termos práticos e para consideração de custos não compense incluílas explicitamente no modelo Esperase que seu efeito combinado possa ser tratado como uma variável aleatória ui10 4 Caráter intrinsecamente aleatório do comportamento humano mesmo se conseguirmos incluir todas as variáveis relevantes no modelo sempre haverá uma aleatoriedade intrínseca 8 veja o Apêndice A no qual apresentamos uma breve discussão das propriedades do operador esperança E observe que EY Xi uma vez que o valor de Xi é fixo é uma constante 9 a propósito no método dos mínimos quadrados que examinaremos no Capítulo 3 supõese explicitamen te que euixi 0 veja a Seção 32 10 Uma dificuldade adicional é que variáveis como gênero escolaridade e religião são difíceis de quantificar ECONOBOOKindb 65 23112010 070929 66 Parte Um Modelos de regressão com equação única nos Y individuais que não pode ser explicada por mais que nos esforcemos para tanto Os termos de erro os u podem refletir bem a aleatoriedade intrínseca 5 Variáveis proxy pouco adequadas embora o modelo clássico de regressão que será examinado no Capítulo 3 suponha que as variáveis Y e X sejam medidas com exatidão na prática os dados podem estar infestados de erros de medição Veja por exemplo a conhecida teoria da função consumo de Milton Friedman11 Ele considera o consumo permanente Y P como uma função da renda perma nente X P Mas como os dados relativos a essas variáveis não são diretamente observáveis na prática utilizamos variáveis proxy como consumo corrente Y e renda corrente X que são observáveis Como os Y e X observados podem não ser iguais aos Y P e X P há um problema de erro de medição Nesse caso o termo de erro u também pode representar erro de medição Como veremos em um capítulo mais à frente se existirem tais erros de medição eles podem ter sérias implicações na estimativa dos coeficientes da regressão os Ø 6 Princípio da parcimônia de acordo com a navalha de Occam12 o ideal seria formular o modelo de regressão mais simples possível Se pudermos explicar parte substancial do comportamento de Y com duas ou três variáveis explanatórias e se nossa teoria não for suficientemente forte para sugerir quais outras variáveis podem ser incluídas por que adicionar mais variáveis Melhor deixar que ui represente todas as outras variáveis Naturalmente não deveríamos excluir variáveis importantes e relevantes para apenas manter o modelo de regressão simples 7 Forma funcional errada mesmo se as variáveis explanatórias de um fenômeno forem teorica mente corretas e mesmo se encontrarmos dados para essas variáveis muitas vezes desconhece remos a forma funcional da relação entre o regressando e os regressores As despesas de consumo serão uma função linear invariável da renda ou uma função nãolinear invariável Se for o primeiro caso Yi Ø1 Ø2Xi ui será a relação funcional apropriada entre Y e X mas se for o segundo Yi Ø1 Ø2 Xi Ø3 Xi 2 ui pode ser a forma funcional correta Nos modelos de duas variáveis a forma funcional da relação pode muitas vezes ser inferida do gráfico de dispersão Mas em um modelo de regressão múltipla não é fácil determinar a relação funcional adequada pois não podemos visualizar graficamente diagramas de dispersão com múltiplas dimensões Por todas essas razões o termo de erro estocástico ui assume um papel fundamental na análise de regressão como veremos no decorrer do livro 26 A função de regressão amostral FRA Até agora ao limitar nosso exame dos valores de Y correspondentes aos X fixados para a popula ção evitamos deliberadamente quaisquer considerações relativas à amostragem observe que os dados da Tabela 21 representam a população não uma amostra Mas já está na hora de enfrentar os pro blemas nas amostras pois na maioria das situações práticas o que temos é uma amostra de valores de Y correspondentes a alguns X fixados Nossa tarefa agora é estimar a função de regressão com base em informações amostrais Para ilustrar imagine que a população da Tabela 21 seja desconhecida e que a única infor mação que tenhamos seja uma amostra selecionada aleatoriamente de valores de Y para os X fixados como na Tabela 24 Ao contrário da Tabela 21 só temos um valor de Y para cada X cada Y dado Xi na Tabela 24 foi escolhido aleatoriamente dentre os Y correspondentes aos Xi dados para a população mostrada na Tabela 21 A pergunta é com base na amostra da Tabela 24 é possível prever as despesas médias de consu mo semanais Y para a população como um todo correspondentes aos X escolhidos Em outras pala vras podemos estimar a FRP com base nos dados da amostra Como o leitor seguramente desconfia 11 Friedman milton A theory of the consumption function Princeton n J Princeton University Press 1957 12 as descrições devem ser mantidas o mais simples possível até que se prove sua inadequação neWman J r Coord The world of mathematics nova York Simon Schuster 1956 v 2 p 1247 ou as entidades não deveriam ser multiplicadas além do necessário In morriSon donald F Applied linear statistical meth ods englewood Cliffs n J Prentice hall 1983 p 58 ECONOBOOKindb 66 23112010 070930 Capítulo 2 Análise de regressão com duas variáveis algumas ideias básicas 67 não seremos capazes de estimar precisamente a FRP devido a variações amostrais Para melhor entender suponha que selecionemos outra amostra aleatória da população da Tabela 21 como a que aparece na Tabela 25 Representando graficamente os dados das Tabelas 24 e 25 obtemos o diagrama de dispersão apresentado na Figura 24 No diagrama traçamos duas linhas de regressão amostral para ajustar os pontos razoavelmente FRA1 baseiase na primeira amostra e FRA2 na segunda Qual das duas linhas de regressão representa a linha de regressão populacional real Se evitarmos a tentação de olhar a Figura 21 que por definição representa a regressão populacional não há como ter certeza absoluta de qual das linhas de regressão da Figura 24 representa a verdadeira linha ou curva de regressão populacional As linhas de regressão da Figura 24 são conhecidas como linhas de regressão amostral Supostamente representam a linha de regressão populacional mas devido às variações amos trais elas são no máximo aproximações da verdadeira regressão populacional Em geral obtemos N diferentes FRAs para N amostras diferentes e estas FRAs provavelmente não serão as mesmas Agora tal como no caso da FRP subjacente à linha de regressão populacional podemos formular o conceito de função de regressão amostral FRA para representar a linha de regressão da amostra A equação correspondente à 222 para a amostra pode ser escrita como i H 1 C 2Xi ØO ØO YO 261 em que Ŷ lêse Y chapéu Ŷi estimador de EY Xi Ø1 estimador de Ø1 Ø2 estimador de Ø2 Observe que um estimador também conhecido como estatística amostral é apenas uma regra ou fórmula ou método que nos diz como estimar o parâmetro da população com base nas informações oferecidas pela amostra que temos à mão Um valor numérico em particular obtido pela aplicação do estimador é conhecido como estimativa13 Pode ser visto como aleatório mas uma estimativa não é aleatória Por quê Agora assim como expressamos a FRP de duas formas equivalentes Equação 222 e Equação 224 podemos expressar a FRA na Equação 261 em sua forma estocástica como a seguir Yi H 1 C 2Xi C iuO ØO ØO 262 13 Como mencionado na introdução o chapéu sobre a variável representa um estimador do valor populacional relevante Tabela 24 Amostra aleatória da população da Tabela 21 Y X 70 80 65 100 90 120 95 140 110 160 115 180 120 200 140 220 155 240 150 260 Y X 55 80 88 100 90 120 80 140 118 160 120 180 145 200 135 220 145 240 175 260 Tabela 25 Outra amostra aleatória da população da Tabela 21 ECONOBOOKindb 67 23112010 070931 68 Parte Um Modelos de regressão com equação única fiGuRa 24 Linhas de regressão baseadas em duas amostras diferentes Despesas de consumo semanais em Primeira amostra Tabela 24 150 50 80 180 220 Renda semanal em 160 140 120 100 200 260 240 200 Segunda amostra Tabela 25 100 Regressão baseada nos dados da segunda amostra Regressão baseada nos dados da primeira amostra FRA2 FRA1 em que além dos símbolos já definidos ûi denota o termo residual na amostra Conceitualmente ûi é análogo a ui e pode ser considerado uma estimativa de ui Foi incluído na FRA pelas mesmas razões que ui foi incluído na FRP Resumindo então verificamos que nosso objetivo primordial na análise de regressão é estimar a FRP Yi H Ø1 C Ø2Xi C ui 242 com base na FRA Yi H 1 C xi C i ØO ØO uO 262 porque frequentemente nossa análise baseiase em uma única amostra de alguma população Mas devido a variações amostrais nossas estimativas da FRP com base na FRA são na melhor das hipóteses apenas uma aproximação Essa aproximação é apresentada graficamente na Figura 25 Para X Xi temos uma observação amostral Y Yi Em termos da FRA o Yi observado pode ser expresso como Yi H i C i YO uO 263 e em termos de FRP como Yi H EY j Xi C ui 264 Obviamente na Figura 25 Ŷi superestima a verdadeira EY Xi para o Xi nela mostrado Da mesma forma para cada Xi à esquerda do ponto A a FRA subestimará a verdadeira FRP Contudo o leitor pode ver facilmente que essas sobre e subestimações são inevitáveis devido às variações amostrais A pergunta crítica agora é sabendo que a FRA não é mais do que uma aproximação da FRP podemos formular uma regra ou um método que torne essa aproximação a mais próxima possível Em outras pa lavras como devemos formular a FRA para que Ø1 fique o mais próximo possível do verdadeiro Ø1 e Ø2 do verdadeiro Ø2 mesmo que nunca venhamos a saber quais são os verdadeiros Ø1 e Ø2 ECONOBOOKindb 68 23112010 070933 Capítulo 2 Análise de regressão com duas variáveis algumas ideias básicas 69 A resposta para essa pergunta ocupará grande parte de nossa atenção no Capítulo 3 Aqui desta camos que é possível desenvolver procedimentos que nos digam como formular a FRA a fim de espelhar FRP o mais fielmente possível É fascinante considerar que isso pode ser feito mesmo que nunca determinemos a FRP real 27 Exemplos ilustrativos Concluiremos este capítulo com dois exemplos14 exeMPlo 21 Saláriohora médio segundo o nível de escolaridade a Tabela 26 apresenta dados relativos ao nível de escolaridade medido pelo número de anos de frequência escolar o saláriohora médio das pessoas em cada nível de escolaridade e o número de pessoas em cada um desses níveis ernst berndt obteve originalmente os dados apresentados na tabela com base em um levantamento da população conduzido em maio de 198514 Tabela 26 Salário médio segundo nível de escolaridade Fonte Adaptado de GOLDBERGER Arthur S Introductory econometrics Cambridge Mass Harvard University Press 1998 p 5 Anos de estudo Salário médio hora Número de pessoas 6 44567 3 7 57700 5 8 59787 15 9 73317 12 10 73182 17 11 65844 27 12 78182 218 13 78351 37 14 110223 56 15 106738 13 16 108361 70 17 136150 24 18 135310 31 Total 528 14 berndT ernst r The practice of econometrics classic and contemporary reading mass addison Wesley 1991 Convém mencionar que se trata de um livro excelente no qual o leitor poderá ver como os econometris tas conduzem suas pesquisas Despesas de consumo semanais em FRA Xi Renda semanal em Y X EY Xi Yi Yi 1 2Xi FRP EY Xi 1 2Xi Yi EY Xi ui ui Yi Yi A ØO ØO Ø Ø fiGuRa 25 Linhas de regressão para uma amostra e para a população ECONOBOOKindb 69 23112010 070934 70 Parte Um Modelos de regressão com equação única exeMPlo 21 Continuação representando graficamente o salário médio condicional em relação à educação obtemos o diagrama da Figura 26 a curva de regressão mostra como os salários médios variam com o nível de escolaridade eles em geral aumentam com o nível de escolaridade o que não surpreende estudaremos mais adiante como outras variáveis além da escola ridade também afetam o salário médio fiGuRa 26 Relação entre salários médios e nível de escolaridade 18 16 14 12 10 8 6 4 6 8 10 12 14 Anos de estudo Salário médio Valor médio exeMPlo 22 Pontuação em matemática no Teste de Aptidão Escolar segundo a renda familiar a Tabela 210 no exercício 217 fornece dados sobre a pontuação média no Teste de aptidão escolar Scholastic aptitude Test SaT em aptidão verbal matemática e redação para alunos que estão se preparando para ingressar no ensino superior com base em 947347 estudantes que realizaram o teste em 2007 Traçando graficamente a pontuação média em matemática com base na renda média familiar obtivemos a Figura 27 Nota como a renda da primeira e última categorias mostrada na Tabela 210 tem natu reza ilimitada preconizouse que a menor renda média familiar seria de 5 mil e a maior seria de 150 mil fiGuRa 27 Relação entre pontuação média em matemática no SAT e renda média familiar 160000 120000 80000 40000 Renda média familiar em 0 440 460 480 Pontuação média em matemática 560 540 520 500 Continua ECONOBOOKindb 70 23112010 070934 Capítulo 2 Análise de regressão com duas variáveis algumas ideias básicas 71 exeMPlo 22 Continuação Como a Figura 27 mostra a pontuação média em matemática acompanha o aumento da renda familiar Como o número de estudantes que realizam o exame SaT é bastante grande provavelmente representa toda a população de alunos que fizeram o teste Portan to a linha de regressão traçada na Figura 27 provavelmente representa a linha de regressão populacional Pode haver várias razões para a relação positiva observada entre as duas variáveis Por exemplo é possível argumentar que os estudantes de famílias com maior nível de renda tenham mais condições de arcar com aulas particulares ou cursos preparatórios para o teste além disso os pais dos estudantes de famílias de renda mais alta provavelmente têm esco laridade maior Também é possível que alunos com maior pontuação em matemática ve nham de escolas melhores o leitor pode fornecer outras explicações para a relação positiva observada entre as duas variáveis Resumo e conclusões 1 O conceitochave subjacente à análise de regressão é o de função de esperança condicional FEC ou função de regressão populacional FRP Nosso objetivo na análise de regressão é verificar como o valor médio da variável dependente ou regressando varia com o valor da variável explanatória regressor 2 Este livro trata principalmente de FRPs lineares isto é regressões que são lineares nos parâmetros Elas podem ou não ser lineares no regressando ou nos regressores 3 Para fins empíricos o que importa é a FRP estocástica O termo de erro estocástico ui desem penha um papel fundamental na estimação da FRP 4 A FRP é um conceito idealizado já que na prática muito raramente temos acesso a toda a população que nos interessa Em geral temos uma amostra de observações da população Portanto utilizamos as funções estocásticas de regressão amostral FRA para estimar a FRP No Capítulo 3 veremos como fazer isso exeRCíCioS 21 O que é função de esperança condicional ou função de regressão populacional 22 Qual a diferença entre as funções de regressão populacional e amostral Essa distinção é indiferente 23 Qual o papel do termo de erro estocástico ui na análise de regressão Qual a diferença entre o termo de erro estocástico e o resíduo ûi 24 Por que precisamos da análise de regressão Por que não usar simplesmente o valor médio do regressando como o melhor valor 25 O que entendemos por modelo de regressão linear 26 Determine se os modelos a seguir são lineares nos parâmetros ou nas variáveis ou em ambos Quais destes modelos são modelos de regressão linear Modelo Título descritivo a Yi D Ø1 C Ø2 1 Xi C ui Recíproco b Yi D Ø1 C Ø2 ln Xi C ui Semilogarítmico c ln Yi H Ø1 C Ø2Xi C ui Semilogarítmico inverso d ln Yi H ln Ø1 C Ø2 ln Xi C ui Logarítmico ou duplo logaritmo e ln Yi H Ø1 Ø2 1 Xi C ui Logarítmico recíproco Nota ln logaritmo natural isto é logaritmo de base e ui é o termo de erro estocástico Estudaremos esses modelos no Capítulo 6 ECONOBOOKindb 71 23112010 070935 72 Parte Um Modelos de regressão com equação única 27 Os modelos a seguir são modelos de regressão linear Justifique sua resposta a Yi H eØ1CØ2 XiCu i b Yi H 1 1 C eØ1CØ2 Xi Cu i c ln Yi D Ø1 C Ø2 1 Xi C ui d Yi D Ø1 C 075 Ø1eØ2Xi 2 C ui e Yi D Ø1 C Ø3 2 Xi C ui 28 O que entendemos por modelo de regressão intrinsecamente linear Se Ø2 no Exercício 27d fosse 08 seria um modelo de regressão linear ou nãolinear 29 Considere os modelos nãoestocásticos a seguir isto é modelos sem termo de erro estocástico São modelos de regressão linear Se não forem é possível por meio de manipu lações algébricas adequa das convertêlos em modelos lineares a Yi D 1 Ø1 C Ø2Xi b Yi D Xi Ø1 C Ø2Xi c Yi D 1 1 C exp Ø1 Ø2Xi 210 Dados o gráfico de dispersão da Figura 28 e linha de regressão correspondente que conclusão geral você tiraria do diagrama A linha de regressão da figura é populacional ou amostral 211 Com base no diagrama de dispersão da Figura 29 que conclusões gerais poderiam ser tiradas Qual a teoria econômica que embasa o gráfico Dica pesquise em um livro de economia inter nacional o modelo de comércio de HeckscherOhlin 212 O que o gráfico de dispersão da Figura 210 revela Você afirmaria que a legislação relativa ao salário mínimo contribui para o bemestar econômico fiGuRa 28 Taxas de crescimento das exportações e dos salários no setor industrial Dados para 50 países em desenvolvimento 19701990 Fonte World Bank World Development Report 1995 p 55 A fonte original reúne dados da UNIDO e do Banco Mundial 008 006 004 002 000 Variação média anual da razão exportaçõesPIB Variação média nos salários da indústria em por ano 002 004 006 008 6 4 2 0 2 4 6 8 10 12 Leste da Ásia e Pacífico América Latina e Caribe Sul da Ásia África Subsaariana Oriente Médio e norte da África 72 Parte Um Modelos de regressão com equação única ECONOBOOKindb 72 23112010 070936 Capítulo 2 Análise de regressão com duas variáveis algumas ideias básicas 73 020 1 2 3 4 PNB per capita em milhares de dólares Razão entre o total do salário mínimo recebido durante 12 meses e o PNB per capita 5 6 7 8 9 10 04 06 08 10 12 14 16 18 fiGuRa 210 Salário mínimo e PNB per capita A amostra é formada por 17 países em desenvolvimento Os anos variam por país no período de 1988 a 1992 Os dados estão em preços internacionais Fonte World Bank World Development Report 1995 p 75 fiGuRa 29 Intensidade de qualificação das exportações e dotação de capital humano Os dados se referem a 126 países industrializados e em desenvolvimento em 1985 Os valores no eixo horizontal são os logaritmos da razão entre a escolaridade média do país e sua área no eixo vertical estão os logaritmos da razão entre exportações de matériasprimas e produtos manufaturados Fonte World Bank World Development Report 1995 p 59 Fontes primárias para as exportações banco de dados COMTRADE das Nações Unidas para a escolaridade dados da UNDP 1990 e para a terra dados do Banco Mundial 0 Abundância de terra trabalhadores menos qualificados Escassez de terra trabalhadores mais qualificados 1 2 3 4 5 6 7 8 9 10 11 12 4 3 2 1 0 1 Mais manufaturados nas exportações Mais matériasprimas nas exportações 2 3 4 5 6 7 Médias regionais Leste da Ásia e Pacífico América Latina e Caribe Sul da Ásia Economais de mercado industrializadas África Subsaariana 213 A linha de regressão apresentada na Figura 13 da Introdução é uma FRP ou uma FRA Por quê Como você interpretaria os pontos situados em torno da linha de regressão Além do PIB que outros fatores ou variáveis poderiam determinar as despesas pessoais de consumo exercícios aplicados 214 Com os dados da Tabela 27 relativos aos Estados Unidos nos período 19802006 a Represente graficamente a relação entre a taxa de participação dos homens na força de trabalho civil e a taxa de desemprego civil dos homens Trace a olho uma linha de regres são que passe pelos pontos A priori qual a relação esperada entre as duas variáveis e em que teoria econômica está embasada O diagrama de dispersão respalda essa teoria Capítulo 2 Análise de regressão com duas variáveis algumas ideias básicas 73 ECONOBOOKindb 73 23112010 070937 74 Parte Um Modelos de regressão com equação única b Faça o mesmo para as mulheres c Agora represente graficamente a taxa de participação de homens e mulheres em relação aos ganhos médios por hora em dólares de 1982 Você pode usar gráficos separados O que constatou Como você justificaria isso d É possível representar graficamente a taxa de participação na força de trabalho em rela ção à taxa de desemprego e aos ganhos médios por horas simultaneamente Em caso negativo como você expressaria a relação entre as três variáveis 215 A Tabela 28 apresenta dados sobre despesas com alimentação e totais em rupias para uma amostra de 55 domicílios rurais da Índia No início de 2000 um dólar americano era equiva lente a cerca de 40 rupias indianas a Represente graficamente os dados colocando no eixo vertical as despesas com alimentação e no eixo horizontal os gastos totais Trace uma linha de regressão b Que conclusões gerais você pode tirar deste exemplo c Você esperaria a priori que as despesas com alimentação aumentassem linearmente com o aumento das despesas totais independentemente do nível destas Por quê Utilize a despesa total como uma proxy para o nível de renda total Tabela 27 Dados da participação na força de trabalho nos Estados Unidos 19802006 Anos TPFTCH1 TPFTCM2 TDCH3 TDCM4 GMH825 GMH6 1980 7740000 5150000 6900000 7400000 7990000 6840000 1981 7700000 5210000 7400000 7900000 7880000 7430000 1982 7660000 5260000 9900000 9400000 7860000 7860000 1983 7640000 5290000 9900000 9200000 7950000 8190000 1984 7640000 5360000 7400000 7600000 7950000 8480000 1985 7630000 5450000 7000000 7400000 7910000 8730000 1986 7630000 5530000 6900000 7100000 7960000 8920000 1987 7620000 5600000 6200000 6200000 7860000 9130000 1988 7620000 5660000 5500000 5600000 7810000 9430000 1989 7640000 5740000 5200000 5400000 7750000 9800000 1990 7640000 5750000 5700000 5500000 7660000 10190000 1991 7580000 5740000 7200000 6400000 7580000 10500000 1992 7580000 5780000 7900000 7000000 7550000 10760000 1993 7540000 5790000 7200000 6600000 7520000 11030000 1994 7510000 5880000 6200000 6000000 7530000 11320000 1995 7500000 5890000 5600000 5600000 7530000 11640000 1996 7490000 5930000 5400000 5400000 7570000 12030000 1997 7500000 5980000 4900000 5000000 7680000 12490000 1998 7490000 5980000 4400000 4600000 7890000 13000000 1999 7470000 6000000 4100000 4300000 8000000 13470000 2000 7480000 5990000 3900000 4100000 8030000 14000000 2001 7440000 5980000 4800000 4700000 8110000 14530000 2002 7410000 5960000 5900000 5600000 8240000 14950000 2003 7350000 5950000 6300000 5700000 8270000 15350000 2004 7330000 5920000 5600000 5400000 8230000 15670000 2005 7330000 5930000 5100000 5100000 8170000 16110000 2006 7350000 5940000 4600000 4600000 8230000 16730000 Fonte Economic Report of the President 2007 As citações abaixo se referem ao documento original 1TPFTCH Taxa de participação na força de trabalho civil homens Tabela B39 p277 2TPFTCM Taxa de participação na força de trabalho civil mulheres Tabela B39 p277 3TDCH Taxa de desemprego civil homens Tabela B42 p280 4TDCM Taxa de desemprego civil mulheres Tabela B42 p280 5GMH82 ganho médio por hora em dólares de 1982 Tabela B47 p286 6GMH ganho médio por hora em dólares correntes Tabela B47 p286 ECONOBOOKindb 74 23112010 070937 Capítulo 2 Análise de regressão com duas variáveis algumas ideias básicas 75 Tabela 28 Despesas totais e com alimentação em rupias Despesas com Despesa Despesas com Despesa 1 2170000 3820000 29 3900000 6550000 2 1960000 3880000 30 3850000 6620000 3 3030000 3910000 31 4700000 6630000 4 2700000 4150000 32 3220000 6770000 5 3250000 4560000 33 5400000 6800000 6 2600000 4600000 34 4330000 6900000 7 3000000 4720000 35 2950000 6950000 8 3250000 4780000 36 3400000 6950000 9 3360000 4940000 37 5000000 6950000 10 3450000 5160000 38 4500000 7200000 11 3250000 5250000 39 4150000 7210000 12 3620000 5540000 40 5400000 7300000 13 3150000 5750000 41 3600000 7310000 14 3550000 5790000 42 4500000 7330000 15 3250000 5850000 43 3950000 7450000 16 3700000 5860000 44 4300000 7510000 17 3900000 5900000 45 3320000 7520000 18 4200000 6080000 46 3970000 7520000 19 4100000 6100000 47 4460000 7690000 20 3830000 6160000 48 4800000 7730000 21 3150000 6180000 49 3520000 7730000 22 2670000 6230000 50 4100000 7750000 23 4200000 6270000 51 3800000 7850000 24 3000000 6300000 52 6100000 7880000 25 4100000 6350000 53 5300000 7900000 26 2200000 6400000 54 3600000 7950000 27 4030000 6480000 55 3050000 8010000 28 3500000 6500000 Observação alimentação total Observação alimentação total Fonte MUKHERJEE Chandan WHITE Howard WUYTS Marc Econometrics and data analysis for developing countries Nova York Routledge 1998 p 457 216 A Tabela 29 apresenta dados sobre a pontuação média do Teste de Aptidão Escolar SAT para os estudantes que se preparavam para ingressar no ensino superior no período 19671990 a Use o eixo horizontal para os anos e o eixo vertical para a pontuação obtida para traçar as notas nas provas de aptidão verbal e matemática obtidas por homens e mulheres separadamente b Que conclusões gerais você tirou desses gráficos c Conhecendo a pontuação de homens e mulheres nos testes de aptidão verbal você pode ria prever suas notas em matemática d Represente graficamente as notas de matemática das mulheres em relação às dos homens O que você observa 217 A Tabela 210 apresenta dados sobre a pontuação média no SAT em relação à renda para três tipos de provas aptidão verbal matemática e redação No Exemplo 22 apresentamos a Figu ra 27 que representa graficamente a pontuação média em matemática em relação à renda média familiar a Consulte a Figura 27 e prepare um gráfico semelhante relacionando as notas de aptidão verbal à renda média familiar Compare seus resultados com aqueles da Figura 27 b Repita o exercício a relacionando as notas de redação à renda média familiar c Examinando os três gráficos que conclusões gerais você pode tirar ECONOBOOKindb 75 23112010 070938 76 Parte Um Modelos de regressão com equação única Nota para o período 19721986 aplicouse uma fórmula à média original e ao desvio padrão para converter a média para a esca la normatizada recentered scale Para o período 19871995 as notas individuais dos alunos foram convertidas para a escala normatizada e em seguida a média foi recalculada No período de 19961999 praticamente todos os alunos receberam notas na escala normatizada Todas as notas que ainda estavam na escala original foram convertidas para a escala normatizada antes do cálculo da média No período 20002007 todas as notas foram publicadas na escala normatizada Aptidão verbal Matemática Ano Homens Mulheres Total Homens Mulheres Total 1972 531 529 530 527 489 509 1973 523 521 523 525 489 506 1974 524 520 521 524 488 505 1975 515 509 512 518 479 498 1976 511 508 509 520 475 497 1977 509 505 507 520 474 496 1978 511 503 507 517 474 494 1979 509 501 505 516 473 493 1980 506 498 502 515 473 492 1981 508 496 502 516 473 492 1982 509 499 504 516 473 493 1983 508 498 503 516 474 494 1984 511 498 504 518 478 497 1985 514 503 509 522 480 500 1986 515 504 509 523 479 500 1987 512 502 507 523 481 501 1988 512 499 505 521 483 501 1989 510 498 504 523 482 502 1990 505 496 500 521 483 501 1991 503 495 499 520 482 500 1992 504 496 500 521 484 501 1993 504 497 500 524 484 503 1994 501 497 499 523 487 504 1995 505 502 504 525 490 506 1996 507 503 505 527 492 508 1997 507 503 505 530 494 511 1998 509 502 505 531 496 512 1999 509 502 505 531 495 511 2000 507 504 505 533 498 514 2001 509 502 506 533 498 514 2002 507 502 504 534 500 516 2003 512 503 507 537 503 519 2004 512 504 508 537 501 518 2005 513 505 508 538 504 520 2006 505 502 503 536 502 518 2007 504 502 502 533 499 515 Tabela 29 Pontuação obtida nos testes de aptidão escolar dos estudantes que se preparavam para ingressar no ensino superior 19722007 Fonte College Board 2007 ECONOBOOKindb 76 23112010 070939 Capítulo 2 Análise de regressão com duas variáveis algumas ideias básicas 77 Tabela 210 Pontuação obtida nos testes de aptidão escolar classificada por renda familiar Fonte College Board 2007 Alunos ingressando no ensino superior Tabela 11 Renda Familiar Número de alunos que realizam o teste Média DP Média DP Média DP Aptidão verbal Matemática Redação 10000 40610 427 107 451 122 423 104 1000020000 72745 453 106 472 113 446 102 2000030000 61244 454 102 465 107 444 97 3000040000 83685 476 103 485 106 466 98 4000050000 75836 489 103 486 105 477 99 5000060000 80060 497 102 504 104 486 98 6000070000 75763 504 102 511 103 493 98 7000080000 81627 508 101 516 103 498 98 80000100000 130752 520 102 529 104 510 100 100000 245025 544 105 556 107 537 103 ECONOBOOKindb 77 23112010 070939 78 Modelo de regressão de duas variáveis o problema da estimação Como visto no Capítulo 2 nossa primeira tarefa é estimar a função de regressão populacional FRP com base na função de regressão amostral FRA da maneira mais precisa possível No Apêndice A examinaremos dois métodos de estimação muito usados 1 o dos mínimos quadrados ordinários MQO e 2 o de máxima verossimilhança MV Em grande parte o primeiro método é o mais utilizado para a análise de regressão principalmente porque é intuitivamente convin cente e matematicamente muito mais simples que o da máxima verossimilhança Além disso como mostraremos mais adiante no contexto da regressão linear os dois costumam proporcionar resultados similares 31 Método dos mínimos quadrados ordinários Este método é atribuído a Carl Friedrich Gauss um matemático alemão Sob certas hipóteses que serão discutidas na Seção 32 o MQO tem algumas propriedades estatísticas muito atraentes que o tor naram um dos métodos de análise de regressão mais poderosos e difundidos Para que você o entenda explicaremos primeiro o princípio dos mínimos quadrados Recordando a FRP de duas variáveis Yi DØ1 C Ø2Xi C ui 242 No entanto como vimos no Capítulo 2 a FRP não pode ser observada diretamente Temos de estimá la por meio da FRA Yi D 1 C 2Xi C uO i D i C i ØO ØO YO uO 262 263 em que YOi é o valor estimado média condicional de Yi Mas como determinamos a FRA propriamente dita Primeiro expressamos 263 como uOi DYi YOi DYi 1 2Xi ØO ØO 311 que mostra que uOi os resíduos são simplesmente as diferenças entre os valores observados e estima dos de Y Capítulo 3 ECONOBOOKindb 78 23112010 070940 Capítulo 3 Modelo de regressão de duas variáveis o problema da estimação 79 Agora dados n pares de observações de Y e X queremos determinar a FRA de maneira que fique o mais próximo possível do Y observado Para tanto podemos adotar o seguinte critério escolher a FRA de tal forma que a soma dos resíduos PuOi D P Yi YOi seja a menor possível Embora con vincente esse não é um critério muito bom como se pode ver pelo diagrama de dispersão hipotético apresentado na Figura 31 Se adotarmos o critério de minimizar o PuOi a Figura 31 mostra que os resíduos uO2 e uO3 bem como os resíduos uO1 e uO4 têm o mesmo peso na soma uO1 C uO2 C uO3 C uO4 embora os dois primeiros estejam muito mais próximos da FRA que os dois últimos Em outras palavras todos os resíduos recebem a mes ma importância independentemente de quão próximos ou distantes estejam das observações individuais em relação à FRA Como consequência é bem possível que a soma algébrica dos uO1 seja pequena ou até zero embora os û1 estejam muito dispersos em relação à FRA Para melhor entender atribua a uO1 uO2 uO3 e uO4 da Figura 31 os valores de 10 2 C 2 e 10 respectivamente A soma algébrica desses resíduos é zero embora uO1 e uO4 estejam bem mais afastados da FRA do que uO2 e uO3 Podemos evitar o problema adotando o critério dos mínimos quadrados segundo o qual a FRA pode ser fixada de tal maneira que uO2 i D Yi 2 D Yi 1 2Xi2 YOi ØO ØO 312 seja o menor possível onde os uOi 2 são os resíduos elevados ao quadrado Ao eleválos ao quadrado este método dá mais peso aos resíduos como û1 e uO4 da Figura 31 do que aos resíduos uO2 e uO3 Como já foi mencionado sob o critério do mínimo PuOi o somatório pode ser pequeno embora os uOi estejam muito dispersos em relação à FRA Mas isso não é possível sob o critério dos mínimos quadrados porque quanto maior uOi em valores absolutos maior PuOi 2 Outra justificativa para o uso do método de mínimos quadrados é que os estimadores obtidos têm algumas propriedades estatísticas muito dese jáveis como veremos em breve Com base na Equação 312 tornase óbvio que 2 D f uO i 1 ØO ØO2 313 isto é a soma do quadrado dos resíduos é uma função dos estimadores ØO1 e ØO2 Para qualquer con junto de dados a escolha de valores diferentes para ØO1 e ØO2 resultará em û diferentes e portanto em valores diferentes de PuOi 2 Considere os valores hipoté ticos de Y e X apresentados nas duas primeiras fiGuRa 31 Critério dos mínimos quadrados FRA X1 Y X Yi Ø 1 Ø 2Xi Yi X2 X3 X4 u1 u2 u3 u4 ECONOBOOKindb 79 23112010 070941 80 Parte Um Modelos de regressão com equação única colunas da Tabela 31 Façamos dois experimentos No primeiro considere ØO1 D 1572 e ØO2 D 13571 Usando esses valores de ØO e os valores de X fornecidos da coluna 2 da Tabela 31 podemos calcular facilmente os Yi estimados dados na coluna 3 como YO1i em que o subscrito l indica o primeiro ex perimento Agora vamos conduzir outro experimento desta vez utilizando os valores ØO1 D 3 e ØO2 D 1 Os valores estimados de Yi neste experimento aparecem como YO2i na coluna 6 da Tabela 31 Como os valores de ØO nos dois experimentos são diferentes obtemos valores diferentes para os resíduos es timados como se vê na tabela os uO1i são os resíduos do primeiro experimento e os uO2i resíduos do segundo Os quadrados desses resíduos estão nas colunas 5 e 8 Obviamente como poderíamos esperar da Equação 313 a soma dos quadrados desses resíduos são diferentes já que têm como base conjuntos diferentes de valores de ØO Que conjunto de valores de ØO devemos escolher Como os valores de ØO do primeiro experimento nos fornecem um PuOi 2 menor D 12214 do que os obtidos com os valores de ØO no segundo experi mento D14 podemos dizer que os ØO do primeiro experimento são os melhores valores Mas como sabemos disso Se tivéssemos tempo e paciência infinitos poderíamos conduzir muitos mais experi mentos desse tipo escolhendo diferentes conjuntos de ØO a cada vez comparando os PuOi 2 resultantes e escolhendo o conjunto de valores de ØO que nos dessem o menor valor possível de PuOi 2 supondo é claro que tivéssemos considerado todos os valores possíveis de Ø1 e Ø2 Mas como tempo e certa mente paciência são em geral escassos precisamos encontrar algum atalho para esse processo de ten tativa e erro Felizmente o método dos mínimos quadrados oferece tal atalho O princípio ou mé todo dos mínimos quadrados escolhe ØO1 e ØO2 de tal forma que para qualquer amostra ou conjunto de dados o PuOi 2 é o menor possível Em outras palavras para uma dada amostra o método dos mínimos quadrados nos oferece estimativas únicas de Ø1 e Ø2 que proporcionam o menor valor possível de PuOi 2 Como isso é feito É um exercício direto de cálculo diferencial Como mostra o Apêndice 3A em sua Seção 3A1 o processo de diferenciação resulta nas seguin tes equações para estimar Ø1 e Ø2 Yi H nØO1 C 2 Xi ØO 314 Yi Xi H 1 Xi C 2 X2 i ØO ØO 315 em que n é o tamanho da amostra Essas equações simultâneas são conhecidas como equações nor mais Resolvendo simultaneamente as equações normais obtemos 1 estes valores foram obtidos aplicandose o método dos mínimos quadrados que veremos em breve veja as equações 316 e 317 Tabela 31 Determinação experimental da FRA Yi Xt ˆY1i û1i û1i 2 ˆY2i û2i û2i 2 1 2 3 4 5 6 7 8 4 1 2929 1071 1147 4 0 0 5 4 7000 2000 4000 7 2 4 7 5 8357 1357 1841 8 1 1 12 6 9714 2286 5226 9 3 9 Soma 28 Notas ˆY1i H 1572 C 1357Xi isto é ˆØ1 H 1572 e ˆØ2 H 1357 ˆY2i H 30 C 10Xi isto é ˆØ1 H 3 e ˆØ2 H 10 û1i H Yi ˆY1i û2i H Yi ˆY2i 16 00 12214 0 14 ECONOBOOKindb 80 23112010 070942 Capítulo 3 Modelo de regressão de duas variáveis o problema da estimação 81 2 H n XiYi Xi Yi n X2 i Xi 2 H Xi X Yi Y Xi X 2 H xi yi x2 i ØO 316 em que X e Y são as médias amostrais de X e de Y e onde definimos xi D Xi X e yi D Yi Y Daqui em diante usaremos letras minúsculas para indicar os desvios em relação aos valores mé dios 1 H X2 i Yi Xi XiYi n X2 i Xi 2 H Y 2X ØO ØO S 317 O último passo da Equação 317 pode ser obtido diretamente na Equação 314 com manipulações algébricas simples Vale notar que fazendo uso de identidades algébricas simples a Fórmula 316 para estimar de Ø2 também pode ser expressa como 2 H xi yi x2 i H xiYi X2 i nX 2 H X i yi X2 i nX 2 ØO 3182 Os estimadores obtidos anteriormente são conhecidos como estimadores de mínimos quadra dos pois são derivados do princípio dos mínimos quadrados Note as seguintes propriedades numé ricas dos estimadores obtidos por meio do método dos MQO Propriedades numéricas são aquelas que se sustentam em consequência do uso dos mínimos quadrados ordinários independentemente das formas pelas quais os dados foram gerados3 Em breve veremos as propriedades estatísticas dos estimadores de MQO isto é as propriedades que se mantêm apenas sob certas hipóteses sobre a forma como os dados foram gerados4 Veja o modelo clássico de regressão linear na Seção 32 I Os estimadores de MQO são expressos unicamente em termos de quantidades observáveis amostrais como X e Y Portanto podem ser calculados com facilidade 2 Nota 1 x2 i D Xi 2 D X2 i 2 Xi C 2 D X2 i 2 Xi C X 2 X X X X pois X é uma constante notando também que Xi D n e 2 D n X2 X X pois X é uma constante obtemos por fim x2 i D 2 i n X 2 X Nota 2 xi yi D xi Yi D xi Yi xi D xi Yi Xi D xi Yi Y Y Y X pois Y é uma constante e já que a soma dos desvios de uma variável em relação ao seu valor médio por exemplo P Xi X é sempre zero da mesma forma P yi D P Yi Y D 0 3 davidSon russell maCKinnon James G Estimation and inference in econometrics nova York oxford Univer sity Press 1993 p 3 4 ibid ECONOBOOKindb 81 23112010 070945 82 Parte Um Modelos de regressão com equação única II São estimadores pontuais isto é dada a amostra cada estimador proporciona apenas um único valor ponto do parâmetro populacional relevante No Capítulo 5 veremos os cha mados estimadores de intervalo que oferecem um leque de valores possíveis para os pa râmetros desconhecidos da população III Uma vez obtidas as estimativas de MQO para os dados amostrais a linha de regressão amos tral Figura 31 pode ser obtida facilmente A linha de regressão assim obtida tem as seguin tes propriedades 1 Passa pelas médias amostrais de Y e X Esse fato fica óbvio na Equação 317 porque ela pode ser escrita como Y D ØO1 C ØO2X apresentada graficamente na Figura 32 2 O valor médio estimado do Y D YOi é igual ao valor médio do Y observado para YOi H 1 C 2Xi H 2 C 2Xi H C 2Xi ØO ØO ØO ØO ØO Y Y X X 319 Somandose os dois lados dessa última igualdade aos valores amostrais e dividindo pelo tamanho da amostra n obtemos H Y YO 31105 em que recorremos ao fato de que Xi X D 0 Por quê 3 O valor médio dos resíduos ûi é igual a zero Segundo a Seção 3A1 do Apêndice 3A a primeira equação é 2 Yi 1 2Xi H 0 ØO ØO Mas como uOi D Yi ØO1 ØO2X i a equação anterior reduzse a 2 uO i H 0 em que uO H0 6 5 note que este resultado só é válido quando o modelo de regressão apresenta o intercepto Ø1 Como mostra a Seção 6A1 do Apêndice 6A este resultado pode não se aplicar quando Ø1 está ausente do modelo 6 este resultado também requer que o intercepto Ø1 esteja presente no modelo veja Seção 6A1 do Apên dice 6A fiGuRa 32 Gráfico que mostra que a linha de regressão da amostra passa pelos valores médios amostrais de Y e X Y Y X X FRA Yi Ø 1 Ø 2 Xi ECONOBOOKindb 82 23112010 070947 Capítulo 3 Modelo de regressão de duas variáveis o problema da estimação 83 Como resultado da propriedade anterior a regressão amostral Yi H 1 C 2Xi C uO i ØO ØO 262 pode ser expressa de modo que Y e X sejam considerados desvios de seus valores mé dios Para ver isso some 262 dos dois lados da equação para obter Yi H n 1 C 2 Xi C ui H n 1 C 2 Xi já que ui H 0 ØO ØO ØO ØO O O 3111 Dividindo a Equação 3111 por n obtemos Y H 1 C 2X ØO ØO 3112 que é igual à Equação 317 Subtraindo a Equação 3112 da Equação 262 obte mos Yi Y D ØO2Xi X C uO i 3112 ou yi D ØO2xi C uO i 3113 em que yi e xi segundo nossa convenção são os desvios em relação aos respectivos valores amostrais médios A Equação 3113 é conhecida como formato de desvio Note que o termo de inter cepto ØO1 não aparece aqui Mas ele sempre pode ser estimado pela Equação 317 isto é devido ao fato de que a linha de regressão passa pelas médias amostrais de Y e X Uma vantagem do formato de desvio é que ele frequentemente simplifica o cálculo das fórmulas Note também que no formato de desvio a FRA pode ser escrita como yOi H ØO2xi 3114 enquanto nas unidades originais de medida era YOi H ØO1 C ØO2Xi como vimos na Equa ção 261 4 Os resíduos ûi não estão correlacionados ao Yi previsto Isso pode ser verificado do se guinte modo usando o formato de desvio podemos escrever yOiuO i H ØO2 xiuO i H ØO2 xiyi ØO2xi H ØO2 xi yi ØO2 2 x2 i H ØO2 2 x2 i ØO2 2 x2 i H 0 3115 em que consideramos o fato de que ØO2 D xi yi x2 i 5 Os resíduos uOi não estão correlacionados ao Xi isto é uO i Xi D 0 Esse fato é consequência da Equação 2 no Apêndice 3A Seção 3A1 ECONOBOOKindb 83 23112010 070951 84 Parte Um Modelos de regressão com equação única 32 O modelo clássico de regressão linear as hipóteses subjacentes ao método dos mínimos quadrados Se nosso objetivo for apenas o de estimar Ø1 e Ø2 o método dos MQO examinado na seção ante rior é suficiente Entretanto lembrese do Capítulo 2 de que na análise de regressão nosso objetivo não é apenas o de obter ØO1 e ØO2 mas o de tecer inferências relativas aos verdadeiros Ø1 e Ø2 Por exem plo podemos estar interessados em saber quão próximos ØO1 e ØO2 estão de suas contrapartes na popula ção ou quanto YOi se aproxima da verdadeira EY j Xi Para isso precisamos não apenas especificar a forma funcional do modelo como na Equação 242 mas fazer certas hipóteses a respeito da ma neira como Yi é gerado Veja a FRP Yi D Ø1 C Ø2 Xi C ui Ela demonstra que Yi depende de Xi e ui Portanto a menos que sejamos específicos quanto à maneira como Xi e ui foram criados ou gerados não há forma de fazer qualquer inferência estatística sobre Yi e também como veremos sobre Ø1 e Ø2 Assim as hipóteses feitas quanto às variávelis Xi e ao termo de erro são fundamentais para a inter pretação das estimativas da regressão O modelo clássico de regressão linear gaussiano ou padrão MCRL que é a pedra angular de boa parte da teoria econométrica parte de sete hipóteses7 Discutiremos primeiro essas hipóteses no contexto do modelo de regressão de duas variáveis e no Capítulo 7 as estenderemos ao modelo de regressão múltipla isto é ao modelo em que há mais de um regressor Como será discutido no Capí tulo 7 este modelo pode ser estendido para incluir mais variáveis explicativas HipótESE 1 Modelo de regressão linear o modelo de regressão é linear nos parâmetros embora possa não ser linear nas variáveis este é o modelo de regressão como mostrado na equação 242 Yi D Ø1 C Ø2 Xi C ui 242 Como será discutido no Capítulo 7 este modelo pode ser estendido para incluir mais variáveis explicativas Já examinamos o modelo 242 no Capítulo 2 Como os modelos de regressão linear nos parâme tros são o ponto de partida do MCRL manteremos esta hipótese na maior parte do livro8 Tenha em mente que o regressando Y e o regressor X podem ser não lineares conforme visto no Capítulo 2 HipótESE 2 Valores de X fixos ou independentes do termo de erro valores assumidos pelo regressor X podem ser fixos em amostras repetidas caso do regressor fixo ou seus valores podem mudar de acordo com a variável dependente Y no caso do regressor estocástico no segundo caso supõese que as variáveis X e o termo de erro são independentes isto é cov Xi ui D 0 Isso pode ser explicado em termos do exemplo da Tabela 2 l Considere as várias populações Y correspondentes aos níveis de renda mostrados na tabela Mantendo fixo o valor da renda X no nível de 80 podemos selecionar aleatoriamente uma família e observar suas despesas semanais de consu mo Y que são de 60 Ainda considerando X igual a 80 selecionamos outra família e observamos o valor Y de 75 Em cada uma dessas seleções isto é amostra repetida o valor de X está fixo em 80 Podemos repetir o processo para todos os valores de X apresentados na Tabela 21 Na verdade as amostras das Tabelas 24 e 25 foram selecionadas dessa maneira Por que assumimos que os valores de X não são estocásticos Considerando que na maioria das ciências sociais os dados para ambas as variáveis X e Y em geral são coletados aleatoriamente 7 É clássico no sentido de que foi formulado primeiro por Gauss em 1821 e desde então serve de norma ou pa drão em rela ção ao qual podem ser comparados os modelos que não atendem às premissas gaussianas 8 no entanto no Capítulo 14 apresentaremos um breve exame dos modelos de regressão não linear nos parâmetros ECONOBOOKindb 84 23112010 070951 Capítulo 3 Modelo de regressão de duas variáveis o problema da estimação 85 parece natural assumir o oposto que a variável X assim como a Y também é aleatória ou estocás tica Mas inicialmente consideraremos a variável X não estocástica pelas seguintes razões Primeiro isso é feito inicialmente para simplificar e para apresentar gradualmente ao leitor as complexidades da análise de regressão Segundo em situações experimentais talvez não seja forçado assumir que os valores de X são fixos Por exemplo um fazendeiro pode dividir sua terra em diversos lotes e aplicar uma quantidade de fertilizante diferente em cada lote para ve rificar o efeito sobre a plantação Da mesma maneira uma loja de departamentos pode decidir aplicar diferentes porcentuais de desconto a um produto para verificar o impacto nos consumi dores Às vezes podemos querer fixar os valores de X para uma finalidade específica Suponha que queiramos descobrir o rendimento médio semanal dos trabalhadores X com diversos ní veis de escolaridade Y como no caso dos dados fornecidos na Tabela 26 Desse modo a va riável X pode ser considerada fixa ou não estocástica Terceiro como mostraremos no Capítulo 13 mesmo que as variáveis X sejam estocásticas os resultados estatísticos da regressão linear baseada no caso de regressores fixos também são válidos quando a variável X é aleatória contanto que algumas condições sejam atendidas Uma condição é de que o regressor X e o termo de erro ui se jam independentes Como observa James Davidson este modelo isto é de regressores estocás ticos imita o modelo de regressores fixos e muitas das propriedades estatísticas de mínimos quadrados no modelo de regressor fixo continuam válidas9 Por todas essas razões discutiremos primeiro o modelo MCRL regressor fixo em detalhes No entanto no Capítulo 13 examinaremos o caso dos regressores estocásticos e ressaltaremos as ocasiões em que é necessário considerar os modelos de regressor estocástico Casualmente note que se a variável X for estocástica o modelo resultante será chamado de modelo neoclássico de regressão linear MNRL10 em contraste com o MCRL em que as variáveis X são tratadas como fixas ou não aleatórias Para fins de discussão chamaremos o primeiro modelo de modelo de regressão estocás tico e o segundo de modelo de regressão fixo Esta hipótese afirma que o valor médio de ui condicionado a um dado Xi é zero Geometricamen te esta hipótese pode ser ilustrada como na Figura 33 que mostra alguns dos valores da variável X e das populações Y associadas a cada uma delas Conforme mostrado cada população Y correspon 9 davidSon James Econometric theory rU blackwell Publishers 2000 p 10 10 Um termo de GoldberGer arthur S A course in econometrics Cambridge ma harvard University Press 1991 p 264 fiGuRa 33 Distribuição condicional dos termos de erro ui X1 X2 X3 X4 X Y Média Yi Ø 1 Ø 2Xi FRP ui ui ECONOBOOKindb 85 23112010 070951 86 Parte Um Modelos de regressão com equação única dente a um dado X distribuise em torno da média mostrada pelos pontos circulados sobre a FRP com alguns valores de Y acima e outros abaixo da média As distâncias acima e abaixo da média não são nada mais que os ui A Equação 321 requer que o valor médio desses desvios em relação a qualquer X seja zero Esta hipótese não é difícil de entender em vista do que foi discutido na Seção 24 veja a Equação 245 A hipótese 3 informa simplesmente que fatores não incluídos explicitamente no modelo e portanto agrupados em ui não afetam sistematicamente o valor médio de Y em outras palavras os valores positivos de ui cancelam os negativos de modo que seu efeito médio sobre Y é igual a 011 Note que a premissa EuijXi D 0 implica que E YijXi D Ø1 C Ø2 Xi Por quê Portanto as duas hipóteses são equivalentes É importante ressaltar que a Hipótese 3 implica que não existe viés de especificação ou erro de especificação no modelo usado na análise empírica Em outras palavras o modelo de regressão está especificado corretamente Deixar de fora variáveis explanatórias importantes incluir variáveis desnecessárias ou escolher incorretamente a forma funcional da relação entre as variáveis Y e X são alguns exemplos de erro de especificação Discutiremos o tópico em detalhe no Capítulo 13 Note também que se a média condicional de uma variável aleatória dada outra variável aleatória é zero a covariância entre as duas variáveis é zero e portanto as duas variáveis não são correlacio nadas Sendo assim a Hipótese 3 implica que Xi e ui não são correlacionadas12 A razão para assumir que o termo de erro u e as variáveleis explanatórias X não são cor relacionados é simples Quando expressamos a FRP na Equação 242 assumimos que X e u que representa a influência de todas as variáveis omitidas têm influências separadas e aditivas sobre Y Mas se X e u são correlacionados não é possível avaliar seus efeitos individuais sobre Y Por tanto se X e u são positivamente correlacionados X aumenta quando u aumenta e diminui quando u diminui Da mesma forma se X e u são negativamente correlacionados X aumenta quando u diminui e diminui quando u aumenta Em situações como essa é bem possível que o termo de erro realmente inclua algumas variáveis que deveriam ser incluídas como regressores adicionais no modelo É por esse motivo que a Hipótese 3 é outra maneira de afirmar que não existe erro de especificação no modelo de regressão escolhido A Equação 322 informa que a variância de ui para cada Xi a variância condicional de ui é um número positivo constante igual a æ 2 Tecnicamente a Equação 322 representa a premis sa da homocedasticidade ou igual homo dispersão cedasticidade ou variância igual A palavra tem ori gem no verbo grego skedanime que significa dispersar ou espalhar Em outras palavras a Equação 322 indica que as populações Y correspondentes aos vários valores de X têm a mesma variância Simplificando a variação em torno da linha de regressão que é a linha das relações médias entre Y e X é a mesma para todos os X não aumenta nem diminui quando X varia A Figura 34 representa isso graficamente 11 razões mais técnicas para a necessidade da hipótese 3 podem ser encontradas em malinvaUd e Statistical methods of econometrics Chicago rand mcnally 1966 p75 veja também o exercício 33 12 o oposto contudo não é verdadeiro porque correlação é uma medida de associação linear apenas mesmo se Xi e ui não forem correlacionadas a média condicional de ui dado Xi pode não ser zero no entanto se Xi e ui forem correlacionadas EuijXi deve ser diferente de zero o que viola a hipótese 3 devemos este argumento a Stock e Watson veja SToCK James h WaTSon mark W Introduction to econometrics boston addisonWes ley 2003 p 104105 HipótESE 3 Valor médio do termo de erro ui é zero dado o valor de Xi o valor médio ou esperado do termo de erro aleatório ui é zero Simbolicamente temos Eui j Xi D 0 321 ou se X é não estocástico Eui D 0 ECONOBOOKindb 86 23112010 070952 Capítulo 3 Modelo de regressão de duas variáveis o problema da estimação 87 HipótESE 4 Homocedasticidade ou variância constante de ui a variância do termo de erro é a mesma independentemente do valor de X de maneira simbólica varui D E ui EuijXi2 D Eui 2 Xi devido à hipótese 3 D Eui 2 se Xi é não estocástica D æ2 322 em que var é a abreviatura de variância Em contrapartida considere a Figura 35 em que a variância condicional da população de Y varia com X Essa situação é co nhecida adequadamente como heterocedasticidade ou dispersão ou variân cia desigual Simbolica mente nessa situação a Equação 322 pode ser representada como var uijXi D σ2 i 323 Observe o subscrito em æ 2 na Equação 323 que indica que a variância da população Y não é mais constante Para tornar essa diferença entre as duas situações clara suponha que Y represente as despesas semanais de consumo e X a renda semanal As Figuras 34 e 35 mostram que à medida que a renda aumenta as despesas também aumentam Mas na Figura 34 a variância das despesas de consumo permanece a mesma em todos os níveis de renda enquanto na Figura 35 ela aumenta com o aumen to da renda Em outras palavras as famílias mais ricas em média consomem mais do que as famílias mais pobres mas também há maior variabilidade nas despesas de consumo das primeiras Para entender a lógica por trás desta hipótese veja a Figura 35 Como ela mostra var uX1 varujX2 varujXi Portanto a probabilidade de que as observações Y vindas de uma popula ção com X D X1 estarão mais próximas da FRP do que as da população que corresponde a X D X2 X D X3 e assim por diante Em resumo nem todos os valores Y correspondentes aos vários X serão igualmente confiáveis essa confiabilidade é avaliada pela proximidade ou distância em que os valo res de Y distribuemse em torno de sua média isto é os pontos sobre a FRP Se esse for de fato o caso não seria preferível tirar a amostra de populações Y que estejam mais próximas da média do que da quelas que estão mais dispersas Mas fazer isso pode restringir a variação que obtemos entre os va lores de X Ao invocarmos a Hipótese 4 estamos dizendo que neste estágio todos os valores de Y correspon dentes aos vários X são igualmente importantes No Capítulo 11 veremos o que acontece quando não é esse o caso isto é quando há heterocedasticidade Densidade de probabilidade de ui f u Y X X1 X2 Xi FRP Yi b1 b2Xi Ø Ø fiGuRa 34 Homocedasticidade ECONOBOOKindb 87 23112010 070952 88 Parte Um Modelos de regressão com equação única Note que a Hipótese 4 implica que as variâncias condicionais de Yi também são homocedásticas Isto é var Yi j Xi D æ2 324 Obviamente a variância incondicional de Y é æY 2 Mais adiante veremos a importância de fa zer a distinção entre as variâncias condicional e incondicional de Y veja no Apêndice A deta lhes das variâncias condicional e incondicional HipótESE 5 Não há autocorrelação entre os termos de erro dados quaisquer dois valores de X Xi e Xj i j a correlação entre quaisquer dois ui e uj i j é zero Simbolicamente covui uj j Xi e Xj D 0 325 covui uj D 0 se X for não estocástica em que i e j são duas observações diferentes e cov significa covariância Em palavras a Equação 325 postula que os termos de erro ui e uj não são correlacionados Tecnicamente esta é a hipótese de ausência de correlação serial ou de ausência de autocorrelação Isso significa que dado Xi os desvios de quaisquer dois valores de Y em relação a sua média não apresentam padrões como os das Figuras 36a e b Na Figura 36a vemos que há uma correlação positiva entre os u um u positivo seguido de um u positivo ou um u negativo seguido de outro ne gativo Na Figura 36b os u apresentam uma correlação negativa um u positivo seguido de outro negativo e viceversa Se os termos de erro desvios seguem padrões sistemáticos como os das Figuras 36a e b há autocorrelação ou correlação serial e a Hipótese 5 requer que tais correlações estejam ausentes A Figura 36c mostra que não há um padrão sistemático nos u o que indica uma correlação zero A importância desta hipótese será explicada em detalhes no Capítulo 12 mas é possível explicála intuitivamente do seguinte modo Suponha que em nossa FRP Yt D Ø1 C Ø2 Xt C ut ut e ut1 sejam positivamente correlacionados Então Yt depende não apenas de Xt mas também de ut1 pois ut1 até certo ponto determina ut Neste estágio de nossa formulação ao invocarmos a Hipótese 5 estamos dizendo que consideraremos o efeito sistemático se houver de Xt sobre Yt e não nos preocuparemos com outras influências que possam pesar sobre Y como resultado da possível intercorrelação entre os u Mas conforme observado no Capítulo 12 veremos como as intercorrelações entre os termos de erro po dem ser introduzidas na análise e quais são as consequências fiGuRa 35 Heterocedasticidade X Densidade de probabilidade de ui Y Xi X2 X1 b1 b 2 i Ø Ø X fu ECONOBOOKindb 88 23112010 070953 Capítulo 3 Modelo de regressão de duas variáveis o problema da estimação 89 Mas devemos acrescentar aqui que a justificativa para esta hipótese depende do tipo de dados usados na análise Se os dados forem de corte transversal e forem obtidos como uma amostra aleató ria da população esta hipótese será normalmente válida Entretanto se os dados são de séries tem porais a hipótese de independência é difícil de manter pois observações sucessivas de uma série temporal como o PIB são altamente correlacionadas Mas trataremos desta situação quando exami narmos séries temporais mais adiante no livro HipótESE 6 O número de observações n deve ser maior que o número de parâmetros a serem estimados como alternativa o número de observações n deve ser maior que o número de variá veis explanatórias HipótESE 7 Variabilidade dos valores de X os valores de X em uma amostra não devem ser os mesmos Tecnicamente var X deve ser um número positivo além disso não pode haver valores extre mos outliers da variável X isto é valores muito grandes ou discrepantes em relação ao resto das observações Esta hipótese não é tão inócua quanto parece No exemplo hipotético da Tabela 31 ima gine que só tivéssemos o primeiro par de observações de Y e X 4 e 1 Com base nessa única observação não há como estimar as duas incógnitas Ø1 e Ø2 São necessários pelo menos dois pares de observações para estimar as duas incógnitas Em um capítulo posterior veremos a importân cia fundamental desta hipótese Esta hipótese também não é tão inócua quanto parece Veja a Equação 316 Se todos os valores de X forem idênticos então Xi D X por quê e o denominador da equação será zero tornando ui ui ui ui ui ui ui ui ui ui ui ui a b c fiGuRa 36 Padrões de correlação entre os termos de erro a correlação serial positiva b correlação serial negativa c correlação zero ECONOBOOKindb 89 23112010 070953 90 Parte Um Modelos de regressão com equação única impossível estimar Ø2 e portanto Ø1 Intuitivamente podemos ver por que esta hipótese é tão impor tante Voltando ao exemplo das despesas de consumo familiar do Capítu lo 2 se houver pouca varia ção na renda das famílias não seremos capazes de explicar boa parte da variação dos gastos com consumo O leitor deve ter em mente que a variação tanto de Y quanto de X é essencial para o uso da análise de regressão como uma ferramenta de pesquisa Resumindo as variáveis precisam variar A exigência de que não haja valores extremos para a variável X é para evitar que os resultados da regressão sejam dominados por esses valores extremos Se existirem alguns poucos valores de X que são por exemplo 20 vezes a média dos valores de X as linhas de regressão estimadas com ou sem tais observações serão consideravelmente diferentes Com frequência os valores extremos são resul tado de erros humanos de aritmética ou da mistura de amostras de diferentes populações No Capítu lo 13 discutiremos o tópico em mais detalhes Nossa discussão sobre as hipóteses subjacentes ao modelo clássico de regressão linear agora está completa É importante destacar que todas essas hipóteses aplicamse apenas à função de regressão populacional não à função de regressão amostral Contudo é interessante observar que o método dos mínimos quadrados examinado anteriormente possui algumas propriedades similares às hipóteses da FRP Por exemplo a conclusão de que PuOi D 0 e portanto uO D 0 é semelhante à premissa EuijXi D 0 Do mesmo modo a conclusão de que PuOi Xi D 0 é se melhante a covui Xi D 0 É re confortante notar que o método dos mínimos quadrados tenta duplicar algumas das premissas que impusemos à FRP É claro a FRA não duplica todas as premissas do modelo clássico de regressão linear Como mostraremos mais adiante embora covui uj D 0 i j por definição não é verdadeiro que na amostra cov uOi uOj D 0 i j Na realidade mostraremos mais adiante que os resíduos são não só autocorrelacionados como também heterocedásticos veja o Capítulo 12 um comentário a respeito dessas hipóteses A pergunta fundamental é até que ponto todas essas hipóteses são realistas A realidade das hipó teses é uma questão antiga na filosofia da ciência Alguns argumentam que não importa se são realis tas o que importa são as previsões feitas com base nelas Um notável dentre os defensores da tese da irrelevância das hipóteses é Milton Friedman Para ele a irrealidade das premissas é uma vantagem positiva para ser importante uma hipótese deve ser descritivamen te falsa em suas premissas13 Podemos não concordar plenamente com esse ponto de vista mas lembrese de que em qual quer estudo científico fazemos certas suposições porque facilitam o desenvolvimento do assunto em etapas graduais e não porque sejam necessariamente realistas no sentido de replicar a realidade com exatidão Como um autor observa se a simplicidade é um critério desejável da boa teoria todas as boas teorias idealizam e simplificam exageradamente14 O que planejamos fazer é primeiro estudar minuciosamente as propriedades do MCRL e em capítulos posteriores examinar com profundidade o que aconte ce quando as hipóteses da MCRL não são atendidas No final deste capítulo apresentamos na Tabela 34 um guia que mostra onde verificar o que acontece com o modelo clássico de regressão linear se dada hipótese não for satisfeita Como um colega ressaltou quando examinamos pesquisas feitas por outras pessoas precisamos considerar se as hipóteses feitas pelo pesquisador são adequadas aos dados e ao problema Com mui ta frequência as pesquisas publicadas se embasam em hipóteses implícitas sobre o problema e em dados que provavelmente não estão corretos e produzem estimativas baseadas nessas hipóteses Evi dentemente o leitor atento deveria ao perceber esse problema adotar uma atitude cética em relação à pesquisa As hipóteses apresentadas na Tabela 34 proporcionam uma lista de verificação para orientar nossas pesquisas e avaliar as de terceiros 13 Friedman milton Essays in positive economics Chicago University of Chicago Press 1953 p 14 14 blaUG mark The methodology of economics or how economists explain 2 ed nova York Cambridge University Press 1992 p 92 ECONOBOOKindb 90 23112010 070954 Capítulo 3 Modelo de regressão de duas variáveis o problema da estimação 91 Com esse pano de fundo estamos agora prontos para estudar o modelo clássico de regressão linear Em especial queremos verificar as propriedades estatísticas dos MQO em comparação com as propriedades puramente matemáticas que examinamos anteriormente As propriedades estatísticas dos MQO embasamse nas hipóteses do modelo clássico de regressão linear já exami nadas e estão inseridas no famoso teorema de GaussMarkov Mas antes de passarmos a esse teore ma que fornece a justificativa teórica para a popularidade dos MQO precisamos primeiro tratar da precisão ou dos erros padrão das estimativas de mínimos quadrados 33 Precisão ou erros padrão das estimativas de mínimos quadrados Ao analisarmos as Equações 316 e 317 fica evidente que as estimativas de mínimos quadra dos são uma função dos dados amostrais Mas como os dados costumam mudar de amostra para amostra consequentemente as estimativas mudarão Portanto alguma medida de confiabilidade ou precisão dos estimadores ØO1 e ØO2 fazse necessária Em estatística a precisão de uma estimativa é medida por seu erro padrão ep15 Dadas as hipóteses gaussianas a Seção 3A3 do Apêndice 3A mostra que os erros padrão das estimativas de MQO podem ser obtidos como se segue var ØO2 D æ 2 x2 i epØO2 D æ x2 i var ØO1 D X2 i n x2 i æ 2 ep ØO1 D X2 i n x2 i æ 331 332 333 334 em que var D variância ep D erro padrão e æ 2 é a variância constante ou homocedástica de ui da Hipótese 4 Todas as quantidades que entram nas equações anteriores exceto æ 2 podem ser estimadas com base nos dados Como mostra a Seção A5 do Apêndice 3A o próprio æ 2 é estimado pela seguinte fórmula æO 2 D uO2 i n 2 335 em que æO 2 é o estimador de MQO do verdadeiro mas desconhecido æ 2 a expressão n 2 é conhecida como número de graus de liberdade gl e PuOi 2 é a soma do quadrado dos resíduos SQR16 15 o erro padrão é apenas o desvio padrão da distribuição amostral do estimador e esta é simplesmente a proba bilidade ou distribuição de frequência do estimador isto é uma distribuição do conjunto de valores dos estima dores obtidos de todas as amostras possíveis do mesmo tamanho de uma dada população as distribuições amostrais são usadas para fazer inferências sobre os valores dos parâmetros populacionais com base nos valores calculados dos estimadores baseados em uma ou mais amostras Para deta lhes veja o Apêndice A 16 a expressão número de graus de liberdade representa o número total de observações da amostra D n menos o número de restrições independentes lineares impostas a ele em outras palavras é o núme ro de observações independentes dentre um total de n observações Por exemplo antes de calcular a SQr 312 é preciso obter ØO1 e ØO2 Sendo assim essas duas estimativas impõem duas restrições à SQr Portanto existem n 2 e não n observações independentes para calcular a SQr Seguindo essa lógica em uma regres são com três variáveis a SQr terá n 3 graus de liberdade e o modelo com k variáveis terá n k graus de li berdade a regra geral é a seguinte graus de liberdade D n número de parâmetros estimados ECONOBOOKindb 91 23112010 070955 92 Parte Um Modelos de regressão com equação única Uma vez conhecida PuOi 2 æ 2 pode ser facilmente calculado A própria PuOi 2 pode ser calculada por meio da Equação 312 ou da seguinte expressão veja a prova na Seção 35 uO2 i D y2 i ØO2 2 x2 i 336 Comparada à Equação 312 a Equação 336 é fácil de usar pois não requer o cálculo de ûi para cada observação embora esse cálculo possa ser útil como veremos nos Capítulos 11 e 12 Como ØO2 D xi yi x2 i uma expressão alternativa para calcular PuOi 2 é uO2 i D y2 i xi yi 2 x2 i 337 Note que a raiz quadrada positiva de æ 2 æO D uO2 i n 2 338 é conhecida como erro padrão da estimativa ou erro padrão da regressão ep É simplesmente o desvio padrão dos valores de Y em relação à linha de regressão estimada sendo frequentemente usada como uma medida sintética da qualidade do ajustamento da linha de regressão estimada um tópico que será discutido na Seção 35 Anteriormente observamos que dado Xi æ 2 representa a variância condicional de ui e de Yi Portanto o erro padrão da estimativa pode também ser chamado de desvio padrão condi cional de ui e Yi Obviamente como sempre æY 2 e æY representam respectivamente a variância incondicional e o desvio padrão incondicional de Y Note as seguintes características das variâncias e portanto dos erros padrão de ØO1 e ØO2 1 A variância de ØO2 é diretamente proporcional a æ 2 mas inversamente proporcional a Pxi 2 Isto é dado æ 2 quanto maior a variação dos valores de X menor a variância de ØO2 e portanto maior a precisão com que Ø2 pode ser estimado Resumindo dado σ2 se houver variação substancial dos valores de X Ø2 pode ser medido mais acuradamente do que quando os Xi não variam substancial mente Também dada Pxi 2 quanto maior a variância de æ 2 maior a variância de Ø2 Note que conforme o tamanho da amostra n aumentar o núme ro de termos na somatória Pxi 2 aumentará Com o aumento de n a precisão da estimação de Ø2 também aumenta Por quê 2 A variância de ØO1 é diretamente proporcional a æ 2 e Pxi 2 mas inversamente proporcional a Pxi 2 e ao tamanho da amostra n 3 Como ØO1 e ØO2 são estimadores eles não só variam de amostra para amostra como tendem a ser dependentes um do outro em determinada amostra Essa dependência é medida pela covariância entre eles Na Seção 3A4 do Apêndice 3A vemos que cov ØO1 ØO2 H X var ØO2 H X æ 2 x2 i 339 ECONOBOOKindb 92 23112010 070956 Capítulo 3 Modelo de regressão de duas variáveis o problema da estimação 93 Como var ØO2 é sempre positiva assim como a variância de qualquer variável a natureza da co variância entre ØO1 e ØO2 depende do sinal de X Se o sinal for positivo como mostra a fórmula a cova riância será negativa Portanto se o coeficiente angular Ø2 for superestimado se a incli nação for muito abrupta o intercepto Ø1 será subestimado o intercepto será pequeno demais Mais à frente especial mente no Capítulo 10 sobre multicolinearidade veremos a utilida de de examinar as covariâncias entre os coeficientes de regressão estimados Como as variâncias e os erros padrão dos coeficientes estimados de regressão nos permitem julgar a confiabilidade dessas estimativas Isso é um problema de inferência estatística e será visto nos Capítulos 4 e 5 34 Propriedades dos estimadores de mínimos quadrados o teorema de GaussMarkov17 Como mencionado dadas as hipóteses do modelo clássico de regressão linear as estimati vas de mínimos quadrados possuem algumas propriedades ideais ou ótimas Estas estão contidas no conhe cido teorema de GaussMarkov Para entendêlo precisamos considerar a propriedade de melhor estimador linear não viesado ou não tendencioso MELNT ou BLUE de um estimador18 Como explicado no Apêndice A um estimador por exemplo o estimador de MQO ØO2 é considerado o melhor estimador linear não viesado ou não tendencioso de Ø2 se atender às seguintes condições 1 É linear isto é uma função linear de uma variável aleatória como a variável dependente Y no modelo de regressão 2 É não viesado ou não tendencioso isto é seu valor médio ou esperado EØO2 é igual ao verdadeiro valor Ø2 3 Tem variância mínima na classe de todos os estimadores lineares não viesados um esti mador não viesado com a menor variância é conhecido como um estimador eficiente No contexto da regressão podemos provar que os estimadores de MQO são MELNT Essa é a essência do famoso teorema de GaussMarkov que afirma o seguinte Teorema de GaussMarkov dadas as premissas do modelo clássico de regressão linear os estimadores de mínimos quadrados da classe dos estimadores lineares não viesados têm variância mínima isto é são o melhor estima dor linear não viesado melnT A demonstração deste teorema está na Seção 3A6 do Apêndice 3A Toda a im portância do teore ma ficará mais clara à medida que avançarmos Por enquanto é suficiente notar que o teorema tem importância não só teórica como também prática19 Podemos explicar o significado de tudo isso com auxílio da Figura 37 Na Figura 37 a apresentamos a distribuição amostral do estimador de MQO ØO2 isto é a distri buição dos valores assumidos por ØO2 em experimentos amostrais repetidos lembrese da Tabe la 31 17 embora conhecido como teorema de GaussMarkov a abordagem de Gauss 1821 aos mínimos quadrados antecede a de variância mínima de markov 1900 18 o leitor encontrará no Apêndice A considerações sobre a importância dos estimadores lineares bem como um exame geral das propriedades desejáveis dos estimadores estatísticos 19 Por exemplo é possível demonstrar que qualquer combinação linear dos Ø como Ø1 2Ø2 pode ser estima da por meio de ØO1 2ØO2 e que seu estimador é o melhor estimador linear não viesado Para detalhes veja henrY Theil Introduction to econometrics englewood Cliffs n J Prenticehall 1978 p 401402 Uma obser vação técnica sobre o teorema de Gaussmarkov ele só proporciona a condição suficiente mas não necessária para a eficiência dos mQo agradeço a michael mcaleer da Western australia University por chamar nossa atenção para este ponto ECONOBOOKindb 93 23112010 070957 94 Parte Um Modelos de regressão com equação única Por conveniência supusemos que os ØO2 distribuemse simetricamente mas voltaremos a este ponto no Capítulo 4 Como a figura mostra a média dos valores de ØO2 EØO2 é igual ao verdadeiro Ø2 Nessa situação dizemos que ØO2 é um estimador não viesado de Ø2 Na Figura 37b mostramos a distribuição amostral de Ø2 um estimador alternativo de Ø2 obtido usando outro método diferente de MQO Por conveniência supusemos que Ø2 assim como ØO2 é não viesado ou seja que seu valor médio ou esperado é igual a Ø2 Vamos supor ainda que tanto ØO2 quanto Ø2 são estimadores lineares isto é que são funções lineares de Y Qual dos estimadores ØO2 ou Ø2 você escolheria Para responder a essa pergunta sobreponha as duas figuras como na Figura 37c É óbvio que embora tanto ØO2 quanto Ø2 sejam não viesados a distribuição de Ø2 é mais difusa ou espalhada em torno da média do que a distribuição de ØO2 Em outras palavras a variância de Ø2 é maior que a variân cia de ØO2 Agora dados dois estimadores lineares e não viesados escolhemos o estimador com menor variância a mais porque é mais provável que esteja mais próximo de Ø2 do que o estimador alterna tivo Em resumo escolhemos o melhor estimador linear não viesado MELNT ou BLUE O teorema de GaussMarkov é notável porque não faz suposições sobre a distribuição de proba bilidade da variável aleatória ui e portanto de Yi no próximo capítulo voltaremos ao assunto En quanto as hipóteses do modelo clássico de regressão linear forem atendidas o teorema será válido Consequentemente não precisamos procurar outro estimador linear não viesado pois não encontra remos um cuja variância seja menor que o estimador de mínimos quadrados ordinários É claro se uma ou mais dessas hipóteses não se aplicarem o teorema deixa de ser válido Por exemplo se con siderarmos os modelos de regressão não linear nos parâmetros discutidos no Capítulo 14 podere mos encontrar estimadores melhores que os estimadores de MQO Também como veremos no capítulo sobre heterocedasticidade se a hipótese de variância homocedástica não for satisfeita os estimadores de MQO embora não viesados e consistentes deixam de ser estimadores com variância mínima mesmo na classe dos estimadores lineares fiGuRa 37 Distribuição amostral do estimador de MQO ØO2 de um estimador alternativo Ø2 b2 b2 Ø Ø b2 Ø b2 Ø 2 Ø b2 Ø b2 Ø c Distribuição amostral de Ø2 e b b2 Ø b Distribuição amostral Ø2 a Distribuição amostral Ø2 Eb2 b2 Ø Ø Eb2 b2 Ø Ø ECONOBOOKindb 94 23112010 070957 Capítulo 3 Modelo de regressão de duas variáveis o problema da estimação 95 As propriedades estatísticas que acabamos de examinar são conhecidas como propriedades de amostras finitas elas são válidas independentemente do tamanho da amostra em que os estimado res se embasam Mais adiante teremos oportunidade de considerar as propriedades assintóticas isto é as propriedades que se mantêm apenas se o tamanho da amostra for muito grande tecnicamente in finito O Apêndice A apresenta uma discussão geral das propriedades dos estimadores de amos tras finitas e dos de gran des amostras 35 O coeficiente de determinação r 2 uma medida da qualidade do ajustamento Até aqui estivemos preocupados com o problema de estimar coeficientes de regressão seus erros padrão e algumas de suas propriedades Agora consideraremos a qualidade do ajustamento da linha de regressão ajustada a um conjunto de dados vamos descobrir quão bem uma linha de regressão amostral é adequada aos dados A Figura 31 deixa claro que se todas as observações fossem situadas na linha de regressão obteríamos um ajustamento perfeito mas isso raramente acontece Em geral haverá alguns uOi positivos e outros uOi negativos O que esperamos é que esses resíduos em torno da linha de regressão sejam os menores possíveis O coeficiente de determinação r 2 no caso de duas variáveis ou R2 regressão múltipla é uma medida resumida que diz quanto a linha de regressão amostral ajustase aos dados Antes de mostrarmos como se calcula o r 2 vejamos uma explicação heurística de r 2 em termos de um recurso gráfico conhecido como diagrama de Venn ou Ballentine como mostra a Figura 3820 Nessa figura o círculo Y representa a variação da variável dependente Y e o círculo X a variação da va riável explanatória X21 A sobreposição dos círculos a área sombreada indica a extensão em que a variação de Y é explicada pela variação de X por exemplo por meio de uma regressão de MQO Quanto maior a área de sobreposição maior a parte da variação de Y explicada por X O r 2 é apenas a medida numérica dessa sobreposição Na figura à medida que nos movemos da esquerda para a direita a área de sobreposição aumenta isto é uma proporção cada vez maior da variação de Y é explicada por X Em resumo r 2 aumenta Quando não há sobreposição r 2 é obviamente zero mas quando a sobreposição é total r 2 é igual a l pois 100 da variação de Y é explicada por X Como mostraremos em breve r 2 situase entre 0 e 1 Para calcularmos r 2 procedemos do seguinte modo Lembrese de que Yi H YOi C uO i 263 20 veja KennedY Peter ballentine a graphical aid for econometrics Australian Economics Papers 1981 v 20 p 414416 o nome ballentine faz referência aos círculos da logomarca de uma famosa cerveja com esse nome 21 os termos variação e variância indicam coisas diferentes a variação é a soma dos quadrados dos desvios de uma variável de seu valor médio a variância é a soma dos quadrados dividida pelos graus de liberdade adequa dos em resumo variância D variaçãogl fiGuRa 38 r2 visto no Ballentine a r2 D 0 f r2 D 1 Y X Y X Y X Y X Y X Y X a b c d e f ECONOBOOKindb 95 23112010 070958 96 Parte Um Modelos de regressão com equação única ou no formato de desvio yi H yOi C uO i em que se faz uso das Equações 3113 e 3114 Elevando ao quadrado os dois lados da Equação 351 e somando na amostra obtemos y2 i H yO2 i C uO2 i C 2 yOiuO i H yO2 i C uO2 i H ØO2 2 x2 i C uO2 i 352 já que yOiuO i H 0 por quê e yOi H ØO2xi As várias somas de quadrados que aparecem na Equação 352 podem ser descritas como a seguir y2 i H Yi Y 2 H variação total dos valores observados de Y em torno de sua média amostral que pode ser chamada de soma total de quadrados STQ PyO i 2 D PYOi YO2 D PYOi Y 2 D ØO2 2 Pxi 2 D variação dos valores estimados de Y em torno de sua média YO D Y que apropriadamente pode ser chamado de soma dos quadrados devido à regressão isto é devido às variávelis explanatórias ou simplesmente a soma dos quadrados explicados pela regressão PuOi 2 D varia ção residual ou inexplicada dos valores de Y em relação à linha de regressão ou simplesmente soma dos quadrados dos resíduos SQR Portanto a Equação 352 é STQ D SQE C SQR 353 e mostra que a variação total dos valores observados de Y em torno de sua média pode ser dividida em duas partes uma atribuível à linha de regressão e a outra a forças aleatórias porque nem todas as obser vações efetivas de Y situamse sobre a linha ajustada Podemos ver isso geometricamente na Figura 39 Dividindo os dois lados da Equação 353 por STQ obtemos 1 D SQE STQ C SQR STQ D YOi YO 2 Yi YO 2 C uO2 i Yi YO 2 354 YiY total ui devido aos resíduos FRA B1 B2Xi Ø Ø Yi Yi Y devido à regressão Y Y 0 Xi X Yi fiGuRa 39 Separação da variação de Yi em dois componentes ECONOBOOKindb 96 23112010 071001 Capítulo 3 Modelo de regressão de duas variáveis o problema da estimação 97 Agora definindo r 2 como r2 D YOi Y 2 Yi Y 2 D SQE STQ 355 ou como r2 D 1 uO2 i Yi Y 2 D 1 SQR STQ 355a O valor de r 2 assim definido é conhecido como coeficiente de determinação amostral e é o indica dor mais usado para medir a qualidade do ajustamento de uma linha de regressão Em palavras r 2 mede a proporção ou percentual da variação total de Y explicada pelo modelo de regressão Duas propriedades de r2 devem ser destacadas 1 É um valor não negativo Por quê 2 Seus limites são 0 r 2 1 Um r 2 igual a l significa um ajustamento perfeito isto é YOi D Yi para cada i Por outro lado um r 2 igual a zero significa que não há qualquer relação entre regressando e regressor ØO2 D 0 Nesse caso como mostra a Equação 319 YOi D ØO1 D Y a melhor previsão para qualquer valor de Y é seu valor médio Nessa situação a linha de regressão será horizontal ao eixo dos X Embora r 2 possa ser calculado diretamente da definição da Equação 355 ele pode ser obtido mais rapidamente com a seguinte fórmula r2 D SQE STQ D yO2 i y2 i D ØO2 2 x2 i y2 i D ØO2 2 x2 i y2 i 356 Se dividirmos o numerador e o denominador da Equação 356 pela amostra de tamanho n ou por n l se o tamanho da amostra for muito pequeno obtemos r2 D ØO2 2 S2 x S2y 357 em que Sy 2 e Sx 2 são as variâncias amostrais de Y e X respectivamente Como ØO2 D xi yi x2 i a Equação 356 também pode ser expressa como r2 D xi yi 2 x2 i y2 i 358 que pode ser fácil de calcular ECONOBOOKindb 97 23112010 071003 98 Parte Um Modelos de regressão com equação única Dada a definição de r 2 podemos expressar SQE e SQR discutidas anteriormente como se segue SQED r2 STQ D r2 y2 i SQRD STQ STE D STQ1 SQESTQ D y2 i 1 r2 359 3510 Portanto podemos escrever STQD SQEC SQR y2 i D r2 y2 i C 1 r2 y2 i 3511 uma expressão que nos será muito útil mais adiante Algo estreitamente relacionado mas conceitualmente muito diferente de r 2 é o coeficiente de correlação que como foi visto no Capítulo l é uma medida do grau de associação entre duas variá veis Pode ser calculado tanto por r D ß r2 3512 ou com base em sua definição r D xi yi x2 i y2 i D n XiYi Xi Yi n X2 i Xi 2 n Y 2 i Yi 2 3513 que é conhecido como coeficiente de correlação amostral22 Estas são algumas das propriedades de r veja a Figura 310 1 Pode ser positivo ou negativo o que dependerá do sinal do termo no numerador da Equação 3513 que mede a covariação amostral das duas variáveis 2 Se situa entre os limites de l e C1 isto é l r 1 3 Sua natureza é simétrica isto é o coeficiente de correlação entre X e Y rXY é o mesmo que aquele entre Y e X rYX 4 É independente da origem e da escala isto é se definimos X i D a Xi C C e Y i D b Yi C d onde a 0 b 0 e c e d são constantes então o r entre X e Y é o mesmo que aquele entre as variáveis originais X e Y 5 Se X e Y são estatisticamente independentes veja a definição no Apêndice A o coeficiente de correlação entre elas é zero mas se r D 0 isso não significa que as variáveis sejam independentes Em outras palavras correlação zero não implica necessariamente independência veja Figura 310h 6 É uma medida de associação linear ou de dependência linear não é significativa para descre ver relações não lineares Assim na Figura 310 h Y D X 2 é uma relação exata embora r seja zero Por quê 7 Mesmo sendo uma medida de associação linear entre duas variáveis ela não implica necessa riamente qualquer relação de causa e feito como observado no Capítulo 1 22 o coeficiente de correlação populacional denotado por Ω é definido no Apêndice A ECONOBOOKindb 98 23112010 071004 Capítulo 3 Modelo de regressão de duas variáveis o problema da estimação 99 No contexto da regressão r 2 é uma medida mais significativa que r pois a primeira nos indica a proporção da variação da variável dependente explicada pelas variávelis explanatórias e portan to proporciona uma medida geral da extensão em que a variação de uma variável determina a varia ção de outra Já r não tem esse valor23 Além disso como veremos a interpretação de r D R em um modelo de regressão múltiplo é de valor duvidoso No entanto falaremos mais de r 2 no Capítulo 7 Note que o r 2 definido anteriormente também pode ser calculado como o coeficiente de correla ção entre o Yi observado e o Yi estimado elevado ao quadrado especificamente Ŷi Usando a Equação 3513 podemos escrever r2 D Yi Y YOi Y 2 Yi Y 2 YOi Y 2 Isto é r2 D yi yOi 2 y2 i yO2 i 3514 em que Yi D Y observado YOi D Y estimado e Y D YO D média de Y Para uma demonstração veja o Exercício 315 A Equação 3514 justifica a descrição de r 2 como uma medida de qualidade de ajusta mento pois nos diz quanto os valores estimados de Y estão próximos de seus valores observados 23 no modelo da regressão a teoria subjacente indica a direção de causalidade entre Y e X que no contexto dos modelos de uma única equação é em geral de X para Y d e f X Y r 1 r 1 X Y X Y a b c X Y X Y X Y X Y X Y h g r próximo de 1 r próximo de 1 r positivo mas próximo de zero r negativo mas próximo de zero r 0 Y X2 mas r 0 fiGuRa 310 Padrões de correlação adaptado de Theil Henri Introduction to econometrics Englewood Cliffs NJ Prentice Hall 1978 p 86 ECONOBOOKindb 99 23112010 071006 100 ParteUm Modelos de regressdéo com equagdao unica 36 Um exemplo numérico Ilustraremos a teoria econométrica apresentada até agora considerando os dados fornecidos na Tabela 26 que relaciona o salariohora médio Y com a escolaridade X A teoria econdmica basica do trabalho nos informa que dentre muitas varidveis a escolaridade é um determinante importante dos salarios Na Tabela 32 fornecemos os dados brutos necess4rios para estimar 0 impacto quantitativo dos anos de estudo nos salarios TABELA 32 Obs Y x x y re VK Pas oes com 1 44567 6 6 4218 36 25308 2 577 7 5 29047 25 145235 3 59787 8 4 2696 16 10784 4 73317 9 3 1343 9 4029 5 73182 10 2 13565 4 2713 6 65844 11 1 20903 1 20903 7 78182 12 0 08565 0 0 8 78351 13 1 08396 1 08396 9 110223 14 2 23476 4 46952 10 106738 15 3 19991 9 59973 11 108361 16 4 21614 16 86456 12 13615 17 5 49403 25 247015 13 13531 18 6 48563 36 291378 Soma 1127712 156 0 0 182 1317856 Obs 1 36 1986217 4165294 0291406 0084917 2 49 332929 4916863 0853137 0727843 3 64 3574485 5668432 0310268 0096266 4 81 5375382 6420001 0911699 0831195 5 100 5355605 717157 014663 00215 6 121 4335432 7923139 133874 1792222 7 144 6112425 8674708 085651 0733606 8 169 6138879 9426277 159118 2531844 9 196 121491 1017785 0844454 0713103 10 225 11393 1092941 025562 0065339 11 256 1174211 1168098 084488 0713829 12 289 1853682 1243255 1182447 1398181 13 324 183088 1318412 0346878 0120324 Soma 2054 1083376 1127712 0 983017 Nota xj XXy Y a LyjXj 1317856 h Sr e0 07240967 By BX 8674708 07240967x12 001445 2 g2 2H 983017 9 993652 6 0945332 n2 11 6 0893652 varf2 Se 7 18307 0004910 ep2 000490 0070072 2 Sa 983017 rel Sa yy 7051188 006 r 72 09521 Dx 2054 varB wea 108 7 0868132 epB1 0868132 09317359 Capítulo 3 Modelo de regressão de duas variáveis o problema da estimação 101 20 18 16 14 12 10 8 6 Anos de estudo 4 4 6 Saláriohora médio 14 12 10 8 fiGuRa 311 Linha de regressão estimada para os dados salário escolaridade da Tabela 26 Com base nos dados dessa tabela obtemos a linha de regressão estimada do seguinte modo YOi D 00144 C 07240Xi 361 A Figura 311 apresenta geometricamente a linha de regressão estimada Como sabemos cada ponto da linha de regressão representa uma estimativa do valor médio de Y correspondente ao valor de X escolhido YOi é uma estimativa de EY j Xi O valor de ØO2 D 07240 que mede a inclinação da linha mostra que dentro da faixa amostral de X entre 6 e 18 anos de estudo quando X aumenta em 1 ano o aumento estimado no saláriohora médio é de cerca 072 Para cada ano adicional de escolaridade em média o saláriohora aumenta em 72 centavos de dólar O valor ØO1 D 00144 que é o intercepto da linha indica o nível médio do salário semanal quan do o nível de escolaridade é zero Essa interpretação literal do intercepto nesse caso não faz sentido Como é possível ter um salário negativo Como veremos ao longo do livro muitas vezes o intercepto não apresenta um significado viável no sentido prático Além disso o intervalo amostral não inclui um nível de escolaridade zero O valor de r 2 em torno de 090 sugere que a escolaridade explica cerca de 90 da variação no salário Como r 2 pode ser no máximo igual a l nossa linha de regressão ajustase muito bem aos dados O coeficiente de correlação r D 09521 mostra que salário e anos de estudo têm uma correlação positiva e alta Antes de finalizarmos nosso exemplo note que esse modelo é extremamente simples A teoria econômica do trabalho nos informa que além da escolaridade variáveis como gênero raça local sindicatos trabalhistas e idiomas também são fatores importantes na determinação do salário Depois de estudarmos a regressão com múltiplas variáveis nos Capítulos 7 e 8 passaremos a considerar um modelo mais extenso para a determinação do salário ECONOBOOKindb 101 23112010 071007 102 Parte Um Modelos de regressão com equação única 37 Exemplos ilustrativos exeMPlo 31 Relação entre consumo e renda nos Estados Unidos 1960 2005 voltemos aos dados de consumo e renda apresentados na Tabela i1 da introdução Já mostramos os dados na Figura i3 juntamente com a linha de regressão estimada da equa ção i33 agora apresentaremos os resultados da regressão de mínimos quadrados ordiná rios obtidos com o pacote estatístico Eviews 6 nota Y D despesas pessoais de consumo dPC e X D produto interno bruto Pib medidos em bilhões de 2000 neste exemplo os dados formam uma série temporal ˆYt 2995913 07218Xt var ØO1 8274195 ep ØO1 287649 var ØO2 00000195 ep ØO2 0004423 r 2 09983 ˆ 2 7356689 371 a equação 371 é a função consumo agregado ou para a economia como um todo função consumo keynesiana Como ela mostra a propensão marginal a consumir PmC é de cerca de 072 sugerindo que se a renda real aumenta em um dólar as despesas médias de consumo pessoal dCP sobem em cerca de 072 Segundo a teoria keynesiana a PmC deve situarse entre 0 e 1 o valor do intercepto neste exemplo é negativo o que não faz sentido econômico em uma interpretação literal isso significa que se o valor do Pib fosse zero o nível médio das despesas pessoais de consumo seria cerca de 299 bilhões o valor de r 2 09983 significa que aproximadamente 99 da variação nas dPC são ex plicados pela variação do Pib esse valor é bastante alto considerando que r 2 pode ser no máximo igual a 1 Como veremos ao longo do livro nas regressões que envolvem séries tem porais em geral obtemos valores altos de r 2 veremos as razões desse fenômeno no capítulo sobre autocorrelação assim como no capítulo sobre econometria das séries temporais exeMPlo 32 Despesas com alimentação na Índia volte aos dados apresentados na Tabela 28 do exercício 215 eles referemse a uma amostra de 55 do micílios rurais da Índia neste exemplo o regressando é a despesa com alimentos e o regressor a despesa total uma proxy para a renda ambas em rupias neste caso estamos diante de dados de corte transversal Com base nos dados fornecidos obtivemos a seguinte regressão DespAlimentaçãoi D 942087 C 04368 DespTotali var ØO1 D 25609401 epØO1 D 508563 var ØO2 D 00061 epØO2 D 00783 r 2 D 03698 ˆσ2 D 44696913 372 Com base na equação 372 vemos que se a despesa total aumenta em 1 rupia as des pesas com alimentação aumentam em média cerca de 44 paisas 1 rupia D 100 paisas Se as despesas totais fossem iguais a zero a despesa média com alimentação seria cerca de 94 rupias novamente a interpretação mecânica do intercepto pode não ter muito sentido neste exemplo podese argumentar que mesmo que as despesas totais fossem iguais a zero como no caso da perda de emprego as pessoas ainda manteriam um mínimo de gastos com alimentação seja pedindo dinheiro emprestado ou lançando mão de economias o valor de r 2 cerca de 037 significa que apenas 37 da variação nas despesas com alimentação são explicadas pela despesa total esse pode parecer um valor muito baixo mas como veremos ao longo do livro quando trabalhamos com dados de corte transversal em geral obtemos valores baixos para r 2 possivelmente em decorrência da diversidade de uni dades contidas na amostra Trataremos deste tópico no capítulo sobre heterocedasticidade veja o Capítulo 11 ECONOBOOKindb 102 23112010 071008 Capítulo 3 Modelo de regressão de duas variáveis o problema da estimação 103 exeMPlo 33 Demanda por telefones celulares e computadores pessoais em relação à renda pessoal per capita a Tabela 33 mostra os dados relativos ao número de assinantes de operadoras de tele fonia móvel e o número de computadores pessoais PCs ambos para cada 100 indivíduos e a renda per capita ajustada pelo poder de compra em dólares para uma amostra de 34 países neste caso temos dados de corte transversal eles referemse ao ano de 2003 e fo ram obtidos por meio do Statistical Abstract of the United States 2006 embora celulares e PCs sejam extensivamente usados nos estados Unidos isso não ocorre em muitos países Para verificarmos se a renda per capita é um fator no uso de celulares e PCs construímos uma regressão para cada um desses meios de comunicação usando como amos tra 34 países os resultados foram os seguintes Tabela 33 Número de assinantes de operadoras de telefonia móvel e número de computadores pessoais para cada 100 indivíduos e renda per capita em 2003 para países selecionados Fonte Statistical Abstract of the United States 2006 Tabela 1364 para dados sobre telefones celulares e computadores pessoais e Tabela 1327 para renda per capita ajustada pelo poder de compra Renda per capita em Argentina 1776 82 11410 Austrália 7195 6018 28780 Bélgica 7928 3181 28920 7510 748 2636 Bra lis Bulgária 4664 519 754 Canadá 419 487 30040 4980 276 2148 China Colômbia 1413 493 6410 República Tcheca 9646 1774 15600 Equador 1892 324 3940 3940 291 845 Egito 27640 3471 6959 França Alemanha 7852 4847 27610 Grécia 9023 817 19900 Guatemala 1315 144 4090 Hungria 7688 1084 13840 2880 072 247 Índia Indonésia 874 119 3210 26830 2307 10176 lá ia tI 28450 3822 679 aJ pão México 2947 83 8980 Holanda 7676 4666 28560 2040 042 175 Paquistão Polônia 4509 142 11210 8950 887 2493 Rússia 3211 1367 13230 África do Sul 3636 726 10130 22150 196 9161 Espanha Suécia 9805 6213 26710 Suíça 8434 7087 32220 Tailândia 394 2398 7450 27690 4057 9117 Reino Unido 37750 6598 5458 Estados Unidos Venezuela 273 609 4750 NotaOs dados sobre celulares e PCs são para cada 100 indivíduos Arábia Saudita Celular PCs País Demanda por telefones celulares Sendo Y D número de assinantes de operadoras de telefonia móvel e X D renda per capita ajustada pelo poder de compra obtivemos a seguinte regressão ˆYi H 144773 C 00022Xi epØO1 H 61523 epØO2 H 000032 r2H 06023 373 Continua ECONOBOOKindb 103 23112010 071009 104 Parte Um Modelos de regressão com equação única exeMPlo 33 Continuação o coeficiente angular sugere que se a renda per capita aumentar em média 1000 o número de assinantes de operadoras de telefonia móvel aumentará em 22 para cada 100 indivíduos o valor do intercepto de cerca de 1447 sugere que mesmo que a renda per capita seja zero o número médio de assinantes será de 14 para cada 100 indivíduos nova mente essa interpretação pode não ter muito sentido pois em nossa amostra não existe nenhum país com renda per capita zero o valor de r2 é moderadamente alto mas note que nossa amostra inclui uma variedade de países com diversos níveis de renda em uma amostra tão diversificada como esta não poderíamos esperar um valor de r2 muito elevado após estudarmos o Capítulo 5 mostraremos como os erros padrão apresentados na equação 373 podem ser usados para avaliar a significância estatística dos coeficientes es timados Demanda por computadores pessoais embora os preços dos computadores pessoais tenham caído substancialmente ao longo dos anos os PCs ainda não são onipresentes Um determinante importante da demanda por PCs é a renda pessoal outro determinante é o preço mas não temos dados comparativos sobre preço de PCs para os países de nossa amos tra Sendo Y o número de PCs e X a renda per capita obtivemos a seguinte demanda par cial por PCs parcial porque não temos dados comparativos sobre preços ou sobre outras variáveis que podem afetar a demanda por PCs ˆYi D 65833 C 00018Xi epØO1 D 27437 epØO2 D 000014 r2D 08290 374 Como esses resultados sugerem a renda pessoal per capita tem uma relação positiva com a demanda por PCs depois de estudarmos o Capítulo 5 você verá que estatisticamente a renda pessoal per capita é um determinante importante da demanda por PCs o valor negativo do intercepto neste caso não tem significado prático a despeito da diversidade de nossa amostra o r2 estimado é bastante alto a interpretação do coeficiente angular é que se a renda per capi ta aumentar em média 1000 a demanda por computadores pessoais aumentará cerca de 2 unidades para cada 100 indivíduos embora o uso de PCs esteja popularizandose rapidamente há muitos países que ainda usam computadores mainframe Portanto o uso total de computadores nesses países pode ser muito maior do que aquele indicado pela venda de PCs 38 Uma nota sobre os experimentos de Monte Carlo Neste capítulo mostramos que sob as hipóteses do modelo clássico de regressão linear os estima dores de mínimos quadrados apresentam certas características desejáveis resumidas na propriedade de melhor estimador linear não viesado MELNT No Apêndice deste capítulo demonstraremos essa propriedade de modo mais formal Entretanto como é possível saber na prática que a propriedade de melhor estimador linear não viesado se sustenta Por exemplo como verificamos se os estimadores de MQO são não viesados A resposta é dada pelos chamados experimentos de Monte Carlo que são em essência simulações de computador ou experimentos de amostragem Para apresentar as ideias básicas considere nossa função de regressão populacional FRP com duas variáveis Yi D Ø1 C Ø2 Xi C ui 381 Um experimento de Monte Carlos segue os seguintes passos 1 Suponha que os verdadeiros valores dos parâmetros sejam Ø1 D 20 e Ø2 D 06 2 Escolha o tamanho da amostra como por exemplo n D 25 3 Fixe os valores de X para cada observação Ao todo serão 25 valores de X ECONOBOOKindb 104 23112010 071010 Capítulo 3 Modelo de regressão de duas variáveis o problema da estimação 105 4 Suponha que você usou uma tabela de números aleatórios para escolher 25 valores e os chamou de ui atualmente a maioria dos pacotes estatísticos já inclui geradores de números aleatórios24 5 Como você conhece Ø1 Ø2 Xi e ui aplicando a Equação 381 obtemos 25 valores de Yi 6 Agora com os 25 valores de Yi gerados desse modo fazemos a regressão deles contra os va lores de X escolhidos no passo 3 obtendo ØO1 e ØO2 os estimadores de mínimos quadrados 7 Suponha que o experimento seja repetido 99 vezes usando sempre os mesmos valores de Ø1 Ø2 e X Obviamente os valores de ui variarão de experimento para experimento Portanto ao todo temos 100 experimentos gerando assim cem valores de Ø1 e Ø2 na prática são condu zidos muitos desses experimentos às vezes de 1000 a 2000 8 Chame as médias daquelas cem estimativas de ØO1 e ØO2 9 Se os valores estiverem muito próximos dos verdadeiros valores de Ø1 e Ø2 definidos no passo l este experimento Monte Carlo estabelece que os estimadores de mínimos quadrados são de fato não viesados Lembrese de que segundo o modelo clássico de regressão linear EØO1 D Ø1 e EØO2 D Ø2 Esses passos caracterizam a natureza geral dos experimentos de Monte Carlo que são muitas vezes utilizados para estudar as propriedades estatísticas de vários métodos de estimação de parâmetros populacionais Eles são especialmente úteis para estudar o comportamento dos estimadores em amostras pequenas ou finitas Também são um excelente meio de destacar o conceito de amostras repetidas que é a base da maior parte da inferência estatística clássica como veremos no Capítulo 5 Apresentaremos vários exemplos de experimentos de Monte Carlo por meio de exercícios para sala de aula Veja o Exercício 327 Resumo e conclusões Os tópicos e conceitos mais importantes deste capítulo podem ser resumidos da seguinte forma 1 A estrutura básica da análise de regressão é o modelo clássico de regressão linear MCRL 2 O MCRL baseiase em um conjunto de hipóteses 3 Com base nessas hipóteses os estimadores de mínimos quadrados assumem determinadas pro priedades resumidas no teorema de GaussMarkov que informa que na classe dos estimadores lineares não viesados os estimadores de mínimos quadrados têm variância mínima Em resumo eles são o melhor estimador linear não viesado MELNT ou BLUE 4 A precisão dos estimadores de MQO é medida por seus erros padrão Nos Capítulos 4 e 5 veremos como eles nos permitem fazer inferências sobre os parâmetros populacionais os coeficientes Ø 5 A qualidade geral do ajustamento do modelo de regressão é medida pelo coeficiente de determi nação r 2 Ele nos indica que proporção da variação da variável dependente ou regressando é explicada pela variável explanatória ou regressor O valor de r 2 situase entre 0 e l quanto mais próximo de l melhor o ajustamento 6 Um conceito relacionado ao coeficiente de determinação é o coeficiente de correlação r É uma medida de associação linear entre duas variáveis e seu valor situase entre l e C1 7 O modelo clássico de regressão linear é um construto teórico ou uma abstração porque se apoia em um conjunto de hipóteses que pode ser rígido ou pouco realista Mas esse tipo de abstração é muitas vezes necessário nos estágios iniciais do estudo em qualquer área do conhecimento Uma vez dominado o MCRL podemos verificar o que acontece se uma ou mais das hipóteses não forem satisfeitas A primeira parte deste livro é dedicada ao estudo do modelo clássico de re gressão linear As demais partes consideram refinamentos do MCRL A Tabela 34 apresenta um roteiro do que virá mais adiante 24 na prática supõese que ui siga uma certa distribuição de probabilidade normal com certos parâmetros como média e variância Uma vez especificados os valores dos parâmetros é fácil gerar os ui com o auxílio dos paco tes estatísticos ECONOBOOKindb 105 23112010 071010 106 Parte Um Modelos de regressão com equação única exeRCíCioS 31 Dadas as hipóteses da coluna l da tabela a seguir demonstre que as premissas apresentadas na coluna 2 são suas equivalentes Hipóteses do modelo clássico 1 2 Eui Xi D 0 EYi Xi D Ø2 C Ø2 Xi cov uiuj D 0 i j cov YiYj D 0 i j var ui Xi D æ2 var Yi Xi D æ2 32 Mostre que as estimativas ØO1 D 1572 e ØO2 D 1357 usadas no primeiro experimento da Tabela 31 são de fato calculadas pelos estimadores de MQO 33 De acordo com Malinvaud veja a nota de rodapé 11 a hipótese de que Eui Xi D 0 é bastan te importante Para tanto considere a FRP Y D Ø1 C Ø2 Xi C ui Agora considere duas situa ções i Ø1 D 0 Ø2 D l e Eui D 0 e ii Ø1 D l Ø2 D 0 e Eui D Xi 1Tome a esperança da FRP condicional a X nos dois casos anteriores e veja se concorda com Malinvaud a respeito do significado da hipótese Eui Xi D 0 34 Considere a regressão amostral Yi D ØO1 C ØO2Xi C uO i Impondo as restrições i PuOi D 0 e ii PuOi Xi D 0 obtenha os estimadores ØO1 e ØO2 e mostre que eles são idênticos aos estimadores de mínimos quadrados dados nas Equações 316 e 317 Esse método de obter estimadores é conhecido como princípio da analogia Apresen te uma justificativa intuitiva para a imposição das restrições i e ii Dica lembrese da premissa de MCRL sobre ui Note que o princípio da analogia para estimar parâmetros desco nhecidos também é denominado método dos momentos em que momentos amostrais por exemplo médias amostrais são usados para estimar os momentos populacionais como a mé dia populacional Como observado no Apêndice A um momento é uma estatística sintética de uma distribuição de probabilidade tal como o valor esperado e a variância 35 Mostre que r2 definido em 355 situase entre 0 e 1 Você pode aplicar a desigualdade de Cauchy Schwartz segundo a qual para quaisquer variáveis aleatórias X e Y a seguinte relação é válida EXY2 EX2EY 2 Número da hipótese Tipo de desrespeito Onde estudar 1 Não linearidade nos parâmetros Capítulo 14 2 Regressores estocásticos Capítulo 13 3 Média de ui diferente de zero Introdução à Parte II 4 Heterocedasticidade Capítulo 11 5 Termos de erros autocorrelacionados Capítulo 12 6 Termos de observação amostrais Capíulo 10 inferiores ao número de regressores 7 Variabilidade insuficiente nos regressores Capítulo 10 8 Multicolinearidade Capítulo 10 9 Viés de especificação Capítulos 13 14 1 0 Termos de erro não normais Capítulo 13 Essas hipóteses serão apresentadas no Capítulo 7 quando discutiremos o modelo de regressão múltipla Notas a hipótese de que os termos ui são normalmente distribuídos não faz parte do MCRl Falaremos mais disto no Capítulo 4 Tabela 34 O que acontece se as hipóteses do MCRL não forem respeitadas ECONOBOOKindb 106 23112010 071012 Capítulo 3 Modelo de regressão de duas variáveis o problema da estimação 107 36 ØO yx e ØO xy representam os coeficientes angulares nas regressões de Y contra X e de X contra Y respectivamente Mostre que ØOY XØOXY D r2 em que r é o coeficiente de correlação entre X e Y 37 Suponha que no exercício anterior ØO yx ØO xy D 1 Teria alguma importância se fizéssemos a re gressão de Y contra X ou de X contra Y Explique cuidadosamente 38 O coeficiente de correlação de rankings classificação de Spearman rs é definido assim rs H 1 6 d2 nn2 1 em que d D diferença nos rankings atribuídos ao mesmo indivíduo ou fenômeno e n D núme ro de indivíduos ou fenômenos ranqueados Deduza rs por meio de r definido na Equação 3513 Dica ordene os valores de X e de Y de l a n Observe que a soma dos rankings de X e de Y é nn C l2 para cada um e portanto suas médias são n C 12 39 Considere a seguinte formulação da FRP de duas variáveis Modelo I Yi H Ø1 C Ø2Xi C ui Modelo II Yi H Æ1 C Æ2Xi X C ui a Calcule os estimadores de Ø1 e α1 São idênticos Suas variâncias são idênticas b Calcule os estimadores de Ø2 e a2 São idênticos Suas variâncias são idênticas c Qual a vantagem se é que existe do modelo II em relação ao modelo I 310 Suponha que você execute a seguinte regressão yi H ØO1 C ØO2xi C uO i em que como de costume yi e xi são desvios em relação às respectivas médias Qual será o valor de ØO1 Por quê ØO2 será igual ao obtido por meio da Equação 316 Por quê 311 Seja r1 D coeficiente de correlação entre n pares de valores Yi Xi e r2 D coeficiente de corre lação entre n pares de valores aXi C b cYi C d em que a b c e d são constantes Mostre que r1 D r2 e estabeleça assim o princípio de que o coeficiente de correlação não varia em rela ção à mudança de escala e à mudança de origem Dica aplique a definição de r dada na Equação 3513 Nota as operações aXi Xi C b e aXi C b são conhecidas respectivamente como mudança de escala mudança de origem e mudança de escala e de origem 312 Se r o coeficiente de correlação entre n pares de valores Xi Yi for positivo determine se cada uma das seguintes afirmações é verdadeira ou falsa a r entre Xi Yi também é positivo b r entre Xi Yi e entre Xi Yi pode ser positivo ou negativo c Os coeficientes angulares ØOyx ØOxy são positivos em que Øyx D coeficiente angular na regres são de Y contra X e Øxy D coeficiente angular da regressão de X contra Y 313 Se X1 X2 e X3 são variáveis não correlacionadas tendo cada uma delas o mesmo desvio pa drão mostre que o coeficiente de correlação entre X1 CX2 e X2 C X3 é igual a 2 1 Por que o coeficiente de correlação não é igual a zero 314 Na regressão Yi D Ø1 C Ø2 Xi C ui suponha que multipliquemos cada valor de X por uma cons tante 2 Isso alterará os resíduos e os valores ajustados de Y Explique O que aconteceria se somássemos um valor constante 2 a cada valor de X Capítulo 3 Modelo de regressão de duas variáveis o problema da estimação 107 ECONOBOOKindb 107 23112010 071014 108 Parte Um Modelos de regressão com equação única 315 Mostre que a Equação 3514 mede de fato o coeficiente de determinação Dica aplique a definição de r dada na Equação 3513 e lembrese de que yi yOi H yOi C uO iyOi D yO2 i bem como da Equação 356 316 Explique justificando se as seguintes afirmações são verdadeiras falsas ou duvidosas a Como a correlação entre duas variáveis X e Y pode variar entre l e C1 isso significa que cov X Y também se situa entre esses limites b Se a correlação entre duas variáveis for zero isso quer dizer que não há qualquer relação entre as duas variáveis c Se fizermos uma regressão de Yi contra YOi isto é Y observado contra Y estimado os va lores do intercepto e do coeficiente angular serão 0 e l respectivamente 317 Regressão sem qualquer regressor imagine o modelo Yi D Ø1 C ui Aplique os mínimos qua drados ordinários para encontrar o estimador de Ø1 Qual a variância e a SQR da regressão O Ø1 estimado tem qualquer sentido intuitivo Agora pense no modelo de duas variáveis Yi D Ø1 C Ø2 Xi C ui Vale a pena acrescentar Xi ao modelo Em caso negativo por que se preocupar com a análise de regressão exercícios aplicados 318 Na Tabela 35 está a classificação de dez estudantes nas provas parcial e final de estatística Calcule o coeficiente de correlação de rankings de Spearman e interprete os resultados Estudante Ranking A B C D E F G H I J Prova parcial 1 3 7 10 9 5 4 8 2 6 Prova Final 3 2 8 7 9 6 5 10 1 4 319 A relação entre a taxa de câmbio nominal e os preços relativos Com base nas observações anuais de 1985 a 2005 obtevese a seguinte regressão em que Y D taxa de câmbio do dólar canadense em relação ao dólar americano DC e X D razão do IPC americano pelo IPC canadense isto é X representa os preços relativos dos dois países YOt H 0912 C 2250Xt r2 D 0440 ep H 0096 a Interprete a regressão Como você interpretaria r2 b O valor positivo de Xt faz sentido econômico Qual a teoria econômica em que se embasa c Suponha que X seja redefinido como a razão entre o IPC canadense e o IPC americano Isso mudaria o sinal de X Por quê 320 A Tabela 36 apresenta dados relativos a índices de produção por hora X e remuneração real por hora Y para os setores empresarial e empresarial não agrícola da economia dos Estados Unidos no período 19602005 O anobase dos índices é 1992 D 100 e os índices foram ajus tados sazonalmente a Represente graficamente Y contra X para os dois setores da economia separadamente b Qual a teoria econômica que embasa a relação entre as duas variáveis O gráfico de disper são confirma a teoria c Estime uma regressão de MQO de Y contra X Guarde os resultados para examinálos no vamente depois de estudar o Capítulo 5 Tabela 35 108 Parte Um Modelos de regressão com equação única ECONOBOOKindb 108 23112010 071015 Capítulo 3 Modelo de regressão de duas variáveis o problema da estimação 109 Produção por hora de Remuneração real todas as pessoas 1 por Hora23 Setor empresarial não agrícola Setor empresarial não agrícola Setor empresarial Setor empresarial Ano 1960 489 519 608 633 1961 506 535 625 648 1962 529 559 646 667 1963 550 578 661 681 1964 568 596 677 693 1965 588 614 691 705 1966 612 636 717 726 1967 625 647 735 745 1968 647 669 762 771 1969 650 670 773 781 1970 663 680 788 792 1971 690 707 802 807 1972 712 731 826 832 1973 734 753 843 847 1974 723 742 833 838 1975 748 762 841 845 1976 771 787 864 866 1977 785 800 876 880 1978 793 810 891 896 1979 793 807 893 897 1980 792 806 891 896 1981 808 817 893 898 1982 801 808 904 908 1983 830 845 903 909 1984 852 861 907 911 1985 871 875 920 922 1986 897 902 949 952 1987 901 906 952 955 1988 915 921 965 967 1989 924 928 950 951 1990 944 945 962 961 1991 959 961 974 974 1992 1000 1000 1000 1000 1993 1004 1004 997 995 1994 1013 1015 990 991 1995 1015 1020 987 988 1996 1045 1047 994 994 1997 1065 1064 1005 1003 1998 1095 1094 1052 1049 1999 1128 1125 1080 1075 2000 1161 1157 1120 1115 2001 1191 1186 1135 1128 2002 1240 1235 1157 1151 2003 1287 1280 1177 1171 2004 1327 1318 1190 1182 2005 1357 1349 1202 1193 1A produção se refere ao PIB real do setor 2Salários e ordenados dos empregados mais contribuição dos empregadores à seguridade social e aos planos de aposentadoria privados 3Remuneração por hora dividida pelo IPC para todos os consumidores urbanos nos trimestres recentes Tabela 36 Produtividade e dados relacionados setor empresarial 1960 2005 números índice 1992 D 100 dados trimestrais sazonalmente ajustados Fonte Economic Report of the President 2007 Tabela 49 Capítulo 3 Modelo de regressão de duas variáveis o problema da estimação 109 ECONOBOOKindb 109 23112010 071016 110 Parte Um Modelos de regressão com equação única 321 Os seguintes resultados foram obtidos com base em uma amostra de 10 observações Yi H 1110 Xi H 1700 XiYi H 205500 X2 i H 322000 Y 2 i H 132100 com coeficiente de correlação r D 09758 Mas ao conferir esses dados verificouse que dois pares de observações tinham sido registrados como Y X Y X 90 120 em vez de 80 110 140 220 150 210 Qual será o efeito desse erro sobre r Calcule o r correto 322 A Tabela 37 apresenta dados relativos a preços do ouro índice de preços ao consumidor IPC e o índice NYSE da Bolsa de Valores de Nova York para o período 19742006 O índice NYSE inclui mais de 1500 ações negociadas nessa bolsa a Assinale em um mesmo diagrama de dispersão os preços do ouro o IPC e o índice NYSE Tabela 37 Preço do ouro índice Nyse e IPC para os Estados Unidos no período 19742006 Ano Preço do Ouro Índice NYSE IPC 1974 1592600 4635400 4930000 1975 1610200 4835500 5380000 1976 1248400 5758500 5690000 1977 1577100 5676600 6060000 1978 1932200 5678100 6520000 1979 3066800 6166800 7260000 1980 6125600 7201500 8240000 1981 4600300 7826200 9090000 1982 3756700 7288400 9650000 1983 4243500 9795200 9960000 1984 3604800 9773300 1039000 1985 3172600 1142970 1076000 1986 3676600 1438020 1096000 1987 4464600 1709790 1136000 1988 4369400 1585140 1183000 1989 3814400 1903360 1240000 1990 3835100 1939470 1307000 1991 3621100 2181720 1362000 1992 3438200 2421510 1403000 1993 3597700 2638960 1445000 1994 3840000 2687020 1482000 1995 3841700 3078560 1524000 1996 3877700 3787200 1569000 1997 3310200 4827350 1605000 1998 2942400 5818260 1630000 1999 2788800 6546810 1666000 2000 2791100 6805890 1722000 2001 2740400 6397850 1771000 2002 3097300 5578890 1799000 2003 3633800 5447460 1840000 2004 4097200 6612620 1889000 2005 4447400 7349000 1953000 2006 6034600 8357990 2016000 110 Parte Um Modelos de regressão com equação única ECONOBOOKindb 110 23112010 071017 Capítulo 3 Modelo de regressão de duas variáveis o problema da estimação 111 b Supõese que um investimento funcione como proteção contra a inflação se seu preço eou sua taxa de retorno acompanha pelo menos a taxa de inflação Para testar essa hipótese ajuste o seguinte modelo supondo que o diagrama de dispersão elaborado no item a su giria que isso seja adequado Preço do ouro t H Ø1 C Ø2 IPCt C ut Índice NYSEt H Ø1 C Ø2 IPCt C ut 323 A Tabela 38 apresenta dados do produto interno bruto PIB dos Estados Unidos no pe ríodo 19592005 a Represente graficamente os dados do PIB em dólares correntes e em dólares constan tes de 2000 em relação ao tempo b Denotando o PIB por Y e o tempo por X medido em uma sequência cronológica em que l represente 1959 2 1960 e assim por diante até 47 para 2005 veja se o seguinte modelo ajustase aos dados do PIB Yt D Ø1 C Ø2 Xt C ut Estime este modelo para o PIB nominal e para o PIB real c Como você interpretaria Ø2 d Se existe diferença entre o Ø2 estimado para o PIB nominal e para o Ø2 estimado para o PIB real o que explica essa diferença e Com base nos resultados obtidos o que se pode dizer sobre a natureza da inflação america na durante o período da amostra Tabela 38 PIB nominal e real 19592005 em bilhões de dólares exceto se notificado dados anuais sazonalmente ajustados com base em valores trimestrais PIB real em bilhões de dólares encadeados de 2000 Ano PIB nominal PIB real Ano PIB nominal PIB real 1959 5066 24413 1983 35367 54238 1960 5264 25018 1984 39332 58136 1961 5447 25600 1985 42203 60537 1962 5856 27152 1986 44628 62636 1963 6177 28340 1987 47395 64751 1964 6636 29986 1988 51038 67427 1965 7191 31911 1989 54844 69814 1966 7878 33991 1990 58031 71125 1967 8326 34846 1991 59959 71005 1968 9100 36527 1992 63377 73366 1969 9846 37654 1993 66574 75327 1970 10385 37719 1994 70722 78355 1971 11271 38986 1995 73977 80317 1972 12383 41050 1996 78169 83289 1973 13827 43415 1997 83043 87035 1974 15000 43196 1998 87470 90669 1975 16383 43112 1999 92684 94703 1976 18253 45409 2000 98170 98170 1977 20309 47505 2001 101280 98907 1978 22947 50150 2002 104696 100488 1979 25633 51734 2003 109608 103010 1980 27895 51617 2004 117125 107035 1981 31284 52917 2005 124558 110486 1982 32550 51893 Fonte Economic Report of the President 2007 Tabelas B1 e B2 Capítulo 3 Modelo de regressão de duas variáveis o problema da estimação 111 ECONOBOOKindb 111 23112010 071018 112 Parte Um Modelos de regressão com equação única 324 Utilizando os dados da Tabela I1 verifique a Equação 371 325 Com base no exemplo do SAT fornecido no Exercício 216 faça o seguinte a Represente graficamente a relação entre as notas de homens e mulheres nas provas de aptidão verbal b Se o diagrama de dispersão sugerir que uma relação linear entre as duas variáveis é apropriada calcule a regressão da aptidão verbal das mulheres contra a dos homens c Se houver uma relação entre as duas variáveis acima ela é causal 326 Repita o exercício anterior para as notas de aptidão matemática 327 Estudo de Monte Carlo para sala de aula consulte os 10 valores de X apresentados na Tabela 32 Seja Ø1 D 25 e Ø2 D 05 Suponha que ui º N0 9 isto é ui está distribuído normalmente com média 0 e variância 9 Gere 100 amostras usando esses valores a fim de obter 100 estimativas de Ø1 e Ø2 Represente graficamente as estimativas Que conclusões você pode tirar do estudo de Monte Carlo Nota a maioria dos pacotes estatísticos permi te gerar variáveis aleatórias por meio de distribuições de probabilidade conhecidas Peça ajuda a seu professor caso tenha dificuldade em gerar tais variáveis 328 Usando os dados da Tabela 33 represente graficamente o número de assinantes de operadoras de telefonia móvel contra o número de computadores pessoais em uso Há alguma relação discernível entre os dois Se existe como você justifica essa relação Apêndice 3A 3a1 Derivação dos estimadores de mínimos quadrados Derivando parcialmente a Equação 312 em relação a ØO1 e ØO2 obtemos uO2 i ØO1 D 2 Yi ØO1 ØO2Xi D 2 uO i uO2 i ØO2 D 2 Yi ØO1 ØO2XiXi D 2 uO i Xi 1 2 Igualando essas equações a zero depois de simplificação e manipulação algébricas obtemos os estimado res dados pelas Equações 316 e 317 3a2 Propriedades de linearidade e não tendenciosidade dos estimadores de mínimos quadrados Com base em 318 temos ØO2 H xiYi x2 i H kiYi 3 em que ki H xi x2 i que mostra que ØO2 é um estimador linear porque é função linear de Y na verdade é uma média ponderada de Yi em que os ki são os pesos Também pode ser demonstrado que ØO1 é um estimador linear 112 Parte Um Modelos de regressão com equação única ECONOBOOKindb 112 23112010 071020 Capítulo 3 Modelo de regressão de duas variáveis o problema da estimação 113 As propriedades dos pesos ki são as seguintes 1 Como os Xi são considerados não estocásticos os ki também são não estocásticos 2 ki D 0 3 k2 i H 1 x2 i 4 ki xi H ki Xi D 1 Essas propriedades decorrem diretamente da definição de ki Por exemplo ki D xi x2 i D 1 x2 i xi uma vez que para uma dada amostra x2 i é conhecida D 0 já que xi a soma dos desvios em relação à média é sempre zero Agora substitua a FRP Yi D Ø1 C Ø2 Xi C ui na Equação 3 para obter ØO2 H kiØ1 C Ø2Xi C ui H Ø1 ki C Ø2 ki Xi C kiui H Ø2 C kiui 4 em que se usam as propriedades de ki mencionadas anteriormente Agora tomando a esperança da Equação 4 dos dois lados da equação e observando que os ki sendo não estocásticos podem ser tratados como constantes obtemos EØO2 H Ø2 C ki Eui H Ø2 5 Já que Eui D 0 por hipótese Portanto ØO2 é um estimador não viesado de Ø2 Do mesmo modo é possível provar que ØO1 também é um estimador não viesado de Ø1 3a3 Variâncias e erros padrão dos estimadores de mínimos quadrados Agora segundo a definição de variância podemos escrever var ØO2 D EØO2 EØO22 D EØO2 Ø22 uma vez que EØO2 D Ø2 D E kiui 2 usando a Equação 4 acima D E k2 1u2 1 C k2 2u2 2 C C k2 nu2 n C 2k1k2u1u2 C C 2kn1knun1un 6 Da hipótese Eui 2 D σ2 para cada i e Euiuj D 0 i j seguese que var ØO2 H æ 2 k2 i H æ 2 x2 i usando a definição de k2 i H Equação 331 7 A variância de ØO1 pode ser obtida seguindo a mesma linha de raciocínio já apresentada Uma vez obtidas as variâncias de ØO1 e ØO2 suas raízes quadradas positivas proporcionam os erros padrão correspondentes ECONOBOOKindb 113 23112010 071022 114 Parte Um Modelos de regressão com equação única 114 Parte Um Modelos de regressão com equação única 3a4 Covariância entre ØO1 e ØO2 Por definição cov ØO1 ØO2 D EfØO1 EØO1ØO2 EØO2g D EØO1 ØO1ØO2 ØO2 Por quê D X E ØO2 ØO22 D X var ØO2 D Equação 339 8 em que usamos o fato de que ØO1 Y ØO2X e EØO1 Y Ø2 X o que resulta em ØO1 EØO1 X ØO2 Ø2 Nota var ØO2 é dada na Equação 331 3a5 estimador de mínimos quadrados de æ 2 Lembrese de que Yi D Ø1 C Ø2 Xi C ui 9 Portanto Y D Ø1 C Ø2X C u 10 Subtraindo 10 de 9 obtemos yi D Ø2xi C ui u 11 Lembrese também de que uO i D yi ØO2xi 12 Portanto substituindo a Equação 11 na Equação 12 obtemos uO i D Ø2xi C ui u ØO2xi 13 Reunindo os termos elevando ao quadrado e somando os dois lados obtemos uO2 i D ØO2 Ø22 x2 i C ui u2 2ØO2 Ø2 xiui u 14 Considerando a esperança dos dois lados temos E uO2 i D x2 i EØO2 Ø22 C E ui u2 2E ØO2 Ø2 xiui u D x2 i var ØO2 C n 1 var ui 2E kiuixiui D æ 2 C n 1 æ 2 2E ki xiu2 i D æ 2 C n 1 æ 2 2æ 2 D n 2æ 2 15 em que no penúltimo passo fazemos uso da definição de ki dada na Equação 3 e da relação dada na Equação 4 Note também que ECONOBOOKindb 114 23112010 071025 Capítulo 3 Modelo de regressão de duas variáveis o problema da estimação 115 E ui u2 H E u2 i nu2 H E u2 i n ui n 2 H E u2 i 1 n u2 i H næ 2 n n æ 2 H n 1æ 2 que se embasa no fato de os ui serem não correlacionados e de que a variância de cada ui é æ2 Assim obtemos E uO2 i D n 2æ 2 16 Portanto se definirmos æO 2 H uO2 i n 2 17 seu valor esperado é EæO2 D 1 n 2 E uO2 i D æ 2 usando a Equação 16 18 o que mostra que æO 2 é um estimador não viesado do verdadeiro æ 2 3a6 Propriedade da variância mínima dos estimadores de mínimos quadrados Mostramos na Seção 3A2 do Apêndice 3A que o estimador de mínimos quadrados ØO2 é linear e não viesado o que também se aplica a ØO1 Para mostrar que esses estimadores também apresentam variância mínima dentro da classe de todos os estimadores lineares não viesados considere o estimador de mínimos quadrados ØO2 ØO2 D kiYi Onde ki D Xi X Xi X 2 D xi x2 i veja Apêndice 3A2 19 que mostra que ØO2 é uma média ponderada de todos os Y com peso ki Vamos definir um estimador linear alternativo de Ø2 do seguinte modo Ø2 H wiYi 20 onde wi também são pesos não necessariamente iguais a ki Agora EØ2 D wi EYi D wiØ1 C Ø2Xi D Ø1 wi C Ø2 wi Xi 21 Portanto para que Ø 2 seja não viesado é preciso que wi H 0 22 ECONOBOOKindb 115 23112010 071029 116 Parte Um Modelos de regressão com equação única e wi Xi D 1 23 Também podemos escrever var Ø2 D var wiYi D w2 i var Yi Notavar Yi D var ui D æ 2 D æ 2 w2 i Notacov Yi Yj D 0 i H j D æ 2 wi xi x2 i C xi x2 i 2 Observe o truque matemático D æ 2 wi xi x2 i 2 C æ 2 x2 i x2 i 2 C 2æ 2 wi xi x2 i xi x2 i D æ 2 wi xi x2 i 2 C æ 2 1 x2 i 24 porque o último termo desaparece no penúltimo passo Por quê Como o último termo da Equação 24 é constante a variância de Ø 2 pode ser minimizada apenas pela manipulação do primeiro termo Se fizermos wi D xi x2 i a Equação 24 reduzse a var Ø 2 D æ 2 x2 i D var ØO2 25 Em palavras com pesos wi D ki que são as ponderações de mínimos quadrados a variância do estimador linear Ø 2 é igual à variância do estimador de mínimos quadrados senão var Ø 2 varØO2 Dito de outro modo se houver um estimador linear não viesado de variância mínima de Ø2 deve ser o estimador de mínimos quadrados Do mesmo modo podese demonstrar que é um estimador linear não viesado de variância mínima de Ø1 3a7 Consistência dos estimadores de mínimos quadrados Demonstramos que na estrutura do modelo clássico de regressão linear os estimadores de mínimos qua drados são não viesados e eficientes em qualquer tamanho de amostra grande ou pequena Mas às vezes como foi visto no Apêndice A um estimador pode não satisfazer uma ou mais propriedades estatísticas dese jáveis no caso das amostras pequenas Mas à medida que o tamanho da amostra aumenta indefinidamente os estimadores apresentam propriedades estatísticas desejáveis Essas propriedades são conhecidas como pro priedades das amostras grandes ou propriedades assintóticas Neste Apêndice examinaremos uma proprie dade das amostras gran des especificamente a consistência discutida em mais detalhes no Apêndice A Já mostramos que no caso do modelo de duas variáveis o estimador de MQO ØO2 é um estimador não viesado do verdadeiro Ø2 Agora veremos que ØO2 também é um estimador consistente de Ø2Como apresentado no Apên dice A uma condição suficiente para a consistência é que ØO2 seja não viesado e que sua variância tenda para zero à medida que o tamanho da amostra n tende para o infinito Como já demonstramos a propriedade sem viés agora precisamos apenas mostrar que a variância de ØO2 tende a zero quando n aumenta indefinidamente Sabemos que var ØO2 D æ 2 x2 i D æ 2n x2 i n 26 Dividindo o numerador e o denominador por n não alteramos a igualdade ECONOBOOKindb 116 23112010 071031 Capítulo 3 Modelo de regressão de duas variáveis o problema da estimação 117 Assim lim var ØO2 D lim æ 2n x2 i n D 0 n1 n1 27 já que 1 o limite de um quociente é o limite do numerador dividido pelo limite do denominador o que pode ser visto em qualquer manual de cálculo 2 como n tende para o infinito σ 2n tende a zero pois σ 2 é um número finito e x2 i n D 0 porque a variância de X tem um limite finito em decorrência da Hipótese 7 do modelo clássico de regressão linear Do que foi visto concluise que o estimador de MQO ØO2 é um estimador consistente do verdadeiro Ø2 Da mesma forma é possível verificar que ØO1 também é um estimador consistente Assim em pequenas amostras repetidas os estimadores de MQO são não viesados e à medida que o tamanho da amostra cresce indefinida mente os estimadores de MQO são con sistentes Como veremos mais adiante mesmo se algumas das hipóteses do modelo clássico de regressão linear não forem atendidas podemos obter estimadores consistentes dos coe ficientes de regressão em várias situações ECONOBOOKindb 117 23112010 071032 118 Modelo clássico de regressão linear normal MCRLN O que é conhecido como teoria clássica da inferência estatística consiste em dois ramos a estimação e o teste de hipóteses Até agora abordamos o tema da estimação dos parâmetros do mo delo de regressão linear com duas variáveis Utilizando o método dos MQO conseguimos estimar os parâmetros Ø1 Ø2 e æ2 Sob as hipóteses do modelo clássico de regressão linear demonstramos que os es timadores desses parâmetros Ø1 Ø2 e æ 2 satisfazem várias propriedades estatísticas desejáveis como a de não viés variância mínima etc Lembrese da propriedade de melhor estimador linear não vie sado ou não tendencioso MELNT ou BLUE Note que como são estimadores seus valores muda rão de amostra para amostra Portanto esses estimadores são variáveis aleatórias Mas a estimação é metade do caminho A outra metade é o teste de hipóteses Lembrese de que na análise de regressão nosso objetivo é não apenas estimar a função de regressão amostral FRA mas também usála para fazer inferências sobre a função de regressão populacional FRP como enfatiza mos no Capítulo 2 Então queremos saber até que ponto Ø1 aproximase de Ø1 ou quanto æ 2 está próxi mo do verdadeiro æ2 Por exemplo no Exemplo 32 estimamos a FRA apresentada na Equação 372 Mas como essa regressão está baseada em uma amostra de 55 famílias como saberemos se a PMC esti mada de 04368 representa a verdadeira PMC da população como um todo Portanto como Ø1 Ø2 e æ 2 são variáveis aleatórias precisamos descobrir suas distribuições de probabilidade pois sem esse conhecimento não seremos capazes de relacionálas a seus verdadeiros valores 41 A distribuição de probabilidade dos termos de erro ui Para descobrir as distribuições de probabilidade dos estimadores de mínimos quadrados ordiná rios procedemos como a seguir Especificamente considere Ø2 Como mostramos no Apêndice 3A2 2 H kiYi ØO 411 em que ki H xi x2 i Mas como supomos que os X são fixos ou não estocásticos porque nossa análise de regressão é condicional ou seja condicionada aos valores fixos de Xi a Equação 411 mostra que Ø2 é uma função linear de Yi que é aleatória por hipótese Devido ao fato de Yi Ø1 Ø2 Xi ui podemos escrever a Equação 411 como 2 H kiØ1 C Ø2Xi C ui ØO 412 Capítulo 4 ECONOBOOKindb 118 23112010 071033 Como ki os betas e Xi são todos fixos Ø2 é em última análise uma função linear da variável alea tória ui que é aleatória por hipótese Portanto a distribuição de probabilidade de Ø2 e também de Ø1 dependerá da hipótese adotada sobre a distribuição de probabilidade de ui E por ser necessário co nhecer as distribuições de probabilidade dos estimadores de mínimos quadrados ordinários para fazer inferências sobre seus valores populacionais a natureza da distribuição de probabilida de de ui assume um papel muito importante no teste de hipóteses O método dos mínimos quadrados ordinários não faz qualquer suposição sobre a natureza proba bilística de ui ele é de pouca ajuda para inferências sobre a função de regressão populacional com base nos resultados da função de regressão amostral apesar do teorema de GaussMarkov Esse hiato pode ser preenchido se nos dispusermos a aceitar que os u seguem alguma distribuição de probabili dade Por motivos explicados em breve no contexto da regressão em geral supõese que os u sigam a distribuição normal Acrescentando a hipótese da normalidade para ui às hipóteses do modelo clás sico de regressão linear examinado no Capítulo 3 obtemos o que se conhece por modelo clássico de regressão linear normal MCRLN 42 A hipótese de normalidade de ui O modelo clássico de regressão linear normal supõe que cada ui seja distribuído normal mente com Média Eui H 0 421 Variância Eui Eui2 H E u2 i D æ 2 422 cov ui uj Efui Euiuj Eujg H Eui uj H 0 i j 423 Essas hipóteses podem ser representadas de modo mais compacto como ui ª N0 æ 2 424 em que o símbolo ª significa distribuído como e N representa a distribuição normal os termos entre parênteses são os dois parâmetros da distribuição normal a média e a variância Conforme observado no Apêndice A no caso de duas variáveis com distribuição normal covariância ou correlação iguais a zero significam independência das duas variáveis Dada a hipó tese de normalidade a Equação 424 indica que ui e uj não estão correlacionados e são distri buídos independentemente Dessa forma podemos escrever a Equação 424 como ui ª NID 0 æ 2 425 em que NID representa normal e independentemente distribuído Por que utilizamos a hipótese de normalidade Por que utilizamos a hipótese de normalidade Existem diversas razões 1 De acordo com a Seção 25 ui representa a influência combinada sobre a variável dependen te de um grande número de variáveis não incluídas explicitamente no modelo de regressão Espera mos que a influência dessas variáveis omitidas ou negligenciadas seja pequena e na melhor das hipóteses aleatória O conhecido teorema central do limite TCL da estatística veja o Apêndice A para maiores detalhes permite demonstrar que se há um grande número de variáveis aleatórias independentes e com distribuição idêntica então com poucas exceções a distribuição de suas somas Capítulo 4 Modelo clássico de regressão linear normal MCRLN 119 ECONOBOOKindb 119 23112010 071035 120 Parte Um Modelos de regressão com equação única tende à distribuição normal conforme o número dessas variáveis aumenta indefinidamente1 É o TCL que oferece uma justificativa teórica para a hipótese de normalidade de ui 2 Uma variante do TCL informa que mesmo que o número de variáveis não seja muito grande ou que essas variáveis não sejam estritamente independentes sua soma ainda pode ser normalmen te distribuída2 3 Dada a hipótese de normalidade a distribuição de probabilidade dos estimadores de mínimos quadrados ordinários pode ser facilmente derivada porque segundo o Apêndice A uma das pro priedades da distribuição normal é que qualquer função linear de variáveis com distribuição normal também é normalmente distribuída Como já discutimos os estimadores de mínimos quadrados ordinários Ø1 e Ø2 são funções lineares de ui Portanto se os ui estiverem normalmente distribuídos Ø1 e Ø2 também estarão o que facilita muito nossa tarefa de testar as hipóteses 4 A distribuição normal é comparativamente simples envolvendo apenas dois parâmetros mé dia e variância é muito conhecida e suas propriedades teóricas já foram extensamente estudadas na estatística matemática Além disso muitos fenômenos parecem seguir a distribuição normal 5 Se estivermos lidando com uma amostra pequena ou finita por exemplo com menos de 100 observações a hipótese de normalidade assume um papel fundamental Ela não só nos auxilia a derivar a distribuição de probabilidade exata dos estimadores de mínimos quadrados ordinários mas também nos permite usar os testes estatísticos t F e 2 para modelos de regressão As propriedades estatísticas desses testes são discutidas no Apêndice A Como mostraremos a seguir se o tamanho da amostra for suficientemente grande podemos relaxar a hipótese de normalidade 6 Por fim em amostras grandes as estatísticas de t e F têm aproximadamente as distribuições probabilísticas de t e F de forma que os testes de t e F que se baseiam na hipótese de que o erro pa drão tem distribuição normal ainda possam ser aplicados validamente3 Hoje há muita informação sobre corte transversal e temporais que possuem um número razoavelmente grande de observações Portanto a hipótese de normalidade pode não ser muito relevante em grandes conjuntos de dados Uma advertência como estamos impondo a hipótese de normalidade devemos verificar em apli cações práticas envolvendo dados de amostras pequenas se ela é adequada Mais à frente apresentare mos alguns testes que se destinam a isso e também veremos situações em que a hipótese de normalidade pode ser inadequada Por enquanto continuaremos trabalhando com a hipótese de normalidade pelos motivos examinados anteriormente 43 Propriedades dos estimadores de MQO sob a hipótese de normalidade Dada a hipótese de que ui segue a distribuição normal como na Equação 425 os estimadores de mínimos quadrados ordinários têm as seguintes propriedades o Apêndice A apresenta uma dis cussão geral sobre as propriedades estatísticas desejáveis dos estimadores 1 São não viesados 2 Têm variância mínima Combinado ao item l isso significa que eles são estimadores não viesados com variância mínima ou estimadores eficientes 1 Para uma discussão relativamente simples e objetiva deste teorema veja roSS Sheldon m Introduction to probability and statistics for engineers and scientists 2 ed nova York harcourt academic Press 2000 p 193 194 Uma exceção ao teorema é a distribuição de Cauchy que não tem média ou momentos mais elevados veja Kendall m G STUarT a The advanced theory of statistics londres Charles Griffin Co 1960 v1 p 248249 2 Para as várias formas do TCl veja Cramer harald Mathematical methods of statistics Princeton nJ Princeton University Press 1946 cap 17 3 Para uma discussão técnica sobre este tema veja heiJ Christiaan et al Econometric methods with applications in business and economics oxford oxford University Press 2004 p 197 ECONOBOOKindb 120 23112010 071035 3 São consistentes à medida que o tamanho da amostra aumenta indefinidamente os estimado res convergem para os verdadeiros valores da população 4 Ø1 que é uma função linear de ui apresenta distribuição normal com Média E 1 D Ø1 var 1 æ 2 1 D X2 i n x2 i æ 2 ØO ØO ØO 431 333 432 Ou de modo mais compacto 1 ª N Ø1 æ 2 ØO1 ØO Pelas propriedades da distribuição normal a variável Z que é definida como Z H 1 1 æ 1 ØO ØO Ø 433 segue a distribuição normal padrão uma distribuição normal com média zero e variância unitária 1 ou Z ª N0 1 5 Como Ø2 sendo uma função linear de ui tem distribuição normal com Média EØO2 H Ø2 var ØO2 æ 2 ØO2 H æ 2 x2 i 434 331 435 Ou de modo mais compacto ØO2 ª N Ø2 æ 2 ØO2 Como na Equação 433 Z H ØO2 Ø2 æØO2 436 também segue a distribuição normal padrão A Figura 41 apresenta geometricamente as distribuições de probabilidades de Ø1 e Ø2 6 n 2 æ2æ2 segue a distribuição de 2 quiquadrado com n 2 graus de liberdade4 Essa informação nos ajuda a fazer inferências a respeito do verdadeiro æ2 com base em æ2 estimado como mostraremos no Capítulo 5 A distribuição de quiquadrado e suas propriedades são discutidas no Apêndice A 4 a demonstração desta afirmação é um pouco complexa Um fonte acessível é hoGG robert v CraiG allen T Introduction to mathematical statistics 2 ed nova York mcmillan 1965 p 144 Capítulo 4 Modelo clássico de regressão linear normal MCRLN 121 ECONOBOOKindb 121 23112010 071038 122 Parte Um Modelos de regressão com equação única 7 A distribuição de Ø1 Ø2 é independente de æ2 A importância disso será explicada no próximo capítulo 8 Ø1 e Ø2 possuem a variância mínima dentro da classe dos estimadores não viesados sejam li neares ou não Esse resultado formulado por Rao é muito pertinente pois diferentemente do teorema de GaussMarkov não se limita apenas à classe dos estimadores lineares5 Podemos dizer que os esti madores de mínimos quadrados ordinários são os melhores estimadores não viesados MELNT eles têm a variância mínima na classe inteira de estimadores não viesados Resumindo o importante a observar é que a hipótese de normalidade nos permite deduzir as distribuições de probabilidade ou amostrais de Ø1 e Ø2 ambas normais e de æ2 relacionada à qui quadrado Como veremos no próximo capítulo isso simplifica a tarefa de estabelecer intervalos de confiança e de testar estatisticamente as hipóteses Note também que dada a hipótese de que ui ª N0 æ2 Yi sendo uma função linear de ui também está distribuído normalmente com média e variância dadas por EYi H Ø1 C Ø2Xi 437 var Yi H æ 2 438 Ou de modo mais elegante Yi ª NØ1 C Ø2Xi æ 2 439 44 O método da máxima verossimilhança MV Um método de estimação pontual com algumas propriedades teóricas mais fortes que as do mé todo dos mínimos quadrados ordinários é o da máxima verossimilhança MV Tratandose de um método um tanto intrincado será discutido no apêndice deste capítulo Para o leitor em geral é sufi ciente observar que se considerarmos a distribuição de ui normal como fizemos pelas razões já examinadas os estimadores de máxima verossimilhança e de mínimos quadrados ordinários dos coe ficientes de regressão os Ø serão idênticos e isso é válido tanto para as regressões simples quanto para as múltiplas O estimador de máxima verossimilhança MV para æ2 é 2 uOi n Esse estimador é viesado enquanto o estimador de mínimos quadrados ordinários de æ 2 D uO2 i n 2 é como 5 rao C r Linear statistical inference and its applications nova York John Wiley Sons 1965 p 258 Densidade Densidade fZ fØO1 0 Z 1 1 1 E 1 1 1 ØO ØO ØO Ø Ø æ ØO Densidade Densidade 0 fZ 2 b2 b2 E 2 2 Z 2 Ø Ø ØO æ fØO2 ØO ØO ØO fiGuRa 41 Distribuição das probabilidades de Ø1e Ø2 ECONOBOOKindb 122 23112010 071041 vimos não viesado Mas comparando esses dois estimadores de æ2 vemos que à medida que o ta manho da amostra n aumenta os dois estimadores de æ2 tendem a se igualarem Dessa forma assin toticamente quando n aumenta indefinidamente o estimador de máxima verossimilhança de æ2 também é não viesado Como o método dos mínimos quadrados acrescido da hipótese de normalidade de ui nos oferece todas as ferramentas necessárias tanto para a estimação quanto para o teste de hipóteses dos modelos de regressão linear não há perda para os leitores que não se interessarem pelo método da máxima verossimilhança em função de sua possível complexidade matemática Resumo e conclusões 1 Este capítulo abordou o modelo clássico de regressão linear normal MCRLN 2 A diferença entre este modelo e o modelo clássico de regressão linear MCRL é que o primeiro supõe especificamente que o termo de erro ui do modelo de regressão tem distribuição normal O modelo de regressão linear clássico não requer qualquer hipótese sobre a distribuição de proba bilidade ui apenas exige que o valor médio de ui seja igual a zero e sua variância seja uma cons tante finita 3 A justificativa teórica da hipótese de normalidade é o teorema central do limite 4 Sem a hipótese de normalidade sob as demais hipóteses examinadas no Capítulo 3 o teorema de GaussMarkov mostrou que os estimadores de MQO são os melhores estimadores lineares não viesados MELNT ou BLUE 5 Com a hipótese adicional de normalidade os estimadores de MQO não são apenas melhores es timadores não viesados MENT ou BUE mas também seguem distribuições de probabilidade conhecidas Os estimadores de mínimos quadrados ordinários do intercepto e do coeficiente an gular são eles próprios normalmente distribuídos e o estimador de MQO da variância de ui æ2 relacionase à distribuição quiquadrado 6 Nos Capítulos 5 e 8 mostraremos como este conhecimento é útil para inferências sobre os valores dos parâmetros populacionais 7 Uma alternativa ao método dos mínimos quadrados é o da máxima verossimilhança MV No entanto para aplicar esse método é preciso fazer uma suposição sobre a distribuição de proba bilidade do termo de erro ui No contexto da regressão a suposição mais empregada é de que ui segue a distribuição normal 8 Sob a hipótese de normalidade os estimadores de MV e de MQO dos parâmetros do intercepto e do coeficiente angular do modelo de regressão são idênticos No entanto os estimadores de MQO e os de MV da variância de ui são diferentes Em grandes amostras os dois estimadores convergem 9 O método de máxima verossimilhança é conhecido como método de amostras grandes Ele tem uma aplicação mais ampla já que também pode ser usado para modelos de regressão não lineares nos parâmetros Neste último caso o método dos MQO em geral não é usado Para mais detalhes veja o Capítulo 14 10 Neste livro usaremos muito o método dos mínimos quadrados ordinários por questões práticas a comparado ao método da máxima verossimilhança o dos mínimos quadrados é fácil de apli car b os estimadores de máxima verossimilhança e os de mínimos quadrados ordinários de Ø1 e Ø2 são idênticos o que também é válido para as regressões múltiplas e c mesmo em amostras relativamente grandes os estimadores de æ2 dos dois métodos citados não diferem demasiada mente No entanto para os leitores com mais inclinação à matemática apresentamos uma breve introdução ao método da máxima verossimilhança no apêndice a seguir e também no Apêndice A Capítulo 4 Modelo clássico de regressão linear normal MCRLN 123 ECONOBOOKindb 123 23112010 071041 124 ParteUm Modelos de regressdo com equagdao unica Apéndice 4A 4A1 Estimagao de maxima verossimilhanga de um modelo de regressao com duas variaveis Suponha que no modelo de duas variaveis Y 6 6X u os Y sejam normal e independentemente dis tribuidos com média f 6X e variancia 0 Veja a Equacao 439 Em consequéncia a fungdo de den sidade de probabilidade conjunta de Y Y Y dadas a média e a variancia anteriores pode ser escrita como FX Yo Yn Bi B2Xi07 Mas tendo em vista a independéncia dos Y essa funao de densidade de probabilidade conjunta pode ser expressa como um produto de n fungées de densidade individuais FY Yo Yn Bi PoXi 07 1 f1 Bi BoXi 07 fY2 Bi BrXi0 f En Bi PXi 0 em que I 1 Yi Bi B2Xi f exp p o 21x 2 2 que é a funao de densidade de uma varidvel com distribuigdo normal dadas a média e a variancia Nota exp significa e elevado a poténcia da expressao indicada por Substituindo a Equacao 2 por cada Y na Equacao 1 obtemos I 1 Bi 2Xi fi Yas s Yn Bi BoXi0 exp 3 er n 2 oO o 2m 3 Se Yj Yo Y S40 conhecidos ou dados mas f fo e o7 nao so a funcdo na Equacio 3 6 chamada de funcdo de verossimilhana denotada por FV f2 e 77 e expressa como I 1 Bi 62Xi FVB1 Bo 7 z exp 5 Ee on 20 2 4 O método da maxima verossimilhanga como 0 nome indica consiste em estimar os parametros desco nhecidos de maneira que a probabilidade de observar os dados Y seja a maior ou a maxima possivel Precisa mos encontrar o maximo da funcdo na Equagao 4 Isso um exercicio direto de calculo diferencial Para derivar é mais facil expressar a Equacio 4 na forma logaritmica como a seguir Nota In log natural n 1 Yj Bi B2Xi InFV nIno 5 InQ2a 5 ee n Nn 1 Y Bi B2Xi Derivando a Equacio 5 parcialmente em relacao a fh B e 7 obtemos dInFV 1 Y B Bo X1 i Di Bi BaXi1 eB Obviamente se B2 e forem conhecidos mas os Y forem desconhecidos a Equaao 4 representa a fungao de densidade de probabilidade conjunta a probabilidade de observar conjuntamente os Y 2Como uma fungao log é uma fungao monoténica In FV atingiré seu valor maximo no mesmo ponto que FV Capítulo 4 Modelo clássico de regressão linear normal MCRLN 125 ln FV Ø2 H 1 æ 2 Yi Ø1 Ø2XiXi 7 ln FV æ 2 H n 2æ 2 C 1 2æ 4 Yi Ø1 Ø2Xi2 8 Igualando essas equações a zero condição de primeira ordem para a otimização e denotando os estimado res de máxima verossimilhança por QØ1 QØ2 e Qæ2 obtemos3 1 æ 2 Yi Ø1 Ø2Xi D 0 9 1 æ 2 Yi Ø1 Ø2XiXi H 0 10 n 2æ 2 C 1 2æ 4 Yi Ø1 Ø2Xi2 D 0 11 Após a simplificação as Equações 9 e 10 ficam como Yi D nØ1 C Ø2 Xi 12 Yi Xi C Ø1 Xi C Ø2 X2 i 13 que são exatamente as equações normais da teoria dos mínimos quadrados obtidas nas Equações 314 e 315 Portanto os estimadores de máxima verossimilhança os QØ são idênticos aos estimadores de MQO os Ø dados nas Equações 316 e 317 Essa igualdade não é acidental Examinando a verossimilhança 5 vemos que o último termo entra com sinal negativo Maximizar a Equação 5 é o mesmo que minimizar esse termo que é justamente o que faz a abordagem dos mínimos quadrados como se pode ver na Equação 312 Substituindo na Equação 11 os estimadores de máxima verossimilhança MQO e simplificando obte mos o estimador de máxima verossimilhança para Qæ2 como æ 2 H 1 n Yi Ø1 Ø2Xi2 D 1 n Yi OØ1 Ø2Xi2 H 1 n u2 i O O 14 Com base na Equação 14 fica óbvio que o estimador de máxima verossimilhança Qæ2 difere do estimador de MQO æO 2 H 1n 2 uO2 i que como já foi demonstrado no Apêndice 3A é um estimador não viesados de æ 2 Assim o estimador de máxima verossimilhança de æ2 é viesado A magnitude desse viés pode ser de terminada com facilidade do seguinte modo Tomandose a esperança matemática da Equação 14 de ambos os lados obtemos Eæ 2 H 1 n E uO2 i H n 2 n æ 2 usando a Equação 16 da Seção 3A5 do Apêndice 3A D σ2 2 n æ 2 15 que mostra que Qæ2 é viesado para baixo isto é subestima o verdadeiro æ2 em amostras pequenas Note que quando n o tamanho da amostra aumenta indefinidamente o se gundo termo na Equação 15 o fator de viés 3 Usamos til para denotar os estimadores de mv e circunflexo para os estimadores de mQo Capítulo 4 Modelo clássico de regressão linear normal MCRLN 125 ECONOBOOKindb 125 23112010 071049 126 Parte Um Modelos de regressão com equação única tende a zero Portanto assintoticamente em amostras muito grandes Qæ2 também é não viesado ou seja lim E Qæ2 æ2 quando n Podese demonstrar adicionalmente que Qæ2 é também um estimador consistente4 conforme n aumenta indefinidamente Qæ2 converge para seu valor verdadeiro æ2 4a2 estimação de máxima verossimilhança das despesas com alimentação na índia Volte ao Exemplo 32 e à Equação 372 que mostram a regressão das despesas com alimentação contra as despesas totais em 55 domicílios rurais na Índia Como sob a hipótese de normalidade os estimadores dos coe ficientes da regressão são os mesmos nos métodos dos mínimos quadrados ordinários e da máxima verossimi lhança obtemos os estimadores de MV como QØ1 Ø1 942087 e QØ2 Ø2 04386 O estimador de MQO de æ2 é æ 2 44696913 mas o estimador de MV Qæ2 44071563 que é menor que o estimador de MQO Como obser vado em amos tras pequenas o estimador de máxima verossimilhança é viesado para baixo subes tima em mé dia a verdadeira variância de æ2 Naturalmente como seria de esperar quando o tamanho da amostra aumenta a diferença entre os dois estimadores estreitase Inserindo os valores dos estimadores na função logarítmica de verossimilhança obtemos o valor de 3081625 Se quiser o valor máximo da MV basta encontrar o antilogaritmo de 3081625 Nenhum outro valor dos parâmetros proporcionará uma probabilidade maior de obter a amostra utilizada na análise apêndice 4a exercícios 41 Se duas variáveis aleatórias são estatisticamente independentes o coeficiente de correlação entre elas é igual a zero Mas o inverso não é necessariamente verdadeiro isto é correlação zero não implica indepen dência estatística Contudo se duas variáveis têm distribuição normal correlação igual a zero implica ne cessariamente independência estatística Verifique essa afirmação para a seguinte função de densidade de probabilidade conjunta de duas variáveis Y1 e Y2 normalmente distribuídas essa função de densidade de pro babilidade conjun ta é conhecida como função de densidade de probabilidade normal bivariada f Y1 Y2 H 1 2ºæ1æ2 1 Ω2 exp 1 21 Ω2 Y1 π1 æ1 2 2Ω Y1 π1Y2 π2 æ1æ2 C Y2 π2 æ 2 2 em que π1 média de Y1 π2 média de Y2 æ1 desvio padrão de Y1 æ2 desvio padrão de Y2 Ω coeficiente de correlação entre Y1 e Y2 42 Aplicando as condições de segunda ordem para a otimização teste da derivada segunda mostre que o estimador de máxima verossimilhança de Ø1 Ø2 e æ 2 obtidos pela solução das Equações 9 10 e 11 maximizam de fato a função de verossimilhança na Equação 4 4 veja no Apêndice A uma discussão geral das propriedades dos estimadores de máxima verossimilhança bem como a distinção entre propriedade assintótica de ausência de viés e propriedade de consistência Grosso modo na proprie dade assintótica de ausência de viés tentamos encontrar o lim Qæ2 n quando n tende ao infinito em que n é o tama nho da amostra em que se embasa o estimador enquanto na consistência procuramos verificar como Qæ2 n se comporta quando n aumenta indefinidamente note que a propriedade de não viés é de amostragem repetida de um estimador baseado em uma amostra de dado tamanho enquanto na consistência estamos preocupados com o comportamento de um estimador à medida que a amostra aumenta indefinidamente ECONOBOOKindb 126 23112010 071050 Capítulo 4 Modelo clássico de regressão linear normal MCRLN 127 43 Uma variável aleatória X segue a distribuição exponencial se tem a seguinte função de densidade de proba bilidade f X H 1µeXµ para X 0 H 0 nos demais casos em que θ 0 é o parâmetro da distribuição Usando o método de máxima verossimilhança mostre que o estimador de MV de θ é H Xin µO em que n é o tamanho da amostra Ou seja mostre que o estimador de máxima verossimilhança de θ é a média amostral X 44 Suponha que o resultado de um experimento seja classificado apenas como um sucesso ou um fracasso No meando X 1 quando o resultado é um sucesso e X 0 quando é um fracasso a função de densidade de probabilidade ou massa de X é dada por pX H 0 H 1 p pX H 1 H p 0 p 1 Qual o mais provável estimador de p a probabilidade de sucesso Capítulo 4 Modelo clássico de regressão linear normal MCRLN 127 ECONOBOOKindb 127 23112010 071051 128 A regressão de duas variáveis estimação de intervalo e teste de hipóteses Cuidado para não testar hipóteses demais quanto mais você tortura os dados maior a probabilidade de que confessem mas tal confissão pode não ser admissível no tribunal da opinião científica1 Como destacado no Capítulo 4 a estimação e o teste de hipóteses são os dois ramos principais da estatística clássica A teoria da estimação consiste em duas partes a estimação pontual e a de interva lo Nos dois capítulos anteriores abordamos em detalhes a estimação pontual quando apresentamos os métodos dos mínimos quadrados ordinários e da máxima verossimilhança da estimação pontual Neste capítulo abordaremos primeiro a estimação de intervalo e então examinaremos o teste de hi póteses um tópico estreitamente relacionado à estimação de intervalo 51 Prérequisitos estatísticos Antes de demonstrar a mecânica do estabelecimento de intervalos de confiança e o teste estatísti co de hipóteses supõese que o leitor esteja familiarizado com os conceitos fundamentais de proba bilidade e de estatística Embora não seja um substituto de um curso básico de estatística o Apêndice A apresenta os conceitos estatísticos essenciais que o leitor deveria conhecer bem Concei tos fundamentais como probabilidade distribuições de probabilidade erro do tipo I e II nível de significância potência dos testes estatísticos e intervalos de confiança são imprescindíveis para entender o conteúdo deste e dos próximos capítulos 52 Estimativa de intervalo algumas ideias básicas Para fixar as ideias considere novamente o exemplo da relação entre salário e escolaridade do Capítulo 3 A Equação 361 mostra que o aumento médio no saláriohora em relação ao aumento de um ano na escolaridade ØO2 é de 07240 que representa uma única estimativa pontual do valor desconhecido da população Ø2 Até que ponto essa estimativa é confiável Conforme observado no Capítulo 3 devido a variações amostrais uma única estimativa provavelmente será diferente do 1 STiGler Stephen m Testing hypothesis or fitting models another look at mass extinctions in niTeCKi matthew h hoFFman antoni Coord Neutral models in biology oxford oxford University Press 1987 p 148 Capítulo 5 ECONOBOOKindb 128 23112010 071052 Capítulo 5 A regressão de duas variáveis estimação de intervalo e teste de hipóteses 129 verdadeiro valor embora em amostras repetidas esperase que seu valor médio seja igual ao valor verda deiro Nota EØO2 D Ø2 Na estatística a confiabilidade de um estimador pontual é medida por seu erro padrão Em vez de tomarmos como base apenas a estimativa pontual podemos construir um in tervalo em torno de um estimador pontual por exemplo de dois ou três erros padrão de cada lado do estimador pontual de modo que esse intervalo tenha por exemplo 95 de probabilidade de incluir o verdadeiro valor do parâmetro Essa é a ideia que está por trás da estimação de intervalo Para ser mais específico suponha que queiramos verificar quanto ØO2 está próximo de Ø2 Para tanto tentamos encontrar dois números positivos e Æ este último situado entre 0 e l tais que a pro babilidade de que o intervalo aleatório ØO2 ØO2 C contenha o verdadeiro Ø2 seja l Æ Simbo licamente Pr ØO2 Ø2 ØO2 C H 1 Æ 521 Esse intervalo quando existe é conhecido como intervalo de confiança l Æ como coefi ciente de confiança e Æ 0 Æ l como nível de significância2 Os pontos extremos do inter valo de confiança são os limites de confiança ou valores críticos ØO2 é o limite inferior de confiança e ØO2 C é o limite superior de confiança Note que na prática Æ e l Æ muitas vezes são expressos em percentuais como 100Æ e 100l Æ A Equação 521 mostra que um estimador de intervalo ao contrário do pontual é um intervalo construído de tal modo que tem uma probabilidade especificada l Æ de incluir em seus limites o verdadeiro valor do parâmetro Por exemplo se Æ D 005 ou 5 leremos a Equação 521 como a probabilidade de que o intervalo aleatório mostrado nela inclua o verdadei ro Ø2 é de 095 ou 95 Assim o estimador de intervalo proporciona uma faixa dentro da qual o verdadeiro Ø2 pode se situar É muito importante conhecer os seguintes aspectos da estimação de intervalo 1 A Equação 521 não indica que a probabilidade de Ø2 que se situa entre os limites dados seja de l Æ Pelo fato de supormos que Ø2 embora desconhecida seja algum número fixo ou está dentro do intervalo ou não está A Equação 521 informa que para o método descrito neste capítulo a probabilidade de estabelecer um intervalo que contenha Ø2 é de l Æ 2 O intervalo na Equação 52l é um intervalo aleatório isto é variará de amostra para amos tra porque se baseia em ØO2 que é aleatório Por quê 3 Como o intervalo de confiança é aleatório as probabilidades relacionadas a ele devem ser entendidas a longo prazo isto é sob amostras repetidas Mais especificamente a Equação 521 significa se em amostras repetidas intervalos de confiança semelhantes forem esta belecidos muitas vezes com base na probabilidade de l Æ então a longo prazo em média esses intervalos incluirão em l Æ dos casos o verdadeiro valor do parâmetro 4 Como mencionado no item 2 o intervalo na Equação 521 é aleatório enquanto ØO2 for des conhecido Mas uma vez que contarmos com uma amostra específica e tivermos o valor nu mérico específico de ØO2 o intervalo na Equação 521 deixa de ser aleatório está fixado Nesse caso não podemos fazer a afirmação probabilística na Equação 521 não podemos dizer que há uma probabilidade de l Æ de que um dado intervalo fixado inclua o verdadeiro Ø2 Nessa situação Ø2 ou está dentro do intervalo fixado ou fora dele Portanto a probabilidade será de 1 ou 0 Para nosso exemplo salárioescolaridade se o intervalo de confiança de 95 fosse calculado como 05700 Ø2 08780 como faremos a seguir na Equação 539 não poderíamos afirmar que haveria uma probabilidade de 95 de que esse intervalo incluísse o verdadeiro Ø2 A probabilidade seria de l ou de 0 2 Também conhecido como probabilidade de cometer um erro do tipo i este erro consiste em rejeitar uma hipótese verdadeira en quanto o erro de Tipo ii representa a aceitação de uma hipótese falsa este tópico é discutido com mais detalhe no Apêndice A o sím bolo Æ é também conhecido como tamanho do teste estatístico ECONOBOOKindb 129 23112010 071052 130 Parte Um Modelos de regressão com equação única Como são estabelecidos os intervalos de confiança Com base na discussão anterior podese esperar que se as distribuições amostrais ou de probabilidade dos estimadores forem conhecidas é possível fazer afirmações sobre intervalos de confiança como a Equação 521 No Capítulo 4 vimos que sob a hipótese de normalidade dos termos de erro ui os estimadores de MQO de ØO1 e ØO2 são eles próprios normalmente distribuídos e que o estimador de MQO de æO2 relacionase à distribuição 2 quiqua drado Parece então que a tarefa de estabelecer intervalos de confiança é simples E é mesmo 53 Intervalos de confiança para os coeficientes Ø1 e Ø2 da regressão intervalo de confiança para Ø2 Na Seção 43 do Capítulo 4 mostramos que dada a hipótese de normalidade para ui os estimado res de mínimos quadrados ordinários ØO1 e ØO2 são eles próprios normalmente distribuídos com médias e variâncias dadas Portanto por exemplo a variável Z H ØO2 Ø2 ep ØO2 H ØO2 Ø2 x2 i æ 531 de acordo com a Equação 436 é uma variável normal padronizada Parece que podemos empregar a distribuição normal para afirmações probabilísticas sobre Ø2 contanto que a verdadeira variância da população æ2 seja conhecida Se æ2 for conhecida uma propriedade importante de uma variável nor malmente distribuída com média μ e variância æ2 é que a área sob a curva normal entre μ ß æ2 corres ponde a cerca de 68 aquela entre os limites de μ ß 2æ é de cerca de 95 e a que está entre μ ß 3æ é de cerca de 997 Mas æ2 raramente é conhecida e na prática é determinada pelo estimador não viesado æO2 Se substituírmos æ por æO a Equação 531 poderá ser escrita como t H ØO2 Ø2 epØO2 H EstimadorParâmetro Erro padrão estimado do estimador H ØO2 Ø2 x2 i æO 532 em que o ep ØO2 agora se refere ao erro padrão estimado Podese demonstrar veja a Seção 5A2 do Apêndice 5A que a variável t assim definida segue a distribuição t com n 2 graus de liberdade Note a diferença entre as Equações 531 e 532 Em vez de usarmos a distribuição normal po demos usar a distribuição t para estabelecer um intervalo de confiança para Ø2 como a seguir Pr tÆ2 t tÆ2 H 1 Æ 533 em que o valor t entre a dupla desigualdade é o valor t dado pela Equação 532 e ta2 é o valor da variável t obtido na distribuição t para um nível de significância Æ2 e n 2 graus de liberdade mui tas vezes é chamado de valor crítico de t em um nível de significância de Æ2 Substituindo a Equação 532 na Equação 533 obtemos Pr tÆ2 ØO2 Ø2 ep ØO2 tÆ2 H 1 Æ 534 ECONOBOOKindb 130 23112010 071054 Capítulo 5 A regressão de duas variáveis estimação de intervalo e teste de hipóteses 131 Reorganizando a Equação 534 obtemos Pr ØO2 tÆ2 ep ØO2 Ø2 ØO2 C tÆ2 ep ØO2 H 1 Æ 5353 A Equação 535 oferece um intervalo de confiança de 1001 Æ para Ø2 que pode ser escri to de modo mais compacto como Intervalo de confiança 1001 Æ para Ø2 ØO2 ß tÆ2 ep ØO2 536 Com um argumento análogo e usando as Equações 431 e 432 podemos escrever Pr ØO1 tÆ2 ep ØO1 Ø1 ØO1 C tÆ2 ep ØO1 H 1 Æ 537 ou de modo mais compacto Intervalo de confiança 1001 Æ para Ø1 ØO1 ß tÆ2ep ØO1 538 Observe uma característica importante dos intervalos de confiança dados nas Equações 536 e 538 nos dois casos a amplitude do intervalo de confiança é proporcional ao erro padrão do estima dor Quanto maior o erro padrão maior a amplitude do intervalo de confiança Em outras palavras quanto maior o erro padrão do estimador maior é a incerteza da estimação do verdadeiro valor do pa râmetro desconhecido O erro padrão de um estimador é muitas vezes descrito como uma medida da precisão do estimador da exatidão com que o estimador mede o verdadeiro valor da população Voltando a nosso exemplo de regressão no Capítulo 3 Seção 36 da relação entre salário mé dio por hora Y e escolaridade X lembrese de que verificamos na Tabela 32 que ØO2 D 07240 ep ØO2 D 00700 Como há 13 observações os graus de liberdade são 11 Supondo que Æ D 5 ou seja um coeficiente de confiança de 95 a tabela t mostra que para 11 graus de liberdade o valor crítico ta2 D 2201 Substituindo esses valores na Equação 535 o leitor verificará que o intervalo de confiança de 95 para Ø2 é o seguinte4 05700 Ø2 08780 539 Ou usando a Equação 536 é 07240 ß 2201 00700 isto é 07240 ß 01540 5310 3 alguns autores preferem escrever a equação 535 indicando explicitamente os graus de liberdade assim te ríamos Pr ØO2 tn2Æ2ep ØO2 Ø2 ØO2 C tn2Æ2ep ØO2 H 1 Æ mas para simplificarmos manteremos nossa notação o contexto esclarece os graus de liberdade envolvidos 4 devido ao arredondamento dos erros na Tabela32 as respostas dadas podem não corresponder exatamente às respostas obtidas do pacote estatístico ECONOBOOKindb 131 23112010 071057 132 Parte Um Modelos de regressão com equação única A interpretação desse intervalo de confiança é dado o coeficiente de confiança de 95 a longo prazo em 95 de cada 100 casos os intervalos como a Equação 539 conterão o verdadeiro Ø2 Mas como advertimos não podemos dizer que existe uma probabilidade de 95 de que o intervalo especí fico na Equação 539 contenha o verdadeiro Ø2 porque agora o intervalo está fixado e deixou de ser aleatório portanto ou Ø2 está dentro dele ou não está a probabilidade de que o intervalo fixado espe cificado inclua o verdadeiro Ø2 é de l ou 0 Seguindo a Equação 537 e os dados da Tabela 32 o leitor verificará facilmente que o interva lo de confiança de 95 para o Ø1 de nosso exemplo é 18871 Ø1 18583 5311 Novamente é preciso estar atento ao interpretar esse intervalo de confiança Em 95 de cada 100 casos intervalos como a Equação 5311 conterão o verdadeiro Ø1 a probabilidade de que esse inter valo fixado inclua o verdadeiro Ø1 é de l ou 0 intervalos de confiança simultâneos para Ø1 e Ø2 Há ocasiões em que é preciso estabelecer um intervalo de confiança conjunto para Ø1 e Ø2 de tal modo que com um coeficiente de confiança l Æ de por exemplo 95 esse intervalo inclua Ø1 e Ø2 simultaneamente Como este tópico é complexo o leitor interessado pode querer consultar uma bibliografia adequada5 Discutiremos este assunto rapidamente nos Capítulos 8 e 10 54 Intervalo de confiança para æ2 Como destacado na Seção 43 do Capítulo 4 sob a hipótese de normalidade a variável 2 H n 2 æO 2 æ 2 541 segue a distribuição de 2 com n 2 graus de liberdade6 Portanto podemos usar a distribuição de χ2 para estabelecer um intervalo de confiança para æ2 Pr 2 1Æ2 2 2 Æ2 H 1 Æ 542 5 Uma discussão acessível pode ser encontrada em neTer John WaSSerman William KUTner michael h Ap plied linear regression models homewood 111 richard d irwin 1983 cap 5 6 Para uma demonstração veja hoGG robert v CraiG allen T Introduction to mathematical statistics 2 ed nova York macmillan 1965 p 144 fiGuRa 51 O intervalo de confiança de 2 com 95 11 graus de liberdade f 2 2 Densidade 95 25 25 219200 38157 0025 2 0975 ECONOBOOKindb 132 23112010 071058 Capitulo 5 A regressdo de duas varidveis estimagdo de intervalo e teste de hipoteses 133 em que o valor da distribuiao de X no meio dessa dupla desigualdade é dado pela Equacao 541 onde Xia 2e x 2 Sao dois valores de x os valores criticos de x obtidos na tabela de quiquadrado para n 2 graus de liberdade de modo que eles excluem 100a2 das areas caudais da distribuicao de quiquadrado como mostra a Figura 51 Substituindo x da Equacio 541 na Equacao 542 e reorganizando os termos obtemos a2 a2 Pr n 2 0 n2 12 543 Xe 2 x ja2 0 que nos da o intervalo de confianca 1001 a para o Continuando com nosso exemplo salariosescolaridade encontramos na Tabela 32 que para nos sa base de dados temos 6 08936 Se escolhermos a de 5 a tabela de quiquadrado para 11 graus de liberdade fornecenos os seguintes valores criticos Xd025 219200 e Xo975 38157 Esses va lores mostram que a probabilidade de que um valor de quiquadrado seja superior a 219200 é de 25 e a 38157 é de 975 Portanto o intervalo entre esses dois valores é 0 intervalo de confiana de 95 para x como mostra a Figura 51 Note a caracteristica assimétrica da distribuiao de qui quadrado Substituindo os dados de nosso exemplo na Equacao 543 o leitor verificara que o intervalo de confianga de 95 para o é o seguinte 04484 0 25760 544 A interpretacio desse intervalo é se estabelecermos limites de confianca de 95 em o e se man tivermos a priori que esses limites incluem o verdadeiro o estaremos certos 95 das vezes a longo prazo 39 Teste de hipoteses comentarios gerais Depois de discutirmos o problema das estimacg6es pontuais e de intervalos consideraremos o teste de hipdteses Nesta segdo discutiremos rapidamente certos aspectos gerais o Apéndice A apre senta alguns detalhes adicionais O problema do teste estatistico de hipdteses pode ser resumido da seguinte maneira determinada observagao ou resultado é ou ndo compativel com alguma hipotese feita A palavra compativel aqui significa suficientemente proxima do valor pressuposto de modo que nao rejeitamos a hipo tese feita Se alguma teoria ou experimento anterior levarnos a acreditar que o verdadeiro coeficien te angular 6 do exemplo salarioescolaridade seja igual a unidade esse b 0724 obtido da amostra da Tabela 32 sera consistente com a hipotese feita Se for nao rejeitamos a hipdtese caso contrario podemos rejeitala Na linguagem da estatistica a hipdtese estabelecida é denominada hipétese nula e é denotada pelo simbolo Hp A hipdtese nula é em geral testada contra uma hipétese alternativa também co nhecida como hipoétese mantida denotada por H que pode afirmar por exemplo que 0 verdadeiro diferente da unidade A hipdtese alternativa pode ser simples ou composta Por exemplo H B 15 uma hip6tese simples mas H 6 15 é uma hipétese composta A teoria do teste de hipoteses trata da formulagao de regras ou procedimentos a serem adotados para decidir se a hipdtese nula deve ser rejeitada ou nao Ha duas abordagens mutuamente comple Uma hipétese estatistica é chamada de hipétese simples se especifica 0s valores exatos dos parametros de uma funcdo de densidade de probabilidade caso contrario 6 chamada de hipétese composta Por exemplo na FDP normal 10 27 exp05X o se afirmamos que Hy 1 15 eo 2 tratase de uma hipotese sim ples mas se H uw 15e0 15 tratase de uma hipdtese composta porque o desvio padrao nao tem um valor especifico 134 Parte Um Modelos de regressão com equação única mentares para a elaboração dessas regras especificamente intervalo de confiança e teste de signi ficância Ambas postulam que a variável estatística ou estimador sendo considerada tem alguma distribuição de probabilidade e que o teste de hipóteses envolve a formulação de declarações ou afir mações sobre os valores dos parâmetros dessa distribuição Por exemplo sabemos que de acordo com a hipótese de normalidade ØO2 distribuise normalmente com média igual a Ø2 e variância dada pela Equação 435 Se propomos a hipótese de que Ø2 D l estamos fazendo uma afirmação sobre um dos parâmetros da distribuição normal a saber a média A maioria das hipóteses esta tísticas apresentadas neste livro será deste tipo afirmações sobre um ou mais dos parâmetros de alguma distribuição de probabilidade determinada tal como a normal a F a t ou 2 As duas seções a seguir mostrarão como isso é feito 56 Teste de hipóteses a abordagem do intervalo de confiança Teste bilateral ou bicaudal Para ilustrarmos a abordagem do intervalo de confiança voltaremos mais uma vez ao exemplo do salárioescolaridade Com base nos resultados da Equação 361 sabemos que o coeficiente angular é 07240 Postulemos que H0 Ø2 H 05 H1 Ø2 05 isto é que o verdadeiro coeficiente angular é 05 sob a hipótese nula mas menor ou maior que 05 sob a hipótese alternativa A hipótese nula é uma hipótese simples enquanto a hipótese alternativa é com posta o que é conhecido como hipótese bilateral Muitas vezes essas hipóteses alternativas bilaterais refletem o fato de que não temos uma expectativa forte a priori ou teórica sobre a direção em que a hipótese alternativa deveria diferenciarse da hipótese nula O ØO2 observado é compatível com H0 Para respondermos a essa pergunta voltemos ao intervalo de confiança na Equação 539 Sabemos que a longo prazo intervalos como 05700 08780 con terão com 95 de probabilidade o verdadeiro valor de Ø2 Consequentemente a longo prazo em amostras repetidas esses intervalos proporcionam faixas ou limites dentro dos quais o verdadeiro Ø2 pode situarse com um coeficiente de confiança de por exemplo 95 O in tervalo de confiança ofere ce um conjunto de hipóteses nulas plausíveis Se Ø2 sob H0 cair no intervalo de confiança de 1001 Æ não rejeitaremos a hipótese nula se estiver situada fora desse intervalo poderemos rejeitála8 Essa faixa é ilustrada esquematicamente na Figura 52 8 Tenha sempre em mente que há uma chance de 100Æ de que o intervalo de confiança não contenha Ø2 sob H0 mesmo que a hipótese seja correta em resumo há uma chance de 100Æ de cometer um erro do tipo i assim se Æ for igual a 005 há 5 de chances de que possamos rejeitar a hipótese nula mesmo que ela seja correta fiGuRa 52 Intervalo de confiança de 1001 Æ para Ø2 b2 ta2 epb2 b2 ta2 epb2 Os valores de Ø2 situados neste intervalo são plausíveis segundo H0 com 1001 Æ de confiança Portanto não rejeite H0 se Ø2 situarse nesta região Æ Æ ØO ØO ØO ØO ECONOBOOKindb 134 23112010 071100 Capítulo 5 A regressão de duas variáveis estimação de intervalo e teste de hipóteses 135 Regra de decisão estabeleça um intervalo de confiança de 1001 Æ para Ø2 Se Ø2 sob H0 situarse no intervalo de confiança não rejeite H0 mas se cair fora desse intervalo rejeite H0 Seguindo essa regra no caso de nosso exemplo hipotético H0 Ø2 D 05 claramente está fora do intervalo de confiança de 95 dado na Equação 539 Portanto podemos rejeitar a hipótese de que a verdadeira inclinação é de 05 com 95 de confiança Se a hipótese nula fosse verdadeira a proba bilidade de obtermos um valor de inclinação de pelo menos 07240 por puro acaso ou sorte seria de no máximo 5 uma probabilidade pequena Em estatística quando rejeitamos a hipótese nula dizemos que nossos resultados foram estatisti camente significativos Por outro lado quando não rejeitamos a hipótese nula dizemos que nossos resultados não são estatisticamente significativos Alguns autores usam a expressão alta significância estatística Com isso em geral querem dizer que quando rejeitam a hipótese nula a probabilidade de cometer um erro do Tipo I isto é Æ é um número pequeno em geral 1 Mas como nossa discussão sobre o valor p na Seção 58 mostrará é melhor deixar que o pesquisador decida se um resultado estatístico é significativo moderada mente significativo ou muito significativo Teste unilateral ou unicaudal Às vezes temos uma forte expectativa a priori ou teórica ou expectativas embasadas em algum trabalho empírico anterior de que a hipótese alternativa seja unilateral ou unidirecional em vez de bi lateral como acabamos de ver Para nosso exemplo salárioescolaridade seria possível postular que H0 Ø2 05 e H1 Ø2 05 Talvez a teoria econômica ou trabalhos empíricos anteriores sugiram que a inclinação seja maior que 05 Embora o procedimento para testar essa hipótese seja facilmente deduzido a partir da Equação 535 a mecânica talvez seja melhor explicada em termos da abordagem do teste de significância examinado a seguir9 57 Teste de hipóteses a abordagem do teste de significância Teste de significância dos coeficientes de regressão o teste t Uma abordagem alternativa mas complementar ao método do intervalo de confiança para o teste de hipóteses estatísticas é a abordagem do teste de significância formulado segundo texto de R A Fisher e texto conjunto de Neyman e Pearson10 Em termos gerais um teste de significância é um procedimento em que os resultados amostrais são usados para verificar a veracidade ou a falsidade de uma hipótese nula A ideia fundamental por trás dos testes de significância é a de um teste estatístico estimador e a distribuição amostral dessa estatística sob a hipótese nula A decisão de aceitar ou rejeitar H0 é tomada com base no valor do teste estatístico dos dados disponíveis Para ilustrar lembrese de que sob a hipótese de normalidade a variável t H ØO2 Ø2 ep ØO2 H ØO2 Ø2 x2 i æO 532 9 Se desejar usar a abordagem do intervalo de confiança use um teste unilateral ou unicaudal de 100 l Æ para Ø2 Por quê 10 detalhes podem ser encontrados em lehman e l Testing statistical hypotheses nova York John Wiley Sons 1959 ECONOBOOKindb 135 23112010 071101 136 Parte Um Modelos de regressão com equação única segue a distribuição t com n 2 graus de liberdade Se o valor do verdadeiro Ø2 é especificado sob a hipótese nula o valor t na Equação 532 pode ser facilmente calculado para a amostra disponível e portanto pode servir como teste estatístico E como o teste estatístico segue a distri buição t podemos fazer afirmações de intervalo de confiança como a seguinte Pr tÆ2 ØO2 Ø 2 ep ØO2 tÆ2 H 1 Æ 571 em que Ø2 é o valor de Ø2 sob H0 e ta2 e ta2 são os valores de t os valores críticos de t obtidos na tabela t para o nível de significância Æ2 e n 2 graus de liberdade Equação 534 A tabela t consta do Apêndice D Reorganizando a Equação 571 obtemos Pr Ø2 tÆ2 ep ØO2 ØO2 Ø 2 C tÆ2 ep ØO2 H 1 Æ 572 que nos fornece o intervalo em que ØO2 cairá dentro da probabilidade l a dado Ø2 D Ø2 Na lingua gem do teste de hipóteses o intervalo de confiança de 1001 Æ estabelecido na Equação 572 é conhecido como região de aceitação da hipótese nula e as regiãoões fora do intervalo de confiança é são chamadas de regiãoões de rejeição de H0 ou de regiãoões críticas Como observado os limites de confiança os pontos extremos do intervalo de confiança também são chamados de va lores críticos A estreita conexão entre as abordagens de intervalo de confiança e de teste de significância para o teste de hipóteses pode agora ser vista comparando a Equação 535 com a Equação 572 No procedimento de intervalo de confiança tentamos estabelecer uma faixa ou intervalo com certa pro babilidade de incluir o valor verdadeiro mas desconhecido de Ø2 enquanto na abordagem do teste de significância supusemos o valor de Ø2 e tentamos ver se o ØO2 calculado está dentro de limites ra zoáveis confiáveis em torno desse valor hipotético Mais uma vez voltemos ao exemplo de salárioescolaridade Sabemos que ØO2 D 07240 ep ØO2 D 00700 e graus de liberdade gl D 11 Se supusermos Æ D 5 ta2 D 2201 Se considerarmos H0 Ø2 D Ø2 D 05 e H1 Ø2 05 a Equação 572 tornase Pr 03460 ØO2 06540 57311 conforme o diagrama da Figura 53 Na prática não há necessidade de estimar a Equação 572 explicitamente Podemos calcular o valor t no meio da dupla desigualdade dada pela Equação 571 e verificar se ele se situa entre os valores críticos de t ou fora deles No nosso exemplo t H 07240 05 00700 H 32 574 Que claramente se situa na região crítica da Figura 54 A conclusão permanece a mesma rejeita mos H0 Note que se o Ø2 estimado D ØO2 for igual ao Ø2 hipotético o valor t na Equação 574 será zero Pelo fato de o valor estimado de Ø2 ser diferente do valor hipotético de Ø2 t o valor absoluto de t Nota t pode ser tanto positivo quanto negativo será cada vez maior Portanto um valor t grande será uma evidência contra a hipótese nula Obviamente sempre podemos usar a tabela t para deter minar se determinado valor t é grande ou pequeno a resposta depende dos graus de liberdade assim 11 na Seção 52 item 4 afirmamos que não podemos dizer que haja uma probabilidade de 95 de que o inter valo fixado 05700 08780 inclua o verdadeiro Ø2 mas podemos fazer a afirmação probabilística dada na equação 573 porque ØO2 sendo um estimador é uma variável aleatória ECONOBOOKindb 136 23112010 071103 Capítulo 5 A regressão de duas variáveis estimação de intervalo e teste de hipóteses 137 Densidade f 2 Região crítica 25 ØO2 07240 está nesta região crítica 25 2 03460 05 06540 ØO2 ØO fiGuRa 53 Intervalo de confiança de 95 para ØO2 sob a hipótese de que Ø2 D 05 fiGuRa 54 O intervalo de confiança de 95 para t 11 gl Densidade ft t Região crítica 25 t 32 está nesta região crítica 25 2201 0 2201 95 Região de aceitação como da probabilidade de um erro de Tipo I que estamos dispostos a aceitar Se você examinar a tabela t do Apêndice D verá que para cada valor dado dos graus de liberdade a probabilidade de obter um valor t cada vez maior tornase progressivamente menor Assim para 20 graus de liberda de a probabilidade de obter um valor t de 1725 ou maior é de 010 ou 10 mas para os mesmos graus de liberdade a probabilidade de obter um valor t de 3552 ou maior é de apenas 0002 ou 02 Como usamos a distribuição t o procedimento de verificação é chamado de teste t Na linguagem dos testes de significância uma estatística é dita significativa se o valor do teste estatístico situarse na região crítica Nesse caso a hipótese nula é rejeitada Do mesmo modo um teste é considerado estatisticamente insignificante ou não significativo se o valor do teste estatístico situarse na região de aceitação Nesse caso a hipótese nula não é rejeitada Em nosso exemplo o teste t é significativo e portanto rejeitamos a hipótese nula Antes de concluirmos nossa discussão sobre teste de hipóteses note que os procedimentos que aca bamos de delinear são conhecidos como testes de significância bilaterais ou bicaudais pois con sideramos os dois extremos da distribuição de probabilidade relevantes as regiões de rejeição e rejeita mos a hipótese nula se esta situarse em qualquer das caudas Isso acontece porque nossa H1 era uma hipótese composta bilateral Ø2 05 significa que Ø2 é maior ou menor que 05 Mas suponha que uma experiência anterior sugerisse que a inclinação deveria ser maior que 05 Nesse caso te mos H0 Ø2 05 e H1 Ø2 05 Embora H1 ainda seja uma hipótese composta agora é unilateral Para testála recorremos a um teste unicaudal a cauda direita como mostra a Figura 55 Veja também a Seção 56 O procedimento de teste é o mesmo que o anterior exceto o limite de confiança superior ou valor crítico que agora corresponde a ta D t05 isto é o nível de 5 Como a Figura 55 mostra neste caso não precisamos considerar a cauda inferior da distribuição t Usar um teste de significância unicaudal ou bicaudal dependerá de como a hipótese alternativa é formulada a qual por sua vez pode depender de alguma consideração a priori ou de uma experiência empírica anterior Veremos mais a respeito disso na Seção 58 ECONOBOOKindb 137 23112010 071104 138 Parte Um Modelos de regressão com equação única Podemos resumir a abordagem do teste t de significância nos testes de hipóteses conforme mostra a Tabela 51 Tabela 51 Regras de decisão para o teste t de significância Tipo de Hipótese Regra de decisão rejeitar H0 se H0 hipótese nula H1 Hipótese Alternativa Bicaudal Ø2 D Ø2 Ø2 Ø2 jtj tÆ2gl Cauda direita Ø2 Ø2 Ø2 Ø2 t tÆgl Cauda esquerda Ø2 Ø2 Ø2 Ø2 t tÆgl Notas Ø2 é o valor numérico hipotético de Ø2 t é o valor absoluto de t ta ou ta 2 representa o valor crítico t no nível de significância Æ ou Æ2 gl graus de liberdade n 2 para o modelo de duas variáveis n 3 para o modelo de três variáveis e assim por diante O mesmo procedimento aplicase ao teste de hipóteses para Ø1 Teste de significância para æ2 o teste de quiquadrado 2 Para ilustrar de outro modo a metodologia dos testes de significância considere a seguinte variável 2 H n 2 æO 2 æ 2 541 que como mencionado segue a distribuição de χ2 com n 2 graus de liberdade Tomemos o exem plo hipotético æO 2 D 08937 e gl D 11 Se postulamos que H0 æ 2 D 06 versus H1 æ 2 06 a Equação 541 oferece o teste estatístico para H0 Substituindo pelos valores adequados na Equação 541 verificamos que para H0 2 D 163845 Se supusermos que Æ D 5 os valores críticos de 2 são 381575 e 219200 Como o 2 calculado situase nesses limites os dados sustentam a hipótese nula e fiGuRa 55 Teste de significância unicaudal 1796 t005 11 gl 95 Região de aceitação b2 1796 ep b ØO2 b2 Densidade ft t t 32 está nesta região crítica 5 0 95 Região de aceitação Densidade fØO2 b2 07240 está nesta região crítica 25 ØO2 05 06257 ØO2 Ø ECONOBOOKindb 138 23112010 071105 Capítulo 5 A regressão de duas variáveis estimação de intervalo e teste de hipóteses 139 não a rejeitamos Veja a Figura 51 Esse procedimento de teste é chamado de teste de significância quiquadrado A abordagem do teste 2 de significância para o teste de hipóteses está resumida na Tabela 52 58 Teste de hipóteses alguns aspectos práticos o sentido de aceitar ou rejeitar uma hipótese Se com base em um teste de significância por exemplo o teste t decidirmos aceitar a hipótese nula tudo o que estamos dizendo é que com base na evidência amostral não temos razões para re jeitála não estamos dizendo que a hipótese nula é sem sombra de dúvida verdadeira Por quê Para responder volte ao nosso exemplo de saláriosescolaridade e suponha que H0 Ø2 D 070 Agora o valor estimado da inclinação é ØO2 D 07241 com um erro padrão de ØO2 D 00701 Com base no teste t verificamos que t H 07241 07 00701 H 03438 que é insignificante a Æ D 5 Portanto deci dimos aceitar H0 Mas suponhamos que H0 Ø2 D 06 Aplicando o teste t novamente obtemos t H 07241 06 00701 H 17703 que também é estatisticamente insignificante Então podemos aceitar essa H0 Qual das duas hipóteses nulas é verdadeira Não sabemos Ao aceitarmos a hipótese nula de vemos sempre ter em mente que outra hipótese nula pode ser igualmente compatível com os dados É preferível dizermos que é possível aceitar a hipótese nula em vez de dizer que a aceitamos Melhor ainda tal como um júri emite um veredicto de não culpado em vez de inocente a conclusão de um teste estatístico é não rejeitamos em vez de aceitamos12 a hipótese nula zero e a regra prática 2t Uma hipótese nula muito testada empiricamente é H0 Ø2 D 0 ou seja o coeficiente angular é igual a zero Essa hipótese nula zero é uma espécie de testa de ferro cujo objetivo é descobrir se Y está relacionado de alguma forma a X a variável explanatória Se a princípio não existe nenhuma relação entre Y e X testar uma hipótese como Ø2 D 03 ou qualquer outro valor não faz nenhum sentido 12 KmenTa Jan Elements of econometrics nova York macmillan 1971 p 114 H0 hipótese nula H1 hipótese alternativa Regra de decisão rejeitar H0 se æ2 D æ 2 0 æ2 æ 2 0 glæˆ 2 2 Ægl æ2 0 æ2 D æ 2 0 æ2 æ 2 0 glσˆ 2 2 1 Ægl æ2 0 æ2 D æ 2 0 æ2 æ 2 0 ou 2 1 Æ2gl glσˆ 2 2 Æ2gl æ2 0 Nota æO 2 0 é o valor de æ 2 sob a hipótese nula O primeiro subscrito de 2 na última coluna é o nível de significância e o segundo referese aos graus de liberdade Esses são os valores críticos de 2Observe que os graus de liberdade são n 2 para o modelo de regressão de duas variáveis n 3 para o modelo de regressão de três variáveis e assim por diante Tabela 52 Um resumo do teste χ2 ECONOBOOKindb 139 23112010 071108 140 Parte Um Modelos de regressão com equação única Essa hipótese nula pode ser testada facilmente pelas abordagens do intervalo de confiança ou do teste t vistas na seção anterior Mas muitas vezes o teste formal pode ser contornado adotandose a regra 2t de significância que pode ser expressa como Regra prática 2t Se o número de graus de liberdade for de 20 ou mais e se Æ o nível de significância for definido em 005 a hipótese nula Ø2 D 0 pode ser rejeitada se o valor t calculado por meio da equação 532 for maior que 2 em valor absoluto A lógica dessa regra não é difícil de entender Da Equação 571 sabemos que rejeitaremos H0 Ø2 D 0 se t H ØO2ep ØO2 tÆ2 quando ØO2 0 ou t H ØO2ep ØO2 tÆ2 quando ØO2 0 ou quando jtj H ØO2 ep ØO2 tÆ2 581 para graus de liberdade apropriados Agora se examinarmos a tabela t apresentada no Apêndice D veremos que para todos os graus de liberdade de 20 ou mais um valor t calculado maior que 2 em termos absolutos é estatisticamen te significativo no nível de 5 implicando a rejeição da hipótese nula Se verificarmos que com 20 ou mais graus de liberdade o valor de t será de 25 ou 3 não precisaremos nem mesmo consultar a tabela t para avaliar a significância dos coeficientes angulares calculados É claro que sempre pode mos consultar a tabela t para obter o nível exato de significância e devemos consultála sempre que os graus de liberdade forem menores que por exemplo 20 Note que se estamos testando a hipótese unilateral Ø2 D 0 contra Ø2 0 ou Ø2 0 devemos rejeitar a hipótese nula se jtj H ØO2 ep ØO2 tÆ 582 Se fixarmos Æ em 005 verificaremos na tabela t que com 20 ou mais graus de liberdade um valor t superior a 173 é estatisticamente significativo no nível de 5 de significância unilateral Sempre que um valor t for maior que por exemplo 18 em termos absolutos e os graus de liberdade forem 20 ou mais não será necessário consultar a tabela para verificar a significância do coeficiente observado É claro se escolhermos Æ em 001 ou qualquer outro nível teremos de decidir sobre o valor adequado de t como marco de referência Mas a esta altura o leitor já está apto para isso elaboração das hipóteses nula e alternativa13 Dadas as hipóteses nula e alternativa testar sua significância estatística já não deve ser um misté rio Mas como formulálas Não há regras rigorosas Muitas vezes o fenômeno estudado sugere a natureza das hipóteses nula e alternativa Por exemplo considere a linha do mercado de capitais LMC da teoria do portfólio que postula que Ei D Ø1 C Ø2æi em que E D retorno esperado sobre o portfólio e æ D desvio padrão do retorno uma medida de risco Pelo fato de esperarse que exista 13 Para uma discussão interessante sobre a formulação de hipóteses veja lonG J bradford lanG Kevin are all economic hipotheses falseJournal of Political Economy 1992 v 100 n 6 p 12571272 ECONOBOOKindb 140 23112010 071110 Capítulo 5 A regressão de duas variáveis estimação de intervalo e teste de hipóteses 141 uma relação positiva entre retorno e risco quanto mais alto o risco maior o retorno a hipótese alternativa natural à hipótese nula Ø2 D 0 seria Ø2 0 Ou seja não se consideraria os valores de Ø2 menores que zero Mas suponha o caso da demanda por moeda Como mostraremos mais adiante um dos determi nantes importantes da demanda por moeda é a renda Estudos anteriores sobre as funções de deman da por moeda mostram que a elasticidade renda da demanda a variação percentual da demanda por moeda decorrente do aumento de 1 na renda em geral situase entre 07 e 13 Em um novo estu do da demanda por moeda se postularmos que o coeficiente elasticidaderenda Ø2 é l a hipótese al ternativa será Ø2 l uma hipótese alternativa bilateral Assim é possível basearse em expectativas teóricas ou trabalhos empíricos anteriores ou em am bos para formular as hipóteses Mas qualquer que seja o modo de formulação das hipóteses é da maior importância que o pesquisador defina essas hipóteses antes de levar adiante a pesquisa empíri ca Caso contrário será acusado de raciocínio evasivo ou de profecias autorrealizáveis Se as hipóteses forem formuladas depois de examinar os resultados empíricos podese cair na tentação de elaborar hipóteses que justifiquem os resultados obtidos Essa prática deve ser evitada a todo custo no mínimo em prol da objetividade científica Tenha em mente a citação de Stigler que abre o capítulo escolhendo Æ o nível de significância Do que foi dito até aqui deve estar claro que rejeitar ou não a hipótese nula depende fundamen talmente de Æ o nível de significância ou a probabilidade de cometer um erro do Tipo I a proba bilidade de rejeitar a hipótese verdadeira No Apêndice A discutiremos em detalhe a natureza de um erro do Tipo I sua relação com um erro do Tipo II a probabilidade de aceitarmos a hipótese falsa e por que a estatística clássica concentrase de modo geral no erro do Tipo I Mas mesmo assim por que Æ é em geral fixado nos níveis de probabilidade de 1 5 ou no máximo 10 Na realidade não há nada de especial nesses valores quaisquer outros funcionariam igualmente bem Em um livro introdutório como este não é possível examinar em profundidade os motivos pelos quais escolhemos níveis de significância de 1 5 ou 10 pois levarianos ao campo da tomada de decisão estatística que é uma disciplina em si No entanto podemos oferecer um breve resumo Como discutiremos no Apêndice A para um dado tamanho de amostra se tentamos reduzir um erro do Tipo I o erro do Tipo II aumenta e viceversa Dado o tamanho da amostra se tentamos reduzir a probabilidade de rejeitar a hipótese verdadeira estamos ao mesmo tempo aumentando a possibili dade de aceitar a falsa Portanto há um tradeoff dilema ou escolha conflitiva entre esses dois tipos de erro dado o tamanho da amostra A única forma de resolver o dilema é descobrir o custo relativo dos dois tipos de erro Então Se o erro de rejeitar a hipótese nula que na verdade é verdadeira erro do Tipo I for custoso em relação ao erro de não a rejeitar quando ela for de fato falsa erro do Tipo II será racional definir uma probabilidade baixa para o primeiro tipo de erro Se por outro lado o custo de cometer um erro do Tipo I for baixo em relação ao custo de cometer um erro do Tipo II compensará definir uma probabilidade alta para o primeiro tipo de erro tornando baixa a probabilidade do segundo tipo de erro14 Obviamente a questão é que raramente conhecemos o custo de cometer os dois tipos de erros Na econometria aplicada em geral seguese a prática de definir o valor de Æ em 1 5 ou no máximo 10 e escolher um teste estatístico que torne a probabilidade de cometer um erro do Tipo II a menor possível Como 1 menos a probabilidade de cometer um erro do Tipo II é conhecido como a potência do teste esse procedimento equivale a maximizar a potência do teste Veja o Apêndice A para uma discussão sobre a potência dos testes Felizmente o dilema de escolher um valor de Æ adequado pode ser evitado usando o que é conhe cido como valor p do teste estatístico que será discutido a seguir 14 KmenTa Jan Elements of econometrics nova York macmillan 1971 p 126127 ECONOBOOKindb 141 23112010 071110 142 Parte Um Modelos de regressão com equação única o nível de significância exato o valor p Como acabamos de mencionar o calcanhar de Aquiles do teste de hipóteses é a arbitrariedade na seleção de Æ Uma vez obtido o teste estatístico por exemplo o teste t em um dado exemplo por que não simplesmente consultar a tabela estatística adequada e verificar a probabilidade efe tiva de obter um valor do teste estatístico tão grande ou maior que o obtido no exemplo Essa probabilidade é denominada valor p o valor da probabilidade também conhecida como nível de significância exato ou observado ou probabilidade exata de cometer um erro do Tipo I Mais tecnicamente o valor p é definido como o menor nível de significância em que uma hipó tese nula pode ser rejeitada Para ilustrarmos voltemos ao nosso exemplo da relação saláriosescolaridade Dada a hipótese nula de que o verdadeiro coeficiente de escolaridade é de 05 obtivemos um valor t de 32 na Equação 574 Qual é o valor p de obter um valor t igual ou maior que 32 Consultando a tabela de t do Apêndice D observamos que com 11 graus de liberdade a probabilidade de obter tal valor t deve ser menor que 0005 unilateral ou 00010 bilateral Se usar os pacotes estatísticos Stata ou EViews verá que o valor p de obtenção de um valor t de 32 ou maior é de cerca de 00001 ou seja é extre mamente pequeno Esse é o valor p da estatística t observada O nível exato de significância observa do da estatística t é muito menor que o nível de significância fixado de maneira convencional e arbitrária como l 5 ou 10 Na realidade se fôssemos usar o valor p que acabamos de calcular e rejeitar a hipótese nula de que o verdadeiro coeficiente de educação é de 05 a probabilidade de cometermos um erro de Tipo I seria de apenas 1 em 100000 Como observado se os dados não sustentam a hipótese nula o t obtido sob a hipótese nula será grande e portanto o valor p da obtenção de tal valor t será peque no Em outras palavras para determinado tamanho de amostra quando t aumenta o valor p diminui e por conseguinte é possí vel rejeitar a hipótese nula com maior confiança Qual a relação entre o valor p e o nível de significância Æ Se nos acostumarmos a fixar Æ igual ao valor p de um teste estatístico como a estatística t não haverá conflito entre os dois valores Em outras palavras é melhor abrir mão de fixar Æ arbitrariamente em algum nível e apenas escolher o valor p do teste estatístico É preferível deixar ao leitor a decisão de rejeitar ou não a hi pótese nula a um dado valor p Se em uma aplicação o valor p em um teste estatístico for de 0145 ou 145 e se o leitor desejar rejeitar a hipótese nula neste exato nível de significância que assim seja Não há nada de mau em arriscar estar errado em 145 das vezes se você rejeitar a hipótese nula verdadeira Do mesmo modo como em nosso exemplo saláriosescolaridade não há nada de errado se o pesquisador escolher um valor p de 002 e não correr o risco de estar errado mais do que 2 em 10 mil vezes Afinal alguns pesqui sadores podem ser adeptos ao risco e outros avessos a ele No restante do livro citaremos o valor p de determinado teste estatístico Alguns leitores preferi rão fixar Æ em algum nível e rejeitar a hipótese nula se o valor p for menor que Æ A escolha é deles Significância estatística versus significância prática Volte ao Exemplo 31 e aos resultados da regressão da Equação 371 Essa regressão relaciona as despesas pessoais de consumo DPC e o PIB nos Estados Unidos para o período 19602005 am bas as variáveis medidas em bilhões de dólares de 2000 Com base nessa regressão vemos que a propensão marginal a consumir PMC isto é o consumo adicional como resultado de 1 dólar adicional de renda conforme medido pelo PIB é de cerca de 072 ou aproximadamente de 72 centavos Com os dados da Equação 371 o leitor pode verificar que o intervalo de confiança de 95 para o PMC é 07129 07306 Nota como há 44 gl neste problema não temos um valor t crítico preciso para tal grau de liberdade Consequentemente você pode usar a regra prática 2 t para calcular o intervalo de confiança de 95 Suponha que alguém afirme que a verdadeira PMC seja de 074 Esse número é diferente de 072 Será se nos ativermos estritamente ao intervalo de confiança definido anteriormente ECONOBOOKindb 142 23112010 071110 Capítulo 5 A regressão de duas variáveis estimação de intervalo e teste de hipóteses 143 Mas qual a significância prática ou substantiva de nossa conclusão Que diferença faz dizer que assumimos que a PMC é de 074 não de 072 Essa diferença de 002 entre as duas PMC é tão impor tante na prática A resposta depende do que pretendemos fazer com as estimativas Por exemplo a macroecono mia nos ensina que o multiplicador da renda é 11 PMC Portanto se a PMC é de 072 o multi plicador é de 357 mas será de 384 se a PMC for de 074 Assim se o governo resolvesse aumentar seus gastos em 1 para tirar a economia de uma recessão a renda acabaria aumentando em 357 se a PMC fosse de 072 mas aumentaria em 384 se a PMC fosse de 074 E essa diferença poderia ser fundamental para a recuperação da economia O importante nessas considerações é que não devemos confundir significância estatística com significância prática ou econômica Como observa Goldberger Quando uma hipótese nula digamos Øj D l é especificada o que se quer dizer é que Øj está próximo de l tão próximo que para todos os fins pode ser tratado como se fosse 1 Mas o fato de 11 ser praticamente a mesma coisa que 10 é uma questão econômica não estatística Não é possível decidir a questão baseandose em um teste de hipóteses porque o teste estatístico mede o coeficiente estimado em unidades de erro padrão que não se prestam à medição do parâmetro econômico Øj l Talvez seja uma boa ideia reservar o termo significância para o conceito estatístico e adotar substancial para o conceito econômico15 A questão levantada por Goldberger é importante À medida que o tamanho da amostra tornase muito grande a significância estatística perde importância mas os aspectos de significância econô mica passam a ser fundamentais De fato com amostras muito grandes praticamente nenhuma hipó tese nula será rejeitada haverá casos em que a grandeza das estimativas pontuais será o único ponto a discutir a escolha entre as abordagens do intervalo de confiança e do teste de significância no teste de hipóteses Na maioria das análises de economia aplicada a hipótese nula é definida como testa de ferro e o objetivo da análise empírica é derrubála ou seja rejeitar a hipótese nula No exemplo da relação entre consumo e renda a hipótese nula de que a PMC Ø2 D 0 é obviamente absurda mas muitas vezes recorremos a ela para aumentar o impacto dos resultados empíricos Aparentemente os editores de periódicos famosos não consideram empolgante publicar artigos empíricos em que a hipótese nula não seja rejeitada Parece que a verificação de que a PMC é estatisticamente diferente de zero é mais digna de manchetes do que a constatação de que ela é igual por exemplo a 07 Assim J Bradford De Long e Kevin Lang argumentam que é melhor para os economistas concentraremse na grandeza dos coeficientes e informar os níveis de confiança em vez dos testes de significância Se todas ou quase todas as hipóteses nulas são falsas faz pouco sentido especular se uma estimativa pode ser distinguida ou não do seu valor previsto sob a hipótese nula Em vez disso queremos lançar luz sobre quais modelos são boas aproximações o que requer que conheçamos as faixas de valores dos parâmetros excluídas das estimativas empíricas16 Em resumo esses autores preferem a abordagem do intervalo de confiança à do teste de signifi cância Talvez o leitor deva manter esse conselho em mente17 15 GoldberGer arthur S A course in econometrics Cambridge massachusetts harvard University Press 1991 p 240 note que bj é o estimador de mQo para Øj e æObj é seu erro padrão Para uma opinião neste mesmo sentido veja mCCloSKeY d n The loss function has been mislaid the rhetoric of significance tests Ameri can Economic Review 1985 v 75 p 201205 veja também mCCloSKeY d n ZiliaK S T The standard error of regression Journal of Economic Literature 1996 v 37 p 97114 16 veja o artigo dos autores citado na nota de rodapé 13 p 1271 17 Para uma perspectiva diferente veja hill Carter GriFFiThS William JUdGe George Undergraduate econome trics nova York Wiley Sons 2001 p 108 ECONOBOOKindb 143 23112010 071110 144 Parte Um Modelos de regressão com equação única 59 Análise de regressão e análise de variância Nesta seção estudaremos a análise de regressão sob o ponto de vista da análise de variância e apresentaremos ao leitor uma forma esclarecedora e complementar de examinar o problema da infe rência estatística Na Seção 35 do Capítulo 3 formulamos a seguinte identidade y2 i H yO2 i C uO2 i H ØO2 2 x2 i C uO2 i 352 ou seja STQ D SQE C SQR que decompõe a soma total dos quadrados STQ em dois componentes soma dos quadrados explicados pela regressão SQE e soma do quadrado dos resíduos SQR Um estudo desses elementos da STQ é conhecido como análise de variância ANOVA do ponto de vista da regressão Associados a qualquer soma de quadrados estão seus graus de liberdade o número de observa ções independentes em que se embasa A STQ tem n l gl porque per demos 1 gl ao calcular a média da amostra Y A SQR tem n 2 gl Por quê Nota isso é verdadeiro apenas para o modelo de re gressão com duas variáveis com o in tercepto Ø1 presente A SQE tem l gl novamente isso é válido apenas no caso de duas variáveis que resulta do fato de que SQE H ØO2 2 x2 i é uma função apenas de x2 i visto que ØO2 é conhecida Vamos organizar as várias somas de quadrados e os graus de liberdade correspondentes na Tabela 53 que é a forma padrão de uma tabela de análise de regressão muitas vezes chamada tabela ANO VA Dadas as entradas da Tabela 53 consideremos agora a seguinte variável F H MSQ de SQE MSQ de SQR H ØO2 2 x2 i uO2 i n 2 H ØO2 2 x2 i æO 2 591 Se supormos que os termos de erro ui sejam normalmente distribuídos como fazemos no modelo clássico de regressão linear normal e se a hipótese nula H0 é Ø2 D 0 podese demonstrar que a variável F da Equação 591 segue a distribuição F com l gl no numerador e n 2 gl no denomi nador Veja a demonstração na Seção 5A3 do Apêndice 5A As propriedades gerais da distribuição F são discutidas no Apêndice A Como podemos usar a razão F Podemos demonstrar18 que E ØO2 2 x2 i H æ 2 C Ø2 2 x2 i 592 18 Para uma demonstração veja broWnlee K a Statistical theory and methodology in science and engineering nova York John Wilev Sons 1960 p 278280 Tabela 53 Tabela ANOVA para o modelo de regressão de duas variáveis Fonte da Variação SQ gl MSQ Devido à regressão SQE yˆ 2 i D ؈2 2 x 2 i 1 ؈ 2 2 x 2 i Devido aos resíduos SQR uˆ2 i n 2 u2 i n 2 D æ 2 STQ y 2 i n 1 ˆ SQ significa soma dos quadrados Média da soma dos quadrados obtida dividindose SQ pelos graus de liberdade correspondentes ECONOBOOKindb 144 23112010 071113 Capítulo 5 A regressão de duas variáveis estimação de intervalo e teste de hipóteses 145 e E u2 i n 2 H EæO 2 H æ 2 ˆ 593 Note que Ø2 e æ2 no lado direito dessas equações são os verdadeiros parâmetros Portanto se Ø2 for de fato zero as Equações 592 e 593 proporcionarão estimativas idênticas do verdadeiro æ2 Nesta situação a variável explanatória X não tem nenhuma influência linear sobre Y e toda a varia ção de Y é explicada pelos distúrbios aleatórios ui Se por outro lado Ø2 não for zero as Equações 592 e 593 serão diferentes e parte da variação de Y será atribuída a X Portanto a razão F da Equação 591 proporciona um teste da hipótese nula H0 Ø2 D 0 Como to das as quantidades que entram nessa equação podem ser obtidas por meio da amostra disponível essa razão F oferece um teste estatístico para verificar a hipótese nula de que o verdadeiro Ø2 é igual a zero Tudo o que pre cisamos fazer é calcular a razão F e comparála com o valor crítico de F apresentado nas tabelas F ao nível de significância escolhido ou obter o valor p da estatística F calculada Para ilustrar vamos continuar com nosso exemplo A Tabela 54 apresenta a tabela ANOVA para este exemplo O valor de F calculado é de 1083026 O valor p dessa estatística F correspondente a l e 11 graus de liberdade não pode ser encontrado na tabela F do Apêndice D mas usando tabelas estatísticas eletrônicas verificamos que o valor p é 00000001 de fato uma probabilidade extrema mente baixa Se você optar pela abordagem do nível de significância para o teste de hipóteses e fixar Æ em 001 ou um nível de 1 verá que o valor F calculado de 1083026 é obviamente significativo nesse nível Portanto se rejeitarmos a hipótese nula de que Ø2 D 0 a probabilidade de cometer um erro do Tipo I será muito pequena Para todos os fins práticos nossa amostra não poderia ser prove niente de uma população com um valor de Ø2 igual a zero e podemos concluir com grande confiança que X a escolaridade afeta Y o salário médio Consulte o Teorema 57 do Apêndice 5A1 que informa que o quadrado do valor t com k graus de liberdade corresponde a um valor F com l grau de liberdade no numerador e k graus de liberdade no denominador Para nosso exemplo se supormos que H0 Ø2 D 0 podemos verificar facilmente pela Equação 532 que o valor estimado de t é 1041 Esse valor t tem 11 graus de liberdade Sob a mes ma hipótese nula o valor de F era 1083026 com l e 11 graus de liberdade Portanto 1034282 D valor F salvo erros de arredondamento Assim os testes t e F oferecem duas formas alternativas mas complementares de testar a hipótese nula de que Ø2 D 0 Sendo esse o caso por que não nos basearmos apenas no teste t e deixarmos de lado o teste F e a análise de variância que o acompanha Para o modelo com duas variáveis não há realmente necessidade de recorrermos ao teste F mas quando tratarmos do tema regressões múlti plas veremos que o teste F tem várias aplicações interessantes que o tornam muito útil e poderoso para verificar hipóteses estatísticas 510 Aplicação da análise de regressão o problema da previsão Com base nos dados amostrais da Tabela 32 obtivemos a seguinte regressão amostral YOi H 00144 C 07240Xi 361 Tabela 54 Tabela ANOVA para o exemplo de consumo e renda Fonte de variação SQ gl MSQ Devido à regressão SQE 954255 1 954255 F D 954255 08811 96928 11 08811 D 1083026 12 1051183 STQ Devido aos resíduos SQR ECONOBOOKindb 145 23112010 071114 146 Parte Um Modelos de regressão com equação única em que YOi é o estimador da verdadeira EYi correspondente a X Que usos podemos dar a essa re gressão histórica Um deles seria prever ou projetar os futuros salários médios Y correspon dentes a algum nível de escolaridade X Há dois tipos de previsão 1 previsão do valor médio condicional de Y correspondente a um X selecionado por exemplo X0 que é o próprio ponto da linha de regressão da população veja a Figura 22 e 2 previsão de um valor individual de Y correspon dente a X0 Chamaremos essas duas previsões de previsão média e previsão individual Previsão média19 Para consolidarmos essas ideias suponhamos que X0 D 20 e que desejamos prever EY j X0 D 20 Podese mostrar que a regressão histórica 361 proporciona a estimativa pontual dessa previsão mé dia do seguinte modo YO0 H ØO1 C ØO2X0 H 00144 C 0724020 H 144656 5101 em que YO0 D estimador de EY j X0 É possível demonstrar que esse previsor pontual é um melhor estimador linear não viesado ou não tendencioso MELNT ou do inglês BLUE Como YO0 é um estimador é possível que seja diferente de seu verdadeiro valor A diferença entre os dois valores dará alguma ideia sobre o erro de previsão ou projeção Para avaliálo precisamos verificar a distribuição amostral de YO0 Na Seção 5A4 do Apêndice 5A mostramos que YO0 na Equa ção 5101 tem distribuição normal com média Ø1 C Ø2 X0 e variância dada pela seguinte fór mula var YO0 H æ 2 1 n C X0 X 2 x2 i 5102 Substituindo o æ2 desconhecido por seu estimador não viesado æO 2 vemos que a variável t H YO0 Ø1 C Ø2X0 epYO0 5103 segue a distribuição t com n 2 graus de liberdade Portanto a distribuição t pode ser utilizada para obter intervalos de confiança para a verdadeira EY0 j X0 e testar hipóteses da maneira habi tual a saber Pr ØO1 C ØO2X0 tÆ2 ep YO0 Ø1 C Ø2X0 ØO1 C ØO2X0 C tÆ2 ep YO0 H 1 Æ 5104 em que o erro padrão de YO0 é obtido por meio de 5102 Para nossos dados veja a Tabela 32 var 0 H 08936 1 13 C 20 122 182 H 03826 YO e ep 0 H 06185 YO 19 Para a demonstração das várias afirmações feitas veja a Seção 5a4 do Apêndice 5A ECONOBOOKindb 146 23112010 071117 Capítulo 5 A regressão de duas variáveis estimação de intervalo e teste de hipóteses 147 Portanto o intervalo de confiança com 95 de probabilidade da verdadeira EY j X0 D Ø1 C Ø2 X0 é dado por 144656 220106185 EY0 j X D 20 144656 C 22006185 isto é 131043 EY j X H 20 158260 5105 Assim dado X0 D 20 em amostras repetidas 95 de cada 100 intervalos como a Equação 5105 incluirão o verdadeiro valor médio a melhor estimativa individual do verdadeiro valor médio é obvia mente a estimativa pontual 144656 Se obtivermos intervalos de confiança de 95 como a Equação 5105 para cada um dos valores de X dados na Tabela 32 obteremos o que é conhecido como o intervalo de confiança ou banda de confiança para a função de regressão da população da Figura 56 Previsão individual Se estivermos interessados em prever um valor individual de Y Y0 correspondente a um valor de X por exemplo X0 então como mostra a Seção 5A3 do Apêndice 5A o melhor estimador linear não viesado de Y0 também será dado por 5101 mas sua variância será a seguinte var Y0 YO0 H EY0 YO02 H æ 2 1 C 1 n C X0 X 2 x2 i 5106 É possível demonstrar ainda que Y0 também segue a distribuição normal com média e variância dadas pelas Equações 5101 e 5106 respectivamente Substituindo æO 2 pelo desconhecido æ2 temos t H Y0 OY0 ep Y0 Y0 O fiGuRa 56 Intervalos de confiança bandas para Y médio e para valores individuais de Y 18 14 Salário médio Escolaridade 12 16 10 8 6 4 2 00 8 6 4 2 10 14 16 18 20 22 Y X 1201 1582 1691 YOi 00144 07240Xi 1446 Intervalo de confiança para Y individual Intervalo de confiança para Y médio 12 X 1310 ECONOBOOKindb 147 23112010 071119 148 Parte Um Modelos de regressão com equação única que também segue a distribuição t Desse modo a distribuição t pode ser usada para fazer infe rências sobre o verdadeiro Y0 Continuando com nosso exemplo vemos que a previsão pontual de Y0 é 144656 a mesma de YO0 e sua variância é de 12357 o leitor deve verificar este cálculo Portanto o intervalo de confiança de 95 para Y0 correspondente a X0 D 100 é 120190 Y0 j X0 H 20 169122 5107 Comparando esse intervalo com a Equação 5105 vemos que o intervalo de confiança para o Y0 individual é mais amplo que aquele para o valor médio de Y0 Por quê Calculando interva los de confiança como a Equação 5107 condicionais aos valores de X da Tabela 32 obtemos a banda de confiança de 95 para os valores individuais de Y correspondentes a esses valores de X Essa banda de confiança juntamente com aquela para associada aos mesmos X estão na Fi gura 56 Note um aspecto importante das bandas de confiança da Figura 56 sua largura é menor quando X0 D X Por quê Contudo a largura da banda ampliase significativamente à medida que X0 afasta se de X Por quê Essa mudança sugere que a capacidade de previsão da linha de regressão amos tral histórica cai acentuadamente à medida que X0 afastase progressivamente de X Portanto é preciso ter grande cautela ao extrapolar a linha de regressão histórica para prever EY X0 ou Y0 associado a um dado X0 que esteja muito afastado da média amostral 511 A apresentação dos resultados da análise de regressão Há várias maneiras de apresentarmos os resultados da análise de regressão mas neste livro usare mos o formato a seguir empregando o exemplo saláriosescolaridade do Capítulo 3 para ilustrar Yi H 00144 C 07240Xi epH 09317 00700 r2 H 09065 t H 00154 103428 gl H 11 p H 0987 0000 F111 H 10830 O 5111 Na Equação 5111 os números do primeiro conjunto de parênteses são os erros padrão estima dos dos coeficientes de regressão os do segundo conjunto são os valores t estimados calculados por meio de 532 sob a hipótese nula de que o verdadeiro valor populacional de cada coeficiente de regressão individual é zero por exemplo 103428 H 07240 00700 e os números do terceiro conjunto são os valores p estimados Com 11 graus de liberdade a probabilidade de obter um valor t de 103428 ou mais é de praticamente zero Além disso para 11 graus de liberdade a probabilidade de obter um valor t de 103428 ou mais é 000009 o que é praticamente nula Lembrese de que quanto menor o valor p menor a probabilidade de cometer um erro se rejeitarmos a hipótese nula Apresentando os valores p para os coeficientes estimados t percebemos de imediato o nível de importância de cada valor t estimado Além disso sob a hipótese nula que o verdadeiro valor da curva populacional é zero a probabilidade exata de obter um valor de t igual ou maior de 103428 é praticamente zero Mostramos anteriormente a estreita relação entre as estatísticas F e t especificamente F1k D tk 2 Sob a hipótese nula de que o verdadeiro Ø2 D 0 a Equação 5111 mostra que o valor F é de 10830 para l grau de liberdade no numerador e 11 no denominador e o valor t é cerca de 1034 11 gl conforme esperado o primeiro valor é o quadrado do segundo valor exceto pelos erros de arredon damento A tabela ANOVA para esse problema já foi discutida ECONOBOOKindb 148 23112010 071121 Capítulo 5 A regressão de duas variáveis estimação de intervalo e teste de hipóteses 149 512 Avaliando os resultados da análise de regressão Na Figura 14 da Introdução traçamos a anatomia da modelagem econométrica Agora que apresentamos os resultados da análise de regressão do exemplo saláriosescolaridade na Equação 5111 gostaríamos de questionar a adequação do modelo ajustado Qual a qualidade dele Precisamos de alguns critérios para responder a essa pergunta Primeiro os sinais dos coeficientes estimados estão de acordo com as expectativas teóricas ou os resultados de estudos anteriores A priori Ø2 no exemplo saláriosescolaridade deveria ser positivo No caso é Segundo se a teoria diz que a relação deve ser não apenas positiva mas também estatis ticamente significante isso ocorre nessa aplicação Como discutimos na Seção 511 o coeficiente de escolaridade não só é positivo como também difere significativamente de zero em termos estatísticos o valor p do valor t estimado é extremamente pequeno Os mesmos comentários aplicamse ao coefi ciente do intercepto Terceiro até que ponto o modelo de regressão explica as variações no nosso exemplo Podemos usar r2 para responder a essa pergunta Neste exemplo r2 é cerca de 090 o que é um valor muito alto considerandose que r2 pode chegar no máximo a 1 O modelo que escolhemos para explicar os salários médios parece bastante bom Mas antes de passarmos a outro tópico gostaríamos de verificar se o modelo satisfaz as hipóteses do modelo clássico de regressão linear normal Não examinaremos agora as várias hipóteses porque o mo delo é extremamente simples Contudo há uma hipótese que merece ser verificada a normalidade do termo de erro ui Lembrese de que os testes t e F usados anteriormente exigem que o termo de erro siga uma distribuição normal Caso contrário o procedimento de teste não será válido para amostras pequenas ou finitas Testes de normalidade Embora a literatura específica examine vários testes de normalidade consideraremos apenas de três 1 histograma de resíduos 2 representação de probabilidade normal um artifício gráfico e 3 o teste JarqueBera Histograma de resíduos O histograma de resíduos é um dispositivo gráfico simples usado para conhecer algo sobre a for ma da função de densidade de probabilidade FDP de uma variável aleatória No eixo horizontal dividimos os valores da variável de interesse no caso os resíduos de MQO em intervalos adequados e em cada intervalo de classe traçamos retângulos com altura correspondente ao número de observa ções sua frequência nesse intervalo de classe Sobrepondo mentalmente a curva em forma de sino da distribuição normal ao histograma você poderá ver se a aproximação normal FDP é adequada A Figura 57 mostra o histograma de resíduos para a regressão saláriosescolaridade fiGuRa 57 Histograma de resíduos da regressão saláriosescolaridade 4 3 Frequência Resíduo Histograma Resposta em saláriohora médio 2 1 0 15 10 05 0 10 05 15 ECONOBOOKindb 149 23112010 071121 150 Parte Um Modelos de regressão com equação única Esse diagrama indica que os resíduos não têm uma distribuição normal perfeita para uma variá vel normalmente distribuída a assimetria uma medida de simetria deve ser zero e a curtose que mede quão alta ou atarracada é a distribuição normal deve ser 3 Mas é sempre uma boa prática traçar o histograma dos resíduos de qualquer regressão como um método rústico e rápido de testar a premissa de normalidade Gráfico de probabilidade normal Um artifício gráfico comparativamente simples para estudar a forma da função de densidade de probabilidade de uma variável aleatória é o gráfico de probabilidade normal GPN em que usa mos o papel de probabilidade normal um papel especial para gráficos No eixo horizontal ou dos X marcamos os valores da variável de interesse no caso os resíduos de MQO uOi e no eixo vertical ou dos Y representamos o valor esperado para essa variável caso estivesse normalmente distribuída Se a variável provém de fato de uma população normal o GPN será aproximadamente uma linha reta A Figura 58 mostra um gráfico desse tipo para nossa regressão saláriosescolaridade elaborada com o software MINITAB versão 15 Como observado se a linha ajustada do GPN for aproximada mente uma reta podemos concluir que a variável está normalmente distribuída Na Figura 58 vemos que os resíduos de nosso exemplo apresentam uma distribuição aproximadamente normal porque a linha reta parece ajustarse bastante bem aos dados O MINITAB também gera o teste de normalidade AndersonDarling conhecido como estatística A2 A hipótese nula subjacente é que a variável considerada é em geral distribuída De acordo com a Fi gura 58 para nosso exemplo a estatística A2 calculada é 0289 O valor p da obtenção desse valor de A2 é 0558 que é razoavelmente alto Portanto não rejeitamos a hipótese de que os resíduos da regressão de nosso exemplo distribuemse normalmente De maneira casual a Figura 58 mostra os parâmetros da distribuição normal a média de aproximadamente 0 e o desvio padrão de cerca de 08987 Teste de normalidade JarqueBera JB20 O teste de normalidade JB é um teste assintótico ou de amostra grande Também se baseia nos resí duos de MQO Ele calcula primeiro a assimetria e a curtose examinadas no Apêndice A dos resíduos de MQO e usa o seguinte teste estatístico JB H n S2 6 C K 32 24 5121 20 veja JarQUe C m bera a K a test for normality of observations and regression residuals International Statistical Review 1987 v 55 p 163172 fiGuRa 58 Resíduos da regressão salários escolaridade Média 321111E15 Desvpd 08987 N 13 A2 0289 Valor p 0558 2 1 0 RESI1 1 2 10 5 1 20 40 30 80 70 60 50 Percentual 90 95 99 Gráfico de probabilidade de RESI1 Normal ECONOBOOKindb 150 23112010 071122 Capítulo 5 A regressão de duas variáveis estimação de intervalo e teste de hipóteses 151 em que n H tamanho da amostra S D coeficiente de assimetria e K D coeficiente de curtose Para uma variável normalmente distribuída S D 0 e K D 3 Portanto o teste JB de normalidade é um teste da hipótese conjunta de que S e K são iguais a 0 e 3 respectivamente Nesse caso esperase que o valor da estatística JB seja igual a 0 Sob a hipótese nula de que os resíduos são normalmente distribuídos Jarque e Bera demonstra ram que assintoticamente isto é em amostras grandes a estatística JB dada na Equação 5121 segue a dis tribuição de quiquadrado com 2 graus de liberdade Se o valor p calculado para a esta tística JB em uma aplicação for suficientemente baixo o que acontece quando o valor da estatística é muito diferente de zero podemos rejeitar a hipótese de que a distribuição dos resíduos é normal Mas se o valor p for razoavelmente alto o que acontece quando o valor da estatística está próximo de zero não rejeitaremos a hipótese de normalidade A estatística JB estimada para nosso exemplo saláriosescolaridade é de 08286 A hipótese nula de que os resíduos neste exemplo estão normalmente distribuídos não pode ser rejeitada pois o valor p de obtermos uma estatística JB de 08286 ou maior é de cerca de 066 ou 66 Essa probabilida de é bastante alta Note que embora nossa regressão tenha 13 observações elas foram obtidas de uma amostra de 528 observaçoes o que parece razoavelmente alto Outros testes da adequação do modelo Lembrese de que o modelo clássico de regressão linear normal estabelece muito mais hipóteses além da normalidade do termo de erro ou termo de distúrbio À medida que avançarmos no exame da teoria econométrica veremos vários testes da adequação do modelo veja o Capítulo 13 Até lá tenha em mente que a formulação de modelos de regressão baseiase em várias hipóteses simplifica doras que podem não se sustentar em cada caso específico Um exemplo final voltemos ao exemplo 32 sobre despesas com alimentos na Índia Usando os dados for necidos na equação 372 e adotando o formato da equação 5111 obtemos a seguinte equação de despesas gl ep 5122 em que denota extremamente pequeno Primeiro vamos interpretar a regressão Como esperado existe uma relação positiva en tre despesas com alimentos e despesa total Se a despesa total aumentar em uma rupia em média a despesa com alimentação aumentará em cerca de 44 países Se a despesa total for zero em média a despesa com alimentação será de 94 rupias obviamente essa interpreta ção mecânica do intercepto pode não fazer muito sentido econômico o valor de r2 cerca de 037 significa que 37 da variação na despesa com alimentos é explicada pela despesa total uma proxy para a renda Suponha que queiramos testar a hipótese nula de que não há relação entre despesa com alimentação e despesa total que o coeficiente angular verdadeiro Ø2 D 0 o valor estimado de Ø2 é 04368 Se a hipótese nula fosse verdadeira qual seria a probabilidade de obter um valor de 04368 Sob a hipótese nula observamos na equação 5122 que o valor t é 55770 e o valor p de obter esse valor t é praticamente igual a zero em outras palavras po demos rejeitar totalmente a hipótese nula mas suponha que a hipótese nula seja Ø2 D 05 e agora recorrendo ao teste t obtemos Continua ECONOBOOKindb 151 23112010 071123 152 Parte Um Modelos de regressão com equação única Um exemplo final Continuação a probabilidade de obter um t de 08071 é de mais de 20 Portanto não rejeitamos a hipótese de que o verdadeiro Ø2 seja 05 note que sob a hipótese nula o coeficiente angular verdadeiro é zero o valor F é 311034 como mostra a equação 5122 Sob a mesma hipótese nula obtivemos um valor t de 55770 Se elevarmos ao quadrado esse valor obteremos 311029 que é quase o mesmo valor de F mostrando novamente a estreita relação entre as estatísticas t e F Nota o gl no numerador da estatística F deve ser 1 como ocorre neste caso Usando os resíduos estimados da regressão o que podemos dizer sobre a distribuição de probabilidade do termo de erro essa informação está na Figura 59 Como a Figura 59 indi ca os resíduos da re gressão da despesa com alimentos parecem ter uma distribuição simétrica a aplicação do teste Jarquebera mostra que a estatística Jb é de cerca de 02576 e que a probabilidade de obter esse número sob uma premissa de distribuição normal é de cerca de 88 Portanto não rejeitamos a hipótese de que os termos de erro se distribuam normal mente mas tenha em mente que o ta manho da amostra de 55 observações pode não ser suficientemente grande fiGuRa 59 Resíduos da regressão das despesas com alimentação 14 12 10 8 Número de observações Resíduos 6 4 2 0 150 100 50 0 50 100 150 Séries resíduos Amostra 1 55 Observações 55 Média 119 1014 Mediana 7747849 Máximo 1715859 Mínimo 1537664 Desvio padrão 6623382 Assimetria 0119816 Curtose 3234473 JarqueBera 0257585 Probabilidade 0879156 deixamos para o leitor a tarefa de estabelecer intervalos de con fiança para os dois coefi cientes de regressão assim como a de representar graficamente a probabilidade normal e fazer previsões para a média e individual Resumo e conclusões 1 A estimação e o teste de hipóteses são os dois ramos principais da estatística clássica Depois de discutirmos o problema da estimação nos Capítulos 3 e 4 dedicamos este capítulo ao problema do teste de hipóteses 2 O teste de hipóteses responde à seguinte pergunta um resultado obtido é compatível com a hipó tese feita ou não 3 Há duas abordagens mutuamente complementares para a resposta à pergunta feita o intervalo de confiança e o teste de significância 4 Por trás da abordagem do intervalo de confiança está o conceito da estimação de intervalo Um estimador de intervalo é um intervalo ou faixa elaborada de tal modo que tenha uma probabili dade específica de incluir entre seus limites o verdadeiro valor de um parâmetro desconhecido O intervalo assim construído é conhecido como intervalo de confiança que muitas vezes é apre sentado em forma de porcentagem como 90 ou 95 O intervalo de confiança oferece um conjunto de hipóteses plausíveis sobre o valor do parâmetro desconhecido Se o valor proposto na hipótese nula estiver dentro do intervalo de confiança a hipótese não será rejeitada se estiver fora do intervalo a hipótese nula poderá ser rejeitada ECONOBOOKindb 152 23112010 071124 Capítulo 5 A regressão de duas variáveis estimação de intervalo e teste de hipóteses 153 5 No procedimento do teste de significância desenvolvemos um teste estatístico e examinamos sua distribuição amostral sob a hipótese nula Os testes estatísticos costumam seguir uma dis tribuição de probabilidade bem definida como a normal a t a F ou a quiquadrado Uma vez calculado o teste estatístico por exemplo a estatística t com base nos dados disponíveis seu valor p pode ser facilmente obtido O valor p fornece a probabilidade exata de obter o teste estatís tico calculado sob a hipótese nula Se esse valor p for pequeno podemos rejeitar a hipótese nula mas se for grande talvez não seja possível rejeitála Cabe ao pesquisador definir o que constitui um p grande ou pequeno Ao escolher o valor p o pesquisador deve ter em mente as probabili dades de cometer os erros do Tipo I ou do Tipo II 6 Na prática é preciso ter cuidado ao fixar Æ a probabilidade de cometer um erro do Tipo I em valores arbitrários como 1 5 ou 10 É melhor recorrer ao valor p do teste estatístico Além disso a significância estatística de um indicador não deve ser confundida com sua significância prática 7 Obviamente o teste de hipóteses presume que o modelo escolhido para a análise empírica seja adequado no sentido de que não desrespeite uma ou mais das hipóteses que embasam o modelo clássico de regressão linear normal Os testes da adequação do modelo devem preceder o teste de hipóteses Este capítulo apresentou um desses testes o teste de normalidade para verificar se o termo de erro segue a distribuição normal Como em amostras pequenas ou finitas os testes t F e quiquadrado requerem a hipótese de normalidade é importante que essa hipótese seja testada formalmente 8 Se o modelo é considerado praticamente adequado pode ser usado para fins de previsão Mas ao prever os valores futuros do regressando é preciso não se afastar demais da faixa de valores do regressor Caso contrário os erros de previsão podem aumentar de modo impressionante exeRCíCioS 51 Verifique explicando se as seguintes afirmações são verdadeiras falsas ou duvidosas Seja preciso a O teste t de significância discutido neste capítulo requer que as distribuições amostrais dos estimadores ØO1 e ØO2 sigam a distribuição normal b Mesmo que o termo de erro do modelo clássico de regressão linear não seja normalmen te distribuído os estimadores de mínimos quadrados ordinários continuam sendo não viesados c Se não há intercepto no modelo de regressão a soma dos ui estimados D uOi não totalizará zero d O valor p e o tamanho de um teste estatístico significam a mesma coisa e Em um modelo de regressão que contém o intercepto a soma dos resíduos é sempre igual a zero f Se uma hipótese nula não é rejeitada ela é verdadeira g Quanto mais alto o valor de æ2 maior a variância de ØO2 dada na Equação 331 h As médias condicional e não condicional de uma variável aleatória são a mesma coisa i Na FRP de duas variáveis se o coeficiente angular Ø2 é zero o intercepto Ø1 é estimado pela média amostral Y j A variância condicional var Yi Xi D æ 2 e a variância não condicional de Y var Y æ 2 Y serão iguais se X não influenciar Y 52 Monte uma tabela ANOVA semelhante à Tabela 54 para o modelo de regressão da Equação 372 e teste a hipótese de que na Índia não há relação entre a despesa com alimentos e a despesa total 53 Consulte a regressão da demanda por telefones celulares na Equação 373 ECONOBOOKindb 153 23112010 071124 154 Parte Um Modelos de regressão com equação única a O coeficiente de intercepto estimado é significativo no nível de 5 de significância Qual é a hipótese nula subjacente b O coeficiente angular estimado é significativo no nível de 5 de significância Qual a hi pótese nula subjacente c Estabeleça uma confiança de 95 para o verdadeiro coeficiente angular d Qual o valor médio estimado para a demanda de telefones celulares se a renda per capita for de 9000 Qual o intervalo de confiança de 95 para o valor previsto 54 Seja ρ2 o verdadeiro coeficiente de determinação populacional Suponha que você queira testar a hipótese ρ2 D 0 Explique verbalmente como seria possível testar essa hipótese Dica use a Equação 3511 Veja também o Exercício 57 55 O que se conhece por linha característica na análise moderna de investimentos nada mais é do que a regressão obtida por meio do seguinte modelo em que rit D taxa de retorno do iésimo ativo no período t rmt D taxa de retorno do portfólio de mercado no período t ut D termo de erro estocástico Neste modelo Øi é conhecido como o coeficiente beta do iésimo ativo uma medida do risco de mercado ou risco sistêmico de um ativo 21 Com base em 240 taxas de retorno mensais do período 19561976 Fogler e Ganapathy obti veram a seguinte linha característica para as ações da IBM em relação ao índice de portfólio de mercado calculado pela Universidade de Chicago 22 a Dizse que um ativo cujo coeficiente beta é maior que um é um papel volátil ou agres sivo As ações da IBM foram voláteis durante o período estudado b O coeficiente do intercepto é significativamente diferente de zero Se for qual o significa do prático disso 56 A Equação 535 também pode ser escrita como ep ep Em outras palavras a desigualdade fraca pode ser substituída pela desigualdade forte Por quê 57 R A Fisher derivou a distribuição amostral do coeficiente de correlação definido na Equação 3513 Se supusermos que as variáveis X e Y não apresentam uma distribuição normal conjun ta isto é elas provêm de distribuição normal bivariada veja o Apêndice 4A Exercício 41 en tão sob a hipótese de que o coeficiente de correlação populacional Ω é zero podese demonstrar que segue a distribuição t de Student com n 2 graus de liberdade Mostre que esse valor de t é idêntico ao valor t da Equação 532 sob a hipótese nula de que Ø2 D 0 Então estabeleça que sob a mesma hipótese nula FD t 2 Veja a Seção 5923 veja levY haim SarnaT marshall Portfolio and investment Selection theory and practice englewood Cliffs n J Prenticehall international 1984 cap 12 FoGler h russell GanaPaThY Sundaram Financial econometrics englewood Cliffs n J Prenticehall in ternational 1982 p 13 Se Ω for de fato zero Fisher mostrou que r seguirá a mesma distribuição t contanto que X ou Y seja normal mente distribuído mas se Ω não for igual a zero as duas variáveis deverão ser normalmente distribuídas veja anderSon r l branCroFT T a Statistical theory in research nova York mcGrawhill 1952 p 8788 154 Parte Um Modelos de regressão com equação única ECONOBOOKindb 154 23112010 071125 Capítulo 5 A regressão de duas variáveis estimação de intervalo e teste de hipóteses 155 58 Considere os seguintes resultados de uma regressão SQR em que Y D taxa de participação das mulheres na força de trabalho em 1972 e X D taxa de participação das mulheres na força de trabalho em 1968 A regressão foi feita com uma amos tra de 19 cidades americanas a Como você interpreta esta regressão b Teste as hipóteses H0 Ø2 D l e H1 Ø2 l Qual teste você usa Por quê Quais são as pre missas que embasam os testes usados c Suponha que a taxa de participação das mulheres na força de trabalho em 1968 tenha sido de 058 ou 58 Com base nos resultados da regressão anterior qual a taxa média de participação das mulheres em 1972 Adote um intervalo de confiança de 95 para prever a média d Como você testaria a hipótese de que o termo de erro na regressão da população se distribui normalmente Mostre os cálculos necessários exercícios aplicados 59 A Tabela 55 apresenta dados sobre a remuneração anual salário médio em dólares dos pro fessores e as despesas por aluno das escolas em dólares no ano de 1985 em 50 Estados e no distrito de Columbia adaptado de ChaTTerJee Samprit hadi ali S PriCe bertram Regression analysis by example 3 ed nova York Wiley interscience 2000 p 4647 Capítulo 5 A regressão de duas variáveis estimação de intervalo e teste de hipóteses 155 Tabela 55 Salário médio anual dos professores e despesa média por aluno em dólares 1985 Fonte National Education Association citado em reportagem do Albuquerque Tríbune 7 nov 1986 Observação Salário Despesa Observação Salário Despesa 1 19583 3346 27 22795 3366 2 20263 3114 28 21570 2920 3 20325 3554 29 22080 2980 4 26800 4642 30 22250 3731 5 29470 4669 31 20940 2853 6 26610 4888 32 21800 2533 7 30678 5710 33 22934 2729 8 27170 5536 34 18443 2305 9 25853 4168 35 19538 2642 10 24500 3547 36 20460 3124 11 24274 3159 37 21419 2752 12 27170 3621 38 25160 3429 13 30168 3782 39 22482 3947 14 26525 4247 40 20969 2509 15 27360 3982 41 27224 5440 16 21690 3568 42 25892 4042 17 21974 3155 43 22644 3402 18 20816 3059 44 24640 2829 19 18095 2967 45 22341 2297 20 20939 3285 46 25610 2932 21 22644 3914 47 26015 3705 22 24624 4517 48 25788 4123 23 27186 4349 49 29132 3608 24 33990 5020 50 41480 8349 25 23382 3594 51 25845 3766 26 20627 2821 ECONOBOOKindb 155 23112010 071127 156 Parte Um Modelos de regressão com equação única Para verificar se há alguma relação entre a remuneração dos professores e as despesas por aluno nas escolas públicas sugeriuse o seguinte modelo Remi D Ø1 C Ø2 Gasti C ui em que Rem representa o salário dos professores e Gast as despesas por aluno a Represente graficamente os dados e trace uma linha de regressão a olho b Suponha que com base em a você decida estimar o modelo de regressão anterior Obte nha as estimativas dos parâmetros os erros padrão r2 SQR e SQE c Interprete os resultados da regressão Faz sentido do ponto de vista econômico d Estabeleça um intervalo de confiança de 95 para Ø2Você rejeitaria a hipótese de que o verdadeiro coeficiente angular é 30 e Obtenha a média e o valor individual previsto de Rem se as despesas por aluno forem de 5000 Estabeleça também intervalos de confiança para a média real e para o valor indi vidual de Rem para a despesa dada f Como você testaria a hipótese de normalidade do termo de erro Mostre os testes que usou 510 Consulte os dados do Exercício 320 e monte as tabelas ANOVA e teste a hipótese de que não há relação entre produtividade e salário real Faça isso para o setor empresarial e para o empre sarial não agrícolas 511 Volte ao Exercício 17 a Trace um gráfico dos dados com as impressões no eixo vertical e as despesas com publici dade no horizontal Que tipo de relação você observa b Seria apropriado ajustar um modelo de regressão linear bivariada a esses dados Justifique sua resposta Em caso negativo que tipo de modelo você usaria para ajustar os dados Temos as ferramentas necessárias para fazêlo c Suponha que você não tenha representado graficamente os dados e apenas os ajuste a um modelo de regressão bivariada Obtenha os resultados costumeiros Guarde os resultados para voltar mais adiante a este problema 512 Volte ao Exercício 11 a Trace um gráfico com os dados do Índice de Preços ao Consumidor IPC dos Estados Unidos em um eixo e os do IPC canadense no outro O que o gráfico mostra b Suponha que você queira prever o IPC dos Estados Unidos com base no IPC do Canadá Desenvolva um modelo adequado c Teste a hipótese de que não há relação entre os IPCs dos dois países Use Æ D 5 Se você rejeitar a hipótese nula isso significa que o IPC canadense causa o IPC dos Estados Uni dos Justifique sua resposta 513 Volte ao Exercício 322 a Estime as duas regressões dadas lá calculando os erros padrão e os demais resultados ha bituais b Teste a hipótese de que os termos de erro dos dois modelos de regressão distribuemse normalmente c Na regressão do preço do ouro teste a hipótese de que Ø2 D 1 ou seja de que há uma rela ção de um para um entre os preços do ouro e o IPC o ouro é um hedge perfeito Qual o valor p da estatística t estimada d Repita o item c agora com a regressão do índice NYSE O investimento no mercado de ações é um hedge perfeito contra a inflação Que hipótese nula você está testando Qual seu valor p e Entre o ouro e as ações qual investimento você escolheria Em que se baseia sua deci são 156 Parte Um Modelos de regressão com equação única ECONOBOOKindb 156 23112010 071127 Capítulo 5 A regressão de duas variáveis estimação de intervalo e teste de hipóteses 157 514 A Tabela 56 apresenta dados sobre o PNB e quatro definições do estoque de moeda dos Esta dos Unidos no período 19701983 Fazendo as regressões do PNB contra as várias definições de moeda obtemos os resultados apresentados na Tabela 57 Os monetaristas ou adeptos da teoria quantitativa afirmam que a renda nominal o PNB nomi nal é determinada em grande parte pela variação na quantidade ou estoque de moeda embo ra não haja consenso quanto à definição certa de moeda De acordo com os resultados na tabela responda às seguintes perguntas a Que definição de moeda parece apresentar relação mais estreita com o PNB nominal b Como os r2 são todos elevados isso significa que a escolha da definição de moeda não tem importância c Se o FED Banco Central dos Estados Unidos quer controlar a oferta de moeda qual des ses indicadores de moeda seria o melhor objetivo para esse fim Isso pode ser dito com base nos resultados da regressão 515 Imagine que a equação de uma curva de indiferença entre dois bens seja Capítulo 5 A regressão de duas variáveis estimação de intervalo e teste de hipóteses 157 Tabela 56 PNB e estoque de moeda segundo quatro conceitos Fonte Economic Report of the President 1985 dados do PNB Quadro B1 p 232 e estoque de moeda Quadro B61 p 303 Medida de estoque de moeda bilhões de PNB bilhões de Ano 1 M M 2 M3 L 1970 99270 2166 6282 6775 8163 1971 10776 2308 7128 7762 9031 1972 11859 2520 8052 8860 10230 1973 13264 2659 8610 9850 11417 1974 14342 2776 9085 10705 12493 1975 15492 2912 10233 11742 13679 1976 17180 3104 11636 13119 15166 1977 19183 3354 12867 14729 17047 1978 21639 3631 13891 16471 19106 1979 24178 3891 14985 18048 21171 1980 26317 4149 16326 19900 23262 1981 29578 4419 17966 22382 25998 1982 30693 4805 19654 24625 28708 1983 33048 5254 21963 27104 31831 Definição M1 D Papel moeda C depósitos à vista C cheques de viagem e outros depósitos sacáveis por cheque M2 D C depósitos no overnight e eurodólares C fundos do mercado monetário C depósitos a prazo fixo C contas de poupança e pequenos depósitos M3 D L D M3 C outros ativos líquidos M C grandes depósitos a prazo fixo C depósitos a prazo C fundos do mercado monetário institucionais 2 M1 Tabela 57 Regressões PNB Estoque de moeda 19701983 1 PNBt H 7874723 C 80863 M1t r 2 H 09912 779664 02197 2 PNBt H 440626 C 15875 M2t r 2 H 09905 610134 00448 3 PNBt H 1591366 C 12034 M3t r 2 H 09943 429882 00262 4 PNBt H 1642071 C 10290 Lt r 2 H 09938 447658 00234 Notaos números entre parênteses são os erros padrão estimados ECONOBOOKindb 157 23112010 071129 158 Parte Um Modelos de regressão com equação única Como você estimaria os parâmetros desse modelo Aplique o modelo anterior aos dados da Tabela 58 e comente os resultados 516 Desde 1986 a revista The Economist publica o índice Big Mac uma tentativa pouco refinada mas engraçada de avaliar se as taxas de câmbio das diversas moedas estão corretas de acor do com os preceitos da teoria da paridade do poder de compra PPC Essa teoria afirma que uma unidade monetária deveria poder comprar a mesma cesta de produtos em todas as econo mias Seus proponentes argumentam que a longo prazo as moedas tendem a convergir para a PPC A revista The Economist adota o Big Mac do McDonalds como cesta de produtos repre sentativa e apresenta as informações da Tabela 59 158 Parte Um Modelos de regressão com equação única Tabela 58 Consumo do bem X 1 2 3 4 5 Consumo do bem Y 4 35 28 19 08 Considere o seguinte modelo de regressão em que Y é a taxa de câmbio vigente e X D PPC implícita do dólar a Se a PPC estiver certa que valores de Ø1 e Ø2 você poderia esperar a priori b Os resultados da regressão confirmam suas expectativas Que testes formais você empre garia para testar suas hipóteses c A revista The Economist deveria continuar divulgando o índice Big Mac Justifique 517 Volte aos dados das provas SAT apresentados no Exercício 216 Suponha que você queira prever a pontuação dos homens nas provas de matemática Y com base na pontuação das mu lheres X usando a seguinte regressão a Estime esse modelo b Com base nos resíduos estimados verifique se a hipótese de normalidade sustentase c Agora teste a hipótese de que Ø2 D l isto é de que existe uma correspondência de um para um entre as notas de matemática de homens e mulheres d Monte uma tabela ANOVA para este problema 518 Repita o exercício anterior agora com as notas de aptidão verbal 519 A Tabela 510 apresenta os dados anuais relativos ao Índice de Preços ao Consumidor IPC e ao Índice de Preço no Atacado IPA também conhecido como Índice de Preços ao Produtor IPP para a economia americana no período 19802006 a Trace um gráfico com o IPC no eixo vertical e o IPP no eixo horizontal A priori que tipo de relação você espera encontrar entre os dois índices Por quê b Suponha que você deseja prever um desses índices com base no outro Qual deles usaria como regressando e qual como regressor Por quê c Estime a regressão de acordo com o estabelecido no item b Mostre os resultados habituais Teste a hipótese de que existe uma relação de um para um entre os dois índices d Com base nos resíduos obtidos na regressão calculada é possível cogitar a hipótese de que o verdadeiro termo de erro está normalmente distribuído Mostre os testes usados 520 A Tabela 511 apresenta dados sobre o índice de mortalidade por câncer de pulmão 100 D média e o índice de consumo de fumo 100 D média para 25 grupos ocupacionais a trace o gráfico do índice de mortalidade por câncer de pulmão em relação ao índice de fumo Que padrão geral você observa ECONOBOOKindb 158 23112010 071130 Capítulo 5 A regressão de duas variáveis estimação de intervalo e teste de hipóteses 159 Capítulo 5 A regressão de duas variáveis estimação de intervalo e teste de hipóteses 159 Preços do big Mac PPC implícita do dólar Taxa de câmbio em 3112007 Super C ou sub valorização em relação ao dólar em moeda local em dólares estados Unidos argentina austrália brasil Grãbretanha Canadá Chile China Colômbia Costa rica república Tcheca dinamarca egito estônia Zona do euro hong Kong hungria islândia indonésia Japão letônia lituânia malásia méxico nova Zelândia noruega Paquistão Paraguai Peru Filipinas Polônia rússia arábia Saudita Cingapura eslováquia África do Sul Coreia do Sul Sri lanka Suécia Suíça Taiwan Tailândia Turquia emirados Árabes Ucrânia Uruguai venezuela dólar americano 322 Peso argentino 825 dólar australiano 345 real 64 libra esterlina199 dólar canadense 363 Peso chileno 1670 Yuan 110 Peso colombiano 6900 Cólon 1130 Coroa tcheca 521 Coroa dinamarquesa 2775 libra egípicia 909 Kroon 30 euro 294 dólar de hong Kong 120 Florim 590 nova Coroa islandesa 509 rupia 15900 iene 280 lats 135 litas 650 ringgit 550 Peso mexicano 290 dólar neozelandês 460 Kroner 415 rupia paquistanesa 140 Guarani 10000 Sol novo 950 Peso filipino 850 Zloty 690 rublo 490 rial saudita 900 dólar de Cingapura 360 Coroa 5798 rand 155 Won 2900 rupia 190 Coroa sueca 320 Franco suíço 630 novo dólar de Taiwan 750 baht 620 lira turca 455 Unidos dirrã 100 hrivna 900 Peso uruguaio 550 bolívar 6800 322 265 267 301 390 308 307 141 306 218 241 484 160 249 382 154 300 744 175 231 252 245 157 266 316 663 231 190 297 174 229 185 240 234 213 214 308 175 459 505 228 178 322 272 171 217 158 256 107 199 162 113 519 342 2143 351 162 862 282 932 110 373 183 158 4938 870 042 202 171 901 143 129 435 3106 295 264 214 152 280 112 180 481 901 590 994 196 233 193 141 311 280 171 2112 311 129 213 196 118 544 777 2254 519 216 574 570 120 130 781 197 684 9100 121 054 266 350 109 145 626 607 5250 320 489 301 265 375 154 272 725 942 109 697 125 329 347 141 367 527 253 4307 18 17 6 C21 4 5 56 5 32 25 C50 50 23 C19 52 7 C131 46 28 22 24 51 17 2 C106 28 41 8 46 29 43 25 27 34 34 4 46 C43 C57 29 45 nil 15 47 33 51 Paridade do poder de compra preço local dividido pelo preço nos Estados Unidos Dólares por euro Média dos preços em Nova York Chicago São Francisco e Atlanta Dólares por libra Tabela 59 O padrão hambúrguer Fonte McDonalds The Economist 1 fev 2007 ECONOBOOKindb 159 23112010 071131 160 Parte Um Modelos de regressão com equação única 160 Parte Um Modelos de regressão com equação única Tabela 511 Fumo e câncer de pulmão Fonte disponível em httplibstatcmuedu DASLDatafiles smokingandcancerhtml Câncer Fumo Ocupação 84 77 Fazendeiro profissionais de atividades florestais pescador 116 137 Minerador cavouqueiro 123 117 Operários da produção de combustíveis coque e produtos químicos 128 94 Vidraceiro e ceramista 155 116 Fundidor 101 102 Operários da fabricação de eletroeletrônicos 118 111 Profissionais de engenharia e atividades associadas Madereiros marceneiros 113 93 104 88 Curtidores em confecção de artigos de couro Operários da fabricação de artigos têxtis 88 102 104 91 Operários da confecção de vestuário 129 104 Profissionais da produção de alimentos bebidas e tabaco 86 107 Operários da fabricação de papel e atividades gráficas 96 112 Operários da fabricação de outros produtos 144 113 Operários da construção civil 139 110 Pintores e decoradores 113 125 Operadores de máquinas guindastes etc 146 113 Operários não incluídos nestas categorias Profissionais de transportes e comunicações 115 128 Estoquistas em armazéns depósitos e lojas almoxarifes etc 115 105 79 87 Escreventes escriturários funcionários de escritórios 85 91 Vendedores 120 100 Profisisonais de seviços esportes e recreadores 60 76 Administradores e gerentes Artistas e proissionais e técnicos em geral 66 51 Tabela 510 IPC e IPP Estados Unidos 19802006 Fonte Economic Report of the President 2007 Tabelas B62 e B65 IPP Total dos bens acabados IPC Total Ano 1980 824 880 1981 909 961 1982 965 1000 1983 996 1016 1984 1039 1037 1985 1076 1047 1986 1096 1032 1987 1136 1054 1988 1183 1080 1989 1240 1136 1990 1307 1192 1991 1362 1217 1992 1403 1232 1993 1445 1247 1994 1482 1255 1995 1524 1279 1996 1569 1313 1997 1605 1318 1998 1630 1307 1999 1666 1330 2000 1722 1380 2001 1771 1407 2002 1799 1389 2003 1840 1433 2004 1889 1485 2005 1953 1557 2006 2016 1603 ECONOBOOKindb 160 23112010 071132 Capítulo 5 A regressão de duas variáveis estimação de intervalo e teste de hipóteses 161 b Considerando Y D índice de mortalidade por câncer de pulmão e X D índice de fumo esti me um modelo de regressão linear e obtenha as estatísticas de regressão habituais c Teste a hipótese de que o fumo não tem influência sobre o câncer de pulmão com Æ D 5 d Quais as ocupações de maior risco em termos de mortalidade por câncer de pulmão Você pode apresentar algumas razões para isso e Existe alguma maneira de incluir a categoria de ocupação na análise de regressão Apêndice 5A 5a1 Distribuições de probabilidade relacionadas à distribuição normal As distribuições de probabilidade t quiquadrado 2 e F cujas características mais destacadas são dis cutidas no Apêndice A estão estreitamente relacionadas à distribuição normal Como faremos grande uso dessas distribuições de probabilidade nos capítulos seguintes resumiremos sua relação com a distribuição nor mal nos teoremas a seguir as demonstrações que estão além do escopo deste livro podem ser encontradas na bibliografia1 Teorema 51 Se Z1 Z2 Zn são variáveis normal e independentemente distribuídas tais que Zi ª Nμi æ 2 i então a soma em que os ki são constantes diferentes de zero também se distribui normalmen te com média e variância isto é Z ª N Nota μ denota o valor médio Resumindo combinações lineares de variáveis normais são normalmente distribuídas Por exemplo se Z1 e Z2 têm distribuição normal e independente como Z1 ª N10 2 e Z2 ª N8 15 a combinação linear Z D 08 Z1 C 02 Z2 também se distribui normalmente com média D 0810 C 028 D 96 e variância D 0642 C 00415 D 134 isto é Z 96 134 Teorema 52 Se Z1 Z2 Zn são variáveis aleatórias com distribuição normal mas não independentes a soma Z D P kiZi em que os ki são constantes diferentes de zero também se distribui normalmente com média P kiμi e variância Assim se Z1 ª N6 2 e Z2 ª N7 3 e cov Z1 Z2 D 08 a combinação linear 06 Z1 C 04 Z2 também tem distribuição normal com média D 066 C 047 D 64 e variância D 0362 C 0163 C 2 06 04 08 D 1584 Teorema 53 Se Z1 Z2 Zn são variáveis aleatórias normal e independentemente distribuídas tais que Z1 ª N01 isto é uma variável normal padronizada então segue a distribuição qui quadrado com n gl Simbolicamente em que n denota os graus de liberdade Resumindo a soma dos quadrados de variáveis normais padrão independentes tem uma distribuição qui quadrado com um número de graus de liberdade igual ao dos termos do somatório2 Teorema 54 Se Z1 Z2 Zn são variáveis aleatórias com distribuição independente todas elas seguindo a distribuição quiquadrado com ki graus de liberdade a soma também segue uma distribuição quiquadrado com Assim se Z1 e Z2 são variáveis independentes χ2 com k1 e k2 graus de liberdade respectivamente então Z D Z1C Z2 também é uma variável 2 com k1 C k2 graus de liberdade Esta é a chamada propriedade repro dutiva da distribuição 2 1 Para demonstrações dos vários teoremas veja mood alexander m GraYbill Franklin a boSe duane C Introduction to the theory of statistics 3 ed nova York mcGrawhill 1974 p 239249 2 ibid p 243 Capítulo 5 A regressão de duas variáveis estimação de intervalo e teste de hipóteses 161 ECONOBOOKindb 161 23112010 071135 162 Parte Um Modelos de regressão com equação única 162 Parte Um Modelos de regressão com equação única Teorema 55 Se Z1 é uma variável normal padronizada Z1 ª N01 e outra variável Z2 segue a distri buição quiquadrado com k graus de liberdade e é independente de Z1 então a variável definida como segue a distribuição t de Student com k graus de liberdade Nota essa distribuição é discutida no Apêndice A e ilustrada no Capítulo 5 Casualmente note que quando k os graus de liberdade aumenta indefinidamente quando k 1 a dis tribuição t de Student aproximase da distribuição normal padrão3 Por convenção a notação tk representa a variável ou distribuição t de Student com k graus de liberdade Teorema 56 Se Z1 e Z2 são variáveis quiquadrado independentemente distribuídas com k1 e k2 graus de li berdade respectivamente então a variável tem distribuição F com k1 e k2 graus de liberdade em que k1 é conhecida como graus de liberdade do nume rador e k2 como graus de liberdade do denominador Mais uma vez por convenção a notação Fk1k2 representa uma variável F com k1 e k2 graus de liberdade e os graus do numerador são citados primeiro Em outras palavras o Teorema 56 informa que a variável F é apenas a razão entre duas variáveis qui quadrado com distribuições independentes divididas pelos respectivos graus de liberdade Teorema 57 O quadrado da variável t de Student com k graus de liberdade segue uma distribuição F com k1 D l gl no numerador e k2 D k gl no denominador4 Isto é Note que para que esta igualdade se mantenha o grau de liberdade do numerador da variável F deve ser igual a 1 Assim F14 D t2 4 ou F123 D t2 23 e assim por diante Teorema 58 Quando os graus de liberdade do numerador são altos os gl do numerador multiplicados pelo valor de F são aproximadamente iguais ao valor da quiquadrado com os graus de liberdade do numerador Assim Teorema 59 Com um número suficientemente grande de gl a distribuição quiquadrado pode ser aproxima da pela distribuição normal padrão da seguinte forma em que k denota os graus de liberdade 5a2 Derivação da equação 532 Seja ep 1 e 2 3 Uma demonstração é encontrada em Theil henri Introduction to econometrics englewood Cliffs n J Prentice hall 1978 p 237245 4 Para uma demonstração veja as equações 532 e 591 ECONOBOOKindb 162 23112010 071136 Capítulo 5 A regressão de duas variáveis estimação de intervalo e teste de hipóteses 163 Capítulo 5 A regressão de duas variáveis estimação de intervalo e teste de hipóteses 163 Desde que æ seja conhecido Z1 segue a distribuição normal padronizada isto é Z1 ª N 0 1 Por quê Z2 segue a distribuição 2 com n 2 graus de liberdade5 Além disso é possível mostrar que Z2 tem distribui ção independente de Z16 Portanto dado o Teorema 55 a variável 3 segue a distribuição t com n 2 graus de liberdade Substituindo as Equações 1 e 2 na Equação 3 obtemos 532 5a3 Derivação da equação 591 A Equação 1 mostra que Z1 ª N0 1 Portanto de acordo com o Teorema 53 o valor anterior segue a distribuição 2 com l grau de liberdade Como mencionado na Seção 5A1 também segue a distribuição 2 com n 2 gl Além disso como mencionado na Seção 43 Z2 tem distribuição independente de Z1 Então do Teorema 56 seguese que segue a distribuição F com l e n 2 graus de liberdade respectivamente Sob a hipótese nula H0 Ø2 D 0 a razão F anterior reduzse à Equação 591 5a4 Derivação das equações 5102 e 5106 Variância da previsão média Com Xi D X0 a verdadeira previsão média EY0 X0 é dada por 1 Estimamos a Equação 1 por meio de 2 Tomando o valor esperado da Equação 2 dado X0 obtemos porque e ØO1 são ØO2 estimadores não viesados Portanto 3 5 Uma demonstração pode ser encontrada em hoGG robert v CraiG allen T Introduction to mathematical statistics 2 ed nova York macmillan 1965 p 144 6 veja JohnSTon J Econometric methods 3 ed nova York mcGrawhill 1984 p 181182 Para acompanhar a demonstração é necessário ter conhecimentos de álgebra matricial ECONOBOOKindb 163 23112010 071138 164 Parte Um Modelos de regressão com equação única 164 Parte Um Modelos de regressão com equação única Isto é YO0 é um previsor não viesado de EY0 X0 Agora usando a propriedade de que var a C b D var a C var b C 2 cov a b obtemos 4 Empregando as fórmulas das variâncias e da covariância de ØO1 e ØO2 dadas nas Equações 331 333 e 339 e reorganizando os termos obtemos 5102 Variância da previsão individual Queremos prever um Y individual correspondente a X D X0 isto é desejamos obter 5 Prevemos isso como 6 O erro de previsão Y0 YO0 é 7 Portanto porque ØO1 e ØO2 são não viesados X0 é um número fixo e Eu0 é igual a zero por hipótese Elevando os dois lados ao quadrado e subtraindo os valores esperados obtemos var Y0 YO0 D var ØO1 C X 2 0 var ØO2 C 2X0 cov Ø1 Ø2 C var u0 Usando as fórmulas de variância e co variância para ØO1 e ØO2 dadas anteriormente e observando que varu0 D æ2 obtemos 5106 ECONOBOOKindb 164 23112010 071140 165 Extensões do modelo de regressão linear de duas variáveis Alguns dos aspectos da análise de regressão linear podem ser facilmente apresentados no âmbito da estrutura do modelo de regressão linear de duas variáveis que discutimos até o momento Primeiro consideraremos o caso da regressão que passa pela origem em que o intercepto Ø1 está ausente do modelo Depois passaremos para a questão das unidades de medida ou seja como as variáveis Y e X são medidas e se uma mudança nessas unidades afeta os resultados da regressão Por fim levare mos em questão a forma funcional do modelo de regressão linear Até agora consideramos modelos lineares nos parâmetros e nas variáveis Mas lembrese de que a teoria da regressão vista nos capítu los anteriores requer que apenas os parâmetros sejam lineares as variáveis podem ou não entrar li nearmente no modelo Ao considerarmos modelos lineares nos parâmetros mas não necessariamente nas variáveis mostraremos neste capítulo como os modelos de duas variáveis podem lidar com al guns problemas práticos interessantes Uma vez assimiladas essas ideias sua extensão para modelos de regressão múltipla será bem di reta como veremos nos Capítulos 7 e 8 61 A regressão que passa pela origem Há ocasiões em que a função de regressão populacional com duas variáveis assume a seguinte forma 611 Nesse modelo o intercepto está ausente ou é igual a zero daí a denominação regressão que passa pela origem Para ilustrar considere o modelo de formação de preços de ativos do inglês CAPM da teoria moderna de portfólio que na sua forma de prêmio de risco pode ser expresso como1 612 em que ERi taxa esperada de retorno do ativo i ERm taxa esperada de retorno sobre o portfólio de mercado representado por exemplo pelo índice de ações composto SP 500 1 veja levY haim SarneT marshall Portfolio and investment selection theory and practice englewood Cliffs n J Prenticehall inter national 1984 cap 14 Capítulo 6 ECONOBOOKindb 165 23112010 071141 166 Parte Um Modelos de regressão com equação única rf taxa de retorno livre de risco por exemplo o retorno das letras do Tesouro dos Estados Uni dos para 90 dias Øi coeficiente beta uma medida de risco sistemático risco que não pode ser eliminado por meio da diversificação Também uma medida da extensão em que a taxa de retorno do iésimo ativo acompanha o mercado Um Øi l implica título volátil ou agressivo ao passo que um Øi l é um título defensivo ou conservador Nota não confunda este Øi com o coeficiente angular da regressão de duas variáveis Ø2 Se o mercado de capitais funcionar com eficiência o modelo de formação de preços de ativos postula que o prêmio de risco esperado do iésimo ativo ERi rf é igual ao coeficiente Ø desse ativo multiplicado pelo prêmio de risco esperado de mercado ERm rf Se o CAPM for váli do teremos a situação da Figura 61 A linha mostrada é conhecida como linha do mercado de ativos Para fins práticos a Equação 612 muitas vezes é expressa como 613 ou 614 Esse último modelo é conhecido como Modelo do Mercado2 Se o CAPM for válido esperase que Æi seja zero Veja a Figura 62 Note que na Equação 614 a variável dependente Y é Ri rf e a variável explanatória X é Øi o coeficiente de volatilidade e não Rm rf Portanto para executar a regressão da Equação 614 é preciso estimar primeiro Øi que em geral é obtido por meio da linha característica como descreve o Exercício 55 Para mais detalhes veja o Exercício 828 Como o exemplo mostra às vezes a teoria subjacente determina que o termo de intercepto esteja ausente do modelo Outros casos em que o modelo com intercepto zero é mais adequado são o da hi pótese da renda permanente de Milton Friedman que afirma que o consumo permanente é proporcio nal à renda permanente a teoria da análise de custo em que se postula que o custo variável de produção é proporcional ao produto e algumas versões da teoria monetarista que consideram que a taxa de va riação dos preços a taxa de inflação é proporcional à taxa de variação da oferta de moeda 2 veja por exemplo harrinGTon diana r Modern portfolio theory and the capital asset pricing model a users guide englewood Cliffs n J Prenticehall 1983 p 71 fiGuRa 61 Risco sistemático 1 ERi rf Linha do mercado de ativos 0 βi ERi rf ECONOBOOKindb 166 23112010 071142 Capítulo 6 Extensões do modelo de regressão linear de duas variáveis 167 De que maneira estimamos modelos como a Equação 611 e que problemas especiais eles implicam Para responder a essas perguntas passemos à função de regressão amostral FRA da Equação 611 615 Aplicando o método dos MQO na Equação 615 obtemos as seguintes fórmulas para Ø2 e sua variância na Seção 6A1 do Apêndice 6A encontramos as demonstrações 616 617 em que æ2 é estimado por 618 É interessante comparar essas fórmulas com as obtidas quando o termo de intercepto está incluso no modelo 316 331 335 As diferenças entre os dois conjuntos de fórmulas são óbvias no modelo em que o termo de in tercepto está ausente usamos somas brutas de quadrados e multiplicações entre variáveis mas no modelo em que o intercepto está presente usamos somas ajustadas por meio da média de quadrados e multipli fiGuRa 62 Modelo do mercado da teoria de portfólio supondose Æi 0 βi Risco sistemático Prêmio de risco do ativo 0 Ri rf ECONOBOOKindb 167 23112010 071144 168 Parte Um Modelos de regressão com equação única cações entre variáveis Além disso os graus de liberdade para o cálculo de æ 2 são n 1 no primeiro caso e n 2 no segundo caso Por quê Embora o modelo sem intercepto ou com intercepto igual a zero possa ser adequado em al guns casos há vários aspectos que merecem ser observados Primeiro que é sempre zero para o modelo com o termo de intercepto o modelo convencional não precisa ser zero quando esse termo está ausente Em resumo não precisa ser igual a zero no caso das regressões que passam pela origem Segundo r2 o coeficiente de determinação apresentado no Capítulo 3 que é sempre não negativo no modelo convencional pode em certos casos ser negativo nos modelos em que o inter cepto está ausente Esse resultado anômalo decorre do fato de que o r2 apresentado no Capítulo 3 assume explicitamente que o termo de intercepto está incluído no modelo Portanto o r2 calculado de forma convencional pode não ser adequado para modelos em que a regressão passa pela origem3 Cálculo do r 2 para modelos que passam pela origem Como acabamos de observar e como será discutido na Seção 6Al do Apêndice 6A o r2 convencio nal apresentado no Capítulo 3 não é adequado para as regressões que não contêm o termo de inter cepto Mas é possível calcular para esses modelos o que é conhecido como r2 bruto e definido por 619 Nota essa soma dos quadrados e essa multiplicação de variáveis são brutas não foram corrigidas pela média Embora esse r2 bruto atenda à relação 0 r2 l não pode ser comparado diretamente ao valor do r2 convencional Por esse motivo alguns autores não informam o valor do r2 no caso dos modelos de regressão em que o intercepto é zero Devido às características especiais desse modelo é preciso ter muito cuidado ao usálo A menos que exista uma expectativa a priori muito forte seria aconselhável aterse ao modelo con vencional em que o intercepto está presente Isso tem uma dupla vantagem Primeiro se o termo de intercepto estiver incluído no modelo mas revelarse estatisticamente desprezível isto é esta tisticamente igual a zero para todos os fins práticos teremos uma regressão que passa pela ori gem4 Segundo e mais importante se de fato existir um intercepto no modelo mas insistirmos em ajustar uma regressão que passa pela origem estaremos cometendo um erro de especificação Falaremos mais sobre isso no Capítulo 75 exeMPlo 61 a Tabela 61 apresenta dados relativos às taxas do excesso de retorno Yt de um índice de 104 ações do setor de bens de consumo cíclico e o excesso de retorno Xt do índice do mercado de ações como um todo no reino Unido durante o período 19801999 para um total de 240 observações5 excesso de retorno referese ao excedente de retorno em relação a um ativo livre de risco veja o modelo CaPm Continua 3 Para uma discução adicional veja aiGner dennis J Basic econometrics englewood Cliffs n J Prentice hall 1971 p 8588 4 henri Theil destaca que se o intercepto estiver de fato ausente o coeficiente angular pode ser estimado com precisão muito maior do que quando o intercepto está incluído veja sua Introduction to econometrics englewood Cliffs n J Prentice hall 1978 p 76 veja também o exemplo numérico a seguir 5 esses dados obtidos originalmente a partir do banco de dados dataStream foram reproduzidos por hei J Christian et al Econometrics methods with applications in business and economics oxford reino Unido oxford University Press 2004 ECONOBOOKindb 168 23112010 071144 Capítulo 6 Extensões do modelo de regressão linear de duas variáveis 169 Tabela 61 Continua ECONOBOOKindb 169 23112010 071145 170 Parte Um Modelos de regressão com equação única Tabela 61 Continuação ECONOBOOKindb 170 23112010 071147 Capítulo 6 Extensões do modelo de regressão linear de duas variáveis 171 exeMPlo 61 Continuação Primeiro ajustamos o modelo 613 aos dados Usando o software eviews6 obtivemos os seguintes resultados da regressão apresentados no formato padrão do eviews variável dependente Y método mínimos quadrados amostra 1980m01 1999m12 observações incluídas 240 Coeficiente Erro Padrão testatístico X 1155512 0074396 1553200 00000 R2 0500309 Var dependente padrão 0499826 R2 ajustado 0500309 7849594 Regressão de SE 1972853 Soma dos resíduos2 Discutiremos esta estatística no Capítulo 12 Veja Capítulo 7 Probabilidade Var dependente SD Stat DurbinWatson 5548786 7358578 Como esses resultados mostram o coeficiente angular que é o coeficiente beta é alta mente significativo pois seu valor p é extremamente pequeno a interpretação aqui é que se o excesso de retorno do mercado aumentar em um 1 ponto percentual o excesso de re torno do índice do setor de bens de consumo aumenta em cerca de 115 ponto percentual o coeficiente angular não é apenas significativo mas também é significativamente maior que 1 você consegue verificar isso Se um coeficiente beta é maior que 1 dizse que um ativo como esse aqui um portfólio de 104 ações é volátil varia mais do que proporcionalmente ao índice do mercado de ações como um todo mas essa conclusão não deve surpreender pois neste exemplo consideramos ações do setor de bens de consumo cíclico como eletrodo mésticos automóveis produtos têxteis e equipamentos esportivos Se ajustarmos o modelo 614 obteremos os seguintes resultados variável dependente Y método mínimos quadrados amostra 1980m01 1999m12 observações incluídas 240 Coeficiente Erro Padrão testatístico C 0447481 0362943 1171128 0075386 1232924 0362943 1553500 00000 R2 0503480 0499826 R2 ajustado 0501394 7849594 Regressão de SE 1972853 Soma dos resíduos2 festatística Probabilidade Var dependente SD Estat DurbinWatson Prob Estatística F X 5542759 7311877 2413363 Var dependente padrão Com base nesses resultados vemos que o intercepto não é estatisticamente diferente de zero embora o coeficiente angular o coeficiente beta seja altamente significativo em ter mos estatísticos isso sugere que o modelo de regressão que passa pela origem ajustase bem aos dados além disso estatisticamente não existe diferença no valor do coeficiente angular nos dois modelos note que o erro padrão do coeficiente angular no modelo de regressão que passa pela origem é ligeiramente menor do que aquele no modelo em que o intercepto está presente o que sustenta o argumento de Theil mencionado na nota de rodapé 4 mes mo assim o coeficiente angular é estatisticamente maior que 1 mais uma vez confirmando que os retornos das ações do setor de bens de consumo cíclico são voláteis a propósito note que o valor de r 2 para o modelo de regressão que passa pela origem deve ser visto com certa reserva pois a fórmula tradicional de r 2 não se aplica a esses mode los no entanto o pacote estatístico eviews apresenta rotineiramente o valor padrão de r 2 inclusive para esses modelos ECONOBOOKindb 171 23112010 071148 172 Parte Um Modelos de regressão com equação única 62 Escalas e unidades de medida Para entender as ideias desenvolvidas nesta seção considere os dados da Tabela 62 que se referem ao investimento interno privado bruto dos Estados Unidos IIPB e ao produto interno bruto PIB em bilhões e em milhões de dólares encadeados de 2000 Suponha que na regressão do IIPB contra o PIB um pesquisador use dados em bilhões de dólares enquanto outro expressa as mesmas variáveis em milhões de dólares Os resultados da regressão serão iguais nos dois casos E se não forem que resultados deveriam ser usados Re sumindo as unidades em que o regressando e os regressores são medidos influenciam os resul tados da regressão Em caso afirmativo qual o caminho sensato a seguir para escolher as unidades de medida na análise de regressão Para responder a essas perguntas procederemos siste maticamente Seja 621 em que Y IIPB e X PIB Definindo 622 623 em que w1 e w2 são constantes denominadas fatores de escala w1 pode ser igual ou diferente de w2 As Equações 622 e 623 deixam claro que Yi e Xi são Yi e Xi com outra escala Se Yi e Xi forem medidos em bilhões de dólares e desejarmos expressálos em milhões de dólares teremos Yi 1000 Yi e Xi 1000 Xi em que w1 w2 1000 Considere agora a regressão que utiliza as variáveis Yi e Xi 624 Tabela 62 Investimento interno privado bruto e PIB dos Estados Unidos 19902005 bilhões de dólares encadeados de 2000 exceto quando notificado dados trimestrais ajustadas sazonalmente Fonte Economic Report of the President Tabela B2 p328 ano iiPbbl iiPbM Pibb PibM 1990 8866 8866000 71125 71125000 1991 8291 8291000 71005 71005000 1992 8783 8783000 73366 73366000 1993 9535 9535000 75327 75327000 1994 10423 10423000 78355 78355000 1995 11096 11096000 80317 80317000 1996 12092 12092000 83289 83289000 1997 13206 13206000 87035 87035000 1998 14550 14550000 90669 90669000 1999 15763 15763000 94703 94703000 2000 16790 16790000 98170 98170000 2001 16294 16294000 98907 98907000 2002 15446 15446000 100488 100488000 2003 15969 15969000 103010 103010000 2004 17139 17139000 107035 107035000 2005 18420 18420000 110486 110486000 Nota IIPBBL investimento interno privado bruto em bilhões de dólares de 2000 IIPBM investimento interno privado bruto em milhões de dólares de 2000 PIBB produto interno bruto em bilhões de dólares de 2000 PIBM produto interno bruto em milhões de dólares de 2000 ECONOBOOKindb 172 23112010 071150 Capítulo 6 Extensões do modelo de regressão linear de duas variáveis 173 Queremos encontrar a relação entre os seguintes pares 1 Ø1 e Ø1 2 Ø2 e Ø2 3 var Ø1 e var Ø1 4 var Ø2 e var Ø2 5 æ 2 e æ2 6 r2 xy e r2 xy Da teoria dos mínimos quadrados sabemos veja o Capítulo 3 que 625 626 627 628 629 Aplicando o método dos MQO à Equação 624 obtemos de forma similar 6210 6211 6212 6213 6214 Com base nesses resultados é fácil estabelecer as relações entre os dois conjuntos de estimativas dos parâmetros Tudo o que precisamos é recordar as seguintes definições Y i w1Yi ou y i w1yi X i w2Xi ou xi w2xi ui w1u i Y w1Y e X w2 X Usando essas definições é fácil verificar que 6215 6216 6217 6218 ECONOBOOKindb 173 23112010 071153 174 Parte Um Modelos de regressão com equação única 6219 6220 Esses resultados deixam claro que dados os resultados da regressão baseados em uma escala de medida é possível derivar resultados baseados em outra escala de medida uma vez que os fatores de escala os w sejam conhecidos Entretanto na prática devese escolher as unidades de medida com bom senso não faz muito sentido trabalhar com todos aqueles zeros ao expressar números em milhões ou bilhões de dólares Os resultados de 6215 a 6220 permitem deduzir com facilidade alguns casos especiais Por exemplo se w1 w2 isto é se os fatores de escala são idênticos o coeficiente angular e seu erro pa drão não são afetados quando passamos da escala Yi Xi para Yi Xi o que deveria ser óbvio Contudo o intercepto e seu erro padrão são ambos multiplicados por w1 Mas se a escala de X não é alterada w2 1 e a escala de Y for alterada por um fator w1 o coeficiente angular e o do intercepto e seus respectivos erros padrão são multiplicados pelo mesmo fator w1 Por fim se a escala de Y per manece inalterada w2 1 enquanto a escala de X é alterada pelo fator w2 o coeficiente angular e seu erro padrão são multiplicados pelo fator 1 w2 mas o coeficiente do intercepto e seu erro padrão não são afetados No entanto é preciso observar que a transformação da escala Y X para a Y X não afeta as propriedades dos estimadores de MQO examinadas nos capítulos anteriores exeMPlo 62 Relação entre IIPB e PIB nos Estados Unidos 19902005 Para reforçarmos os resultados teóricos que acabamos de apresentar voltemos aos dados da Tabela 62 e examinemos os seguintes resultados os números entre parênteses são os erros padrão estimados as duas variáveis estão expressas em bilhões de dólares 6221 as duas variáveis expressas em milhões de dólares 6222 note que o intercepto assim como o erro padrão são 1000 vezes o valor correspondente na regressão 6221 note que w1 1000 quando passamos de bilhões para milhões de dólares mas o coeficiente angular e seu erro padrão não se alteram conforme a teoria iiPb em bilhões de dólares e Pib em milhões de dólares 6223 Como esperado o coeficiente angular assim como o erro padrão é 11000 seu valor na equação 6221 já que somente a escala de X ou Pib foi alterada iiPb em milhões de dólares e Pib em bilhões 6224 observe mais uma vez que tanto o intercepto quanto o coeficiente angular e seus respectivos erros padrão são 1000 vezes seus valores na equação 6221 de acordo com nossos resul tados teóricos Continua ECONOBOOKindb 174 23112010 071155 Capítulo 6 Extensões do modelo de regressão linear de duas variáveis 175 exeMPlo 62 Continuação note que em todas as regressões apresentadas o valor de r 2 permaneceu o mesmo o que não surpreende porque esse valor não varia com alterações na unidade de medida uma vez que é um número puro ou sem dimensão uma palavra sobre a interpretação Como o coeficiente angular Ø2 é apenas a taxa de variação ele é medido nas unidades da razão Unidades da variável dependente Unidades da variável esplanatória Na regressão 6221 a interpretação do coeficiente angular 02535 dáse da seguinte maneira se o PIB varia em uma unidade de um bilhão de dólares o investimento interno privado bruto vai variar em média 02535 bilhão de dólares Na regressão 6223 uma variação de uma unidade no PIB de um milhão de dólares levará a uma variação média de 00002535 bilhão de dólares no IIPB Obvia mente os dois resultados são idênticos quanto aos efeitos do PIB sobre o IIPB apenas estão expres sos em unidades de medida diferentes 63 Regressão com variáveis padronizadas Na seção anterior vimos que as unidades em que regressando e regressores estão expressas afetam a interpretação dos coeficientes de regressão Isso pode ser evitado se nos dispusermos a expressar regressando e regressor como variáveis padronizadas Dizse que uma variável é padronizada se subtrairmos o valor médio da variável de seus valores individuais e dividirmos a diferença pelo desvio padrão dessa variável Assim na regressão de Y contra X se redefinirmos essas variáveis como 631 632 em que Y média amostral de Y SY desvio padrão amostral de Y X média amostral de X SX é desvio padrão amostral de X as variáveis e Y i e X i são chamadas variáveis padronizadas Uma propriedade interessante das variáveis padronizadas é que sua média é sempre zero e seu desvio padrão é sempre 1 Para uma demonstração veja a Seção 6A2 do Apêndice 6 Em consequência não importa em que unidades expressemse o regressando e os regressores Portanto em vez de calcularmos a regressão padrão bivariada Yi Ø1 Ø2Xi ui 633 podemos estimar a regressão em termos de variáveis padronizadas como Y i D Ø 1 C Ø 2 X i C u i 634 D Ø 2 X i C u i 635 uma vez que é fácil mostrar que em uma regressão envolvendo regressando e regressores padroni zados o termo de intercepto é sempre zero6 Os coeficientes de regressão das variáveis padronizadas 6 lembrese da equação 317 que o intercepto valor médio da variável dependente coeficiente angular o valor médio do regressor mas para as variáveis padronizadas os valores médios da variável dependente e do regressor são zero Portanto o valor do intercepto é zero ECONOBOOKindb 175 23112010 071157 176 Parte Um Modelos de regressão com equação única denotados por Ø1 e Ø2 são conhecidos na literatura específica como coeficientes beta7 Casualmente note que 635 é uma regressão que passa pela origem Como interpretamos os coeficientes beta A interpretação é a seguinte se o regressor padroniza do aumenta em média em um desvio padrão o regressando padronizado aumenta em Ø2 unidades de desvio padrão Ao contrário do modelo tradicional na Equação 633 medimos o efeito não nos termos das unidades originais em que Y e X foram expressos mas em unidades de desvio padrão Para mostrarmos a diferença entre as Equações 633 e 635 voltemos ao exemplo do IIPB e do PIB examinado na seção anterior Os resultados de 6221 são repetidos aqui por conveniência 636 em que IIPB e PIB são medidos em bilhões de dólares Os resultados correspondentes à Equação 635 são apresentados a seguir as variáveis marcadas por um asterisco são variáveis padronizadas 637 Sabemos como interpretar a Equação 636 se o PIB aumentar em média em um dólar o IIPB aumentará em média cerca de 25 centavos E a Equação 637 Nesse caso a interpretação é que se o PIB padronizado aumentar em um desvio padrão em média o IIPB padronizado aumentará em cerca de 098 desvio padrão Qual a vantagem do modelo padronizado de regressão em relação ao tradicional A vanta gem é mais evidente quando há mais de um regressor um tópico que será abordado no Capítu lo 7 Ao padronizarmos os regressores colocamos todos em uma mesma base e portanto podemos comparálos diretamente Se o coeficiente de um regressor padronizado for maior que o de outro regressor padronizado que consta do mesmo modelo o segundo contribui mais em relação à explicação do regressando do que o primeiro Em outras palavras podemos usar os coeficientes beta como medida da força relativa dos vários regressores Isso será aprofun dado nos próximos dois capítulos Antes de deixarmos este tópico façamos duas observações Primeiro no caso da regressão padro nizada 637 não apresentamos o valor de r2 porque esta é uma regressão que passa pela origem para a qual não se aplica o habitual r2 como destacamos na Seção 61 Segundo há uma relação in teressante entre os coeficientes Ø do modelo convencional e os coeficientes beta Para o caso bivariado a relação é a seguinte 638 em que Sx desvio padrão amostral do regressor X e Sy desvio padrão amostral do regressando Portanto é possível fazer cruzamentos entre os coeficientes Ø e beta se conhecermos o desvio padrão amostral do regressor e do regressando Veremos no próximo capítulo que essa relação tam bém é válida no caso da regressão múltipla Deixamos ao leitor a tarefa de verificar o que ocorre com a Equação 638 em nosso exemplo ilustrativo 64 Formas funcionais dos modelos de regressão Como mencionado no Capítulo 2 este livro trata principalmente de modelos lineares nos parâmetros eles podem ou não ser lineares nas variáveis Nas próximas seções trataremos alguns modelos de 7 não confunda estes coeficientes beta com o coeficiente beta da teoria financeira ECONOBOOKindb 176 23112010 071158 Capítulo 6 Extensões do modelo de regressão linear de duas variáveis 177 regressão bastante usados que podem ser não lineares nas variáveis mas o são nos parâmetros ou que podem ser tornados lineares por meio de transformações das variáveis Em particular discutiremos os seguintes modelos de regressão 1 Modelo loglinear 2 Modelos semilogarítmicos 3 Modelos recíprocos 4 Modelo recíproco logarítmico Examinaremos os aspectos especiais de cada modelo quando seu uso é adequado e como são estimados Cada modelo será ilustrado por exemplos 65 Como medir a elasticidade o modelo loglinear Considere o seguinte modelo conhecido como modelo de regressão exponencial 651 que também pode ser expresso como8 652 em que ln logaritmo natural logaritmo com base e em que e 27189 Se escrevermos a Equação 652 como 653 em que Æ ln Ø1 este modelo é linear nos parâmetros Æ e Ø2 linear nos logaritmos das variáveis Y e X e pode ser estimado mediante uma regressão de MQO Devido a essa linearidade tais modelos são denominados modelos loglog duplolog ou loglineares Se as hipóteses do modelo clássico de regressão linear forem atendidas os parâmetros da Equa ção 653 podem ser estimados pelo método dos mínimos quadrados ordinários sendo 654 em que e Y i 1n Yi e X i 1n Xi Os estimadores de MQO Æ e Ø2 obtidos serão os melhores estimadores lineares não viesados de Æ e Ø2 respectivamente 8 observe estas propriedades dos logaritmos 1 lnAB ln A ln B 2 lnAB ln A ln B e 3 ln ak k ln A supondo que A e B sejam positivos e k uma constante 9 na prática podemos usar logaritmos comuns isto é logaritmos de base 10 a relação entre logaritmo natural e logaritmo comum é lne X 23026log10 X Por convenção ln significa logaritmo natural e log logaritmo de base 10 não há necessidade de explicitar os subscritos e e 10 fiGuRa 63 Modelo de elasticidade constante a Preço Quantidade demandada Y b Log do preço Log da quantidade demandada ln Y ln X X Y b1X i b 2 β β lnY ln 1 2 ln Xi β β ECONOBOOKindb 177 23112010 071159 178 Parte Um Modelos de regressão com equação única Um aspecto atraente do modelo loglog que o tornou muito difundido nos trabalhos aplicados é que o coeficiente angular Ø2 mede a elasticidade de Y em relação a X isto é a variação percentual de Y cor respondente a uma dada variação percentual pequena em X10 Se Y representa a quantidade demandada de um bem e X seu preço unitário Ø2 mede a elasticidade preço da demanda um parâmetro de conside rável interesse econômico Se a relação entre quantidade demandada e preço for como a da Figura 63a a transformação loglog da Figura 63b mostrará a elasticidade preço estimada Ø2 Podemos observar dois aspectos especiais do modelo loglinear ele pressupõe que o coeficiente da elasticidade entre Y e X Ø2 permaneça constante por quê daí o nome alternativo modelo de elasti cidade constante11 Em outras palavras como mostra a Figura 63b a variação em ln Y por unidade de variação em ln X isto é a elasticidade Ø2 permanece a mesma com qualquer ln X utilizado para medir a elasticidade Outro aspecto desse modelo é que embora Æ e Ø2 sejam estimativas não viesadas de Æ e Ø1 Ø2 o parâmetro que entra no modelo original ao ser estimado como Ø1 antilog Æ é um esti mador viesado Contudo na maioria dos problemas práticos o termo de intercepto é de importância secundária e não é necessário preocuparse em obter sua estimativa não viesada12 No modelo de duas variáveis o modo mais simples de decidir se o modelo loglinear ajustase aos dados é traçar o diagrama de dispersão de ln Yi contra ln Xi e ver se os pontos aproximamse de uma reta como na Figura 63b Atenção o leitor deve saber a diferença entre variação percentual e variação de pontos percentuais Por exemplo a taxa de desemprego normalmente é expressa na forma percentual por exemplo de 6 Se essa taxa for para 8 dizemos que a variação em pontos percentuais na taxa de desemprego é 2 enquanto a variação percentual na taxa de desemprego será de 8 66 ou cerca de 33 Cuidado ao lidar com variações percentuais e de pontos percentuais pois são dois conceitos muito diferentes13 exeMPlo 63 Despesas com bens duráveis em relação às despesas totais de consumo pessoal a Tabela 63 apresenta dados relativos às despesas totais de consumo pessoal deSPTCP despesas com bens duráveis deSPdUr com bens não duráveis deSPnaodUr e despesas com serviços deSPServ todas medidas em bilhões de dólares de 200013 Continua 10 o coeficiente de elasticidade em notação de cálculo é definido como dYYdXX dYdXXY os leito res familiarizados com o cálculo diferencial verão prontamente que Ø2 é de fato o coeficiente de elasticidade Nota técnica o leitor que gosta de cálculo observará que dln XdX 1X ou dln X dXX isto é para variações infinitesimais veja o operador diferencial d a variação em ln X é igual à variação relativa ou propor cional em X Contudo na prática se a variação de X for pequena esta relação poderá ser escrita como variação ln X variação relativa em X em que significa aproximadamente Para pequenas variações o leitor deve observar estes termos que aparecerão com frequência 1 variação absoluta 2 variação re lativa ou proporcional e 3 varia ção percentual ou taxa de crescimento percentual assim Xt Xt1 representa a variação absoluta Xt Xt1Xt1 XtXt1 1 é a variação relativa ou proporcional e Xt Xt1 Xt1100 é a variação porcentual ou taxa de crescimento Xt e Xt1 são respectivamente os valores corrente e anterior da variável X 11 Um modelo de elasticidade constante mostra uma variação constante da receita total para uma dada variação percentual do preço qualquer que seja o nível absoluto do preço o leitor deveria comparar este resultado com as condições de elasticidade implícitas em uma função linear de demanda simples Yi Ø1 Ø2Xi ui Contudo uma função linear simples resulta em uma variação constante na quantidade por unidade de variação no preço Compare com as implicações do modelo loglinear no caso de uma dada variação no preço 12 em relação à natureza do viés e o que pode ser feito a respeito dele veja GoldberGer arthur S Topics in regression analysis nova York macmillan 1978 p 120 13 os bens duráveis incluem veículos motorizados e suas peças móveis e eletrodomésticos os bens não duráveis incluem alimentação vestuá rio combustível automotivo óleo combustível e carvão e os serviços incluem gastos com moradia luz e gás transporte e saúde ECONOBOOKindb 178 23112010 071200 Capítulo 6 Extensões do modelo de regressão linear de duas variáveis 179 exeMPlo 63 Continuação Suponha que queiramos encontrar a elasticidade das despesas com bens duráveis em relação às despesas totais de consumo pessoal representando graficamente o ln das despe sas com bens duráveis contra o ln das despesas totais de consumo você verá que a relação entre as duas variáveis é linear Portanto o modelo loglog pode ser apropriado os resulta dos da regressão são os seguintes 655 em que indica que o valor p é extremamente pequeno Tabela 63 Despesa pessoal total e categorias em bilhões de dólares encadeados de 2000 Fonte Economic Report of the President 1999 Quadro B17 p 34 anoTrimestre DeSPSeRV DeSPDuR DeSPNaoDuR DeSPTCP 2003i 41433 9714 20725 71849 2003ii 41613 10098 20842 72493 2003iii 41907 10496 21230 73529 2003iv 42202 10514 21325 73943 2004i 42682 10670 21553 74798 2004ii 43084 10714 21643 75344 2004iii 43415 10939 21840 76071 2004iv 43774 11103 22131 76871 2005i 43953 11168 22415 77394 2005ii 44200 11508 22684 78198 2005iii 44545 11759 22876 78953 2005iv 44767 11379 23096 79102 2006i 44945 11905 23428 80038 2006ii 45354 11903 23511 80550 2006iii 45666 12088 23601 81112 Nota DESPSERV despesas com serviços DESPDUR despesas com bens duráveis DESPNAODUR despesas com bens não duráveis DESPTCP despesas totais de consumo pessoal Como esses resultados sugerem a elasticidade de deSPdUr em relação à deSPTCP é de cerca de 163 sugerindo que quando as despesas totais aumentam em 1 as despesas com bens duráveis au mentam em cerca de 163 em média as despesas com bens duráveis são muito sensíveis a variações nas despesas totais de consumo pessoal essa é uma das razões pelas quais os produtores de bens duráveis acompanham atentamente as variações na renda e nas despesas de consumo pessoal no exercício 618 pedese que o leitor faça um estudo semelhante para as despesas com bens não duráveis e com serviços 66 Modelos semilogarítmicos loglin e linlog Como medir a taxa de crescimento o modelo loglin Economistas homens de negócios e governos frequentemente estão interessados em conhecer a taxa de crescimento de algumas variáveis econômicas como a população o PNB a oferta de moeda o emprego a produtividade e o déficit comercial Suponha que queiramos conhecer a taxa de crescimento das despesas pessoais com serviços para os dados fornecidos na Tabela 63 Denotemos por Yt as despesas reais com serviços no período t e por Y0 o valor inicial dessas despesas o valor ao fim do quarto trimestre de 2002 Recordando a conhecida fórmula dos juros compostos temos 661 ECONOBOOKindb 179 23112010 071201 180 Parte Um Modelos de regressão com equação única em que r é a taxa de crescimento composta ou geométrica ao longo do tempo de Y Usando o loga ritmo natural da Equação 661 podemos escrever 662 Agora considerando 663 664 podemos escrever a Equação 662 como 665 Incluindo o termo de erro na Equação 665 obtemos14 666 Esse modelo é semelhante a qualquer outro de regressão linear no sentido de os parâmetros Ø1 e Ø2 serem lineares A única diferença é que o regressando é o logaritmo de Y e o regressor é o tempo que assumirá os valores l 2 3 etc Modelos como a Equação 666 são chamados de modelos semilogarítmicos porque apenas uma das variáveis neste caso o regressando está em forma logarítmica Para fins de descrição um modelo em que o regressando aparece em forma logarítmica é chamado de modelo loglin Mais adiante veremos um modelo em que o regressando é linear mas os regressores é são logarítmicos e é conhecido como modelo linlog Antes de apresentarmos os resultados da regressão examinemos as propriedades do modelo 665 Neste o coeficiente angular mede a variação proporcional ou relativa constante em Y para uma dada variação absoluta no valor do regressor neste caso a variável t isto é15 667 Se multiplicarmos a variação relativa de Y por 100 a Equação 667 nos dará a variação percen tual ou a taxa de crescimento de Y para uma variação absoluta em X o regressor Isto é 100 multipli cado por Ø2 nos dá a taxa de crescimento de Y 100 multiplicado por Ø2 é conhecido na literatura específica como a semielasticidade de Y em relação a X Pergunta para obter a elasticidade o que devemos fazer16 exeMPlo 64 A taxa de crescimento das despesas com serviços Para ilustrar o modelo de crescimento 666 considere os dados relativos a despesas com serviços da Tabela 63 os resultados da regressão são os seguintes 668 Nota deSPServ representa os gastos com serviços e indica que o valor p é extremamente pequeno Continua 14 acrescentamos o termo de erro porque a fórmula dos juros compostos não funciona com precisão na Seção 68 explicaremos por que se acrescenta o termo de erro após a transformação logarítmica 15 Usando cálculo diferencial podemos demonstrar que Ø2 din YdX 1YdYdX dYYdX que não é outra coisa senão a equação 667 Para pequenas variações em Y e X esta relação pode ser aproximada por Nota aqui X t 16 veja no apêndice 6a4 diversas fórmulas de crescimento ECONOBOOKindb 180 23112010 071203 Capítulo 6 Extensões do modelo de regressão linear de duas variáveis 181 exeMPlo 64 Continuação a interpretação da equação 668 em um período que vai do 1 trimestre de 2003 ao 3 trimestre de 2006 implica que as despesas com serviços aumentaram a uma taxa trimes tral de 0705 aproximadamente igual a uma taxa de crescimento anual de 282 Como 83226 log de deSPServ no início do período estudado ao tomarmos seu antilogaritmo obtemos 411596 bilhões de como o valor inicial de deSPServ o valor ao fim do quarto trimestre de 2003 a linha de regressão da equação 668 está esboçada na Fi gura 64 fiGuRa 64 0 832 2 4 6 Tempo 8 10 12 14 16 834 836 Log das despesas com serviços 840 844 842 838 Taxas de crescimento instantâneas versus taxas compostas O coeficiente da variável de tendência do modelo de crescimento 666 Ø2 dá a taxa de crescimento instantânea em um ponto do tempo não a composta ao longo de um período de tempo Mas esta última pode ser obtida com facilidade a partir da Equação 664 tomandose o antilogaritmo do Ø2 estimado subtraindoo de um e multiplicando a diferença por 100 Em nosso exemplo o coeficiente angular estimado é 000705 Portanto antilog 000705 1 000708 ou 0708 Logo neste exemplo a taxa de crescimento composta das despesas com serviços foi de cerca de 0708 por trimestre que é ligeiramente mais alta do que a de crescimento instantânea de 0705 A diferença obviamente se deve ao efeito da composição Modelo de tendência linear Em vez de estimarem o modelo 666 os pesquisadores às ve zes estimam o seguinte modelo 669 Ou seja em vez de fazerem a regressão do log de Y contra o tempo fazem a regressão de Y contra o tempo em que Y é o regressando em questão Esse modelo é conhecido como modelo de tendência linear e a variável de tempo t é conhecida como variável de tendência Se o coeficiente angular na Equação 669 for positivo Y apresentará uma tendência crescente se for negativo Y terá tendên cia decrescente No caso das despesas com serviços que vimos anteriormente o resultado do ajustamento do mo delo de tendência linear 669 é o seguinte 6610 Em contraste com a Equação 668 a interpretação da Equação 6610 é a seguinte entre o primeiro trimestre de 2003 e o terceiro trimestre de 2006 as despesas com serviços aumentaram em média à taxa absoluta atenção não taxa relativa de cerca de 30 bilhões por trimestre As despesas com serviços registraram uma tendência crescente A escolha entre um modelo de taxa de crescimento 668 e modelo de tendência linear 6610 dependerá de estarmos interessados na variação relativa ou absoluta das despesas com serviços ECONOBOOKindb 181 23112010 071204 182 Parte Um Modelos de regressão com equação única embora para fins de comparação em geral é a variação relativa que apresenta maior relevância Note que não podemos comparar os valores de r2 dos modelos 668 e 6610 porque os regressandos dos dois modelos são diferentes Mostraremos no Capítulo 7 como comparar os r2 de modelos como 668 e 6610 o modelo linlog Diferentemente do modelo de crescimento que acabamos de discutir no qual estávamos interessados em conhecer o crescimento percentual de Y para uma variação absoluta de X suponha agora que quei ramos conhecer a variação absoluta de Y dada uma variação percentual de X Um modelo que poderia atingir esse propósito seria 6611 Para fins descritivos denominamos esse tipo de modelo linlog Vamos agora interpretar o coeficiente angular Ø2 17 Como sempre A segunda expressão seguese do fato de que uma variação no logaritmo de um número é uma varia ção relativa Simbolicamente temos 6612 em que como de costume 1 denota uma pequena variação A Equação 6612 pode ser escrita de modo equivalente como 6613 Essa equação indica que a variação absoluta de Y 1Y é igual ao coeficiente angular multiplicado pela variação relativa em X Se esta última for multiplicada por 100 a Equação 6613 fornecerá a variação absoluta de Y para uma variação percentual de X Se 1XX variar em 001 unidade ou 1 a varia ção absoluta de Y será de 001Ø2 se em uma aplicação obtermos Ø2 500 a variação absoluta de Y será de 001 500 50 Portanto quando estimar a regressão 6611 por meio dos MQO não se esqueça de multiplicar o coeficiente angular estimado por 001 ou de dividilo por 100 Se você não tiver isso em mente a interpretação dos resultados de uma aplicação será tremendamente equivocada A questão é quando um modelo linlog como a Equação 6611 é útil Uma aplicação interes sante são os chamados modelos de despesas de Engel assim denominados em homenagem ao esta tístico alemão Ernst Engel 18211896 Veja o Exercício 610 Engel postulou que o total das despesas com alimentação tende a aumentar em progressão aritmética enquanto as despesas totais aumentam em progressão geométrica18 17 novamente usando o cálculo diferencial temos portanto 18 veja mUKherJee Chandan WhiTe howard WUYTS marc Econometrics and data analisys for developing countries londres routledge 1998 p 158 esta citação é atribuída a WorKinG h Statistical laws of family expenditure Journal of lhe American Slatistical Associalion 1943 v 38 p 4356 ECONOBOOKindb 182 23112010 071205 Capítulo 6 Extensões do modelo de regressão linear de duas variáveis 183 exeMPlo 65 Para ilustrar o modelo linlog voltemos às despesas com ali mentação na Índia o exemplo 32 lá ajustamos um modelo linear nas variáveis como primeira aproximação mas se repre sentarmos os dados graficamente obteremos o diagrama de dispersão da Figura 65 Como a figura sugere as despesas com alimentação aumentam mais lentamente do que as despe sas totais o que parece confirmar a lei de engel os resultados do ajustamento de um mode lo linlog a estes dados são os seguintes 6614 Nota denota um valor p extremamente pequeno fiGuRa 65 300 100 400 500 600 Despesas totais em rúpias 700 800 900 200 300 Despesas com alimentação em rúpias 500 700 600 400 interpretado como anteriormente o coeficiente angular de cerca de 257 significa que um aumento de 1 em média nas despesas totais leva a um aumento de cerca de 257 rupias nas despesas com alimentos das 55 famílias incluídas na amostra Nota dividimos o coefi ciente estimado por 100 antes de prosseguir note que se você quiser calcular o coeficiente de elasticidade dos modelos loglin ou linlog deve fazêlo com base no coeficiente de elasticidade apresentado anteriormente ou seja evidentemente uma vez conhecida a forma funcional de um mo delo podemos calcular as elasticidades aplicando a definição anterior mais adiante a Tabela 66 resumirá os coeficien tes de elasti cidade dos vários modelos Devese ressaltar que às vezes a transformação logarítmica é usada para reduzir a heterocedasti cidade assim como a assimetria skewness Veja o Capítulo 11 Uma característica comum de muitas variáveis econômicas é que elas são assimétricas positivas por exemplo a distribuição de tamanho das empresas ou a distribuição da renda ou da riqueza e heterocedásticas Uma transformação loga rítmica de tais variáveis reduz tanto a assimetria quanto a heterocedasticidade É por esse motivo que economistas do trabalho usam logaritmos dos salários na regressão dos salários por exemplo contra escolaridade medida em anos de estudo 67 Modelos recíprocos Os modelos do tipo a seguir são conhecidos como recíprocos 671 ECONOBOOKindb 183 23112010 071206 184 Parte Um Modelos de regressão com equação única Embora este modelo seja não linear na variável X porque entra de modo inverso ou recíproco o modelo é linear em Ø1 e Ø2 e portanto é um modelo de regressão linear19 Este modelo apresenta os seguintes aspectos quando X aumenta indefinidamente o termo Ø21X tende a zero nota Ø2 é uma constante e Y aproximase do valorlimite ou assintótico Ø1 Portanto modelos como 671 trazem embutido um valor assíntota ou limite que a variável dependente assumirá quando o valor da variável X aumentar indefinidamente20 A Figura 66 apresenta algumas das formas prováveis da curva correspondente à Equação 671 exeMPlo 66 Para ilustrar a Figura 66a considere os dados da Tabela 64 São dados de corte transver sal relativos à mortalidade infantil e algumas outras variáveis em 64 países Por enquanto vamos examinar as variáveis mortalidade infantil mi e Pnb per capita que estão representa das graficamente na Figura 67 Como se vê essa figura assemelhase à Figura 66a à medida que o Pnb per capita au menta seria de esperar uma redução da mortalidade infantil porque as pessoas podem ter maiores gastos com saúde mantendo tudo o mais constante mas essa relação não é uma linha reta quando o Pnb per capita aumenta inicialmente há uma redução substancial da mortalidade infantil mas a queda amenizase com o aumento contínuo do Pnb per capita fiGuRa 67 Relação entre mortalidade infantil e PNB per capita em 64 países 00 5000 10000 PNB 15000 20000 100 200 Mortalidade infantil e PNB MI 300 400 Continua 19 Se considerarmos X i 1xi então a equação 671 é linear nos parâmetros bem como as variáveis Yi e Xi 20 o coeficiente angular de 671 é dYdX Ø21X2 implicando que se Ø2 for positivo o coeficiente angular é sempre negativo e se Ø2 for negativo o coeficiente angular será sempre positivo veja as Figuras 66a e 66c respectivamente fiGuRa 66 O modelo recíproco Y D Ø1 C Ø2 1 X Y X 0 b20 β β10 β 1 a β Y X 0 b20 β b1 c β Y X 0 b20 β b10 β b1 b β b2 β b1 β ECONOBOOKindb 184 23112010 071208 Capítulo 6 Extensões do modelo de regressão linear de duas variáveis 185 exeMPlo 66 Continuação Tabela 64 Fecundidade e outras informações para 64 países Nota MI mortalidade infantil número anual de óbitos de crianças menores de 5 anos por 1000 nascidos vivos TAF taxa de alfabetização feminina em PNBpc PNB per capita em 1980 TFT taxa de fecundidade total 19801985 número médio de filhos por mulher com base em taxas de fecundidade segundo a idade em determinado ano Fonte MUKHERJEE Chandan WHITE Howard WHYTE Mark Econometrics and data analysis for developing countries Londres Routledge 1998 p 456 Se ajustarmos o modelo recíproco 671 obteremos os seguintes resultados da regressão 672 na medida em que o Pnb per capita aumenta indefinidamente a mortalidade infantil aproxi mase de seu valor assintótico de cerca de 82 óbitos por mil Como explicado na nota de roda pé 20 o valor positivo do coeficiente de 1Pnbt implica que a taxa de variação de mortalidade in fantil em relação ao Pnb per capita seja negativa Continua ECONOBOOKindb 185 23112010 071209 186 Parte Um Modelos de regressão com equação única exeMPlo 66 Continuação fiGuRa 68 Curva de Phillips Taxa de variação dos salários nominais em Taxa natural de desemprego Taxa de desemprego em UN 1 β 0 Uma das aplicações importantes da Figura 66b é a famosa curva de Phillips da macro economia Com os dados de variação percentual dos salários nominais Y e a taxa de desem prego X do reino Unido no período de 1861 a 1957 Phillips obteve uma curva cuja forma geral se assemelha à da Figura 66b Figura 68 21 Como a Figura 68 mostra há uma assimetria na reação das variações salariais ao nível da taxa de desemprego os salários aumentam mais rapidamente por unidade de variação no desemprego se esta taxa situase abaixo de UN que é denominada pelos economistas como taxa natural de desemprego definida como a taxa de desemprego necessária para a manuten ção da inflação dos salários cons tante e depois caem para uma variação equivalente quan do a taxa de desemprego está acima de sua taxa natural UN indicando o piso assintótico ou Ø1 para a variação dos salários esse aspecto específico da curva de Phillips pode ser decorrente de fatores institucionais como o poder de barganha dos sindicatos o salário mínimo o auxílio desemprego etc desde a publicação do artigo de Phillips muito foi pesquisado sobre o assunto tanto em termos teóricos quanto práticos o espaço não nos permite aprofundar nos detalhes da contro vérsia que cerca a curva de Phillips e a própria curva já passou por várias encarnações Uma formulação relativamente recente é oferecida por olivier blanchard22 Seja ºt a taxa de inflação no período t que é definida como a variação percentual do nível de preços medida por um índice representativo como o índice de Preços ao Consumidor iPC e Unt a taxa de desempre go no período t então a versão moderna da curva de Phillips pode ser expressa da seguinte forma 673 em que ºt taxa de inflação vigente no período t ºte taxa de inflação esperada para o período t com expectativa formada no ano t 1 Continua 2122 21 PhilliPS a W The relationship between unemployment and the rate of change of money wages in the United Kingdom 18611957 Economica nov 1958 v 15 p 283299 note que a curva original não corta o eixo da taxa de desemprego mas a Figura 68 apresenta uma versão posterior da curva 22 veja blanChard olivier Macroeconomics englewood Cliffs n J Prentice hall 1997 cap 17 Traduzido para o português pela editora Campus sob o título Macroeconomia ECONOBOOKindb 186 23112010 071209 Capítulo 6 Extensões do modelo de regressão linear de duas variáveis 187 exeMPlo 66 Continuação Unt taxa de desemprego vigente no período t UN taxa natural de desemprego ut termo de erro estocástico23 Como ºte não pode ser observado diretamente podemos como ponto de partida fazer a hipótese simplificadora de que ºte ºt 1 isto é a inflação esperada para este ano é a taxa de inflação vigente no ano anterior obviamente é possível postular hipóteses mais comple xas para a formação de expectativas e discutiremos este tópico no Capítulo 17 sobre mode los com defasagens distribuídas Substituindo essa hipótese na equação 673 e escrevendo o modelo de regressão no formato padrão obtemos a seguinte equação de estimativa 674 em que Ø1 Ø2UN a equação 674 indica que a variação da taxa de inflação entre dois períodos relacionase linearmente com a taxa de desemprego corrente A priori esperase que Ø2 seja negativo por quê e Ø1 positivo não surpreende pois Ø2 é negativo e UN positivo a relação de Phillips da equação 673 é conhecida na literatura específica como curva de phillips modificada ou curva de phillips com expectativas para indicar que ºt 1 representa a inflação esperada ou a curva aceleracionista de phillips para sugerir que uma taxa de desemprego baixa provoca um aumento da taxa de inflação e em consequên cia uma aceleração na variação do nível de preços 23 exeMPlo 67 Para ilustrar a curva de Phillips modificada apresentamos na Tabela 65 dados relativos à inflação medida pela variação anual do índice de preços ao consumidor iPC e a taxa de desemprego durante o período 19602006 a taxa de desemprego referese ao desemprego civil Com base nesses dados obtivemos a variação da taxa de inflação ºt ºt 1 a qual representamos graficamente contra a taxa de desemprego civil usamos o iPC dos estados Unidos como medida da inflação a Figura 69 mostra o gráfico Como esperado a relação entre a variação da taxa de inflação e a taxa de desemprego é negativa uma taxa de desemprego baixa leva a um aumento na taxa de inflação e por tanto a uma aceleração no nível de preços daí o nome de curva aceleracionista de Phillips observando a Figura 69 não fica óbvio se um modelo de regressão linear linha reta ou um modelo recíproco seria mais adequado aos dados pode haver uma relação curvilínea entre as duas variáveis a seguir apresentamos os resultados de regressões baseadas em am bos os modelos Tenha em mente que no modelo recíproco esperase um intercepto nega tivo e um coeficiente angular positivo como observamos na nota de rodapé 20 675 676 Todos os coeficientes estimados nos dois modelos são individualmente estatisticamente significativos pois todos os valores p são inferiores ao nível de 0005 Continua 23 os economistas consideram que este termo de erro representa algum tipo de choque de oferta como os em bargos do petróleo da OPEP de 1973 e 1979 ECONOBOOKindb 187 23112010 071210 188 Parte Um Modelos de regressão com equação única exeMPlo 67 Continuação Tabela 65 Taxa de inflação e taxa de desemprego nos Estados Unidos 1960 2006 para todos os consumidores urbanos 19821984 100 exceto quando notificado Fonte Economic Report of the President 2007 Quadro B60 p 399 para o IPC e Quadro B42 p 376 para a taxa de desemprego Nota a taxa de inflação é a variação anual do IPC A taxa de desemprego referese aos trabalhadores civis fiGuRa 69 Curva de Phillips modificada 3 5 Taxa de desemprego 10 9 8 7 6 5 4 3 4 0 1 2 Variação da taxa de inflação 3 2 1 4 5 6 o modelo 675 mostra que se a taxa de desemprego cair em média 1 a taxa de inflação registrará um aumento médio de cerca de 064 ponto percentual e viceversa o modelo 676 mostra que mesmo se a taxa de desemprego aumentar indefinidamente a inflação cairá no máximo em torno de 307 pontos percentuais É interessante observarmos que por meio da equação 675 podemos calcular a taxa natural de desemprego subja cente como 677 a taxa natural de desemprego é de cerca de 593 os economistas situam a taxa natural entre 5 e 6 embora recentemente a taxa de desemprego vigente nos estados Unidos tenha sido bem inferior ECONOBOOKindb 188 23112010 071211 Capítulo 6 Extensões do modelo de regressão linear de duas variáveis 189 Modelo da hipérbole logarítmica ou modelo recíproco logarítmico Concluiremos nossa discussão sobre os modelos recíprocos considerando o modelo recíproco loga rítmico que assume a seguinte forma 678 Sua forma é apresentada na Figura 610 Como a figura mostra inicialmente Y aumenta a uma taxa crescente a curva é inicialmente convexa e então aumenta a uma taxa decrescente tornase côncava24 Portanto esse modelo pode ser adequado a uma função de produção de curto prazo Lembrese da microeconomia que se trabalho e capital são os insumos em uma função de produção e se o capital for mantido constante enquanto se aumenta a quantidade de trabalho a relação produto trabalho será semelhante à Figura 610 Veja o Exemplo 73 do Capítulo 7 68 A escolha da forma funcional Neste capítulo discutimos as várias formas funcionais que um modelo prático pode assumir mesmo dentro dos limites dos modelos de regressão linear nos parâmetros A escolha de uma forma funcional específica é comparativamente simples no caso de duas variáveis porque podemos representálas graficamente e ter uma ideia aproximada do modelo adequado A escolha tornase muito mais complexa quando consideramos modelos de regressão múltipla envolvendo mais de um regressor como veremos ao tratar desse assunto nos próximos dois capítulos Não há como negar que é necessário bastante conhecimento e experiência para escolher o mode lo adequado às estimativas empíricas Mas é possível oferecer algumas orientações 1 A teoria subjacente por exemplo a curva de Phillips pode sugerir uma forma funcional em particular 2 Uma boa prática é descobrir a taxa de variação o coeficiente angular do regressando em relação ao regressor bem como calcular a elasticidade do regressando em relação ao regres sor Na Tabela 66 a seguir fornecemos as fórmulas dos coeficientes angulares e de elastici dade para os vários modelos apresentados neste capítulo O conhecimento dessas fórmulas nos ajudará a comparar os vários modelos 24 recorrendo ao cálculo podemos demonstrar que Fazendo essa substituição obtemos que é o coeficiente angular de Y em relação a X fiGuRa 610 O modelo logarítmico recíproco Y X ECONOBOOKindb 189 23112010 071212 190 Parte Um Modelos de regressão com equação única 3 Os coeficientes do modelo escolhido devem satisfazer certas expectativas a priori Se esti vermos considerando a demanda por automóveis como função do preço e outras variáveis deveríamos esperar um coeficiente negativo para a variável preço 4 Às vezes mais de um modelo pode ajustarse muito bem a determinado conjunto de dados No caso da curva de Phillips modificada ajustamos os modelos linear e recíproco aos mes mos dados Nos dois casos os coeficientes estavam de acordo com expectativas prévias e eram estatisticamente significativos Uma das principais diferenças era que o valor de r2 do modelo linear era maior que o do recíproco Podese portanto dar preferência ao primeiro Mas ao comparar os dois valores de r2esteja certo de que a variável dependente ou regres sando dos dois modelos é a mesma os regressores podem assumir qualquer forma No próximo capítulo explicaremos a razão disso 5 Em geral não se deve dar excessiva importância ao r2 no sentido de que quanto mais ele vado o r2 melhor o modelo Como veremos no próximo capítulo r2 aumenta à medida que acrescentamos mais regressores ao modelo Muito importante é a base teórica do modelo escolhido os sinais dos coeficientes estimados e sua significância estatística Se um modelo for bom segundo esses critérios um r2 menor pode ser aceitável Voltaremos a este tópico rele vante em mais detalhe no Capítulo 13 6 Em algumas situações pode não ser fácil estabelecer uma forma funcional em particular caso em que podemos usar as chamadas transformações BoxCox Como é um tópico bas tante técnico discutiremos o procedimento BoxCox no Apêndice 6A5 69 Um comentário sobre a natureza do termo de erro estocástico termo aditivo versus termo multiplicativo Considere o seguinte modelo de regressão que é igual à Equação 651 exceto pela ausência do termo de erro 691 Tabela 66 Nota o indica que a elasticidade varia dependendo do valor assumido por X ou Y ou por ambos Quando não se especificam os valores de X e de Y na prática muitas vezes essas elasticidades são medidas pelos valores médios das variáveis a saber X e Y opcional ECONOBOOKindb 190 23112010 071213 Capítulo 6 Extensões do modelo de regressão linear de duas variáveis 191 Para fins de estimação podemos expressálo de três maneiras diferentes 692 693 694 Aplicando logaritmos nos dois lados dessas equações obtemos 692a 693a 694a em que Æ ln Ø1 Modelos como a Equação 692 são modelos de regressão intrinsecamente linear nos parâme tros no sentido de que com a transformação logarítmica adequada podem ser transformados em modelos lineares nos parâmetros Æ e Ø2 Nota esses modelos são não lineares em Ø1 Mas o modelo 694 é intrinsecamente não linear nos parâmetros Não há um modo simples de aplicar os logaritmos da Equação 694 porque ln A B ln A ln B Embora as Equações 692 e 693 sejam modelos de regressão linear e possam ser estimados por mínimos quadrados ordinários MQO ou máxima verossimilhança MV devemos ter cuidado com as propriedades do termo de erro estocástico que entra nesses modelos Lembrese de que a propriedade de melhor estimador linear não viesado do método de MQO exige que o valor da média de ui tenha média zero variância constante e autocorrelação nula Para o teste de hipóteses supomos ainda que ui siga a distribuição normal com os valores da média e da variância que acabamos de mencionar Em resumo supomos que ui ª N0 æ2 Considere agora o modelo 692 Sua contrapartida estatística é dada em 692a Para usar o modelo clássico de regressão linear normal MCRLN precisamos supor que 695 Quando calculamos a regressão 692a temos de aplicar os testes de normalidade discutidos no Capítulo 5 aos resíduos da regressão Note que se ln ui segue a distribuição normal com média zero e variância constante a teoria estatística mostra que ui na Equação 692 deve seguir a distribuição lognormal com média eæ22 e variância eæ2eæ2 1 Como a análise anterior mostra é preciso estar muito atento ao termo de erro ao transformar um modelo para fins de análise de regressão Quanto à Equação 694 tratase de um modelo de regres são não linear nos parâmetros e deverá ser resolvido por alguma rotina computacional iterativa O modelo 693 não deve apresentar problemas de estimação Em resumo preste muita atenção ao termo de erro quando transformar um modelo para a análise de regressão Caso contrário uma aplicação às cegas de MQO ao modelo transformado não resultará em um modelo com as propriedades estatísticas desejáveis Resumo e conclusões Este capítulo apresentou vários detalhes do modelo clássico de regressão linear 1 Às vezes um modelo de regressão não contém um termo de intercepto explícito Estes são chama dos de modelos de regressão que passa pela origem Embora a álgebra de sua estimação seja simples tais modelos devem ser usados com cautela A soma de seus resíduos é diferente de zero além disso o r2 calculado da maneira convencional pode não fazer muito sentido A menos que exista uma forte razão teórica é preferível introduzir o termo de intercepto explicitamente no modelo ECONOBOOKindb 191 23112010 071215 192 Parte Um Modelos de regressão com equação única 2 As unidades e a escala em que expressamos o regressando e os regressores são muito impor tantes porque a interpretação dos coeficientes de regressão depende fundamentalmente deles Na prática o pesquisador deve não só citar as fontes dos dados mas também mostrar explicitamente como as variáveis são medidas 3 A forma funcional da relação entre regressando e regressores é igualmente importante Algumas formas funcionais relevantes discutidas neste capítulo são a o modelo loglinear ou de elastici dade constante b os modelos de regressão semilogarítmicos e c os recíprocos 4 No modelo loglinear tanto o regressando quanto os regressores são expressos em forma loga rítmica O coeficiente de regressão correspondente ao logaritmo de um regressor é interpretado como a elasticidade do regressando em relação ao regressor 5 No modelo semilogarítmico ou o regressando ou os regressores estáão em forma logarítmica No modelo semilogarítmico em que o regressando é logarítmico e o regressor X é o tempo o coeficiente angular estimado multiplicado por 100 mede a taxa de crescimento instantâneo do regressando Esses modelos são usados com frequência para medir a taxa de crescimento dos fenômenos econômicos No modelo semilogarítmico em que o regressor é logarítmico seu coefi ciente mede a taxa de variação absoluta do regressando para uma dada variação percentual no valor do regressor 6 Nos modelos recíprocos ou o regressando ou o regressor é expresso em forma recíproca ou in versa para capturar as relações não lineares entre variáveis econômicas como no caso da famosa curva de Phillips 7 Ao escolher as várias formas funcionais devese dar grande atenção ao termo de erro estocástico ui Como observado no Capítulo 5 o modelo clássico de regressão linear assume explicitamente que o termo de erro apresenta média igual a zero variância constante homocedástica e não é correlacionado aos regressores É sob essas hipóteses que os estimadores de mínimos quadra dos ordinários são o melhor estimador linear não viesado Além disso no modelo clássico de re gressão linear normal os estimadores de MQO também estão normalmente distribuídos É preciso verificar se essas hipóteses sustentamse na forma funcional escolhida para a análise empírica Depois de estimar a regressão o pesquisador precisa aplicar testes de diagnóstico como o teste de normalidade discutido no Capítulo 5 Esse ponto é de máxima importância pois os testes de hipótese clássicos como o t o F e χ2 baseiamse na hipótese de normalidade do termo de erro Isso é especialmente crítico se o tamanho da amostra for pequeno 8 Embora a discussão até o momento tenha limitadose aos modelos de regressão com duas variáveis os próximos capítulos mostrarão que em muitos casos a extensão para modelos de regressão múltipla envolve apenas mais álgebra sem necessariamente incluir mais conceitos fun damentais É por isso que é tão importante que o leitor domine o modelo de regressão de duas variáveis exeRCíCioS 61 Considere o seguinte modelo de regressão em que yi Yi Y e xi Xi X Neste caso a linha de regressão deve passar pela origem Verdadeiro ou falso Mostre seus cálculos 62 Os seguintes resultados de uma regressão tomaram como base dados mensais do período janeiro de 1978 a dezembro de 1987 ECONOBOOKindb 192 23112010 071216 Capítulo 6 Extensões do modelo de regressão linear de duas variáveis 193 em que Y taxa mensal de retorno das ações ordinárias da Texaco em e X taxa mensal de retorno do mercado em a Qual a diferença entre os dois modelos de regressão b Dados os resultados obtidos você manteria o termo de intercepto no primeiro modelo Justi fique sua resposta c Como interpretar os coeficientes angulares dos dois modelos d Qual a teoria que embasa os dois modelos e Você pode comparar os r2 dos dois modelos Justifique f A estatística JarqueBera de normalidade para o primeiro destes modelos é igual a 11167 e para o segundo modelo 11170 Que conclusões você pode tirar dessas estatísticas g O valor t do coeficiente angular do modelo com intercepto zero é de cerca de 295 enquanto o do modelo com intercepto presente é de 281 Há alguma lógica por trás desse resultado 63 Considere o seguinte modelo de regressão Nota nem Y nem X assumem valor zero a É um modelo de regressão linear b Como você estimaria este modelo c O que ocorre com Y quando X tende ao infinito d Você pode dar um exemplo em que este tipo de modelo seria adequado 64 Considere o seguinte modelo loglinear Represente graficamente as curvas que mostram a relação entre Y no eixo vertical e X no eixo horizontal quando Ø2 l Ø2 l e Ø2 1 65 Considere os modelos em que Y e X são variáveis padronizadas Mostre que Æ2 Ø2 Sx Sy e portanto estabeleça que embora os coeficientes angulares da regressão sejam independentes da mudança da ori gem não são independentes da mudança de escala 66 Considere os seguintes modelos em que Y i w1Yi e X i w2Xi sendo os w constantes a Estabeleça as relações entre os dois conjuntos de coeficientes de regressão e seus erros padrão b Há diferença entre os r2 dos dois modelos os dados básicos foram extraídos do disquete de dados que acompanha berndT ernst r The pratice of econometrics classic and contemporary reading mass addisonWesley 1991 Capítulo 6 Extensões do modelo de regressão linear de duas variáveis 193 ECONOBOOKindb 193 23112010 071217 194 Parte Um Modelos de regressão com equação única 67 Entre as regressões 668 e 6610 qual dos modelos você prefere Por quê 68 Para a regressão 668 teste a hipótese de que o coeficiente angular não difere significativa mente de 0005 69 Com base na curva de Phillips da Equação 673 é possível estimar a taxa natural de desem prego Como 610 A curva de despesas de Engel relaciona as despesas de um consumidor com um bem a sua renda total Sendo Y despesas de consumo com um bem e X renda do consumidor consi dere os seguintes modelos Qual desses modelos você escolheria para representar a curva de despesas de Engel e por quê Dica interprete os vários coeficientes angulares descubra as expressões da elasticidade das despesas em relação à renda etc 611 Considere o seguinte modelo Tratase de um modelo de regressão linear Em caso negativo que truque você pode usar para transformálo em um modelo de regressão linear Como você interpretaria o modelo re sultante Sob que circunstâncias seria adequado usálo 612 Represente graficamente os seguintes modelos para facilitar omitimos o subscrito i da variá vel Explique em que casos seria adequado o uso desses modelos 613 Considere a seguinte regressão Em que ISP índice de instabilidade sociopolítica média para o período 19601985 e Gini coeficiente Gini para 1975 ou o ano mais próximo dentro do período 19701980 A amostra consiste em 40 países O coeficiente Gini é uma medida de desigualdade de renda e situase entre 0 e 1 Quanto mais próximo de 0 maior a igualdade de renda e quanto mais próximo de 1 maior a desigual dade de renda a Como você interpreta esta regressão b Suponha que o coeficiente Gini aumente de 025 para 055 Em quanto o ISP aumentará c O coeficiente angular é estatisticamente significativo no nível de 5 Demonstre os cálcu los necessários d Com base na regressão anterior é possível argumentar que os países com maior desigual dade de renda são politicamente instáveis veja Weil david n Economic growth boston addison Wesley 2005 p 392 194 Parte Um Modelos de regressão com equação única ECONOBOOKindb 194 23112010 071218 Capítulo 6 Extensões do modelo de regressão linear de duas variáveis 195 exercícios aplicados 614 Com base na Tabela 67 ajuste o seguinte modelo aos dados e obtenha as estatísticas de regres são habituais Interprete os resultados Tabela 67 615 Para estudarem a relação entre taxa de investimento despesas com investimento como uma proporção do PIB e a taxa de poupança poupança como uma proporção do PIB Martin Feldstein e Charles Horioka obtiveram dados para uma amostra de 21 países veja a Tabela 68 A taxa de investimento para cada país é a taxa média para o período 19601974 e a taxa de poupança é a taxa média de poupança para o mesmo período A taxa de investimento é re presentada pela variável Taxainv e a taxa de poupança pela variável Taxapoup a Represente graficamente a relação entre taxa de investimento e taxa de poupança b Com base neste gráfico você acha que os modelos a seguir se ajustamse igualmente bem aos dados Taxainvi Ø1 Ø2 Taxapoupi ui ln Taxainvi Æ1 Æ2 ln Taxapoupi ui adaptado de JohnSTon J Econometric methods 3 ed nova YorK mcGrawhill 1984 p 87 na verdade estes dados foram ex traídos de uma prova de econometria da Universidade de oxford de 1975 FeldSTein martin horioKa Charles domestic saving and international capital flows Economic Journal Jun 1980 v 20 p 314329 dados reproduzidos de mUrraY michael P Econometrics a modern introduction boston addison Wesley 2006 Tabela 68 Nova Zelândia TAXAINV TAXAPOUP Nota TAXAINV investimento como uma proporção do PIB TAXAPOUP poupança como uma proporção do PIB Capítulo 6 Extensões do modelo de regressão linear de duas variáveis 195 ECONOBOOKindb 195 23112010 071220 196 Parte Um Modelos de regressão com equação única c Calcule ambos os modelos e obtenha as estatísticas habituais d Como você interpretaria o coeficiente angular no modelo linear E no modelo loglinear Existe alguma diferença nas interpretações e Como você interpretaria os interceptos dos dois modelos Existe alguma diferença nas in terpretações f Há alguma diferença entre os coeficientes r2 Por que ou por que não g Suponha que você queira calcular a elasticidade da taxa de investimento em relação à taxa de poupança De que maneira você obtém a elasticidade para o modelo linear E para o modelo loglinear Note que a elasticidade é definida como a variação porcentual na taxa de investi mento para uma variação percentual na taxa de poupança h Dados os resultados dos dois modelos de regressão qual deles você prefere Por quê 616 A Tabela 69 apresenta as definições de variáveis para diversos tipos de despesas despesas totais renda idade do chefe da família e número de filhos para uma amostra de 1519 famílias extraídas do British Family Expenditures Surveys Censo das Despesas Familiares na Inglater ra no período 19801982 Os dados amostrais estão disponíveis no site deste livro Eles incluem apenas famílias com um ou mais filhos que residem na Grande Londres A amostra não inclui famílias cujo chefe é autônomo ou aposentado a Usando os dados sobre despesas com alimentação em relação a despesas totais determine qual dos modelos resumidos na Tabela 66 é adequado aos dados b Com base nos resultados da regressão obtidos em a qual modelo parece mais apropriado à situação presente Nota guarde os dados para uma análise futura no próximo capítulo sobre regressão múltipla 617 Consulte a Tabela 63 Verifique qual é a taxa de crescimento das despesas com bens duráveis Qual a semielasticidade estimada Interprete os resultados Faria sentido estimar uma regres são loglog tendo como regressando a despesa com bens duráveis e o tempo como regressor Como você interpretaria o coeficiente angular neste caso 618 Com os dados da Tabela 63 calcule a taxa de crescimento das despesas com bens não duráveis e compare esses resultados com os obtidos no Exercício 617 os dados são de blUndell richard PendaKUr Krishna Semiparametric estimation and consumer demand Journal of Applied Econometrics 1998 v 13 n 5 p 435462 dados reproduzidos de hill r Carter GriFFiThS William e JUdGe George G Undergraduate econometrics 2 ed nova York John Wiley Sons 2001 A parcela no orçamento de um bem por exemplo alimentação é definica como Tabela 69 196 Parte Um Modelos de regressão com equação única ECONOBOOKindb 196 23112010 071220 Capítulo 6 Extensões do modelo de regressão linear de duas variáveis 197 619 A Tabela 610 fornece dados sobre despesas totais de consumo em milhões de libras e despe sas com publicidade em milhões de libras para 29 categorias de produtos no Reino Unido a Considerando as várias formas funcionais que abordamos no capítulo qual delas ajustase ao dados fornecidos na Tabela 610 b Estime os parâmetros do modelo de regressão escolhido e interprete seus resultados c Tomando a razão das despesas com publicidade em relação às despesas totais de consumo o que você observa Há alguma categoria de produto para a qual esta razão é excepcional mente alta Existe algo de especial sobre essas categorias de produtos que possa explicar a despesa relativamente alta com publicidade 620 Consulte o Exemplo 33 no Capítulo 3 para responder o seguinte a Represente graficamente a demanda por telefones celulares em relação à renda per capita ajustada pela paridade do poder de compra b Represente graficamente o log da demanda por telefones celulares em relação ao log da renda per capita c Qual a diferença entre os dois gráficos estes dados são do Advertising Year Book 1996 disponíveis em httpwwweconomicswebinstituteorg ecdatahtm Tabela 610 Despesas com publicidade e despesas totais em milhões de libras para 29 categorias de produtos no Reino Unido Fonte httpwwweconomicswebinstituteorgecdatahtm DESPUB despesa com publicidade milhões DESCON despesa total de consumo milhões Capítulo 6 Extensões do modelo de regressão linear de duas variáveis 197 ECONOBOOKindb 197 23112010 071221 198 Parte Um Modelos de regressão com equação única d Com base nesses gráficos você acredita que um modelo loglog pode ajustarse melhor aos dados do que um modelo linear Estime o modelo loglog e Como você interpreta o coeficiente angular no modelo loglog f O coeficiente angular estimado no modelo loglog é estatisticamente significativo no nível de 5 g Como você estimaria a elasticidade da demanda por telefones celulares em relação à renda para o modelo linear da Equação 373 De que informações adicionais você precisa Chame a elasticidade ajustada de elasticidade da renda h Existe alguma diferença entre a elasticidade da renda estimada no modelo loglog e a esti mada no modelo linear Se houver qual modelo você escolheria 621 Repita o Exercício 620 mas consulte a demanda por computadores pessoais fornecida na Equação 374 Existe alguma diferença entre as elasticidades da renda estimadas para tele fones celulares e computadores pessoais Se houver que fatores podem responder pela dife rença 622 Consulte os dados da Tabela 33 Para descobrir se pessoas que possuem PC também possuem telefone celular calcule a seguinte regressão a Estime os parâmetros desta regressão b O coeficiente angular estimado é estatisticamente significativo c Faz diferença se você calcular a seguinte regressão d Calcule a regressão anterior e teste o significado estatístico do coeficiente angular estimado e Baseado em que você decidiria entre usar a primeira e a segunda regressão Apêndice 6A 6a1 Derivação de estimadores de mínimos quadrados para regressões que passam pela origem Desejamos minimizar 1 em relação a Ø2 Diferenciando 1 em relação a Ø2 obtemos 2 Igualando a Equação 2 a zero e simplificando obtemos 616 3 Agora substituindo a FRP Yi Ø2Xi ui nesta equação obtemos 4 198 Parte Um Modelos de regressão com equação única ECONOBOOKindb 198 23112010 071222 Capítulo 6 Extensões do modelo de regressão linear de duas variáveis 199 Nota E Ø2 Ø2 Portanto 5 Expandindo o lado direito da Equação 5 e observando que os Xi são não estocásticos e os ui são homocedás ticos e não correlacionados obtemos 617 6 Note que por meio da Equação 2 obtemos depois de igualála a zero 7 Na Seção 3A1 do Apêndice 3A vimos que quando o termo de intercepto está presente no modelo temos além de 7 a condição Com base na matemática que acabamos de ver deve ficar claro por que no mode lo de regressão que passa pela origem a soma dos erros ˆui pode não ser igual a zero Suponha que queremos impor a condição de que Neste caso teríamos 8 Esta expressão nos dá então 9 Mas esse estimador não é o mesmo que a Equação 3 ou a Equação 616 E como o Ø2 da Equação 3 não é viesado por quê o Ø2 da Equação 9 não pode ser não viesado O surpreendente é que nas regressões que passam pela origem não podemos ter simultaneamente e ˆui iguais a zero como no modelo convencional de regressão A única condição que se sustenta é que é igual a zero Lembrese de que 263 Somando os dois lados dessa equação e dividindo por N o tamanho da amostra obtemos 10 Como no modelo com intercepto igual a zero e NOu portanto não precisam ser zero seguese que 11 isto é a média dos valores efetivos de Y não precisa ser igual à média dos valores estimados de Y as duas mé dias são idênticas no caso do modelo em que o intercepto está presente como se vê na Equação 3110 Já mencionamos que no modelo com intercepto zero r2 pode ser negativo enquanto no modelo conven cional ele nunca pode ser Essa condição pode ser demonstrada como a seguir Usando a Equação 355a podemos escrever SQR STQ 12 Agora no modelo convencional ou com o intercepto presente a Equação 366 mostra que SQR 13 a menos que Ø2 seja zero X não influencie Y de forma alguma No modelo convencional SQR STQ ou r2 nunca pode ser negativo Capítulo 6 Extensões do modelo de regressão linear de duas variáveis 199 ECONOBOOKindb 199 23112010 071226 200 Parte Um Modelos de regressão com equação única Para o modelo com intercepto zero podese demonstrar analogamente que SQR 14 Nota as somas dos quadrados de Y e X não são ajustadas à média Não há garantia de que essa SQR será sempre menor que a STQ o que sugere que a SQR pode ser maior que a STQ impli cando que r2 tal como convencionalmente definido pode ser negativo Note que nesse caso a SQR será maior que a STQ se 6a2 Demonstração de que uma variável padronizada tem média zero e variância igual a um Considere a variável aleatória Y com valor médio amostral de Y e desvio padrão amostral de Sy Definindo 15 Portanto Yi é uma variável padronizada Note que a padronização envolve uma operação dupla 1 mudança da origem que é o numerador da Equação 15 e 2 mudança da escala que é o denominador Assim a padro nização envolve tanto uma mudança da origem quanto da escala Agora 16 Dado que a soma dos desvios de uma variável em relação a seu valor médio é sempre igual a zero Portanto a média do valor padronizado é zero Nota podemos excluir o termo Sy da somatória porque seu valor é conhe cido Agora 17 Note que que é a variância amostral de Y 6a3 logaritmos Considere os números 5 e 25 sabemos que 25 52 18 Dizemos que o expoente 2 é o logaritmo de 25 para a base 5 Mais formalmente o logaritmo de um número por exemplo 25 para determinada base por exemplo 5 é a potência 2 à qual a base 5 deve ser elevada para obter essa dado número 25 De modo mais geral se 19 então 20 200 Parte Um Modelos de regressão com equação única ECONOBOOKindb 200 23112010 071229 Capítulo 6 Extensões do modelo de regressão linear de duas variáveis 201 Em matemática a função 19 é chamada de função exponencial e a função 20 de função logarítmica Como ficou claro nas Equações 19 e 20 uma função é o inverso da outra Embora qualquer base positiva possa ser usada na prática as duas bases mais comumente usadas são 10 e o número matemático e 271828 Logaritmos de base 10 são chamados de logaritmos comuns Assim isto é no primeiro caso 100 102 e no segundo 30 10148 Logaritmos na base e são chamados de logaritmos naturais Assim Todos esses cálculos podem ser feitos rotineiramente em uma calculadora Por convenção o logaritmo na base 10 é denotado por log e na base e por ln No exemplo anterior podemos escrever log 100 ou log 30 ou ln 100 ou ln 30 Há uma relação fixa entre o log comum e o log natural que é 21 O log natural para o número X é igual a 23026 vezes o log X na base 10 Assim como antes Portanto não importa se usamos log comum ou natural Mas em matemática a base preferida é a e o logaritmo natural Todos os logs usados neste livro são naturais a menos que explicitado de maneira dife rente Obviamente podemos converter o log de um número de uma base para a outra usando a Equação 21 Tenha em mente que logaritmos de números negativos não são definidos Portanto o log de 5 ou o ln de 5 não é definido Algumas propriedades dos logaritmos se A e B são números positivos quaisquer podemos demonstrar que 1 22 O log do produto de dois números positivos é igual à soma de seus logs 2 23 O log da razão de dois números positivos é igual à diferença de seus logs 3 24 O log da soma ou da diferença de A e B não é igual à soma ou à diferença de seus logs 4 25 O log de A elevado à potência k é igual a k multiplicado pelo log de A 5 26 O log de e tendo ele mesmo como base é igual a 1 assim como o log de 10 na base 10 6 27 O log natural do número 1 é zero assim como o log comum do número 1 7 Se Y ln X dY dX H 1 X 28 A taxa de mudança ou seja a derivada de Y em relação a X é 1 sobre X As funções logarítmicas exponen ciais e naturais estão na Figura 6A1 Capítulo 6 Extensões do modelo de regressão linear de duas variáveis 201 ECONOBOOKindb 201 23112010 071231 202 Parte Um Modelos de regressão com equação única Embora o número para o qual se obtém o log seja sempre positivo o logaritmo deste número pode ser tanto positivo quanto negativo É possível verificar facilmente que se Note também que embora a curva logarítmica da Figura 6A1b tenha inclinação positiva implicando que quanto maior o número maior será seu logaritmo a curva aumenta em uma razão decrescente matematica mente a segunda derivada da função é negativa Assim ln10 23026 aprox e ln20 299576 aprox Se um número é dobrado seu logaritmo não dobra É por essa razão que a transformação logarítmica é chamada de não linear Tal fato também pode ser visto por meio da Equação 28 que ressalta que se Y ln X dXdX 1X Isso significa que a inclinação da função logarítmica depende do valor de X ou seja não é constante lembrese da definição de linearidade na variável Logaritmos e porcentagens como para variações muito pequenas a varia ção em ln X é igual à variação relativa ou proporcional em X Na prática se a variação em X é razoavelmente pequena essa relação pode ser escrita como a variação em ln X º à variação relativa em X em que º significa aproximadamente Para variações pequenas 6a4 fórmulas de taxa de crescimento Seja a variável Y uma função de tempo Y ft em que t denota o tempo A taxa instantânea por exemplo um ponto no tempo de crescimento de Y gY é definida como 29 Note que se multiplicarmos gY por 100 obteremos a taxa percentual de crescimento em que é a taxa de variação de Y em relação ao tempo Agora seja ln Y ln ft em que ln representa o logaritmo natural então 30 Isso é igual à Equação 29 Portanto transformações logarítmicas são muito úteis para calcular taxas de crescimento especialmente se Y for uma função de outras variáveis dependentes do tempo como o exemplo a seguir mostrará Seja 31 fiGuRa 6a1 Funções exponencial e logarítmica a função exponencial b função logarítmica a 1 1 0 0 45 Y b X ln Y X ln Y Y X Y e X 45 202 Parte Um Modelos de regressão com equação única ECONOBOOKindb 202 23112010 071233 Capítulo 6 Extensões do modelo de regressão linear de duas variáveis 203 em que Y é o PIB nominal X o PIB real e Z é o deflator de preço do PIB Em palavras o PIB nominal é o PIB real multiplicado pelo deflator de preço do PIB Todas essas variáveis são funções de tempo já que variam ao longo do tempo Agora aplicando logs na Equação 31 obtemos 32 Derivando a Equação 32 em relação ao tempo obtemos 33 ou seja gY gX gZ em que g denota a taxa de crescimento Em palavras a taxa instantânea de crescimento de Y é igual à soma da taxa instantânea de crescimento de X com a taxa instantânea de crescimento de Z Neste exemplo a taxa instantânea de crescimento do PIB nomi nal é igual à soma da taxa instantânea de crescimento do PIB real com a taxa instantânea de crescimento do deflator de preço do PIB De modo mais geral a taxa instantânea de crescimento de um produto é a soma das taxas instantâneas de crescimento de seus componentes Isso pode ser generalizado para o produto de mais de duas variáveis De maneira semelhante se tivermos 34 35 ou seja gY H gX gZ Em outras palavras a taxa instantânea de crescimento Y é igual à diferença entre a taxa instantânea de crescimento de X e a taxa instantânea de crescimento de Z Se Y renda per capita X PIB e Z população a taxa instantânea de crescimento da renda per capita é igual à taxa instantânea de crescimento do PIB menos a taxa instantânea de crescimento da população Agora seja Y X Z Qual a taxa de crescimento de Y Seja Y emprego total X empregos na produção e Z empregos administrativos Como não é fácil calcular a taxa de crescimento de Y mas com alguma álgebra podemos demonstrar que 36 A taxa de crescimento de uma soma é a média ponderada das taxas de crescimento de seus componentes Por exemplo a taxa de crescimento do emprego total é a média ponderada das taxas de crescimento de empre gos na produção e empregos administrativos sendo os pesos a parcela de cada componente no emprego total 6a5 o modelo de regressão boxCox Considere o seguinte modelo de regressão 37 em que a letra grega lambda é um parâmetro que pode ser negativo zero ou positivo Como Y está elevado à potência teremos várias transformações de Y dependendo do valor desse parâmetro A Equação 37 é conhecida como modelo de regressão BoxCox em homenagem aos estatísticos Box e Cox1 Dependendo do valor de temos os seguintes modelos de regressão apresentados na tabela a seguir 1 boX G e P CoX d r an analysis of transformations Journal of the Royal Statistical Society 1964 b26 p 211243 Capítulo 6 Extensões do modelo de regressão linear de duas variáveis 203 ECONOBOOKindb 203 23112010 071235 204 Parte Um Modelos de regressão com equação única Como você pode ver os modelos linear e loglinear são casos especiais na família de transformações Box Cox Obviamente podemos aplicar essas transformações às variáveis X também É interessante notar que quan do é zero obtemos a transformação log de Y A demonstração disso é um tanto complexa e é melhor deixála para as consultas Leitores que apreciam cálculo deverão recordar a regra do lHopital Mas de que maneira determinamos o valor adequado de em determinada situação Não podemos estimar a Equação 37 diretamente pois ela envolve não só os parâmetros de regressão Ø1 e Ø2 como também que entra não linearmente Mas podemos usar o método de máxima verossimilhança para estimar todos esses parâ metros Existem pacotes de regressão apenas para fazer isso Não abordaremos esse tópico aqui porque o procedimento é um tanto complexo No entanto podemos recorrer à tentativa e erro Escolha diversos valores para transforme Y de acordo calcu le a regressão 37 e obtenha o soma dos quadrados dos resíduos SQR para cada regressão transformada Escolha o valor de que oferece o menor SQR2 2 Para uma discussão acessível consulte neTer John KUTner michael naChTSheim Cristopher WaSSerman William Applied regression models 3 ed Chicago richard d irving 1996 204 Parte Um Modelos de regressão com equação única ECONOBOOKindb 204 23112010 071235 205 Análise de regressão múltipla o problema da estimação O modelo de duas variáveis estudado extensamente nos capítulos anteriores muitas vezes é inade quado na prática No exemplo de consumo e renda Exemplo 31 assumiuse implicitamente que apenas a renda X afeta o consumo Y No entanto raramente a teoria econômica é tão simples além da renda há diversas outras variáveis que possivelmente afetam as despesas de consumo Um exemplo óbvio é a riqueza do consumidor Outro a demanda por um bem depende não só de seu preço mas também do preço de outros bens substitutos ou complementares da renda do consumidor do status social etc Portanto precisamos ampliar nosso modelo de regressão simples com duas variáveis para abranger casos que envolvem mais de duas variáveis Adicionar mais variáveis levanos à discussão dos modelos de regressão múltipla em que a variável dependente ou regressando Y depende de duas ou mais variáveis explanatórias ou regressores O modelo de regressão múltipla mais simples possível é o de três variáveis uma dependente e duas explanatórias Neste e no próximo capítulo estudaremos esse modelo De modo geral estamos interessados em modelos de regressão linear múltipla isto é modelos lineares nos parâmetros po dendo ou não ser lineares nas variáveis 71 O modelo de três variáveis notação e hipóteses Generalizando a função de regressão populacional com duas variáveis FRP Equação 242 podemos escrever a FRP com três variáveis do seguinte modo 711 em que Y é a variável dependente X2 e X3 as variáveis explanatórias ou regressores u o termo de erro estocástico e i o indicador da iésima observação no caso em que os dados são séries temporais o subs crito t denota a observação de ordem t1 Na Equação 711 Ø1 é o intercepto Como de costume ele dá o efeito médio sobre Y de todas as variáveis excluídas do modelo embora sua interpretação mecânica seja do valor médio de Y quando X2 e X3 são iguais a zero Os coeficientes Ø2 e Ø3 são denominados coeficientes parciais de regressão e seus significados serão explicados em breve 1 Para fins de simetria da notação a equação 711 também pode ser escrita como desde que X1i H 1 para todos os i Capítulo 7 ECONOBOOKindb 205 23112010 071236 206 Parte Um Modelos de regressão com equação única Continuaremos operando dentro da estrutura do modelo clássico de regressão linear MCRL apresentado no Capítulo 3 Especificamente estamos considerando o seguinte HipótESES 1 modelo de regressão linear ou linear nos parâmetros 712 2 valores fixos de X ou valores de X independentes do termo de erro aqui isso significa que é necessário covariância igual a zero entre ui e cada variável X 7132 3 o termo de erro ui tem valor médio zero 714 4 homocedasticidade ou variância constante de ui 715 5 ausência de autocorrelação ou de correlação serial entre os termos de erro 716 6 o número de observações n deve ser maior que o número de parâmetros a serem estimados neste caso 3 717 7 deve haver variação nos valores das variáveis X 718 Trataremos também de outros dois requisitos 8 não há colinearidade exata entre as variáveis X não há relação linear exata entre X2 e X3 719 na Seção 77 dedicaremos mais tempo discutindo a última hipótese 9 ausência de viés de especificação o modelo está corretamente especificado 7110 2 A lógica das Hipóteses 712 a 716 é a mesma que foi discutida na Seção 32 A Hipótese 719 ausência de relação linear exata entre X2 e X3 é conhecida tecnicamente como ausência de colinearidade ou ausência de multicolinearidade se estiverem envolvidas mais de uma relação linear exata Informalmente a ausência de colinearidade significa que nenhum dos regressores pode ser expresso como uma combinação linear exata dos demais regressores do modelo Formalmente a ausência de colinearidade significa que não existe um conjunto de números 2 e 3 que não sejam os dois iguais a zero tais que 7111 Se essa relação linear exata existe dizse que X2 e X3 são colineares ou linearmente dependentes Por outro lado se a Equação 7111 só é verdadeira quando 2 H 3 H 0 dizse que X2 e X3 são linear mente independentes Assim se 7112 as duas variáveis são linearmente dependentes e se ambas forem incluídas em um modelo de re gressão haverá colinearidade perfeita ou relação linear exata entre os dois regressores Embora consideremos o problema da colinearidade a fundo no Capítulo 10 a lógica por trás da hipótese de ausência de colinearidade exata não é difícil de entender Suponha que na Equação 711 Y X2 e X3 representem despesa de consumo renda e riqueza do con sumidor respectivamente Ao postular que a despesa de consumo relacionase linearmente com a renda e a riqueza a teoria 2 esta hipótese será atendida automaticamente se X2 e X3 forem não estocásticos e a equação 714 for válida ECONOBOOKindb 206 23112010 071238 Capítulo 7 Análise de regressão múltipla o problema da estimação 207 econômica presume que a riqueza e a renda podem ter uma influência independente sobre o consumo Caso contrário não faz sentido incluir as duas variáveis no modelo No extremo se houver uma rela ção linear exata entre renda e riqueza só teremos uma variável independente não duas e não haverá forma de avaliar a influência separada da renda e da riqueza sobre o consumo Para melhor entender mos seja X3i H 2X2i na regressão de consumorendariqueza A regressão 711 tornase 7113 em que α H Ø2 C 2Ø3 Temos na verdade uma regressão com duas e não três variáveis Além disso se calcularmos a regressão 7113 e obtivermos α não haverá como estimar a influência separada de X2 H Ø2 e X3 H Ø3 sobre Y pois α dá a influência combinada de X2 e X3 sobre Y 3 Em resumo a hipótese de ausência de multicolinearidade perfeita exige que se inclua na função de regressão populacional apenas aquelas variáveis que não sejam funções lineares exatas de uma ou mais variáveis do modelo Embora este tópico seja abordado em maior profundidade no Capítulo 10 cabe aqui fazer algumas observações Primeiro a hipótese da ausência de multicolinearidade é parte de nosso modelo teórico a FRP Na prática quando coletamos dados para análises nada garante que não existirá correlação entre os regressores Na verdade na maior parte do trabalho aplicado é quase impossível encontrar duas ou mais variáveis econômicas que não tenham alguma correlação como mostraremos mais adian te nos exemplos ilustrativos deste capítulo O ne cessário é que não haja uma relação linear exata entre os regressores como na Equação 7112 Segundo tenha em mente que estamos falando apenas de relações lineares perfeitas en tre duas ou mais variáveis A multicolinearidade não exclui relações não lineares exatas entre variáveis Suponha que X3i H X 2 2i Isso não contradiz a hipótese de ausência de colinearidade perfeita já que nesse caso a relação entre as variáveis é não linear 72 Interpretação da equação de regressão múltipla Dadas as hipóteses do modelo clássico de regressão seguese que ao tomar a esperança condicio nal de Y nos dois lados da Equação 711 obtemos 721 Em palavras a Equação 721 fornece o valor esperado ou a média de Y condicional aos valores dados ou fixados de X2 e X3 Assim como no caso de duas variáveis a análise de regressão múltipla está condicionada aos valores fixados dos regressores e o que obtemos é o valor médio de Y ou a resposta média de Y para os valores dos regressores 73 O significado dos coeficientes parciais de regressão Como já mencionado os coeficientes de regressão Ø2 e Ø3 são conhecidos como coeficientes parciais de regressão ou coeficientes parciais angulares Seu significado é o seguinte Ø2 mede a variação no valor médio de Y EY por unidade de variação em X2 mantendose o valor de X3 constante Em outras palavras ele nos dá o efeito direto ou líquido de uma unidade de variação em X2 sobre o valor médio de Y excluídos os efeitos que X3 possa ter sobre a média de Y De modo análogo Ø3 3 em termos matemáticos Æ H Ø2 C 2Ø3 é uma equação com duas incógnitas e não há uma forma única de estimar Ø2 e Ø3 com base no Æ estimado ECONOBOOKindb 207 23112010 071239 208 Parte Um Modelos de regressão com equação única mede a variação do valor médio de Y por unidade de variação em X3 mantendose constante o valor de X24 Ele nos dá o efeito direto ou líquido de uma unidade de variação de X3 sobre o valor mé dio de Y excluídos quaisquer efeitos que X2 possa ter sobre o valor médio de Y5 Como mantemos constante na realidade a influência de um regressor Para explicar isso volte mos ao exemplo da mortalidade infantil Exemplo 66 Lembrese de que nesse exemplo Y H morta lidade infantil MI X2 H PNB per capita PNBpc e X3 H taxa de alfabetização feminina TAF Suponha que queiramos manter constante a influência de TAF Como TAF pode ter algum efeito sobre a MI assim como o PNBpc em qualquer caso concreto o que podemos fazer é remover a influência linear da TAF da MI e do PNBpc calculando a regressão de MI contra a TAF e a do PNBpc contra a TAF separadamente e examinando os resíduos obtidos nessas re gressões Usando os dados da Tabela 64 obtemos as seguintes regressões 731 em que uO1i representa o termo residual da regressão 732 em que uO2i representa o termo residual dessa regressão Agora 733 representa a parte da MI que resta após removermos da expressão a influência linear de TAF Do mesmo modo 734 representa a parte do PNBpc que sobra após remover a influência linear de TAF Portanto se agora fizermos uma regressão de uO1i contra uO2i que foram purificados da influência linear de TAF não obteremos o efeito líquido do PNBpc sobre a MI E é justamente isso o que ocorre veja a Seção 7A2 do Apêndice 7A Os resultados da regressão são os seguintes 735 Nota essa regressão não tem termo de intercepto porque o valor médio dos resíduos de MQO uO1i e uO2i é igual a zero Por quê O coeficiente angular de 00056 dá agora o efeito verdadeiro ou líquido de uma variação unitária do PNBpc sobre a MI ou a inclinação verdadeira da MI em relação ao PNBpc Ou seja propor ciona o coeficiente parcial de regressão da MI com relação ao PNBpc Ø2 Os leitores que quiserem obter o coeficiente parcial de regressão da MI em relação à TAF podem replicar o procedimento anterior calculando primeiro a regressão da MI contra o PNBpc e obtendo 4 o leitor afeito ao cálculo observará logo que Ø2 e Ø3 são derivadas parciais de EY X2 X3 em relação a X2 e X3 5 note que as expressões mantendo constante controlando levando em conta a influência de corrigindo a influên cia de e excluindo a influência de são sinônimos e serão usados de modo intercambiável neste livro ECONOBOOKindb 208 23112010 071240 Capítulo 7 Análise de regressão múltipla o problema da estimação 209 os resíduos dessa regressão uO1i depois calculando a regressão da TAF contra o PNBpc e obtendo os resíduos dessa regressão uO2i e então fazendo a regressão de uO1i contra uO2i Tenho certeza de que os leitores entenderam a ideia Será que é preciso repetir todas essas etapas cada vez que desejarmos obter os verdadeiros coeficien tes parciais de regressão Felizmente não é necessário pois o procedimento de MQO que veremos na próxima seção permite fazer a mesma coisa de modo rápido e rotineiro O procedimento que aca bamos de descrever teve apenas o propósito didático de propiciar o entendimento do sentido do coeficiente parcial de regressão 74 Estimação dos coeficientes parciais de regressão por meio dos métodos de mínimos quadrados ordinários e de máxima verossimilhança Para estimarmos os parâmetros do modelo de regressão com três variáveis 711 primeiro con sideramos o método dos mínimos quadrados ordinários MQO apresentado no Capítulo 3 e depois consideraremos brevemente o método da máxima verossimilhança MV visto no Capítulo 4 estimadores de MQo Para encontrarmos os estimadores de MQO vejamos primeiro a função de regressão amostral FRA correspondente à função de regressão populacional FRP da Equação 711 que é a seguinte 741 em que uOi é o termo residual a contrapartida amostral do termo de erro estocástico ui Como observamos no Capítulo 3 o procedimento de MQO consiste na escolha dos valores dos parâmetros desconhecidos de forma que a soma dos quadrados dos resíduos SQR seja a menor possível Simbolicamente 742 em que a expressão da SQR é obtida por simples manipulação algébrica da Equação 741 O procedimento mais objetivo para obter estimadores que minimizem a Equação 742 é derivar em relação à incógnita betas igualar a zero as expressões resultantes e resolvêlas simultaneamente Como mostra a Seção 7A1 do Apêndice 7A esse procedimento dá as seguintes equações normais veja as Equações 314 e 315 743 744 745 Com base na Equação 743 verificamos de imediato que 746 que é o estimador de MQO do intercepto populacional Ø1 Seguindo a convenção de denotar por minúsculas os desvios dos valores médios amostrais pode mos deduzir as seguintes fórmulas com base nas equações normais 743 a 745 ECONOBOOKindb 209 23112010 071242 210 Parte Um Modelos de regressão com equação única 7476 748 que nos dão os estimadores de MQO dos coeficientes parciais de regressão populacional Ø2 e Ø3 respectivamente Note o seguinte 1 as Equações 747 e 748 são de natureza simétrica porque uma pode ser obtida por meio da outra pela troca dos papéis de X2 e X3 2 os denominadores dessas duas equações são idênticos e 3 o caso de três variáveis é uma extensão natural do caso de duas variáveis Variâncias e erros padrão dos estimadores de MQo Após obtermos os estimadores de MQO dos coeficientes parciais de regressão podemos deduzir as variâncias e os errospadrão desses estimadores da maneira indicada no Apêndice 3A3 Como no caso de duas variáveis precisamos dos errospadrão para dois propósitos principais estabelecer intervalos de confiança e testar hipóteses estatísticas As fórmulas relevantes são as seguintes7 749 7410 7411 ou de modo equivalente 7412 em que r23 é o coeficiente de correlação amostral entre X2 e X3 como definido no Capítulo 38 7413 7414 ou de modo equivalente 7415 6 este estimador é igual ao da equação 735 como mostra a Seção 7a2 do apêndice 7a 7 as deduções destas fórmulas são mais fáceis quando se usa notação matricial os leitores avançados podem con sultar o Apêndice C 8 Usando a definição de r dada no Capítulo 3 temos ECONOBOOKindb 210 23112010 071244 Capítulo 7 Análise de regressão múltipla o problema da estimação 211 7416 7417 Em todas essas fórmulas σ2 é a variância homocedástica dos termos de erro da população ui Segundo o argumento da Seção 3A5 do Apêndice 3A o leitor pode verificar que um estimador não viesado de σ2 é dado por 7418 Observe a semelhança entre esse estimador de σ2 e sua contrapartida de duas variáveis Os graus de liberdade agora são n 3 porque ao calcularmos precisamos estimar primeiro Ø1 Ø2 e Ø3 o que consome 3 graus de liberdade O argumento é bem geral No caso de quatro variáveis os graus de liberdade serão iguais a n 4 O estimador de æO 2 pode ser calculado com base na Equação 7418 quando os resíduos estão disponíveis mas também pode ser obtido mais prontamente usando a seguinte relação para a demons tração veja a Seção 7A3 do Apêndice 7A 7419 que é a contrapartida de três variáveis à relação dada na Equação 336 Propriedades dos estimadores de MQo As propriedades dos estimadores de mínimos quadrados ordinários MQO no modelo de regressão múltipla são semelhantes às do modelo de duas variáveis Especificamente 1 A linha superfície de regressão de três variáveis passa pelas médias Y X 2 e X 3 o que fica evidente por meio da Equação 743 veja a Equação 317 do modelo com duas variáveis Essa proprie dade é válida de modo geral No modelo de regressão linear com k variáveis um regressando e k 1 regressores 7420 temos 7421 2 O valor médio estimado de Yi H YOi é igual à média do Yi efetivo o que é fácil de demonstrar 7422 em que como sempre as letras minúsculas indicam os valores das variáveis em termos de desvios das respectivas médias ECONOBOOKindb 211 23112010 071245 212 Parte Um Modelos de regressão com equação única Somando os valores amostrais de ambos os lados da Equação 7422 e dividindo pelo tamanho da amostra n obtemos YO H Y Nota Por quê Observe que devido à Equa ção 7422 podemos escrever 7423 em que yOi H YOi Y Portanto a função de regressão amostral pode ser expressa na forma de desvios como 7424 3 que pode ser verificada com base na Equação 7424 Dica some os dois lados da Equação 7424 para todos os valores da amostra 4 Os resíduos uOi não estão correlacionados com X2i e X3i isto é veja a demonstração no Apêndice 7Al 5 Os resíduos uOi não estão correlacionados com YOi isto é Por quê Dica multiplique os dois lados da Equação 7423 por uOi e some para todos os valores amostrais 6 Das Equações 7412 e 7415 fica evidente que quando r23 o coeficiente de correlação entre X2 e X3 aumenta aproximandose de 1 as variâncias de ØO2 e ØO3 aumentam para valores dados de σ2 e ou No limite quando r23 H l ou seja a colinearidade for perfeita essas variâncias tornamse infinitas As implicações disso serão exploradas a fundo no Capítulo 10 mas o leitor pode perceber que à medida que r23 aumenta fica cada vez mais difícil saber quais são os valores verdadeiros de Ø2 e Ø3 Falaremos mais no próximo capítulo mas veja a Equação 7113 7 Também fica claro por meio das Equações 7412 e 7415 que para valores dados de r23 e ou as variâncias dos estimadores de MQO são diretamente proporcionais a σ2 ou seja eles aumentam à medida que σ2 aumenta Do mesmo modo para valores dados de σ2 e r23 a variância de ØO2 é inversamente proporcional a isto é quanto maior a variância dos valores amostrais de X2 menor a variância de ØO2 e portanto de Ø2 Podese dizer o mesmo da variância de ØO3 8 Dadas as hipóteses do modelo clássico de regressão linear especificadas na Seção 71 podese demonstrar que os estimadores de MQO dos coeficientes parciais de regressão não são apenas lineares e não viesados mas também têm a variância mínima dentro da classe de todos os estima dores lineares não viesados ou não tendenciosos Em resumo são MELNT ou BLUE Dito de forma diferente eles atendem ao teorema de GaussMarkov A demonstração é semelhante àque la do caso das duas variáveis da Seção 3A6 do Apêndice 3A e será apresentada de modo mais resu mido no Apêndice C usando notação matricial estimadores de máxima verossimilhança Mencionamos no Capítulo 4 que sob a hipótese de que ui o termo de erro da população segue a distribuição normal com média zero e variância constante σ2 os estimadores de máxima verossimi lhança MV e os de mínimos quadrados ordinários MQO dos coeficientes de regressão do modelo de duas variáveis são idênticos Essa igualdade estendese aos modelos com qualquer número de variáveis Na Seção 7A4 do Apêndice 7A é apresentada a demonstração Contudo isso não é ver dade no caso do estimador de σ2 É possível demonstrar que o estimador de MV de σ2 é independentemente do número de variáveis do modelo enquanto o estimador de MQO para σ2 é no caso de duas variáveis no caso de três variáveis e no caso do modelo com k variáveis 7420 Em resumo o estimador de MQO para σ2 leva em conta o número de graus de liberdade enquanto o estimador de má xima verossimilhança não É claro se n for muito grande os estimadores de MV e de MQO para σ2 tenderão a aproximarse Por quê ECONOBOOKindb 212 23112010 071249 Capítulo 7 Análise de regressão múltipla o problema da estimação 213 75 O coeficiente de determinação múltiplo R2 e o coeficiente de correlação múltiplo R No caso de duas variáveis vimos que r2 tal como definido na Equação 355 mede a qualidade do ajustamento da equação de regressão isto é fornece a proporção ou percentual da variação total da variável dependente Y que é explicada pela variável explanatória única X Essa notação de r2 pode ser facilmente estendida aos modelos com mais de duas variáveis No caso de modelos com três va riáveis queremos conhecer a proporção da variação de Y que é explicada conjuntamente pelas variá veis X2 e X3 A medida que nos oferece essa informação é o coeficiente de determinação múltiplo denotado por R2 conceitualmente é semelhante ao r2 Para deduzirmos R2 podemos seguir o procedimento adotado no caso de r2 e apresentado na Se ção 35 Lembrese de que 751 em que YOi é o valor estimado de Yi dado pela linha de regressão ajustada e é um estimador da verda deira EYi X2i X3i Passando a usar as letras minúsculas para indicar os desvios em relação à média a Equação 751 pode ser escrita como 752 Elevando ao quadrado os dois lados dessa expressão e somando os valores amostrais obtemos 753 Em palavras a Equação 753 nos informa que a soma total dos quadrados STQ é igual à soma dos quadrados explicados pela regressão SQE mais a soma dos quadrados dos resíduos SQR Substituindo por sua expressão na Equação 7419 obtemos que reorganizada fica 754 Por definição 7559 compare a Equação 755 com a Equação 356 Como os números que entram na Equação 755 são calculados rotineiramente é fácil obter o R2 Note que R2 assim como r2 se situa entre 0 e 1 Se for l a linha de regressão ajustada explicará 9 note que R2 também pode ser calculado do seguinte modo ECONOBOOKindb 213 23112010 071250 214 Parte Um Modelos de regressão com equação única 100 da variação de Y Por outro lado se for 0 o modelo não explicará nada da variação de Y De modo geral R está entre esses valores extremos Dizse que a qualidade do ajustamento é melhor quanto mais próximo R2 situarse de l Lembrese de que no caso de duas variáveis definimos r como o coeficiente de correlação e dissemos que ele mede o grau de associação linear entre duas variáveis O coeficiente análogo a r para três ou mais variáveis é o coeficiente de correlação múltipla denotado por R e que mede o grau de associação entre Y e todas as variáveis explanatórias em conjunto Embora r possa ser positivo ou negativo R sempre será positivo Contudo na prática R tem pouca importância O indicador mais representativo é R2 Antes de prosseguirmos vejamos a seguinte relação entre R2 e a variância de um coeficiente par cial de regressão no modelo de regressão múltipla com k variáveis dado na Equação 7420 756 em que ØOj é o coeficiente parcial de regressão do regressor Xj e Rj 2 é o R2 da regressão de Xj contra os restantes k 2 regressores Nota há k 1 regressores no modelo com k variáveis Embora a utilidade da Equação 756 fique evidente no Capítulo 10 sobre multicolinearidade note que essa equação é apenas uma extensão da fórmula da Equação 7412 ou da Equação 7415 para o modelo de regressão com três variáveis um regressando e dois regressores 76 Exemplo ilustrativo exeMPlo 71 Mortalidade infantil em relação ao PNB per capita e à taxa de alfabetização feminina no Capítulo 6 consideramos o comportamento da mortalidade infantil mi em relação ao Pnb per capita Pnbpc e verificamos que essa variável tinha um impacto negativo na mortalidade infantil como seria de esperar agora vejamos a alfabetização das mulheres medida pela taxa de alfabetização feminina TaF A priori esperamos que a TaF também tenha uma influência negativa sobre a mi Quando incluímos as duas variáveis no modelo precisamos isolar a influência de cada um dos regressores Precisamos estimar os coeficientes parciais de regressão de cada regressor nosso modelo é 761 os dados necessários são os da Tabela 64 Tenha em mente que a mi é o número de óbitos de crianças com menos de 5 anos por mil nascidos vivos Pnbpc é o Pnb per capita em 1980 e a TaF é medida em porcentagem nossa amostra é constituída de 64 países Usando o programa estatístico eviews6 obtivemos os seguintes resultados 762 em que os números entre parênteses são os erros padrão estimados antes de interpretar essa regressão observe o coeficiente parcial angular do Pnbpc especificamente 00056 não é exatamente o mesmo que o obtido por meio do processo em três etapas examinado na seção anterior veja a equação 735 mas isso deveria surpreender você não mas os dois erros padrão são exatamente iguais o que também não deveria surpreender Fizemos isso sem aquele trabalhoso procedimento em três etapas veja a Seção 78 Continua ECONOBOOKindb 214 23112010 071251 Capítulo 7 Análise de regressão múltipla o problema da estimação 215 exeMPlo 71 Continuação agora vamos interpretar os coeficientes da regressão 00056 é o coeficiente parcial de regressão do Pnbpc e diz que mantida constante a influência da TaF quando o Pnbpc au menta por exemplo em um dólar a mortalidade infantil reduzse em média de 00056 unidade Para facilitarmos a interpretação econômica podemos dizer que se o Pnb per capi ta aumenta em 1000 o número de óbitos de crianças com menos de 5 anos cai em mé dia de cerca de 56 por mil nascimentos vivos o coeficiente 22316 indica que mantida constante a influência do Pnbpc o número de óbitos de crianças de menos de 5 anos reduzse em média em cerca de 223 por mil nascidos vivos quando a taxa de alfabetização feminina aumenta em um ponto percentual o valor do intercepto de cerca de 263 interpretado mecanicamente significa que se os valores do Pnbpc e da TaF fossem fixados em zero a mortalidade infantil média seria de cerca de 263 óbitos por mil nascidos vivos obviamente essa interpretação deve ser vista com certa reserva Tudo o que podemos inferir é que se os dois regressores fossem fixados em zero a mortalidade infantil seria bas tante alta o que faz sentido prático o valor de R2 de aproximadamente 071 significa que cerca de 71 da variação da mortalidade infantil pode ser explicada por Pnbpc e TaF um valor bastante alto considerando que R2 pode chegar no máximo a 1 enfim os resultados da regressão fazem sentido e quanto à significância estatística dos coeficientes estimados Trataremos desse assunto no Capítulo 8 Como veremos sob muitos aspectos este capítulo será uma extensão do Capí tulo 5 que tratou o modelo com duas variáveis Como mostraremos também existem algu mas diferenças importantes na inferência estatística no teste de hipóteses entre os modelos de duas variáveis e os de regressão múltipla Regressão com variáveis padronizadas No capítulo anterior apresentamos o tópico sobre regressão com variáveis padronizadas e afirma mos que a análise pode ser estendida a regressões com muitas variáveis Lembrese de que uma variável é considerada padronizada se estiver expressa em termos de desvios em relação à média e dividida por seu desvio padrão No exemplo da mortalidade infantil os resultados são os seguintes PNBpc TAF R 763 Nota as variáveis com asterisco são variáveis padronizadas Observe também que nesse modelo não há intercepto pelas razões expostas no capítulo anterior Como você pode ver nessa regressão com a TAF mantida constante o aumento de um desvio pa drão no PNBpc leva em média a uma redução de 02026 desvio padrão na MI Do mesmo modo se o PNBpc for mantido constante o aumento de um desvio padrão na TAF levará em média a uma re dução de 07639 desvio padrão na MI Em termos relativos a alfabetização feminina tem mais in fluência sobre a mortalidade infantil do que o PNB per capita Aqui você pode ver a importância de usar variáveis padronizadas pois a padronização permite dispor todas as variáveis em pé de igualdade todas as variáveis padronizadas têm média zero e variância unitária impacto sobre a variável dependente da variação de uma unidade em mais de um regressor Antes de prosseguir suponha que você queira descobrir o que aconteceria com a taxa de mortali dade infantil se aumentássemos o PNBpc e a TAF simultaneamente Suponha que o PNB aumentasse em 1 dólar e ao mesmo tempo a alfabetização feminina aumentasse em um ponto percentual Qual seria o impacto dessa variação simultânea sobre a taxa de mortalidade infantil Para descobrirmos tudo o que precisamos fazer é multiplicar os coeficientes do PNBpc e da TAF pelas variações propostas e adicionar os termos resultantes Em nosso exemplo isso dá ECONOBOOKindb 215 23112010 071252 216 Parte Um Modelos de regressão com equação única Como resultado dessa variação simultânea no PNBpc e na TAF o número de óbitos de crianças com menos de 5 anos cairia em cerca de 224 mortes De modo mais geral se quisermos verificar o impacto total sobre a variável dependente da varia ção de uma unidade em mais de um regressor só precisaremos multiplicar os coeficientes desses re gressores pela variação proposta e somar os produtos Note que o termo de intercepto não entra nesses cálculos Por quê 77 Regressão simples no contexto da regressão múltipla uma introdução ao viés de especificação Lembrese de que a Hipótese 7110 do modelo clássico de regressão linear afirma que o modelo de regressão utilizado na análise está corretamente especificado não há viés de especificação ou erro de especificação veja no Capítulo 3 algumas observações iniciais Embora o tópico sobre erro de especificação seja visto com mais detalhes no Capítulo 13 o exemplo da seção anterior nos oferece ótima oportunidade não apenas de reforçar a importância da Hipótese 7110 mas também de lançar mais luz sobre o significado do coeficiente parcial de regressão e proporcionar uma introdução um tanto informal ao tópico do viés de especificação Suponha que a Equação 761 seja o modelo que explica verdadeiramente o comportamento da mortalidade infantil em relação ao PNB per capita e à taxa de alfabetização feminina TAF Mas suponha que deixemos de lado a TAF e estimemos a seguinte regressão simples 771 em que Y H MI e X2 H PNBpc Como a Equação 761 é o verdadeiro modelo estimar a Equação 771 constituiria um erro de especificação sendo o erro a omissão da variável X3 a taxa de alfabetização feminina Note que esta mos usando símbolos diferentes para os parâmetros os alfas na Equação 771 para distinguilos dos verdadeiros parâmetros os betas dados na Equação 761 Será que α2 oferecerá uma estimativa não viesada da verdadeira influência do PNBpc dada por Ø2 no modelo 761 Será E H αO 2 H Ø2 em que αO 2 é o valor estimado de α2 Em outras palavras o coeficiente do PNBpc na Equação 771 fornecerá uma estimativa não viesada da verdadeira in fluência do PNBpc sobre a MI sabendose que omitimos a variável X3 TAF do modelo Como você suspeita de modo geral αO 2 não será um estimador não viesado do verdadeiro Ø2 Para termos uma ideia do viés calculamos a regressão 771 que obteve os seguintes resultados pc 772 Observe alguns detalhes na comparação entre esta regressão e a regressão múltipla verdadeira 761 1 Em termos absolutos desconsiderando o sinal o coeficiente do PNBpc aumentou de 00056 para 00114 um aumento de quase duas vezes 2 Os erros padrão são diferentes 3 Os valores do intercepto são diferentes 4 Os valores de r2 divergem substancialmente embora em geral seja normal que à medida que o número de regressores no modelo aumenta o valor de r2 também aumente ECONOBOOKindb 216 23112010 071253 Capítulo 7 Análise de regressão múltipla o problema da estimação 217 Agora suponha que você calcule a regressão da mortalidade infantil contra a taxa de alfabetização feminina desconsiderando a influência do PNBpc Os resultados obtidos foram os seguintes 773 Comparando novamente os resultados desta regressão mal especificada com os da regressão múltipla verdadeira você verá que os resultados são diferentes embora neste caso as diferenças não sejam tão notáveis quanto no caso da regressão 772 Um aspecto importante a observar é que uma especificação equivocada do modelo pode ter graves consequências Veremos isso mais a fundo no Capítulo 13 sobre erros de especificação 78 R2 e R2 ajustado Uma propriedade importante do R2 é que ele é uma função não decrescente do número de variá veis explanatórias ou regressores presentes no modelo a menos que a variável adicionada seja per feitamente colinear com os outros regressores À medida que o número de regressores aumenta quase invariavelmente R2 aumenta e nunca diminui Dito de outra forma uma variável X adicional não reduz o valor de R2 Compare por exemplo a regressão 772 ou a 773 com a 762 Para ver isso lembrese de que a definição dos coeficientes de determinação 781 Agora é independente do número de variáveis X do modelo porque é apenas A SQR no entanto depende do número de regressores do modelo Intuitivamente fica claro que à medida que a quantidade de variáveis X aumenta tende a diminuir ou pelo menos não aumenta assim R2 tal como definido na Equação 781 aumentará Em vista disso ao comparar mos dois modelos de regressão com a mesma variável dependente mas com número diferente de variáveis X poderíamos ser levados a escolher o modelo com o R2 mais alto Para comparar dois termos R2 é preciso levar em conta o número de variáveis X do modelo Isso pode ser feito se considerarmos um coeficiente de determinação alternativo que é o seguinte 782 em que k H número de parâmetros do modelo incluindo o termo de intercepto Na regressão com três variáveis k H 3 Por quê O R2 assim definido é conhecido como o R2 ajustado denotado por R 2 O termo ajustado significa ajustado pelos graus de liberdade associados à soma de quadrados que entra na Equação 781 tem n k graus de liberdade envolvendo k parâmetros o que inclui o termo de intercepto e tem n l graus de liberdade Por quê Para o caso de três variáveis sabemos que tem n 3 graus de liberdade A Equação 782 também pode ser escrita como 783 ECONOBOOKindb 217 23112010 071254 218 Parte Um Modelos de regressão com equação única em que æO2 é a variância residual um estimador não viesado do verdadeiro σ2 e SY 2 é a variância amos tral de Y É fácil verificar que R 2 e R2 relacionamse porque substituindo a Equação 781 na Equação 782 obtemos 784 Com base na Equação 784 fica imediatamente claro que 1 para k l R 2 R2 o que implica que à medida que o número de variáveis X aumenta o R2 ajustado aumenta menos que o R2 não ajustado e 2 R 2 pode ser negativo embora R2 seja necessariamente não negativo10 Se em uma apli cação R 2 for negativo seu valor será tomado como zero Qual R2 deveria ser empregado na prática Como Theil observa é uma boa prática usar R 2 em vez de R2 porque este tende a oferecer um quadro otimista do ajustamento da regressão principalmente quando o número de variáveis explanatórias não é muito pe queno em relação ao número de observações11 Mas a opinião de Theil não é compartilhada amplamente pois ele não ofereceu nenhuma justifi cativa teórica geral para a superioridade do R 2 Por exemplo Goldberger argumenta que o R2 a seguir que chama de R2 modificado funcionará igualmente bem12 785 Seu conselho é relatar o R2 o n e o k e deixar ao leitor decidir como fazer o ajustamento de R2 levando em conta n e k A despeito dessa advertência é o R2 ajustado tal como dado na Equação 784 que é adotado pela maior parte dos programas de estatística juntamente com o R2 convencional O leitor é aconse lhado a tratar R 2 como mais uma estatística sintética Vale mencionar que no caso da regressão da mortalidade infantil 762 seria conveniente ao leitor verificar se R 2 é 06981 mantendo em mente que neste exemplo n 1 H 63 e n k H 60 Como esperado o R 2 de 06981 é menor que o R2 de 07077 Além do emprego do R2 e do R2 ajustado como medidas da qualidade do ajustamento muitas vezes são usados outros critérios para avaliar a adequação de um modelo de regressão Dois deles são o critério de informação de Akaike e o critério de previsão de Amemiya utilizados para fazer a seleção entre modelos substitutos Falaremos desses critérios quando considerarmos em mais detalhes o problema da seleção de modelos em capítulo mais à frente veja o Capítulo 13 Comparação de dois valores de R2 É fundamental observar que ao comparar dois modelos com base no coeficiente de determinação ajustado ou não o tamanho da amostra n e a variável dependente devem ser os mesmos as variá veis explanatórias podem assumir qualquer forma No caso dos modelos 786 787 10 note contudo que se R2 D 1 R 2 D R2 D 1 Quando R2 D 0 R 2 D 1 k n k caso em que R 2 pode ser negativo se k 1 11 Theil henry Introduction to econometrics englewood Clifís n J Prentice hall 1978 p 135 12 GoldberGer arthur S A course in econometrics Cambridge mass harvard University Press 1991 p 178 Para uma opinião mais crítica do R2 veja Cameron S Why is the R squared adjusted reported Journal of Quantitative Economics jan 1993 v 9 n l p 183186 o autor argumenta que ele R2 nÃo é um teste esta tístico e parece não haver uma justificativa intuitiva clara para seu uso como estatística descritiva Por fim deveria ser claro para nós que não é uma ferramenta eficaz para prevenir a garimpagem de dados p 186 ECONOBOOKindb 218 23112010 071256 Capítulo 7 Análise de regressão múltipla o problema da estimação 219 os R2 obtidos não podem ser comparados A razão é a seguinte por definição R2 mede a proporção da variação da variável dependente explicada pelos regressores Na Equação 786 R2 mede a proporção da variação em ln Y explicada por X2 e X3 enquanto na Equação 787 ele mede a propor ção da variação em Y e os dois não são a mesma coisa como visto no Capítulo 6 uma variação em ln Y dá uma variação relativa ou proporcional em Y enquanto uma variação em Y dá uma variação absoluta Portanto var YOi var Yi não é igual a isto é os dois coeficientes de determinação não são o mesmo13 Como é possível comparar os R2 de dois modelos quando o regressando não está expresso do mesmo modo Para responder a isso consideremos um exemplo numérico exeMPlo 72 Consumo de café nos Estados Unidos 19701980 Considere os dados da Tabela 71 eles dizem respeito ao consumo de xícaras de café por dia Y e o preço real do café no varejo X nos estados Unidos no período 19701980 apli cando o método dos mínimos quadrados ordinários aos dados obtemos os seguintes resulta dos da regressão 788 esses resultados fazem sentido do ponto de vista econômico À medida que os preços do café aumentam em média o consumo de café diminui cerca de meia xícara por dia o valor de r 2 de cerca de 066 indica que o preço do café explica cerca de 66 da variação do consumo de café o leitor pode verificar facilmente que o coeficiente angular é estatis ticamente significativo Tabela 71 Consumo de café nos Estados Unidos Y em relação ao preço médio no varejo X 19701980 Fonte Os dados relativos a Y foram extraídos de Summary of National Coffee Drinking Study Data Group Elkins Park Penn 1981 e os dados relativos a X nominal preços correntes do café são de Nielsen Food Index A C Nielsen Nova York 1981 Agradeço a Scott E Sandberg pela coleta dos dados Nota O preço nominal foi dividido pelo IPC de alimentos e bebidas 1967 H 100 Continua 13 da definição de R2 sabemos que para o modelo linear e para o modelo logarítmico Como os denominadores do lado direito dessas expressões são diferentes não podemos comparar os dois R2 diretamente Como mostra o exemplo 72 para a especificação linear a SQr H 01491 a soma dos quadrados dos resíduos do consumo de café e para o modelo loglinear a SQr H 00226 a soma dos quadrados dos resíduos do logaritmo do consumo de café esses resíduos são de ordens diferentes de magnitude e portanto não po dem ser comparados diretamente ECONOBOOKindb 219 23112010 071257 220 Parte Um Modelos de regressão com equação única exeMPlo 72 Continuação Com os mesmos dados podese estimar o seguinte modelo loglog ou de elasticidade constante 789 Como este é um modelo loglog o coeficiente angular oferece uma estimativa direta do coeficiente da elasticidadepreço neste caso diz que se o preço do café por libra de peso aumentar em 1 o consumo diário de café cairá em média cerca de 025 lembrese de que no modelo linear 788 o coeficiente angular só nos mostra a taxa de variação do con sumo de café em relação ao preço Como você estimará a elasticidadepreço no caso do mo delo linear o valor de r 2 de cerca de 074 significa que cerca de 74 da variação do logaritmo da demanda por café é explicada pela variação no logaritmo do preço do café Como o valor de r 2 no modelo linear de 06628 é menor que o do modelo loglinear de 07448 você pode ficar tentado a escolher o segundo modelo em função desse r 2 mais alto mas pelas razões já expostas não é possível proceder desse modo Se quiser comparar os dois valores de r 2 você deve fazer o seguinte 1 Calcular lnYt com base na equação 789 para cada observação isto é obter o valor esti mado em logaritmo de cada observação deste modelo Tomar o antilogaritmo corres pondente a esses valores e calcular r 2 entre esses valores do antilogaritmo e o Yt efetivo da forma indicada pela equação 3514 esse valor de r 2 é comparável ao valor de r 2 do modelo linear 788 2 Como alternativa supondo que todos os valores de Y sejam positivos obtenha os logaritmos dos valores de Y ln Y obter os valores estimados de Y YOt de acordo com o modelo linear 788 tomar os logaritmos desses valores estimados de Y isto é in YOt e calcular o r2 entre in Yt e in YOt conforme indicado na equação 3514 esse valor de r 2 é comparável com o valor obtido na equação 789 apresentamos para este exemplo de consumo de café os dados brutos necessários para o cálculo dos r 2 comparáveis com base na Tabela 72 Para compararmos o valor do r 2 do mode lo linear 788 com aquele de 789 primeiro obtemos o log de YOt dado na coluna 6 da Tabela 72 então obtemos os logaritmos dos valores efetivos de Y dados na coluna 5 da ta bela e por fim calculamos o r 2 entre esses dois conjuntos de valores usando a equação 3514 o resultado é um r 2 de 06779 que agora podemos comparar com o valor de r 2 obtido no modelo loglinear 07448 a diferença entre os dois valores de r 2 é de cerca de 007 Tabela 72 Dados brutos para comparação dos dois valores de R2 Notas Coluna 1 valores efetivos de Y constantes da Tabela 71 Coluna 2 valores de Y estimados com o modelo linear 788 Coluna 3 logaritmos de Y estimados com o modelo loglog 789 Coluna 4 antilogaritmos dos valores constantes da coluna 3 Coluna 5 logaritmos dos valores de Y constantes da coluna 1 Coluna 6 logaritmos dos valores de Y constantes da coluna 2 Continua ECONOBOOKindb 220 23112010 071258 Capítulo 7 Análise de regressão múltipla o problema da estimação 221 exeMPlo 72 Continuação Por outro lado se quisermos comparar o valor do r 2 obtido no modelo loglinear com o do modelo linear precisaremos obter lnYt para cada observação da equação 789 dada na co luna 3 da tabela obter os antilogaritmos correspondentes dados na coluna 4 da tabela e por fim calcular o r 2 entre esses antilogaritmos e os valores efetivos de Y usando a Fórmula 3514 isso nos dará um valor de r 2 igual a 07187 que é ligeiramente mais alto que aque le obtido no modelo linear 788 ou seja 06628 Qualquer que seja o método empregado parece que o modelo loglinear proporciona um melhor ajustamento Distribuição de R2 entre os regressores Voltemos ao exemplo da mortalidade infantil Vimos na Equação 762 que os dois regressores PNBpc e TAF explicam 07077 ou 7077 da variação da mortalidade infantil Mas considere agora a regressão 772 em que excluímos a variável TAF e como resultado o valor do r2 caiu para 01662 Isso quer dizer que a diferença de 05415 07077 01662 pode ser atribuída à variável excluída TAF Por outro lado se você considerar a regressão 773 em que excluímos a variável PNBpc o valor do r2 cairá para 06696 Será que isso indica que a diferença de 00381 07077 06696 no valor do r2 devese à exclusão da variável PNBpc A pergunta então é podemos distribuir o valor de R2 07077 entre os dois regressores PNBpc e TAF desse modo Infelizmente não podemos fazer isso pois a alocação depende da ordem em que os regressores entram como acabamos de ilustrar Parte do problema está no fato de que os dois regres sores estão correlacionados sendo o coeficiente de correlação de 02685 verifique na Tabela 64 Na maioria das aplicações com vários regressores a correlação entre eles é um problema comum Obviamente o problema será muito grave se houver perfeita colinearidade entre os regressores A melhor orientação prática é que há pouco sentido em tentar distribuir o valor de R2 entre os regressores que o determinam o jogo da maximização de R 2 Antes de concluirmos esta seção cabe uma advertência Às vezes os pesquisadores entram no jogo da maximização do R 2 escolhem o modelo que fornece o maior R 2 Mas isso pode ser perigoso pois na análise de regressão nosso objetivo não é obter um R 2 alto per se mas em vez disso obter estimativas confiáveis dos verdadeiros coeficientes de regressão para a população e fazer inferências estatísticas a respeito deles Na análise prática não é raro obter um R 2 muito elevado e verificar que alguns dos coeficientes de regressão são estatisticamente não significativos ou apresentam sinais contrários aos esperados Portanto o pesqui sador deve preocuparse mais com a relevância lógica ou teórica das variáveis explanatórias em relação à variável dependente e em sua significância estatística Se nesse processo obtivermos um R 2 alto ótimo por outro lado se o R 2 for baixo não significa que o modelo seja necessariamente ruim14 A propósito Goldberger tem uma visão muito crítica do papel do R2 Ele disse Em nosso ponto de vista R2 tem um papel muito modesto na análise de regressão sendo uma medida da qualidade do ajustamento de uma regressão linear de mínimos quadrados amostrais em um conjunto de dados 14 alguns autores preferem relativizar o uso de R2 como medida de qualidade do ajustamento bem como seu uso para comparar dois ou mais valores de R2 veja aChen Christopher h Interpreting and using regression beverty hills Calif Sage Publications 1982 p 5867 e GranGer C neWbold F R2 and the transformation of regression variables Journal of Econometrics 1976 v 4 p 205210 Casualmente note que a prática da escolha de um mo delo com base no R2 mais elevado uma espécie de garimpagem de dados introduz o que é conhecido como viés do préteste que pode destruir algumas das propriedades dos estimadores de mQo do modelo clássico de regressão linear Sobre esse tópico o leitor pode consultar JUdGe George G hill Carter r GriFFiThS William e lüTKePohl helmuth lee TsuongChao Introduction to the theory and practice of econometrics nova York John Wiley 1982 cap 21 ECONOBOOKindb 221 23112010 071259 222 Parte Um Modelos de regressão com equação única Nada no modelo clássico de regressão exige que R2 seja alto Logo um R2 elevado não é uma evidência favorável ao modelo tampouco um R2 baixo constitui prova desfavorável Na verdade o mais importante do R2 é que ele não tem importância no modelo clássico de regres são O modelo clássico de regressão trata de parâmetros da população não da qualidade do ajustamento da amostra Quando se insiste em uma medida de sucesso de previsão ou melhor de fracasso talvez σ2 seja suficiente afinal ele é o quadrado do erro de previsão esperado que resultaria se a população FRP fosse usada como previsor Como alternativa o erro padrão da previsão elevado ao quadrado para valores relevantes de x regressores pode ser bastante informativo15 79 A função de produção CobbDouglas mais sobre formas funcionais Na Seção 64 mostramos como com transformações adequadas podemos converter relações não lineares em relações lineares para trabalharmos dentro do marco de referência do modelo clássico de regressão linear As várias transformações examinadas no contexto do caso de duas variá veis podem ser facilmente estendidas aos modelos de regressão múltipla Nesta seção demonstra mos tais transformações partindo do modelo loglinear outras transformações serão encontradas nos exercícios e nos exemplos apresentados ao longo do livro O exemplo específico a ser discutido agora é a famosa função de produção CobbDouglas da teoria da produção A função de produção CobbDouglas em sua forma estocástica pode ser expressa como 791 em que Y H produção X2 H insumo trabalho X3 H insumo capital u H termo de erro estocástico e H logaritmo de base natural Com base na Equação 791 fica claro que a relação entre a produção e os dois insumos não é linear Contudo se transformarmos logaritmicamente este modelo obteremos 792 em que Ø0 H ln Ø1 Escrito desse modo o modelo é linear nos parâmetros Ø0 Ø2 e Ø3 e portanto é um modelo de re gressão linear Note porém que é não linear nas variáveis Y e X mas é linear nos logaritmos dessas variá veis Em resumo a Equação 792 é um modelo loglog duplo log ou log linear a contrapartida do modelo loglinear 653 de duas variáveis agora em termos de regressão múltipla As propriedades da função de produção CobbDouglas são bem conhecidas 1 Ø2 é a elasticidade parcial do produto em relação ao insumo trabalho mede a variação percentual da produção quando se verifica por exemplo uma variação de l no insumo trabalho enquanto o capital é mantido constante veja o Exercício 79 2 Do mesmo modo Ø3 é a elasticidade parcial do produto em relação ao insumo capital mantido constante o trabalho 3 A soma Ø2 C Ø3 informa a respeito dos retornos de escala a resposta do produto a uma variação proporcional nos insumos Se essa soma for igual a l haverá retornos constantes de escala isto é se dobrarmos os insumos a produção dobrará se os triplicarmos a produção triplicará e assim por 15 GoldberGer arthur S op cit p 177178 ECONOBOOKindb 222 23112010 071259 Capítulo 7 Análise de regressão múltipla o problema da estimação 223 diante Se a soma for menor que l haverá retornos decrescentes de escala se dobramos os insu mos a produção aumenta menos que o dobro Por fim se a soma for maior que 1 haverá retornos crescentes de escala quando dobramos os insumos a produção crescerá mais de duas vezes Antes de prosseguir note que sempre que temos um modelo de regressão loglinear envolvendo qualquer número de variáveis o coeficiente de cada variável X mede a elasticidade parcial da variá vel dependente Y em relação àquela variável Em um modelo loglinear com k variáveis 793 cada um dos coeficientes parciais de regressão de Ø2 a Øk é a elasticidade parcial de Y em relação às variáveis de X2 a Xk1617 exeMPlo 73 Valor agregado horas de trabalho e insumo capital no setor de transformação Para ilustrar a função de produção Cobbdouglas apresentamos os dados da Tabela 73 que se referem ao setor de transformação para todos os 50 estados e a capital Washington dC dos estados Unidos em 2005 Supondo que o modelo 792 atenda às hipóteses do modelo clássico de regressão li near17 obtivemos a seguinte regressão pelo método dos mQo veja na Seção 7a5 do apêndice 7a a tela do computador com o resultado Tabela 73 Valor agregado horas de trabalho e insumo capital no setor de transformação Continua 16 Para melhor entender derive parcialmente 793 com relação ao log de cada variável X assim in Y in X2 Y X2X2 Y Ø2 que é por definição a elasticidade de Y em relação a X2 e in Y in X3 Y X3X3 Y Ø3 que é a elasticidade de Y em relação a X3 e assim por diante 17 observe que na função de produção Cobbdouglas 791 incluímos o termo de erro estocástico de forma especial para que a transformação logarítmica resultante entre na forma linear habitual a esse respeito veja a Seção 69 ECONOBOOKindb 223 23112010 071301 224 Parte Um Modelos de regressão com equação única exeMPlo 73 Continuação Tabela 73 Continuação Fonte 2005 Annual Survey of Manufacturers Setor 31 Supplemental Statistics for US 794 Com base na equação 794 vemos que no setor de transformação dos estados Unidos em 2005 as elasticidades da produção em relação ao trabalho e ao capital foram de 04683 e 05213 respectivamente em outras palavras nos 50 estados americanos e no distrito de Columbia mantido constante o capital um aumento de 1 no insumo trabalho levou em média a um aumento de cerca de 047 na produção da mesma forma mantidas cons tantes as horas trabalhadas um aumento de 1 no insumo capital levou em média a um aumento de 052 na produção Somando as duas elasticidades obtemos 099 que é o valor do parâmetro dos retornos de escala Como fica evidente durante o período estudado o setor de transformação para os 50 estados americanos e o distrito de Columbia caracteriza vase pelos retornos constantes de escala Sob um ponto de vista puramente estatístico a linha de regressão estimada ajustase mui to bem aos dados o valor de R2 09642 significa que cerca de 96 da variação do logarit mo da produção é explicada por logaritmos do trabalho e do capital no Capítulo 8 veremos como podemos usar os erros padrão estimados para testar hipóteses sobre os verdadeiros valores dos parâmetros da função de produção Cobbdouglas aplicada ao setor de transfor mação dos estados Unidos ECONOBOOKindb 224 23112010 071301 Capítulo 7 Análise de regressão múltipla o problema da estimação 225 fiGuRa 71 A curva em U de custo marginal CM Produção X Y Custo marginal 710 Modelos de regressão polinomial Agora consideraremos uma classe de modelos de regressão múltipla os modelos polinomiais que têm sido muito usados nas pesquisas econométricas relativas a funções de custo e de produção Ao apresentarmos estes modelos ampliamos a gama de especificações às quais o modelo clássico de re gressão linear pode ser facilmente aplicado Para fixar a ideia considere a Figura 71 que relaciona o custo marginal CM de produção de curto prazo Y de um bem com o nível de sua produção X A curva de CM traçada a olho na figura é a curva em U dos manuais e mostra que a relação entre o CM e a produção não é linear Se fôssemos quantificar essa relação com base nos pontos de dispersão como faríamos Em outras palavras que tipo de modelo econométrico captaria a natureza primeiro decrescente e depois crescente dos custos marginais Sob o aspecto geométrico a curva de CM da Figura 71 representa uma parábola Matematica mente a parábola é representada pela seguinte equação 7101 que é conhecida como função quadrática ou de modo mais geral polinômio de segundo grau na variável X o expoente mais alto de X representa o grau do polinômio se acrescentássemos X 3 à função anterior teríamos um polinômio de terceiro grau e assim por diante A versão estocástica de 7101 pode ser representada como 7102 e é denominada regressão polinomial de segundo grau A forma geral da regressão polinomial de késimo grau pode ser escrita como 7103 Observe que nesses tipos de regressão polinomial só há uma variável explanatória do lado direito mas ela aparece elevada a várias potências o que a torna um modelo de regressão múltipla Casualmente note que se considerarmos que Xi seja fixo ou não estocástico os termos de Xi elevados a uma potên cia também se tornam fixos ou não estocásticos Será que esses modelos apresentam algum problema especial de estimação Como o polinômio de segundo grau 7102 ou de késimo grau 7103 é linear nos parâmetros os Ø podem ser estimados pelo método de mínimos quadrados ordinários ou da máxima verossimilhança Mas o que podemos dizer sobre o problema da colinearidade As diversas variáveis X não estarão altamente correlacionadas já que são potências de X Sim mas lembrese de que termos como X 2 X 3 X 4 etc são todos funções não lineares de X e portanto estritamente falando não desrespeitam a ECONOBOOKindb 225 23112010 071303 226 Parte Um Modelos de regressão com equação única hipótese da ausência de multicolinearidade Em resumo os mode los de regressão polinomial podem ser estimados com as técnicas deste capítulo e não apresentam novos problemas de estimação exeMPlo 74 Estimativa da função de custo total Como um exemplo da regressão polinomial considere os dados sobre produção e custo total de um bem no curto prazo apresentados na Tabela 74 Que tipo de modelo de regres são se ajustaria a esses dados Para este propósito vejamos primeiro o diagrama de dispersão da Figura 72 Com base na figura fica claro que a relação entre custo total e produção assemelhase a uma curva em S alongado note como a curva de custo total primeiro aumenta gradualmen te e depois aceleradamente como previsto pela famosa lei dos rendimentos decrescentes a forma de S da curva de custo total pode ser capturada pelo seguinte modelo cúbico ou poli nômio de terceiro grau 7104 em que Y H custo total e X H produção Com base nos dados da Tabela 74 podemos aplicar o método dos mQo para estimar os parâmetros da equação 7104 mas antes vejamos o que a teoria econômica diz a respeito da função cúbica de custos a curto prazo 7104 a teoria elementar dos preços mostra que a curto prazo as curvas de custo marginal Cm e de custo médio Cme apresentam de modo geral forma de U e inicialmente tanto o Cm quanto o Cme caem mas depois de atingir determinado nível de produção as duas curvas voltamse para cima em consequên cia da já mencionada lei dos rendimentos decrescentes isso pode ser visto na Figura 73 veja também a Figura 71 e como as curvas de custos marginal e médio derivam da curva de custo total a natureza dessa forma de U impõe algumas restrições aos parâmetros da curva de custo total 7104 Tabela 74 Custo total Y e produção X fiGuRa 72 Curva de custo total Custo total da produção produção X 1 2 3 4 5 6 7 8 9 10 Produção 450 400 350 300 250 200 150 Custo total de produção Y Continua ECONOBOOKindb 226 23112010 071304 Capítulo 7 Análise de regressão múltipla o problema da estimação 227 exeMPlo 74 Continuação fiGuRa 73 de custo a curto prazo X Pordução Custo Y CT CM CMe X Y Produção Custo na verdade é possível demonstrar que os parâmetros de 7104 devem atender às seguintes restrições para que se observe a típica forma de U das curvas de custo marginal e médio de curto prazo18 7105 Toda essa discussão teórica pode parecer um tanto tediosa mas este conhecimento é extre mamente útil para o exame de resultados práticos pois se eles não estiverem de acordo com as expectativas supondo que não tenhamos cometido um erro de especificação escolhido o mode lo errado teremos de modificar a teoria ou procurar uma nova teoria e recomeçar toda a inves tigação mas como observado na introdução essa é a natureza de qualquer investigação Resultados práticos ajustando uma regressão polinomial de terceiro grau aos dados da Tabe la 74 obtemos os seguintes resultados 7106 Nota os números entre parênteses são os erros padrão estimados embora examinaremos a significância estatística desses resultados no próximo capítulo o leitor pode verificar desde já que eles estão em conformidade com as expectativas teóricas listadas na equação 7105 Como um exercício deixamos ao leitor a interpretação da regressão 7106 mais um exemplo econômico do modelo de regressão polinomial é dado pelos seguintes resultados TCPibi H 55347 55788 PibPCr C 28378 PibPCr2 7107 18 18 veja ChianG alpha C Fundamental methods of mathematical economics 3 ed nova York mcGrawhill 1984 p 250252 ECONOBOOKindb 227 23112010 071306 228 Parte Um Modelos de regressão com equação única exeMPlo 75 Taxa de crescimento do PIB e PIB per capita relativo para 2007 em 190 países em desenvolvimento em bilhões de dólares de 2000 em que TCPib H taxa de crescimento do Pib em 2007 e PibPCr H TCP per capita relativo em 2007 como do Pib per capita dos estados Unidos 2007 o R2 ajustado R2 aj informa que levando em conta o número de regressores o modelo explica apenas 996 da variação da TCPib mesmo o R2 não ajustado de 01092 parece baixo esses valores podem parecer desapon tadores mas como mostraremos no próximo capítulo esses R2 baixos são encontrados com frequência em dados de corte transversal com grande número de observações além disso até um valor aparentemente baixo de R2 pode ser estatisticamente significativo isto é diferente de zero como mostraremos no próximo capítulo Fonte Indicadores de Desenvolvimento do Banco Mundial ajustados para a base de 2000 e valores estimados projetados e desenvolvidos pelo Economic Research Service 711 Coeficientes de correlação parcial explicação de coeficientes de correlação simples e parcial No Capítulo 3 apresentamos o coeficiente de correlação r como uma medida do grau de associa ção linear entre duas variáveis No caso de um modelo de regressão com três variáveis podemos com putar três coeficientes de correlação r12 correlação entre Y e X2 r13 coeficiente de correlação entre Y e X3 e r23 coeficiente de correlação entre X2 e X3 Note que por conveniência estamos usando o subscrito l para representar Y Esses coeficientes de correlação são denominados coeficientes de cor relação brutos ou simples ou ainda coeficientes de correlação de ordem zero Eles podem ser calcu lados conforme a definição dada na Equação 3513 Mas agora considere esta pergunta será que digamos r12 mede de fato o verdadeiro grau de associação linear entre Y e X2 quando uma terceira variável X3 pode estar associada às outras duas Essa pergunta é análoga à seguinte suponha que o verdadeiro modelo de regressão seja 711 mas que omitimos a variável X3 do modelo e apenas calculamos a regressão de Y contra X2 obtendo o coeficiente angular de por exemplo b12 Esse coeficiente será igual ao verdadeiro coeficiente Ø2 que teríamos obtido ao estimarmos o modelo 711 A resposta deve ser evidente com base no que foi dito na Seção 77 Em geral r12 não refletirá o verdadeiro grau de associação entre Y e X2 na presença de X3 Na verdade tende a dar uma impressão falsa da natureza da associação entre Y e X2 como mostraremos em breve O que precisamos é de um coeficiente de correlação independente da influên cia se é que ela existe de X3 sobre Y e X2 Esse coeficiente de correlação pode ser obtido e é conhecido como coeficiente de correlação parcial Conceitualmente é semelhante ao coeficiente parcial de regres são Definimos r123 H coeficiente de correlação parcial entre Y e X2 mantendo X3 constante r132 H coeficiente de correlação parcial entre Y e X3 mantendo X2 constante r231 H coeficiente de correlação parcial entre X2 e X3 mantendo Y constante Esses coeficientes de correlação parcial podem ser facilmente obtidos por meio do coeficiente de correlação simples ou de ordem zero para uma demonstração veja os exercícios19 7111 opcional 19 muitos programas de computador para análise de regressão múltipla calculam rotineiramente os coeficientes de correlação simples a partir daí é fácil obter os coeficientes de correlação parcial ECONOBOOKindb 228 23112010 071306 Capítulo 7 Análise de regressão múltipla o problema da estimação 229 7112 7113 As correlações parciais dadas pelas Equações 711 l a 7113 são chamadas de coeficientes de corre lação de primeira ordem Por ordem entendemos o número de subscritos secundários Assim r 1 234 seria o coeficiente de correlação de segunda ordem r 1234 5 seria o coeficiente de correlação de terceira ordem e assim por diante Como observado r 1 2 r 1 3 e assim por diante são denominados coeficientes de corre lação simples ou de ordem zero A interpretação de por exemplo r 1 234 é que ele nos dá o coeficiente de correlação entre Y e X2 mantendo X3 e X4 constantes interpretação dos coeficientes de correlação simples e parcial No caso de duas variáveis o r simples tem um significado objetivo mede o grau de associação linear entre a variável dependente Y e a única variável explanatória X Mas quando vamos além do caso de duas variáveis precisamos estar muito atentos à interpretação dos coeficientes de correlação simples Na Equa ção 7111 por exemplo observamos o seguinte 1 Mesmo se r 1 2 H 0 r123 não será igual a zero a menos que r13 ou r23 ou ambos sejam iguais a zero 2 Se r12 H 0 e r13 e r23 forem diferentes de zero e apresentarem o mesmo sinal r123 será nega tivo mas se apresentarem sinais contrários será positivo Um exemplo esclarecerá isso Seja Y H rendimento da colheita X2 H precipitação pluviométrica e X3 H temperatura Suponha que r12 H 0 ou seja que não haja associação entre rendimento da colheita e chuva Suponha ainda que r13 seja positivo e r23 negativo Como mostra a Equação 7111 r123 será positivo isto é man tendo a temperatura constante há uma associação positiva entre rendimento e chuva Esse resultado aparentemente paradoxal não é surpreendente Como a temperatura X3 afeta tanto o rendimento Y quanto a precipitação pluviométrica X2 para encontrarmos a relação líquida entre rendimento da colheita e chuva precisamos remover a influência da variável incômoda temperatura Esse exemplo mostra como podemos ser enganados pelo coeficiente de correlação simples 3 Os termos r123 e r12 e comparações semelhantes não precisam ter o mesmo sinal 4 No caso de duas variáveis vimos que r2 situase entre 0 e 1 A mesma propriedade é válida para o quadrado dos coeficientes de correlação parcial Usando esse fato o leitor pode verificar que é possível obter a seguinte expressão por meio da Equação 7111 7114 que nos dá as interrelações entre os três coeficientes de correlação de ordem zero Expressões semelhantes podem ser obtidas com base nas Equações 7112 e 7113 5 Suponha que r13 H r23 H 0 Isso significa que r12 também é zero A resposta é óbvia a partir da Equação 7114 O fato de Y X3 X2 e X3 não serem correlacionados não significa que Y e X2 não são correlacionados Note que a expressão r 2 123 pode ser denominada coeficiente de determinação parcial e pode ser interpretada como a proporção da variação de Y não explicada pela variável X3 que foi explicada pela inclusão de X2 no modelo veja o Exercício 75 Conceitualmente é semelhante a R2 Antes de prosseguir observe as seguintes relações entre o R2 os coeficientes de correlação sim ples e os coeficientes de correlação parcial 7115 ECONOBOOKindb 229 23112010 071308 230 Parte Um Modelos de regressão com equação única 7116 7117 Ao concluirmos esta seção pensemos no seguinte afirmamos anteriormente que R2 não diminui quando se inclui uma variável explanatória no modelo o que pode ser visto com base na Equação 7116 Essa equação informa que a proporção da variação de Y explicada conjuntamente por X2 e X3 é a soma de duas partes a parte explicada apenas por X2 H r 2 12 e a parte não explicada por X2 H 1 r 2 12 multiplicada pela proporção explicada por X3 depois de manter a influência de X2 constante Agora R2 r 2 12 desde que r 2 132 0 Na pior das hipóteses será igual a zero caso em que R2 H r 2 12 Resumo e conclusões 1 Este capítulo apresentou o mais simples dos modelos de regressão múltipla especificamente o mo delo de regressão de três variáveis Entendese que o termo linear referese à linearidade dos parâme tros e não necessariamente à das variáveis 2 Embora sob muitos aspectos o modelo de regressão com três variáveis seja uma extensão do modelo de duas variáveis há alguns conceitos novos envolvidos tais como os coeficientes parciais de regressão os coeficientes de correlação parcial o coeficiente de correlação múltipla os R2 ajusta dos e não ajustados pelos graus de liberdade a multicolinearidade e o viés de especificação 3 Este capítulo também considerou a forma funcional do modelo de regressão múltipla como a função de produção CobbDouglas e o modelo de regressão polinomial 4 Embora o R2 e o R2 ajustado sejam medidas gerais da qualidade do ajustamento do modelo a um dado conjunto de dados sua importância não deve ser exagerada O fundamental são as expectati vas teóricas subjacentes sobre o modelo em termos de sinais a priori dos coeficientes das variáveis que entram no modelo e como mostraremos no próximo capítulo sua significância estatística 5 Os resultados apresentados neste capítulo podem ser facilmente generalizados para um modelo de regressão linear múltipla com qualquer número de regressores Mas a álgebra tornase muito tediosa Esse tédio pode ser evitado recorrendose à álgebra matricial Para o leitor interessado a extensão para o modelo de regressão com k variáveis usando álgebra matricial é apresentada no Apêndice C que é opcional Mas o leitor em geral pode ler o restante do livro sem conhecer muita álgebra matricial exeRCíCioS 71 Considere os dados da Tabela 75 Tabela 75 Com base nesses dados estime as seguintes regressões 1 2 3 Nota estime apenas os coeficientes não os erros padrão ECONOBOOKindb 230 23112010 071309 Capítulo 7 Análise de regressão múltipla o problema da estimação 231 a α2 H Ø2 Justifique sua resposta b 3 H Ø3 Justifique sua resposta Que conclusão importante você tira deste exercício 72 Com base nos dados a seguir estime os coeficientes parciais de regressão seus erros padrão e os valores de R2 ajustado e não ajustado 73 Mostre que a Equação 747 também pode ser expressa como Onde b23 é o coeficiente angular da regressão de X2 contra X 3 Dica lembrese de que 74 Sabendo que em um modelo de regressão múltipla o termo de erro ui tem a distribuição de proba bilidade ui N0 4 como você montaria um experimento de Monte Carlo para verificar que a variância verdadeira é de fato igual a 4 75 Mostre que r 2 123 H R2 r 2 131 r 2 13 e interprete a equação 76 Se a relação α1X1 C α2X2 C α3X3 H 0 for válida para todos os valores de X1 X2 e X3 obtenha os valores dos três coeficientes de correlação parcial 77 É possível obter os seguintes resultados a partir de um conjunto de dados a r23 H 09 r 13 H 02 r12 H 08 b r12 H 06 r23 H 09 r31 H 05 c r21 H 001 r13 H 066 r23 H 07 78 Considere o seguinte modelo Yi D Ø1 C Ø2Escolaridadei C Ø2Anos de experiência C ui Suponha que você deixe de fora do cálculo a variável anos de experiência Que tipos de problemas ou vieses você esperaria encontrar Explique verbalmente 79 Mostre que em 792 Ø2 e Ø3 representam de fato as elasticidades do produto em relação ao trabalho e ao capital Esta pergunta pode ser respondida sem recorrer ao cálculo basta recordar a definição do coeficiente de elasticidade e lembrar que a variação do logaritmo de uma variável é uma mudança relativa supondo que as variações sejam bem pequenas 710 Considere o modelo de regressão com três variáveis discutido neste capítulo a Suponha que você multiplique todos os valores de X2 por 2 Qual será o efeito dessa mudan ça de escala se existir algum sobre a estimativa dos parâmetros e seus erros padrão b Agora em vez de a suponha que todos os valores de Y sejam multiplicados por 2 Qual será o efeito dessa mudança de escala se existir algum sobre a estimativa dos parâmetros e seus erros padrão 711 Em geral R2 r 2 12 C r 2 13 mas isso só acontece se r23 H 0 Comente e destaque a importância deste resultado Dica veja a Equação 7115 Capítulo 7 Análise de regressão múltipla o problema da estimação 231 ECONOBOOKindb 231 23112010 071310 232 Parte Um Modelos de regressão com equação única 712 Considere os seguintes modelos20 Modelo A Yt H α1 C α2X2t C α3X3t C u1t Modelo B Yt X2t H Ø1 C Ø2X2C Ø3 X3t C u2t a As estimativas de MQO de α1 e Ø1 serão as mesmas Por quê b As estimativas de MQO de α3 e Ø3 serão as mesmas Por quê c Qual é a relação entre α2 e Ø2 d Você pode comparar os R2 dos dois modelos Justifique sua resposta 713 Suponha que você estime a função consumo 21 Yi H α1C α2Xi C u1i e a função poupança Zi H Ø1 C Ø2Xi C u2i onde Y H consumo Z H poupança X renda e X H Y C Z isto é a renda é igual a consumo mais poupança a Qual é a relação se existir entre α2 e Ø2 Mostre seus cálculos b A soma dos quadrados dos resíduos SQR será igual nos dois modelos Explique c Você pode comparar o R2 dos dois modelos Explique 714 Suponha que você expresse o modelo CobbDouglas dado na Equação 791 da seguinte forma Aplicando a este modelo a transformação logarítmica você terá ln ui como termo de erro do lado direito da equação a Que hipóteses probabilísticas você deve fazer a respeito de ln ui para poder aplicar o mo delo clássico normal de regressão linear Como você testaria isso em relação aos dados da Tabela 73 b As mesmas hipóteses se aplicam a ui Justifique sua resposta 715 Regressão que passa pela origem Considere a seguinte regressão que passa pela origem a O que é necessário fazer para estimar as incógnitas b Para este modelo será zero Justifique sua resposta c Para este modelo d Em que caso você usaria este modelo e É possível generalizar os resultados para um modelo com k variáveis Dica reveja a discus são sobre duas variáveis no Capítulo 6 exercícios aplicados 716 A demanda por rosas A Tabela 76 apresenta dados trimestrais relativos às seguintes variáveis22 adaptado de CharemZa Wojciech W deadman derek F Econometric practice general to specific modelling cointegration and vector autogression brookfield vermont edward elgar 1992 p 18 adaptado de KennedY Peter A guide to econometrics 3 ed Cambridge massachusetts The miT Press 1992 p 308 pergunta n 9 agradeço a Joe Walsh pela coleta destes dados com um grande atacadista da área metropolitana de detroit e pelo subseqente processamento das informações 232 Parte Um Modelos de regressão com equação única ECONOBOOKindb 232 23112010 071312 Capítulo 7 Análise de regressão múltipla o problema da estimação 233 Y H quantidade de rosas vendidas em dúzias X2 H preço médio das rosas no atacado dúzia X3 H preço médio dos cravos no atacado dúzia X4 H renda média familiar disponível semana X5 H variável de tendência com valores de l 2 e assim por diante para o período entre o ter ceiro trimestre de 1971 e o segundo trimestre de 1975 na área metropolitana de Detroit Considere as seguintes funções de demanda Yi H α1C α2X2t C α3X3t C α4X4t C α5X5t Cut ln Yt H Ø1 C Ø2 lnX2tC Ø3 lnX3t C Ø4 lnX4t C Ø5X5t ut a Estime os parâmetros do modelo linear e interprete os resultados b Estime os parâmetros do modelo loglinear e interprete os resultados c Ø2 Ø3 e Ø4 dão respectivamente as elasticidadespreço própria preço cruzada e renda da de manda Quais seus sinais a priori Os resultados obtidos confirmam as expectativas a priori d Como você calcularia as elasticidadespreço própria preço cruzada e renda do modelo linear e Com base em sua análise qual dos modelos escolheria e por quê 717 Atividades de prospecção de petróleo Os poços experimentais são perfurados para encontrar e ex trair petróleo eou gás em uma área expandida ou para encontrar novos reservatórios em áreas conhecidas como produtivas ou para ampliar os limites de reservatórios existentes A Tabela 77 apresenta dados relativos às seguintes variáveis23 Y H número de poços experimentais perfurados X2 H preço do petróleo na boca do poço no período anterior em dólares constantes 1972 H 100 X3 H produção interna X4 H PNB em dólares constantes 1972 H 100 X5 H variável de tendência 1948 H l 1949 H 2 1978 H 31 Verifique se o seguinte modelo ajustase aos dados agradeço a raymond Savino pela coleta e processamento dos dados Capítulo 7 Análise de regressão múltipla o problema da estimação 233 Tabela 76 Demanda trimestral por rosas na área metropolitana de Detroit de 1971III a 1975II ECONOBOOKindb 233 23112010 071313 234 Parte Um Modelos de regressão com equação única a Você pode mostrar a lógica a priori deste modelo b Supondo que o modelo seja aceitável estime os parâmetros do modelo e seus erros padrão e obtenha R2 e R 2 c Comente os resultados obtidos em relação a suas expectativas prévias d Que outra especificação você sugeriria para explicar a atividade de prospecção Por quê 718 Gastos orçamentários com defesa Estados Unidos 19621981 Para explicar o orçamento com defesa dos Estados Unidos você deve examinar o seguinte modelo em que Yt H Gastos orçamentários com defesa no ano t em bilhões de X2t H PNB do ano t em bilhões de X3t H vendasassistência militar dos Estados Unidos no ano t em bilhões de X4t H vendas da indústria aeroespacial em bilhões de X5t H conflitos militares envolvendo mais de 100 mil soldados Esta variável assume o valor l quando 100 mil ou mais soldados estão envolvidos e é igual a 0 quando esse número é inferior a 100 mil 234 Parte Um Modelos de regressão com equação única Tabela 77 Prospecção de poços experimentais Fonte Energy Information Administration 1978 Report to Congress ECONOBOOKindb 234 23112010 071313 Capítulo 7 Análise de regressão múltipla o problema da estimação 235 Para testar o modelo use os dados da Tabela 78 a Estime os parâmetros do modelo e seus erros padrão e obtenha R2 R2 modificado e R 2 b Comente os resultados levando em conta quaisquer expectativas a priori que tenha quanto a relação entre Y e as diversas variáveis X c Que outras variávelis você incluiria no modelo e por quê Capítulo 7 Análise de regressão múltipla o problema da estimação 235 719 Demanda por frangos nos Estados Unidos 19601982 Para estudar o consumo per capita de frango nos Estados Unidos use os dados da Tabela 79 em que Y H consumo per capita de frango em libras peso X2 H renda real disponível per capita em X3 H preço real do frango no varejo em centavos de dólar por libra peso X4 H preço real da carne suína no varejo em centavos de dólar por libra peso X5 H preço real da carne bovina no varejo em centavos de dólar por libra peso X6 H preço real dos substitutos da carne de frango em centavos de dólar por libra peso que é uma média ponderada dos preços reais das carnes suína e bovina usando como pesos o consumo relativo de cada uma dessas carnes em relação ao consumo total delas Agora considere as seguintes funções de demanda 1 2 3 4 5 Da teoria microeconômica sabese que a demanda por um bem depende em geral da renda real do consumidor do preço real do bem e dos preços reais de bens complementares ou substi tutos Tendo em vista esses aspectos responda às seguintes perguntas Tabela 78 Gastos orçamentários com defesa 1962 1981 Fonte os dados de diversas publicações do governo foram coletados por Albert Lucchino ECONOBOOKindb 235 23112010 071314 236 Parte Um Modelos de regressão com equação única a Qual das funções de demanda dentre as apresentadas você escolheria e por quê b Como interpretaria os coeficientes de ln X2t e ln X3t nesses modelos c Qual a diferença entre as especificações 2 e 4 d Quais os problemas você prevê se adotasse a especificação 4 Dica os preços das carnes suína e bovina estão incluídos no preço do frango e Como a especificação 5 inclui o preço ponderado das carnes bovina e suína seria preferível usar a função de demanda 5 em lugar da 4 Por quê f As carnes suína eou bovina substituem ou concorrem com a de frango Como você sabe g Suponha que a função 5 é a função de demanda correta Estime os parâmetros desse modelo calcule seus erros padrão R2 R 2 e R2 modificado Interprete os resultados h Suponha agora que você calculou o modelo incorreto 2 Avalie as consequências desse erro de especificação considerando os valores de γ2 e γ3 em relação a Ø2 e Ø3 respectivamente Dica preste atenção na discussão da Seção 77 720 Em um estudo sobre a rotatividade no mercado de trabalho James F Ragan Jr obteve os seguintes resultados para a economia norteamericana no período que vai do primeiro trimestre de 1950 ao quarto trimestre de 1979 Os dados entre parênteses são a estatística t estimada24 Fonte veja o artigo de ragan Turnover in the labor market a study of quit and layoff rates economic review Federal reserve bank de Kansas City maio 1981 p 1322 pág 223 236 Parte Um Modelos de regressão com equação única Tabela 79 Demanda por frangos nos Estados Unidos 19601982 Fonte os dados relativos a Y são da Citibase e os relativos às variáveis de X2 a X6 são do Departamento de Agri cultura dos Estados Unidos Agradeço a Robert J Fisher pela coleta dos dados e pela análise estatística Nota os preços reais foram obtidos dividindose os preços nominais pelo IPC para alimentos ECONOBOOKindb 236 23112010 071315 Capítulo 7 Análise de regressão múltipla o problema da estimação 237 Nota discutiremos a estatística t no próximo capítulo em que Y H taxa de saída no setor de transformação definida como o número de pessoas que saem voluntariamente da empresa por 100 empregados X2 H variável instrumental ou proxy para a taxa de desemprego masculino X3 H percentual de empregados com menos de 25 anos X4 H Nt1Nt4 H razão do emprego no setor no trimestre t 1 em relação aos do trimestre t 4 X5 H percentual de mulheres empregadas X6 H tendência temporal 1o trimestre de 1950 H 1 a Interprete os resultados anteriores b A relação negativa observada entre os logaritmos de Y e de X2 é justificável a priori c Por que o coeficiente de ln X3 é positivo d Como o coeficiente de tendência é negativo há um declínio secular na taxa percentual de saída do emprego e em caso afirmativo por que há esse declínio e O R 2 é baixo demais f Você pode estimar os erros padrão dos coeficientes por meio dos dados disponíveis Justifi que sua resposta 721 Considere a seguinte função de demanda por moeda dos Estados Unidos no período 19801998 em que M H demanda real por moeda usando M2 como definição de moeda Y H PIB real r H taxa de juros Essa função de demanda por moeda pode ser estimada por meio dos dados da Tabela 710 Capítulo 7 Análise de regressão múltipla o problema da estimação 237 Tabela 710 Demanda por moeda nos Estados Unidos 19801998 Fonte Economic Report of the President 2000 Tabelas B1 B58 B67 e B71 Notas PIB produto interno bruto em bilhões de M2 oferta de moeda no conceito de M2 IPC Índice de Preços ao Consumidor dos Estados Unidos 19821984 H 100 TJLP taxa de juros de longo prazo Títulos do Tesouro de 30 anos TJCP taxa das Letras do Tesouro de três meses ao ano ECONOBOOKindb 237 23112010 071316 238 Parte Um Modelos de regressão com equação única Nota para converter os valores nominais em valores reais divida M e o PIB pelo IPC índice de preços ao consumidor dos Estados Unidos Não há necessidade de dividir a variável taxa de juros pelo IPC Note ainda que apresentamos duas taxas de juros uma de curto prazo medida pela taxa das Letras do Tesouro de três meses e uma de longo prazo medida pelo rendimento dos Títulos do Tesouro de 30 anos pois estudos anteriores empregaram esses dois tipos de ta xas de juros a Com base nos dados estime a função de demanda Quais as elasticidades renda e taxa de juros da demanda por moeda b Suponha que em vez de estimar a função de demanda você tivesse de ajustar a função MYt D Æ1r Æ2t eut Interprete os resultados Mostre os cálculos necessários c Como você decidiria qual a melhor especificação Nota um teste estatístico formal será visto no Capítulo 8 722 A Tabela 711 apresenta dados relativos ao setor de transformação grego no período 19611987 a Verifique se a função de produção CobbDouglas ajustase aos dados da tabela e interprete os resultados Que conclusão geral você tira b Agora considere o seguinte modelo Produtotrabalho H AKLØ eu em que o regressando representa a produtividade do trabalho e o regressor a relação capitaltra balho Qual o significado econômico dessa relação se existe algum Estime os parâmetros desse modelo e interprete os resultados 238 Parte Um Modelos de regressão com equação única Tabela 711 Setor industrial grego Fonte agradeço a George K Zestos da Christopher Newport University Virgínia pelos dados Bilhões de dracmas a preços constantes de 1970 Milhares de trabalhadoresano ECONOBOOKindb 238 23112010 071317 Capítulo 7 Análise de regressão múltipla o problema da estimação 239 723 Experimento de Monte Carlo Considere o seguinte modelo Sabendo que Ø1 H 262 Ø2 H 0006 Ø3 H 24 σ2 H 42 e ui N0 42 gere dez conjuntos de 64 observações sobre ui da distribuição normal dada e use as 64 observações da Tabela 64 em que Y H MI X2 H PNBpc e X3 H TAF para gerar dez conjuntos de coeficientes Ø cada conjunto deve ter os três parâmetros estimados Tome as médias de cada coeficiente Ø estimado e rela cioneas aos verdadeiros valores dos coeficientes Que conclusões gerais você tira daí 724 A Tabela 712 apresenta dados sobre despesa real de consumo renda real riqueza real e taxas reais de juros para os Estados Unidos no período 19472000 Esses dados serão utilizados novamente no Exercício 835 a Com os dados da tabela estime a função consumo linear usando as variáveis renda rique za e a taxa de juros Qual a equação ajustada b O que os coeficientes estimados indicam sobre a relação entre as variáveis e as despesas de consumo Capítulo 7 Análise de regressão múltipla o problema da estimação 239 Tabela 712 Despesa real de consumo renda real riqueza real e taxas reais de juros para os Estados Unidos no período 19472000 Fonte C RD e índices de preços encadeados trimestrais e anuais 1996 H 100 Bureau of Economic Analysis Departamento de Comércio dos EUA httpwwwbea docgovbeadn1htm Rendimento nominal anual dos Títulos do Tesouro de três meses Economic Report of the President 2002 Riqueza nominal H valor líquido nominal de domicílios pessoas físicas e organizações sem fins lucrativos no fim do ano de fluxo de fundos do Federal Reserve httpwww federalreservegov Continua ECONOBOOKindb 239 23112010 071318 240 Parte Um Modelos de regressão com equação única 240 Parte Um Modelos de regressão com equação única Tabela 712 Continuação Notas Ano H calendário civil C H despesas reais de consumo em bilhões de dólares encadeados de 1996 RD H renda pessoal disponível real em bilhões de dólares encadeados de 1996 Riqueza H riqueza real em bilhões de dólares encadeados de 1996 Juros H rendimento nominal anual dos Títulos do Tesouro americano de três meses taxa de inflação medida pela variação porcentual no índice de preços anual encadeado A variável riqueza nominal convertida em termos reais foi criada com dados da medição feita pelo Federal Reserve Board do valor líquido nominal no fim do ano de domicílios pessoas físicas e organizações sem fins lucrativos nas contas de fluxo dos fundos O índice de preços utilizado para converter esta variável de riqueza nominal em real foi a média do índice de preços encadeado do quarto trimestre do ano corrente e do primeiro trimestre do ano subsequente 725 Estimação dos preços da ação da Qualcomm Como exemplo da regressão polinomial considere os dados sobre os preços semanais da ação da Qualcomm Inc uma empresa que projeta e produz equipamentos de telecomunicação digital sem fio no período de 1995 a 2000 Os dados completos podem ser encontrados na Tabela 713 no site do livro Durante o final da década de 1990 as ações do setor de tecnologia foram particularmente lucrati vas mas que tipo de modelo de regressão deve se ajustar melhor a esses dados A Figura 74 mostra um gráfico básico dos dados durante esse período O gráfico não parece assemelharse a uma curva em S alongado parece haver um ligei ro aumento no preço médio da ação mas depois a taxa aumenta drasticamente em direção à extrema direita do gráfico À medida que a demanda por telefones especializados aumen tou e o boom tecnológico ganhou força o preço das ações acompanhou em um ritmo mui to mais rápido a Estime um modelo linear para prever o preço de fechamento da ação baseado no tempo Esse modelo parece ajustarse bem aos dados b Agora estime um modelo quadrático usando tanto o tempo como o quadrado do tempo Esse modelo tem melhor ajustamento que o de a c Por fim ajuste o seguinte polinômio cúbico ou de terceiro grau em que Y H preços da ação e X H tempo Qual modelo parece ser o melhor estimador para os preços das ações ECONOBOOKindb 240 23112010 071319 Capítulo 7 Análise de regressão múltipla o problema da estimação 241 Apêndice 7A 7a1 Derivação dos estimadores de MQo dados nas equações 743 a 745 Derivando a equação 742 parcialmente em relação às três incógnitas e igualando a zero as três equações resultantes obtemos Simplificando obtemos as Equações 743 a 745 Note que as três equações podem ser escritas como que mostram as propriedades do ajustamento de mínimos quadrados especificamente que a soma dos resíduos é igual a zero e que eles não estão correlacionados com as variáveis X2 e X3 Capítulo 7 Análise de regressão múltipla o problema da estimação 241 fiGuRa 74 Preços da ação ao longo do tempo 500 450 400 350 250 300 150 200 50 100 0 030195 270295 240495 190695 140895 091095 041295 290196 250396 200596 150796 090996 041196 301296 240297 210497 160697 110897 061097 011297 260198 230398 180598 130798 080998 021198 281298 220299 190499 140699 090899 041099 291199 Preço Data ECONOBOOKindb 241 23112010 071320 242 Parte Um Modelos de regressão com equação única 242 Parte Um Modelos de regressão com equação única Casualmente note que para obtermos os estimadores de MQO do modelo de regressão linear com k variá veis 7420 procedemos de modo análogo Assim começamos com Calculando as derivadas parciais em relação a cada uma das k incógnitas igualando as equações resultantes a zero e reorganizando os termos obtemos as seguintes k equações normais para as k incógnitas Ou passando para letras minúsculas essas equações podem ser expressas como Cabe ainda notar que o modelo com k variáveis também satisfaz estas equações 7a2 igualdade dos coeficientes de PNbpc em 735 e 762 Seja Y H MI X2 H PNBpc e X3 H TAF e usando a forma do desvio temos 1 2 Fazendo a regressão de û1 contra û2 obtemos 3 Note que como os û são resíduos suas médias são zero Usando 1 e 2 podemos escrever 3 como 4 ECONOBOOKindb 242 23112010 071322 Capítulo 7 Análise de regressão múltipla o problema da estimação 243 Expandindo a expressão e observando que 5 e 6 Fazendo as substituições em 4 obtemos 747 7a3 Derivação da equação 7419 Lembrese de que que também pode ser escrito como em que as letras minúsculas como sempre indicam desvios em relação aos valores médios Agora em que se faz uso do fato de que Também isto é 7419 que é o resultado desejado 7a4 estimação de máxima verossimilhança do modelo de regressão múltipla Estendendo as ideias apresentadas no Apêndice 4A do Capítulo 4 podemos escrever a função de verossimilhança logarítmica do modelo de regressão linear com k variáveis 7420 como Calculando as derivadas parciais dessa função em relação a Ø1 Ø2 Øk e σ2 obtemos as seguintes K C 1 equações 1 Capítulo 7 Análise de regressão múltipla o problema da estimação 243 ECONOBOOKindb 243 23112010 071325 244 Parte Um Modelos de regressão com equação única 244 Parte Um Modelos de regressão com equação única 2 K K C 1 Igualando essas equações a zero condição de primeira ordem para a otimização e denotando os estimado res de MV como ØQ1 ØQ2 ØQk e æQ 2 obtemos depois de algumas manipulações algébricas simples que são exatamente as equações normais da teoria dos mínimos quadrados como mostra a Seção 7A1 do Apêndice 7A Portanto os estimadores de máxima verossimilhança os ØQ são semelhantes aos estimadores de MQO os ØO apresen tados anteriormente Mas como observado no Apêndice 4A do Capítulo 4 essa igualdade não é acidental Substituindo os estimadores de MV H MQO na equação K C 1 obtemos após simplificar o estimador de MV para σ2 que é Como observado esse estimador difere do estimador de MQO E como este último é um estimador não viesado de σ2 tal conclusão implica que o estimador de MV æQ 2 é um estimador viesado Mas como pode ser prontamente verificado assintoticamente æQ 2 também é não viesado ou não tendencioso 7a5 Tela do resultado do eViews para a função de produção CobbDouglas 794 ECONOBOOKindb 244 23112010 071327 Capítulo 7 Análise de regressão múltipla o problema da estimação 245 Nota Y1 H ln YY2 H ln X2 Y3 H ln X3 Os autovalores são 37861 e 1875269 que serão usados no Capítulo 10 Capítulo 7 Análise de regressão múltipla o problema da estimação 245 ECONOBOOKindb 245 23112010 071329 246 Análise da regressão múltipla o problema da inferência Este capítulo desenvolve as ideias de estimação de intervalos e teste de hipóteses tratadas no Ca pítulo 5 para os modelos que envolvem três ou mais variáveis Embora sob muitos aspectos os conceitos desenvolvidos no Capítulo 5 possam ser aplicados diretamente ao modelo de regressão múltipla algumas características adicionais são exclusivas a tais modelos e são elas que receberão mais atenção neste capítulo 81 Novamente a hipótese da normalidade Já sabemos até aqui que se o nosso único objetivo é a estimação pontual dos parâmetros dos modelos de regressão o método dos mínimos quadrados ordinários MQO que não faz nenhuma suposição sobre a distribuição da probabilidade dos termos de erro ui será suficiente Mas se a meta é a estimação e a inferência como discutido nos Capítulos 4 e 5 precisaremos supor que os ui seguem alguma distribuição de probabilidade Pelos motivos já claramente explicados pressupomos que os ui seguem a distribuição normal com média zero e variância constante æ2 Manteremos essa hipótese nos modelos de regressão múlti pla Com a hipótese da normalidade e seguindo a discussão dos Capítulos 4 e 7 descobrimos que os estimadores de MQO dos coeficientes parciais de regressão idênticos aos estimadores de máxima verossimilhança MV são os melhores estimadores lineares não viesados ou não tendenciosos MELNT ou do inglês BLUE1 Os estimadores ØO2 ØO3 e ØO1 estão distribuídos normalmente com mé dias iguais aos verdadeiros Ø2 Ø3 e Ø1 e as variâncias apresentadas no Capítulo 7 Além disso n 3 æO 2æ 2 segue a distribuição 2 com n 3 graus de liberdade e os três estimadores de MQO são distri buídos independentemente de æO 2 A demonstração acompanha o caso de duas variáveis discutido no Apêndice 3A Seção 3A Como resultado de acordo com o Capítulo 5 podemos mostrar que ao substituirmos æ 2 por seu estimador æO 2 não viesado no cálculo dos erros padrão cada uma das variá veis a seguir segue a distribuição t com n 3 graus de liberdade 1 Sob a hipótese de normalidade os estimadores de mQo ØO2 ØO3 e ØO1 são os estimadores com variância mínima dentro de toda a classe de estimadores não viesados ou não tendenciosos sejam lineares ou não em síntese eles são os melhores estimadores não viesados ou não tendenciosos melnT ou do inglês blUe veja rao C r Linear statistical inference and its applications nova York John Wiley Sons 1965 p 258 Capítulo 8 ECONOBOOKindb 246 23112010 071329 Capítulo 8 Análise da regressão múltipla o problema da inferência 247 811 812 813 Observe que os graus de liberdade agora são n 3 porque ao calcularmos PuOi 2 e portanto æO 2 precisamos estimar primeiro os três coeficientes parciais de regressão o que portanto coloca três restrições à soma do quadrado dos resíduos SQR segundo essa lógica no caso de quatro variáveis deverá ser n 4 graus de liberdade e assim por diante Além disso a distribuição t pode ser empre gada para estabelecer intervalos de confiança bem como testar hipóteses estatísticas sobre os verda deiros coeficientes parciais de regressão da população Do mesmo modo a distribuição do 2 pode ser usada para testar hipóteses relativas ao verdadeiro æ2 Para demonstrarmos a mecânica efetiva utilizamos o exemplo a seguir exeMPlo 81 Retomando o exemplo da mortalidade infantil no Capítulo 7 fizemos a regressão da mortalidade infantil mi contra o Pnb per capita Pnbpc e a taxa de alfabetização feminina TaF para uma amostra de 64 países os resulta dos da regressão dada na equação 762 são reproduzidas abaixo com informações adicio nais 814 em que indica um valor extremamente baixo na equação 814 seguimos o primeiro formato apresentado na equação 5111 em que as cifras do primeiro conjunto de parênteses são os erros padrão estimados os do segundo conjunto são os valores t relativos à hipótese nula de que o coeficiente populacional relevante tem valor zero e os do terceiro são os valores p estimados os valores de R 2 e R 2 ajustados tam bém são dados Já interpretamos essa regressão no exemplo 71 e quanto à significância estatística dos resultados observados Considere por exem plo o coeficiente de Pnbpc 00056 esse coeficiente é estatisticamente significativo ou seja estatisticamente diferente de zero da mesma forma o coeficiente de TaF 22316 é estatisticamente significativo ambos os coeficientes são estatisticamente significativos Para responder a essas e outras questões relacionadas consideremos primeiro os tipos de testes de hipóteses que podemos encontrar no contexto de um modelo de regressão múltipla 82 Teste de hipóteses na regressão múltipla comentários gerais Uma vez que fomos além do básico do modelo de regressão linear de duas variáveis os testes de hipóteses assumem várias formas interessantes 1 Testar as hipóteses relativas a um coeficiente individual parcial de regressão Seção 83 2 Testar a significância geral do modelo de regressão múltipla estimado ou seja descobrir se todos os coeficientes angulares parciais são simultaneamente iguais a zero Seção 84 ECONOBOOKindb 247 23112010 071330 248 Parte Um Modelos de regressão com equação única 3 Testar se dois ou mais coeficientes são iguais entre si Seção 85 4 Testar se os coeficientes parciais de regressão satisfazem certas restrições Seção 86 5 Testar a estabilidade do modelo de regressão estimado ao longo do tempo ou em diferentes unidades de corte transversal Seção 87 6 Testar a forma funcional dos modelos de regressão Seção 88 Pelo fato de os testes de um ou mais desses tipos ocorrerem normalmente na análise prática de dicaremos uma seção a cada tipo 83 Testes de hipótese relativos aos coeficientes individuais de regressão Se aceitarmos a hipótese de que ui ª N0 æ 2 segue distribuição nornal com média zero e variân cia constante então como observado na Seção 81 poderemos usar o teste t para verificar uma hipó tese sobre qualquer dos coeficientes parciais individuais da regressão Considere a regressão da mortalidade infantil Equação 814 para ilustrar a mecânica Podemos postular que A hipótese nula afirma que quando X3 taxa de alfabetização feminina é mantido constante X2 PNBpc não exerce influência linear sobre Y mortalidade infantil2 Para testarmos a hipótese nula usamos o teste t dado na Equação 812 De acordo com o Capítulo 5 veja a Tabela 51 se o valor de t calculado exceder o valor crítico de t no nível de significância escolhido poderemos rejei tar a hipótese nula sob outras circunstâncias não poderemos rejeitála Em nosso exemplo ilustrati vo usando 812 e observando que Ø2 H 0 sob a hipótese nula obtemos 831 conforme mostra a Equação 814 Note que temos 64 observações Nesse exemplo são 61 graus de liberdade Por quê Se consultarmos a Tabela t do Apêndice D não encontraremos dados correspondentes a 61 gl O mais próximo são 60 gl Se usarmos esses graus de liberdade e assumirmos um Æ o nível de significância ou seja a probabilidade de cometer um erro do tipo I de 5 o valor t crítico será de 20 para um teste bicaudal procure tÆ2 para 60 gl ou 1671 para um teste unicaudal procure tÆ para 60 gl Em nosso exemplo a hipótese alternativa é bilateral Usamos o valor t bilateral Uma vez que o valor t calculado 28187 em termos absolutos excede o valor t crítico 2 podemos re jeitar a hipótese nula de que o PNBpc não afeta a mortalidade infantil Em outras palavras mantida constante a alfabetização feminina o PNB per capita PNBpc tem um efeito negati vo significativo na mortalidade infantil e como seria de esperar a priori Graficamente a si tuação é a da Figura 81 Na prática não é preciso pressupor qualquer valor específico de Æ para conduzir o teste de hipó teses Podemos simplesmente usar o valor p da Equação 814 que neste caso é 00065 A interpre tação desse valor p o nível exato de significância é a de que se a hipótese nula fosse verdadeira a probabilidade de obter um valor t igual a 28187 ou maior em termos absolutos seria de apenas 2 na maioria das pesquisas empíricas utilizase esta forma para a hipótese nula ou seja adotase a posição extre ma de que não há qualquer relação entre a variável dependente e a variável explanatória em consideração a ideia aqui é verificar de início se a relação entre as duas é trivial ECONOBOOKindb 248 23112010 071331 Capítulo 8 Análise da regressão múltipla o problema da inferência 249 00065 ou 065 que é de fato uma probabilidade pequena muito menor que o valor adotado arti ficialmente de Æ H 5 Esse exemplo oferece uma oportunidade de decidir se queremos usar um teste t uni ou bicaudal Como a priori esperamos que a relação entre a mortalidade infantil e o PNB per capita seja negati va por quê deveríamos usar o teste unicaudal A hipótese nula e a alternativa deveriam ser Como o leitor já sabe podemos rejeitar a hipótese nula com base no teste t unicaudal Se puder mos rejeitar a hipótese nula em um teste bilateral teremos evidências suficientes para rejeitála no cenário unilateral enquanto a estatística estiver na mesma direção que o teste No Capítulo 5 vimos a estreita conexão entre o teste de hipóteses e a estimação de intervalos de confiança Em nosso exemplo o intervalo de confiança de 95 para Ø2 é que em nosso exemplo resulta em isto é 832 ou seja o intervalo 00096 a 00016 inclui o verdadeiro coeficiente Ø2 com um nível de confiança de 95 Assim se 100 amostras de tamanho 64 forem selecionadas e 100 intervalos de con fiança como na Equação 832 forem formulados esperamos que 95 deles incluam o verdadeiro parâmetro populacional Ø2 Devido ao intervalo 832 não incluir o valor proposto como hipó tese nula zero podemos rejeitar a hipótese nula zero de que o verdadeiro Ø2 seja zero com 95 de confiança Assim se usarmos o teste t de significância como em 831 ou a estimação de intervalos de confiança como em 832 chegamos à mesma conclusão No entanto isso não deveria ser surpreendente em vista da estreita relação entre estimação de intervalos de confiança e teste de hipóteses De acordo com o processo que acabamos de descrever podemos testar hipóteses relativas aos outros parâmetros da regressão do nosso exemplo Os dados necessários já foram fornecidos na Equação 814 Por exemplo imagine que desejamos testar a hipótese de que mantida constante a influência do PNBpc a taxa de alfabetização feminina não tem nenhum efeito sobre a mortalidade fiGuRa 81 Intervalo de confiança de 95 para t 60 gl 0 t 20 20 ft Densidade Região crítica 25 t 282 Região crítica 25 95 Região de aceitação ECONOBOOKindb 249 23112010 071333 250 Parte Um Modelos de regressão com equação única infantil Podemos rejeitar tal hipótese pois sob a hipótese nula o valor p da obtenção de um valor t absoluto igual ou maior que 106 é praticamente zero Antes de avançar lembrese de que o procedimento do teste t baseiase na hipótese de que o termo de erro ui segue a distribuição normal Embora não possamos observar diretamente ui podemos observar sua proxy uOi ou seja os resíduos No caso da mortalidade infantil o histograma dos resí duos é apresentado na Figura 82 Segundo o histograma parece que os resíduos são normalmente distribuídos Podemos também calcular o teste JarqueBera JB de normalidade como mostrado na Equação 5121 No nosso caso o valor JB é 05594 com um valor p de 0763 Parece que o termo de erro do exemplo segue a distribuição normal Naturalmente lembrese de que o teste JB é para grandes amostras e que nossa amostra com 64 observações pode não ser suficientemente grande 84 Teste da significância geral da regressão amostral Na seção anterior estávamos preocupados em testar a significância dos coeficientes parciais indi viduais da regressão estimada ou seja sob a hipótese separada de que cada coeficiente parcial de regressão populacional verdadeiro era igual a zero Mas considere agora a seguinte hipótese 841 Essa hipótese nula propõe que Ø2 e Ø3 sejam conjunta ou simultaneamente iguais a zero Para testála recorremos ao que chamamos de teste da significância geral da linha de regressão observa da ou estimada ou seja se Y é relacionado linearmente a tanto X2 quanto X3 A hipótese conjunta proposta na Equação 841 pode ser testada verificando as significâncias individuais de ØO2 e ØO3 como fizemos na Seção 83 A resposta é não e a razão é a seguinte na Seção 83 ao testarmos a significância individual de um coeficiente parcial de regressão observado supuse mos implicitamente que cada teste de significância fosse baseado em uma amostra diferente ou seja independente Ao testarmos a significância de ØO2 sob a hipótese de que Ø3 D 0 presumimos tacita mente que o teste era baseado em uma amostra diferente da utilizada para testar a significância de ØO3 sob a hipótese nula de que Ø3 D 0 Mas para testarmos a hipótese conjunta da Equação 841 se usássemos dados da mesma amostra estaríamos violando a hipótese básica do procedimento de teste4 A questão pode ser colocada de forma diferente na Equação 832 estabelecemos um intervalo 3 no nosso exemplo o valor da assimetria é de 02276 e o da curtose 29488 recordese de que no caso de uma variável com distribuição normal os valores da assimetria e da curtose são de 0 e 3 respectivamente 4 em qualquer amostra dada a cov ØO2 ØO3 pode não ser zero isto é ØO2 e ØO3 podem estar correlacionados veja a equação 7417 10 8 6 4 2 0 80 40 0 40 80 Séries resíduos Amostra 1 64 Observações 64 Média 495 x 1014 Mediana 0709227 Máximo 9680276 Mínimo 8426686 Desvio Padrão 4107980 Assimetria 0227575 Curtose 2948855 JarqueBera 0559405 Probabilidade 0756009 fiGuRa 82 Histograma de resíduos da regressão ECONOBOOKindb 250 23112010 071334 Capítulo 8 Análise da regressão múltipla o problema da inferência 251 de confiança de 95 para Ø2 Mas se usarmos os mesmos dados para estabelecer um intervalo de confiança para Ø3 com um coeficiente de confiança de 95 não poderemos ter certeza de que Ø2 e Ø3 estão nos seus respectivos intervalos de confiança com uma probabilidade de 1 Æ1 Æ D 095 095 Em outras palavras apesar das afirmações serem individualmente verdadeiras não é verdade que a probabilidade de que os intervalos incluam simultaneamente Ø2 e Ø3 seja 1 Æ2 porque os intervalos podem não ser independentes quando usamos os mesmos dados para obtêlos Dito de forma diferente testar uma série de hipóteses singulares individuais não é equivalente a testar essas mesmas hi póteses em conjunto A razão intuitiva para isso é que em um teste conjunto de várias hipóteses qual quer uma delas é afetada pela informação relativa às outras hipóteses5 A conclusão do argumento anterior é que para um exemplo dado amostra apenas um intervalo de confiança ou um teste de significância pode ser obtido Como podemos então testar a hipótese nula simultânea Ø2 D Ø3 D 0 A resposta está a seguir a abordagem da análise de variância para teste de significância geral de uma regressão múltipla observada o teste F Como já foi explicado não podemos empregar o conhecido teste t para verificar a hipótese con junta de que os verdadeiros coeficientes parciais angulares são simultaneamente iguais a zero No entanto essa hipótese conjunta pode ser verificada pela técnica da análise de variância ANOVA apresentada na Seção 59 que pode ser demonstrada como se segue Recordemos a identidade 842 STQ a soma total dos quadrados tem como de costume n 1 graus de liberdade e SQE soma dos quadrados explicados tem n 3 por razões já discutidas SQR a soma do quadrado dos resíduos tem 2 graus de liberdade uma vez que é uma função de ØO2 e ØO3 Seguindo os procedimentos da ANOVA discutidos na Seção 59 podemos montar a Tabela 81 Agora podemos demonstrar6 que sob a hipótese de normalidade para ui e a hipótese nula Ø2 D Ø3 D 0 a variável 843 5 FombY Thomas b hill r Carter JohnSon Stanley r Advanced econometric methods nova York Springerverlag 1984 p37 6 veja broWnlee K a Statistical theory and methodology in science and engineering nova York John Wiley Sons 1960 p 278280 ECONOBOOKindb 251 23112010 071336 252 Parte Um Modelos de regressão com equação única Tabela 81 Tabela ANOVA para regressão com três variáveis está distribuída como a distribuição F com 2 e n 3 graus de liberdade Como podemos utilizar a razão F anterior Podemos provar7 que sob a hipótese de que os ui ª N0 æ 2 seguem distribuição normal com média zero e variância constante 844 Com a hipótese adicional de que Ø2 D Ø3 D 0 podemos demonstrar que 845 Portanto se a hipótese nula for verdadeira ambas as Equações 844 e 845 darão estimativas idênticas do verdadeiro æ 2 Essa afirmação não deveria surpreender porque se há uma relação trivial entre Y e X2 e X3 a única fonte de variação de Y devese a forças aleatórias representadas por ui Se contudo a hipótese nula for falsa ou seja se X2 e X3 influenciam definitivamente Y a igualdade entre as Equações 844 e 845 não se sustentará Nesse caso a SQE será relativamente maior do que a SQR levando em conta os respectivos graus de liberdade Portanto o valor F da Equação 843 fornece um teste para a hipótese nula de que os verdadeiros coeficientes angulares são simultanea mente iguais a zero Se o valor F calculado de acordo com a Equação 853 superar o valor F crítico da Tabela de F ao nível de significância rejeitamos H0 caso contrário não a rejeitamos Como alter nativa se o valor p do F observado for suficientemente baixo podemos rejeitar H0 A Tabela 82 resume o teste F Voltando ao nosso exemplo ilustrativo podemos obter a tabela ANOVA como mostra a Tabela 83 7 ibid Tabela 82 Resumo da estatística F gl gl gl gl gl gl Notas 1 æ2 1 e æ2 2 são as duas variâncias populacionais 2 S 2 1 e S 2 2 são as duas variâncias amostrais 3 ngl e d gl denotam respectivamente os graus de liberdade do numerador e do denominador 4 Ao calcular a razão F coloque o S 2 de valor mais elevado no numerador 5 Os valores críticos de F aparecem na última coluna O primeiro subscrito de F referese ao nível de significância e o segundo aos graus de liberdade do numerador e do denominador 6 Note que F1 Æ2 n gl d gl D 1FÆ2 d gl n gl ECONOBOOKindb 252 23112010 071339 Capítulo 8 Análise da regressão múltipla o problema da inferência 253 Recorrendo à Equação 843 obtemos 846 O valor de p da obtenção de um valor F igual a 738325 ou mais é quase zero levando a rejeição da hipótese de que PNBpc e TAF em conjunto não exercem efeito sob a mortalidade infantil Se fôssemos usar o valor convencional do nível de significância de 5 o valor crítico de F com 2 graus de liberdade no numerador e 60 no denominador os graus de liberdade efetivos são 61 é de quase 315 ou cerca de 498 se usarmos o nível de significância de 1 Evidentemente o F observado de cerca de 74 é muito superior a qualquer um desses valores críticos de F Podemos generalizar os procedimentos anteriores para a realização do teste F como se segue Verificação da significância geral de uma regressão múltipla o teste F Regra dado o modelo de regressão com k variáveis Para testar a hipótese ou seja todos os coeficientes angulares são simultaneamente iguais a zero versus H1 nem todos os coeficientes angulares são simultaneamente iguais a zero calcule 847 Se F FÆk 1 n k rejeite H0 caso contrário não o rejeite em que FÆk 1 n k é o valor crítico de F no nível Æ de significância k 1 os graus de liberdade do numerador e n k os graus de liberdade do denominador Como alternativa se o valor p de F obtido por meio da equação 847 for suficientemente baixo poderemos rejeitar H0 Desnecessário dizer que no caso de três variáveis Y e X2 X3 k é igual a 3 no caso de quatro variáveis k é igual a 4 e assim por diante Observe que a maioria dos programas para cálculo de regressão calcula rotineiramente o valor de F dado na tabela de análise de variância com os demais resultados de regressão como os coeficien tes estimados seus erros padrão os valores de t etc A hipótese nula para o cálculo de t é em geral considerada Øi D 0 Teste de hipóteses conjunto versus individual Na Seção 83 discutimos o teste de significância de um único coeficiente de regressão e na Seção 84 discutimos o teste de significância geral ou conjunto da regressão estimada ou seja todos os coeficientes angulares simultaneamente iguais a zero Reiteramos que esses testes são diferentes Tabela 83 Tabela ANOVA para o exemplo de mortalidade infantil ECONOBOOKindb 253 23112010 071341 254 Parte Um Modelos de regressão com equação única Com base no teste t ou no intervalo de confiança da Seção 83 é possível aceitar a hipótese de que dado coeficiente angular Øk é igual a zero e ainda assim rejeitar a hipótese conjunta de que todos os coeficientes angulares são iguais a zero A lição a ser aprendida é que a mensagem conjunta dos intervalos de confiança individuais não substitui uma região de confiança conjunta inferida do teste F quando se trata de testes conjuntos de hipóteses e afirmações conjuntas de confiança8 uma relação importante entre R2 e F Há uma relação estreita entre o coeficiente de determinação R2 e o teste F empregado na análise de variância Supondo uma distribuição normal dos termos de erro ui e a hipótese nula Ø2 D Ø3 D 0 vimos que 848 é distribuída como a distribuição F com 2 e n 3 graus de liberdade Em geral no caso de k variáveis incluindo o intercepto se assumirmos que os termos de erro são normalmente distribuídos e que a hipótese nula é 849 então 847 8410 segue a distribuição F com k 1 e n k graus de liberdade Nota o número total de parâmetros a serem estimados é k dos quais 1 é o intercepto Manipulando a Equação 8410 8411 em que se faz uso da definição R2 D SQESTQ A Equação 8411 mostra de que forma F e R2 estão relacionados Os dois variam diretamente Quando R2 D 0 F é zero ipso facto Quanto maior R2 maior o valor de F No limite quando R2 D 1 F é infinito Assim o teste F que é uma medida de significân cia geral da regressão estimada é também um teste de significância de R2 Em outras palavras testar a hipótese nula na Equação 849 é equivalente a testar a hipótese nula de que o R2 da população é igual a zero 8 FombY et al opcit p42 ECONOBOOKindb 254 23112010 071343 Capítulo 8 Análise da regressão múltipla o problema da inferência 255 No caso de três variáveis a Equação 8411 tornase 8412 Em virtude da estreita relação entre F e R2 a Tabela 81 ANOVA pode agora ser reformulada como Tabela 84 Em nosso exemplo ilustrativo usando 8412 obtemos que é quase o mesmo obtido anteriormente exceto pelos erros de arredondamento Uma vantagem do teste F expresso em termos de R2 é sua facilidade de cálculo tudo o que pre cisamos saber é o valor de R2 Portanto o teste geral de significância F dado na Equação 847 pode ser reformulado em termos de R2 como mostra a Tabela 84 Tabela 84 Tabela ANOVA em termos de R2 Teste de significância geral em termos de R2 para uma regressão múltipla Regra Teste da significância geral de uma regressão em termos de R2 é uma alternativa equivalente ao teste dado pela equação 847 dado o modelo de regressão com k variáveis Para testar a hipótese versus H1 nem todos os coeficientes angulares são simultaneamente iguais a zero Calcule 8413 Se F FÆk 1 n k rejeitase H0 caso contrário podese aceitar H0 em que FÆk 1 n k é o valor F crítico ao nível de significância Æ e k 1 graus de liberdade no numerador e n k graus de liberdade no denominador Como alternativa se o valor p de F obtido por meio da equação 8413 é suficientemente baixo rejeitase H0 Antes de continuarmos voltemos ao Exemplo 75 do Capítulo 7 Na regressão 7107 observa mos que o PIBpcr PIB per capita relativo e o PIBpcr ao quadrado explicam apenas 1092 da va riação da TCPIB taxa de crescimento do PIB dada uma amostra de 190 países Esse R2 de 01092 parece um valor baixo Será de fato estatisticamente diferente de zero Como descobrimos isso Recordemos a discussão anterior denominada uma importante relação entre R2 e F sobre a relação entre os dois valores dados na Equação 8411 ou 8412 no caso específico de dois regres sores Como observamos se R2 for zero automaticamente F será zero o que ocorre quando os ECONOBOOKindb 255 23112010 071345 256 Parte Um Modelos de regressão com equação única regressores não influenciam de forma alguma o regressando Se inserirmos R2 D 01092 na Fórmula 8412 obtemos 8413 Sob a hipótese nula de que R2 D 0 o valor de F acima segue a distribuição F com 2 e 187 graus de liberdade no numerador e no denominador respectivamente Nota existem 190 observações e dois regressores Verificamos na tabela de F que esse valor é significativo ao nível de 5 na verda de o valor p é de 000002 Podemos rejeitar a hipótese nula de que os dois regressores não influen ciam o regressando apesar de R2 ser de apenas 01092 Esse exemplo destaca a importante observação de que com dados de corte transversal que envol vem várias observações em geral obtemos valores baixos de R2 em virtude da diversidade das uni dades de corte transversal Não deveríamos ficar surpresos ou preocupados ao encontrar R2 baixos em regressões de corte transversal O que é relevante é a especificação correta do modelo o sinal correto dos regressores aqueles sinais teoricamente esperados e esperase que os coeficientes de regressão sejam estatisticamente significativos O leitor deve verificar se os regressores da Equação 7107 são individualmente significativos do ponto de vista estatístico no nível de 5 ou melhor menor do que 5 a contribuição incremental ou marginal de uma variável explanatória No Capítulo 7 afirmamos que geralmente não podemos distribuir o valor de R2 entre os vários regressores No nosso exemplo de mortalidade infantil verificamos que R2 era de 07077 mas não podemos dizer qual parte desse valor devese ao regressor PNBpc e qual devese à taxa de alfabeti zação feminina TAF em virtude da possível correlação entre os dois regressores na amostra dispo nível Podemos esclarecer um pouco mais essa questão recorrendo à técnica de variância Verificamos no nosso exemplo ilustrativo que X2 PNBpc e X3 TAF apresentavam individual mente significância estatística com base em testes t separados Também descobrimos que com base no teste F os dois regressores tinham conjuntamente um efeito significativo sobre o regressan do Y mortalidade infantil Imaginemos agora que façamos a inclusão sequencial de PNBpc e TAF ou seja primeiro faze mos a regressão da mortalidade infantil contra o PNBpc e avaliamos sua significância e acrescentamos TAF ao modelo para verificar se este contribui com algo obviamente a ordem em que as variáveis entram no modelo pode ser invertida Por contribuição queremos dizer que desejamos saber se a inclusãoadição da variável no modelo aumenta a SQE e por conseguinte R2 significativamente em relação a SQR Essa contribuição pode ser chamada com propriedade de contribuição incre mental ou marginal de uma variável explanatória A questão da contribuição marginal é importante na prática Na maioria das pesquisas o pesqui sador pode não estar totalmente convencido de que vale a pena acrescentar uma variável X ao mo delo sabendo que várias outras variáveis X já estão presentes Não se quer incluir variáveis que aumentem relativamente pouco a SQE Mas como decidir se uma variável X reduz significativamen te a SQR A técnica da análise de variância pode ser empregada para responder a essa pergunta Imagine que façamos inicialmente a regressão da mortalidade infantil contra PNBpc e obte nhamos a seguinte regressão ajus PNBpc 8414 Como mostram os resultados o PNBpc influencia significativamente a MI A Tabela 85 apresen ta a ANOVA correspondente a essa regressão ECONOBOOKindb 256 23112010 071346 Capítulo 8 Análise da regressão múltipla o problema da inferência 257 Supondo que os termos de erro ui sejam distribuídos normalmente e com a hipótese de que o PNBpc não influencia diretamente MI obtemos o valor F de 8415 que segue a distribuição F com 1 e 62 graus de liberdade Esse valor de F é altamente significativo assim como o valor de p calculado de 00008 Como anteriormente rejeitamos a hipótese de que PNBpc não influencia a MI Observe que t2 D 351562 D 123594 que é aproximadamente igual ao valor F da Equação 8414 em que o valor t é obtido por meio da Equação 8514 Mas isso não surpreende tendo em vista que o quadrado da estatística t com n graus de liberdade é igual ao valor F com 1 gl no numerador e n gl no denominador uma relação que estabelecemos no Capítulo 5 Neste exemplo n é igual a 64 Tendo calculado a regressão 8414 vamos supor que decidimos acrescentar a TAF ao modelo e obter a regressão múltipla 814 As questões que queremos responder são 1 Qual a contribuição marginal da TAF sabendo que o PNBpc já está no modelo e que se re laciona significativamente com MI 2 A contribuição incremental da TAF é estatisticamente significativa 3 Qual o critério para acrescentar variáveis ao modelo Essas perguntas podem ser respondidas com a técnica ANOVA Para tanto elaboremos a Tabela 86 Nesta X2 referese ao PNBpc e X3 à TAF Para avaliar a contribuição incremental de X3 depois de levar em conta a contribuição de X2 fa zemos 8416 Tabela 86 Tabela ANOVA para avaliação da contribuição incremental de variáveis Tabela 85 Tabela ANOVA para a regressão 8414 ECONOBOOKindb 257 23112010 071347 258 Parte Um Modelos de regressão com equação única em que SQEnovo D SQE sob o novo modelo ou seja após adicionar os novos regressores D Q3 SQEvelho D SQE no modelo velho D Q1 e SQRnovo D SQR no novo modelo ou seja levando em conta todos os regressores D Q4 No nosso exemplo os resultados são apresentados na Tabela 87 Agora aplicando 8416 obtemos 8417 Sob as hipóteses habituais esse valor de F segue a distribuição de F com 1 e 62 graus de liberda de O leitor deve verificar se esse valor de F é altamente significativo a ponto de sugerir que o acrés cimo da TAF ao modelo aumente significativamente o valor de SQE e por conseguinte de R2 Portanto a TAF deve ser adicionada ao modelo Novamente observe que se você elevar o valor do coeficiente da TAF da regressão múltipla 814 que é1062932 obteremos o valor de F da Equa ção 8417 exceto os erros de arredondamento A propósito a razão de F na Equação 8416 pode ser reformulada utilizandose apenas os valores de R2 como fizemos na Equação 8413 Como o exercício 82 mostra a razão F da Equação 8416 é equivalente à seguinte razão F9 8418 Essa razão de F segue a distribuição de F com os graus de liberdade correspondentes no numera dor e no denominador 1 e 61 no nosso exemplo ilustrativo Assim em nosso exemplo R2 novo D 07077 da Equação 814 e R2 velho D 01662 da Equação 8414 Portanto 8419 que é aproximadamente igual ao obtido na Equação 8417 exceto pelos erros de arredondamento Esse F é altamente significativo reforçando nossa descoberta anterior de que a variável TAF pertence ao modelo Uma advertência ao empregar a versão do R2 para o teste F apresentado em 8411 certifiquese de que a variável dependente dos modelos novos e antigos seja a mesma Se forem diferentes use o teste F da Equação 8416 PNBpc PNBpc 9 o teste F a seguir é um caso especial do teste F mais geral da equação 869 ou 8610 na Seção 86 Tabela 87 Tabela ANOVA para o exemplo análise incremental ECONOBOOKindb 258 23112010 071348 Capítulo 8 Análise da regressão múltipla o problema da inferência 259 Quando acrescentar uma nova variável O procedimento apresentado para o teste F fornece um método formal para decidir se devemos adicionar uma variável ao modelo de regressão Frequentemente os pesquisadores são confrontados com a tarefa de escolher entre vários modelos que envolvem a mesma variável dependente mas diferentes variáveis explanatórias Ao fazerem uma escolha ad hoc porque com muita frequência o fundamento teórico da análise é fraco esses pesquisadores escolhem o modelo que proporciona o R2 ajustado mais alto Se a inclusão de uma variável aumenta R 2 ela é mantida no modelo mesmo que não reduza significativamente no sentido estatístico a soma dos quadrados do resíduo A questão é quando o R2 ajustado aumenta Podese demonstrar que R 2 aumenta se o valor absoluto do coeficiente da nova variável incluída for maior que 1 e o valor de t for calculado sob a hipótese de que o valor do referido coeficiente na população seja zero o valor de t calculado por meio da Equação 532 sob a hipótese de que o verdadeiro β seja igual a zero10 Esse critério também pode ser expresso de forma diferente R 2 aumentará com o acréscimo de uma nova variável explanatória apenas se o valor de F D t 2 for superior a 1 Sob qualquer dos critérios aplicados a variável TAF do exemplo da mortalidade infantil com valor t de 106293 ou um valor F de 1129814 deverá aumentar o R 2 como de fato ocorre quando TAF é acrescentado ao modelo R 2 aumenta de 01528 para 06981 Quando acrescentar um grupo de variáveis Podemos formular uma regra semelhante para decidir se vale a pena adicionar ou excluir um grupo de variáveis ao modelo A resposta deveria ser clara por meio da Equação 8418 se incluir excluir um grupo de variáveis ao modelo resulta em um valor F maior menor que 1 R2 aumenta rá diminuirá Naturalmente com a Equação 8418 podemos verificar facilmente se o acréscimo exclusão de um grupo de variáveis aumenta reduz significativamente o poder explanatório de um modelo de regressão 85 Teste da igualdade para dois coeficientes de regressão Imaginemos que na regressão múltipla 851 desejamos testar as hipóteses 852 ou seja testar se os dois coeficientes angulares β3 e β4 são iguais Essa hipótese nula é de importância prática Por exemplo seja a Equação 851 a função demanda de um bem em que Y D quantidade demandada do bem X2 D preço do bem X3 D renda do consumi dor e X4 D riqueza do consumidor Neste caso a hipótese nula significa que os coeficientes da renda e da riqueza são os mesmos Ou se Yi e os X forem expressos em forma logarítmica a hipótese nula na Equação 852 implica que as elasticidades renda e riqueza do consumo são iguais Por quê Como testamos uma hipótese nula desse tipo Sob as hipóteses clássicas podemos demons trar que 853 10 Para uma demonstração veja aiGner dennis J Basic econometrics englewood Cliffs nJ Prentice hall 1971 p 9192 ECONOBOOKindb 259 23112010 071349 260 Parte Um Modelos de regressão com equação única segue a distribuição t com n 4 graus de liberdade porque a Equação 851 é um modelo com quarto variáveis ou de forma mais geral com n k graus de liberdade em que k é o número total de parâmetros estimados incluindo o termo constante O erro padrão epØO3 ØO4 é obtido por meio da seguinte fórmula bem conhecida veja detalhes no Apêndice A 854 Se substituirmos a hipótese nula e a expressão para ØO3 ØO4 na Equação 853 nosso teste estatístico tornase 855 Agora o processo de teste envolve os seguintes passos 1 Estimamos ØO3 e ØO4 Qualquer programa padrão de computador faz isso 2 A maioria dos programas calcula rotineiramente as variâncias e covariâncias dos parâmetros estimados11 Com base nessas estimativas é fácil obter o erro padrão do denominador para a Equação 855 3 Obtemos a razão t por meio da Equação 855 Observe que a hipótese nula neste caso é β3 β4 D 0 4 Se a variável t calculada por meio da Equação 855 for maior que o valor crítico de t no nível de significância proposto para dados graus de liberdade poderemos rejeitar a hipótese nula caso contrário não a rejeitaremos Como alternativa se o valor p da estatística t da Equação 855 for razoavelmente baixo poderemos rejeitar a hipótese nula Portanto quando dizemos que o valor p é baixo ou razoavelmente baixo queremos dizer que é inferior ao nível de significância seja 10 5 ou 1 Essa decisão envolve certa avaliação pessoal exeMPlo 82 Retornando à função cúbica recordemos a função cúbica de custo total estimada no exemplo 74 Seção 710 que por conveniência é reproduzida a seguir 7106 em que Y é o custo total e X a produção e os números entre parênteses são os erros padrão estimados Suponha que queiramos testar a hipótese de que os coeficientes dos termos X2 e X3 da função cúbica de custo são iguais ou seja Ø3 D Ø4 ou Ø3 Ø4 D 0 na regressão 7106 temos todos os resultados necessários para conduzir o teste t da equação 855 a mecânica envolvida é a seguinte 856 Continua 11 a expressão algébrica da fórmula da covariância é bastante complicada no apêndice C oferecemos uma ex pressão compacta mas que usa notação matricial ECONOBOOKindb 260 23112010 071350 Capítulo 8 Análise da regressão múltipla o problema da inferência 261 exeMPlo 82 Continuação o leitor pode verificar que com 6 graus de liberdade por quê o valor t observado é supe rior ao valor t crítico mesmo ao nível de significância de 0002 ou 02 considerandose um teste bicaudal o valor p é extremamente pequeno 0000006 Portanto podemos rejeitar a hipótese de que os coeficientes de X2 e X3 da função cúbica de custo sejam idênticos 86 Mínimos quadrados restritos teste de restrições de igualdade linear Há ocasiões em que a teoria econômica sugere que os coeficientes de um modelo de regressão estão sujeitos a algum tipo de restrição de igualdade linear Por exemplo considere a função de pro dução CobbDouglas 791 861 em que Y D produção X2 D insumo trabalho e X3 D insumo capital Na sua forma logarítmica a equação tornase 862 em que β0 D In β1 Agora se houver retornos constantes de escala variação equiproporcional da produção para uma variação equiproporcional nos insumos a teoria econômica sugere que 863 que é um exemplo de restrição de igualdade linear12 Como podemos descobrir se existem retornos constantes de escala ou seja se a restrição 863 é válida Há duas abordagens a abordagem do teste t O processo mais simples é estimar a Equação 862 da maneira habitual sem levar em conta explicitamente as restrições de 863 Isso é chamado de regressão sem restrições ou irrestrita Tendo estimado β2 e β3 por exemplo por meio dos mínimos quadrados ordinários um teste de hi pótese ou restrição 863 pode ser conduzido pelo teste t apresentado na Equação 853 a saber 864 em que β2 C β3 é a hipótese nula e o denominador é o erro padrão de ØO2 C ØO3 Então de acordo com a Seção 85 se o valor t calculado na Equação 863 for maior que o valor t crítico no nível de signi ficância escolhido rejeitaremos a hipótese de retornos constantes de escala caso contrário não o re jeitaremos 12 Se tivéssemos β2 β3 1 essa relação seria um exemplo de restrição de desigualdade linear Para lidar com essas restrições é preciso recorrer a técnicas de programação matemática ECONOBOOKindb 261 23112010 071351 262 Parte Um Modelos de regressão com equação única a abordagem do teste F mínimos quadrados restritos O teste t apresentado é uma espécie de exame post mortem porque tentamos verificar se a restri ção linear é satisfeita depois de estimar a regressão sem restrições Uma abordagem direta seria incorporar desde o início a restrição 863 ao procedimento de estimação No exemplo em pauta isso poderia ser feito facilmente Por meio de 863 vemos que 865 ou 866 Ao empregarmos qualquer uma dessas igualdades podemos eliminar um dos coeficientes β na Equação 862 e estimar a equação resultante Se usarmos a Equação 865 podemos escrever a função de produção CobbDouglas como ou 867 ou 868 em que YiX2i D razão produçãotrabalho e X3iX2i D razão capitaltrabalho indicadores de grande importância econômica Observe a transformação da Equação original 862 Como estimamos β3 por meio da Equação 867 ou 868 β2 pode ser calculado facilmente com base na relação 865 É desnecessário dizer que esse procedimento garante que a soma dos coeficientes estimados dos dois insumos será igual a 1 O procedimento esboçado na Equação 867 ou 868 é conhecido como mínimos quadrados restritos MQR e pode ser generalizado para modelos com qualquer número de variáveis explana tórias e mais de uma restrição linear de igualdade A generalização pode ser encontrada em Theil13 Veja também o teste F geral a seguir Como comparamos as regressões com mínimos quadrados irrestritos e restritos Em outras palavras como sabemos que a restrição por exemplo 863 é válida A pergunta pode ser respondida apli candose o teste F apresentado a seguir Seja D SQR da regressão sem restrições 862 D SQR da regressão com restrições 867 m D número de restrições lineares neste exemplo 1 k D número de parâmetros da regressão sem restrições n D número de observações Então 869 13 Theil henri Principles of econometrics nova York John Wiley Sons 1971 p 4345 ECONOBOOKindb 262 23112010 071353 Capítulo 8 Análise da regressão múltipla o problema da inferência 263 segue a distribuição F com m e n k graus de liberdade Nota SR e R representam as regressões sem restrições e com restrições respectivamente Esse teste F também pode ser expresso em termos de R2 8610 em que R2 SR e R2 R são respectivamente os valores de R2 obtidos nas regressões sem e com restrições ou seja das regressões 862 e 867 Devese observar que 8611 e 8612 No Exercício 84 será pedido a você que justifique essas afirmações Uma advertência ao empregar a Equação 8610 lembrese de que se a variável dependente nos modelos com e sem restrição não for a mesma R2 SR e R2 R não poderão ser comparados diretamen te Nesse caso devese empregar o procedimento descrito no Capítulo 7 para tornar os valores de R2 comparáveis veja Exemplo 83 ou usar o teste F apresentado na Equação 869 exeMPlo 83 Função de produção CobbDouglas para a economia mexicana 19551974 Para ilustrar a discussão anterior considere as informações da Tabela 88 Tentamos ajus tar a elas a função de produção Cobbdouglas o que produziu os seguintes resultados 8613 Tabela 88 México PIB real trabalho e capital fixo real Fonte ELIAS Victor J Sources of growth a study of seven Latin American economies International Center for Economic Growth San Francisco ICS Press 1992 Dados das Tabelas E5 E12 E14 f Milhões de pesos mexicanos de 1960 Milhares de pessoas Milhões de pesos mexicanos de 1960 Continua ECONOBOOKindb 263 23112010 071354 264 Parte Um Modelos de regressão com equação única exeMPlo 83 Continuação em que SQrSr é a SQr sem restrições já que não impusemos quaisquer restrições na estima tiva da equação 8613 Já vimos no Capítulo 7 como interpretar os coeficientes da função da produção Cobb douglas Como você pode ver a elasticidade produçãotrabalho é de cerca de 034 e a da relação produçãocapital é de cerca de 085 Se somarmos esses coeficientes obteremos 119 sugerindo que é possível que a economia mexicana registrasse retornos crescentes de escala no período estudado obviamente não sabemos se 119 difere estatisticamente de 1 Para verificar se esse é o caso vamos impor a restrição de retornos de escala constantes o que resulta na seguinte regressão 8714 em que SQrr é a SQr com restrições uma vez que impusemos a condição de que existem retornos constantes de escala Como nas duas regressões anteriores as variáveis dependentes são diferentes precisamos empregar o teste F da equação 869 Temos os dados necessários à obtenção do valor F observe que neste caso m D 1 já que impusemos apenas uma restrição e n k D 17 uma vez que temos 20 observações e três parâmetros na regressão sem restrições este valor de F segue a distribuição de F com 1 grau de liberdade no numerador e 17 no denominador o leitor poderá verificar facilmente que este F não é significativo no nível de significância de 5 veja o apêndice D Tabela d3 a conclusão é de que a economia mexicana provavelmente caracterizouse por retornos constantes de escala no período estudado portanto não há prejuízo em empregar a regres são com restrições da equação 8614 Como ela mostra se a razão capitaltrabalho aumen tar 1 em média o aumento da produtividade do trabalho provavelmente será de 1 Teste F geral14 O teste F da Equação 8610 ou seu equivalente da Equação 869 fornece um método para teste de hipóteses sobre um ou mais parâmetros do modelo de regressão com k variáveis 8615 O teste de F da Equação 8416 ou o teste t da Equação 853 é apenas uma aplicação específi ca da Equação 8610 Assim hipóteses tais como 8616 8617 14 Quando se emprega a abordagem de máxima verossimilhança para a estimação um teste semelhante ao exa minado é o teste da razão de verossimilhança que é algo complicado e portanto será tratado no apêndice do capítulo mais detalhes podem ser encontrados em Theil opcit p 179184 ECONOBOOKindb 264 23112010 071355 Capítulo 8 Análise da regressão múltipla o problema da inferência 265 que envolvem alguma restrição linear aos parâmetros do modelo com k variáveis ou hipóteses como 8618 que implicam ausência de alguns dos regressores do modelo podem ser todas testadas pelo teste de F da Equação 8610 Do que foi discutido nas Seções 84 e 86 o leitor terá observado que a estratégia do uso do teste F é esta há um modelo maior o modelo sem restrições 8615 e há um modelo menor o modelo com restrições que é obtido eliminandose algumas variáveis do maior ou seja pela Equação 8618 ou pela imposição de algumas restrições lineares a um ou mais coeficientes do modelo maior isto é pela Equação 8616 ou na 8617 Então ajustamos os modelos com restrições e sem restrições aos dados e obteremos os respecti vos coeficientes de determinação a saber R2 SR e R2 R Observamos os graus de liberdade do modelo sem restrições D n k e os do modelo com restrições D m sendo m o número de restrições lineares ou seja 1 na Equação 8616 ou na 8618 ou o número de regressores omitidos do modelo por exemplo m D 4 se adotamos a Equação 8618 já que quatro regressores foram omitidos do mode lo Então calculamos a razão F como indicado na Equação 869 ou na 8610 e adotamos a se guinte regra se o F calculado é maior que FÆm n k em que FÆm n k é o F crítico ao nível de significância Æ rejeitamos a hipótese nula caso contrário não a rejeitamos Vamos ilustrar exeMPlo 84 Demanda de frango nos Estados Unidos 19601982 no exercício 79 dentre outras coisas você a considerou a seguinte função de deman da por frango 8619 em que Y D consumo per capita de frango em libraspeso X2 D renda real disponível per capita em X3 D preço real do frango no varejo em centavos de dólar por librapeso X4 D preço real da carne suína no varejo em centavos de dólar por librapeso e X5 D preço da carne bovina no varejo em centavos de dólar por librapeso nesse modelo Ø2 Ø3 Ø4 e Ø5 são respectivamente as elasticidades renda preço pró prio preço cruzado carne suína preço cruzado carne bovina Por quê Segundo a teoria econômica 8620 Suponha que alguém afirme que as carnes de frango suína e bovina são produtos sem qualquer relação no sentido de que o consumo de frango não é afetado pelo preço das car nes suína e bovina em resumo 8621 Portanto a regressão com restrições será 8622 Continua ECONOBOOKindb 265 23112010 071356 266 Parte Um Modelos de regressão com equação única exeMPlo 84 Continuação a equação 8619 é obviamente a regressão sem restrições Com os dados do exercício 719 obtemos os seguintes resultados Regressão sem restrições 8623 Regressão com restrições 8624 em que os números entre parênteses são os erros padrão estimados Nota os valores de R2 das equações 8623 e 8624 são comparáveis já que a variável dependente dos dois modelos é a mesma agora a razão F para testar a hipótese da equação 8621 é 8610 o valor de m neste caso é 2 pois há duas restrições envolvidas Ø4 D 0 e Ø5 D 0 os graus de liberdade do denominador n k são 18 já que n D 23 e k D 5 5 coeficientes Ø Portanto a razão de F é 8625 que tem distribuição F com 2 e 18 graus de liberdade a 5 é claro que esse valor de F não tem significância estatística F05218 D 355 o valor p é 03472 não há razão para rejeitar a hipótese nula a demanda por frango não depende dos preços das carnes suínas e bovinas em resumo podemos aceitar a regres são com restrições 8624 como representativa da função demanda de frango observe que a função demanda satisfaz as expectativas econômicas a priori já que a elas ticidade preço própria é negativa e a elasticidade renda é positiva Contudo a elasticidade preço estimada em valor absoluto é estatisticamente menor que um implicando que a demanda por frango é inelástica em relação ao preço Por quê Também a elasticidade renda embora positiva é estatisticamente menor que um o que sugere que o frango não é um bem de luxo por convenção considerase que bens de luxo são aqueles cuja elasticidade renda é maior que 1 87 Teste da estabilidade estrutural ou dos parâmetros nos modelos de regressão o teste de Chow Quando utilizamos um modelo de regressão que envolve o uso de séries temporais pode aconte cer que se verifique uma mudança estrutural na relação entre o regressando e os regressores Por mudança estrutural entendemos que os valores dos parâmetros do modelo não se mantêm iguais durante todo o período de tempo Às vezes a mudança estrutural decorre de forças externas por exemplo os embargos do petróleo impostos pela Opep em 1973 e 1979 ou a Guerra do Golfo de ECONOBOOKindb 266 23112010 071357 Capítulo 8 Análise da regressão múltipla o problema da inferência 267 19901991 ou por mudanças na política econômica como a passagem de um sistema de câmbio fixo para outro de taxa flutuante por volta de 1973 ou por ações tomadas pelo Congresso como as mudanças tributárias promovidas pelo presidente Reagan ou alterações do salário mínimo ou várias outras causas Como podemos verificar que ocorreu de fato uma mudança estrutural Para ser específico ve jamos os dados apresentados na Tabela 89 Essa Tabela apresenta os dados sobre a renda pessoal disponível e as poupanças pessoais em bilhões de dos Estados Unidos no período 1970 a 1995 Suponha que queiramos estimar uma função poupança simples que relacione a poupança Y com a renda pessoal disponível RPD X Uma vez que temos os dados podemos calcular uma regressão de Y contra X usando os mínimos quadrados ordinários Mas ao fazermos isso estamos sustentando que a relação entre poupança e renda pessoal disponível não mudou muito nesse período de 26 anos Essa pode ser uma hipótese muito forte Por exemplo sabese que em 1982 os Estados Unidos re gistraram sua pior recessão em tempos de paz A taxa de desemprego civil atingiu 97 nesse ano a mais alta desde 1948 Um evento dessa grandeza poderia perturbar a relação entre poupança e renda Para verificarmos se isso aconteceu podemos dividir os dados da amostra em dois períodos 19701981 e 19821995 ou seja os períodos anterior e posterior à recessão de 1982 Temos agora três possíveis regressões 871 872 873 A regressão 873 pressupõe que não há diferença entre os dois períodos e estima a relação entre poupança e renda pessoal para todo o período que consiste em 26 observações Em outras palavras essa regressão considera que o intercepto e o coeficiente angular da re gressão permanecem os mesmos durante todo o período ou seja não se verifica mudança estru tural Se esta for de fato a situação então Æ1 D l1 D g1 e Æ2 D l2 D g2 As regressões 871 e 872 pressupõem que as regressões dos dois períodos sejam diferentes o intercepto e os coeficientes angulares diferem como indicado pelos parâmetros com subscritos Nas regressões os u representam os termos de erro e os n o número de observações Para os dados apresentados na Tabela 89 as contrapartidas das três regressões anteriores são as seguintes 871a Tabela 89 Estados Unidos poupança e renda pessoal disponível em bilhões de 19701995 Fonte Economic Report of the President ECONOBOOKindb 267 23112010 071359 268 Parte Um Modelos de regressão com equação única 872a 873a Nas regressões anteriores a SQR indica a soma do quadrado dos resíduos e os números entre parênte ses são os valores t estimados A observação das regressões estimadas sugere que a relação entre a poupança e a renda pessoal disponível não é a mesma nos dois subperíodos O coeficiente angular das regressões de poupança contra renda representa a propensão marginal a poupar PMP ou seja a variação média das poupanças decorrentes do aumento de um dólar na renda pessoal disponível No período 1970 1981 a PMP era de cerca de 008 enquanto no período 19821995 era de cerca de 002 É difícil dizer se essa mudança foi decorrente das políticas econômicas implementadas pelo presidente Reagan Mas isso sugere que a regressão combinada 873a aquela que reúne todas as 26 observações em uma regressão comum desconsiderando possíveis diferenças nos dois períodos pode não ser adequada Obviamente a afirmação anterior deve ser apoiada pelos testes estatísticos pertinentes A propósito o diagrama de dispersão e as linhas de regressão estimadas são apresen tados na Figura 83 Agora as possíveis diferenças ou seja as mudanças estruturais podem ser provocadas por dife renças no intercepto ou no coeficiente angular ou em ambos Como descobrimos isso Uma impres são visual pode ser obtida na Figura 83 Mas seria útil ter um teste formal Este é o lugar em que o teste de Chow vem a calhar15 Ele pressupõe que 1 u1t ª N0 æ 2 e u2t ª N0 æ 2 Isto é os termos de erro nas regressões dos subperíodos distribuemse normalmente com a mesma variância homocedástica æ 2 2 Os dois termos de erro u1t e u2t têm distribuições independentes 15 ChoW Gregory C Tests of equality between sets of coefficients in two linear regressions Econometrica v 28 n 3 1960 p 591605 fiGuRa 83 500 50 1000 1500 Renda 2000 2500 100 150 Poupança 200 250 19701981 2000 160 3000 4000 Renda 5000 6000 180 Poupança 280 19821995 200 220 240 260 ECONOBOOKindb 268 23112010 071400 Capítulo 8 Análise da regressão múltipla o problema da inferência 269 A mecânica do teste de Chow é a seguinte 1 Estimase a regressão 873 que será adequada se não houver instabilidade dos parâmetros e obtémse SQR com n1 C n2 k graus de liberdade em que k é o número de parâmetros estimados 2 neste caso Em nosso exemplo SQR3 D 2324830 Chamamos SQR3 de soma restrita dos qua drados dos resíduos SQRR porque é obtida pela imposição da restrição de que 1 D 1 e 2 D 2 ou seja as regressões dos subperíodos não são diferentes 2 Estimase a Equação 871 e obtémse a soma dos quadrados dos resíduos SQR1 com n1 k graus de liberdade Em nosso exemplo SQR1 D 1785032 e 10 graus de liberdade 3 Estimase a Equação 872 e obtémse a soma dos quadrados dos resíduos SQR2 com n2 k graus de liberdade Em nosso exemplo SQR2 D 1000522 e 12 graus de liberdade 4 Já que consideramos que os dois conjuntos de amostras são independentes podemos somar SQR1 e SQR2 para obter o que podemos chamar de soma sem restrições dos quadrados dos resí duos SQRSR que é Neste caso 5 Agora a ideia subjacente ao teste de Chow é que se não há mudança estrutural ou seja se as regressões 871 e 872 são essencialmente iguais então a SQRR e a SQRSR não deveriam ser estatisticamente diferentes Portanto tomando a razão 874 Chow mostrou que sob a hipótese nula as regressões 871 e 872 são estatisticamente iguais não há mudança ou quebra estrutural e a razão F anterior segue a distribuição F com k e n1 C n2 2k graus de liberdade no numerador e no denominador respectivamente 6 Portanto não rejeitaremos a hipótese nula de estabilidade dos parâmetros ausência de mudan ça estrutural se o valor de F calculado em uma aplicação não for superior ao valor de F crítico regis trado na tabela F no nível de significância ou valor p escolhido Nesse caso o uso da regressão combinada restrita 873 pode ser justificado Contrariamente se o valor de F calculado for supe rior ao valor de F crítico rejeitaremos a hipótese de estabilidade dos parâmetros e concluiremos que as regressões 871 e 872 são diferentes e desse modo o emprego da regressão combinada 873 seria no mínimo de valor dúbio Voltando ao nosso exemplo verificamos que 875 Na tabela F descobrimos que com 2 e 22 graus de liberdade o valor crítico de F para um nível de significância de 1 é igual a 572 A probabilidade de obter um valor F igual ou maior que 1069 é muito menor que 1 na realidade o valor p é de apenas 000057 O teste de Chow portanto parece apoiar a nossa ideia inicial de que a relação entre a poupança e a renda nos Estados Unidos sofreu uma mudança estrutural ao longo do período 19701995 supondo que as hipóteses que embasam o teste estejam válidas Em breve falaremos mais sobre esse assunto Observe a propósito que o teste de Chow pode ser facilmente generalizado para lidar com casos em que há mais de uma quebra estrutural Por exemplo se acreditamos que a relação poupançarenda mudou depois da posse do presidente Clinton em janeiro de 1992 podemos dividir a amostra em três subperíodos 19701981 19821991 19921995 e aplicar o teste de Chow ECONOBOOKindb 269 23112010 071401 270 Parte Um Modelos de regressão com equação única Obviamente teríamos quatro termos SQR um para cada período e um para os dados combinados mas a lógica do teste permanece a mesma Hoje os dados disponíveis já chegam a 2007 de modo que o último subperíodo poderia ser estendido Há algumas ressalvas sobre o teste de Chow que devem ser lembradas 1 As hipóteses que embasam o teste devem estar válidas Por exemplo é preciso verificar se as variâncias dos erros das regressões 871 e 872 são as mesmas Discutiremos este ponto em breve 2 O teste de Chow apenas indicará se as duas regressões 871 e 872 são diferentes sem in formar se a diferença é por conta dos interceptos dos coeficientes angulares ou de ambos No Capí tulo 9 sobre variáveis binárias veremos como podemos responder a questão 3 O teste de Chow pressupõe que conhecemos os pontos de quebra estrutural No exemplo presumimos que ela seria em 1982 Se não for possível determinar o momento em que realmente aconteceu a mudança estrutural talvez tenhamos de usar outros métodos16 Antes de deixarmos o teste de Chow e a regressão poupançarenda examinaremos uma das hipó teses que embasam o teste de Chow a de que as variâncias dos erros são iguais nos dois períodos Como não podemos observar as verdadeiras variâncias dos erros nos dois períodos obtemos suas estimativas por meio das SQR das regressões 871a e 872a a saber 876 877 Observe que uma vez que existem dois parâmetros estimados em cada equação subtraímos 2 do número de observações para obter os graus de liberdade Dadas as hipóteses subjacentes ao teste de Chow æO 2 1 e æO 2 2 são estimadores não viesados das verdadeiras variâncias dos dois subperíodos Como resultado podemos demonstrar que se æO 2 1 D æO 2 2 ou seja as variâncias das duas subpopulações são iguais como pressupõe o teste de Chow então podemos demonstrar que 878 segue a distribuição F com n1 k e n2 k graus de liberdade no numerador e no denominador respectivamente em nosso exemplo k D 2 visto que existem apenas dois parâmetros em cada subregressão Obviamente se æ 2 1 D æ 2 2 o teste de F anterior reduzse ao cálculo de 879 Nota por convenção colocamos a maior das duas variâncias estimadas no numerador Veja no Apêndice A os detalhes de F e outras distribuições de probabilidade Calculando esses F em uma aplicação e comparandoos ao valor crítico de F com os graus de li berdade apropriados podemos decidir rejeitar ou não a hipótese nula de que as variâncias das duas subpopulações são iguais Se a hipótese nula não for rejeitada poderemos usar o teste de Chow Voltando à regressão poupançarenda obtemos o seguinte resultado 8710 16 em Greene William h Econometric analysis 4 ed englewood Cliffs nJ Prentice hall 2000 p 293297 encontrase um exame detalhado da questão ECONOBOOKindb 270 23112010 071402 Capítulo 8 Análise da regressão múltipla o problema da inferência 271 Sob a hipótese nula de igualdade das variâncias das duas subpopulações esse valor de F segue a distribuição F com 12 e 10 graus de liberdade no numerador e denominador respectivamente Nota colocamos a maior das duas variâncias estimadas no numerador Vemos nas tabelas de F do Apên dice D que os valores críticos de F a 5 e 1 com 12 e 10 graus de liberdade respectivamente são 291 e 471 O valor de F calculado é significativo ao nível de 5 e quase significativo ao nível de 1 Podemos concluir que as variâncias das duas subpopulações não são as mesmas e na realidade não deveríamos aplicar o teste de Chow Nosso propósito aqui foi o de demonstrar a mecânica do teste de Chow muito usado em trabalhos aplicados Se as variâncias dos erros das duas subpopulações forem heterocedásticas o teste de Chow poderá ser modificado Mas esse procedimento está além do escopo deste livro17 Outro ponto que mencionamos anteriormente foi o de que o teste de Chow é sensível à escolha do período em que os parâmetros de regressão podem ter registrado a mudança No exemplo presumi mos que a mudança provavelmente ocorreu no ano de recessão 1982 Se tivéssemos suposto que se trata de 1981 quando Ronald Reagan assumiu a Presidência o valor calculado de F poderia ser dife rente Como aliás no Exercício 834 o leitor será convidado a verificar isso Se não quisermos escolher o ponto em que a quebra da relação subjacente ocorreu podemos re correr a métodos alternativos como o teste residual recursivo Retomaremos a questão no Capítulo 13 que trata a análise de especificação do modelo 88 Previsão com regressão múltipla Na Seção 510 mostramos como o modelo de regressão com duas variáveis pode ser usado para 1 fazer previsões médias ou seja prever o ponto na função de regressão populacional FRP bem como para 2 previsões individuais ou seja prever um valor individual de Y dado o valor do regressor X D X0 em que X0 é o valor numérico especificado de X A regressão múltipla estimada também pode ser usada para propósitos semelhantes e o proce dimento para tal é uma extensão direta do caso de duas variáveis exceto que as fórmulas para estimar as variâncias e os erros padrão do valor previsto comparáveis às Equações 5102 e 5106 do modelo de duas variáveis são muito complicadas e melhor tratadas pelos métodos matriciais examinados no Apêndice C Com certeza a maioria dos programas de regressão pode fazer isso rotineiramente então não é necessário procurar a formulação matricial Ela é apresen tada no Apêndice C beneficiando os estudantes com inclinações matemáticas nele encontramos também um exemplo plenamente elaborado 89 A trinca dos testes de hipótese a razão de verossimilhança RV o teste de Wald W e o multiplicador de Lagrange ML18 Neste e no capítulo anterior empregamos de modo geral os teste t F e quiquadrado para testar várias hipóteses no contexto de modelos de regressão lineares nos parâmetros Mas uma vez que vamos além do mundo confortável dos mo delos de regressão linear precisamos de métodos para testar hipóteses que possam tratar modelos de regressão lineares ou não A conhecida trindade dos testes de verossimilhança de Wald e do multiplicador de Lagrange pode cumprir esse objetivo O interessante é observar que assintoticamente no caso de amostras 17 Um exame do teste de Chow sob condições de heterocedasticidade é encontrado em Greene William h Econometric analysis 4 ed englewood Cliffs nJ Prentice hall 2000 p 292293 e em darnell adrian C A dictionary of econometrics reino Unido edward elgar 1994 p 51 opcionais 18 Uma apresentação acessível pode ser encontrada em bUSe a The likelihood ratio Wald and langrange multiplier tests an expository note American Statistician 1982 v 36 p 153157 ECONOBOOKindb 271 23112010 071402 272 Parte Um Modelos de regressão com equação única grandes todos os três são equivalentes e que o teste estatístico associado a cada um deles segue a distribuição de quiquadrado Embora examinemos o teste de verossimilhança no apêndice deste capítulo de modo geral não empregamos esses testes neste livro pela simples razão de que em amostras pequenas ou finitas que infelizmente são aquelas com que lida a maioria dos pesquisadores o teste F que utilizamos até aqui será suficiente Como Davidson e MacKinnon observam No caso de modelos de regressão linear com e sem erros normais não há a necessidade de examinar mos a razão de verossimilhança RV o teste de Wald W e o multiplicador de Lagrange ML já que não nos proporcionam informações maiores do que as já presentes em F19 810 Teste da forma funcional da regressão escolha entre modelos de regressão lineares e loglineares A escolha entre um modelo de regressão linear o regressando é uma função linear dos regresso res ou um modelo loglinear o logaritmo do regressando é uma função dos logaritmos dos regres sores é um dilema perpétuo da análise empírica Podemos recorrer a um teste proposto por MacKinnon White e Davidson que chamaremos para abreviar teste MWD para a escolha entre dois modelos20 Para ilustrar esse teste imaginemos o seguinte H0 modelo linear Y é uma função linear dos regressores os X H1 modelo loglinear ln Y é uma função linear dos regressores os logaritmos dos X em que como de costume H0 e H1 denotam as hipóteses nula e alternativa O teste MWD envolve as seguintes etapas21 Etapa I estimação do modelo linear e obtenção dos valores estimados de Y que chamaremos de Y f ou seja YO Etapa II estimação do modelo loglinear e obtenção dos valores estimados de ln Y que chamaremos de ln f ou seja lnY Etapa III cálculo de Z1 D ln Y f ln f Etapa IV regressão de Y contra X e o Z1 obtido na Etapa III Rejeitase H0 se o coeficiente de Z1 é estatisticamente significativo segundo o teste t habitual Etapa V cálculo de Z2 D antilogaritmo de ln f Y f Etapa VI regressão do logaritmo de Y contra os logaritmos dos X e Z2 Rejeitase H1 se o coeficiente de Z2 é estatisticamente significativo segundo o teste t habitual Embora o teste MWD pareça complicado sua lógica é bastante simples Se o modelo linear for de fato o modelo correto a variável construída Z1 não deve ser estatisticamente significativa na Etapa IV pois nesse caso os valores estimados de Y com base no modelo linear e aqueles estimados com base 19 davidSon russel maCKinnon James G Estimation and inference in econometrics nova York oxford Univer sity Press 1993 p 456 opcionais 20 mackinnon J WhiTe h davidSon r Tests for model specification in the presence of alternative hypothe sis some further results Journal of Econometrics v 21 p 5370 1983 Um teste semelhante é proposto em bera a K JarQUe C m model specification tests a simultaneous approachJournal of Econometrics v 20 p 5982 1982 21 esta apresentação embasase em Greene William h ET the econometrics toolkit version 3 econometrics Software nova York bellport 1992 p 245246 ECONOBOOKindb 272 23112010 071403 Capítulo 8 Análise da regressão múltipla o problema da inferência 273 no modelo loglinear depois de obtidos seus antilogaritmos para fins de comparação não devem ser diferentes O mesmo comentário aplicase à hipótese alternativa H1 exeMPlo 85 A demanda por rosas voltemos ao exercício 716 em que apresentamos dados relativos à demanda por rosas na área metropolitana de detroit no período que vai do segundo trimestre de 1971 ao se gundo trimestre de 1975 Para fins de ilustração consideraremos que a demanda por rosas seja função apenas dos preços das rosas e dos preços dos cravos deixando de lado por en quanto a variável renda agora vejamos os seguintes modelos 8101 8102 em que Y é a quantidade de rosas em dúzias X2 é o preço médio das rosas no atacado em dúzia e X3 é o preço médio dos cravos no atacado em dúzia A priori esperase que Æ2 e Ø2 seja negativo e Ø3 e Ø3 seja positivo por quê Como sabemos os coeficientes angulares no modelo loglinear dão as elasticidades os resultados da regressão são os seguintes 8103 8104 Como os resultados mostram os dois modelos parecem ajustarse muito bem aos dados os parâmetros apresentam os sinais esperados e os valores de t e de R2 são estatisticamente significativos Para escolhermos um desses modelos com base no teste MWD primeiro testamos a hipótese de que o verdadeiro modelo é o linear de acordo com a etapa iv do teste calcula mos a seguinte regressão 8105 Como o coeficiente de Z1 não é estatisticamente significativo o valor p do t estimado é 098 não rejeitamos a hipótese de que o verdadeiro modelo seja linear Suponha agora que mudemos de opinião e consideremos que o verdadeiro modelo seja o loglinear de acordo com a etapa vi do teste mWd obtemos os seguintes resultados da regressão 8106 o coeficiente de Z2 é estatisticamente significativo a cerca de 12 valor p igual a 01225 Portanto podemos rejeitar a hipótese de que o verdadeiro modelo seja o loglinear neste nível de significância obviamente se mantivermos os níveis de significância convencionais de 1 ou 5 não poderemos rejeitar a hipótese de que o verdadeiro modelo seja loglinear Como este exemplo mostra é bem possível que em certas situações não possamos rejeitar nenhuma das especificações ECONOBOOKindb 273 23112010 071404 274 Parte Um Modelos de regressão com equação única Resumo e Conclusões 1 Este capítulo estendeu e refinou as ideias de estimação de intervalos e teste de hipóteses apresentadas inicialmente no Capítulo 5 no contexto de um modelo de regressão com duas variáveis 2 Em uma regressão múltipla o teste da significância individual de um coeficiente parcial de regressão utilizando o teste t e o teste de significância geral da regressão isto é H0 todos os coeficientes parciais angulares são zero ou R2 0 não são a mesma coisa 3 Em especial a verificação de que um ou mais coeficientes parciais de regressão são não significativos estatisticamente com base no teste t individual não indica que todos os coefi cientes parciais de regressão também sejam coletivamente não significativos estatistica mente Essa hipótese só pode ser testada com auxílio do teste F 4 O teste F é versátil no sentido de que pode testar uma grande variedade de hipóteses como verificar se 1 um coeficiente individual de regressão é estatisticamente significativo 2 todos os coeficientes parciais angulares são iguais a zero 3 dois ou mais coeficientes são estatisticamente iguais 4 os coeficientes satisfazem alguma restrição linear e 5 o modelo de regressão apresenta estabilidade estrutural 5 Como no caso de duas variáveis o modelo de regressão múltipla pode ser usado para fins de previsão média e ou individual exeRCíCioS 81 Imagine que você deseja estudar o comportamento das vendas de um produto por exemplo automóveis ao longo de alguns anos e suponha que alguém lhe sugira testar os seguintes mo delos em que Yt D vendas no ano e t D tempo medido em anos O primeiro modelo postula que as vendas são uma função linear do tempo enquanto o segundo considera que sejam uma função quadrática do tempo a Discuta as propriedades desses modelos b Como você decidiria entre os dois modelos c Em que situações o modelo quadrático seria útil d Procure dados sobre as vendas de automóveis nos Estados Unidos nos últimos 20 anos e verifique qual dos modelos ajustase melhor aos dados 82 Demonstre que a razão F da Equação 8416 é igual à razão F da Equação 8418 Dica SQESQT D R2 83 Mostre que os testes F das Equações 8418 e 8610 são equivalentes 84 Estabeleça as afirmações 8611 e 8612 85 Considere a função de produção CobbDouglas 1 em que Y D produto L D insumo trabalho e K D insumo capital Dividindo 1 por K obtemos 2 ECONOBOOKindb 274 23112010 071405 Capítulo 8 Análise da regressão múltipla o problema da inferência 275 Tomando o logaritmo natural de 2 e acrescentando o termo de erro obtemos 3 em que β0 D ln β1 a Imagine que você tenha os dados para calcular a regressão 3 Como testaria a hipótese de retornos constantes de escala isto é β2 C β3 D 1 b Se os retornos de escala forem constantes como você interpretará a regressão 3 c Faz diferença dividir 1 por L no lugar de K 86 Valores críticos de R2 quando o verdadeiro R2 D 0 A Equação 8411 fornece a relação entre F e R2 sob a hipótese de que todos os coeficientes parciais angulares são simultaneamente iguais a zero isto é R2 0 Do mesmo modo que podemos encontrar o valor crítico de F no nível de sig nificância α na tabela F podemos encontrar o valor crítico de R2 por meio da seguinte relação em que k é o número de parâmetros do modelo de regressão incluindo o intercepto e F é o valor crítico de F no nível de significância α Se o R2 observado exceder o R2 crítico obtido por meio da fórmula anterior poderemos rejeitar a hipótese de que o verdadeiro R2 seja zero Demonstre a fórmula anterior e encontre o valor crítico de R2 para α D 5 no caso da re gressão 814 87 Os resultados abaixo correspondem a uma regressão calculada com dados anuais do período 19681987 1 2 em que Y D gastos dos Estados Unidos com importação de bens em bilhões de de 1982 X2 D renda pessoal disponível em bilhões de de 1982 e X3 D variável de tendência Verdadeiro ou falso o erro padrão de X3 em 1 é 42750 Mostre seus cálculos Dica recorra à relação entre R2 F e t 88 Imagine que na regressão os valores dos coeficientes de regressão e seus erros padrão são conhecidos Sabendo isso como poderíamos estimar os parâmetros e os erros padrão do seguinte modelo de regressão22 89 Suponha que23 em que Y são as despesas pessoais de consumo X2 é a renda pessoal e X3 é a riqueza pessoal O termo X2i X3i é conhecido como termo de interação O que queremos dizer com essa adaptado de KennedY Peter A guide to econometrics 3 ed Cambridge mass The miT Press 1992 p310 ibid p 327 ECONOBOOKindb 275 23112010 071406 276 Parte Um Modelos de regressão com equação única expressão Como seria possível testar a hipótese de que a propensão marginal a consumir PMC isto é β2 é independente da riqueza do consumidor 810 Dados os seguintes resultados de uma regressão É possível descobrir qual o tamanho da amostra que gerou esses resultados Dica lembrese da relação entre os valores de R2 F e t 811 Com base no que dissemos sobre o uso dos testes t e F para testar hipóteses individual e con juntamente quais das seguintes situações seriam possíveis 1 Rejeição da hipótese nula com base na estatística F sem contudo rejeitar cada hipótese nula isolada com base no teste t individual 2 Rejeitar a hipótese nula conjunta com base na estatística F rejeitar uma hipótese indivi dual com base no teste t e não rejeitar as demais hipóteses individuais com base no mesmo teste t 3 Rejeitar a hipótese nula conjunta com base na estatística F rejeitar uma das hipóteses indi viduais com base nos testes t individuais 4 Não rejeitar a hipótese nula conjunta com base na estatística F rejeitar uma das hipóteses nulas individuais com base nos testes t 5 Não rejeitar a hipótese nula conjunta com base na estatística F rejeitar uma das hipóteses individuais com base no teste t e não rejeitar as demais com base no mesmo teste 6 Não rejeitar a hipótese nula conjunta com base na estatística F mas rejeitar todas as hipó teses nulas individuais com base nos testes t24 exercícios aplicados 812 Voltemos ao Exercício 721 a Quais as elasticidades renda real e taxa de juros dos saldos monetários reais b Essas estatísticas têm individualmente significância estatística c Teste a significância geral da regressão estimada d A elasticidade renda da demanda por saldos monetários reais é significativamente diferen te da unidade e A variável taxa de juros deveria permanecer no modelo Por quê 813 Com dados relativos a 46 Estados dos Estados Unidos para o ano de 1992 Baltagi obteve os seguintes resultados de uma regressão 25 em que C D consumo de cigarros em maçosano P D preço real do maço Y D renda real disponível per capita extraído de berndT ernst r The pratice of econometrics classic and contemporary reading mass addisonWesley 1991 p 79 veja balTaGi badi h Econometrics nova York Springerverlag 1998 p111 276 Parte Um Modelos de regressão com equação única ECONOBOOKindb 276 23112010 071407 Capítulo 8 Análise da regressão múltipla o problema da inferência 277 a Qual a elasticidadepreço da demanda por cigarros em relação ao preço É estatistica mente significativa É estatisticamente diferente de 1 b Qual a elasticidadepreço da demanda por cigarros É estatisticamente significativa Se não for qual seriam as razãoões c Como poderíamos obter R2 com base no R2 ajustado acima 814 Com base uma amostra de 209 empresas Wooldridge obteve os seguintes resultados de regressão26 em que salário D salário do CEO vendas D vendas anuais da empresa roe D retorno sobre o patrimônio em ros D retorno sobre as ações da empresa e os números entre parênteses são os erros padrão estimados a Interprete a regressão anterior levando em conta quaisquer expectativas a priori que você poderia ter sobre os sinais dos vários coeficientes b Qual dos coeficientes é individualmente significativo do ponto de vista estatístico no nível de 5 c Qual a significância geral da regressão Que testes você aplicou Por quê d Poderíamos interpretar os coeficientes de roe e ros como coeficientes de elasticidade Jus tifique sua resposta 815 Supondo que Y e X2 X3 Xk apresentem em conjunto distribuição normal e que a hipótese nula seja a de que as correlações parciais da população sejam individualmente iguais a zero R A Fisher demonstrou que segue a distribuição t com n k 2 graus de liberdade em que k é o késimo coeficiente de correlação parcial e n é o número total de observações Nota r123 é um coeficiente de correlação parcial de primeira ordem r1234 é um coeficiente de correlação parcial de segunda ordem e as sim por diante Voltemos ao Exercício 72 Supondo que Y X2 e X3 registrem conjuntamente uma distribuição normal calcule as três correlações parciais r123 r132 e r231 e teste sua signifi cância na hipótese de que as correlações populacionais correspondentes são individualmente iguais a zero 816 Ao estudar a demanda de tratores agrícolas dos Estados Unidos nos períodos 19211941 e 19481957 Griliches obteve os seguintes resultados 27 See Jeffrey m Wooldridge Introductory Econometrics SouthWestern Publishing Co 2000 pp 154155 GriliCheS Z The demand for a durable input farm tractors in the United States 19211957 in harberGer arnold C ed The demand for durable goods Chicago The University of Chicago Press 1960 p 192 tabela 1 ECONOBOOKindb 277 23112010 071408 278 Parte Um Modelos de regressão com equação única em que Yt D valor do estoque de tratores existentes nos estabelecimentos agrícolas em 1º de janeiro em dólares de 193539 X2 D índice de preços dos tratores dividido por um índice dos preços rece bidos por todos os produtos agrícolas no período t 1 X3 D taxa de juros vigente no ano t 1 Os números entre parênteses são os erros padrão a Interprete a regressão anterior b Os coeficientes angulares estimados apresentam individualmente significância estatísti ca São significativamente diferentes de 1 c Aplique a técnica de análise de variância para testar a significância da regressão geral Dica use a variante R2 da técnica ANOVA d Como seria possível calcular a elasticidade da demanda por tratores agrícolas em relação à taxa de juros e Como seria possível testar a significância do R2 estimado 817 Considere a seguinte equação de determinação dos salários para a economia britânica no período 19501969 28 em que W D salários e ordenados por funcionário PF D preços do produto final a custo de fatores U D taxa de desemprego na GrãBretanha em do total de empregados do país t D anos Os números entre parênteses são os errospadrão estimados a Interprete a regressão acima b Os coeficientes estimados são individualmente significativos c Qual é a lógica do uso da variável PFt1 d A variável PF t1 deveria ser excluída do modelo Por quê e Como poderíamos calcular a elasticidade dos salários e ordenados por funcionário em re lação à taxa de desemprego U 818 A equação a seguir é uma variante daquela dada no Exercício 817 29 em que W D salários e ordenados por funcionário V D vagas abertas na GrãBretanha como percentual do número de empregados do país X D produto interno bruto por pessoa empregada M D preço das importações Mt1 D preços das importações no ano anterior ou defasado Os números entre parênteses são os erros padrão estimados a Interprete a equação acima extraído de Prices and earnings in 19511969 an econometric assessment dept of employment hmSo equa ção 19 1971 p 35 ibid equação 67 p 37 ECONOBOOKindb 278 23112010 071409 Capítulo 8 Análise da regressão múltipla o problema da inferência 279 b Quais dos coeficientes estimados são do ponto de vista estatístico individualmente signi ficativos c Qual é a lógica da inclusão da variável X A priori seria de esperar que seu sinal fosse negativo d Qual o objetivo da inclusão de Mt e Mt1 no modelo e Qual das variáveis poderia ser excluída do modelo Por quê f Teste a significância geral da regressão observada 819 No caso da função de demanda por carne de frango estimada na Equação 8624 a elastici dade renda estimada é igual a 1 A elasticidade preço é igual a 1 820 No caso da função de demanda na Equação 8624 como seria possível testar a hipótese de que o valor da elasticidade renda é igual ao da elasticidade preço mas seus sinais são contrá rios Mostre os cálculos necessários Nota cov ØO2 ØO3 H 000142 821 Volte à função de demanda por rosas do Exercício 716 e restrinja suas considerações à especifi cação logarítmica a Qual a elasticidade preço própria estimada isto é a elasticidade com respeito ao preço das rosas b É estatisticamente significativa c Em caso positivo é significativamente diferente da unidade d A priori quais seriam os sinais esperados de X3 preço dos cravos e X4 renda Os resul tados empíricos estão de acordo com essas expectativas e Se os coeficientes de X3 e X4 forem não significativos estatisticamente quais poderiam ser as razões disso 822 Volte ao Exercício 717 que trata das atividades de prospecção de petróleo a Cada um dos coeficientes angulares estimados é estatisticamente significativo no nível de 5 b Você rejeitaria a hipótese de que R2 H 0 c Qual a taxa de crescimento instantânea das atividades de prospecção de petróleo no perío do 19481978 E a taxa de crescimento geométrica no mesmo período 823 Volte à regressão dos gastos militares dos Estados Unidos estimada no Exercício 718 a Comente os resultados gerais da regressão estimada b Monte uma tabela ANOVA e teste a hipótese de que todos os coeficientes parciais angula res são iguais a zero 824 A função a seguir é conhecida como função de produção transcendental ou translog FPT uma generalização da função de produção CobbDouglas em que Y H produto L H insumo trabalho e K H insumo capital Depois de aplicar logaritmos e acrescentar um termo de erro estocástico obtemos a FPT em que β0 H ln β1 a Quais as propriedades dessa função b Para que a FTP reduzase a uma função de produção CobbDouglas quais deveriam ser os valores de β4 e β5 c Se tivéssemos os dados em mãos como poderíamos verificar se a FTP reduzse a uma função de produção CobbDouglas Que procedimentos de teste deveríamos aplicar d Verifique se a FTP ajustase aos dados da Tabela 88 Mostre seus cálculos ECONOBOOKindb 279 23112010 071410 280 Parte Um Modelos de regressão com equação única 825 Preços da energia e formação de capital Estados Unidos 19481978 Para testar a hipótese de que um aumento nos preços da energia em relação ao produto provoca uma queda de pro dutividade dos recursos de capital e trabalho existentes John A Tatom estimou a seguinte função de produção para os Estados Unidos no período que vai do primeiro trimestre de 1948 ao segundo trimestre de 197830 em que y H produção real do setor privado k H indicador do fluxo de serviços de capital h H horashomens trabalhadas no setor privado Pe H índice de preços ao produtor para combustíveis e produtos correlatos P H deflator de preços para o setor privado t H tempo em trimestres Os números entre parênteses são as estatísticas t a Os resultados confirmam a hipótese do autor b Entre 1972 e 1977 o preço relativo da energia Pe P aumentou 60 Com base na re gressão estimada qual foi a perda de produtividade c Depois de levar em conta as alterações de hk e Pe P qual foi a taxa de crescimento tendencial da produtividade durante o período de amostragem d Como você interpretaria o valor de 07135 para o coeficiente e O fato de que cada um dos coeficientes angulares parciais é estatisticamente significativo por quê quer dizer que podemos rejeitar a hipótese R2 H 0 Justifique sua resposta 826 A demanda por cabos A Tabela 810 fornece dados usados por um fabricante de cabos telefô nicos para prever as vendas a um de seus principais clientes no período 19681983 31 As variáveis do quadro são assim definidas Y H vendas anuais em milhões de pés de pares MPP X2 H produto nacional bruto PNB em bilhões de X3 H construção de moradias milhares de unidades X4 H taxa de desemprego X5 H taxa de juros preferencial com defasagem de 6 meses X6 H ganhos de clientes por linha Considere o seguinte modelo a Estime a regressão acima b Quais os sinais esperados para os coeficientes deste modelo c Os resultados empíricos estão de acordo com as expectativas d Os coeficientes parciais estimados são do ponto de vista estatístico individualmente signi ficativos no nível de 5 veja deste autor energy Prices and Capital Formation 19721977 Review Federal Reserve Bank of St Louis v 61 n 5 p 4 5 de maio 1979 agradeço a daniel J reardon pela coleta e processamento de dados ECONOBOOKindb 280 23112010 071410 Capítulo 8 Análise da regressão múltipla o problema da inferência 281 e Suponha que você primeiro faça apenas a regressão de Y contra X2 X3 e X4 e então decida incluir as variáveis X5 e X6 Como poderíamos verificar se vale a pena o acréscimo destas novas variáveis Que teste poderia ser usado Demonstre os cálculos necessários 827 Marc Nerlove estimou a seguinte função de custo para a geração de energia elétrica32 1 2 3 1 em que Y D custo total de produção X D produção em quilowattshora P1 D preço do trabalho P2 D preço do capital P3 D preço do combustível u D termo de erro Teoricamente esperase que a soma das elasticidades preço seja igual à unidade ou seja α1 α2 α3 Ao impor essa restrição a função anterior pode ser escrita como 2 Em outras palavras 1 é uma função de custo sem restrições enquanto 2 é uma função res trita Com base em uma amostra de 29 empresas de tamanho médio e após efetuar uma transforma ção logarítmica Nerlove obteve os seguintes resultados de regressão 3 nerlove marc returns to scale in eletric supply in ChriST Carl ed Measurement in economics Palo alto Calif Stanford University Press 1963 a notação foi alterada Tabela 810 Variáveis da regressão Vendas anuais MPP ECONOBOOKindb 281 23112010 071412 282 Parte Um Modelos de regressão com equação única 4 a Interprete as equações 3 e 4 b Como seria possível verificar se a restrição α1 C α2 C α3 é válida Mostre seus cálculos 828 Estimação do modelo de formação de preços de ativos CAPM Na Seção 61 consideramos rapidamente esse modelo conhecido da teoria moderna do portfólio Na análise empírica a sua estimativa é feita em duas etapas Etapa I Regressão de série temporal Para cada um dos N títulos incluídos na amostra calculamos a seguinte regressão 1 em que Rit e Rmt são as taxas de retorno do iésimo título e do portfólio de mercado por exem plo do índice SP 500 no ano t βi como já mencionado é o coeficiente beta ou coeficiente de volatilidade de mercado do iésimo título e eit é o resíduo Ao todo são N regressões deste tipo uma para cada título com o que temos N estimativas de βi Etapa II Regressão de corte transversal Nesta etapa calculamos a seguinte regressão para os N títulos 2 em que R i é a taxa média de retorno do título i calculada para o período coberto pela amostra da Etapa I ØOi é o coeficiente beta estimado na regressão da primeira etapa e ui é o termo residual Comparando a regressão 2 obtida na segunda etapa com a Equação do CAPM 612 escri ta como 3 em que rf é a taxa de retorno livre de risco vemos que O1 é uma estimativa de rf e O2 é uma estimativa de ERm rf o prêmio de risco do mercado Assim ao testar empiricamente o CAPM R i e ØOi são usados como estimadores de ERi e ØOi respectivamente Agora se o CAPM for válido estatisticamente Considere agora um modelo alternativo 4 em que s2 ei é a variância residual do iésimo título da regressão estimada na primeira etapa Então se o CAPM for válido O3 não deve ser significativamente diferente de zero Para testar o modelo Levy estimou as regressões 2 e 4 usando uma amostra de 101 ações para o período 19481968 e obteve os seguintes resultados33 levY h equilibrium in an imperfect market a constraint on the number of securities in the portfolio American Economic Review set 1978 v 68 n 4 p 643658 ECONOBOOKindb 282 23112010 071413 Capítulo 8 Análise da regressão múltipla o problema da inferência 283 2 4 a Estes resultados confirmam o CAPM b Vale a pena acrescentar a variável s2 ei ao modelo Justifique c Se o modelo CAPM for válido O1 em 2 deveria aproximarse do valor médio da taxa li vre de risco rf O valor estimado é 109 Isso parece uma estimativa razoável da taxa de retorno livre de risco no período observado 19481968 Podemos considerar a taxa de retorno das letras do Tesouro dos Estados Unidos ou outro ativo comparativamente livre de risco d Se o modelo CAPM for válido o prêmio de risco de mercado R m rf da Equação 2 é de cerca de 37 Se supusermos que rf é 109 isso implica que R m para o período da amostra é de cerca de 146 Essa estimativa parece razoável e O que podemos dizer sobre o CAPM em geral 829 Voltemos ao Exercício 721c Agora que temos em mãos as ferramentas necessárias que testes deveriam ser usados para escolher um dos modelos Mostre os cálculos necessá rios Vale observar que as variáveis dependentes dos dois modelos são diferentes 830 Voltemos ao Exemplo 83 Empregue o teste t como apresentado na Equação 864 para des cobrir se a economia mexicana registrou retornos constantes de escala no período estudado 831 Voltemos ao exemplo da mortalidade infantil Na regressão 762 estimamos a regressão da mortalidade infantil MI contra o PNB per capita PNBpc e a taxa de alfabetização feminina TAF Agora vamos ampliar esse modelo incluindo a taxa de fecundidade total TFT Os dados sobre essas variáveis constam da Tabela 64 Reproduzimos a seguir a regressão 762 e mostramos os resultados do modelo de regressão ampliado pc pc 762 a Interprete o coeficiente de TFT A priori deveríamos esperar uma relação positiva ou ne gativa entre MI e TFT Justifique sua resposta b Os valores dos coeficientes de PNBpc e de TAF alteraramse com o cálculo da nova regres são Em caso afirmativo qualis poderiam ser as razãoões A diferença observada é estatisticamente significativa Que teste você usou e por quê c Como faria para escolher entre os modelos 1 e 2 Que testes estatísticos aplicaria para responder a essa pergunta Mostre os cálculos necessários d Não apresentamos o erro padrão do coeficiente de TFT É possível verificar qual é Dica reveja as relações entre as distribuições t e F 832 Voltemos ao Exercício 17 em que encontramos dados sobre impressões retidas e orçamento publicitário em uma amostra de 21 empresas No Exercício 511 representamos esses dados graficamente e escolhemos um modelo adequado para relacionar as duas variáveis ECONOBOOKindb 283 23112010 071414 284 Parte Um Modelos de regressão com equação única Tomando Y como impressões retidas e X como gastos com publicidade calculamos duas re gressões com os seguintes resultados a Interprete os dois modelos b Qual o melhor Por quê c Que testes estatísticos você usaria para escolher um dos modelos d Os gastos com publicidade apresentam retornos decrescentes ou seja após certo nível de gastos nível de saturação a publicidade deixa de compensar Poderíamos verificar qual é esse nível Mostre os cálculos necessários 833 Na regressão 794 apresentamos os resultados da função de produção CobbDouglas ajus tada ao setor de manufatura dos 50 Estados e do Distrito de Washington para 2005 Com base nessa regressão verifique se o setor registrou retornos constantes de escala empregando a O teste t dado na Equação 864 A covariância entre os dois estimadores dos coeficientes angulares é igual a 003843 b O teste F dado na Equação 869 c Há diferenças entre os dois resultados E qual a conclusão que podemos tirar em relação aos retornos de escala no setor de manufatura dos 50 Estados e do distrito de Washington no período da amostra 834 Consideremos a regressão da poupança contra a renda dada na Seção 87 Imagine que dividi mos a amostra em dois períodos de 1970 a 1982 e de 1983 a 1995 Verifique aplicando a teste de Chow se houve uma mudança estrutural na relação poupançarenda nos dois períodos Comparando os resultados obtidos agora com os apresentados na Seção 87 que conclusões gerais podem ser tiradas a respeito da sensibilidade do teste de Chow à escolha do ponto de quebra que divide uma amostra em dois ou mais períodos 835 Votando ao Exercício 724 e aos dados na Tabela 712 com relação às quatro variáveis econô micas nos Estados Unidos entre 19472000 a Com base na regressão de gastos de consumo sob a renda real riqueza real e taxa real de juros verifique quais dos coeficientes de regressão são do ponto de vista estatístico indi vidualmente significativos no nível de significância de 5 Os sinais dos coeficientes esti mados estão de acordo com a teoria econômica b Com base nos resultados de a como você estimaria a elasticidadepreço riqueza e taxa de juros Que informação adicional se houver é necessária para calcular as elasticidades c Como você testaria a hipótese de que a elasticidaderenda e riqueza são as mesmas Mostre os cálculos necessários d Suponha que em vez da função linear de consumo estimada você faça a regressão do loga ritmo do consumo contra os logaritmos da renda riqueza e taxa de juros Mostre os resultados da regressão Como você interpreta os resultados e Quais as elasticidadesrenda e riqueza estimadas em d Como você interpreta o coeficien te da taxa de juros estimada em d f Você poderia ter utilizado na regressão em d o logaritmo da taxa de juros em vez da taxa de juros Por quê g Como você compara as elasticidades estimadas em b e em d h Entre os modelos de regressão estimados em a e d qual você prefere Por quê ECONOBOOKindb 284 23112010 071415 Capítulo 8 Análise da regressão múltipla o problema da inferência 285 i Suponha que em vez de estimar o modelo dado em d você apenas faça a regressão do lo garitmo do consumo contra o logaritmo da renda Como você decide se vale a pena acrescen tar o logaritmo da riqueza ao modelo E como você decide se vale a pena acrescentar tanto o logaritmo de riqueza quanto a taxa de juros no modelo Mostre os cálculos necessários 836 Consulte a Seção 88 e os dados na Tabela 89 relativos à renda pessoal disponível e poupança para o período 19701995 Nesse ponto o teste de Chow foi introduzido para verificar se ocor reu uma mudança estrutural com os dados entre os dois períodos A Tabela 811 inclui dados contendo os valores atualizados de 19702005 De acordo com o National Bureau of Economic Research o ciclo mais recente de contratação dos Estados Unidos terminou no final de 2001 Divida os dados em três seções 1 19701981 2 19822001 e 3 20022005 a Calcule os dois modelos para o total de dados anos 19702005 e da terceira secção após 2002 Determine se há uma quebra significativa entre o terceiro período e todo o conjunto de dados utilizando o teste de Chow Tabela 811 Poupança e rendimento pessoal disponível bilhões de dólares Estados Unidos 19702005 bilhões de dólares exceto conforme indicado dados trimestrais ajustados sazonalmente para frequência anual Fonte Department of Com merce Bureau of Economic Analysis ECONOBOOKindb 285 23112010 071415 286 Parte Um Modelos de regressão com equação única b Com os dados novos da Tabela 811 determine se existe uma diferença significativa entre o primeiro conjunto de anos 19701981 e o conjunto de dados completo agora que há um maior número de observações disponíveis c Faça o teste de Chow no período intermediário 19822001 versus aquele com o total de dados para ver se os dados nesse período comportaramse de modo significativamente di ferente do que o resto dos dados Apêndice 8A2 Teste da razão de verossimilhança RV O teste RV está embasado no princípio da máxima verossimilhança MV examinado no Apêndice 4A em que mostramos como obter os estimadores de MV para o modelo de regressão com duas variáveis O princípio pode ser aplicado diretamente ao modelo de regressão múltipla Sob a hipótese de que os termos de erro ui são distribuídos normalmente mostramos que para o modelo de regressão com duas variáveis os estimadores dos coeficientes de regressão de MQO e os de MV eram idênticos mas a variância dos erros estimados eram dife rentes O estimador de MQO de æ 2 é mas o estimador de MV é sendo o primeiro não viesado e o segundo viesado embora no caso de amostras grandes o viés tenda a desaparecer O mesmo é válido para o caso de regressão múltipla Para ilustrarmos vejamos um modelo de regressão com três variáveis 1 Correspondendo à Equação 5 do Apêndice 4A a função de verossimilhança FV logarítmica do modelo 1 pode ser escrita como 2 Como mostrou o Apêndice 4A diferenciando esta função em relação a β1 β2 β3 e æ2 igualando as expres sões resultantes a zero e resolvendo obtemos os estimadores de MV destes parâmetros Os estimadores de MV para β1 β2 e β3 são idênticos aos estimadores de MQO que já foram dados nas Equações 746 a 748 mas a variância do erro será diferente já que a soma dos quadrados dos resíduos SQR será dividida por n em lugar de n 3 como no caso dos mínimos quadrados ordinários Agora imaginemos que a hipótese nula H0 seja que β3 o coeficiente de X3 é igual a zero Neste caso o logaritmo da FV dado em 2 se tornará 3 A Equação 3 é conhecida como função de verossimilhança logarítmica com restrições FVLCR porque é estimada com a restrição a priori de que β3 é igual a zero enquanto a Equação 1 é conhecida como a função de verossimilhança logarítmica sem restrições FVLSR porque não são impostas restrições a priori sobre os parâmetros Para testar a validade da restrição a priori de que β3 é igual a zero o teste da razão de verossimilhança gera a seguinte estatística 4 em que FVLSR e FVLCR são respectivamente a função de verossimilhança logarítmica sem restrições Equa ção 2 e a função de verossimilhança logarítmica com restrições Equação 3 Se o tamanho da amostra for grande podese demonstrar que o teste estatístico dado na Equação 4 segue a distribuição de quiquadrado 2 com números de graus de liberdade iguais ao número de restrições impostas pela hipótese nula 1 neste caso34 A ideia básica por trás do teste de RV é simples se uma ou mais restrições a priori forem válidas os FV logarítmicos restrito e sem restrições não deveriam ser diferentes e assim na Equação 4 seria igual a zero Mas se esse não for o caso os dois FV divergirão Como sabemos que para grandes amostras segue a opcional esta expressão também pode ser escrita nas formas 2FvlCr FvlSr ou 2 ln FvCrFvSr ECONOBOOKindb 286 23112010 071417 Capítulo 8 Análise da regressão múltipla o problema da inferência 287 distribuição de quiquadrado podemos verificar se a divergência é estaticamente significativa em 1 ou 5 Ou podemos encontrar o valor p do estimado Ilustraremos o teste de RV recorrendo ao exemplo da mortalidade infantil Se fizermos a regressão da mor talidade infantil MI contra o PNB per capita PNBpc e a taxa de alfabetização feminina TAF como fize mos na Equação 814 obteremos uma FVLSR de 3281012 mas se fizermos a regressão apenas contra o PNBpc a FVLCR será de 3616396 Em termos de valor absoluto desconsiderando o sinal o primeiro é maior que o segundo o que faz sentido pois há uma variável adicional no primeiro modelo A questão agora é saber se vale a pena acrescentar a variável TAF Se não valer a pena as funções logarítmicas de verossimilhança com e sem restrições não serão muito diferentes mas em caso positivo elas serão diferentes Para verificarmos se a diferença é estatisticamente significativa empregamos agora o teste de RV dado na Equação 4 que nos dá Isso é distribuído assintoticamente segundo a distribuição quiquadrado com 1 grau de liberdade porque só impusemos uma restrição ao omitir a variável TAF do modelo O valor p da obtenção de tal valor de quiquadrado com um grau de liberdade está muito próximo de zero levandonos à conclusão de que a variável TAF não deveria ser excluída do modelo Em outras palavras a regressão restrita neste caso não é válida Vamos permitir que SRQR e SSRQR denote a soma restrita e não restrita dos quadrados dos resíduos a Equação 4 pode também ser expressa como 5 que é distribuída como 2 com r graus de liberdade em que r é o número de restrições impostas ao modelo o número de coeficientes r omitidos do modelo original Contudo não entraremos em detalhes sobre os testes de Wald e ML eles podem ser implementados como se segue 6 7 em que k é o número de regressores no modelo sem restrições e r é o número de restrições Como você pode observar nas equações anteriores todos os três testes são assintoticamente equivalentes ou seja fornecem respostas semelhantes Entretanto em amostras pequenas as respostas podem divergir Há uma relação interessante entre estas estatísticas em que se pode demonstrar que Contudo em amostras pequenas uma hipótese pode ser rejeitada pela estatística Wald mas não pela esta tística ML35 Como observado no texto para a maioria dos nossos objetivos os testes de t e F serão suficientes Mas os três testes discutidos são de aplicação geral e podem ser usados para verificar hipóteses não lineares em mode los lineares ou verificar restrições em matrizes de variânciacovariância Eles também podem ser aplicados em situações em que a hipótese de que os erros são normalmente distribuídos não é defensável Dada a complexidade matemática dos testes de Wald e da máxima verossimilhança não os examinaremos aqui Mas como já mencionamos assintoticamente os testes ML de Wald e de RV dão respostas idênticas de modo que a escolha depende da conveniência de cálculo Pra uma explicação veja madalla G S Introduction to econometrics 3 ed nova York John Wiley Sons new York 2001 p 177 Capítulo 8 Análise da regressão múltipla o problema da inferência 287 ECONOBOOKindb 287 23112010 071418 288 Modelos de regressão com variáveis binárias dummies No Capítulo1 discutimos brevemente os quatro tipos de variáveis que em geral encontramse em análise empírica São eles variáveis proporcionais de intervalo ordinais e nominais Os tipos de variáveis que encontramos nos capítulos anteriores eram essencialmente proporcionais mas isso não deveria dar a impressão de que os modelos de regressão só podem lidar com variáveis proporcionais Os modelos de regressão também trabalham com os outros tipos de variáveis mencionadas anterior mente Neste capítulo consideraremos modelos que podem envolver não só variáveis proporcio nais mas também variáveis de escala nominal Tais variáveis são conhecidas ainda como variáveis indicadoras de categoria qualitativas ou binárias dummies1 91 A natureza das variáveis dummies Em análise de regressão a variável dependente ou regressando é influenciada com frequência não só pelas variáveis proporcionais renda produto preços custos altura temperatura mas pelas variáveis que são de natureza essencialmente qualitativa ou escala nominal como gênero raça cor religião nacionalidade região geográfica movimentos políticos e afiliação partidária Por exemplo mantendo os demais fatores constantes verificouse que as mulheres ganham menos que os homens ou que trabalhadores não brancos ganham menos que os brancos2 Esse padrão pode resultar de dis criminação de gênero ou racial qualquer que seja a razão as variáveis qualitativas como gênero e raça parecem influenciar o regressando e deveriam claramente ser incluídas entre as variáveis explanatórias ou os regressores Tais variáveis em geral indicam a presença ou ausência de uma qualidade ou atributo como homens ou mulheres negros ou brancos católicos ou não católicos democratas ou republicanos elas são essencialmente variáveis nominais Poderíamos quantificar tais atributos formulando va riáveis artificiais que assumem valores de 1 ou 0 em que 1 indica a presença ou posse daquele atributo e 0 a ausência dele Por exemplo 1 pode indicar que uma pessoa é mulher e 0 designar que é homem ou 1 pode indicar que uma pessoa tem grau superior completo e 0 que não tem e assim por diante 1 discutiremos variáveis de escala ordinal no Capítulo 15 2 Para uma revisão deste assunto veja KaUFman bruce e hoTChKiSS Julie l The economics of labor markets 5 ed nova York dryden Press 2000 Capítulo 9 ECONOBOOKindb 288 23112010 071419 Variáveis que assumem esses valores 0 e 1 são chamadas variáveis binárias dummies3 Portan to elas são essencialmente um dispositivo para classificar dados em categorias mutuamente exclu sivas como homem ou mulher As variáveis dummies podem ser incorporadas aos modelos de regressão com tanta facilidade quanto as quantitativas De fato um modelo de regressão pode conter regressores de natureza exclu sivamente dummy ou qualitativa Estes são os chamados modelos de análise de variância ANOVA4 92 Modelos ANOVA Para ilustrar os modelos ANOVA considere o seguinte exemplo exeMPlo 91 Salários de professores da rede pública por região geográfica a Tabela 91 apresenta dados sobre o salário médio em dólares de professores de escolas públicas em 50 estados e no distrito de Colúmbia para o ano escolar de 20052006 essas 51 áreas são classificadas em três regiões geográficas 1 nordeste e Centronorte 21 estados no total 2 Sul 17 estados no total e 3 oeste 13 estados no total Por ora não se preo cupe com o formato da tabela e outras informações especificadas vamos verificar se o salário anual médio de professores da rede pública difere entre as três regiões geográficas do país Se tomarmos a média aritmética simples dos salários médios dos professores nas três regiões veremos que essas médias para as três regiões são as seguintes 4953871 nordeste e Centronorte 4629359 Sul e 4810462 oeste esses nú meros parecem diferentes mas seriam estatisticamente diferentes uns dos outros há várias técnicas estatísticas para comparar dois ou mais valores médios que em geral são chamadas análise de variância5 no entanto o mesmo objetivo pode ser alcançado dentro do marco de referência da análise de regressão Para tanto imaginemos o seguinte modelo Yi D Ø1 C Ø2D2i C Ø3iD3i C ui 921 em que Yi D salário médio de professor da rede pública no estado i D2i D 1 se o estado for do nordeste ou do norte Central D 0 se não for se for situado em outras regiões do país D3i D 1 se o estado pertencer à região Sul D 0 se não pertencer se for localizado em outras regiões note que a equação 921 é como qualquer modelo de regressão múltipla considerado anteriormente exceto que em vez de regressores quantitativos temos apenas regressores qualitativos ou binários assumindo o valor 1 se a observação pertencer a determinada cate goria e 0 se não pertencer àquela categoria ou grupo Daí em diante designaremos todas as variáveis dummies pela letra D a Tabela 91 mostra as variáveis dummies assim construídas Continua 5 3 não é absolutamente essencial que as variáveis dummies assumam os valores de 0 e 1 o par 01 pode ser trans formado em qualquer outro par por uma função linear tal que Z D a C bD b 0 em que a e b são constantes e D D 1 ou 0 Quando D D 1 temos Z D a C b e quando D D 0 temos Z D a assim o par 0 1 tornase a a C b Por exemplo se a D 1 e b D 2 as variáveis dummies serão 1 3 Esta expressão mostra que variáveis qualitativas ou dummies não têm uma escala natural de medida Por isso são descritas como variáveis de escala nominal 4 os modelos anova devem ser usados para avaliar o significado estatístico da relação entre um regressando quan titativo e regressores binários ou qualitativos eles são usados com frequência para comparar as diferenças nos va lores médios de dois ou mais grupos ou categorias e são portanto mais gerais que o teste t que pode ser usado para comparar as médias de apenas dois grupos ou categorias 5 Para um tratamento aplicado veja FoX John Applied regression analysis linear models and related methods Sage Publications 1997 cap 8 Capítulo 9 Modelos de regressão com variáveis binárias dummies 289 ECONOBOOKindb 289 23112010 071419 290 Parte Um Modelos de regressão com equação única Continuação Tabela 91 Salário médio de professores de escolas da rede pública por estado 20052006 Salário Salário Novo México Nota D2 1 para Estados no Nordeste e CentroNorte 0 para Estados de outras regiões D3 1 para Estados no Sul 0 para Estados em outras regiões Fonte National Educational Association como relatado em 2007 o que o modelo 921 nos diz Pressupondo que o termo de erro satisfaça os pressupos tos usuais de mQo ao tomar a esperança ou valor esperado da equação 921 em ambos os lados obtemos Salário médio de professores da rede pública no nordeste e Centro norte 922 Salário médio de professores da rede pública de ensino no Sul 923 Poderíamos desejar saber como descobrimos o salário médio de professores no oeste Se supuséssemos que este é igual ao Ø1 estaríamos absolutamente certos pois Salário médio de professores da rede pública de ensino no oeste 924 Continua ECONOBOOKindb 290 23112010 071420 exeMPlo 91 Continuação em outras palavras o salário médio de professores da rede pública de ensino no oeste é dado pelo intercepto Ø1 na regressão múltipla 921 e os coeficientes angulares Ø2 e Ø3 dizem quanto os salários médios de professores no nordeste e Centronorte e no Sul diferem do salário médio de professores no oeste mas como sabemos se essas diferenças são estatistica mente significativas antes de respondermos vamos apresentar os resultados com base na regressão 921 com os dados da Tabela 91 925 em que indica os valores p Como esses resultados de regressão mostram o salário médio de professores no oeste é cerca de 48015 o dos professores do nordeste e Centronorte é cerca de 1524 mais alto e o de professores no Sul é cerca de 1721 mais baixo os salários médios reais nas duas últimas regiões podem ser facilmente obtidos adicionando esses salários diferenciais ao salá rio médio de professores no oeste como mostram as equações 923 e 924 desse modo verificaremos que os salários médios nas duas últimas regiões são de aproximadamen te 49539 e 46294 mas como sabemos que esses salários médios são estatisticamente diferentes do salário médio de professores no oeste a categoria de comparação Fácil basta descobrir se cada um dos coeficientes angulares na equação 925 é estatisticamente significativos Como podemos ver dessa regressão o coeficiente angular estimado para o nordeste e Centro norte não é estatisticamente significativo uma vez que seu valor p é 52 e aquele do Sul também não é estatisticamente significativo visto que o valor p é cerca de 49 Portanto a conclusão geral é que estatisticamente os salários médios dos professores de escola pública no oeste no nordeste no Centronorte e no Sul são iguais a situação é representada grafi camente na Figura 91 Convém fazer uma advertência quanto à interpretação dessas diferenças as variáveis dummies apenas apontarão as diferenças se existirem mas não sugerem as razões para as diferenças diferenças em níveis educacionais índices de custo de vida gênero e raça podem ter efeito nas diferenças observadas Portanto se não considerarmos todas as demais variá veis que podem afetar o salário de um professor não seremos capazes de identificar as causas das diferenças da discussão anterior fica claro que basta verificar se os coeficientes ligados às diversas variáveis dummies são individualmente significativos do ponto de vista estatístico este exemplo também mostra como é fácil incorporar regressores qualitativos ou binários nos modelos de regressão fiGuRa 91 Salário médio em dólares de professores de escola pública nos Estados Unidos em três regiões Nordeste e CentroNorte Oeste Sul Ø 1 Ø 2 48015 Ø1 49539 Ø 1 Ø 3 46294 Capítulo 9 Modelos de regressão com variáveis binárias dummies 291 ECONOBOOKindb 291 23112010 071421 292 Parte Um Modelos de regressão com equação única advertência quanto ao uso de variáveis dummies Embora seja fácil incorporálas aos modelos de regressão devese usar as variáveis dummies com cautela Em particular considere os seguintes aspectos 1 No Exemplo 91 para distinguir as três regiões usamos apenas duas variáveis dummies D2 e D3 Por que não usamos três variáveis dummies para distinguir as três regiões Suponha que façamos isso e escrevamos o modelo 921 como 926 em que D1i assume o valor de 1 para Estados no Oeste e 0 para as demais regiões Agora temos uma variável dummy para cada uma das três regiões geográficas Usando os dados da Tabela 91 se você tivesse de fazer a regressão 926 o computador se recusaria a efetuála experimente6 Por quê A razão é que na montagem da Equação 926 na qual há uma variável dummy para cada categoria ou grupo e também um intercepto existe um caso de co linearidade perfeita isto é relações lineares exatas entre as variáveis Por quê Consulte a Tabela 91 Imagine que agora acrescentemos a coluna D1 assumindo o valor de 1 sempre que um Estado estiver no Oeste e 0 nas demais regiões Agora se você acrescentar as três colunas D horizontalmente obterá uma coluna que tem 51 uns nela Mas como o valor do intercepto α é implicitamente 1 para cada observação você terá uma coluna que também conterá 51 uns Em outras palavras a soma das três colunas D apenas reproduzi rá a coluna intercepto levando à colinearidade perfeita Neste caso a estimação do modelo 926 é impossível A mensagem aqui é se uma variável qualitativa tem m categorias introduza apenas m 1 variáveis binárias Em nosso exemplo uma vez que a variável qualitativa região tem três categorias introduzimos apenas duas variáveis binárias Se você não seguir essa regra cairá no que é chamado de armadilha da variável binária a situação de colinearida de perfeita ou multicolinearidade perfeita se houver mais de uma relação exata entre as va riáveis Essa regra também se aplica se temos mais de uma variável qualitativa no modelo caso exemplificado mais adiante Deveríamos reformular a regra anterior como para cada regressor qualitativo o número de variáveis binárias introduzidas deve ser um a menos que as categorias daquela variável Se no Exemplo 91 tínhamos informação sobre o gê nero do professor usaríamos uma variável binária adicional mas não duas assumindo um valor de 1 para mulheres e 0 para homens ou viceversa 2 A categoria para a qual nenhuma variável binária é atribuída é conhecida como categoriabase de controle de comparação de referência ou categoria omitida Todas as comparações são feitas em relação à categoria de referência 3 O valor do intercepto Ø1 representa o valor médio da categoria de referência No Exemplo 91 a categoria de referência é a região Oeste Daí na regressão 925 o valor do intercep to de cerca de 48015 representa o salário médio de professores nos Estados do Oeste 4 Os coeficientes ligados às variáveis binárias na Equação 921 são conhecidos como coefi cientes diferenciais de intercepto porque informam quanto a categoria que recebe o valor de 1 difere do coeficiente do intercepto da categoria de referência Por exemplo na Equação 925 o valor aproximado de 1524 indica que o salário médio de professores no Nordeste ou CentroNorte é cerca de 1524 a mais do que o salário médio de aproximadamente US48015 para a categoria de referência a região Oeste 5 Se uma variável qualitativa apresentar mais de uma categoria como em nosso exemplo a escolha da categoria de referência ficará estritamente a critério do pesquisador Às vezes a esco lha do referencial é ditada por determinado problema No exemplo poderíamos ter escolhido o Sul como categoria de referência Nesse caso os resultados de regressão da Equação 925 mudariam porque agora todas as comparações seriam feitas em relação ao Sul Evidentemente 6 na realidade você receberá uma mensagem informando que a matriz de dados é singular ECONOBOOKindb 292 23112010 071421 isso não mudaria a conclusão geral do exemplo por quê O valor do intercepto seria de aproximadamente 4 6294 que é o salário médio de professores no Sul 6 Fizemos uma advertência quanto à armadilha da variável binária Há uma forma de contor nar essa armadilha introduzindo tantas variáveis binárias quanto o número de categorias daquela variável contanto que não seja introduzido o intercepto em tal modelo Se excluir mos o termo de intercepto da Equação 926 e considerarmos o modelo a seguir 927 não cairemos na armadilha da variável dummy pois não há mais colinearidade perfeita Mas ao calcular essa regressão assegurese de que você usou a opção sem intercepto do programa de regressão Como interpretamos a regressão 927 Se tomarmos o valor esperado da Equação 927 constataremos que Ø1 D salário médio de professores no Oeste Ø2 D salário médio de professores no Nordeste e CentroNorte Ø3 D salário médio de professores no Sul Em outras palavras suprimindo o intercepto e permitindo uma variável binária para cada categoria obtemos diretamente os valores médios das diversas categorias Os resultados da Equação 927 para nosso exemplo são os seguintes 928 em que indica que os valores p dessas razões t são muito pequenos Como você pode ver os coeficientes da variável binária dão diretamente os valores médios salário nas três regiões Oeste Nordeste e CentroNorte e Sul 7 Qual o melhor método de introduzir uma variável binária 1 introduzir uma variável biná ria para cada categoria e omitir o termo de intercepto ou 2 incluir o termo de intercepto e introduzir apenas variáveis binárias m 1 em que m é o número de categorias da variável binária Como observa Kennedy A maioria dos pesquisadores acredita que a equação com um intercepto seja mais conveniente porque lhes permite tratar com mais facilidade as questões em que geralmente têm mais interesse ou seja se a categorização faz diferença e se fizer de quanto é essa diferença Se a categorização faz diferença essa é medida diretamente por estimativas do coeficiente da variável binária Podemos verificar se a catego rização é ou não relevante efetuando um teste t de um coeficiente da variável binária contra zero ou para ser mais geral um teste F do conjunto adequado de estimativas do coeficiente da variável binária7 93 Modelos ANOVA com duas variáveis qualitativas Na seção anterior consideramos o modelo ANOVA com uma variável qualitativa com três catego rias Nesta seção consideraremos outro modelo ANOVA mas com duas variáveis qualitativas e apre sentaremos alguns pontos adicionais sobre variáveis binárias 7 KennedY Peter A guide to econometrics 4 ed Cambridge mass miT Press 1998 p 223 Capítulo 9 Modelos de regressão com variáveis binárias dummies 293 ECONOBOOKindb 293 23112010 071422 294 Parte Um Modelos de regressão com equação única exeMPlo 92 Ganho por hora em relação a estado civil e região de residência de uma amostra de 528 pessoas de maio de 1985 os seguintes resultados de regressão foram obtidos8 931 em que Y D salário por hora D2 D estado civil 1 D casado 0 D outros D3 D região de residência 1 D Sul 0 D outras regiões e denota os valores p neste exemplo temos dois regressores qualitativos cada um com duas categorias desse modo atribuímos uma única variável binária para cada categoria Qual a categoria de referência aqui obviamente é não casado não residente no Sul em outras palavras pessoas não casadas que não moram no Sul são a categoria omitida Todas as comparações são feitas em relação a esse grupo o ganho médiosalário médio por hora nessa referência é de aproximadamente 881 Comparado com este o ganho médiosalá rio médio por hora daqueles que são casados é cerca de 110 mais alto ganho médio real por hora de 991 D 881 C 110 em contrapartida para aqueles que moram no Sul o salário médio por hora é de cerca de 167 mais baixo um ganho médio real por hora de 714 os ganhos médios por hora são estatisticamente diferentes em comparação à categoria base São pois todos os interceptos diferenciais são estatisticamente significativos já que seus valores p são bastante baixos devese observar o seguinte neste exemplo depois de irmos além da variável qualitativa precisamos prestar atenção à categoriabase uma vez que todas as comparações são feitas em relação àquela categoria Isso é importante principalmente quando temos vários regressores qua litativos cada um com diversas categorias mas a essa altura o procedimento de introdução de diversas variáveis qualitativas deve estar claro 8 94 Regressão com uma mistura de regressores quantitativos e qualitativos os modelos ANCOVA Os modelos ANOVA discutidos nas duas seções anteriores embora sejam comuns em áreas como sociologia psicologia educação e pesquisa de mercado não são tão comuns em economia Tipicamente na maioria das pesquisas econômicas um modelo de regressão contém algumas variáveis explanatórias quantitativas e algumas qualitativas Os modelos de regressão com uma mistura de variáveis quantitativas e qualitativas são chamados de modelos de análise de covariância ANCOVA Eles são uma extensão dos modelos ANOVA no sentido de que fornecem um método de controle estatístico dos efeitos de regressores quantitativos chamados covariáveis ou variá veis de controle em um modelo que inclui tanto regressores quantitativos quanto qualitativos ou binários Agora ilustraremos os modelos ANCOVA 8 esses valores provêm do disco de dados de GoldberGer arthur S Introductory econometrics Cambridge mass harvard University Press 1998 Já consideramos esses dados no Capítulo 2 ECONOBOOKindb 294 23112010 071422 exeMPlo 93 Salário de professores em relação à região e a gastos em escolas públicas por aluno Para motivar a análise reconsideremos o exemplo 91 Contudo suponhamos que o salário médio de professores da rede pública não seja diferente nas três regiões se levarmos em consi deração quaisquer variáveis que não podem ser padronizadas Considere por exemplo a variável gastos das autoridades locais com a escola pública já que a educação pública é basicamente uma questão local e estadual Para ver se é esse o caso desenvolvemos o modelo a seguir 941 em que Yi D salário médio anual de professores da rede pública do estado Xi D gastos com escolas públicas por aluno D2i D 1 se o estado for do nordeste ou do Centronorte D 0 caso contrário D3i D 1 se o estado for da região Sul D 0 caso contrário os dados sobre X estão na Tabela 91 lembrese de que estamos considerando o oeste como a categoria de referência note também que além dos dois regressores qualitativos temos uma variável quantitativa X que no contexto dos modelos anCova é conhecida como covariável dos dados da Tabela 91 os resultados do modelo 941 são os seguintes 942 em que indica valores p menores que 5 e indica valores p maiores que 5 Como esses resultados sugerem ceteris paribus quando os gastos públicos sobem 1 dólar em média o salário de um professor da rede pública aumenta cerca de 234 Controlando os gastos com educação agora vemos que o coeficiente do intercepto diferencial não é signi ficativo para a região nordeste Centronorte nem para a região Sul esses resultados são di ferentes daqueles da equação 925 mas isso não deveria surpreender pois na equação 925 não consideramos as diferenças da covariável gastos públicos com educação por aluno Temos a situação representada graficamente na Figura 92 note que embora tenhamos mostrado três linhas de regressão para as três regiões esta tisticamente as linhas de regressão são as mesmas para todas as três regiões observe ainda que as três linhas de regressão são traçadas paralelamente Por quê fiGuRa 92 Salário do professor em escola pública nos Estados Unidos Y em relação a gasto com educação por aluno X 28695 1 Oeste 234 234 234 Sul Nordeste e CentroNorte 1 1 Y X 25741 25583 Capítulo 9 Modelos de regressão com variáveis binárias dummies 295 ECONOBOOKindb 295 23112010 071423 296 Parte Um Modelos de regressão com equação única Poupança Renda a Regressões coincidentes Poupança Renda c Regressões concorrentes Poupança Renda b Regressões Paralelas Poupança Renda d Regressões dissimilares g1 y1 1 1 1 1 1 1 1 g2 l2 g2 g2 l2 g1 l1 l1 g1 g2 l2 g2 l2 g1 l1 l2 fiGuRa 93 Regressões poupança renda plausíveis 95 A variável binária alternativa ao teste de Chow9 Na Seção 87 discutimos o teste de Chow para examinar a estabilidade estrutural de um modelo de regressão O exemplo referiase à relação entre poupança e renda nos Estados Unidos no período de 19701995 Dividimos o período da amostra em dois 19701981 e 19821995 e mostramos com base no teste de Chow que havia uma diferença na regressão da poupança sobre a renda entre os dois períodos Entretanto não podíamos apontar se a diferença nos dois regressores deviase às diferenças nos termos de intercepto ou aos coeficientes angulares ou a ambos Com muita frequência esse conheci mento é muito útil Quanto às Equações 871 e 872 vemos que há quatro possibilidades que ilustraremos na Figura 93 1 Tanto o intercepto quanto os coeficientes angulares são iguais nas duas regressões Este caso de regressões coincidentes é apresentado na Figura 93a 2 Somente os interceptos nas duas regressões são diferentes mas os coeficientes angulares são iguais Este é o caso de regressões paralelas apresentado na Figura 93b 3 Os interceptos nas duas regressões são iguais mas os coeficientes angulares são diferentes Esta é a situação das regressões concorrentes Figura 93c 4 Ambos os interceptos e coeficientes angulares nas duas regressões são diferentes Este é o caso de regressões dissimilares apresentado na Figura 93d O procedimento do teste de Chow que envolve várias etapas discutido na Seção 87 informa apenas se duas ou mais regressões são diferentes sem dizer qual a origem da diferença A origem da diferença se houver pode ser identificada combinandose todas as observações 26 ao todo e efetuandose apenas uma regressão múltipla como apresentado a seguir10 951 9 o material desta seção baseiase nos artigos do autor Use of dummy variables in testing for equality between sets of coefficients in two linear regressions a note e Use of dummy variables a generalization ambos publicados em American Statistician 1970 v 24 n 1e 5 p 5052 e 1821 10 Como mostra o teste de Chow a técnica de combinação pressupõe a homocedasticidade isto é æ 2 1 D æ 2 2 D æ 2 ECONOBOOKindb 296 23112010 071424 em que Y D poupança X D renda t D tempo D D 1 para observações em 19821995 D 0 caso contrário para observações em 19701981 A Tabela 92 mostra a estrutura da matriz de dados Para ver as implicações da Equação 951 e supondo como usual que Eui D 0 obtemos Função poupança média para 19701981 952 Função poupança média para 19821995 953 Variável dummy Nota variável dummy D 1 para observações iniciadas em 1982 0 para outras datas Os dados sobre poupança e renda estão em bilhões de dólares Fonte Economic Report of the President 1997 Tabela B28 O leitor notará que estas são as mesmas funções que as Equações 871 e 872 com 1 D Æ1 2 D Ø1 1 D Æ1 C Æ2 e 2 D Ø1 C Ø2 Portanto calcular a Equação 951 equivale a estimar as duas funções de poupança individuais nas Equações 871 e 872 Na Equação 951 Æ2 é o intercepto diferencial como anteriormente e Ø2 é o coeficiente an gular diferencial também chamado de deslocador do coeficiente angular indicando quanto o coeficiente angular da função poupança do segundo período a categoria que recebe o valor binário de 1 difere daquele do primeiro período Note quanto a introdução da variável binária D na forma interativa ou multiplicativa D multiplicado por X permite diferenciar entre os coeficientes angu Tabela 92 Dados sobre poupança e renda Estados Unidos 19701995 Capítulo 9 Modelos de regressão com variáveis binárias dummies 297 ECONOBOOKindb 297 23112010 071425 298 Parte Um Modelos de regressão com equação única lares dos dois períodos assim como a introdução da variável binária na forma aditiva permitiu dis tinguir entre os interceptos dos dois períodos exeMPlo 94 Diferenças estruturais na regressão poupançarenda nos Estados Unidos a abordagem da variável binária antes de prosseguirmos vamos apresentar os resultados da regressão do modelo 951 aplicado aos dados de poupançarenda dos estados Unidos 954 em que indica valores p menores que 5 e indica valores p superiores a 5 Como mostram esses resutados da regressão tanto o intercepto diferencial quanto os coeficientes angulares são estatisticamente significativos sugerindo que as regressões pou pançarenda para os dois períodos de tempo são diferentes como na Figura 93d da equação 954 podemos derivar as equações 952 e 953 que são Regressão poupançarenda 19701981 955 Regressão poupançarenda 19821995 956 estes são exatamente os resultados obtidos nas equações 871a e 872a que não deveriam surpreender estas regressões já são mostradas na Figura 83 as vantagens do método de variáveis binárias estimar a equação 951 sobre o teste de Chow estimar as três regressões 871 872 e 873 agora podem ser vistas dire tamente 1 Precisamos efetuar apenas uma regressão porque as regressões individuais podem ser derivadas facilmente dela da maneira indicada pelas equações 952 e 953 2 a regressão simples 951 pode ser usada para testar diversas hipóteses Se o coefi ciente do intercepto diferencial Æ2 for não significativo estatisticamente podemos acei tar a hipótese de que as duas regressões têm o mesmo intercepto as duas regressões são concorrentes veja a Figura 93c da mesma forma se o coeficiente diferencial an gular Ø2 for não significativo estatisticamente mas Æ2 for significativo podemos não rejeitar a hipótese de que as duas regressões têm a mesma inclinação as duas retas de regressão são paralelas veja a Figura 93b o teste da estabilidade de toda a regressão Æ2 D Ø2 D 0 simultaneamente pode ser feito pelo teste F usual lembrese do teste F de mínimos quadrados restritos Se essa hipótese não for rejeitada as retas de regres são serão coincidentes como mostra a Figura 93a 3 o teste de Chow não nos diz explicitamente quais coeficientes o intercepto ou os angu lares como no exemplo ou ambos são diferentes nos dois períodos ou seja podese obter um teste de Chow significativo porque apenas o coeficiente angular é diferente ou apenas o intercepto é diferente ou ambos são diferentes em outras palavras não podemos dizer pelo teste de Chow qual das quatro possibilidades descritas na Figura 93 ocorre em determinado exemplo nesse sentido a abordagem da variável binária tem uma vantagem distinta pois ela não só diz se os dois são diferentes mas identi fica as origens da diferença seja ela devida ao intercepto ou ao coeficiente angular ou a ambos na prática saber que as duas regressões diferem neste ou naquele coeficiente é tão importante quanto se não for mais saber que eles são diferentes 4 Por fim uma vez que a combinação incluir todas as observações em uma regressão aumenta os graus de liberdade ela pode melhorar a exatidão relativa aos parâmetros estimados evidentemente lembrese de que toda adição de uma variável binária con sumirá um grau de liberdade ECONOBOOKindb 298 23112010 071426 96 Efeitos de interação usando variáveis dummies As variáveis binárias são uma ferramenta flexível que pode lidar com uma variedade de proble mas interessantes Para tanto considere o seguinte modelo 961 em que Y D salário por hora em dólares X D escolaridade anos de estudo D2 D 1 se for mulher 0 se for homem D3 D 1 se for não branco e não hispânico 0 nos demais casos Neste modelo gênero e raça são regressores qualitativos e a escolaridade é um regressor quanti tativo11 No modelo está implícito o pressuposto de que o efeito diferencial da variável binária D2 é constante nas categorias de raça e o efeito diferencial da raça D3 também é constante entre os dois gêneros Em outras palavras se o salário médio for mais alto para homens que para mulheres tal fato acontecerá independentemente de serem não brancosnão hispânicos Da mesma forma se por exem plo não brancos e não hispânicos tiverem salários médios mais baixos isso acontecerá independen temente de serem homens ou mulheres Em muitas aplicações esse pressuposto pode não ser respeitado Uma mulher não brancanão his pânica pode ganhar salários mais baixos que um homem não branconão hispânico Pode haver inte ração entre as duas variáveis qualitativas D2 e D3 O efeito delas sobre Y médio pode não ser aditivo como na Equação 961 mas também multiplicativo como no modelo a seguir 962 em que as variáveis são como definidas para o modelo 961 Da Equação 962 obtemos 963 que é a função salário médio por hora para mulher não brancanão hispânica Observe que Æ2 D efeito diferencial de ser uma mulher Æ3 D efeito diferencial de ser não branconão hispânico Æ4 D efeito diferencial de ser mulher não brancanão hispânica o que mostra que os salários médios por hora de mulheres não brancasnão hispânicas é diferente por Æ4 dos salários médios por hora de mulheres ou não brancosnão hispânicos Se por exemplo todos os três coeficientes binários diferenciais forem negativos isso implicaria que mulheres não brancasnão hispânicas que trabalham ganham salários médios por hora muito mais baixos com parados à categoriabase o que no exemplo são homens brancos ou hispânicos Agora o leitor pode entender como a interação binária o produto de duas variáveis binárias ou qualitativas modifica o efeito dos dois atributos considerados individualmente aditivamente 11 Se tivéssemos de definir escolaridade como primeiro grau incompleto primeiro grau completo e acima de primeiro grau poderíamos usar duas variáveis binárias para representar as três classes Capítulo 9 Modelos de regressão com variáveis binárias dummies 299 ECONOBOOKindb 299 23112010 071427 300 Parte Um Modelos de regressão com equação única exeMPlo 95 Ganhos médios por hora em relação à escolaridade gênero e raça Primeiro vamos apresentar os resultados de regressão baseados no modelo 961 Usando os dados empregados para estimar a regresão 931 obtivemos os seguintes resultados 964 em que indica os valores p menores que 5 e indica os valores p maiores que 5 o leitor pode verificar que os coeficientes diferencias de intercepto são estatisticamente significativos se têm os sinais esperados por quê e se a escolaridade apresenta um forte efeito positivo no salário por hora uma constatação não surpreendente Como mostra a equação 964 ceteris paribus os ganhos médios por hora de mulheres são cerca de 236 mais baixos e os ganhos médios por hora de trabalhadores não brancos não hispânicos também são cerca de 173 mais baixos agora considere os resultados do modelo 962 que incluem a variável binária de inte ração 965 em que indica valores p inferiores a 5 e indica valores p superiores a 5 Como se pode ver as duas variáveis binárias aditivas ainda são estatisticamente significa tivas mas a variável binária interativa não está no nível convencional de 5 o valor p real da variável binária de interação é de cerca de 8 Se consideramos que essa é uma probabilida de suficientemente baixa os resultados da equação 965 podem ser interpretados como se segue mantendo o nível de escolaridade constante se acrescentarmos os três coeficientes de variável dummy obteremos 1964 D 23605 17327 C 21289 o que significa que os salários médios por hora de mulheres não brancasnão hispânicas é inferior em cerca de 196 que está entre o valor de 23605 apenas a diferença de gênero e 17327 apenas a diferença de raça O exemplo anterior revela claramente o papel das variáveis binárias de interação quando dois ou mais regressores são incluídos no modelo É importante notar que no modelo 965 estamos pressu pondo que a taxa de aumento dos ganhos por hora com respeito à escolaridade de cerca de 80 centa vos por ano adicional de escolaridade permanece constante entre gênero e raça mas pode não ser esse o caso Se quisermos testar isso teremos de introduzir coeficientes angulares diferenciais veja o Exercício 925 97 O uso de variáveis dummies na análise sazonal Muitas séries temporais baseadas em dados mensais ou trimestrais exibem padrões sazonais mo vimentos oscilatórios regulares Exemplos são as vendas de lojas de departamentos no Natal ou em outros dias importantes a demanda por dinheiro ou saldos pelas famílias em datas comemorativas a demanda de sorvete e refrigerantes durante o verão preços das safras logo depois da temporada de colheita a demanda por viagens aéreas etc Com frequência é desejável remover o fator sazonal ou componente de uma série temporal de modo que se possa concentrar nos demais componentes como a tendência12 O processo de remover o componente sazonal de uma série temporal é conhecido como dessazonalização ou ajustamento sazonal e a série temporal assim obtida é chamada série tempo ral dessazonalizada ou ajustada sazonalmente Séries temporais importantes economicamente 12 Uma série temporal pode conter quatro componentes 1 sazonal 2 cíclico 3 tendência e 4 estrita mente aleatório ECONOBOOKindb 300 23112010 071427 como a taxa de desemprego o índice de preços ao consumidor IPC o índice de preços do produtor IPP e o índice de produção industrial em geral são publicadas na forma sazonal ajustada Existem vários métodos para dessazonalizar uma série temporal mas consideraremos apenas um deles o método de variáveis binárias13 Para ilustrar como as variáveis binárias podem ser usadas para dessazonalizar séries temporais econômicas considere os dados da Tabela 93 Nela são apresen tados dados trimestrais para os anos de 19781995 sobre a venda de quatro eletrodomésticos lavado ras de pratos trituradores de lixo lavadoras de roupas e geladeiras todos em milhares de unidades A tabela também apresenta dados sobre despesa com bens duráveis em bilhões de de 1982 Nota LAV D lavadora de pratos TRIT D triturador de lixo REFR D refrigerador ROUP D lavadora de roupas DUR D despesas com bens duráveis bilhões de dólares de 1982 Fonte Business Statistics and Survey of Current Business Department of Commerce vários números Para ilustrar a técnica das variáveis binárias consideremos apenas as vendas de geladeiras no perío do de amostra mas primeiro vamos examinar os dados da Figura 94 Ela sugere que talvez haja um padrão sazonal nos dados associados aos vários trimestres Para tanto considere o modelo a seguir 971 em que Yt D vendas de geladeiras em milhares e os D são as variáveis binárias assumindo o valor de 1 no trimestre relevante e 0 nos demais Observe que para evitar a armadilha das variáveis dummies estamos atribuindo uma variável dummy para cada trimestre do ano mas omitindo o termo de intercepto Se houver qualquer efeito sazonal em dado trimestre isso será indicado por um valor t estatisticamente significativo do coeficiente binário associado a esse tri mestre14 Note que na Equação 971 estamos fazendo a regressão de Y efetivamente contra um intercepto exceto que permitimos um intercepto diferente em cada temporada trimestre Como resultado o coeficiente binário de cada trimestre dará as vendas médias de geladeiras em cada trimestre ou tem porada por quê 13 Sobre os vários métodos de ajuste sazonal veja por exemplo diebold Francis X Elements of forecasting 2 ed SouthWestern Publishing 2001 cap 5 14 vale fazer referência a um aspecto técnico este método de atribuir uma variável dummy a cada trimestre supõe que o fator sazonal se presente é determinístico e não estocástico voltaremos a esse ponto quando discutir mos econometria de séries temporais na Parte 5 do livro Tabela 93 Dados trimestrais sobre vendas de eletrodomésticos em milhares e despesas com bens duráveis 1º trimestre de 1978 ao 4º trimestre de 1985 Capítulo 9 Modelos de regressão com variáveis binárias dummies 301 ECONOBOOKindb 301 23112010 071428 302 Parte Um Modelos de regressão com equação única 80078 79 80 81 82 83 84 85 86 1000 1200 1400 1600 1800 Milhares de unidades Ano exeMPlo 96 Sazonalidade na venda de geladeiras dos dados sobre venda de geladeira apresentados na Tabela 94 obtemos os seguintes resultados 972 Nota não apresentamos os erros padrão dos coeficientes estimados já que cada erro padrão é igual a 599904 porque todas as variáveis binárias assumem apenas um valor de 1 ou zero os coeficientes Æ estimados na equação 972 representam as vendas médias de refrige radores em milhares de unidades em cada temporada trimestre a venda média de refri geradores no primeiro trimestre em milhares de unidades é cerca de 1222 no segundo trimestre é de aproximadamente 1468 no terceiro trimestre é cerca de 1570 e no quarto aproximadamente 1160 Tabela 94 Venda trimestrais de refrigeradores em milhares de unidades 19781985 Nota REFR D Refrigeradores DUR D despesas com bens duráveis D2 D 1 para o segundo trimestre 0 nos demais D3 D 1 para o terceiro trimestre 0 nos demais D4 D 1 para o quarto trimestre 0 nos demais Continua fiGuRa 94 Vendas de geladeiras 19781985 trimestrais ECONOBOOKindb 302 23112010 071429 exeMPlo 96 Continuação em vez de atribuirmos uma variável dummy para cada trimestre e suprimir o termo de intercepto a fim de evitar a armadilha das variáveis binárias poderíamos atribuir apenas três variáveis e incluir o termo de intercepto Suponhamos que o primeiro trimestre seja tomado como referência e que sejam atribuídas variáveis binárias ao segundo terceiro e quarto tri mestre isso levará aos resultados da regressão veja a Tabela 94 973 em que indica valores menores que 5 e indica valores maiores que 5 Já que estamos considerando o primeiro trimestre como referência os coeficientes ligados às diversas variáveis binárias agora são interceptos diferenciais mostrando quanto o valor mé dio de Y no trimestre cuja variável binária recebe o valor 1 difere do trimestre de referência em outras palavras os coeficientes das variáveis binárias sazonais darão aumento ou diminuição sazonal ao valor médio de Y em relação ao período de base Se acrescentarmos os diversos valores do intercepto diferencial ao valor médio referencial de 1222125 será obtido o valor médio para os diversos trimestres desse modo reproduziremos exatamente a equação 972 desprezando os erros de arredondamento mas agora veremos que vale tratar um trimestre como referência pois a equação 973 mostra que o valor médio de Y para o quarto trimestre não é estatisticamente diferente do valor médio para o primeiro trimestre o coeficiente da variável binária para o quarto trimes tre não é estatisticamente significativo É claro que a resposta mudará dependendo do tri mestre tratado como referência mas a conclusão geral não mudará Como obtemos a série dessazonalizada das vendas de refrigeradores isso pode ser feito facilmente estimamos com base no modelo 972 ou 973 os valores de Y para cada observação e subtraímos deles os valores efetivos de Y ou seja obtemos Yt YOt que são apenas os resíduos da regres são 972 eles estão na Tabela 9515 a esses resíduos temos de adicionar a média da série Y a fim de obtermos os valores previstos o que esses resíduos representam os componentes restantes da série temporal de refrige radores os componentes de tendência cíclicos e aleatórios mas devese considerar a advertên cia feita na nota de rodapé 15 Uma vez que os modelos 972 e 973 não contêm covariáveis o quadro mudará se incluirmos um regressor quantitativo no modelo Como os gastos com bens duráveis têm uma influência importante sobre a demanda por refrigeradores expandiremos nosso mode lo 973 para incluir essa variável os dados para gastos com bens duráveis em bilhões de dólares de 1982 já são apresentados na Tabela 93 esta é nossa variável quantitativa X no modelo os resultados da regressão são os seguintes 974 em que indica valores menores que 5 e indica valores maiores que 5 Continua 15 15 evidentemente isto pressupõe que a técnica das variáveis binárias seja um método apropriado de dessazonali zar uma série temporal ST e que esta ST pode ser representada por ST D s C c C t C u em que s representa o componente sazonal c o cíclico t o de tendência e u o componente aleatório Contudo se a série temporal for da forma ST D sct u em que os quatro componentes entram de forma multiplicaiva o método de dessazona lização que acabamos de apresentar será inadequado pois pressupõe que os componentes da série temporal sejam aditivos Falaremos mais sobre o assunto nos capítulos a respeito de econometria das séries temporais Capítulo 9 Modelos de regressão com variáveis binárias dummies 303 ECONOBOOKindb 303 23112010 071430 304 Parte Um Modelos de regressão com equação única exeMPlo 96 Continuação Tabela 95 Regressão de vendas de refrigeradores valores observados ajustados e resíduos Equação 973 novamente devese lembrar que estamos tratando o primeiro trimestre como base Como na equação 973 vemos que os coeficientes de intercepto diferenciais para o segun do e o terceiro trimestres são estatisticamente diferentes daquele do primeiro trimestre mas os interceptos do quarto e primeiro trimestres são estatisticamente iguais o coeficiente de X gastos com bens duráveis de aproximadamente 277 diz que descontando os efeitos sazo nais se os gastos com bens duráveis aumentam em um dólar em média as vendas de refri geradores sobem em cerca de 277 unidades aproximadamente 3 unidades lembrese de que os refrigeradores estão em mil unidades e X está em bilhões de dólares 1982 Continua ECONOBOOKindb 304 23112010 071430 fiGuRa 95 Relação hipotética entre comissão e volume de vendas Nota o intercepto no eixo Y denota comissão mínima garantida I II Comissão de vendas X Y X vendas exeMPlo 96 Continuação Cabe aqui fazer uma pergunta visto que as vendas de refrigeradores exibem padrões sazonais os gastos com bens duráveis exibiriam também padrões sazonais Como levamos em conta a sazonalidade em X o interessante na equação 974 é que as variáveis binárias naquele modelo não só removem a sazonalidade em Y mas também a sazonalidade em X se houver isso decorre de um teorema de estatística conhecido como teorema de Frisch Waugh16 Podemos dizer que matamos dessazonalizamos dois coelhos duas séries com uma cajadada só a técnica de variáveis binárias Para apresentarmos uma demonstração informal dessa afirmação sigamos estas eta pas 1 efetuamos a regressão de Y contra as variáveis binárias como na equação 972 ou na 973 e guardamos os resíduos por exemplo S1 estes representam Y dessazona lizado 2 efetuamos uma regressão similar para X e obtemos os resíduos dela por exem plo S2 esses resíduos representam X dessazonalizado e 3 calculamos a regressão de S1 contra S2 veremos que o coeficiente angular nessa regressão é exatamente o coeficiente de X na regressão 974 16 98 Regressão linear segmentada Para ilustrar mais um emprego das variáveis binárias considere a Figura 95 que mostra como uma empresa hipotética remunera seus representantes de vendas Ela paga comissões com base em vendas de modo que até certo nível o nível meta ou limiar X há uma estrutura estocástica de co missões e para vendas acima desse ponto paga outra comissão Nota além das vendas outros fa tores afetam a comissão Suponha que esses outros fatores sejam representados pelo termo de erro estocástico Especificamente pressupõese que a comissão de vendas aumente linearmente com as vendas até o limiar X após o qual continua a aumentar linearmente com as vendas mas a uma taxa muito mais acentuada Temos uma regressão linear segmentada consistindo em dois segmentos ou trechos rotulados I e II na Figura 95 e a função de comissão muda sua inclinação no valor limiar Tendo os dados sobre comissão vendas e o valor do limiar X a técnica de variáveis binárias pode ser usada para estimar os coeficientes angulares diferentes dos dois segmentos da regressão linear segmentada da Figura 95 Procedemos da seguinte forma 981 16 Para ver a demonstração consulte darnell adrian C A dictionary of econometrics lyme reino unido edqard elgar 1995 p 150152 Capítulo 9 Modelos de regressão com variáveis binárias dummies 305 ECONOBOOKindb 305 23112010 071431 306 Parte Um Modelos de regressão com equação única em que Yi D comissão de vendas Xi D volume de vendas geradas pelo vendedor X D limiar de vendas também chamado de nó conhecido de antemão17 D D 1 se Xi X D 0 se Xi X Supondo E ui D 0 vemos imediatamente que 982 que dá a comissão média de vendas até o nível meta X e 983 que dá a comissão média de vendas além do nível meta X Assim Ø1 dá o coeficiente angular da linha de regressão no segmento I e Ø1C Ø2 o coeficiente angular no segmento II da regressão linear segmentada da Figura 95 Um teste da hipótese de que não há quebra na regressão ao valor limiar X pode ser conduzido facilmente notandose a signifi cância estatística do coeficiente angular diferencial estimado ØO2 veja a Figura 96 A propósito a regressão linear fragmentada que acabamos de discutir é o exemplo de uma classe mais geral de funções conhecidas como funções spline18 17 entretanto o limiar pode não estar sempre evidente Uma abordagem ad hoc é representar graficamente a variável dependente contra as variávelis explanatórias e observar se parece haver uma mudança acentuada na relação após um dado valor de X X Uma abordagem analítica para encontrar o ponto de quebra pode ser vista nos chamados modelos de regressão com mudança mas esse ainda é um tópico avançado essa discussão pode ser encontrada em FombY Thomas hill r Carter JohnSon Stanley Advanced econometric methods nova York Springerverlag 1984 cap 14 18 Para uma discussão acessível sobre splines polinômios segmentados de ordem k veja montgomery douglas C Peck elizabeth a vininG G Geoffrey Introduction to linear regression analysis 3 ed nova York John Wiley Sons 2001 p 228230 Y a1 b2X Æ Ø a1 Æ Comissão de vendas X 1 Ø1 1 b1 b2 Ø Ø X vendas fiGuRa 96 Parâmetros da regressão linear segmentada ECONOBOOKindb 306 23112010 071432 exeMPlo 97 Custo total em relação à produção Como exemplo da aplicação da regressão linear segmentada considere a relação hipoté tica entre custo total e produção dada na Tabela 96 Sabese que o custo total pode mudar seu coeficiente angular quando a produção atinge 5500 unidades Seja Y na equação 984 o custo total e X a produção total obtemos os seguintes resul tados 984 Como mostram os resultados o custo marginal de produção é cerca de 28 centavos de dólar por unidade e embora atinja 37 centavos 28 C 9 para uma produção de 5500 uni dades a diferença entre os dois não é estatisticamente significativa porque a variável binária não é significativa por exemplo no nível de 5 Para fins práticos podemos fazer a regres são do custo total sobre a produção total excluindo a variável binária Tabela 96 Dados hipotéticos sobre produção e custo total 99 Modelos de regressão com dados em painel Lembrese de que no Capítulo 1 discutimos diversos dados que estão disponíveis para análise em pírica como cortes transversais séries temporais dados combinados combinação de série temporal e corte transversal e dados em painel A técnica de variáveis binárias pode ser facilmente estendida aos dados combinados e em painel Uma vez que o uso de dados em painel está tornandose cada vez mais comum nos trabalhos aplicados consideraremos este tópico em detalhes no Capítulo 16 910 Alguns aspectos técnicos do modelo de variáveis dummies a interpretação de variáveis dummies em regressões semilogarítmicas No Capítulo 6 discutimos os modelos loglineares em que o regressando é logarítmico e os re gressores são lineares Em tais modelos os coeficientes angulares dos regressores dão a semielastici dade a variação percentual no regressando para uma variação unitária do regressor Isso só se aplica se o regressor for quantitativo O que acontece se um regressor for uma variável binária Para sermos específicos considere o seguinte modelo 9101 em que Y D saláriohora em e D D 1 para mulheres e 0 para homens Como interpretamos tal modelo Supondo que E ui D 0 obtemos Capítulo 9 Modelos de regressão com variáveis binárias dummies 307 ECONOBOOKindb 307 23112010 071433 308 Parte Um Modelos de regressão com equação única Função salário para os homens 9102 Função salário para as mulheres 9103 Portanto o intercepto Ø1 dá o logaritmo médio do saláriohora e o coeficiente angular dá a di ferença no logaritmo médio dos ganhos por hora de homens e mulheres Essa é uma afirmação bas tante esquisita mas se tomarmos o antilogaritmo de Ø1 o que obtemos não são os salários médios por hora recebidos pelos homens e sim seus salários medianos Como sabemos média mediana e moda são as três medidas de tendência central de uma variável aleatória Se tomarmos o antilogaritmo de Ø1 C Ø2 obtemos os salários medianos das mulheres exeMPlo 98 Logaritmo de salárioshora em relação a gênero Para ilustrar a equação 9101 usamos os dados do exemplo 92 a regressão resulta com base em 528 observações como se segue 9104 em que indica que os valores p são praticamente nulos Tomando o antilogaritmo de 21763 encontramos 88136 que corresponde aos ga nhos medianos por hora de homens e tomando o antilogaritmo de 21763 02437 D 192857 obtemos 6879 que são os ganhos medianos por hora recebidos pelas mulhe res os ganhos medianos por hora das mulheres são cerca de 2194 mais baixos compara dos aos dos homens 88136 6879 88136 É interessante notar que podemos obter a semielasticidade para um regressor binário diretamente pelo dispositivo sugerido por halvorsen e Palmquist19 Tomamos o antilogaritmo para base e do coeficiente binário estimado subtraímos 1 dele e multiplicamos a diferença por 100 veja o apêndice 9a1 para entender a lógica do procedimento Portanto se tomar mos o antilogaritmo de 02437 obteremos 078366 Subtraindo 1 disso temos 02163 depois de multiplicarmos por 100 obtemos 2163 sugerindo que o salário mediano das mulheres D D 1 é 2163 mais baixo que aquele de sua contraparte masculina o mesmo que obtivemos anteriormente salvo erros de arredondamento 19 Variáveis dummies e heterocedasticidade Retomemos nossa regressão de poupançarenda nos Estados Unidos para os períodos de 19701981 19821995 e para todo o período de 19701995 Ao testarmos a estabilidade estrutural usando a técnica das variáveis dummies supusemos que a var u1i D var u2i D æ2 isto é as variâncias dos erros nos dois períodos eram iguais Essa também era a premissa do teste de Chow Se essa premissa não for válida se as variâncias dos erros nos dois subperíodos forem dife rentes é bem possível tirar conclusões equivocadas Primeiro devese checar se as variâncias no subperíodo são iguais usando técnicas estatísticas adequadas Discutiremos esse tópico com mais detalhes no capítulo sobre heterocedasticidade mas no Capítulo 8 já descrevemos como o 19 halvorSen robert PalmQUiST raymond The interpretation of dummy variables in semilogarithmic equa tions American Economic Review v 70 n 3 p 474475 ECONOBOOKindb 308 23112010 071434 teste F pode ser usado com essa finalidade20 Veja nossa discussão do teste de Chow no Capítulo 8 Como mostramos parece que as variâncias de erro nos dois períodos não são as mesmas Daí os resultados tanto do teste de Chow quanto do método de variáveis binárias apresentados podem não ser totalmente confiáveis Evidentemente nosso propósito aqui é ilustrar as várias técnicas que podem ser usadas para lidar com um problema o da estabilidade estrutural Essas técnicas podem não ser válidas em qualquer aplicação mas isso se aplica à maioria das técnicas estatísticas Obviamente podemse tomar as ações adequadas para resolver o problema como faremos no capítulo sobre heterocedasticidade mesmo assim veja o Exercício 928 Variáveis binárias e autocorrelação Além da homocedasticidade o modelo de regressão linear clássico supõe que os termos de erro nos modelos de regressão não estejam correlacionados Mas o que acontece se esse não for o caso principalmente em modelos envolvendo regressores binários Como nos aprofundaremos na discus são sobre a autocorrelação adiaremos a resposta a essa questão o que acontece se a variável dependente for uma variável dummy Até aqui consideramos modelos em que o regressando é quantitativo e os regressores são quantitativos ou qualitativos ou ambos mas há ocasiões em que o regressando pode ser qualitati vo ou binário Considerese por exemplo a decisão de um trabalhador de participar da força de trabalho A decisão de participar é do tipo sim ou não Portanto a variável participação da força de trabalho é uma variável binária A decisão de participar da força de trabalho depende de vários fatores como o salário inicial grau de escolaridade e condições no mercado de trabalho medidas pela taxa de desemprego Ainda podemos usar os mínimos quadrados ordinários MQO para estimar modelos de regres são em que o regressando é binário Sim mecanicamente podemos mas há vários problemas estatísticos que se encontram em tais modelos uma vez que há alternativas para a estimação dos MQO discutiremos o assunto no Capítulo 15 sobre modelos logit e probit Naquele capítulo também discutiremos modelos em que o regressando tem mais de duas categorias por exemplo a decisão de ir para o trabalho de carro ônibus ou trem ou a decisão de trabalhar meio período período integral ou não trabalhar Tais modelos são chamados modelos de variáveis dependen tes politômicas em contraste com os modelos de variáveis dependentes dicotômicas em que a variável dependente só tem duas categorias 911 Tópicos para estudos avançados Vários tópicos relacionados às variáveis binárias discutidos na literatura específica são bastante avançados entre eles 1 modelos com parâmetros aleatórios ou variáveis 2 modelos de regres são com mudança e 3 modelos de desequilíbrio Nos modelos de regressão considerados neste texto supõese que os parâmetros os Ø sejam desconhecidos mas fixos Os modelos de coeficientes aleatórios e há várias versões deles su põem que os Ø também sejam aleatórios Um importante trabalho de referência nessa área é o de Swamy21 20 o procedimento do teste de Chow pode ser realizado mesmo na presença de heterocedasticidade mas depois se terá de usar o teste de Wald os cálculos matemáticos envolvidos no teste são complexos no capítulo sobre heterocedasticidade retomaremos o assunto 21 SWamY Pav b Statistical inference in random coefficient regression models berlim Springerverlag 1971 Capítulo 9 Modelos de regressão com variáveis binárias dummies 309 ECONOBOOKindb 309 23112010 071434 310 Parte Um Modelos de regressão com equação única No modelo com variáveis binárias usando tanto interceptos quanto coeficientes angulares diferen ciais pressupõese implicitamente que saibamos qual é o ponto de quebra Assim no exemplo da poupançarenda para 19701995 dividimos o período em 19701981 e 19821995 os períodos pré e pósrecessão acreditando que a recessão em 1982 mudou a relação entre poupança e renda Às vezes não é fácil identificar quando ocorre a quebra A técnica dos modelos de regressão com mudança SRM do inglês switching regression models foi desenvolvida para tais situações O SRM trata o ponto de quebra como uma variável aleatória e por meio de um processo iterativo determina quando a quebra pode ter acontecido realmente O trabalho seminal nessa área é o de Goldfeld e Quandt22 Técnicas especiais de estimação são exigidas para lidar com o que é conhecido como situa ções de desequilíbrio situações em que mercados não se ajustam a demanda não é igual à ofer ta O exemplo clássico é aquele da demanda e da oferta de um bem A demanda de um bem é a função de seu preço e outras variáveis e a oferta dele é a função de seu preço e outras variáveis algumas das quais são diferentes daquelas que entram na função de demanda A quantidade de bens comprados e vendidos de fato pode não ser necessariamente igual à obtida igualandose a demanda à oferta levando assim ao desequilíbrio Para uma discussão completa de modelos de desequilíbrio o leitor pode consultar Quandt23 912 Um exemplo para concluir Terminamos este capítulo com um exemplo que ilustra alguns pontos apresentados A Tabela 97 fornece dados em uma amostra de 261 trabalhadores em uma cidade industrial no sul da Índia em 1990 As variáveis são definidas como se segue RS D renda semanal em rúpias Idade D idade em anos Dgen D 0 para homem e 1 para mulher DE2 D uma variável binária assumindo o valor de 1 para trabalhadores com primeiro grau completo DE3 D uma variável binária tomando o valor de 1 para trabalhadores com segundo grau completo DE4 D uma variável binária assumindo o valor de 1 para trabalhadores com escolaridade superior ao segundo grau DPT D uma variável binária assumindo o valor de 1 para trabalhadores contratados com tempo indeterminado e o valor de 0 para trabalhadores temporários A categoria de referência são trabalhadores do gênero masculino com primeiro grau incompleto e trabalho temporário Outro interesse é descobrir como os salários semanais estão relacionados à ida de gênero nível de escolaridade e tempo no emprego Com essa finalidade estimamos o seguinte modelo de regressão RS Idade Dgen Seguindo a literatura de Economia do Trabalho estamos expressando o logaritmo natural de salários como uma função das variáveis explanatórias Como observamos no Capítulo 6 a distribuição de 22 GoldFeld S QUandT r Nonlinear methods in econometrics amsterdã north holland 1972 23 QUandT richard e The econometrics of disequilibrium nova York basil blackwell 1988 ECONOBOOKindb 310 23112010 071434 Idade RS Idade RS gen gen Tabela 97 Salários de trabalhadores em rupias indianas 1990 Capítulo 9 Modelos de regressão com variáveis binárias dummies 311 ECONOBOOKindb 311 23112010 071435 312 Parte Um Modelos de regressão com equação única variáveis como salários tende a ser assimétrica transformações logarítmicas de tais variáveis reduzem tanto a assimetria quanto a heterocedasticidade Usando o EViews6 obtemos os seguintes resultados de regressão Dependent Variable LnRS Method Least Squares Sample 1 261 Included observations 261 Coefficient Std Error tStatistic Prob C 3706872 0113845 3256055 00000 AGE 0026549 0003117 8516848 00000 Dgen 0656338 0088796 7391529 00000 DE2 0113862 0098542 1155473 02490 DE3 0412589 0096383 4280732 00000 DE4 0554129 0155224 3569862 00004 DPT 0558348 0079990 6980248 00000 Rsquared 0534969 Mean dependent var 4793390 Adjusted Rsquared 0523984 SD dependent var 0834277 SE of regression 0575600 Akaike info criterion 1759648 Sum squared resid 8415421 Schwarz criterion 1855248 Log likelihood 2226340 HannanQuinn criter 1798076 Fstatistic 4870008 DurbinWatson stat 1853361 ProbFstatistic 0000000 Esses resultados mostram que o logaritmo de salários está positivamente relacionado à idade educação e permanência no emprego mas negativamente relacionado ao gênero um achado não surpreendente Embora pareça não haver diferença prática nos salários semanais de trabalhadores com graus de escolaridade primário ou menor os salários semanais são mais altos para trabalhado res com segundo grau e muito mais altos para trabalhadores com educação superior Os coeficientes das variáveis binárias devem ser interpretados como valores diferenciais da cate goria de referência O coeficiente da variável DPT sugere que aqueles trabalhadores com contratos por tempo indeterminado ganham em média mais dinheiro que aqueles cujos trabalhos são tempo rários Como sabemos do Capítulo 6 em um modelo loglinear variáveis dependentes em forma de lo garitmo e variáveis explanatórias em forma linear o coeficiente angular de uma variável explanató ria representa semielasticidade ele fornece a variação percentual ou relativa na variável dependente para uma variação de unidade no valor da variável explanatória Mas como foi observado no texto quando a variável explanatória é uma variável dummy temos de ser cuidadosos Aqui temos de tomar o antilogaritmo do coeficiente binário estimado subtrair 1 dele e multiplicar o resultado por 100 Para descobrirmos a variação percentual em salários semanais para aqueles trabalhadores que têm empre gos por tempo indeterminado versus aqueles que têm empregos temporários tomamos o antilogaritmo do coeficiente DPT de 0558348 subtraímos 1 e então multiplicamos a diferença por 100 Para nosso exemplo isso resulta e0558348 1 D 174778 1 D 074778 ou cerca de 75 O leitor é aconselha do a calcular tais variações percentuais para as outras variáveis binárias incluídas no modelo Nossos resultados mostram que o gênero e a escolaridade têm efeitos diferenciais nos ganhos semanais É possível que haja uma interação entre gênero e o nível educacional Os trabalhadores do gênero masculino com graus de escolaridades mais altos ganham salários mais altos que as mulheres com graus de escolaridade mais altos Para examinarmos essa possibilidade podemos estender a regressão anterior de salários pela interação do gênero com educação Os resultados da regressão são os seguintes ECONOBOOKindb 312 23112010 071436 Dependent Variable LnRS Method Least Squares Sample 1 261 Included observations 261 Coefficient Std Error tStatistic Prob C 3717540 0114536 3245734 00000 AGE 0027051 0003133 8634553 00000 Dgen 0758975 0110410 6874148 00000 DE2 0088923 0106827 0832402 04060 DE3 0350574 0104309 3360913 00009 DE4 0438673 0186996 2345898 00198 DgenDE2 0114908 0275039 0417788 06765 DgenDE3 0391052 0259261 1508337 01327 DgenDE4 0369520 0313503 1178681 02396 DPT 0551658 0080076 6889198 00000 Rsquared 0540810 Mean dependent var 4793390 Adjusted Rsquared 0524345 SD dependent var 0834277 SE of regression 0575382 Akaike info criterion 1769997 Sum squared resid 8309731 Schwarz criterion 1906569 Log likelihood 2209847 HannanQuinn criter 1824895 Fstatistic 3284603 DurbinWatson stat 1856488 Prob Fstatistic 0000000 Embora as variáveis binárias de interação mostrem que haja algumas interações entre gênero e o grau de escolaridade o efeito não é estatisticamente significativo pois nenhum dos coeficientes de interação são estatisticamente significativos considerados individualmente É interessante notar que se excluirmos as variáveis binárias de educação mas mantivermos as variáveis binárias de interação obteremos os seguintes resultados Dependent Variable LnRS Method Least Squares Sample 1 261 Included observations 261 Coefficient Std Error tStatistic Prob C 3836483 0106785 3592725 00000 AGE 0025990 0003170 8197991 00000 Dgen 0868617 0106429 8161508 00000 DgenDE2 0200823 0259511 0773851 04397 DgenDE3 0716722 0245021 2925140 00038 DgenDE4 0752652 0265975 2829789 00050 DPT 0627272 0078869 7953332 00000 Rsquared 0514449 Mean dependent var 4793390 Adjusted Rsquared 0502979 SD dependent var 0834277 SE of regression 0588163 Akaike info criterion 1802828 Sum squared resid 8786766 Schwarz criterion 1898429 Log likelihood 2282691 HannanQuinn criter 1841257 Fstatistic 4485284 DurbinWatson stat 1873421 Prob Fstatistic 0000000 Capítulo 9 Modelos de regressão com variáveis binárias dummies 313 ECONOBOOKindb 313 23112010 071438 314 Parte Um Modelos de regressão com equação única Agora parece que as variáveis binárias para escolaridade não têm efeito nos salários semanais mas introduzidas em um formato interativo parecem ter Como mostra o exercício devese ter caute la no uso de variáveis binárias É deixado como exercício para o leitor descobrir se as variáveis biná rias para escolaridade interagem com a DPT Resumo e conclusões 1 As variáveis binárias tomando valores de 1 e zero ou suas transformações lineares são um meio de introduzir regressores qualitativos em modelos de regressão 2 As variáveis binárias são um instrumento de classificação de dados por dividirem uma amos tra em vários subgrupos com base nas qualidades ou atributos gênero estado civil raça religião etc e implicitamente permitem que se calculem regressões para cada subgrupo Se há diferenças na resposta do regressando à variação nas variáveis qualitativas nos vários subgrupos elas se refletirão nas diferenças nos interceptos ou coeficientes angulares ou ambos dos vários subgrupos de regressões 3 Embora seja uma ferramenta versátil a técnica das variáveis binárias precisa ser aplicada com cuidado Primeiro se a regressão contém um termo constante o número de variáveis binárias deve ser menor que o número de classificações de cada variável qualitativa Em segundo lugar o coeficiente ligado às variáveis binárias deve ser interpretado sempre em relação ao grupobase ou referência o grupo que recebe o valor de zero A base escolhida dependerá do propósito de pesquisa Por fim se um modelo tem várias variáveis qualitativas com várias classes a introdução de variáveis binárias pode consumir um grande número de graus de liberdade Devese sempre ponderar o número de variáveis binárias a serem introdu zidas em função do número total de observações disponíveis para análise 4 Entre suas várias aplicações este capítulo considerou algumas Estas incluíram 1 comparar duas ou mais regressões 2 dessazonalizar dados de série temporal 3 variáveis interati vas 4 interpretação de variáveis binárias em modelos semilogarítmicos e 5 modelos de regressão linear segmentada 5 Também fizemos advertências quanto ao uso de variáveis binárias em situações de heterocedas ticidade e autocorrelação Mas uma vez que trataremos desses assuntos detalhadamente nos ca pítulos subsequentes retomaremos esses tópicos exeRCíCioS 91 Tendose dados mensais ao longo de vários anos quantas variáveis binárias podem ser intro duzidas para testar as seguintes hipóteses a Todos os 12 meses do ano mostram padrões sazonais b Apenas fevereiro abril junho agosto outubro e dezembro mostram padrões sazonais 92 Considere os resultados as razões t estão entre parênteses da regressão a seguir24 em que Y D horas de trabalho por ano desejadas pela esposa calculadas como horas de trabalho por ano mais semanas em que se procurava emprego leUThold Jane The effect of taxation on the hours worked by married women Industrial and Labor Rela tions Review jul 1978 n 4 p 520526 notação mudada para ajustarse ao nosso formato ECONOBOOKindb 314 23112010 071438 Capítulo 9 Modelos de regressão com variáveis binárias dummies 315 X2 D ganhos reais médios por hora da esposa descontados os impostos X3 D ganhos reais do marido no ano anterior descontados os impostos X4 D idade da esposa em anos X5 D anos de escolaridade completados pela esposa X6 D variável atitude 1 D se a informante acha que não há problema em trabalhar desde que ela e o marido concordem 0 D caso contrário X7 D variável atitude 1 D se o marido da informante está de acordo com o trabalho da es posa 0 D caso contrário X8 D número de filhos com menos de 6 anos de idade X9 D número de filhos com idades entre 6 e 13 anos a Os sinais dos coeficientes de vários regressores não binários fazem sentido do ponto de vista econômico Justifique sua resposta b Como poderíamos interpretar as variáveis binárias X6 e X7 Essas variáveis são estatistica mente significativas Como a amostra é bastante grande é possível recorrer à regra prática 2t para responder a esta pergunta c Por que se pode considerar que as variáveis de idade e escolaridade não sejam fatores signi ficativos neste estudo na decisão de uma mulher em trabalhar Estimativas preliminares Tabela 98 Matriz dos dados para regressão no Exercício 93 Fonte GUJARATI Damodar The behavior of unemployment and unfilled vacancies Great Britain 19581971 The Economic Journal v 82 p 202 mar 1972 Capítulo 9 Modelos de regressão com variáveis binárias dummies 315 ECONOBOOKindb 315 23112010 071439 316 Parte Um Modelos de regressão com equação única 93 Considere os seguintes resultados de regressão Os dados estão na Tabela 9825 em que TD D taxa de desemprego V D vagas em aberto D D 1 para o período iniciado no quarto trimestre de 1966 D 0 para o período anterior ao quarto trimestre de 1966 t D tempo medido em trimestres Nota no quarto trimestre de 1966 o então governo trabalhista liberalizou a Lei de Segurida de substituindo o sistema de segurodesemprego baseado em um percentual fixo por um siste ma que combinava o percentual fixo aos benefícios relacionados aos ganhos recebidos pelo funcionário o que aumentou o nível de benefícios aos desempregados a Quais suas expectativas sobre a relação entre desemprego e vagas em aberto b Mantendo a taxa de vagas em aberto constante qual a taxa média de desemprego no perío do que se inicia no quarto trimestre de 1966 Ela é estatisticamente diferente do período anterior ao quarto trimestre de 1966 Como você sabe c Os coeficientes angulares nos dois períodos anteriores diferem estatisticamente Como verificamos isso d Podemos concluir deste estudo que os generosos benefícios de desemprego levam a taxas mais altas de desemprego Isso faz sentido em termos econômicos 94 Dos dados anuais para 19721979 William Nordhaus estimou o modelo a seguir para explicar o comportamento dos preços do petróleo determinados pela Opep os erros padrão estão entre parênteses26 em que y D diferença entre os preços atuais e os do ano anterior por barril x1 D diferença entre o preço spot do ano corrente e o preço da Opep no ano anterior x2 D 1 para 1974 e 0 para os demais anos Interprete esse resultado e mostre os resultados graficamente O que esses resultados sugerem sobre o poder de monopólio da Opep 95 Considere o seguinte modelo em que Y D salário anual de um professor universitário X D anos de experiência de ensino D D variável dummy para gênero Considere três maneiras de definir a variável dummy a D D 1 para homens 0 para mulheres b D D 1 para mulheres 2 para homens c D D 1 para mulheres 1 para homens GUJaraTi damodar The behaviour of unemployment and unfilled vacancies reat britain 19581971 The Economic Journal mar 1972 v 82 p 195202 oil and economic performance in industrial countries Brookings Papers on Economic Activity 1980 p 341388 ECONOBOOKindb 316 23112010 071440 Capítulo 9 Modelos de regressão com variáveis binárias dummies 317 Interprete o modelo de regressão anterior para cada definição de variável dummy Um método é preferível a outro Justifique sua resposta 96 Retome a regressão 973 Como seria possível testar a hipótese de que os coeficientes de D2 e D3 são iguais E que os coeficientes de D2 e D4 são iguais Se o coeficiente de D3 for estatis ticamente diferente daquele de D2 e o coeficiente de D4 for diferente de D2 isso significa que os coeficientes de D3 e D4 também são diferentes Dica var A ß B D VAR A C var B ß 2 cov A B 97 Volte ao exemplo de poupançarenda nos Estados Unidos discutido na Seção 95 a Como se obteriam os erros padrão dos coeficientes de regressão dados nas Equações 955 e 956 obtidos da regressão combinada 954 b Para respostas numéricas que informações adicionais se houver são necessárias 98 Em seu estudo sobre horas de trabalho gastas pela FDIC Federal Deposit Insurance Corporation em 91 auditorias bancárias R J Miller estimou as seguintes funções27 em que Y D horas trabalhadas pelos auditores da FDIC X1 D ativos totais do banco X2 D número total de agências do banco X3 D razão de empréstimos duvidosos em relação ao total dos empréstimos concedidos pelo banco D1 D 1 se a administração do banco foi classificada como ótima D2 D 1 se a administração do banco foi classificada como boa D3 D 1 se a administração do banco foi classificada como satisfatória D4 D 1 se o exame foi conduzido em conjunto com órgão estadual Os dados entre parênteses são os erros padrão estimados a Interprete esses resultados b Há algum problema em interpretar as variáveis binárias neste modelo uma vez que Y está em forma logarítmica c Como você interpretaria os coeficientes binários 99 Para avaliar o efeito da política do Fed de desregulamentar as taxas de juros a começar em julho de 1979 Sidney Langer um aluno meu estimou o seguinte modelo para o período que vai do terceiro trimestre de 1975 ao segundo trimestre de 1983 28 examination of man hour cost for independent join and divided examination programs Journal of Bank Research 1980 v 11 p 2835Nota as notações foram alteradas para se ajustarem aos padrões deste livro lanGer Sidney interest rate deregulation and shortterm interest rates não publicado ECONOBOOKindb 317 23112010 071440 318 Parte Um Modelos de regressão com equação única em que Y D taxa de juros das Letras do Tesouro dos Estados Unidos de 3 meses P D taxa de inflação esperada TD D taxa de desemprego ajustada sazonalmente M D variações da base monetária Dum D variável binária levando em conta o valor de 1 para observações a começar em 1º de julho de 1979 a Interprete esses resultados b Qual foi o efeito da desregulamentação da taxa de juros Os resultados fazem sentido do ponto de vista econômico c Os coeficientes de Pt TDt e Mt são negativos Qual seria a lógica econômica disso 910 Retome a regressão segmentada discutida no texto Suponha que não haja apenas uma mudan ça no coeficiente angular de X mas que a linha de regressão também dê um salto como mostra a Figura 97 Como você modificaria a Equação 981 para levar em conta o salto na linha de regressão em X Y X X 911 Determinantes de preço por onça de refrigerante Cathy Schaefer uma de minhas alunas es timou a seguinte regressão usando 77 observações29 em que Pi D preço por onça de refrigerante D1i D 001 se comprado em loja de descontos D 010 se comprado em loja de rede D 100 se comprado em loja de conveniência D2i D 10 se for de marca D 01 se não for de marca D3i D 0001 se tiver 676 onças dois litros D 0010 se tiver 2833 onças um litro D 0100 se tiver 16 onças meio litro D 1000 se tiver 12 onças 330 ml Os resultados foram os seguintes SChaeFer Cathy Price per ounce of cola beverage as a function of place of purchase size of container and branded or unbranded product Trabalho semestral não publicado fiGuRa 97 Regressão linear segmentada descontínua ECONOBOOKindb 318 23112010 071441 Capítulo 9 Modelos de regressão com variáveis binárias dummies 319 Nota os erros padrão são mostrados apenas até cinco casas decimais a Comente a respeito da forma como as variáveis binárias foram incluídas no modelo b Supondo que a forma de inclusão das variáveis binárias seja aceitável como poderíamos interpretar os resultados c O coeficiente de D3 é positivo e estatisticamente significativo Como você racionalizaria este resultado 912 Com base nos dados para 101 países sobre a renda per capita em dólares X e da expectativa de vida em anos Y no início da década de 1970 Sen e Srivastava obtiveram os seguintes re sultados de regressão30 em que Di D 1 se ln Xi 7 e Di D 0 nos demais casos Nota quando ln Xi D 7 X D 1097 aproximadamente a Quais poderiam ser as razões para introduzir a forma logarítmica da variável renda b Como poderíamos interpretar o coeficiente 939 de ln Xi c Qual seria a razão da inclusão do regressor Di ln Xi 7 Como podemos explicar verbal mente esse regressor E como podemos interpretar o coeficiente 336 desse regressor Dica regressão linear segmentada d Supondo uma renda per capita de 1097 como sendo a linha divisória entre os países mais pobres e mais ricos de que maneira derivaríamos a regressão para países cuja renda per capita seja inferior a 1097 e a regressão para países cuja renda per capita seja maior que 1097 e Que conclusões gerais você tira do resultado de regressão apresentado neste problema 913 Considere o seguinte modelo em que Di D 0 para as 20 primeiras observações e Di D 1 para as 30 observações remanescen tes Sabese que var ui 2 D 300 a Como interpretamos Ø1 e Ø2 b Quais os valores médios dos dois grupos c Como calcularíamos a variância de ØO1 C ØO2 Nota a cov ØO1 ØO2 D 15 914 Para avaliar o efeito das leis estaduais do direito ao trabalho que não exigem a filiação a um sindicato como précondição de emprego sobre filiação a sindicatos são obtidos os seguintes resultados de regressão dos dados para 50 Estados nos Estados Unidos para 198231 em que PES D percentual de funcionários de empresas privadas sindicalizados em 1982 e DAT D 1 se existe legislação de direito ao trabalho 0 se não existe Nota Em 1982 20 Estados tinham leis de direito ao trabalho a A priori qual a relação esperada entre PES e DAT b Os resultados da regressão apoiam as expectativas anteriores c Interprete os resultados de regressão Sen ashish SrivaSTava muni Regression analysis theory methods and applications nova York Springer verlag 1990 p 92 notação alterada os dados usados nos resultados de regressão foram obtidos de melTZ n m interstate and interprovincial differences in union density Industrial Relations 1989 v 28 n p 142158 ECONOBOOKindb 319 23112010 071442 320 Parte Um Modelos de regressão com equação única d Qual foi o percentual médio dos empregados sindicalizados do setor privado nos Estados que não tinham leis de direito ao trabalho 915 No modelo de regressão a seguir Y representa o salário por hora em e D a variável dummy tomando o valor de 1 para um aluno com curso universitário e o valor de 0 para um aluno de segundo grau Usando as fórmu las de MQO dadas no Capítulo 3 mostre que sg sg cs em que os subscritos têm os significados sg D segundo grau e cs D curso superior No total há n1 pessoas com se gundo grau e n2 pessoas com segundo grau completo para uma amostra de n D n1 C n2 916 Para estudar a taxa de crescimento da população em Belize no período de 19701992 Mukherjee et al estimaram os seguintes modelos32 em que Pop D população em milhões t D variável de tendência Dt D 1 para observações iniciadas em 1978 e 0 antes de 1978 e ln D logaritmo natural a No Modelo I qual a taxa de crescimento da população de Belize no período de amostra b As taxas de crescimento da população são estatisticamente diferentes dos períodos anteriores e posteriores a 1978 Como podemos saber Se forem diferentes quais as taxas de crescimento para 19721977 e para 19781992 exercícios aplicados 917 Usando os dados da Tabela 98 teste a hipótese de que as variâncias dos erros no 4º trimestre de 1958 ao 3º trimestre de 1966 e do 4º trimestre de 1966 ao 2º trimestre de 1971 são as mesmas 918 Usando a metodologia discutida no Capítulo 8 compare as regressões sem restrição 973 e restrita 974 isto é teste a validade das restrições impostas 919 Na regressão poupançarenda para os Estados Unidos 954 discutida neste capítulo suponha que em vez de usar valores 1 e 0 para a variável binária seja usado Zi D a C bDi em que Di D 1 e 0 a D 2 e b D 3 Compare os resultados obtidos 920 Continuando com a regressão poupançarenda 954 suponha que você tivesse de atribuir Di D 0 para observações no segundo período e Di D 1 para observações no primeiro período Como os resultados da Equação 954 mudariam 921 Use os dados da Tabela 92 e considere o modelo a seguir ln Poupançasi D Ø1 C Ø2 ln Rendai Ø3 C ln Di C ui em que ln é o logaritmo natural e Di D 1 para 19701981 e 10 para 19821995 a Qual a lógica de atribuir valores binários como sugerido b Estime o modelo precedente e interprete os resultados obtidos c Quais são os valores do intercepto da função poupança nos dois subperíodos e como você os interpretaria 922 Retomando os dados de vendas trimestrais de eletrodomésticos da Tabela 93 considere o modelo a seguir mUKherJee Chandan WhiTe howard marc WUYTS howard Econometrics and data analysis for developing countries londres routledge 1998 p 372375 notações adaptadas ECONOBOOKindb 320 23112010 071443 Capítulo 9 Modelos de regressão com variáveis binárias dummies 321 em que os D são variáveis binárias que assumem os valores 1 e 0 para o período que vai do segundo ao quarto trimestre a Calcule o modelo anterior para lavadoras de pratos trituradores de lixo e lavadoras de roupas separadamente b Como os coeficientes angulares estimados seriam interpretados c Como seriam usados os Æ estimados para dessazonalizar os dados de vendas para cada eletrodoméstico 923 Estime novamente o modelo no Exercício 922 adicionando ao regressor gastos com bens du ráveis a Há diferença nos resultados da regressão obtidos no Exercício 922 e os deste exercício Se houver o que explica a diferença b Se há sazonalidade nos gastos com bens duráveis como poderíamos explicála 924 A Tabela 99 apresenta dados sobre eleições presidenciais nos Estados Unidos realizadas a cada quatro anos de 1916 a 200433 Notas Ano H ano das eleições V H participação dos democratas na votação bipartidária W H variável indicador 1 se as eleições forem de 1920 1944 e 1948 e 0 para outros casos D H variável indicador 1 se um candidato democrata estiver disputando a eleição 1 se o candidato for republicano C H taxa de crescimento do PIB per capita real nos 3 primeiros trimestres do ano de eleição R H variável indicador 1 se houver democrata candidato a reeleição 1 se o candidato for republicano N H número de trimestres nos 15 primeiros trimestres da administração em que a taxa de crescimento do PIB per capita real for superior a 32 P H valor absoluto da taxa de crescimento do deflator do PIB nos 15 primeiros trimestres da administração estes dados foram compilados originalmente por ray Fair da Universidade de Yale que faz previsões dos resul tados das eleições presidenciais há vários anos os dados são reproduzidos de ChaTTerJee Samprit hadi ali S PriCe bertram Regression analysis by example 3 ed nova York John Wiley Sons 2000 p 150151 e atualizados de httpfairmodeleconyaleedurayfairpdf2006ChTmhTm Tabela 99 Eleições presidenciais dos Estados Unidos 19162004 ECONOBOOKindb 321 23112010 071443 322 Parte Um Modelos de regressão com equação única a Usando os dados da Tabela 99 desenvolva um modelo adequado para prever a participa ção dos democratas nos votos presidenciais que envolvem dois partidos b Como usaríamos este modelo para prever o resultado de uma eleição presidencial c Chatterjee et al sugeriram considerar o modelo a seguir como modelo experimental para prever as eleições presidenciais Estime este modelo e comente os resultados em relação aos obtidos no modelo que você esco lheu 925 Retome a regressão 964 Teste a hipótese de que a taxa de aumento dos ganhos médios por hora com relação à escolaridade difere por gênero e raça Dica use variáveis binárias multi plicativas 926 Retome a regressão 931 Como poderíamos modificar o modelo para descobrir se há intera ção entre as variáveis binárias para o gênero e para a região de residência Apresente os resul tados com base neste modelo e compareos com os da Equação 931 927 No modelo Yi D Ø1 C Ø2 Di C ui seja Di D 0 para as 40 primeiras observações e Di D 1 para as 60 observações remanescentes Sabese que ui tem média zero e uma variância de 100 Quais os valores médios e as variâncias dos dois conjuntos de observações34 928 Retome a regressão de poupançarenda dos Estados Unidos discutida neste capítulo Como alternativa à Equação 951 considere o modelo a seguir em que Y é a poupança e X a renda Calcule o modelo anterior e compare os resultados com os da Equação 954 Qual o melhor modelo b Como você interpretaria o coeficiente binário neste modelo c Como veremos no capítulo sobre heterocedasticidade muito frequentemente uma transfor mação logarítmica da variável dependente reduz a heterocedasticidade nos dados Veja se é esse o caso no exemplo efetuando a regressão de ln de Y contra X para os dois períodos e veja se as variâncias dos erros estimados dos dois períodos são iguais do ponto de vista estatístico Em caso afirmativo o teste de Chow pode ser usado para combinar os dados da maneira indicada neste capítulo 929 Retome o exemplo dos assalariados indianos Seção 912 e os dados da Tabela 97 Lembrese de que as variáveis são definidas como se segue35 RS D renda semanal em rupias Idade D em anos Dgen D 0 para homem e 1 para mulher DE2 D uma variável binária com o valor de 1 para trabalhadores com primeiro grau completo DE3 D uma variável binária com o valor de 1 para trabalhadores com segundo grau completo DE4 D uma variável binária com o valor de 1 para trabalhadores com escolaridade superior ao segundo grau DPT D uma variável binária com o valor de 1 para trabalhadores com empregos permanen tes e um valor de 0 para trabalhadores temporários este exemplo é adaptado de KennedY Peter A guide to econometrics 4th ed Cambridge mass miT Press 1998 p 347 dados extraídos de mUKherJee Chandan WhiTe howard WUYTS marc Econometrics and data analysis for developing countries londres Toutledge Press 1998 apêndice 322 Parte Um Modelos de regressão com equação única ECONOBOOKindb 322 23112010 071444 Capítulo 9 Modelos de regressão com variáveis binárias dummies 323 A categoria de referência são trabalhadores do sexo masculino com primeiro grau incompleto e empregos temporários Na Seção 912 os termos de interação foram criados entre as variáveis escolaridade DE2 DE3 e DE4 e a variável gênero Dgen O que acontece se criamos termos de interação entre as va riáveis binárias escolaridade e a variável binária funcionário permanente DPT a Calcule o modelo prevendo ln RS contendo as variáveis binárias idade gênero escolarida de e os três novos termos de interação DE2 DPT DE3 DPT e DE4 DPT Parece haver um efeito de interação significativo entre os novos termos b Há diferença significativa entre trabalhadores com nível de escolaridade até o primário e aqueles sem primeiro grau completo Avalie isso com relação à variável binária escolari dade quanto ao termo de interação e explique os resultados O que dizer da diferença entre trabalhadores com segundo grau completo e aqueles com primeiro grau incompleto Qual a diferença entre os que têm mais que o grau secundário comparados aos que não têm o primeiro grau c Agora avalie os resultados de retiraremse as variáveis binárias de escolaridade do modelo Os termos de interação têm significância alterada Apêndice 9A Regressão semilogarítmica com regressor binário Na Seção 910 notamos que nos modelos do tipo 1 a variação relativa de Y isto é sua semielasticidade com relação ao regressor binário que toma valores de 1 ou 0 pode ser obtida como antilogaritmo de Ø2 1 vezes 100 ou seja 2 A prova é a seguinte uma vez que ln e exp D e são funções inversas podemos escrever a Equação 1 como 3 Agora quando D D 0 eØ2Di D 1 e quando D D 1 eØ2Di D eØ2 Portanto ao passar do estado 0 para o estado 1 ln Yi varia de eØ2 1 Mas uma variação no ln de uma variável é uma variação relativa a qual após a multi plicação por 100 tornase uma variação percentual Portanto a variação percentual é eØ2 1 100 como se afirmou Nota lne e D 1 isto é o logaritmo de e na base e é 1 assim como o logaritmo de 10 na base 10 é 1 Lembrese de que o logaritmo na base e é chamado logaritmo natural e que o log na base 10 é chamado de logaritmo comum ECONOBOOKindb 323 23112010 071445 325 Relaxamento das hipóteses do modelo clássico Na Parte I realizamos uma discussão aprofundada do modelo de regressão linear normal clássico e mostramos como ele pode ser usado para lidar com problemas gêmeos de inferência estatística a saber a estimação e o teste de hipóteses bem como os problemas de previsão Mas lembrese de que esse modelo baseiase nas diversas hipóteses simplificadoras indicadas a seguir Hipótese 1 O modelo de regressão é linear nos parâmetros Hipótese 2 Os valores dos regressores os X são fixos ou valores de X são independentes do termo de erro Aqui isso significa que exigimos covariância zero entre ui e cada variável X Hipótese 3 Para os X dados o valor médio do erro ui é zero Hipótese 4 Para os X dados a variância de ui é constante ou homocedástica Hipótese 5 Para os X dados não há autocorrelação nem correlação serial entre os termos de erro Hipótese 6 O número de observações n deve ser maior que o número de parâmetros a serem es timados Hipótese 7 Deve haver variação suficiente nos valores das variáveis X Incluímos também as três hipóteses a seguir nesta parte do texto Hipótese 8 Não há colinearidade exata entre as variáveis X Hipótese 9 O modelo está especificado corretamente logo não há viés de especificação Hipótese 10 O termo estocástico de erro ui é distribuído normalmente Antes de prosseguirmos observemos que a maioria dos livrostexto apresenta menos de 10 hipó teses Por exemplo as hipóteses 6 e 7 são presumidas sem serem apresentadas explicitamente Deci dimos incluílas porque distinguir as condições exigidas para que os mínimos quadrados ordinários MQO tenham propriedades estatísticas desejáveis como ser MELNT e as condições exigidas para que os MQO sejam úteis faz sentido Por exemplo os estimadores de MQO são MELNT melhores estimadores lineares não tendenciosos mesmo que a hipótese 7 não seja satisfeita Mas nesse caso os erros padrão dos estimadores de MQO serão grandes em relação a seus coeficientes as razões t serão pequenas dificultando a avaliação da contribuição de um ou mais regressores à soma dos quadrados explicados Como nota Wetherill na prática dois grandes tipos de problemas surgem ao aplicar o modelo de regressão linear clássico 1 aqueles que se devem a hipóteses sobre a especificação do modelo e sobre os termos de erro ui e 2 aqueles que se devem a suposições sobre os dados1 Na primeira 1 Wetherill G Barrie Regression analysis with applications Nova York Chapman and hall Nova York 1986 p 1415 2 Parte 325 ECONOBOOKParte02indb 325 23112010 071747 326 Parte Um Modelos de regressão com equação única 326 Parte Dois Relaxamento das hipóteses do modelo clássico categoria estão as Hipóteses 1 2 3 4 5 9 e 10 Na segunda incluemse as Hipóteses 6 7 e 8 Além disso problemas relativos aos dados como outliers observações atípicas ou incomuns e erros de medida nos dados também se incluem na segunda categoria Com relação aos problemas decorrentes das hipóteses sobre termos de erro e às especificações de modelo surgem três questões importantes 1 Quanto podemos nos afastar de uma hipótese antes que isto venha causar um problema sério Por exemplo se ui não tiverem uma distribuição normal exata que nível de afastamento dessa hipótese podemos aceitar antes que a propriedade MELNT dos estimadores de MQO seja invalidada 2 Como descobrimos se determinada hipótese é de fato violada em um caso concreto Assim como verificamos se os termos de erro estão normalmente distribuídos em uma aplicação Já discutimos os testes de normalidade estatística A2 de Anderson Darling e o de JarqueBera 3 Que medidas podemos tomar se uma ou mais hipóteses forem falsas Por exemplo se for constatado que a hipótese de homocedasticidade é falsa em uma aplica ção o que fazemos então Com relação aos problemas atribuídos às hipóteses sobre os dados também enfrentamos questões semelhantes 1 Em que medida determinado problema é sério Por exemplo a muticolinearidade é um problema tão grave que torna a estimação e a inferência muito difíceis 2 Como descobrimos a gravidade do problema com os dados Por exemplo como decidimos se a inclusão ou exclusão de uma observação ou observações que podem representar discrepâncias farão diferença relevante na análise 3 Alguns dos problemas com dados podem ser facilmente corrigidos Podese ter acesso aos dados originais para descobrir de onde surgem os erros de medida nos dados Infelizmente não se pode dar respostas satisfatórias a todas essas perguntas No restante da Parte 2 examinaremos algumas das hipóteses mais detalhadamente mas nem todas serão examinadas por completo Em particular não apresentaremos uma discussão aprofundada das Hipóteses 2 3 e 10 pelas seguintes razões Hipótese 2 Regressores fixos versus estocásticos Lembrese de que nossa análise de regressão baseiase na hipótese de que os regressores não são estocásticos e assumem valores fixos em amostragem repetida Há uma boa razão para essa estraté gia Ao contrário de pesquisadores nas ciências exatas como observado no Capítulo 1 os economis tas em geral não têm controle sobre os dados que usam Com mais frequência os economistas dependem de dados secundários ou seja dados coletados por terceiros como o governo e organizações privadas A estratégia prática a seguir é pressupor que para o problema em questão os valores das variáveis explanatórias são dados embora as próprias variáveis possam ser intrinsecamente estocás ticas ou aleatórias Logo os resultados da análise de regressão são condicionados a esses valores dados Mas suponha que não possamos considerar os X como verdadeiramente não estocásticos ou fixos É esse o caso de regressores aleatórios ou estocásticos Agora temos uma situação complicada os ui são por definição estocásticos Se os X também forem estocásticos deveremos especificar como os X e os ui são distribuídos Se nos dispusermos a aceitar a Hipótese 2 isto é os X embora aleató rios são distribuídos independentemente ou pelo menos não correlacionados a ui então para todos os fins práticos poderemos continuar a operar como se os X fossem não estocásticos Como observa Kmenta Assim o relaxamento da hipótese de que X é não estocástico e a substituição dela pela hipótese de que X é estocástico mas independente de u não muda as propriedades desejáveis e a viabilidade da es timação dos mínimos quadrados2 2 KmeNta Jan Elements of econometrics 2 ed Nova York macmillan 1986 p 338 Grifo do original ECONOBOOKParte02indb 326 23112010 071747 327 Portanto manteremos a Hipótese 2 até lidarmos com modelos de equações simultâneas na Parte 43 Também faremos uma breve discussão de regressores não estocásticos no Capítulo 13 Hipótese 3 Valor médio zero de ui Lembrese do modelo de regressão linear com k variáveis 1 Agora suponhamos que 2 em que w é uma constante note no modelo padrão que w 0 mas agora consideraremos qualquer constante Utilizando a expectativa condicional da Equação 1 obtemos 3 em que Æ D Ø1 C w e que ao utilizarmos as expectativas é preciso observar que os X são tratados como constantes Por quê Portanto se a Hipótese 3 não for satisfeita veremos que não podemos estimar o intercepto origi nal Ø1 o que obtemos é Æ que contém Ø1 e Eui w Em resumo obtemos uma estimativa viesada de Ø1 Mas como observamos em várias ocasiões em muitas situações o termo de intercepto Ø1 é de pouca importância mais significativos são os coeficientes angulares que permanecem não afetados mesmo quando a Hipótese 3 é violada4 Além disso em muitas aplicações o termo de intercepto não tem interpretação física Hipótese 10 normalidade de u Esta hipótese não é essencial se nosso objetivo for apenas a estimação Como visto no Capítulo 3 os estimadores de MQO são MELNT independentemente de os ui serem distribuídos normalmente ou não Com a hipótese da normalidade no entanto fomos capazes de estabelecer que os estimadores de MQO dos coeficientes de regressão seguem a distribuição normal que n k æO 2æ 2 tem a distri buição 2 e que se pode usar os testes t e F para verificar várias hipóteses estatísticas independente mente do tamanho da amostra 3 Um aspecto técnico pode ser notado aqui em vez da forte hipótese de que os X e os u são independentes po demos usar a hipótese mais fraca de que os valores das variáveis X e u não são correlacionados contemporanea mente isto é no mesmo ponto no tempo Nesse caso os estimadores de mQO podem ser viesados ou tendenciosos mas são consistentes isto é à medida que o tamanho da amostra aumenta indefinidamente os estimadores convergem para seus verdadeiros valores Se no entanto os X e u são correlacionados contempo raneamente os estimadores de mQO são viesados e inconsistentes No Capítulo 17 mostraremos como o mé todo de variáveis instrumentais às vezes pode ser usado para obter estimadores consistentes nessa situação 4 É muito importante notar que essa afirmação só será verdadeira se Eui w para cada i entretanto se Eui wi ou seja uma constante diferente para cada i os coeficientes angulares parciais podem ser viesados bem como inconsistentes Nesse caso a violação da hipótese 3 será crítica Para mais demonstrações e detalhes veja SChmiDt Peter Econometrics Nova York marcel Dekker 1976 p 3639 Relaxamento das hipóteses do modelo clássico 327 ECONOBOOKParte02indb 327 23112010 071748 328 Parte Um Modelos de regressão com equação única Mas o que acontece se os ui não forem distribuídos normalmente Contamos com a seguinte extensão do teorema do limite central lembrese de que recorremos ao teorema do limite central para justificar a hipótese de normalidade Se os termos de erro ui forem independentes e distribuídos identicamente com média zero e variância constante æ2 e se as variáveis explanatórias forem constantes em amostras repetidas os coeficientes dos estimadores de MQO serão assintoticamente normalmente distribuídos com médias iguais aos Ø correspondentes5 Portanto os procedimentos usuais de teste os testes t e F serão válidos assintoticamente isto é em grandes amostras mas não em pequenas ou finitas Saber que se os termos de erro não forem distribuídos normalmente mesmo assim os estimado res de MQO serão normalmente distribuídos assintoticamente sob a hipótese de variância homoce dástica e X fixos é de pouca serventia para os economistas que com frequência não se dão ao luxo de terem dados obtidos em grandes amostras Portanto a hipótese de normalidade tornase extrema mente importante para fins de teste de hipóteses e previsão Logo com os problemas gêmeos de esti mação e do teste de hipóteses em mente e dado o fato de que pequenas amostras são a regra e não a exceção na maioria das análises econômicas continuaremos a usar a hipótese da normalidade6 Veja a Seção 1312 do Capítulo 13 Evidentemente isso significa que quando lidamos com uma amostra finita devemos testar expli citamente a hipótese da normalidade Já consideramos os testes de normalidade de AndersonDarling e JarqueBera O leitor é fortemente incentivado a aplicar estes e outros testes de normalidade aos resíduos de regressão Lembrese de que nas amostras finitas sem a hipótese de normalidade as es tatísticas habituais t e F podem não seguir as distribuições t e F Ficamos então com as Hipóteses 1 4 5 6 7 8 e 9 As Hipóteses 6 7 e 8 estão intimamente re lacionadas e serão discutidas no Capítulo 10 sobre multicolinearidade a Hipótese 4 é vista no Capí tulo 11 sobre heterocedasticidade a Hipótese 5 é examinada no Capítulo 12 sobre autocorrelação e a Hipótese 9 é apresentada no Capítulo 13 sobre especificação de modelo e teste de diagnóstico Devido à natureza especializada e às exigências matemáticas a Hipótese 1 é discutida como tópico especial na Parte 3 Capítulo 14 Por motivos pedagógicos em cada um desses capítulos seguimos um formato comum a saber 1 identificamos a natureza do problema 2 examinamos suas consequências 3 sugerimos métodos para detectar o problema e 4 apresentamos medidas corretivas que possam gerar estimadores que possuam as propriedades estatísticas desejáveis discutidas na Parte 1 Cabe uma advertência como ressaltamos antes não dispomos de respostas satisfatórias a todos os problemas que surgem da violação de hipóteses do modelo clássico de regressão linear Além disso pode haver mais de uma solução a determinado problema e com frequência não está claro qual é o melhor método Assim viés da especificação multicolinearidade e heterocedasticidade podem coexistir em uma aplicação e não há um teste único onipotente que resolva todos os problemas ao mesmo tempo7 Além disso um teste que tenha sido usado em determinada época pode não ser mais empregado hoje por ter sido encontrada alguma falha É assim que a ciência progride e a econometria não é exceção 5 theil henri Introduction to econometrics englewood Cliffs NJ Prenticehall 1978 p 240 Devese notar que a hipótese de X fixos e a constante æ2 são cruciais para este resultado 6 a propósito observe que os efeitos do afastamento da normalidade e tópicos relacionados são discutidos com frequência sob o tópico de estimação robusta na literatura específica um assunto que vai além do escopo deste livro 7 isto não é por falta de tentativas Veja Bera a K JarQUe C m efficient tests for normality homocedasticity and serial independence of regression residuals monte Carlo evidence Economic Letters 1981 v 7 p 313318 328 Parte Dois Relaxamento das hipóteses do modelo clássico ECONOBOOKParte02indb 328 23112010 071748 329 Multicolinearidade o que acontece se os regressores estiverem correlacionados Não há expressão mais inadequada tanto em textos de econometria quanto na literatura aplicada do que problema de multicolinearidade É inegável que muitas variáveis explanatórias são altamente colineares E está absolutamente claro que há experimentos projetados XX a matriz de dados que seriam preferíveis aos naturais que nos são oferecidos a amostra que temos em mãos Mas reclamar da aparente maldade da natureza não é algo de todo construtivo e as correções ad hoc do projeto como a regressão por etapas stepwise ou a regressão ridge podem ser inadequadas com resultados desastro sos Melhor seria aceitarmos o fato de que nossos não experimentos os dados não coletados de acordo com experimentos planejados às vezes não nos dão muitas informações sobre os parâmetros de inte resse1 A Hipótese 8 do modelo clássico de regressão linear afirma que não há multicolinearidade entre os regressores incluídos no modelo de regressão Neste capítulo examinaremos essa hipótese buscando respostas às seguintes perguntas 1 Qual a natureza da multicolinearidade 2 A multicolinearidade é realmente um problema 3 Quais são suas consequências práticas 4 Como é detectada 5 Que medidas podem ser tomadas para atenuar o problema da multicolinearidade Neste capítulo também discutiremos a Hipótese 6 do modelo clássico de regressão linear não importa qual seja o número de observações na amostra deve ser superior ao número de regressores e examinaremos a Hipótese 7 que exige variabilidade suficiente nos valores dos regressores pois estão intimamente relacionados às hipóteses de inexistência de multicolinearidade Arthur Goldberger batizou a Hipótese 6 de problema da micronumerosidade2 que simplesmente significa amostra pequena 1 learNer edward e model choice and specification analysis in GriliCheS Zvi iNtriliGatOr michael D eds Handbook of econometrics amsterdã North holland Publishing Company 1983 v i p 330301 2 Veja seu livro A course in econometrics Cambridge mass harvard University Press 1991 p 249 Capítulo 10 ECONOBOOKParte02indb 329 23112010 071748 330 Parte Um Modelos de regressão com equação única 101 A natureza da multicolinearidade O termo multicolinearidade devese a Ragnar Frisch3 Originalmente significava a existência de uma relação linear perfeita ou exata entre algumas ou todas as variáveis explanatórias do modelo de regressão4 No caso de regressão com k variáveis explanatórias X1 X2 Xk em que X1 D 1 para todas as observações de modo que permita o termo de intercepto dizse existir uma relação linear exata se a seguinte condição for satisfeita 1011 em que 1 2 k são constantes tais que nem todas são simultaneamente zero5 Hoje no entanto o termo multicolinearidade é usado em um sentido mais amplo para incluir o caso de multicolinearidade perfeita como mostra a Equação 1011 bem como o caso em que as variáveis X estão intercorrelacionadas mas não perfeitamente como se segue6 1012 em que vi é um termo de erro estocástico Para entender a diferença entre multicolinearidade perfeita e menos que perfeita suponha por exemplo que 2 0 Então a Equação 1011 pode ser escrita como 1013 a qual mostra como X2 tem uma relação linear exata com outras variáveis ou como pode ser derivado de uma combinação linear de outras variáveis X Nessa situação o coeficiente de correlação entre a variável X2 e a combinação linear do lado direito da Equação 1013 será a unidade Do mesmo modo se 2 0 a Equação 1012 pode ser escrita como 1014 que mostra que X2 não é uma combinação linear exata de outras variáveis X porque também é deter minado pelo termo de erro estocástico vi Como exemplo numérico vejamos os seguintes dados hipotéticos X2 X3 X3 10 50 52 15 75 75 18 90 97 24 120 129 30 150 125 3 FriSCh ragnar Statistical confluence analysis by means of complete regression systems institute of economics Oslo University publ n 5 1934 4 Falando estritamente a multicolinearidade referese à existência de uma relação linear única mas essa distinção raramente é mantida na prática e a multicolinearidade referese a ambos os casos 5 as chances de obtermos uma amostra de valores em que os regressores estão relacionados desta forma são de fato muito pequenas na prática exceto quando propositado em que por exemplo o número de observações é menor que o de regressores ou se um deles cai na armadilha da variável binária como discutido no Capítulo 9 Veja o exercício 102 6 Se há apenas duas variáveis explanatórias a intercorrelação pode ser medida pelo coeficiente de correlação simples ou de primeira ordem mas se houver mais de duas variáveis X a intercorrelação pode ser medida pelos coeficientes de correlação parcial ou pelo coeficiente de correlação múltipla R de uma variável X com todas as outras variáveis X tomadas em conjunto ECONOBOOKParte02indb 330 23112010 071749 Capítulo 10 Multicolinearidade o que acontece se os regressores estiverem correlacionados 331 É evidente que X3i D 5X2i Portanto há uma colinearidade perfeita entre X2 e X3 pois o coeficien te de correlação r23 é igual à unidade A variável X3 foi criada a partir de X3 simplesmente somando a ela os seguintes números tirados de uma tabela de números aleatórios 2 0 7 9 2 Nesse caso já não há colinearidade perfeita entre X2 e X3 Contudo as duas variáveis estão altamente correlaciona das porque os cálculos mostrarão que o coeficiente de correlação entre elas é 09959 A abordagem algébrica à multicolinearidade pode ser descrita sucintamente pelo diagrama de Ballentine lembrese da Figura 38 reproduzida na Figura 101 Nesta os círculos Y X2 e X3 representam respectivamente as variações de Y variável dependente e X2 e X3 as variáveis explanatórias O grau de colinearidade pode ser medido pela extensão da sobreposição área sombreada dos círculos X2 e X3 Na Figura 101a não há sobreposição de X2 e X3 não há colineari dade Na Figura 101b até 101e há um grau de colinearidade que vai de baixo a alto quan to maior a sobreposição entre X2 e X3 isto é maior a área sombreada maior o grau de colinearidade No extremo se X2 e X3 estivessem totalmente sobrepostos ou se X2 estivesse total mente dentro de X3 ou viceversa a colinearidade seria perfeita A propósito note que a multicolinearidade como a definimos referese apenas às relações linea res entre as variáveis X Ela não descarta relações não lineares entre elas Por exemplo considere o seguinte modelo de regressão 1015 em que por exemplo Y D custo total de produção e X D produção As variáveis X 2 i produção ao quadrado e X 3 i produção ao cubo são obviamente relacionadas funcionalmente a Xi mas a relação é não linear Em termos estritos modelos como a Equação 1015 não violam a hipótese de não multico linearidade Entretanto em aplicações concretas o coeficiente de correlação medido em termos conven cionais mostrará Xi X 2 i e X 3 i como altamente correlacionados o que como mostraremos dificultará a estimação dos parâmetros da Equação 1015 com maior precisão isto é com erros padrão menores Figura 101 Visão da multicolinearidade segundo o diagrama de Ballentine Y X2 X3 Y X2 X3 Y X2 X3 Y X2 X3 Y X2 X3 a Ausência de colinearidade b Baixa colinearidade c Colinearidade moderada d Alta colinearidade e Colinearidade muito alta ECONOBOOKParte02indb 331 23112010 071750 332 Parte Um Modelos de regressão com equação única Por que o modelo clássico de regressão linear pressupõe que não há multicolinearidade entre os X O raciocínio é o seguinte se a multicolinearidade for perfeita no sentido da Equação 1011 os coeficientes de regressão das variáveis X serão indeterminados e seus erros padrão infinitos Se a multicolinearidade for menos que perfeita como na Equação 1012 os coeficientes de regressão embora determinados possuirão grandes erros padrão em relação aos próprios coeficientes o que significa que os coeficientes não podem ser estimados com grande precisão ou exatidão As demonstrações dessas afirmações estão nas seções seguintes Há várias fontes de multicolinearidade Como observam Montgomery e Peck a multicolinearida de pode ocorrer devido aos seguintes fatores7 1 O método de coleta de dados empregado Por exemplo a amostragem de uma faixa limitada de valores pelos regressores da população 2 Restrições ao modelo ou à população que está sendo amostrada Por exemplo na regressão do consumo de eletricidade contra renda X2 e o tamanho da casa X3 há uma restrição fí sica na população no sentido de que famílias com rendas mais altas em geral têm casas maiores que as com rendas mais baixas 3 Especificação do modelo Por exemplo adicionando termos polinomiais a um modelo de regressão especialmente quando a amplitude da variável X é pequena 4 Um modelo sobredeterminado Isto acontece quando o modelo tem mais variáveis explana tórias que o número de observações Poderia ocorrer em pesquisa médica na qual pode haver um número pequeno de pacientes sobre os quais são coletadas informações a respeito de um grande número de variáveis Outra razão para a multicolinearidade principalmente nos dados de séries temporais pode ser que os regressores incluídos no modelo tenham uma tendência comum todos aumentam ou diminuem ao longo do tempo Na regressão de gastos de consumo sobre renda riqueza e população os regressores renda riqueza e população podem estar crescendo com o tempo aproximadamente na mesma taxa gerando colinearidade dessas variáveis 102 Estimação na presença de multicolinearidade perfeita Anteriormente se afirmou que no caso da multicolinearidade perfeitas os coeficientes de regres são permanecem indeterminados e seus erros padrão são infinitos Esse fato pode ser demonstrado em termos do modelo de regressão com três variáveis Por meio da forma do desvio em que todas as variáveis são expressas como desvios de suas médias amostrais podemos escrever o modelo de re gressão com três variáveis como 1021 Agora do Capítulo 7 obtemos 747 748 7 mONtGOmerY Douglas PeCK elizabeth Introduction to linear regression analysis Nova York John Wiley Sons 1982 p 289290 Veja também maSON r l GUNSt r F WeBSter J t regression analysis and problems of multicollinearity Communications in statistics A 1975 v 4 n 3 p 227292 GUNSt r F maSON r l advantages of examining multicollinearities in regression analysis Biometrics v 33 p 249260 1977 ECONOBOOKParte02indb 332 23112010 071751 Capítulo 10 Multicolinearidade o que acontece se os regressores estiverem correlacionados 333 Suponha que X3i D X2i em que é uma constante diferente de zero como 2 4 1 8 etc Substi tuindo na Equação 747 obtemos 1022 que é uma expressão indeterminada O leitor pode desejar verificar se ØO3 também é indeterminado8 Por que obtemos o resultado mostrado na Equação 1022 Lembrese do significado de ØO2 Ele nos dá a variação do valor médio de Y quando X2 varia por uma unidade mantendo X3 constante Mas se X3 e X2 forem perfeitamente colineares não haverá como manter X3 constante à medida que X2 muda X3 também muda pelo fator Isso significa que não há como distinguir as influências de X2 e X3 de uma forma separada na amostra dada para fins práticos X2 e X3 são indistinguíveis Em econometria aplicada esse problema é gravíssimo visto que nossa intenção é isolar os efeitos par ciais de cada X sobre a variável dependente Para ver isso de outro modo substituamos X3i D X2i na Equação 1021 e obteremos o seguin te veja também a Equação 7112 1023 em que 1024 Aplicando a fórmula dos MQO conhecida à Equação 1023 obtemos 1025 Portanto embora possamos estimar um único valor para Æ não há como estimar um único valor para Ø2 e Ø3 em termos matemáticos ˆα ˆβ2 λ ˆβ3 1026 dá apenas uma equação com duas incógnitas note que é dado e há uma infinidade de soluções para a Equação 1026 para os valores dados de ÆO e Em termos mais concretos seja ÆO D 08 e D 2 Então temos 1027 ou 1028 8 Outra forma de ver isto é a seguinte por definição o coeficiente de correlação entre X2 e X3 r2 3 é Se isto é se houver colinearidade perfeita entre X2 e X3 o denominador da equa ção 747 será zero tornando impossível estimar Ø2 ou de Ø3 ECONOBOOKParte02indb 333 23112010 071753 334 Parte Um Modelos de regressão com equação única Agora escolhendo um valor arbitrário de ØO3 teremos uma solução para ØO2 Escolhendo outro valor para ØO3 teremos outra solução para ØO2 Não importa quanto se tente não há um valor único de ØO2 Concluise da discussão anterior que no caso de multicolinearidade perfeita não se pode obter uma única solução para os coeficientes de regressão individuais Mas observe que é possível obter uma única solução para combinações lineares desses coeficientes A combinação linear de Ø2 C Ø3 tem um valor único estimado por Æ dado o valor de 9 Vale notar que no caso da multicolinearidade perfeita as variâncias e os erros padrão de ØO2 e ØO3 tomados individualmente são infinitos veja o Exercício 1021 103 Estimação na presença de multicolinearidade alta mas imperfeita A situação de multicolinearidade perfeita é uma situação patológica extrema Em geral não há relação linear exata entre as variáveis X principalmente em dados envolvendo séries temporais eco nômicas Voltando ao modelo de três variáveis no formato de desvio dado na Equação 1021 em vez da multicolinearidade exata podemos ter 1031 em que 0 e vi é um termo de erro estocástico tal que Por quê Por sinal o diagrama de Ballentines mostrado na Figura 101b a 101e representa situações de colinearidade imperfeita Neste caso a estimação dos coeficientes de regressão Ø2 e Ø3 pode ser possível Por exemplo substituindo a Equação 1031 na Equação 747 obtemos 1032 na qual se usa Uma expressão semelhante pode ser derivada para ØO3 Agora diferentemente da Equação 1022 não há razão para acreditar a priori que a Equação 1032 não pode ser estimada Evidentemente se vi for suficientemente pequeno por exemplo mui to próximo de zero a Equação 1031 indicará colinearidade quase perfeita e estaremos de volta ao caso indeterminado da Equação 1022 104 Multicolinearidade muito barulho por nada Consequências teóricas da multicolinearidade Lembrese de que se as hipóteses do modelo clássico forem satisfeitas os estimadores de MQO dos estimadores da regressão serão MELNT melhores estimadores lineares não viesados ou MENT melhores estimadores não viesados se a hipótese da normalidade for acrescentada Agora podemos mostrar que mesmo se a multicolinearidade for muito alta como no caso da quase multicolinearida de os estimadores de MQO ainda conservarão a propriedade de melhores estimadores lineares não viesados10 Por que toda essa confusão por causa da multicolinearidade Como Christopher Achen ressalta veja também a citação de Leamer no início deste capítulo 9 Na literatura econométrica uma função como Ø2 C Ø3 é conhecida como uma função estimável 10 Uma vez que a quase multicolinearidade em si não viola as outras hipóteses listadas no Capítulo 7 os estima dores de mQO são os melhores estimadores lineares não tendenciosos como indicado lá ECONOBOOKParte02indb 334 23112010 071754 Capítulo 10 Multicolinearidade o que acontece se os regressores estiverem correlacionados 335 Os alunos que estão começando a estudar metodologia às vezes se preocupam com a correlação de suas variáveis independentes o chamado problema da multicolinearidade Mas esta não viola nenhuma das hipóteses de regressão Estimativas consistentes não viesadas resultarão e seus erros padrão serão esti mados corretamente O único efeito da multicolinearidade é dificultar a obtenção de estimativas dos coeficientes com erros padrão pequenos Mas ter um pequeno número de observações também gera esse efeito como ter variáveis independentes com pequenas variâncias Na verdade teoricamente a multi colinearidade poucas observações e pequenas variâncias das variáveis independentes são essencialmen te o mesmo problema Perguntar O que devo fazer com a multicolinearidade é como perguntar O que devo fazer se não tenho muitas observações Não há resposta estatística para essa pergunta11 Para reforçar a importância do tamanho da amostra Goldberger criou o termo micronumerosi dade para contrapor à polissílaba multicolinearidade De acordo com Goldberger a micronumero sidade exata a contraparte da multicolinearidade exata surge quando n o tamanho da mostra é zero caso em que qualquer tipo de estimação é impossível A quase micronumerosidade como a quase multicolinearidade surge quando o número de observações mal excede o número de parâme tros a serem estimados Leamer Achen e Goldberger estão certos em reclamar da falta de atenção dada ao problema do tamanho da amostra e da atenção indevida ao problema da multicolinearidade Infelizmente no tra balho aplicado que envolve dados secundários dados coletados por algum órgão como os dados do PNB coletados pelo governo um pesquisador pode não ser capaz de fazer muito com o tamanho da amostra e pode ter de enfrentar problemas de estimação importantes que merecem ser tratados a multicolinearidade como violação do modelo de regressão linear clássico12 Em primeiro lugar é verdade que mesmo no caso de quase multicolinearidade os estimadores de MQO são não viesados mas a não viesidade é uma propriedade de amostragem repetida ou de multia mostragem Em outras palavras mantendo fixos os valores das variáveis X se obtivermos amostras repetidas e calcularmos os estimadores de MQO para cada uma dessas amostras a média dos valores da amostra convergirá para os verdadeiros valores populacionais dos estimadores à medida que o número das amostras aumenta Mas isso não diz nada sobre as propriedades dos estimadores em qualquer amostra dada Em segundo lugar também é verdade que a colinearidade não destrói a propriedade de variância míni ma na classe de todos os estimadores não viesados os estimadores de MQO têm variância mínima são eficientes Contudo não significa que a variância de um estimador de MQO será necessariamente pequena em relação ao valor do estimador em qualquer amostra dada como demonstraremos em breve Terceiro a multicolinearidade é essencialmente um fenômeno amostral da regressão no sentido de que mesmo que as variáveis X não estejam relacionadas linearmente na população elas podem estar relacionadas na amostra em questão quando postulamos a função de regressão populacional ou teórica FRP acreditamos que todas as variáveis X incluídas no modelo tenham uma influência se parada ou independente sobre a variável dependente Y Mas pode acontecer que em qualquer amostra dada que seja usada para testar a FRP algumas ou todas as variáveis X sejam tão colineares que não podemos isolar sua influência sobre Y É como se disséssemos que nossa amostra nos decepcionou embora a teoria informe que todas as variáveis X são importantes Em resumo nossa amostra pode não ser rica o suficiente para acomodar todas as variáveis X na análise Para ilustrar retome o exemplo de consumo e renda do Capítulo 3 Exemplo 31 Os economistas inferem teoricamente que além da renda a riqueza do consumidor também é um determinante im portante nos gastos de consumo Assim podemos escrever Consumoi D Ø1 C Ø2 Rendai C Ø3 Riquezai C ui 11 aCheN Christopher h Interpreting and using regression Beverly hills Califórnia Sage Publications 1982 p 8283 12 KeNNeDY Peter A guide to econometrics 3 ed Cambridge massthe mit Press 1992 p 177 ECONOBOOKParte02indb 335 23112010 071754 336 Parte Um Modelos de regressão com equação única Mas pode acontecer de quando obtemos dados sobre renda e riqueza as duas variáveis terem correla ção alta senão perfeitas pessoas mais ricas em geral tendem a ter rendas mais altas Embora teorica mente renda e riqueza sejam candidatos lógicos para explicar o comportamento dos gastos de consumo na prática na amostra pode ser difícil separar as influências da renda e da riqueza sobre os gastos de consumo Em termos ideais para avaliarmos os efeitos individuais da riqueza e da renda sobre os gastos de consumo precisamos de um número suficiente de observações de amostra dos indivíduos ricos com baixa renda e de indivíduos com alta renda e pouca riqueza lembrese da Hipótese 7 Embora isso possa ser possível em estudos de corte transversal aumentandose o tamanho da amostra é muito difícil de ser obtido no trabalho com séries temporais agregadas Por todas essas razões o fato de os estimadores de MQO serem MELNT apesar da multicolineari dade pouco ajuda na prática Devemos ver o que acontece ou é provável que aconteça em qualquer amostra dada um tópico discutido a seguir 105 Consequências práticas da multicolinearidade Em casos de quase ou de alta multicolinearidade é muito provável nos depararmos com as seguin tes consequências 1 Embora sejam os melhores estimadores lineares não viesados os estimadores de MQO têm grandes variâncias e covariâncias tornando difícil uma estimação precisa 2 Devido à consequência 1 os intervalos de confiança tendem a ser muito mais amplos levan do à aceitação imediata da hipótese nula igual a zero isto é o verdadeiro coeficiente po pulacional igual a zero 3 Também devido à consequência 1 a razão t de um ou mais coeficientes tende a ser estatistica mente insignificante 4 Embora a razão t de um ou mais coeficientes seja estatisticamente insignificante R2 a medi da geral da qualidade do ajustamento pode ser muito alto 5 Os estimadores de MQO e seus erros padrão podem ser sensíveis a pequenas alterações nos dados As consequências anteriores podem ser demonstradas como a seguir grandes variâncias e covariâncias dos estimadores de MQO Para ver grandes variâncias e covariâncias lembrese de que para o modelo 1021 as variân cias e covariâncias de ØO2 e ØO3 são dadas por 7412 7415 7417 em que r23 é o coeficiente de correlação entre X2 e X3 É evidente por meio das Equações 7412 e 7415 que quando r23 tende a 1 isto é quando a coli nearidade aumenta as variâncias dos dois estimadores aumentam e no limite quando r23 D 1 elas são infinitas Tornase igualmente claro pela Equação 7417 que quando r23 aumenta para 1 a covariância dos dois estimadores também aumenta em valor absoluto Nota cov ØO2 ØO3 cov ØO3 ØO2 ECONOBOOKParte02indb 336 23112010 071755 Capítulo 10 Multicolinearidade o que acontece se os regressores estiverem correlacionados 337 A velocidade com a qual as variâncias e covariâncias aumentam pode ser vista com o fator de inflação da variância FIV definido como 1051 O FIV mostra como a variância de um estimador é inflada pela presença da multicolinearidade Quan do r2 23 aproximase de 1 o FIV aproximase do infinito Ou seja quando a colinearidade aumenta a variância de um estimador aumenta e no limite pode tornarse infinita Se não houver colinearidade entre X2 e X3 o FIV será 1 Usando esta definição podemos expressar as Equações 7412 e 7415 como 1052 1053 que mostra que as variâncias de ØO2 e ØO3 são diretamente proporcionais ao FIV Para ter uma ideia da rapidez com que as variâncias e covariâncias aumentam quando r23 aumen ta considere a Tabela 101 que dá essas variâncias e covariâncias para valores selecionados de r23 Como mostra a tabela aumentos em r23 têm um efeito notável nas variâncias e covariâncias estima das dos estimadores de MQO Quando r23 D 050 a var ØO2 é 133 vezes a variância quando r23 é zero mas quando r23 atinge 095 ela é cerca de dez vezes mais alta do que quando não há colineari dade E de repente um aumento de r23 de 095 para 0995 torna a variância estimada 100 vezes aquela verificada quando a colinearidade é igual a zero O mesmo efeito marcante é visto na covariân cia estimada Tudo isto pode ser visto na Figura 102 Os resultados discutidos podem ser facilmente estendidos ao modelo com k variáveis Em tal mo delo a variância do késimo coeficiente como notado na Equação 756 pode ser expressa como 756 em que ØOj D coeficiente parcial estimado de regressão do regressor Xj R2 j D R2 na regressão de Xj sobre as k 2 regressores remanescentes Nota há k 1 regressores no modelo de regressão com k variáveis Também podemos escrever a Equação 756 como 1054 Como podemos ver desta expressão a var ØOj é proporcional a æ2 e FIV mas inversamente pro porcional a Assim var ØOj será grande ou pequena de acordo com três elementos 1 æ2 2 FIV e 3 Este último que se relaciona à Hipótese 8 do modelo clássico informa que quanto maior a variabilidade de um regressor menor a variância de seu coeficiente supondo que os outros dois elementos sejam constantes e portanto maior a precisão com a qual esse coeficiente pode ser estimado Antes de prosseguirmos podemos notar que o inverso de FIV é chamado de tolerância TOL Ou seja 1055 ECONOBOOKParte02indb 337 23112010 071757 338 Parte Um Modelos de regressão com equação única Quando R 2 j D 1 colinearidade perfeita TOLj D 0 e R 2 j D 0 não há colinearidade nenhuma TOLj é 1 Devido à ligação estreita entre FIV e TOL eles podem ser usados indistintamente intervalos de confiança mais amplos Dados os erros padrão grandes os intervalos de confiança dos parâmetros populacionais relevan tes tendem a ser maiores como podemos ver na Tabela 102 Por exemplo quando r2 3 D 095 o in tervalo de confiança para Ø2 é maior que quando r2 3 D 0 por um fator de ou cerca de 3 Portanto em casos de alta multicolinearidade os dados da amostra podem ser compatíveis com um conjunto diverso de hipóteses A probabilidade de aceitar uma hipótese falsa erro tipo II aumenta razões t insignificantes Lembrese para testar a hipótese nula que por exemplo Ø2 D 0 usamos a razão t isto é ØO2 ep ØO2 e comparamos o valor de t estimado com o valor crítico de t na tabela t Mas como vimos em casos Tabela 101 Efeito de aumentos de r23 na var ØO2 e na cov ØO2 ØO3 Nota A Figura 102 Comportamento da var ØO2 como função de r23 133A A 526A 0 09 10 08 05 var Ø 2 A æ S x r23 2 2 2i ECONOBOOKParte02indb 338 23112010 071758 Capítulo 10 Multicolinearidade o que acontece se os regressores estiverem correlacionados 339 de alta colinearidade os erros padrão estimados aumentam acentuadamente tornando os valores t menores Em tais casos aceitase cada vez mais a hipótese nula de que o verdadeiro valor populacio nal relevante é zero13 alto valor de R2 mas poucas razões t significativas Considere o modelo de regressão linear com k variáveis Em casos de alta colinearidade é possível constatar como acabamos de notar que um ou mais coeficientes angulares parciais são insignificantes individualmente com base no teste t Nessas situa ções R2 pode ser tão alto por exemplo superior a 09 que de acordo com o teste F podemos rejeitar convincentemente a hipótese de que De fato esse é um dos indícios de mul ticolinearidade valores t insignificantes mas um R2 geral alto e um valor F significativo Demonstraremos esse sinal na próxima seção mas tal resultado não deveria ser surpreendente tendo em vista nossa discussão sobre testes individuais e conjuntos apresentados no Capítulo 8 Como podemos lembrar o problema real aqui são as covariâncias entre os estimadores que como a fórmula 7417 indica estão relacionadas às correlações entre os regressores Sensibilidade dos estimadores de MQO e de seus erros padrão a pequenas alterações nos dados Contanto que a multilinearidade não seja perfeita é possível estimar os coeficientes de regressão mas as estimativas e seus erros padrão tornamse muito sensíveis até mesmo à menor alteração nos dados Para comprovar isso considere a Tabela 103 Com base nesses dados obtemos a seguinte regres são múltipla 1056 13 em termos de intervalos de confiança o valor de Ø2 D 0 pertencerá cada vez mais à região de aceitação quan do o grau de colinearidade aumentar Tabela 102 O efeito da colinearidade crescente no intervalo de confiança de 95 para Ø2 ØO2 ß 196 ep ØO2 Nota estamos usando a distribuição normal porque supomos por conveniência que æ2 seja conhecida Daí o uso de 196 o fator de confiança de 95 para distribuição normal Os erros padrão correspondentes aos diversos valores r23 são obtidos na Tabela 101 ECONOBOOKParte02indb 339 23112010 071759 340 Parte Um Modelos de regressão com equação única A regressão 1056 mostra que nenhum dos coeficientes de regressão é individualmente significa tivo aos níveis convencionais de 1 ou 5 de significância embora ØO2 seja significativo ao nível de 10 com base em um teste t unicaudal Agora considere a Tabela 104 A única diferença entre as Tabelas 103 e 104 é que o terceiro e o quarto valores de X3 foram trocados Usando os dados da Tabela 104 agora obtemos 1057 Como resultado de uma ligeira alteração nos dados vemos que ØO2 que era estatisticamente signi ficativo ao nível de 10 de significância deixou de sêlo até em termos de nível Note ainda que na Equação 1056 a cov ØO2 ØO3 D 000868 enquanto na Equação 1057 ela é de 00282 mais de três vezes maior Todas essas alterações podem ser atribuídas a um aumento na multicolinearidade em 1056 r23 D 05523 enquanto em 1057 é 08285 Da mesma forma os erros padrão de ØO2 e ØO3 aumentam entre as duas regressões um sintoma comum de colinearidade Observamos anteriormente que na presença de alta colinearidade não podemos estimar os coefi cientes de regressão individuais com precisão mas que combinações lineares desses coeficientes podem ser estimadas com maior precisão Esse fato pode ser validado por meio das regressões 1056 e 1057 Na primeira delas a soma dos dois coeficientes angulares parciais é 04493 e na segunda é 04284 praticamente o mesmo Não só isso seus erros padrão também são praticamente os mesmos 01550 em um caso e 01823 no outro14 Note no entanto que o coeficiente de X3 mudou radicalmente de 0003 para 0027 Consequências da micronumerosidade Em uma paródia das consequências da multicolinearidade e com certa ironia Goldberger cita consequências semelhantes da micronumerosidade ou seja análise baseada em uma amostra de tama nho pequeno15 O leitor é aconselhado a ler a análise de Goldberger para entender por que ele conside ra a micronumerosidade importante como multicolinearidade 14 esses erros padrão são obtidos da fórmula Note que uma colinearidade crescente aumenta as variâncias de ØO2 e ØO3 mas essas variâncias podem ser com pensadas se houver alta covariância negativa entre as duas como indicam nossos resultados 15 GOlDBerGer op cit p 248250 Tabela 103 Dados hipotéticos em Y X2 e X3 Tabela 104 Dados hipotéticos em Y X2 e X3 ECONOBOOKParte02indb 340 23112010 071800 Capítulo 10 Multicolinearidade o que acontece se os regressores estiverem correlacionados 341 106 Um exemplo ilustrativo exeMplO 101 Gastos de consumo em relação à renda e à riqueza Para ilustrar os vários pontos destacados até aqui consideremos o exemplo de consumo renda da introdução a tabela 105 contém dados hipotéticos sobre consumo renda e ri queza Se pressupormos que os gastos de consumo estejam linearmente relacionados à renda e à riqueza então da tabela 105 obteremos a seguinte regressão 1061 Tabela 105 Dados hipotéticos sobre gastos de consumo Y renda X2 e riqueza X3 Tabela 106 Tabela ANOVA para o exemplo de consumorenda riqueza a regressão 1061 mostra que renda e riqueza juntas explicam cerca de 96 da varia ção na despesa de consumo e nenhum dos coeficientes angulares é individualmente esta tisticamente significativo além disso a variável riqueza não só é estatisticamente insignificante mas também tem o sinal errado A priori podese esperar uma relação positiva entre consumo e riqueza embora ØO2 e ØO3 sejam individualmente insignificantes do ponto de vista estatístico se testarmos a hipótese de que Ø2 D Ø3 D 0 simultaneamente essa hipótese poderá ser rejeitada como mostra a tabela 106 Sob o pressuposto usual obtemos 1062 esse valor de F obviamente é altamente significativo É interessante examinar esse resultado geometricamente Veja a Figura 103 Com base na regressão 1061 estabelecemos intervalos de confiança individuais com 95 de proba bilidade para Ø2 e Ø3 seguindo o procedimento usual discutido no Capítulo 8 Como mos tram esses intervalos cada um deles inclui o valor de zero Individualmente podemos aceitar a hipótese de que os dois coeficientes angulares parciais são zero mas quando estabelece mos o intervalo de confiança conjunto para testar a hipótese de que Ø2 D Ø3 D 0 esta não pode ser aceita já que o intervalo de confiança conjunto que na realidade é uma elipse não inclui a origem16 Como já ressaltamos quando a colinearidade é alta os testes dos re gressores individuais não são confiáveis em tais casos é o teste F geral que indicará se Y está relacionado aos vários regressores Continua 16 Como observado na Seção 53 o intervalo de confiança conjunto é bastante complicado O leitor interessado pode consultar a referência citada naquele capítulo ECONOBOOKParte02indb 341 23112010 071802 342 Parte Um Modelos de regressão com equação única exeMplO 101 Continuação Nosso exemplo mostra claramente o que a multicolinearidade faz O fato de o teste F ser significativo mas os valores t de X2 e X3 serem individualmente insignificantes significa que as duas variáveis estão tão correlacionadas que é impossível identificar o impacto individual da renda ou da riqueza sobre o consumo Naturalmente se fizermos a regressão de X3 contra X2 obteremos 1063 o que mostra que há uma colinearidade quase perfeita entre X3 e X2 agora vejamos o que acontece se fizermos a regressão de Y contra X2 apenas 1064 Na equação 1061 a variável renda era estatisticamente insignificante mas agora ela é altamente significativa Se em vez de fazer a regressão de Y contra X2 efetuarmos a regressão contra X3 obteremos 1065 Figura 103 Intervalos de confiança individuais para Ø2 e Ø3 e intervalo de confiança conjunto elipse para Ø2 e Ø3 β3 2 β 0 01484 1004 2887 02332 Intervalo de confiança de 95 para Intervalo de confiança conjunto de 95 para e Intervalo de confiança de 95 para β3 β3 2 β 2 β Vemos que a riqueza agora tem um impacto significativo na despesa de consumo enquanto na equação 1061 não tinha efeito as regressões 1064 e 1065 mostram claramente que em situações de extrema mul ticolinearidade excluir a variável altamente colinear com frequência tornará a outra variável X estatisticamente significativa esse resultado sugere que uma forma de escapar da extrema colinearidade é excluir a variável colinear mas falaremos mais a respeito na Seção 108 ECONOBOOKParte02indb 342 23112010 071803 Capítulo 10 Multicolinearidade o que acontece se os regressores estiverem correlacionados 343 exeMplO 102 Função consumo para os Estados Unidos 1947 2000 agora vamos considerar um conjunto concreto de dados sobre gastos reais de consumo C renda pessoal real disponível Yd riqueza real W e taxa de juros real i para os estados Unidos no período de 19472000 Os dados brutos são apresentadados na tabela 107 Tabela 107 Despesa de consumo nos Estados Unidos para o período de 19472000 Fonte veja a Tabela 712 Continua ECONOBOOKParte02indb 343 23112010 071803 344 Parte Um Modelos de regressão com equação única exeMplO 102 Continuação Tabela 107 Continuação Usamos o seguinte modelo para análise 1066 em que ln representa logaritmo Nesse modelo os coeficientes Ø2 e Ø3 dão as elasticidades de renda e riqueza respectiva mente por quê e Ø4 a semielasticidade por quê Os resultados da regressão 1066 são apresentados na tabela a seguir Os resultados mostram que todos os coeficientes estimados são altamente significativos do ponto de vista estatístico pois seus valores p são extremamente pequenos Os coeficientes estimados são interpretados como segue a elasticidade da renda é º 080 sugerindo que mantendo as outras variáveis constantes se a renda sobe em 1 os gastos médios de con sumo sobem cerca de 08 O coeficiente de riqueza é º 020 o que significa que se a ri queza sobe em 1 o consumo médio sobe apenas 02 novamente mantendose as demais variáveis constantes O coeficiente da variável taxa de juros diz que quando esta sobe em um ponto percentual a despesa de consumo cai em 026 ceteris paribus todos os regressores têm sinais que atendem às expectativas anteriores isto é renda e rique za têm ambas um impacto positivo no consumo mas a taxa de juros tem impacto negativo Continua ECONOBOOKParte02indb 344 23112010 071804 Capítulo 10 Multicolinearidade o que acontece se os regressores estiverem correlacionados 345 exeMplO 102 Continuação temos de nos preocupar com o problema da multicolinearidade neste caso aparente mente não porque todos os coeficientes têm os sinais certos cada coeficiente sendo indivi dualmente significativo do ponto de vista estatístico e o valor de F também é altamente significativo do ponto de vista estatístico sugerindo que coletivamente todas as variáveis têm um impacto significativo na despesa de consumo O valor R2 também é bem alto evidentemente em geral há certo grau de colinearidade entre as variáveis econômicas Contanto que ele não seja exato ainda podemos estimar os parâmetros do modelo Por ora tudo o que podemos dizer é que neste exemplo a colinearidade se houver não parece ser tão acentuada mas na Seção 107 forneceremos testes diagnósticos para detectar a colinea ridade e reexaminar a função consumo nos estados Unidos a fim de determinar se ela é afetada pelo problema da colinearidade 107 Detecção da multicolinearidade Tendo estudado a natureza e as consequências da multicolinearidade a pergunta natural é como saber se a colinearidade está presente em qualquer situação dada principalmente em modelos envol vendo mais de duas variáveis explanatórias Aqui convém relembrar a advertência de Kmenta 1 A multicolinearidade é uma questão de grau e não de tipo A distinção significativa não é entre a presença e a ausência de multicolinearidade mas entre seus vários graus 2 Uma vez que a multicolinearidade referese à condição das variáveis explanatórias que se supõe não serem estocásticas ela é uma característica da amostra e não da população Portanto não fazemos testes para multicolinearidade mas se quisermos medimos seu grau em qualquer amostra específica16 Uma vez que a multicolinearidade é essencialmente um fenômeno amostral decorrente de grande quantidade de dados não experimentais coletados basicamente em ciências sociais não temos um método único para detectála ou para medir sua força O que temos são regras práticas algumas in formais e outras formais mas ainda assim regras práticas Consideremos algumas delas 1 R2 alto mas poucas razões t significativas Como notado este é o sintoma clássico da mul ticolinearidade Se R2 for alto por exemplo superior a 08 o teste F na maioria dos casos rejeitará a hipótese de que os coeficientes angulares parciais são simultaneamente iguais a zero mas os testes t individuais mostrarão que nenhum dos coeficientes angulares parciais ou poucos deles são estatisti camente diferentes de zero Esse fato foi demonstrado claramente por nosso exemplo de consumo rendariqueza Embora esse diagnóstico seja sensato sua desvantagem está no fato de ser forte demais no sen tido de que a multicolinearidade é considerada prejudicial somente quando todas as influências das variáveis explanatórias sobre Y não puderem ser distintas17 2 Altas correlações entre pares de regressores Outra regra sugerida é que se o coeficiente de correlação entre dois regressores for alto por exempo maior que 08 a multicolinearidade será um problema sério O problema desse critério é que embora altas correlações de ordem zero possam sugerir colinearidade não é necessário que sejam altas para que exista colinearidade em qualquer caso específico De um modo mais técnico dizemos que altas correlações de ordem zero são condi ção suficiente mas não necessária para a existência da multicolinearidade porque ela pode existir embora as correlações de ordem zero ou simples sejam comparativamente baixas por exemplo menores que 050 Para entender essa relação suponhamos o modelo de quatro variáveis 16 KmeNta Jan Elements of econometrics 2 ed Nova York macmillan 1986 p 431 17 ibid p 439 ECONOBOOKParte02indb 345 23112010 071805 346 Parte Um Modelos de regressão com equação única e imaginemos que em que 2 e 3 são constantes e não ambas iguais a zero Obviamente X4 é uma combinação linear exata de X2 e X3 dando R 2 42 3 D 1 o coeficiente de determinação na regressão de X4 sobre X2 e X3 Considerando a fórmula 7115 do Capítulo 7 podemos escrever 1071 Mas já que R 2 42 3 D 1 devido à colinearidade perfeita obtemos 1072 Não é difícil entender que a Equação 1072 é satisfeita por r4 2 D 05 r4 3 D 05 e r2 3 D 05 que não são valores muito altos Em modelos que envolvam mais de duas variáveis explanatórias a correlação simples ou de or dem zero não fornecerá uma orientação infalível para a presença de multicolinearidade Evidente mente se houver apenas duas variáveis explanatórias as correlações de ordem zero serão suficientes 3 Exame de correlações parciais Devido ao problema de contarse com correlações de ordem zero Farrar e Glauber sugeriram que se devem examinar os coeficientes de correlação parcial18 As sim na regressão de Y sobre X2 X3 e X4 um resultado em que r 2 12 3 4 é muito elevado mas r 2 123 4 r 2 132 4 e r 2 142 3 são comparativamente baixos pode sugerir que as variáveis X2 X3 e X4 são estreita mente intercorrelacionadas e que pelo menos uma dessas variáveis é supérflua Embora um estudo das correlações parciais possa ser útil não há garantia de que elas fornecerão uma orientação infalível à multicolinearidade pois pode acontecer que tanto R2 quanto as correlações parciais sejam suficientemente altas Mas o mais importante é que o teste de correlação parcial de FarrarGlauber conforme mostrou C Robert Wichers19 é ineficaz uma vez que uma dada correlação parcial pode ser compatível com diferentes padrões de multicolinearidade O teste de FarrarGlauber também foi severa mente criticado por T Krishna Kumar20 e por John OHagan e Brendam McCabe21 4 Regressões auxiliares Uma vez que a multicolinearidade surge porque um ou mais regresso res são combinações lineares aproximadas ou exatas dos outros regressores uma forma de descobrir qual variável X está relacionada a outras variáveis X é fazer a regressão de cada Xi contra as demais variáveis X e calcular o R2 correspondente que designamos como R 2 i cada uma dessas regressões é chamada regressão auxiliar auxiliar em relação à principal regressão de Y contra os X Seguindo a relação entre F e R2 estabelecida na Equação 8411 a variável 1073 segue a distribuição F com k 2 e n k C 1 graus de liberdade Na Equação 1073 n representa o tamanho da amostra k representa o número de variáveis explanatórias que incluem o termo do inter 18 Farrar D e GlaUBer r r multicolinearity in regression analysis the problem revisited Review of Economics and Statistics v 49 p 92107 19 the detection of multicolinearity a comment Review of Economics and Statistics 1975 v 57 p 365366 20 multicolinearity in regression analysis Review of Economics and Statistics 1975 v 57 p 366368 21 tests for the severity of multicolinearity in regression analysis a comment Review of Economics and Statistics 1975 v 57 p 368370 ECONOBOOKParte02indb 346 23112010 071806 Capítulo 10 Multicolinearidade o que acontece se os regressores estiverem correlacionados 347 cepto e R 2 xi x2x3 xk é o coeficiente de determinação na regressão da variável Xi contra as variáveis X remanescentes22 Se o F calculado excede o Fi crítico no nível de significância escolhido considerase que o Xi é colinear com os outros X se não exceder o Fi crítico diremos que não é colinear aos outros X e nes te caso mantemos a variável no modelo Se Fi for estatisticamente significativo ainda teremos de decidir se o Xi em questão deve ser excluído do modelo Essa questão será retomada na Seção 108 Mas este método tem suas desvantagens pois se a multicolinearidade envolve apenas algumas variáveis de modo que as regressões auxiliares não demonstrem multicolinearidade extensa os coeficientes estimados podem revelar a natureza da depen dência linear entre os regressores Infelizmente se há várias associações lineares complexas esse exer cício de ajustamento de curvas pode não ter muito valor pois será difícil identificar as interrelações isoladas23 Em vez de testar formalmente os valores auxiliares de R2 podemos adotar a regra prática de Klein que sugere que a multicolinearidade só será um problema complicado se o R2 obtido de uma regressão auxiliar for maior que o R2 geral aquele obtido da regressão de Y contra todos os regresso res24 Obviamente como todas as demais regras práticas esta deve ser usada com critério 5 Autovalores e índice condicional De EViews e Stata podemos encontrar autovalores e o índice condicional para diagnosticar a multicolinearidade Não discutiremos os autovalores aqui pois nos faria entrar em tópicos de álgebra matricial que estão além do escopo deste livro Desses autova lores no entanto podemos derivar o que é conhecido como o número condicional k definido como e o índice condicional IC definido como Então temos esta regra prática se k está entre 100 e 1000 há multicolinearidade de moderada a forte e se for maior que 1000 haverá multicolinearidade grave Por outro lado se o es tiver entre 10 e 30 a multicolinearidade será de moderada a forte e se for maior que 30 será grave No exemplo do Apêndice 7A5 o menor autovalor é 3786 e o maior é 1875269 em que k D 18752693786 ou aproximadamente 4953 Portanto Tanto k quanto IC sugerem que não temos um problema grave de colinearidade Note que um autovalor baixo em relação ao autovalor máximo em geral indica dependências quase lineares nos dados Alguns autores acreditam que o índice condicional é o melhor diagnóstico disponível da multico linearidade mas essa opinião não é geral Para nós o IC é apenas uma regra talvez um pouco mais sofisticada Mas para maiores detalhes o leitor pode consultar as referências25 6 Tolerância e fator de inflação da variância Já introduzimos TOL e FIV Quando R 2 j o coefi ciente de determinação na regressão do regressor Xj contra os regressores remanescentes no modelo aumenta no sentido da unidade isto é quando a colinearidade de Xj com os outros regressores au menta FIV também aumenta e no limite pode ser infinito 22 Por exemplo R2 x2 pode ser obtido efetuandose a regressão de X2i como se segue X2i D a1 C X3i C a4X4i C C akXki ui 23 JUDGe George G hill r Carter GriFFithS William e lüKePOhl helmut lee tsoungChao Introduction to the theory and practice of econometrics Nova York John Wiley Sons 1982 p 621 24 KleiN lawrence r An introduction to econometrics englewood Cliffs NJ Prenticehall 1962 p 101 25 Veja especialmente BelSleY D a KUh e WelSCh r e Regression diagnostics identifying influential data and sources of collinearity Nova York John Wiley Sons 1980 cap 3 este não é um livro para iniciantes ECONOBOOKParte02indb 347 23112010 071807 348 Parte Um Modelos de regressão com equação única Alguns autores portanto usam o FIV como indicador de multicolinearidade Quanto maior for o valor de FIVj mais problemática ou colinear será a variável Xj Como regra prática se o FIVj de uma variável for maior que 10 o que acontecerá se R 2 j for maior que 090 essa variável será tida como altamente colinear26 Obviamente TOLj poderia ser usado como medida de multicolinearidade tendo em vista a conexão estreita com FIVj Quanto mais próximo TOLj for de zero maior o grau de colinearidade daquela variável com os outros regressores Por outro lado quanto mais próximo TOLj for de 1 maior a evi dência de que Xj não é colinear com os outros regressores Há quem critique o FIV ou tolerância como medida de colinearidade Como mostra a Equação 1054 a var ØOj depende de três fatores æ2 e FIVj Um FIV alto pode ser compensado por um æ2 baixo ou um alto Em outras palavras um FIV alto não é necessário nem suficiente para obter variâncias e erros padrão altos Portanto a alta multicolinearidade medida por um FIV alto pode não necessariamente causar erros padrão altos Durante toda essa discussão os termos alto e baixo são usados no sentido relativo 7 Diagrama de dispersão É uma boa prática usar um diagrama de dispersão para verificar como as diversas variáveis estão relacionadas em um modelo de regressão A Figura 104 apresenta o dia grama de dispersão para o exemplo de consumo discutido na seção anterior Exemplo 102 Esse é um diagrama com quatro por quatro campos porque temos quatro variáveis no modelo uma variável dependente C e as variáveis explanatórias renda pessoal disponível Yd riqueza real W e taxa de juros real I Primeiro considere a diagonal principal indo do canto esquerdo superior para o canto direito in ferior Não há pontos de dispersão nesses campos situados sobre a diagonal principal Se houvesse teriam um coeficiente de correlação igual a 1 porque os pontos seriam de uma dada variável contra ela mesma Os campos fora da diagonal mostram intercorrelações entre as variáveis Tomemos por exemplo o campo da riqueza W Ele mostra que a riqueza e a renda estão altamente correlacionadas o coeficiente de correlação entre as duas é 097 mas não perfeitamente Se fossem perfeitamente correlacionadas isto é se tivessem um coeficiente de correlação de 1 não teríamos sido capazes de estimar a regressão 1066 porque teríamos uma relação linear exata entre riqueza e renda O dia grama de dispersão mostra que a taxa de juros não está altamente correlacionada com as outras três variáveis 26 Veja KleiNBaUm David G KUPPer lawrence l mUller Keith e Applied regression analysis and other multivariate methods 2 ed Boston mass PWSKent 1988 p 210 Figura 104 Diagrama de dispersão para os dados do Exemplo 102 40000 0 20000 2000 4000 6000 0 10 5 5 0 0 4000 2000 6000 0 C Yd W I 2000 4000 6000 10 5 0 5 0 4000 2000 6000 40000 20000 0 ECONOBOOKParte02indb 348 23112010 071808 Capítulo 10 Multicolinearidade o que acontece se os regressores estiverem correlacionados 349 Uma vez que a função do diagrama de dispersão agora é incluída em vários programas de estatís tica esse diagnóstico deveria ser considerado com os discutidos anteriormente Mas lembrese de que correlações simples entre pares de variáveis podem não ser um indicador definitivo de colinearidade como indicado anteriormente Para concluirmos nossa discussão sobre como detectar a multicolinearidade ressaltamos que os vários métodos que discutimos têm essencialmente uma natureza de pescarias pois não podem dizer qual desses métodos funcionará em determinada aplicação Aliás não se pode fazer muito a respeito pois a multicolinearidade é específica a determinada amostra sobre a qual o pesquisador pode não ter muito controle principalmente se os dados forem de natureza não experimental que é a sina dos pesquisadores no campo das ciências sociais Novamente como paródia da multicolinearidade Goldberger cita inúmeras formas de detectar a micronumerosidade como desenvolver valores críticos do tamanho da amostra n de tal modo que a micronumerosidade só será um problema se o tamanho real da amostra n for menor que n A paródia de Goldberger tem o objetivo de enfatizar que amostras pequenas e a falta de variabilidade nas variáveis explanatórias podem causar problemas que são pelo menos tão sérios quanto aqueles devidos à multicolinearidade 108 Medidas corretivas O que podemos fazer se a multicolinearidade for grave Temos duas opções 1 não fazer nada ou 2 seguir alguns procedimentos Não fazer nada A escola do deixa pra lá é expressa por Blanchard como se segue27 Quando estudantes calculam sua primeira regressão dos mínimos quadrados ordinários MQO em geral o primeiro problema que encontram é o da multicolinearidade Muitos deles concluem que há algo erra do no MQO alguns recorrem a técnicas novas e frequentemente criativas de resolver o problema Mas dizemos a eles isso é um erro A multicolinearidade é da vontade divina algo foge ao nosso controle e não um problema com os MQO ou com uma técnica estatística de modo geral O que Blanchard está dizendo é que a multicolinearidade é essencialmente um problema de defi ciência de dados de novo a micronumerosidade e às vezes não temos escolha sobre os dados dis poníveis para análise empírica Também não podemos dizer que todos os coeficientes em um modelo de regressão sejam estatis ticamente insignificantes Além disso mesmo que não possamos estimar um ou mais coeficientes de regressão com maior precisão uma combinação linear deles função estimável pode ser estimada com relativa eficiência Como vimos na Equação 1023 é possível estimar Æ de modo único mes mo que não estimemos seus dois componentes individualmente Às vezes é o melhor que podemos fazer com um dado conjunto de dados28 procedimentos Podemos tentar seguir as regras práticas para resolver o problema da multicolinearidade o suces so dependerá da gravidade do problema de colinearidade 1 Uma informação a priori Suponha que o modelo 27 BlaNCharD O J Comment Journal of Business and Economics Statistics v 5 p 449451 1967 28 Para uma discussão interessante sobre isso veja CONiSK J When collinearity is desirable Western Economic Journal v 9 p 393407 1971 ECONOBOOKParte02indb 349 23112010 071809 350 Parte Um Modelos de regressão com equação única esteja sendo considerado em que Y D consumo X2 D renda e X3 D riqueza Como observado anterior mente as variáveis de renda e riqueza tendem a ser altamente colineares Mas suponha a priori que acreditemos que Ø3 D 010Ø2 isto é a taxa de variação do consumo com relação à riqueza é de um décimo da taxa correspondente com respeito à renda Podemos então efetuar a seguinte regressão em que Xi D X2i C 01 X3i Após obtermos ØO2 podemos estimar ØO3 da relação postulada entre Ø2 e Ø3 Como obtemos uma informação a priori Ela poderia vir de trabalho empírico feito anteriormen te em que o problema da colinearidade é menos grave ou da teoria relevante de nossa área de estudo Por exemplo na função de produção do tipo CobbDouglas 791 se esperarmos retornos constan tes de escala então Ø2 C Ø3 D 1 e nesse caso poderíamos efetuar a regressão 8614 fazendo a regressão da razão produçãotrabalho contra a razão capitaltrabalho Se houver colinearidade entre trabalho e capital como em geral é o caso na maioria dos dados de amostra tal transformação pode reduzir ou eliminar o problema de colinearidade Mas cabe uma advertência a respeito de impor essas restrições a priori uma vez que em geral desejaremos testar as previsões a priori da teoria eco nômica e não apenas as impor a dados para os quais podem não ser verdadeiras29 Entretanto sabe mos da Seção 86 como testar a validade de tais restrições explicitamente 2 Combinando dados de corte transversal e de séries temporais Uma variante da técnica de in formações externas ou a priori é a combinação de dados Suponha que desejemos estudar a demanda por automóveis nos Estados Unidos e pressupomos que tenhamos dados de uma série temporal do número de carros vendidos do preço médio do carro e da renda do consumidor Suponha também que R em que Y D número de carros vendidos P D preço médio R D renda e t D tempo Nosso objetivo é estimar a elasticidade preço Ø2 e a elasticidade renda Ø3 Em séries temporais as variáveis preço e renda em geral tendem a ser altamente colineares Se efetuarmos a regressão anterior enfrentaremos o problema usual da multicolinearidade Uma forma de evitarmos isso tem sido sugerida por Tobin30 Ele diz que se temos dados de corte transversal por exemplo dados gerados por pesquisa de consumo ou por estudos de orçamentos familiares conduzi dos por instituições privadas ou públicas podemos chegar a uma estimativa bastante confiável da elasticidade renda Ø3 porque nesses dados coletados em um ponto no tempo os preços não variam muito Seja ØO3 a elasticidade renda estimada por corte transversal Usando essa estimativa podemos escrever a regressão de série temporal anterior como em que Y D In Y ØO3 ln R isto é Y representa o valor de Y depois de removermos o efeito renda Agora podemos obter uma estimativa da elasticidade preço Ø2 por meio da regressão anterior Embora seja uma técnica interessante a combinação de dados de séries temporais e de corte trans versal que acabamos de sugerir pode criar problemas de interpretação porque estamos supondo impli citamente que a elasticidade renda estimada por corte transversal seja a mesma que a obtida de uma análise de série temporal pura31 Não obstante a técnica tem sido usada em várias aplicações e merece ser considerada em situações em que as estimativas por corte transversal não variem substancialmente de um corte transversal para outro Um exemplo dessa técnica é fornecido no Exercício 1026 29 SteWart mark B WalliS Kenneth F Introductory econometrics 2 ed Nova York John Wiley Sons a halstead Press Book 1981 p 154 30 tOBiN J a statistical demand function for food in the USa Journal of the Royal Statistical Society Ser a 1950 p 113114 31 Para uma discussão completa e aplicação da técnica da combinação veja KUh edwin Capital stock growth a microeconometric approach amsterdã Northholland Publishing Company 1963 cap 5 e 6 ECONOBOOKParte02indb 350 23112010 071810 Capítulo 10 Multicolinearidade o que acontece se os regressores estiverem correlacionados 351 3 Exclusão de variávelis e viés de especificação Quando nos deparamos com uma multicoli nearidade grave uma das coisas mais simples a fazer é excluir uma das variáveis colineares Assim em nossa ilustração de consumorendariqueza quando excluímos a variável riqueza obtemos a re gressão 1064 que mostra que enquanto no modelo original a variável renda era estatisticamente insignificante ela agora é altamente significativa Mas ao excluirmos uma variável do modelo podemos cometer um viés de especificação ou erro de especificação Este surge de uma especificação incorreta do modelo usado na análise Se a teoria econômica informa que a renda e a riqueza deveriam ambas ser incluídas no modelo que explica gastos de consumo excluir a variável riqueza constituiria viés de especificação Discutiremos o assunto no Capítulo 13 mas já tratamos rapidamente dele na Seção 77 Se por exemplo o verdadeiro modelo é mas ajustamos equivocadamente o modelo 1081 podese mostrar que veja o Apêndice 13A1 1082 em que b32 D coeficiente angular na regressão de X3 contra X2 Portanto é obvio da Equação 1082 que b12 será uma estimativa viesada de Ø2 enquanto b3 2 for diferente de zero supõese que Ø3 seja diferente de zero caso contrário não há sentido em incluir X3 no modelo original32 Evidentemente se b32 for zero não teremos problema de multicolinearidade Também fica claro da Equação 1082 que se b3 2 e Ø3 forem positivos ou ambos forem negativos Eb1 2 será maior que Ø2 daí em média b12 superestimará Ø2 provocando um viés positivo De modo semelhante se o produto b3 2 Ø3 for negativo em média b12 subestimará Ø2 causando um viés negativo Da discussão anterior fica claro que excluir uma variável do modelo para atenuar o problema de multicolinearidade pode levar ao viés de especificação Logo em algumas situações o remédio pode ser pior que a doença porque enquanto a multicolinearidade pode impedir a estimação exata dos parâmetros do modelo omitir uma variável pode causar sérios equívocos quanto aos verdadeiros valores dos parâmetros Lembrese de que os estimadores de MQO são MELNT apesar da quase colinearidade 4 Transformação de variáveis Suponha uma série temporal sobre gastos de consumo renda e riqueza Uma razão para a alta multicolinearidade entre renda e riqueza em tais dados é que com o tempo ambas as variáveis tendem a moverse na mesma direção Uma forma de minimizar essa de pendência é proceder da maneira a seguir Se a relação 1083 for válida no tempo t ela também o será no tempo t 1 porque a origem do tempo é arbitrária de qualquer maneira Portanto temos 1084 Se subtrairmos a Equação 1084 da Equação 1083 obtemos 1085 em que vt ut ut1 A Equação 1085 é conhecida como forma de primeira diferença porque não efetuamos a regressão com as variáveis originais mas com as diferenças de valores sucessivos das variáveis 32 Note ainda que se b32 não se aproxima de zero quando o tamanho da amostra está aumentando indefinida mente então b12 será não só tendencioso mas inconsistente ECONOBOOKParte02indb 351 23112010 071811 352 Parte Um Modelos de regressão com equação única A regressão de primeira diferença frequentemente reduz a gravidade da multicolinearidade por que embora os níveis de X2 e X3 possam ser altamente correlacionados não há a priori razão para acreditar que suas diferenças também estarão altamente correlacionadas Como veremos nos capítulos sobre econometria de séries temporais uma vantagem secundária da transformação de primeira diferença é que ela pode tornar estacionária uma série temporal não es tacionária Nesses capítulos veremos a importância de séries temporais estacionárias Como observado no Capítulo 1 falando em termos não exatos uma série temporal por exemplo Yt é estacionária se sua média e sua variância não mudam sistematicamente ao longo do tempo Outra transformação muito usada na prática é a transformação proporcional Considere o modelo 1086 em que Y é a despesa de consumo em X2 é o PIB e X3 é a população total Uma vez que o PIB e a população crescem ao longo do tempo é provável que estejam correlacionados Uma solução para esse problema é expressar o modelo em base per capita isto é dividindo a Equação 1084 por X3 para obter 1087 Essa transformação pode reduzir a colinearidade nas variáveis originais Mas a transformação de primeira diferença ou a proporcional não estão isentas de problemas Por exemplo o termo de erro vt na Equação 1085 pode não satisfazer uma das hipóteses do modelo clássico de regressão linear a de que não há correlação serial entre os termos de erro Como veremos no Capítulo 12 se o termo de erro original ut não registrar correlação serial o termo de erro vt obtido anteriormente não estará correlacionado serialmente na maioria dos casos Portanto o remédio pode ser pior que a doença Além disso há perda de uma observação devido ao procedimento de tomar a diferença e portanto os graus de liberdade são reduzidos em uma unidade Em uma amostra peque na este poderia ser um fator que se desejaria pelo menos levar em consideração Além disso o pro cedimento de primeira diferença pode não ser adequado a dados de corte transversal já que não há um ordenamento lógico das observações De modo semelhante no modelo proporcional 1087 o termo de erro será heterocedástico se o termo de erro original ut for homocedástico como veremos no Capítulo 11 Novamente o remédio pode piorar a doença a colinearidade Em resumo devese ter cautela em usar o método da primeira diferença ou da transformação proporcional para resolver o problema da multicolinearidade 5 Dados adicionais ou novos Como a multicolinearidade é um aspecto da amostra é possível que em outra amostra envolvendo as mesmas variáveis a colinearidade possa não ser tão grave quanto na primeira Às vezes aumentar o tamanho da amostra se possível pode atenuar o problema da colinearidade Por exemplo no modelo de três variáveis vimos que Agora quando a amostra aumenta em geral aumentará Por quê Portanto para qualquer r23 dado a variância de ØO2 diminuirá diminuindo assim o erro padrão o que nos permitirá estimar Ø2 com mais precisão Como ilustração considere a seguinte regressão de gastos de consumo Y contra renda X2 e rique za X3 com base em 10 observações33 33 agradeço ao falecido albert Zucker por fornecer os resultados dados nas regressões a seguir ECONOBOOKParte02indb 352 23112010 071812 Capítulo 10 Multicolinearidade o que acontece se os regressores estiverem correlacionados 353 1088 O coeficiente de riqueza nessa regressão não só tem o sinal errado mas é estatisticamente insignificante ao nível de 5 Quando o tamanho da amostra aumentou para 40 observações micro numerosidade os seguintes resultados foram obtidos 1089 Agora o coeficiente de riqueza não só tem o sinal correto mas é estatisticamente significativo ao nível de 5 Nem sempre é fácil obter dados adicionais ou melhores pois como observam Judge et al Infelizmente os economistas raramente podem obter dados adicionais sem arcar com altos custos muito menos podem escolher os valores das variáveis explanatórias que desejam Além disso ao acrescentarmos novas variáveis em situações não controladas devemos ter ciência de que estamos adicionando observa ções geradas por um processo que não aquele associado aos dados originais isto é devemos ter certeza de que a estrutura econômica associada às novas observações é a mesma que a original34 6 Reduzindo a colinearidade em regressões polinomiais Na Seção 710 discutimos modelos de regressão polinomial Um aspecto especial desses modelos é que a variável explanatória aparece com vários expoentes Na função cúbica de custo total envolvendo a regressão do custo total contra a produção a produção ao quadrado e a produção ao cubo como na Equação 7104 os vários ter mos de produção serão correlacionados dificultando a estimação precisa dos vários coeficientes an gulares35 No entanto na prática temse verificado que se as variávelis explanatórias são expressas na forma de desvios desvios em relação à média a multicolinearidade reduzse substan cialmente Mesmo assim o problema pode persistir36 caso em que se pode querer considerar técnicas como os polinômios ortogonais37 7 Outros métodos de remediar a multicolinearidade Técnicas estatísticas multivariadas como a análise de fator e componentes principais ou técnicas como a regressão ridge são empregadas com frequência para resolver o problema da multicolinaridade Infelizmente estão além do escopo deste livro pois não podem ser discutidas com competência sem recorrermos à álgebra matricial38 109 A multicolinearidade é um mal necessário Talvez não se o objetivo for apenas a previsão Já foi dito que se o único propósito da análise de regressão for a previsão ou o prognóstico a mul ticolinearidade não é um problema grave porque quanto mais alto for o R2 melhor a previsão39 Mas isso pode acontecer enquanto os valores das variáveis explanatórias para as quais se deseja fazer as previsões obedecerem às mesmas dependências lineares quase exatas que a matriz projetada X 34 JUDGe et al op cit p 625 Veja também a Seção 109 35 Como observado uma vez que a relação entre X X2 e X3 é não linear as regressões polinomiais não violam a hipótese de ausência de multicolinearidade do modelo clássico falando em termos estritos 36 Veja BraDleY r a SriVaStaVa S S Correlation and polynomial regression American Statistician v 33 p 1114 1979 37 Veja DraPer Norman Smith harry Applied regression analysis 2 ed Nova York John Wiley Sons 1981 p 266274 38 essas técnicas são abordadas de um ponto de vista aplicado em ChatterJee Samprit PriCe Bertram Regression analysis by example Nova York John Wiley Sons 1977 Cap 7 e 8 Veja também ViNOD h D a survey of ridge regression and related techniques for improvements over ordinary least squares Review of Economics and Statistics v 60 p 121131 fev 1978 39 Veja GearY r C Some results about relations between stochastic variables a discussion document Review of International Statistical Institute v 31 p 163181 1963 ECONOBOOKParte02indb 353 23112010 071813 354 Parte Um Modelos de regressão com equação única de dados original 40 Assim se em uma regressão estimada descobrirse que X2 D 2X3 aproximada mente então em uma amostra futura usada para prever Y X2 também deverá ser aproximadamente igual a 2X3 uma condição difícil de atender na prática veja a nota de rodapé 35 caso em que a pre visão se tornará cada vez mais incerta41 Além disso se o objetivo da análise não for apenas a previsão mas também a estimação confiável dos parâmetros uma multicolinearidade acentuada será um proble ma porque vimos que isso leva a erros padrão maiores dos estimadores Em uma situação no entanto a multicolinearidade pode não impor um problema grave É o caso quando R2 for alto e os coeficientes de regressão individualmente significativos como revelado pelos valores t mais altos No entanto os diagnósticos de multicolinearidade por exemplo o índice condi cional indicam que há grave colinearidade nos dados Quando essa situação pode surgir Como obser va Johnston Isto pode ocorrer se os coeficientes individuais forem numericamente bem superiores ao verdadei ro valor de modo que o efeito ainda aparecerá apesar dos erros padrão inflados eou porque o verda deiro valor em si é tão grande que mesmo uma estimativa para baixo ainda se mostra significativa42 1010 Um exemplo ampliado os dados de Longley Concluímos este capítulo analisando os dados coletados por Longley43 Embora coletados origi nalmente para avaliar a exatidão computacional das estimativas dos mínimos quadrados em vários programas de computador os dados de Longley tornaramse o instrumento para ilustrar vários pro blemas econométricos inclusive a multicolinearidade Os dados são reproduzidos na Tabela 108 Eles são séries temporais para os anos de 19471962 e referemse a Y D número de pessoas empre gadas em milhares X1 D deflator implícito dos preços no PNB X2 D PNB em milhões de X3 D número de pessoas desempregadas em milhares X4 D número de pessoas nas forças armadas X5 população não institucionalizada com mais de 14 anos de idade e X6 D ano igual a 1 em 1947 2 em 1948 e 16 em 1962 40 JUDGe et al op cit p 619 Nesta página o leitor também encontrará a demonstração de por que apesar da colinearidade podese obter melhores previsões médias se a estrutura de colinearidade existente também continuar nas amostras futuras 41 Para uma excelente discussão veja maliNVaUD e Statistical methods of econometrics 2 ed amsterdã North holland Publishing Company 1970 p 220221 42 JOhNStON J Econometric methods 3 ed Nova York mcGrawhill 1984 p 249 43 lONGleY J an appraisal of leastsquares programs from the point of the user Journal of the American Statistical Association 1967 v 62 p 819841 Tabela 108 Dados de Longley Fonte LONGLEY J An appraisal of leastsquare programs from the point of user Journal of the American Statistical Association v 62 p 8198411967 Observação Y X1 X2 X3 X4 X5 Tempo 1947 60323 830 234289 2356 1590 107608 1 1948 61122 885 259426 2235 1456 108632 2 1949 60171 882 258054 3682 1616 109773 3 1950 61187 895 284599 3351 1650 110929 4 1951 63221 962 328975 2099 3099 112075 5 1952 63639 981 346999 1932 3594 113270 6 1953 64989 990 365385 1870 3547 115094 7 1954 63761 1000 363112 3578 3350 116219 8 1955 66019 1012 397469 2904 3048 117388 9 1956 67857 1046 419180 2822 2857 118734 10 1957 68169 1084 442769 2936 2798 120445 11 1958 66513 1108 444546 4681 2637 121950 12 1959 68655 1126 482704 3813 2552 123366 13 1960 69564 1142 502601 3931 2514 125368 14 1961 69331 1157 518173 4806 2572 127852 15 1962 70551 1169 554894 4007 2827 130081 16 ECONOBOOKParte02indb 354 23112010 071813 Capítulo 10 Multicolinearidade o que acontece se os regressores estiverem correlacionados 355 Suponha que nosso objetivo seja prever Y com base nas seis variáveis X Usando EViews6 obte mos os seguintes resultados de regressão Um exame rápido desses resultados sugeriria que temos o problema de colinearidade pois o valor de R2 é muito alto mas algumas poucas variáveis são estatisticamente insignificantes X1 X2 e X5 um sintoma clássico de multicolinearidade Para melhor entendermos o assunto mostramos na Tabe la 109 as intercorrelações entre os seis regressores Esta tabela fornece o que é chamado de matriz de correlação As entradas na diagonal principal aquelas que vão do canto esquerdo superior para o canto direito inferior mostram a correlação de uma variável com ela mesma o que é sempre 1 por definição e as entradas fora da diagonal principal são as correlações entre pares de variáveis X Se você tomar a primeira linha desta tabela terá a cor relação de X1 com as outras variáveis X Por exemplo 0991589 é a correlação entre X1 e X2 0620633 é a correlação entre X1 e X3 e assim por diante Como se pode ver várias dessas correlações são muito altas sugerindo que pode haver um problema grave de colinearidade Obviamente não podemos esquecer a advertência apresentada anteriormente de que essas correlações entre pares de variáveis podem ser uma condição suficien te mas não necessária para a existência de multicolinearidade Para entendermos a natureza do problema da multicolinearidade efetuemos as regressões auxilia res que são as regressão de cada variáveis X contra as variáveis X remanescentes Para pouparmos espaço apresentaremos apenas os valores de R2 obtidos dessas regressões apresentados na Tabela 1010 Uma vez que os valores de R2 dessas regressões auxiliares são muito altos com a possível exceção da regressão de X4 nas variáveis X remanescentes parece que temos um grave problema de colinearidade A mesma informação é obtida dos fatores de tolerância Como notamos quanto mais próximo o fator de tolerância estiver de zero maior será a evidência de colinearidade Tabela 109 Intercorrelações ECONOBOOKParte02indb 355 23112010 071814 356 Parte Um Modelos de regressão com equação única Aplicando a regra prática de Klein vemos que os valores de R2 obtidos das regressões auxiliares excedem o valor do R2 geral aquele obtido na regressão de Y contra todas as variáveis X 09954 em 3 de 6 regressões auxiliares novamente sugerindo que de fato os dados de Longley são afetados pelo problema da multicolinearidade Por sinal aplicando o teste F dado na Equação 1073 o leitor deveria verificar se os valores de R2 dados nas tabelas precedentes são todos significativamente dife rentes de zero do ponto de vista estatístico Observamos que os estimadores de MQO e seus erros padrão são sensíveis a pequenas alterações nos dados No Exercício 1032 o leitor é solicitado a refazer a regressão de Y contra todas as seis variáveis X mas excluindo as últimas observações de dados ou seja efetuando a regressão para o período de 19471961 Você verá como os resultados da regressão mudam ao excluir as observações de apenas um ano Agora que constatamos um problema de multicolinearidade que ações corretivas podemos to mar Vamos reconsiderar nosso modelo original Antes de mais nada poderíamos expressar o PNB não em termos nominais mas em termos reais o que podemos fazer dividindo o PNB nominal pelo deflator implícito dos preços Em segundo lugar uma vez que a população não institucionalizada de mais de 14 anos aumenta ao longo do tempo devido ao crescimento populacional natural ela estará altamente correlacionada com o tempo a variável X6 de nosso modelo Em vez de mantermos ambas as variáveis manteremos a variável X5 e excluiremos X6 Em terceiro lugar não há razão contundente para incluir X3 o número de pessoas desempregadas talvez a taxa de desemprego tivesse sido uma medida melhor das condições do mercado de trabalho Mas não temos dados sobre elas Logo exclui remos a variável X3 Efetuando essas alterações obtemos os seguintes resultados de regressão PNBR D PNB real44 44 O coeficiente de correlação entre X5 e X6 é de aproximadamente 09939 uma correlação realmente muito alta Tabela 1010 Valores de R2 das regressões auxiliares ECONOBOOKParte02indb 356 23112010 071815 Capítulo 10 Multicolinearidade o que acontece se os regressores estiverem correlacionados 357 Embora o valor de R2 tenha declinado ligeiramente em comparação ao R2 original ainda é muito alto Agora todos os coeficientes estimados são significativos e os sinais dos coeficientes fazem sen tido do ponto de vista econômico Deixamos para o leitor a criação de modelos alternativos e ver como os resultados mudam Lem brese também da advertência feita sobre o uso do método de transformação proporcional dos dados para atenuar o problema da colinearidade Retomaremos essa questão no Capítulo 11 Resumo e conclusões 1 Uma das hipóteses do modelo clássico de regressão linear é que não há multicolinearidade entre as variáveis explanatórias os X Interpretada em sentido amplo a multicolinearidade referese à situação em que há uma relação linear exata ou aproximadamente exata entre as variáveis X 2 As consequências da multicolinearidade são as seguintes se existe colinearidade perfeita entre os X seus coeficientes de regressão são indeterminados e seus erros padrão não são definidos se a colinearidade for alta mas não perfeita a estimação dos coeficientes de regressão será possível mas seus erros padrão tendem a ser grandes Como resultado os valores populacionais dos coefi cientes não poderão ser estimados com precisão Entretanto se o objetivo for estimar combina ções lineares desses coeficientes as funções estimáveis podese fazer até mesmo na presença de multicolinearidade perfeita 3 Embora não haja métodos seguros para detectar a colinearidade há vários indicadores a O sinal mais claro de multicolinearidade é quando R2 é muito alto mas nenhum dos coefi cientes de regressão é estatisticamente significativo com base no teste t convencional Este é um caso extremo evidentemente b Em modelos envolvendo apenas duas variáveis explanatórias podese ter uma ideia boa da colinearidade examinandose o coeficiente de correlação simples ou de ordem zero entre as duas variáveis Se a correlação for alta em geral esta é atribuída à multicolinearidade c Entretanto os coeficientes de correlação de ordem zero podem ser enganosos em modelos que envolvem mais de duas variáveis X uma vez que é possível ter correlações baixas de ordem zero e no entanto encontrar alta multicolinearidade Em situações como essas pode ser preciso examinar os coeficientes de correlação parcial d Se R2 é alto mas as correlações parciais são baixas a multicolinearidade é uma possibilida de Nesse caso uma ou mais variáveis podem ser supérfluas Mas se R2 for alto e as corre lações parciais também a multicolinearidade pode não ser detectável imediatamente Além disso como C Robert Wichers Krishna Kumar John OHagan e Brendan McCabe ressalta ram há alguns problemas estatísticos com o teste de correlação parcial sugerido por Farrar e Glauber e Portanto podese efetuar a regressão de cada uma das variáveis Xi contra as variáveis X rema nescentes do modelo e descobrir os coeficientes de determinação correspondentes R2 i Um elevado R2 i sugere que Xi está estreitamente correlacionado com o restante dos X Assim pode mos excluir esse Xi do modelo contanto que ele não leve a um grave viés de especificação 4 Detectar a multicolinearidade é meio caminho andado A outra metade diz respeito a como se livrar do problema Novamente não há métodos seguros apenas algumas regras 1 usar infor mações externas ou obtidas a priori 2 combinar dados de corte transversal com séries tempo rais 3 omitir uma variável altamente colinear 4 transformar dados e 5 obter dados adicionais ou novos Obviamente qual dessas regras funcionará na prática dependerá da natureza dos dados e da gravidade do problema de colinearidade 5 Notamos o papel da multicolinearidade na previsão e ressaltamos que se a estrutura de colineari dade continuar na amostra futura será arriscado empregar para fins de previsão a regressão esti mada afetada pela multicolinearidade 6 Embora a multicolinearidade tenha recebido muita alguns diriam excessiva atenção na literatura específica um problema igualmente importante que ocorre na pesquisa empírica é a micronumerosi ECONOBOOKParte02indb 357 23112010 071815 358 Parte Um Modelos de regressão com equação única dade o pequeno tamanho da amostra De acordo com Goldberger ao ler um artigo de pesquisa que reclama da multicolinearidade o leitor deveria ver se as reclamações seriam convincentes se o termo multicolinearidade fosse substituído por micronumerosidade45 Ele sugere que o leitor decida quanto o n o número de observações é pequeno antes de considerar que se trata de um problema de amostra pequena e que verifique quanto o valor de R2 é alto em uma regressão auxiliar antes de afirmar que o problema da colinearidade é muito grave exerCíCiOS 101 No modelo de regressão linear com k variáveis há k equações normais para estimar as k incógnitas Essas equações normais são dadas no Apêndice C Imagine que Xk seja uma combinação linear perfeita das variáveis X restantes Como poderíamos mostrar que nesse caso é impossível esti mar os coeficientes de regressão k 102 Considere o conjunto de dados hipotéticos na Tabela 1011 Suponha que se queira ajustar o modelo aos dados a É possível estimar as três incógnitas Por quê b Em caso negativo quais funções lineares desses parâmetros as funções estimáveis você pode estimar Mostre os cálculos necessários 103 Retome o exemplo de mortalidade infantil discutido no Capítulo 8 Exemplo 81 O exemplo envolvia a regressão da taxa de mortalidade infantil CM contra o PNB per capita PNBpc e a taxa de alfabetização feminina FLR Imagine agora que seja incluída a variável taxa de fertilidade total TFR ao modelo Isto dá os seguintes resultados de regressão 45 GOlDBerGer op cit p 250 Tabela 1011 ECONOBOOKParte02indb 358 23112010 071816 Capítulo 10 Multicolinearidade o que acontece se os regressores estiverem correlacionados 359 a Compare esses resultados com os da Equação 814 Que mudanças você vê E como as explica b Vale a pena adicionar a variável TFR ao modelo Por quê c Uma vez que todos os coeficientes individuais t são estatisticamente significativos pode mos dizer que não temos um problema de colinearidade neste caso 104 Se a relação for verdadeira para todos os valores de 1 2 e 3 estime r1 23 r1 32 e r2 31 Obtenha também R2 12 3 R2 21 3 e R2 31 2 Qual o grau de multicolinea ridade nesta situação Nota R2 12 3 é o coeficiente de determinação na regressão de Y contra X2 e X3 Outros valores de R2 devem ser interpretados de modo semelhante 105 Considere o seguinte modelo em que Y D consumo X D renda e t D tempo O modelo anterior postula que a despesa de consumo no tempo t é uma função não só da renda no tempo t mas também da renda atra vés dos períodos anteriores Assim a despesa de consumo no primeiro trimestre de 2000 é uma função da renda naquele trimestre e no quarto trimestre de 1999 Tais modelos são chamados de modelos com defasagens distribuídas e serão examinados em um dos pró ximos capítulos a Você esperaria multicolinearidade em tais modelos e por quê b Se a colinearidade é esperada como você resolveria o problema 106 Considere o exemplo da Seção 106 Exemplo 101 Como conciliaria a diferença na pro pensão marginal ao consumo obtida das Equações 1061 e 1064 107 Nos dados envolvendo séries temporais econômicas como PNB oferta de moeda preços renda desemprego etc em geral suspeitase de multicolinearidade Por quê 108 Suponha o modelo em que r23 o coeficiente de correlação entre X2 e X3 seja zero Portanto alguém sugere que você faça as seguintes regressões a ÆO2 D ØO2 e O3 D ØO3 Por quê b ØO2 será igual a ÆO1 ou a O1 ou a alguma combinação deles c A var ØO2 D var ÆO2 e a var ØO3 D var O3 109 Retome o exemplo do Capítulo 7 em que ajustamos a função de produção CobbDouglas ao setor de manufatura de todos os 50 Estados e o Distrito de Colúmbia para 2005 Os resulta dos da regressão da Equação 794 mostram que tanto os coeficientes do trabalho quanto do capital são individualmente significativos do ponto de vista estatístico a Descubra se as variáveis do trabalho e do capital estão altamente correlacionadas b Se a sua resposta a a for afirmativa você excluiria a variável trabalho do modelo e faria a regressão da variável produção apenas contra a variável capital c Se você fizer isso que tipo de viés de especificação será cometido Descubra a natureza desse viés 1010 Retome o Exemplo 74 Para este problema a matriz de correlação é a seguinte Capítulo 10 Multicolinearidade o que acontece se os regressores estiverem correlacionados 359 ECONOBOOKParte02indb 359 23112010 071817 360 Parte Um Modelos de regressão com equação única a Uma vez que as correlações de ordem zero são muito altas deve haver multicolinearidade grave Comente b Você excluiria as variáveis X 2 i e X 3 i do modelo c Se as excluir o que acontecerá com o valor do coeficiente de Xi 1011 Regressão por etapas stepwise Ao decidir qual é o melhor conjunto de variáveis explana tórias para um modelo de regressão os pesquisadores seguem frequentemente o método de regressão por etapas Nesse modelo as variáveis X são introduzidas uma por vez stepwise forward regression ou todas as variáveis X possíveis são incluídas em uma regressão múltipla e em seguida rejeitadas uma a uma stepwise backward regression A decisão de acrescentar ou excluir uma variável em geral é tomada com base na contribuição daquela variável à soma dos quadrados explicados de acordo com o teste F De acordo com seus conhecimentos sobre multicolinearidade você recomendaria esse procedimento Justifique sua resposta46 1012 Informe justificando se as seguintes afirmações são verdadeiras falsas ou incertas a Apesar da multicolinearidade perfeita os estimadores de MQO são os melhores estima dores lineares não viesados b Em casos de alta multicolinearidade não é possível avaliar o significado individual de um ou mais coeficientes parciais de regressão c Se uma regressão auxiliar mostra que determinado R 2 i é alto há evidências incontestáveis de elevada colinearidade d As altas correlações de pares de variáveis não sugere que haja multicolinearidade e A multicolinearidade é inofensiva se o objetivo da análise for apenas de previsão f Ceteris paribus quanto mais alto for o FIV maior a variância dos estimadores de MQO g A tolerância TOL é uma medida melhor de multicolinearidade que o FIV h Não obteremos um valor alto de R2 em uma regressão múltipla se todos os coeficientes angulares parciais forem individualmente insignificantes do ponto de vista estatístico com base no teste t usual i Na regressão de Y contra X2 e X3 suponha que haja pouca variabilidade nos valores de X3 Isso aumentaria a var ØO3 No extremo se todos os X3 forem idênticos a var ØO3 será infinita 1013 a Mostre que se r1i D 0 para todo i D 2 3 k então R123 k D 0 b Qual a importância desse achado para a regressão da variável X1 D Y contra X2 X3 Xk 1014 Suponha que todos os coeficientes de correlação de ordem zero de X1D Y X2 Xk sejam iguais a r a Qual o valor de R2 123 k b Quais os valores dos coeficientes de correlação de primeira ordem 1015 Na notação matricial podese mostrar veja o Apêndice C que ØO D XX1Xy a O que acontece com ØO quando há colinearidade perfeita entre os X b Como podemos saber se existe colinearidade perfeita 1016 Usando a notação matricial podemos mostrar O que acontece a essa matriz varcov a Quando há multicolinearidade perfeita b Quando a colinearidade é alta mas não perfeita Verifique se seu raciocínio está de acordo com o de GOlDBerGer arthur S JOChemS D B Note on stepwise leastsquares Journal of the American Statistical Association mar 1961 v 56 p 105110 Opcional 360 Parte Dois Relaxamento das hipóteses do modelo clássico ECONOBOOKParte02indb 360 23112010 071818 Capítulo 10 Multicolinearidade o que acontece se os regressores estiverem correlacionados 361 1017 Considere a seguinte matriz de correlação Com base nessa matriz como você verificaria se a há colinearidade perfeita b há colinea ridade menos que perfeita e c os X não são correlacionados Dica Podese usar R para responder a essas questões em que R denota o determinante de R 1018 Variáveis explanatórias ortogonais Suponha no modelo que X2 a Xk sejam todos não correlacionados Tais variáveis são chamadas variáveis ortogo nais Se esse for o caso a Qual a estrutura da matriz X0X b Como poderíamos obter ØO D X0X1X0y c Qual a natureza da matriz de variânciacovariância de ØO d Suponha que você tenha efetuado a regressão e depois queira introduzir outra variável ortogonal por exemplo Xk C 1 no modelo Você tem de recalcular todos os coeficientes anteriores de ØO1 a ØOk Por quê 1019 Considere o modelo a seguir em que PNBt D PNB no período t Mt D oferta de moeda no período t Mt1 D oferta de moeda no período t 1 e Mt Mt1 D variação na oferta de moeda entre os períodos t e t 1 Este modelo postula que o nível de PNB no período t é uma função da oferta de moeda nos períodos t e t 1 bem como da variação da oferta de moeda entre esses períodos a Supondo que tenhamos os dados para estimar o modelo anterior conseguiríamos estimar todos os coeficientes desse modelo Por quê b Em caso negativo que coeficientes podem ser estimados c Suponha que os termos Ø3Mt1 estivessem ausentes do modelo Sua resposta para a seria a mesma d Repita c supondo que os termos Ø2Mt estivessem ausentes do modelo 1020 Mostre que as Equações 747 e 748 também podem ser expressas como em que r23 é o coeficiente de correlação entre X2 e X3 1021 Usando as Equações 7412 e 7415 mostre que quando há colinearidade perfeita as variâncias de ØO2 e ØO3 são infinitas 1022 Verifique se os erros padrão das somas desses coeficientes angulares estimados das Equações 1056 e 1057 são respectivamente 01549 e 01825 Veja a Seção 10547 1023 Para o modelo de regressão com k variáveis podese mostrar que a variância do késimo coefi ciente de regressão parcial k D 2 3 K dado em 756 também pode ser expresso como Opcional esta fórmula é dada por StONe r the analysis of market demand Journal of the Royal Statistical Society vl B7 p 297 1945 lembrese também da equação 756 Para aprofundar a discussão veja KeNNeDY Peter A guide to econometrics 2 ed Cambridge mass the mit Press 1985 p 156 Capítulo 10 Multicolinearidade o que acontece se os regressores estiverem correlacionados 361 ECONOBOOKParte02indb 361 23112010 071819 362 Parte Um Modelos de regressão com equação única em que æ2 y D variância de Y æ2 k D variância da késima variável explanatória R2 k R2 do re gressor de Xk contra as variáveis X remanescentes e R2 D coeficiente de determinação da regressão múltipla ou seja a regressão de Y em todas as variáveis X Tudo o mais permanecendo constante se æ2 k aumenta o que acontece com a variância de ØOk Quais as implicações em termos do problema da multicolinearidade b O que acontece com a fórmula anterior quando a colinearidade é perfeita c Verdadeiro ou falso A variância de ØOk diminui quando R2 aumenta de modo que o efei to de um R2 k alto pode ser compensado por um R2 alto 1024 Dos dados anuais para o setor de manufatura dos Estados Unidos para 18991922 Dougherty obteve os seguintes resultados de regressão48 1 em que Y D índice da produção real K D índice do uso de capital real L D índice de uso real de mão de obra t D tempo ou tendência Usando os mesmos dados ele também obteve a seguinte regressão 2 a Há muticolinearidade na regressão 1 Como podemos saber b Na regressão 1 o que é o sinal a priori de log K Os resultados correspondem a essa ex pectativa Por quê c Como justificaríamos a forma funcional de regressão 1 Dica função de produção CobbDouglas d Interprete a regressão 1 Qual o papel da variável de tendência nesta regressão e Qual a lógica que está por trás da regressão 2 f Se havia multicolinearidade na regressão 1 ela foi reduzida na regressão 2 Como sabemos g Se a regressão 2 é uma versão restrita da regressão 1 qual é a restrição imposta pelo autor Dica retornos de escala Como poderíamos saber se essa restrição é válida Que teste usamos Mostre todos os cálculos h Os valores de R2 das duas regressões são comparáveis Por quê Como poderíamos tor nálos comparáveis 1025 Avalie criticamente as seguintes afirmações a De fato a multicolinearidade não é um erro de modelagem É uma condição de dados deficientes49 b Se não for viável obter mais dados então devese aceitar o fato de que os dados que se tem contêm uma quantidade limitada de informações e devem simplificar o modelo de acordo Tentar estimar modelos que sejam complicados demais é um dos erros mais co muns entre econometristas inexperientes50 DOUGhertY Christopher Introduction to econometrics Nova York Oxford University Press 1992 p 159160 ChatterJee Samprit haDi ali S PriCe Bertram Regression analysis by example 3 ed Nova York John Wiley Sons 2000 p 226 DaViDSON russel maCKiNNON James G Estimation and inference in econometrics Nova York Oxford University Press 1993 p 186 362 Parte Dois Relaxamento das hipóteses do modelo clássico ECONOBOOKParte02indb 362 23112010 071820 Capítulo 10 Multicolinearidade o que acontece se os regressores estiverem correlacionados 363 c É comum os pesquisadores afirmarem que a multicolinearidade está presente sempre que os sinais esperados não aparecerem nos resultados da regressão quando as variáveis que eles sabem a priori que são importantes têm valores t insignificantes ou quando vários resultados de regressão são substancialmente alterados sempre que uma variável explanatória é suprimida Infelizmente nenhuma dessas situações é necessária ou sufi ciente para a existência de colinearidade e além disso nenhuma prevê sugestões úteis quanto ao tipo de informações adicionais que podem ser necessárias para resolver o pro blema de estimação que apresentam51 d qualquer regressão de séries temporais que contenha mais de quatro variáveis independen tes resulta em lixo52 exercícios aplicados 1026 Klein e Goldberger tentaram ajustar o seguinte modelo de regressão para a economia dos Estados Unidos em que Y D consumo X2 D renda salarial X3 D renda não agrícola excluídos os salários e X4 D renda agrícola Mas desde que se espera que X2 X3 e X4 sejam altamente colineares eles obtiveram estimativas de Ø3 e Ø4 com base nos dados de corte transversal como se segue Ø3 D 075Ø2 e Ø4 D 0625Ø2 Usando essas estimativas eles reformularam sua função de consumo da seguinte forma a Adapte o modelo modificado para os dados da Tabela 1012 e obtenha estimativas de Ø1 para Ø4 b Como você interpreta a variável Z 1027 A Tabela 1013 apresenta dados sobre as importações PIB e Índice de Preços ao Consumi dor IPC para os Estados Unidos durante o período 19752005 Pedese para considerar o seguinte modelo ln Importaçõest D Ø1 C Ø2 ln PIBt C Ø3 ln IPCt C ut a Estime os parâmetros do modelo utilizando os dados apresentados na tabela b Você acredita que há multicolinearidade nos dados c Faça a regressão 1 ln Importaçõest D A1 C A2 ln PIB 2 ln Importaçõest D B1 C B2 ln IPCt 3 ln PIBt D C1 C C2 ln IPCt esta citação é atribuída ao econometrista Zvi Griliches O trecho foi retirado de BerNDt ernst The practice of econometrics classic and contemporary reading mass addison Wesley 1991 p 224 GreNBerG D h KOSterS m Income guarantees and the working poor rand Corporation r579OeO dez 1970 Capítulo 10 Multicolinearidade o que acontece se os regressores estiverem correlacionados 363 Tabela 1012 Fonte KLEIN L R Goldberger A S An economic model in the United States 19291952 Amsterdã North Holland Publishing Company1964 p 131 Os dados para o período de guerra 19421944 estão faltando os relativos aos outros anos são em bilhões de dólares de 1939 ECONOBOOKParte02indb 363 23112010 071821 364 Parte Um Modelos de regressão com equação única Com base nessas regressões o que se pode dizer sobre a natureza da multicolinearidade nos dados d Suponha que haja multicolinearidade nos dados mas ØO2 e ØO3 sejam individualmente signifi cativos no nível de 5 e que o teste F geral também seja significativo Nesse caso deve ríamos ficar preocupados com o problema da colinearidade 1028 Retome o Exercício 719 sobre a função demanda de frango nos Estados Unidos a Usando o modelo log linear ou o loglog estime as várias regressões auxiliares Quantas são b Dessas regressões auxiliares como você decide quais regressores são altamente colinea res Qual teste podemos usar Mostre os detalhes do cálculo c Se há colinearidade significativa nos dados quais variáveis podem ser excluídas para reduzir a gravidade do problema da colinearidade Se você fizer isso que problemas econométricos enfrentará d Você tem sugestões além de excluir variáveis para atenuar o problema da colinearidade Explique 1029 A Tabela 1014 apresenta dados sobre novos veículos de passageiros vendidos nos Estados Unidos como função de diversas variáveis a Desenvolva um modelo linear ou log linear adequado para estimar uma função de deman da para automóveis nos Estados Unidos b Se decidir incluir todos os regressores apresentados na tabela como variáveis explanató rias como você espera enfrentar o problema da multicolinearidade Por quê c Se espera enfrentar o problema da multicolinearidade como pretende resolvêlo Formu le suas hipóteses com clareza e mostre todos os cálculos explicitamente 1030 Para avaliar a viabilidade de um salário anual garantido imposto de renda negativo a Rand Corporation conduziu um estudo a fim de medir a resposta da oferta de trabalho média de horas trabalhadas a salárioshora crescentes Os dados para este estudo foram extraídos de uma amostra nacional de 6 mil domicílios chefiados por homens que ganhavam menos de 15 mil ao ano Os dados foram divididos em 39 grupos demográficos para análise veja a Tabela 1015 Uma vez que os dados referentes a quatro grupos desses estavam incompletos na tabela só aparecem 35 grupos demográficos As definições das diversas variáveis usadas na análise estão no final da tabela 53 a Faça a regressão das horas trabalhadas durante o ano contra as variáveis dadas na tabela e interprete sua regressão GreeNBerG D h Kosters m Income garantees and the working poor rand Corporation r579OeO dez 1970 364 Parte Dois Relaxamento das hipóteses do modelo clássico Tabela 1013 Estados Unidos Importações PIB e IPC 19752005 para todos os consumidores urbanos 19821984 100 exceto quando informado o contrário Fonte Department of Labor Bureau of Labor Statistics ECONOBOOKParte02indb 364 23112010 071822 Capítulo 10 Multicolinearidade o que acontece se os regressores estiverem correlacionados 365 b Há evidência de multicolinearidade nos dados Como podemos saber c Calcule os fatores de inflação da variância FIV e a TOL para os vários regressores d Se há problema da multicolinearidade que ação corretiva se houver pode ser tomada e O que este estudo informa sobre a viabilidade de um imposto de renda negativo 1031 A Tabela 1016 apresenta dados sobre a taxa de criminalidade em 45 Estados dos Estados Unidos para 1960 Tente desenvolver um modelo adequado para explicar a taxa de crimina lidade em relação às 14 variáveis socioeconômicas apresentadas na tabela Atente principal mente ao problema da colinearidade ao desenvolver seu modelo 1032 Retome os dados de Longley da Seção 1010 Repita a regressão da tabela omitindo os dados para 1962 ou seja faça a regressão para o período de 19471961 Compare as duas regres sões A que conclusão geral você chega com este exercício 1033 Dados de Longley atualizados Ampliamos o número de dados apresentados na Seção 1010 para incluir as observações de 19592005 Os novos dados estão na Tabela 1017 Eles estão ligados a Y D número de pessoas empregadas em milhares X1 D deflator implícito do PNB X2 D PNB em milhares de dólares X3 D número de pessoas desempregadas em milhares X4 D número de pessoas nas forças armadas em milhares X5 D população não instituciona lizada com mais de 16 anos X6 D ano igual a 1 em 1959 2 em 1960 e 47 em 2005 a Crie diagramas de dispersão como sugerido no capítulo para avaliar as relações entre as variáveis independentes As relações são fortes Elas parecem lineares b Crie uma matriz de correlação Quais variáveis parecem ser as mais relacionadas entre si sem incluir a variável dependente c Faça uma regressão MQO padrão para prever o número de pessoas empregadas em mi lhares Os coeficientes das variáveis independentes comportamse como esperado d Com base nos resultados podemos acreditar que eles apresentam multicolinearidade 1034 À medida que o queijo envelhece vários processos químicos ocorrem determinando o sabor do produto final Os dados apresentados na Tabela 1018 pertencem a concentrações de vá rios produtos químicos em uma amostra de 30 queijos cheddar maduros e medidas subjetivas de paladar para cada amostra As variáveis ácido acético e H2S são o logaritmo natural de Capítulo 10 Multicolinearidade o que acontece se os regressores estiverem correlacionados 365 Tabela 1014 Dados de veículos de passageiros Fonte Business Statistics 1986 Suplemento do Current Survey of Business US Department of Commerce 1971 10227 1120 1213 7768 489 79367 Y D veículos de passageiros novos vendidos milhares não ajustados sazonalmnente X2 D veículos novos Índice de Preços ao Consumidor 1967 D 100 não ajustado sazonalmente X3 D Índice de Preços ao Consumidor todos os itens todos os consumidores urbanos 1967 D 100 não ajustados sazonalmente X4 D renda pessoal disponível RPD em bilhões de dólares não ajustado para variação sazonal X5 D taxa de juros percentual dos títulos colocados diretamente pelas instituições financeiras X6 D força de trabalho empregada em milhares não ajustada para variação sazonal Opcional ECONOBOOKParte02indb 365 23112010 071822 366 Parte Um Modelos de regressão com equação única concentração de ácido acético e ácido sulfídrico respectivamente A variável ácido lático não foi transformada em logaritmo a Trace um diagrama de dispersão das quatro variáveis b Faça uma regressão bivariada do paladar contra o ácido acético e H2S e interprete os re sultados obtidos c Faça uma regressão bivariada do paladar contra o ácido lático e H2S e interprete os resul tados obtidos d Faça uma regressão múltipla do paladar contra o ácido acético H2S e ácido lático Inter prete os resultados obtidos e Dados os seus conhecimentos sobre multicolinearidade como decidiria entre essas re gressões f Que conclusões gerais você pode tirar de sua análise 366 Parte Dois Relaxamento das hipóteses do modelo clássico Tabela 1015 Horas de trabalho e outros dados para 35 grupos Fonte GREENBERG D H KOSTERS M Income garantees and the working poor Rand Corporation R579OEO dez 1970 Notas Horas D horas médias trabalhadas durante o ano Taxa D salário médio por hora em dólares GE D ganhos anuais médios da esposa em dólares GOM D ganhos anuais médios de outros membros da família em dólares RNPT D renda não proveniente de trabalho média anual Ativos D ativos médios da família poupança etc em dólares Idade D idade média dos entrevistados DEP D número médio de dependentes Escolaridade D número médio de anos de estudo ECONOBOOKParte02indb 366 23112010 071823 Capítulo 10 Multicolinearidade o que acontece se os regressores estiverem correlacionados 367 Capítulo 10 Multicolinearidade o que acontece se os regressores estiverem correlacionados 367 Tabela 1016 Dados da taxa de criminalidade para 47 Estados dos Estados Unidos em 1960 Observação T Idade S ESCO DESP0 DESP1 FT H POP1 NB D1 D2 VBAT X Definições das va riáveis T D taxa de criminalidade número de delitos relatados à polícia por milhão de pessoas Idade D número de homens com 14 a 24 anos por 1000 pessoas S D variável indicador para Estados do Sul 0 não 1 sim ESCO D número médio de anos de escolaridade vezes 10 para pessoas acima de 25 anos DESP0 D despesas per capita de 1960 com polícia por Estado e governo local DESP1 D despesa per capita de 1959 com polícia por Estado e governo local FT D participação na força de trabalho por 1000 homens civis urbanos com 1424 anos de idade H D número de homens por 1000 mulheres POP1 D tamanho da população do Estado em centenas de milhares NB D número de não brancos por população de 1000 D1 D taxa de desemprego de homens urbanos por 1000 com 1424 anos D2 D taxa de desemprego de homens urbanos por 1000 com 3539 anos VBAT D valor médio de bens e ativos transferíveis ou renda familiar em dezenas de X D número de famílias por 1000 com ganhos ½ da renda média Observação D Estado 47 Estados para o ano de 1960 Fonte VANDAELE W Participation in illegitimate activities Erlich revisted In BLUMSTEIN A COHEN J NAGIN D Eds Deterrence and incapacitation National Academy of Sciences 1978 p 270335 ECONOBOOKParte02indb 367 23112010 071824 368 Parte Um Modelos de regressão com equação única 368 Parte Dois Relaxamento das hipóteses do modelo clássico Tabela 1017 Dados atualizados de Longley 19592005 Fonte Department of Labor Bureau of Labor Statistics e httpsiadappdmdcosdmil personnelMILITARY Miltop htm ECONOBOOKParte02indb 368 23112010 071825 Capítulo 10 369 Capítulo 10 369 Tabela 1018 Químicos em queijos Fonte disponível em http libstatcmuedu DASL DatafilesCheesehtml ECONOBOOKParte02indb 369 23112010 071825 370 Heterocedasticidade o que acontece se a variância do erro não é constante Uma hipótese importante do modelo clássico de regressão linear Hipótese 4 é que os termos de erro ui que aparecem na função de regressão populacional são homocedásticos ou seja todos têm a mesma variância Neste capítulo examinaremos a validade dessa hipótese e descobriremos o que acontece quan do ela não é constatada Como no Capítulo 10 buscamos respostas às seguintes questões 1 Qual a natureza da heterocedasticidade 2 Quais suas consequências 3 Como é detectada 4 Quais as medidas corretivas 111 A natureza da heterocedasticidade Como observado no Capítulo 3 uma das hipóteses importantes do modelo clássico de regressão linear é que a variância de cada termo de erro ui condicional aos valores selecionados das variáveis explanatórias é um número constante igual a æ2 Essa é a hipótese da homocedasticidade ou seja igual ou homogêneo homo espalhamento cedasticidade isto é variância igual Simbolicamente 1111 A homocedasticidade do modelo de regressão com duas variáveis pode ser mostrada como o gráfico da Figura 34 o qual por conveniência é reproduzido como Figura 111 Nessa figura a va riância condicional de Yi que é igual à de ui condicionada ao Xi dado permanece a mesma indepen dentemente dos valores assumidos pela variável X Em contrapartida considere a Figura 112 que mostra que a variância condicional de Yi aumenta à medida que X aumenta Nesse caso as variâncias de Yi não são as mesmas Portanto há heteroce dasticidade Simbolicamente 1112 Note o subscrito de æ2 que nos lembra que as variâncias condicionais de ui variâncias condicionais de Yi não são mais constantes Para deixar clara a diferença entre homocedasticidade e heterocedasticidade suponha que no modelo de duas variáveis Yi Ø1 Ø2Xi ui Y represente poupança e X represente renda As Figuras 111 e 112 mostram que à medida que a renda aumenta as poupanças também aumentam Mas na Figura 111 a variância das poupanças permanece a mesma em todos os níveis de renda enquanto Capítulo 11 ECONOBOOKParte02indb 370 23112010 071826 Capítulo 11 Heterocedasticidade o que acontece se a variância do erro não é constante 371 na Figura 112 ela aumenta com a renda Parece que na Figura 112 as famílias com rendas mais altas poupam em média mais do que as famílias com rendas mais baixas mas também há mais variabili dade em suas poupanças Várias são as razões para as variâncias de ui poderem ser variáveis algumas das quais são dadas a seguir1 1 Seguindo os modelos de erroaprendizagem comportamentos incorretos das pessoas dimi nuem com o tempo ou o número de erros tornase mais consistente Neste caso esperase que æi 2 diminua Como exemplo considere a Figura 113 que relaciona o número de erros de digitação cometidos em um dado período de tempo em um teste com as horas de prática de digitação Como mostra a Figura 113 quando o número de horas de digitação aumenta o número médio de erros de digitação bem como suas variâncias diminui 2 À medida que a renda aumenta as pessoas têm mais renda discricionária2 e portanto mais opções para escolher como aplicarão sua renda Por isso é provável que æi 2 aumente com a renda Assim na regressão de poupanças contra a renda é provável que se verifique que æi 2 aumenta com a renda como na Figura 112 porque as pessoas têm mais opção sobre como irão dispor de suas poupanças Do mesmo modo em geral se espera que as empresas com lu cros maiores mostrem maior variabilidade em suas políticas de dividendos que aquelas com lucros mais baixos Além disso as empresas em crescimento provavelmente mostram mais variabilidade em suas políticas de distribuição de dividendos do que as já estabelecidas 1 Veja ValaVaNiS Stefan econometrics Nova York mcGrawhiull 1959 p 48 2 Como Valavanis ibid p 48 afirma a renda cresce e as pessoas agora mal diferenciam dólares enquanto an teriormente elas diferenciavam centavos Figura 111 Erros homocedásticos Densidade Renda Poupança X Y β1 b2 Xi β β Figura 112 Erros heterocedásticos Densidade Renda Poupança X Y b1 b2 Xi β β ECONOBOOKParte02indb 371 23112010 071827 372 Parte Dois Relaxamento das hipóteses do modelo clássico 3 À medida que as técnicas de coleta de dados aprimoramse é provável que æi 2 diminua As sim os bancos que têm equipamentos sofisticados de processamento de dados provavelmente cometem menos erros nos demonstrativos mensais ou trimestrais de seus clientes do que bancos sem esses recursos 4 A heterocedasticidade também ocorre como resultado da presença de dados discrepantes outliers Uma observação discrepante é aquela que difere muito muito menor ou muito maior em relação às observações da amostra Em termos mais exatos um dado discrepante é a observação de uma população que difere daquela que gera as observações amostradas rema nescentes3 A inclusão ou exclusão de tal observação principalmente quando o tamanho da amostra for menor pode alterar substancialmente os resultados da análise de regressão Como exemplo considere o diagrama de dispersão dado na Figura 114 Com base nos da dos da Tabela 119 no Exercício 1122 este gráfico traça a taxa de variação percentual dos preços das ações Y e dos preços ao consumidor X para o período que vai do pósguerra 1945 até 1969 para 20 países Nessa figura a observação em Y e X para o Chile pode ser considerada um dado discrepante porque os valores apresentados para Y e X são muito maio res do que para os demais países Em situações como essa seria difícil manter a hipótese da homocedasticidade No Exercício 1122 pedemse para descobrir o que acontece com os resultados da regressão quando as observações para o Chile são excluídas da análise 5 Outra fonte de heterocedasticidade surge da violação da Hipótese 9 do modelo clássico de regres são linear MCRL a saber que o modelo de regressão deve ser especificado corretamente Discutiremos os erros de especificação com mais detalhes no Capítulo 13 mas vale dizer por ora que muitas vezes algumas variáveis importantes são omitidas do modelo e isso nos dá a impres são de tratarse de heterocedasticidade Assim na função demanda de um produto se deixamos de incluir os preços de produtos complementares ou concorrentes o viés da variável omitida os resíduos obtidos da regressão podem dar a impressão nítida de que a variância do erro não é constante Mas uma vez incluídas as variáveis omitidas no modelo esse equívoco desfazse Para um exemplo concreto voltemos ao nosso estudo sobre a retenção de lembranças de anúncios em relação às despesas com publicidade X Veja o Exercício 832 Se você fizer a regressão apenas de Y contra X e observa os resíduos dessa regressão verá um padrão mas se você regridir Y contra X e X 2 verá outro padrão que pode ser identificado claramente na Figura 115 Já vimos que X 2 pertence ao modelo Veja o Exercício 832 6 Outra fonte de heterocedasticidade é a assimetria na distribuição de um ou mais regressores incluídos no modelo Exemplos são variáveis econômicas como renda riqueza e educação Sabese que a distribuição de renda e riqueza na maioria das sociedades é desigual cabendo o grosso da renda e riqueza a uma parcela mínima da população 3 Sou grato a michael mcaleer por ter apontado este aspecto Figura 113 Ilustração de heterocedasticidade Densidade X Y b1 b2 Xi Erros de digitação Horas de prática de digitação β β ECONOBOOKParte02indb 372 23112010 071827 Capítulo 11 Heterocedasticidade o que acontece se a variância do erro não é constante 373 7 Outras fontes de heterocedasticidade como David Hendry observa a heterocedasticidade também pode surgir 1 da transformação incorreta de dados por exemplo transformações proporcionais ou de primeira diferença e 2 da forma funcional incorreta por exemplo modelos lineares versus loglineares4 Note que o problema da heterocedasticidade provavelmente é mais comum nos dados de corte transversal do que nas séries temporais Nos primeiros em geral se lida com membros de uma população em determinado ponto no tempo como consumidores individuais ou suas famílias empresas setores industriais ou subdivisões geográficas como Estado país cidade etc Além disso esses integrantes podem ser de diferentes tamanhos como empresas peque nas médias ou grandes ou renda baixa média ou alta Nas séries temporais por outro lado as variáveis tendem a ser de ordens de magnitude similares porque os dados costumam ser coletados para a mesma entidade em um período de tempo Exemplos o produto nacional bruto PNB gastos com consumo poupança ou emprego nos Estados Unidos para um pe ríodo por exemplo de 19552005 Para ilustrar a heterocedasticidade que provavelmente será encontrada na análise de corte transversal veja a Tabela 111 Esta apresenta dados sobre a remuneração por funcionário em 10 ramos de bens não duráveis classificados pelo número de funcionários da empresa ou estabelecimento no ano de 1958 A tabela também dá a produtividade média para nove cate gorias de emprego 4 heNDrY David F Dynamic econometrics Nova York Oxford University Press 1995 p 45 Figura 114 Relação entre os preços das ações e preços ao consumidor 1 9 2 3 4 5 6 7 8 10 26 10 9 8 7 6 5 4 3 2 1 15 25 Preços das ações variação Preços ao consumidor variação Chile Figura 115 Resíduos da regressão de a percepções sobre despesas com publicidade e b percepções sobre despesas de publicidade e o quadrado de despesas com publicidade 2 40 4 6 8 10 12 14 16 18 20 22 20 0 20 40 b 2 60 40 4 6 8 10 a 12 14 16 18 20 22 20 0 20 40 60 ECONOBOOKParte02indb 373 23112010 071828 374 Parte Dois Relaxamento das hipóteses do modelo clássico Tabela 111 Remuneração por funcionário em setores de produção de bens não duráveis de acordo com o número de funcio nários 1958 Número de Funcionários número médio de funcionários Setor 14 59 1019 2049 5099 100249 250499 500999 10002499 alimentos e produtos alimentícios 2994 3295 3565 3907 4189 4486 4676 4968 5342 Fumo 1721 2057 3336 3320 2980 2848 3072 2969 3822 têxtil 3600 3657 3674 3437 3340 3334 3225 3163 3168 Vestuário 3494 3787 3533 3215 3030 2834 2750 2967 3453 Papelaria 3498 3847 3913 4135 4445 4885 5132 5342 5326 Gráfica e editoração 3611 4206 4695 5083 5301 5269 5182 5395 5552 Produtos químicos e derivados 3875 4660 4930 5005 5114 5248 5630 5870 5876 Produtos deriva dos de petróleo e carvão 4616 5181 5317 5337 5421 5710 6316 6455 6347 Derivados de borracha e plástico 3538 3984 4014 4287 4221 4539 4721 4905 5481 Couro e derivados 3016 3196 3149 3317 3414 3254 3177 3346 4067 remuneração média 3396 3787 4013 4104 4146 4241 4388 4538 4843 Desvio padrão 7422 8514 7278 80506 9299 10806 12412 13077 11107 Produtividade média 9355 8584 7962 8275 8389 9418 9795 10281 11750 Fonte The Census of Manufactures US Department of Commerce 1958 elaborado pelo autor Figura 116 Desvio padrão da remuneração e remuneração média 3000 600 3500 4000 Remuneração média 4500 5000 800 1000 Desvio padrão 1200 1400 ECONOBOOKParte02indb 374 23112010 071828 Capítulo 11 Heterocedasticidade o que acontece se a variância do erro não é constante 375 Embora os setores difiram na composição de seus produtos a Tabela 111 mostra claramente que em média as empresas grandes pagam mais do que as pequenas Por exemplo empresas com um a quatro funcionários pagavam em média 3396 enquanto aquelas que empregavam de 1000 a 2499 funcionários pagavam em média cerca de 4843 Note que há uma variabilidade considerável na remuneração entre várias categorias como indicado pelos desvios padrão estimados das remunera ções Isso pode ser observado também na Figura 116 que mostra o gráfico do desvio padrão da re muneração e a remuneração média em cada categoria de emprego Como podemos ver claramente em média o desvio padrão da remuneração aumenta com o valor médio da remuneração 112 Estimativa dos MQO na presença da heterocedasticidade O que acontece com os mínimos quadrados ordinários MQO e suas variâncias se introduzirmos a heterocedasticidade fazendo mas mantivermos todas as demais hipóteses do modelo clássico Para responder a essa pergunta tomamos o modelo de duas variáveis Aplicando a fórmula usual o estimador de MQO de Ø2 é 1121 mas a variância agora é dada pela expressão a seguir veja o Apêndice 11A Seção 11A1 1122 que obviamente é diferente da fórmula usual de variância obtida supondose a homocedasticidade a saber 1123 Evidentemente se æi 2 æ2 para cada i as duas fórmulas serão idênticas Por quê Lembrese de que ØO2 será o melhor estimador linear não tendencioso MELNT se as hipóteses do modelo clássico que incluem a homocedasticidade forem válidas Ele ainda será MELNT quando excluirmos a hipótese da homocedasticidade e substituirmos pela da heterocedasticidade É fácil provar que ØO2 conservase linear e não tendencioso Na verdade como mostra o Apêndice 3A Seção 3A2 para estabelecer a não tendenciosidade de ØO2 não é necessário que os termos de erro ui sejam homocedásticos De fato a variância de ui homoscedástica ou heteroscedástica não desempenha papel na determinação da propriedade da tendência Lembrese de que no Apêndice 3A Seção 3A7 mostra mos que ØO2 é um estimador consistente sob as hipóteses do modelo clássico de regressão linear Apesar da heterocedasticidade podese indicar que ØO2 é um estimador consistente embora não faça mos a prova disso ou seja quando o tamanho da amostra aumenta indefinidamente o Ø2 estimado converge para seu verdadeiro valor Além do mais também pode ser mostrado que sob certas condições chamadas condições de regularidade ØO2 é assintoticamente normalmente distribuído O que dissemos sobre ØO2 também é válido para outros parâmetros de modelo de regressão múltipla ECONOBOOKParte02indb 375 23112010 071829 376 Parte Dois Relaxamento das hipóteses do modelo clássico Admitindose que ØO2 ainda seja linear não tendencioso e consistente ele é eficiente ou me lhor Isto é ele tem a variância mínima na classe dos estimadores não tendenciosos E essa va riância mínima é dada pela Equação 1122 A resposta é não a ambas as perguntas ØO2 deixa de ser o melhor e a variância mínima não é dada pela Equação 1122 Então qual é o estimador MELNT na presença da heterocedasticidade A resposta é dada na seção a seguir 113 O método dos mínimos quadrados generalizados MQG Por que o estimador comum MQO de Ø2 apresentado na Equação 1121 não é mais o melhor embora não seja tendencioso Intuitivamente podemos entender a razão para isso por meio da Tabe la 111 Como a tabela mostra há variabilidade considerável na remuneração dos assalariados Se tivéssemos de fazer a regressão da remuneração por funcionário contra o número de funcionários pensaríamos em levar em consideração a existência de uma variabilidade considerável entre as cate gorias em termos de vencimentos Em termos ideais gostaríamos de sugerir um esquema de estima ção de modo que as observações vindas de populações com maior variabilidade recebam menos peso do que aquelas provenientes de populações com menor variabilidade Examinando a Tabela 111 gostaríamos de atribuir maior peso às observações vindas das categorias de emprego 1019 e 2049 do que às vindas de categorias de emprego como 59 e 250499 pois as primeiras agrupamse mais em torno de seus valores médios do que as últimas e dessa forma nos permitem estimar a função de regressão da população FRP com mais precisão Infelizmente o método dos MQO de emprego não segue essa estratégia e portanto não usa as informações contidas na variabilidade desigual da variável dependente Y ou seja na remuneração dos funcionários da Tabela 111 ela atribui pesos ou importâncias iguais a cada observação Mas um método de estimação conhecido como mínimos quadrados generalizados MQG leva tais infor mações em consideração explicitamente e portanto é capaz de produzir estimadores MELNT Para ver como isso é feito voltemos ao modelo conhecido de duas variáveis 1131 que para facilitar o cálculo algébrico escrevemos como 1132 em que X0i 1 para cada i O leitor pode ver que essas duas formulações são idênticas Agora suponha que as variâncias heterocedásticas æi 2 sejam conhecidas Dividimos a Equação 1132 por æi para obter 1133 que para facilitar a exposição escrevemos como 1134 em que as variáveis com asterisco ou transformadas são as variáveis originais divididas por æi Usa mos a notação Ø1 e Ø2 para indicar os parâmetros do modelo transformado e distinguilos dos parâmetros normais MQO Ø1 e Ø2 Qual o propósito de transformar o modelo original Para entender isso note que o aspecto do termo de erro transformado u i ECONOBOOKParte02indb 376 23112010 071830 Capítulo 11 Heterocedasticidade o que acontece se a variância do erro não é constante 377 1135 que é uma constante A variância do termo de erro transformado u i agora é homoscedástica Uma vez que ainda estejamos conservando as outras hipóteses do modelo clássico a constatação de que u é homocedástico sugere que se aplicarmos o MQO ao modelo transformado 1133 ele produ zirá estimadores MELNT Em suma os Ø1 e Ø2 estimados agora são MELNT e não os estimadores de MQO ØO1 e ØO2 O procedimento de transformar as variáveis originais de forma que as transformadas satisfaçam as hipóteses do modelo clássico e então aplicar os MQO a elas é conhecido como o método de míni mos quadrados generalizados MQG Em síntese os MQG são os MQO nas variáveis transformadas que satisfazem as hipóteses padrão de mínimos quadrados Os estimadores assim obtidos são conhe cidos como estimadores MQG que são MELNT O mecanismo para estimar Ø1 e Ø2 é apresentado a seguir Primeiro escrevemos a função de re gressão amostral FRA da Equação 1133 ou 1136 Agora para obter os estimadores MQG minimizamos ou seja 1137 O mecanismo real para minimizar a Equação 1137 segue as técnicas de cálculo usadas como padrão e é apresentado no Apêndice 11A Seção 11A2 Como mostrado o estimador de MQG para Ø2 é 1138 e sua variância é dada por 1139 em que wi 1æi 2 ECONOBOOKParte02indb 377 23112010 071832 378 Parte Dois Relaxamento das hipóteses do modelo clássico Diferença entre os MQO e os MQg Lembrese do Capítulo 3 que nos MQO minimizamos 11310 mas nos MQG minimizamos a expressão 1137 que também pode ser escrita como 11311 em que wi 1æi 2 note que a Equação 11311 e a Equação 1137 são idênticas Assim nos MQG minimizamos a soma ponderada dos quadrados dos resíduos com wi 1æi 2 funcionando como pesos mas nos MQO minimizamos uma soma dos quadrados dos resíduos SQR não ponderada ou o que resulta no mesmo igualmente ponderada Como mostra a Equação 1137 nos MQG o peso atribuído a cada observação é inversamente proporcional a seu æi ou seja observa ções vindas de uma população com æi maior obterão peso relativamente menor e aquelas de uma po pulação com æi menor terão peso proporcionalmente maior na minimização da SQR 11311 Para entender a diferença entre os MQO e os MQG observe o diagrama de dispersão hipotético apresenta do na Figura 117 Nos MQO não ponderados cada uOi 2 associado aos pontos A B e C receberá o mesmo peso quan do a SQR for minimizada É claro que nesse caso a uOi 2 associada ao ponto C dominará a SQR Mas nos MQG a observação extrema C receberá um peso relativamente menor que as outras duas obser vações Como comentado essa é a estratégia certa pois ao estimarmos a função de regressão popu lacional FRP de uma forma mais confiável gostaríamos de dar mais peso às observações agrupadas em torno de sua média populacional do que àquelas que estão bastante dispersas Como a Equação 11311 minimiza uma SQR ponderada ela é conhecida como mínimos qua drados ponderados MQP e os estimadores assim obtidos e apresentados nas Equações 1138 e 1139 são conhecidos como estimadores MQP Mas os MQP são apenas um caso especial da técnica mais geral de estimação os MQG No contexto da heterocedasticidade podese considerar os dois termos MQP e MQG como intercambiáveis Em capítulos posteriores trataremos de outros casos especiais de MQG A propósito observe que se wi w uma constante para todo i ØO2 é idêntico a ØO2 e a var ØO2 é idêntica à var ØO2 usual isto é homoscedástica dada na Equação 1123 o que não deveria surpreen der Por quê Veja o Exercício 118 X Y A B Yi β 1 β 2 Xi u u C 0 u Figura 117 Diagrama de dispersão hipotético ECONOBOOKParte02indb 378 23112010 071833 Capítulo 11 Heterocedasticidade o que acontece se a variância do erro não é constante 379 114 Consequências de usar MQO na presença de heterocedasticidade Como vimos ØO2 e ØO2 são estimadores lineares não tendenciosos na amostragem repetida em média ØO2 e ØO2 serão iguais ao verdadeiro Ø2 ou seja ambos são estimadores não tendenciosos Mas sabemos que ØO2 é eficiente ou seja tem a menor variância O que acontece com nosso intervalo de confiança testes de hipóteses e outros procedimentos se continuarmos a usar o estimador de MQO ØO2 Distinguiremos dois casos estimação de MQO admitindose a heterocedasticidade Suponha que usemos ØO2 e a fórmula de variância da Equação 1122 que considera explicita mente a heterocedasticidade Usando essa variância e supondo que æi 2 seja conhecido podemos es tabelecer intervalos de confiança e testar hipóteses com os testes habituais t e F A resposta em geral é não porque é possível mostrar que a varØO2 varØO25 o que significa que os intervalos de con fiança baseados nos últimos serão desnecessariamente maiores Como resultado os testes t e F pro vavelmente nos darão resultados imprecisos pois a varØO2 é excessivamente grande e o que parece ser um coeficiente estatisticamente insignificante porque o valor t é menor que o adequado pode de fato ser significativo se os intervalos corretos de confiança forem estabelecidos com base no proce dimento MQG estimação de MQO desconsiderando a heterocedasticidade A situação pode tornarse séria não só se usarmos ØO2 mas também se continuarmos a usar a fór mula de variância da Equação 1123 diante da presença ou suspeita de heterocedasticidade obser ve que esse é o caso mais provável dos dois discutidos aqui porque usar o programa padrão de cálculo de regressões de MQO e desprezar ou não saber da existência de a heterocedasticidade for nece a variância de ØO2 como na Equação 1123 Em primeiro lugar a var ØO2 da Equação 1123 é um estimador tendencioso da var ØO2 dada na Equação 1122 ou seja na média ele sobreestima ou subestima a variância e em geral não podemos dizer se o viés é positivo sobreestimação ou negativo subestimação porque depende da natureza da relação entre æi 2 e os valores assumidos pela variável explanatória X como pode ser observado na Equação 1122 veja o Exercício 119 O viés surge do fato de que æO2 o estimador convencional de æ2 a saber não é mais um esti mador não tendencioso deste último quando a heterocedasticidade está presente veja o Apêndice 11A3 Como resultado não podemos contar com os intervalos de confiança calculados da maneira convencional e com os testes t e F empregados normalmente6 Em suma se persistirmos no uso dos procedimentos comuns de teste apesar da heterocedasticidade quaisquer que sejam as conclu sões a que chegarmos ou as inferências que fizermos poderão ser equivocadas Para melhor entendermos este assunto citamos um estudo de Monte Carlo conduzido por Davidson e MacKinnon7 Eles consideram o seguinte modelo simples que em nossa notação é 1141 Eles supõem que Ø1 1 Ø2 1 e ui ª N0 X Æ i Como mostra a última expressão os autores supõem que a variância de erro seja heteroscedástica e relacionada ao valor do regressor X com poder Æ Se por exemplo Æ 1 a variância do erro é proporcional ao valor de X se Æ 2 a variância do erro é proporcional ao quadrado do valor de X e assim por diante Na Seção 116 iremos considerar a 5 Uma prova formal pode ser encontrada em DhYrmeS Phoebus J Introductory econometrics Nova York SpringerVerlag 1978 p 110111 Observe que a perda da eficiência de Ø2 isto é de quanto a var Ø2 excede a var Ø2 depende dos valores da amostra das variáveis X e do valor de æi 2 6 Da equação 536 sabemos que o intervalo de confiança de 100 1 Æ para Ø2 é ØO2 ß tÆ2 ep ØO2 mas se o desvio padrão de ØO2 não pode ser estimado de uma forma não tendenciosa como podemos crer no intervalo de confiança calculado do modo convencional 7 DaViDSON russell maCKiNNON James G Estimation and inference in econometrics Nova York Oxford University Press 1993 p 549550 ECONOBOOKParte02indb 379 23112010 071834 380 Parte Dois Relaxamento das hipóteses do modelo clássico lógica que envolve tal procedimento Com base em 20 mil réplicas e permitindo vários valores para Æ eles obtêm os erros padrão dos dois coeficientes de regressão usando os MQO veja a Equação 1123 MQO permitindo heterocedasticidade veja Equação 1122 e MQG veja a Equação 1139 A seguir apresentamos os resultados para valores selecionados de Æ Erro padrão de ØO 1 Erro padrão de ØO 2 Valor de Æ MQO MQO MQO MQG MQG het MQO het 05 0164 0134 0110 0285 0277 0243 10 0142 0101 0048 0246 0247 0173 20 0116 0074 00073 0200 0220 0109 30 0100 0064 00013 0173 0206 0056 40 0089 0059 00003 0154 0195 0017 Nota MQOhet são MQO levando em conta a heterocedasticidade A característica mais marcante desses resultados é que MQO com ou sem correção para hetero cedasticidade consistentemente sobreestima o verdadeiro erro padrão obtido pelo procedimento correto dos MQG principalmente para valores grandes de Æ estabelecendo dessa forma a supe rioridade dos MQG Os resultados também mostram que se não usamos os MQG e confiarmos nos MQO permitindo ou não a heterocedasticidade teremos um quadro confuso Os erros padrão de MQG são grandes demais para o intercepto ou em geral pequenos demais para o coeficiente angular em relação aos obtidos pelos MQO permitindo a heterocedasticidade A mensagem é clara na presença de heterocedasticidade use os MQG Contudo por razões que explicaremos mais adian te na prática nem sempre é fácil aplicálos Também como discutiremos mais frente se a heteroce dasticidade for muito acentuada não se pode substituir os MQO por MQG ou por MQP Da discussão anterior fica claro que a heterocedasticidade é potencialmente um problema grave e o pesquisador precisa saber se ela está presente em determinada situação Se ela for detectada po demse adotar medidas corretivas como a regressão de mínimos quadrados ponderados ou alguma outra técnica Antes de examinarmos os vários procedimentos corretivos devemos descobrir se a heterocedasticidade está presente ou se provavelmente irá apresentarse em algum caso Esse tópico é discutido na seção a seguir uma nota técnica Embora tenhamos afirmado que em casos de heterocedasticidade são os MQG e não os MQO que são MELNT há exemplos em que os MQO podem ser MELNT apesar da heterocedasticidade8 Mas tais exemplos não são frequentes na prática 115 Detecção da heterocedasticidade Como acontece com a multicolinearidade a questão prática importante é como saber se a hete rocedasticidade está presente em uma situação específica Novamente como no caso da multicolinea ridade não há regras estabelecidas para detectar a heterocedasticidade apenas alguns procedimentos Mas essa situação é inevitável porque só podemos conhecer æi 2 se tivermos toda a população Y cor respondente aos Xs selecionados como a população mostrada na Tabela 21 ou na Tabela 111 Mas tais dados são uma exceção e não a regra na maioria das investigações econômicas Nesse sentido os 8 a razão para isto é que o teorema de Gaussmarkov fornece condição suficiente mas não necessária para que os mQO sejam eficientes a condição necessária e suficiente para os mQO é dada pelo teorema de Kruskal mas esse tópico está além do escopo deste livro Sou grato a michael mcaleer por chamar minha atenção para esse aspecto mais detalhes podem ser encontrados em BartelS michael mcaleer Proprieties of ordinary least squares estimators in regression models with nonspherical disturbances Journal of Econometrics v 54 n 13 p 321334 outdez 1992 p 321334 Para o estudante interessado em matemática esse tópico é discutido em mais detalhes no Apêndice C usando álgebra matricial ECONOBOOKParte02indb 380 23112010 071834 Capítulo 11 Heterocedasticidade o que acontece se a variância do erro não é constante 381 econometristas diferem dos cientistas que investigam áreas como agricultura e biologia em que os pesquisadores têm bastante controle sobre seus dados Com frequência em estudos econômicos há apenas um valor amostral Y correspondente a determinado valor de X e não há como se conhecer æi 2 com base em uma única observação de Y Portanto na maioria dos casos que envolvem investigações econométricas a heterocedasticidade pode ser uma questão de intuição inferências baseadas em in formações experiência empírica anterior ou pura especulação Tendose em mente essa advertência examinemos alguns dos métodos informais e formais para detectar a heterocedasticidade Como a discussão a seguir revelará a maioria desses métodos baseia se no exame dos resíduos dos MQO uOi visto que estes é que são observados e não os termos de erro ui Esperase que sejam boas estimativas de ui o que só poderá ser concretizado se o tamanho da amostra for muito grande Métodos informais Natureza do problema Com muita frequência a natureza do problema em consideração sugere a probabilidade de encon trarmos heterocedasticidade Por exemplo seguindo o trabalho pioneiro de Prais e Houthakker sobre estudos de orçamentos familiares em que verificaram que a variância residual em torno da regressão de consumo sobre a renda aumentava com a renda agora se supõe de modo geral que em estudos semelhantes podese esperar variâncias desiguais entre os termos de erro9 Na verdade em dados de corte transversal envolvendo unidades heterogêneas a heterocedasticidade pode ser a regra e não a exceção Em uma análise de corte transversal que envolve despesas com investimento em rela ção a vendas taxa de juros etc em geral esperase encontrar heterocedasticidade se empresas de tamanho pequeno médio e grande fizerem parte da amostra Na realidade já demos exemplos disso No Capítulo 2 discutimos a relação entre salários médios por hora em relação a anos de escolaridade nos Estados Unidos Naquele capítulo também discutimos a rela ção entre gastos com alimentação e despesas totais para 55 famílias na Índia veja o Exercício 1116 Método gráfico Se não há informações a priori ou empíricas sobre a natureza da heterocedasticidade na prática pode se fazer a análise de regressão supondose que não há heterocedasticidade e então fazer um exame post mortem dos resíduos elevados ao quadrado uOi 2 para ver se exibem um padrão sistemático Embora uOi 2 não sejam o mesmo que u i 2 podem ser substitutos um do outro principalmente se o tamanho da amostra for suficientemente grande10 Um exame do uOi 2 pode revelar padrões como os da Figura 118 A Figura 118 apresenta gráficos de uOi 2 contra YOi o Yi estimado pela linha de regressão para des cobrir se o valor médio estimado de Y está sistematicamente relacionado aos resíduos elevados ao quadrado Na Figura 118a vemos que não há padrão sistemático entre as duas variáveis o que suge re que talvez não haja heterocedasticidade nos dados As Figuras 118b até e no entanto mostram padrões definidos Por exemplo a Figura 118c sugere uma relação linear enquanto as Figuras 118d e e indicam uma relação quadrática entre uOi 2 e YOi Usando tal conhecimento embora informal podese transformar os dados de modo que como resultado não mostrem heterocedasticidade Na Seção 116 examinaremos várias transformações como essas Em vez de traçar o gráfico de uOi 2 contra YOi podese traçálos contra uma das variáveis explanató rias principalmente se traçar uOi 2 a YOi resultar no padrão mostrado na Figura 118a Tal representação gráfica apresentada na Figura 119 pode revelar padrões semelhantes aos vistos na Figura 118 No caso do modelo de duas variáveis traçar o gráfico de uOi 2 contra YOi equivale a traçálo contra Xi e portanto a Figura 119 é semelhante à Figura 118 Quando consideramos um modelo que envolve duas ou mais variáveis X temos uma situação diferente nesse caso uOi 2 pode ser traçado contra qual quer variável X incluída no modelo 9 PraiS S J hOUthaKKer h S The analysis of family budgets Nova York Cambridge University Press 1955 10 Para a relação entre Oui e ui veja maliNVaUD e Statistical methods of econometrics amsterdã North holland Publishing Company 1970 p 8889 ECONOBOOKParte02indb 381 23112010 071835 382 Parte Dois Relaxamento das hipóteses do modelo clássico Figura 118 Padrões hipotéticos de resíduos quadráticos estimados a b c u2 u2 u2 u2 e Y Y Y Y 0 0 0 0 0 u2 d Y Um padrão como o da Figura 119c por exemplo sugere que a variância do termo de erro está relacionada linearmente com a variável X Se na regressão das poupanças contra a renda encontrase um padrão como o da Figura 119c este sugere que a variância heterocedástica pode ser proporcional ao valor da variável renda Tal conhecimento pode ajudar a transformar nossos dados de maneira que na regressão com os dados transformados a variância do termo de erro seja homocedástica Voltare mos a tratar do assunto na próxima seção Figura 119 Diagrama de dispersão dos resíduos estimados ao quadrado contra X a b c u2 u2 u2 u2 e X X X X 0 0 0 0 0 u2 d X ECONOBOOKParte02indb 382 23112010 071835 Capítulo 11 Heterocedasticidade o que acontece se a variância do erro não é constante 383 Métodos formais Teste de Park11 Park formaliza o método gráfico sugerindo que æi 2 seja uma função da variável explanatória Xi A forma funcional sugerida por ele é ou 1151 em que vi é o termo de erro estocástico Uma vez que æi 2 em geral não é conhecido Park sugere usar uOi 2 como proxy e calcular a seguinte regressão 1152 Se Ø for significativo estatisticamente isso sugere que a heterocedasticidade está presente nos dados Se for insignificante podemos aceitar a hipótese da homocedasticidade O teste de Park é um procedimento que envolve duas etapas Na primeira fazemos a regressão de MQO desconsiderando a questão da hetero cedasticidade Obtemos uOi dessa regressão e então na segunda etapa fazemos a regressão 1152 Embora seja interessante do ponto de vista empírico o teste de Park apresenta alguns problemas Goldfeld e Quandt alegaram que o termo de erro vi que entra na Equação 1152 pode não satisfazer as pressuposições dos MQO e ele mesmo pode ser heterocedástico12 No entanto podese usar o teste de Park como um método estritamente exploratório exeMplO 111 Relação entre remuneração e produtividade Para ilustrarmos a abordagem de Park usamos os dados da tabela 111 no cálculo da seguinte regressão em que Y remuneração média em milhares de dólares X produtividade média em mi lhares de dólares e i iésimo tamanho do emprego de estabelecimento Os resultados da regressão são os seguintes 1153 Os resultados revelam que o coeficiente angular estimado é significante no nível de 5 com base no teste t unicaudal a equação mostra que quando a produtividade no trabalho aumenta em por exemplo um dólar a remuneração da mão de obra aumenta em média 23 centavos Continua 11 ParK r e estimation with heterocedastic error terms Econometrica v 34 n 4 p 888 out 1966 O teste de Park é um caso especial do teste geral proposto por a C harVeY a C em estimating regression models with multiplicative heteroscedasticity Econometrica 1976 v 44 n 3 p 461465 12 GOlDFelD Stephen m QUaNDt richard e Nonlinear methods in econometrics amsterdã North holland Publishing Company 1972 p 9394 ECONOBOOKParte02indb 383 23112010 071836 384 Parte Dois Relaxamento das hipóteses do modelo clássico exeMplO 111 Continuação então calculase a regressão dos resíduos obtidos na regressão 1153 contra Xi como sugerido na equação 1152 dando os resultados a seguir 1154 Obviamente não há relação estatisticamente significativa entre as duas variáveis Seguindo o teste de Park podese concluir que não há heterocedasticidade na variância dos erros13 13 Teste de Glejser14 O teste de Glejser tem um espírito semelhante ao de Park Depois de obter os resíduos uOi da re gressão de MQO Glejser sugere a regressão dos valores absolutos de uOi contra a variável X que se considera estreitamente associada a æi 2 Em seus experimentos Glejser usa as seguintes fórmulas funcionais em que vi é o termo de erro Novamente como uma questão prática ou empírica podese usar a abordagem de Glejser Mas Goldfeld e Quandt ressaltam que o termo de erro vi tem alguns problemas uma vez que se espera que seu valor seja diferente de zero esteja correlacionado serialmente veja o Capítulo 12 e ironicamen te seja heterocedástico15 Uma dificuldade adicional com o método de Glejser é que modelos como e são não lineares nos parâmetros e portanto não podem ser estimados com o procedimento usual de MQO Glejser constatou que para amostras grandes os quatro primeiros modelos anteriores em geral apre sentam resultados satisfatórios quanto à detecção da heterocedasticidade Como questão prática a técnica de Glejser pode ser usada para amostras grandes e nas pequenas usase estritamente como um artifício qualitativo para terse uma ideia da heterodasticidade 13 a forma funcional escolhida por Park é apenas sugestiva Uma forma funcional diferente pode revelar relações significativas Por exemplo podese usar uOi 2 em lugar de ln uOi 2 como a variável dependente 14 GleiSer h a new test for heterocedasticity Journal of the American Statistical Association 1969 v 64 p 316323 15 Para detalhes veja GOlDFelD e QUaNDt op cit cap 3 ECONOBOOKParte02indb 384 23112010 071838 Capítulo 11 Heterocedasticidade o que acontece se a variância do erro não é constante 385 exeMplO 112 Relação entre remuneração e produtividade o teste de Glejser Continuando com o exemplo 111 o valor absoluto dos resíduos obtidos da regressão 1153 foram usados no cálculo da regressão contra a produtividade média X dando os seguintes resultados 1155 Como você pode ver dessa regressão não há relação entre o valor absoluto dos resíduos e o regressor a produtividade média tal fato reforça a conclusão com base no teste de Park Teste de correlação por ordem de Spearman No Exercício 38 definimos o coeficiente de correlação por ordem como 1156 em que di diferença nas classificações atribuídas a duas características diferentes do iésimo indi víduo ou fenômeno e n número de indivíduos ou fenômenos classificados O coeficiente de correla ção de ordem precedente pode ser usado para detectar a heterocedasticidade como se segue suponha Yi Ø0 Ø1Xi ui Etapa 1 Ajuste a regressão aos dados em Y e X e obtenha os resíduos uOi Etapa 2 Ignorando o sinal de uOi ou seja tomando o seu valor absoluto uOi ordene tanto uOi quanto Xi ou YOi de acordo com uma ordem ascendente ou descendente e calcule o coeficiente de correlação pela ordem apresentada anteriormente Etapa 3 Supondo que o coeficiente de correlação por ordem da população Ωs seja zero e n 8 a significância de rs na amostra pode ser verificada pelo teste t como a seguir16 1157 com graus de liberdade iguais a n 2 Se o valor t calculado excede o valor crítico t podemos aceitar a hipótese da heterocedasticidade caso contrário rejeitamos Se o modelo de regressão envolver mais de uma variável X rs poderá ser calculado entre uOi e cada uma das variáveis X separadamente e poderá ser testado quanto à signi ficância estatística pelo teste t da Equação 1157 exeMplO 113 Ilustração do teste de correlação por ordem Para ilustrar o teste de correlação por ordem considere os dados da tabela 112 eles pertencem ao retorno anual médio E e ao desvio padrão do retorno anual æi de 10 fundos mútuos Continua 16 Veja YUle G Udny KeNDall m G An introduction to the theory of statistics londres Charles Criffin Company 1953 p 455 ECONOBOOKParte02indb 385 23112010 071838 386 Parte Dois Relaxamento das hipóteses do modelo clássico exeMplO 113 Continuação Tabela 112 Teste de correlação por ordem para a heterocedasticidade Obtido da regressão Ei 58194 04590 æi Valor absoluto dos resíduos Nota classificação por ordem ascendente de valores a linha de mercado de capitais da teoria do portfólio postula uma relação linear entre o re torno esperado Ei e o risco medido pelo desvio padrão æ de um portfólio Usando os dados na tabela 112 o modelo anterior foi estimado e seus resíduos calculados Uma vez que os dados são referentes a 10 fundos mútuos de tamanhos e objetivos de inves timento diferentes a priori podese esperar heterodasticidade Para verificarmos essa hipóte se aplicamos o teste de correlação por ordem Os cálculos necessários estão na tabela 112 aplicando a fórmula 1156 obtemos 1158 aplicando o teste dado na equação 1157 obtemos 1159 Para os 8 graus de liberdade esse valor t não é significativo nem mesmo ao nível de signifi cância de 10 o pvalor é 017 Não há evidência de uma relação sistemática entre a variável explanatória e os valores absolutos dos resíduos o que poderia sugerir que não há heteroce dasticidade Teste de GoldfeldQuandt17 Este método popular é aplicável quando se supõe que a variância heterocedástica æi 2 relacionase positivamente com uma das variáveis explanatórias no modelo de regressão Para simplificarmos consideramos o modelo usual de duas variáveis 17 GOlDFelD e QUaNDt op cit cap 3 ECONOBOOKParte02indb 386 23112010 071840 Capítulo 11 Heterocedasticidade o que acontece se a variância do erro não é constante 387 Suponha que æi 2 relacionese positivamente a Xi como 11510 em que æ2 é uma constante18 A hipótese 11510 postula que æi 2 é proporcional ao quadrado da variável X Tal hipótese foi considerada muito útil por Prais e Houthakker no estudo sobre orçamentos de famílias Veja na Seção 115 o tópico Métodos informais Se a Equação 11510 for adequada significa que æi 2 será maior quanto maiores forem os valores de Xi Se este for o caso a heterodasticidade muito provavelmente estará presente no modelo Para teste Goldfeld e Quandt sugerem as seguintes etapas Etapa 1 Ordene ou classifique as observações de acordo com os valores de Xi a começar pelo valor mais baixo de X Etapa 2 Omita c observações centrais em que c é especificado a priori e divida as observações remanescentes em dois grupos com observações n c2 em cada um Etapa 3 Ajuste as regressões MQO separadas para as primeiras observações n c2 e para as últimas n c2 e obtenha as respectivas somas dos quadrados dos resíduos SQR1 e SQR2 em que SQR1 representa a soma dos quadrados dos resíduos a partir da regressão correspondente aos valores menores de Xi o grupo de pequena variância e SQR2 a partir do conjunto com maiores valores de Xi o grupo com variância maior Essas somas têm cada uma em que k é o número de parâmetros a serem estimados incluindo o intercepto Por quê Para o caso de duas variáveis evidentemente k é igual a 2 Etapa 4 Calcule a razão 11511 Se pressupormos que os ui sejam distribuídos normalmente o que em geral acontece e se a hipótese da homocedasticidade for válida então poderemos mostrar que da Equação 11510 segue a distribuição F tendo o numerador e o denominador n c 2k2 graus de liberdade Se em uma aplicação F calculado for maior que o F crítico ao nível de significância esco lhido poderemos rejeitar a hipótese da homocedasticidade poderemos dizer que a heterocedasticida de é muito provável Antes de apresentarmos uma ilustração do teste examinemos a omissão das c observações centrais Essas observações são omitidas para ressaltar ou acentuar a diferença entre o grupo com variâncias pequenas SQR1 e o de grandes variâncias SQR2 Mas o sucesso dos resultados obtidos com o teste GoldfeldQuandt dependerá de como c é escolhido19 Para o modelo de duas variáveis os experimentos de Monte Carlo feitos por Goldfeld e Quandt sugerem que c seja cerca de 8 se o tamanho da amostra for de aproximadamente 30 e que seja cerca de 16 se o tamanho aproximado for de 60 Mas Judge et al observam que c 4 se n 30 e c 10 se n for cerca de 60 são valores satisfatórios na prática20 18 esta é apenas uma pressuposição plausível Na realidade exigese que æi 2 esteja monotonicamente relacionada a Xi 19 tecnicamente a potência do teste depende de como c é escolhido em estatística a potência de um teste é medida pela probabilidade de rejeitar a hipótese nula quando ela é falsa isto é por 1 Prob erro de tipo ii aqui a hipótese nula é que as variâncias dos dois grupos são as mesmas ou seja homocedasticidade Para outras discussões veja ali m m GiaCCOttO C a study of several new and existing tests for heteroscedas ticity in the general linear model Journal of Econometrics 1984 v 26 p 335373 20 JUDGe George G hill r Carter GriFFithS William e lUKePOhl helmut lee tsoyngChao Introduction to the theory and practice of econometrics Nova York John Wiley Sons 1982 p 422 ECONOBOOKParte02indb 387 23112010 071841 388 Parte Dois Relaxamento das hipóteses do modelo clássico Antes de prosseguirmos podemos notar que quando há mais de uma variável X no modelo a classificação das observações o primeiro passo do teste pode ser feito de acordo com qualquer uma delas Assim no modelo Yi Ø1 Ø2X2i Ø3X3i Ø4X4i ui podemos ordenar os dados de acordo com qualquer um desses X Se a priori não estamos certos de qual variável X é adequada podemos conduzir o teste para cada uma das variáveis X ou por meio do teste de Park para cada X exeMplO 114 Teste de GoldfeldQuandt Para ilustrar o teste de GoldfeldQuandt apresentamos na tabela 113 dados sobre gas tos de consumo em relação à renda para um corte transversal de 30 famílias Supõese que postulamos que os gastos de consumo tenham uma relação de linearidade com a renda mas que a heterocedasticidade esteja presente nos dados Postulamos ainda que a natureza da heterocedasticidade seja aquela dada na equação 11510 O reordenamento necessá rio dos dados para a aplicação do teste também está presente na tabela 113 eliminando as 4 observações do meio as regressões de mQO para as 13 primeiras e para as 13 últimas observações e suas somas dos quadrados dos resíduos associadas são mostradas a seguir erros padrão entre parênteses Tabela 113 Dados hipotéticos sobre gastos de consumo Y e renda X para ilustrar o teste de GoldfeldQuandt Regressão baseada nas 13 últimas observadas Continua ECONOBOOKParte02indb 388 23112010 071841 Capítulo 11 Heterocedasticidade o que acontece se a variância do erro não é constante 389 exeMplO 114 Continuação Regressão baseada nas 13 últimas observadas O valor crítico de F para 11 graus de liberdade no numerador e no denominador no nível de 5 é 282 Uma vez que o F estimado excede o valor crítico podemos concluir que há heterocedasticidade na variância de erro entretanto se o nível de significância for fixado em 1 não podemos rejeitar a suposição de homocedasticidade Por quê Note que o p valor do observado é 0014 Teste de BreuschPaganGodfrey21 O sucesso do teste de GoldfeldQuandt depende não só do valor de c o número de observações centrais omitidas mas também de identificar a variável X correta com a qual se colocam as observa ções em ordem Essa limitação do teste pode ser evitada se considerarmos o teste de BreuschPagan Godfrey BPG Para ilustrálo considere um modelo de regressão linear com k variáveis explicativas 11512 Suponha que a variância do erro æi 2 seja descrita como 11513 ou seja æi 2 é uma função das variáveis não estocásticas Z alguns ou todos os Xs podem servir como Zs Especificamente suponha que 11514 ou seja æi 2 é uma função linear dos Z Se Æ2 Æ3 Æm 0 æi 2 Æ1 que é uma constante Por tanto para testarmos se æi 2 é homocedástico podemos testar a hipótese de que Æ2 Æ3 Æm 0 Essa é a ideia básica do teste de BreuschPaganGodfrey Segue o procedimento para o teste Etapa 1 Calcule a Equação 11512 por MQO e obtenha os resíduos uO1 uO2 uOn Etapa 2 Obtenha Lembrese do Capítulo 4 que este é o estimador de máxima verossimilhança MV de æ2 Nota o estimador de MQO é Etapa 3 Construa variáveis pi definidas como que são simplesmente cada resíduo elevado ao quadrado dividido por Qæ 2 Etapa 4 Faça a regressão de pi assim construída sobre os Zs como 11515 em que vi é o termo residual dessa regressão 21 BreUSCh t PaGaN a a simple test for heteroscedasticidade and random coefficient variation Econometrica 1979 v 47 p 12871294 Veja também GODFreY l testing for multiplicative heteroscedasticity Journal of Econometrics v 8 p 227236 1978 Devido à similaridade esses testes são conhecidos como testes de BreuschPaganGodfrey para heterocedasticidade ECONOBOOKParte02indb 389 23112010 071843 390 Parte Dois Relaxamento das hipóteses do modelo clássico Etapa 5 Obtenha SQE soma dos quadrados explicados da Equação 11515 e defina 11516 Supondo que os ui sejam normalmente distribuídos podese mostrar que se há homocedasticida de e se o tamanho da amostra n aumenta indefinidamente então 11517 ou seja 2 segue a distribuição de quiquadrado com m 1 graus de liberdade Nota ass significa assintoticamente Portanto se em uma aplicação o 2 2 calculado for maior que o valor crítico 2 no nível escolhido de significância poderemos rejeitar a hipótese de homocedasticidade caso contrário esta não será rejeitada O leitor pode desejar saber por que BPG BreuschPaganGodfrey escolheu ½ SQE como a es tatística de teste A lógica é ligeiramente complexa sendo deixada para as referências22 exeMplO 115 Teste de Breusch PaganGodfrey BPG Como exemplo retomemos os dados tabela 113 usados para ilustrar o teste de hetero cedasticidade de GodfeldQuandt Fazendo a regressão de Y contra X obtemos o seguinte Etapa 1 11518 Etapa 2 Etapa 3 Divida os resíduos elevados ao quadrado Oui obtidos da regressão 11518 por 787051 para construir a variável pi Etapa 4 Supondo que os pi sejam linearmente relacionados a Xi Zi como na equação 11514 obtemos a regressão 11519 Etapa 5 11520 Sob os pressupostos do teste BPG 2 na equação 11520 segue assintoticamente a distribui ção quiquadrado com 1 grau de liberdade Nota há apenas um regressor na equação 11519 agora da tabela do quiquadrado verificamos que para 1 grau de liberdade o valor crítico de quiquadrado a 5 é 38414 e o valor de 2 a 1 é de 66349 Dessa forma o valor observado do quiquadrado de 52140 é significativo ao nível de 5 mas não ao nível de 1 Portanto chegamos à mesma conclusão que o teste de GoldfeldQuandt mas lembrese de que falando estritamente o teste BPG é assintótico de grandes amostras e no exemplo em questão 30 observações podem não constituir uma amostra grande também é preciso ressal tar que em amostras pequenas o teste é sensível à hipótese de que erros ui sejam normalmente distribuídos evidentemente podemos testar o pressuposto de normalidade aplicando os testes discutidos no Capítulo 523 23 22 Veja DarNell adrian C A dictionary of econometrics Cheltenham UK edward elgar 1994 p 178179 23 Sobre o assunto veja KOeNKer r a note on studentizing a test for heteroscedasticity Journal of Econometrics 1981 v 17 p 11801200 ECONOBOOKParte02indb 390 23112010 071845 Capítulo 11 Heterocedasticidade o que acontece se a variância do erro não é constante 391 Teste geral de heterocedasticidade de White Ao contrário do teste de GoldfeldQuandt que requer a reordenação das observações com respeito à variável X que supostamente causa heterocedasticidade ou o teste de BPG que é sensível à hipótese da normalidade o teste geral da heterocedasticidade proposto por White não requer a hipótese da normali dade e é facilmente implementado24 Para ilustrar a ideia considere o modelo de regressão a seguir com três variáveis a generalização para o modelo com k variáveis é direta 11521 Para realizar o teste de White procedese da seguinte forma Etapa 1 Com os dados calculamos a Equação 11521 e obtemos os resíduos uOi Etapa 2 Então fazemos a seguinte regressão auxiliar 1152225 Ou seja os resíduos ao quadrado da regressão original são calculados por regressão contra as variáveis ou regressores X originais seus valores elevados ao quadrado e os produtos cruzados dos regressores Também podem ser incluídos regressores com expoentes mais altos Observe que há um termo constante nessa equação embora a regressão original possa ou não contêlo Obtenha o R2 dessa regressão auxiliar Etapa 3 Sob a hipótese nula de que não há heterocedasticidade podese mostrar que o tamanho da amostra n multiplicado pelo R2 da regressão auxiliar segue assintoticamente a distribuição de quiquadrado com graus de liberdade iguais ao número de regressores excluindose o termo constante na regressão auxiliar Isto é 11523 em que os graus de liberdade são definidos como anteriormente Em nosso exemplo há 5 graus de liberdade uma vez que há 5 regressores na regressão auxiliar Etapa 4 Se o valor do quiquadrado obtido na Equação 11523 excede o valor crítico do qui quadrado ao nível escolhido de significância a conclusão é de que há heterocedasticidade Se ele não exceder o valor crítico do quiquadrado não haverá heterocedasticidade indicando que na regressão auxiliar 11522 Æ2 Æ3 Æ4 Æ5 Æ6 0 veja a nota de rodapé 2526 exeMplO 116 Teste de heteroce dasticidade de White Com os dados do corte transversal de 41 países Stephen lewis estimou o modelo de re gressão a seguir26 11524 em que Y valor proporcional dos impostos de importação e exportação no total da receita do governo X2 valor proporcional da soma de exportações mais importações relativas ao PiB e X3 PiB per capita e ln representa o logaritmo natural Sua hipótese foi de que Y e X2 estariam positivamente correlacionados quanto mais alto o volume de transações comerciais mais alta a receita tributária gerada e que Y e X3 estariam negativamente relacionadas quando a renda aumenta o governo acha mais fácil cobrar impostos diretos por exemplo imposto de renda do que contar com impostos incidentes sobre transações comerciais Continua 24 White h a heteroscedasticity consistent covariance matrix estimator and a direct test of heteroscedasticity Econometrica 1980 v 48 p 817818 25 implícita neste procedimento está a hipótese de que a variância do erro de ui s2 i está funcionalmente relaciona da a regressores seus quadrados e seus produtos cruzados Se todos os coeficientes angulares parciais nessa re gressão são simultaneamente iguais a zero então a variância do erro é a constante de homocedasticidade igual a1 26 leWiS Stephen r Government revenue from foreign trade Manchester School of Economics and Social Studies 1963 v 31 p 3947 ECONOBOOKParte02indb 391 23112010 071846 392 Parte Dois Relaxamento das hipóteses do modelo clássico exeMplO 116 Continuação Os resultados empíricos corrobararam as hipóteses Para nossos fins o importante é se há heterocedasticidade nos dados Uma vez que os dados provêm de corte transversal envolven do países heterogêneos a priori se esperaria heterocedasticidade na variância dos erros ao aplicar o teste de heterocedasticidade de White aos resíduos obtidos da regressão 11524 foram obtidos os seguintes resultados27 11525 Nota os erros padrão não são apresentados pois não são pertinentes para nossos fins agora n R2 41 01148 47068 tem assintoticamente uma distribuição quiquadrado com 5 graus de liberdade por quê O valor crítico de 5 graus de liberdade para o qui quadrado e nível de significância de 5 é de 110705 e com significância de 10 é de 92363 e com 25 é de 662568 Para fins práticos podemos concluir com base no teste de White que não há heterocedasticidade 27 Vale fazer um comentário sobre o teste de White Se um modelo tem vários regressores introduzir todos os regressores seus termos ao quadrado ou a potências mais elevadas e seus pontos cruzados pode consumir rapidamente os graus de liberdade Portanto devese ter cautela para usar o teste28 Em casos em que o teste estatístico de White apresentado em 11525 é estatisticamente signifi cante a heterocedasticidade pode não ser necessariamente a causa mas os erros de especificação sobre os quais discorreremos mais detalhadamente no Capítulo 13 veja o item 5 da Seção 111 Em outras palavras o teste de White pode ser um teste de heterocedasticidade pura ou de erro de especificação ou ambos Já afirmamos que se não houver termos de produtos cruzados ele será um teste de heterocedasticidade pura Se tais termos estão presentes tratase de um teste tanto de hetero cedastocidade quanto de viés de especificação29 Outros testes de heterocedasticidade Há vários outros testes de heterocedasticidade cada qual baseado em certas hipóteses O leitor in teressado poderá desejar consultar as referências30 Mencionamos apenas um desses testes devido à sua simplicidade É o teste de KoenkerBassett KB Como os testes de Park de BreuschPagan Godfrey e de White o teste KB baseiase nos resíduos elevados ao quadrado uOi 2 mas em vez de se fazer a regressão com um ou mais regressores os resíduos elevados ao quadrado são regredidos contra os valores estimados do regressando elevados ao quadrado Especificamente se o modelo original é 11526 estimamos esse modelo obtemos os uOi e então estimamos 11527 27 estes resultados com a mudança na notação são reproduzidos de lOtt William F raY Subhash C Applied econometrics problems with data sets Instructors Manual cap 22 p 137140 28 Às vezes o teste pode ser modificado para conservar graus de liberdade Veja o exercício 1118 29 Veja harriS richard Using cointegration analysis in econometrics modelling reino Unido Prentice hall harvester Wheatsheaf 1995 p 68 30 Veja harriSON m J mCCaBe B P a test for heteroscedasticity based on ordinary least squares residuals Journal of the American Statistical Association v 74 p 494499 SZrOeter J a class of parametric tests for heteroscedasticity in linear econometric models Econometrica v 46 p 13111327 1978 eVaNS m a KiNG m l a further class of tests for heteroscedasticity Journal of Econometrics v 37 p 265276 1988 KOeNler r BaSSett G robust tests for heteroscedastividy based on regression quantiles Econometrica 1982 v 50 p 4361 ECONOBOOKParte02indb 392 23112010 071846 Capítulo 11 Heterocedasticidade o que acontece se a variância do erro não é constante 393 em que YOi são os valores estimados do modelo 11526 A hipótese nula é de que Æ2 0 Se esta não for rejeitada então se poderia concluir que não há heterocedasticidade A hipótese nula pode ser tes tada pelo teste usual t ou pelo teste F Note que F1k tk 2 Se o modelo 11526 for loglog fazse a regressão de log YOi2 contra os quadrados dos resíduos Outra vantagem do teste de KB é que ele é aplicável mesmo quando o termo de erro no modelo original 11526 não é distribuído normalmente Se aplicarmos o teste de KB ao Exemplo 111 veremos que o coeficiente angular da regressão dos quadrados dos resíduos obtidos na Equação 1153 sobre o YO 2 i estimado da Equação 1153 não difere estatisticamente de zero reforçando assim o teste de Park Esse resultado não deveria sur preender uma vez que no caso só temos um regressor Mas o teste de KB é aplicável com um ou mais regressores Uma observação a respeito dos testes de heterocedasticidade Discutimos vários testes de heterocedasticidade nesta seção De que maneira decidimos qual é o melhor Esta não é uma questão fácil pois esses testes baseiamse em vários pressupostos Ao com pararmos os testes precisamos prestar atenção ao seu tamanho ou nível de significância potência a probabilidade de rejeitar uma hipótese falsa e a sensibilidade a discrepâncias outliers Já apontamos algumas das limitações do teste de White para heterocedasticidade que é fácil de aplicar Em decorrência dessas limitações podese ter uma baixa potência contra as alternativas Além disso o teste ajuda pouco na identificação dos fatores ou variáveis que causam heterocedasticidade Da mesma forma o teste de BreuschPaganGodfrey é sensível à hipótese da normalidade Em contra partida o de KoenkerBassett não conta com a hipótese da normalidade e pode portanto ser mais potente31 No teste de GoldfeldQuandt se omitimos muitas observações podemos diminuir sua performance Apresentar análise comparativa dos vários testes de heterocedasticidade é algo que vai além do escopo deste livro Mas o leitor interessado pode consultar o artigo de John Lyon e ChinLing Tsai para ter ideia dos pontos fortes e fracos de vários testes de heterocedasticidade32 116 Medidas corretivas Como vimos a heterocedasticidade não destrói as propriedades de não tendenciosidade e consis tência dos estimadores de MQO mas eles deixam de ser eficientes mesmo assintoticamente em grandes amostras A falta de eficiência torna duvidoso o valor dos procedimentos usuais de teste de hipóteses Portanto medidas corretivas podem ser necessárias Há duas abordagens para a correção quando æi 2 é conhecido e quando não é conhecido Quando Íi 2 é conhecido o método de mínimos quadrados ponderados Como vimos na seção 113 se æi 2 é conhecido o método mais prático para corrigir heterocedasti cidade é por meio dos mínimos quadrados ponderados pois os estimadores obtidos são MELNT exeMplO 117 Ilustração do método de mínimos quadrados ponderados Para ilustrarmos o método suponha que desejemos estudar a relação entre remuneração e o número de funcionários para os dados apresentados na tabela 111 Para simplificarmos medimos o número de funcionários por 1 14 funcionários 2 59 funcionários 9 10002499 funcionários embora também pudéssemos medilo pelo ponto médio das várias classes apresentadas no quadro Continua 31 Para detalhes veja GreeN William h Econometric analysis 6 ed Nova Jersey PearsonPrenticehall 2008 p 165167 32 Veja o artigo deles a comparison of tests of heteroscedasticity The Statician 1996 v 45 n 3 p 337349 ECONOBOOKParte02indb 393 23112010 071847 394 Parte Dois Relaxamento das hipóteses do modelo clássico exeMplO 117 Continuação agora representando a remuneração média por funcionário em por Y e o número de funcionários por X calculamos a regressão conforme mostra a 1161 em que æi é o desvio padrão da remuneração conforme mostrado na tabela 111 Os dados necessários para avaliar esta regressão são fornecidos na tabela 114 Tabela 114 Ilustração de uma regressão de mínimos quadrados ponderados Fonte os dados de Y e æi desvio padrão da remuneração são da Tabela 111 Número de funcionários 1 H 1 a 4 2 H 5 a 9 etc Esses dados também foram extraídos da Tabela 111 Nota na regressão 1162 a variável dependente é Yiæi e as variáveis independentes são 1æi e Xiæi antes de passar para os resultados da regressão note que a equação 1161 não possui termo de intercepto Por quê teremos de usar o modelo de regressão que passa pela ori gem para estimar Ø1 e Ø2 assunto discutido no Capítulo 6 mas a maioria dos programas de computador atuais tem uma opção para suprimir o termo de intercepto como ocorre com o Minitab ou o eViews Vale ressaltar outro aspecto importante da equação 1161 ela tem duas variáveis explanatórias 1æi e Xi æi enquanto se tivéssemos de usar os mQO o cálculo de re gressão da remuneração contra o número de funcionários teria uma única variável explanatória Xi Por quê Os resultados de regressão com mQP são os seguintes 1162 Por comparação damos os resultados usuais ou não ponderados de mQO 1163 No exercício 117 pedese para comparar essas duas regressões 33 Quando Íi 2 não é conhecido Como notado anteriormente se os verdadeiros æi 2 forem conhecidos poderemos empregar o mé todo dos MQP para obter estimadores MELNT Uma vez que os verdadeiros æi 2 raramente são conhe 33 De acordo com a nota de rodapé 3 do Capítulo 6 a regressão de R2 através da origem não é diretamente comparável com a R2 do atual modelo intercepto O R2 avaliado de 09993 considera esta diferença Veja os vários programas para mais detalhes sobre como o R2 está correto ao considerar a ausência do termo intercepto Veja também o apêndice 6a Seção 6a1 ECONOBOOKParte02indb 394 23112010 071848 Capítulo 11 Heterocedasticidade o que acontece se a variância do erro não é constante 395 cidos haverá uma forma de obter estimativas consistentes no sentido estatístico das variâncias e covariâncias dos estimadores de MQO mesmo quando há heterocedasticidade A resposta é sim Variâncias e erros padrão consistentes para heterocedasticidade de White White mostrou que esta estimativa pode ser realizada de modo que inferências estatísticas válidas assintoticamente ie para amostras grandes possam ser feitas sobre os verdadeiros valores dos parâmetros34 Não apresentaremos os detalhes matemáticos pois estão além do escopo deste livro No entanto o Apêndice 11 A4 delineia o procedimento de White Hoje vários programas apresentam as variâncias de heterocedasticidade de White e erros padrão com as variâncias dos MQO e erros padrão usuais35 A propósito os erros padrão corrigidos para a heterocedasticidade de White também são conhecidos como erros padrão robustos36 exeMplO 118 Ilustração de procedimento de White Como exemplo vejamos os resultados de Greene36 1164 em que Y gastos per capita com escolas públicas por estado em 1979 e renda renda per capita por estado em 1979 a amostra consistia em 50 estados mais Washington DC Como os resultados anteriores mostram os erros padrão corrigidos para heterocedasticidade são consideravelmente maiores que os obtidos pelos MQO Com base nos últimos ambos os regressores são estatisticamente significantes no nível de 5 com base nos estimadores de White eles não são Devese destacar que os erros padrão corrigidos para heterocedasticidade de White podem ser maio res ou menores que os não corrigidos Uma vez que os estimadores consistentes para heterocedasticidade de White agora estão disponíveis em programas de regressão recomendase que o leitor os indique Como Wallace e Silver observam Em termos gerais provavelmente é uma boa ideia usar a opção de WHITE disponível em programas de regressão como rotina talvez comparando o resultado com resultados obtidos regularmente com os MQO como verificação para ver se a heterocedasticidade é um problema grave em determinado con junto de dados37 Hipóteses plausíveis sobre o padrão de heterocedasticidade Além de ser usado para amostras amplas uma desvantagem do procedimento de White é que os estimadores obtidos podem não ser tão eficientes quanto os obtidos pelos métodos que transformam dados para refletir tipos específicos de heterocedasticidade Para ilustrar isso voltemos ao modelo de regressão de duas variáveis Agora consideramos várias pressuposições sobre o padrão de heterocedasticidade 34 Veja h White op cit 35 tecnicamente eles são conhecidos como estimadores consistentes da matriz de covariância para heterocedasticidade 36 GreeNe William h Econometric analysis 2 ed Nova York macmillan 1993 p 385 37 WallaCe t Dudley SilVer J lew Econometrics an introduction reading mass addisonWesley 1988 p 265 ECONOBOOKParte02indb 395 23112010 071848 396 Parte Dois Relaxamento das hipóteses do modelo clássico HIPótEsE 1 a variância do erro é proporcional a X i 2 116538 38 Se em função de métodos gráficos especulativos ou das abordagens de Park e Glejser acredi tamos que a variância de ui é proporcional ao quadrado da variável explanatória X veja a Figura 1110 podese transformar o modelo original como se segue Dividimos o modelo original por Xi 1166 em que vi é o termo de erro transformado igual a ui Xi Agora é fácil verificar que Por isso a variância de vi agora é homocedástica e podese proceder aplicando os MQO à equação transformada 1166 fazendo a regressão Yi Xi contra 1 Xi Note que na regressão transformada o termo de intercepto Ø2 é o coeficiente angular na equação original e o coeficiente angular Ø1 é o termo de intercepto no modelo original Para voltarmos ao modelo original temos de multiplicar a equação estimada 1166 por Xi Uma aplicação dessa trans formação está no Exercício 1120 HIPótEsE 2 a variância de erro é proporcional a Xi a transformação raiz quadrada 1167 38 lembrese de que já encontramos essa hipótese em nossa discussão do teste de GoldfeldQuandt Figura 1110 Variância do erro proporcional a X 2 X σ i 2 σ ECONOBOOKParte02indb 396 23112010 071849 Capítulo 11 Heterocedasticidade o que acontece se a variância do erro não é constante 397 Se acreditamos que a variância de ui em vez de ser proporcional ao Xi elevado ao quadrado é proporcional ao próprio Xi o modelo original pode ser transformado da seguinte maneira veja a Fi gura 1111 1168 em que e Xi 0 Dada a Hipótese 2 podese verificar prontamente que E v i 2 æ2 uma situação homocedástica Portanto podese prosseguir e aplicar os MQO a 1168 fazendo a regressão de e Note um importante aspecto do modelo transformado não há o termo intercepto Portanto é ne cessário utilizar o modelo regressão através da origem para estimar Øi e Ø2 Pela Equação 1168 obtémse o modelo original simplesmente multiplicando a Equação 1168 por Um caso interessante é o modelo de intercepto zero a saber Neste caso a Equa ção 1168 tornase 1168a E podese mostrar que 1168b Ou seja o estimador de mínimos quadrados ponderados é apenas a relação entre as variáveis de pendente e explanatória Para provar a Equação 1168b aplique a fórmula de regressão que passa pela origem dada na Equação 616 HIPótEsE 3 a variância do erro é proporcional ao quadrado do valor médio de Y 1169 Figura 1111 Variância do erro proporcional a X X σ i 2 σ ECONOBOOKParte02indb 397 23112010 071852 398 Parte Dois Relaxamento das hipóteses do modelo clássico A Equação 1169 postula que a variância de ui é proporcional ao quadrado do valor esperado de Y veja a Figura 118e Agora Portanto se transformamos a equação original como se segue 11610 em que vi ui E Yi podese ver que E v i 2 æ2 isto é os termos de erro vi são homocedásticos A regressão 11610 irá satisfazer a hipótese da homocedasticidade do modelo clássico de re gressão linear A transformação 11610 é no entanto inoperante porque E Yi depende de Ø1 e Ø2 que são desconhecidos Evidentemente sabemos que YOi ØO1 ØO2 Xi que é um estimador de E Yi Podemos prosseguir em duas etapas primeiro fazemos a regressão usual de MQO sem levar em consideração o problema da heterocedasticidade e obtemos YOi Então usando o YOi estimado transformamos nosso modelo da seguinte maneira 11611 em que vi ui YOi Na segunda etapa calculamos a regressão 11611 Embora YOi não seja exata mente E Yi eles são estimadores consistentes isto é quando o tamanho da amostra aumenta indefini damente eles convergem para os verdadeiros E Yi Desse modo a transformação 11611 terá um desempenho satisfatório na prática se o tamanho da amostra for razoavelmente grande HIPótEsE 4 Uma transformação logarítmica como 11612 muito frequentemente reduz a heterocedasticidade quando comparada com a regressão Yi Ø1 Ø2Xi ui Esse resultado ocorre porque a transformação logarítmica comprime as escalas em que as variáveis são medidas reduzindo uma diferença de dez vezes entre dois valores para uma diferença de duas vezes Assim o número 80 é 10 vezes o número 8 mas ln 80 43280 é cerca de duas vezes maior que ln 8 20794 Uma vantagem adicional da transformação logarítmica é que o coeficiente angular Ø2 mede a elasticidade de Y com relação a X ou seja a mudança percentual em Y para uma mudança percentual em X Por exemplo se Y é consumo e X é renda Ø2 na Equação 11612 mede a elasticidade da renda enquanto no modelo original Ø2 mede apenas a taxa de variação do consumo médio por unida de de variação na renda Essa é uma das razões para os modelos logarítmicos serem muito populares em econometria empírica O Exercício 114 apresenta alguns dos problemas associados à transfor mação logarítmica Para concluirmos nossa discussão das medidas corretivas voltamos a enfatizar que todas as trans formações discutidas anteriormente são ad hoc estamos especulando sobre a natureza do æi 2 Depen dendo da natureza do problema e da gravidade da heterocedasticidade determinaremos qual das transformações discutidas funcionará Há alguns problemas adicionais com as transformações consi deradas que deveríamos ter em mente ECONOBOOKParte02indb 398 23112010 071853 Capítulo 11 Heterocedasticidade o que acontece se a variância do erro não é constante 399 1 Quando vamos além do modelo de duas variáveis podemos não saber a priori qual das variáveis X e Y deverá ser escolhida para transformar os dados39 2 A transformação logarítmica conforme discutido na Hipótese 4 não é aplicável se alguns dos valores de X e Y forem zero ou negativos40 3 Há o problema de correlação espúria Esse termo atribuído a Karl Pearson referese à situação em que se encontra correlação nas razões das variáveis mesmo que as variáveis originais não estejam correlacionadas ou sejam aleatórias41 Assim no modelo Yi Ø1 Ø2 Xi ui Y e X podem não estar correlacionados mas no modelo transformado Yi Xi Ø11Xi Ø2 YiXi e 1 Xi estão frequentemente correlacionados 4 Quando os æi 2 não são conhecidos diretamente e são estimados com base em uma ou mais transfor mações discutidas anteriormente todos os nossos procedimentos de uso dos testes t testes F etc são falando em termos estritos válidos somente para amostras maiores É preciso ser cuidadoso para interpretar os resultados com base nas várias transformações em amostras pequenas ou finitas42 117 Exemplos finais Para concluirmos nossa discussão sobre heterocedasticidade apresentamos três exemplos ilus trando os principais pontos abordados neste capítulo exeMplO 119 Mortalidade infantil revisitada retornemos ao exemplo da mortalidade infantil considerado em várias ocasiões Dos dados para 64 países obtemos os resultados de regressão mostrados na equação 814 Uma vez que temos dados de corte transversal envolvendo diversos países com diferentes experiências de mortalidade é provável que possamos encontrar heterocedasticidade Para descobrir isso vamos primeiro considerar os resíduos obtidos na equação 814 esses resí duos são traçados graficamente na Figura 1112 Dessa figura parece que os resíduos não mostram qualquer padrão distinto que possa sugerir heterocedasticidade No entanto as aparências enganam Vamos aplicar os testes de Park Glejser e White para verificar se há qualquer evidência de heterocedasticidade teste de Park Como há dois regressores o PNB e o taF podemos fazer a regressão dos resíduos elevados ao quadrado por meio da regressão 814 em qualquer uma das variáveis Ou então podemos fazer a regressão deles contra os valores estimados de mi obtidos na regressão 821 Com esta última obtivemos os seguintes resultados 1171 Nota Oui são resíduos obtidos da regressão 814 e mi são os valores estimados de da re gressão 814 Continua 39 entretanto por praticidade podese plotar ûi 2 contra cada variável e decidir qual variável X pode ser usada para transformar os dados Veja a Figura 119 40 Às vezes podemos usar ln Yi k ou ln Xi k em que k é um número positivo escolhido de tal maneira que todos os valores de Y e X tornemse positivos 41 Por exemplo se X1 X2 e X3 são mutuamente não correlacionadas r12 r13 r23 0 e constatamos que os va lores das razões X1 X3 e X2 X3 são correlacionados então há uma correlação espúria em termos mais gerais a correlação poderá ser descrita como espúria se for induzida pelo método de condução dos dados e não esti ver presente no material original KeNDall m G BUCKlaND W r A dictionary of statistical terms Nova York hafner Publishing 1972 p 143 42 Para maiores detalhes veja JUDGe George G et al op cit seção 144 p 415420 ECONOBOOKParte02indb 399 23112010 071853 400 Parte Dois Relaxamento das hipóteses do modelo clássico exeMplO 119 Continuação Como mostra essa regressão não há relação sistemática entre os resíduos elevados ao quadrado e os valores estimados de mi por quê sugerindo que a hipótese de homocedas ticidade pode ser válida Por sinal regressar o logaritmo dos valores de resíduos elevados ao quadrado no logaritmo de não mudou a conclusão teste de Glejser Os valores absolutos dos resíduos obtidos na equação 814 quando regredidos contra o valor estimado de mi da mesma regressão deram os seguintes resultados 1172 Novamente não há uma relação muito sistemática entre os valores absolutos dos resíduos e os valores estimados de mi na medida em que o coeficiente angular t não é significativo estatisticamente teste de White aplicando o teste de heterocedasticidade de White com e sem os ter mos dos produtos cruzados não encontramos evidências de heterocedasticidade também estimamos novamente a equação 814 para obter os erros padrão e os valores de t consis tentes com a heterocedasticidade de White mas os resultados foram semelhantes aos da equação 814 o que não deveria surpreender tendo em vista os vários testes de heteroce dasticidade conduzidos anteriormente em resumo parece que nossa regressão de mortalidade infantil 814 não sofre de hete rocedasticidade Figura 1112 Resíduos da regressão 814 5 100 10 15 20 25 30 35 40 45 50 55 60 65 50 0 50 100 exeMplO 1110 Despesas com PD vendas e lucro em 14 segmentos industriais nos Estados Unidos 2005 a tabela 115 apresenta dados sobre gastos com pesquisa e desenvolvimento PD vendas e lucro para 14 segmentos industriais nos estados Unidos em milhões de dólares Uma vez que os dados de corte transversal desta tabela são bastante heterogêneos em uma regressão de PD contra as vendas a heterocedasticidade é provável Os resultados de re gressão são os seguintes 1173 Não é de surpreender que haja uma relação positiva entre PD e vendas embora não seja estatisticamente positiva nos níveis tradicionais Continua ECONOBOOKParte02indb 400 23112010 071854 Capítulo 11 Heterocedasticidade o que acontece se a variância do erro não é constante 401 ExEmplo 1110 Continuação TabEla 115 Vendas e emprego para empresas com desempenho industrial de PD nos Estados Unidos por setor 2005 valores em milhões de dólares Fonte National Science Foundation Division of Science Resources Statistics Survey of Industrial Research and Development 2005 e o US Census Bureau Annual Survey of Manufactures 2005 Para ver se a regressão 1173 sofre de heterocedasticidade obtemos os resíduos uOi e os resíduos elevados ao quadrado uOi 2 do modelo e plotamos contra vendas como mostra a Figura 1113 Observando essa figura parece haver um padrão sistemático entre os resíduos e os resíduos elevados ao quadrado e vendas sugerindo heterocedasticidade Para testarmos formal mente empregamos os testes de Park Glejser e White que deram os resultados a seguir Figura 1113 a e resíduos ao quadrado b contra vendas 0 20000 100000 200000 Vendas 300000 400000 10000 10000 0 20000 Resíduos 30000 0 0 100000 200000 300000 Vendas 400000 100000000 200000000 Resíduos ao quadrado 300000000 400000000 500000000 Continua CAP11indd 401 23112010 085441 402 Parte Dois Relaxamento das hipóteses do modelo clássico exeMplO 1110 Continuação teste de Park 1174 O teste de Park sugere que há uma relação significativa positiva entre os resíduos elevados ao quadrado e as vendas teste de Glejser 1175 O teste de Glejser também sugere que há uma relação sistemática entre os valores abso lutos dos resíduos e vendas levantando a possibilidade de que a regressão 1173 seja afe tada pela heterocedasticidade teste de White 1176 Usando o valor de R2 e n 14 obtemos n R2 6090 Sob a hipótese nula de ausência de heterocedasticidade isto deveria seguir uma distribuição de quiquadrado com 2 graus de liberdade porque há dois regressores na equação 1176 O Ωvalor de obter um valor qui quadrado de pelo menos 6090 ou maior é cerca de 00476 Uma vez que esse é um valor baixo o teste de White também sugere que há heterocedasticidade em resumo com base nos gráficos dos resíduos e dos testes de Park Glejser e White parece que nossa regressão de PD 1173 é afetada pela heterocedasticidade Como a verdadeira variância do erro não é conhecida não podemos usar o método dos mínimos quadrados ponderados para obter os erros padrão e valores t corrigidos para heterocedasti cidade temos de fazer suposições com base nos dados disponíveis sobre a natureza da variância do erro Para concluirmos nosso exemplo apresentamos os erros padrão consistentes com a hete rocedasticidade de White como discutido na Seção 116 1177 Comparando a equação 1177 com a equação 1173 a última não tendo sido correlacionada para heterocedasticidade vemos que as estimativas dos parâmetros não mudaram como esperaríamos o erro padrão do coeficiente de intercepto diminuiu ligei ramente e o erro padrão do coeficiente angular aumentou ligeiramente mas lembrese de que o procedimento de White é estritamente de amostra grande enquanto temos apenas 14 observações ECONOBOOKParte02indb 402 23112010 071856 Capítulo 11 Heterocedasticidade o que acontece se a variância do erro não é constante 403 Capítulo 11 Heterocedasticidade o que acontece se a variância do erro não é constante 403 exeMplO 1111 a tabela 1116 no site do livro fornece salário e dados relacionados em 94 distritos esco lares no noroeste de Ohio inicialmente a regressão a seguir foi estimada com base nesses dados ln Salárioi Ø1 Ø2 ln rendaFam Ø3 ln ValorProp ui em que Salário salário médio dos professores rendaFam renda familiar média no distrito e ValorProp valor médio da propriedade no distrito Como este é um modelo loglog todos os coeficientes angulares são elasticidades Com base nos vários testes de heterocedasticidade discutidos no texto verificouse que o modelo anterior foi afetado pela heterocedasticidade Portanto obtivemos os erros padrão robustos de White a tabela a seguir apresenta os resultados da regressão anterior com e sem erros padrão robustos Variável Coeficiente ep MQO ep robusto Intercepto 70198 08053 07721 87171 90908 lnRendaFam 02575 00799 01009 32230 25516 lnValorProp 00704 00207 00460 33976 15311 R 2 02198 Nota dados entre parênteses são os valores estimados das razões t embora os valores de coeficientes e de R2 permaneçam os mesmos quer usemos o méto do dos mQO ou o de White os erros padrão mudaram a mudança mais acentuada está no erro padrão do coeficiente de lnValorProp O método dos mQO sugeriria que o coeficiente estimado dessa variável é altamente significativo do ponto de vista estatístico enquanto o erro padrão robusto de White sugere que esse coeficiente não é significativo nem mesmo ao nível de 10 este exemplo mostra que se há heterocedasticidade deveríamos levála em conta ao estimarmos um modelo 118 Uma advertência sobre reações exageradas à heterocedasticidade Retomando o exemplo de PD discutido na seção anterior vimos que quando usamos a transfor mação raiz quadrada para corrigir a heterocedasticidade no modelo original 1173 o erro padrão do coeficiente angular diminuiu e seu valor t aumentou A mudança é tão significativa que seria preocu pante na prática Em outras palavras quando devemos ficar preocupados com o problema da hetero cedasticidade Como defende um autor a heterocedasticidade nunca foi razão para descartarse um modelo que sob outros aspectos é considerado bom43 Neste ponto pode ser útil ter em mente a advertência feita por John Fox vale corrigir variâncias desiguais do erro somente quando o problema for grave O impacto da variância do erro não constante sobre a eficiência do estimador de mínimos quadrados e na validade da eficiência dos mínimos quadrados depende de vários fatores inclusive do tamanho da amostra do grau de variação no æi 2 da configuração dos valores de X regressor e da relação entre a variância dos erros e os X Portanto não é possível chegar a conclusões gerais aplicáveis a respeito dos danos produzidos pela heterocedasticidade44 43 maNKiW N Gregory a quick refresher course in macroeconomics Journal of Economic Literature dez 1990 v XXViii p 1648 44 FOX John Applied regression analysis linear models and related methods Califórnia Sage Publications 1997 p 306 ECONOBOOKParte02indb 403 23112010 071856 404 Parte Dois Relaxamento das hipóteses do modelo clássico Voltando ao modelo 1131 vimos que a variância do estimador angular varØO2 é dada pela fórmula comum mostrada em 1123 Sob os MQG a variância do estimador angular varØO2 é dada por 1139 Sabemos que a última é mais eficiente que a primeira Mas quanto a variância de MQO deve ser maior em relação a de MQG antes de tornarse preocupante Como regra prática Fox sugere que esse problema merece atenção quando a maior variância do erro for mais de dez vezes a menor45 Assim voltando aos resultados das simulações de Monte Carlo de Davidson e MacKinnon apresentadas na Se ção 114 considere o valor de Æ 2 A variância de Ø2 estimado é 004 sob MQO e 0012 sob MQG sendo a razão entre a primeira e a última cerca de 33346 De acordo com a regra de Fox a gravidade da heterocedasticidade nesse caso pode não ser grande o suficiente para gerar preocupação Devemos lembrar também que apesar da heterocedasticidade os estimadores de MQO são linea res não tendenciosos e em condições gerais têm distribuição normal assintoticamente i e em grandes amostras Como veremos ao discutirmos outras violações das suposições do modelo clássico de regressão linear a advertência nesta seção parece ser adequada como regra geral Caso contrário podemos exagerar Resumo e conclusões 1 Uma hipótese fundamental do modelo clássico de regressão linear é que os termos de erro ui têm todos a mesma variância æ2 Se essa hipótese não for satisfeita haverá heterocedasticidade 2 A heterocedasticidade não invalida as propriedades de consistência e não tendenciosidade dos estimadores de MQO 3 Esses estimadores no entanto não têm mais variância mínima nem são eficientes Ou seja não são MELNT 4 Os estimadores MELNT são fornecidos pelo método de mínimos quadrados ponderados con tanto que as variâncias heterocedásticas dos erros æi 2 sejam conhecidas 5 Na presença de heterocedasticidade as variâncias dos estimadores de MQO não são fornecidas pelas fórmulas usuais de MQO Mas se persistirmos em usar as fórmulas MQO usuais os testes t e F baseados nelas podem ser altamente enganosos resultando em conclusões incorretas 6 Documentar as consequências da heterocedasticidade é mais fácil que detectála Há vários testes disponíveis para diagnósticos mas não se pode dizer com certeza qual deles funcionará em deter minada situação 7 Mesmo que a heterocedasticidade seja suspeita e detectada não é fácil corrigir o problema Se a amostra é grande podese obter os erros padrão ajustados para heterocedasticidade de White com base nos estimadores de MQO e conduzir inferência estatística com base nesses erros padrão 8 Caso contrário com base nos resíduos dos MQO podese fazer inferências baseadas em informa ções do provável padrão da heterocedasticidade e transformar os dados originais de tal forma que nos dados transformados não haja heterocedasticidade exerCíCiOS 111 Diga se as afirmações a seguir são verdadeiras falsas ou incertas e apresente uma breve justi ficativa a Na presença da heterocedasticidade os estimadores de MQO são tendenciosos bem como ineficientes b Se a heterocedasticidade estiver presente os testes t e F convencionais serão inválidos c Na presença de heterocedasticidade o método usual de MQO sempre estima os erros pa drão dos estimadores para mais 45 ibid p 306 46 Note que elevamos os erros padrão ao quadrado para obter as variâncias ECONOBOOKParte02indb 404 23112010 071857 Capítulo 11 Heterocedasticidade o que acontece se a variância do erro não é constante 405 Capítulo 11 Heterocedasticidade o que acontece se a variância do erro não é constante 405 d Se os resíduos estimados de uma regressão MQO exibirem um padrão sistemático signifi ca que a heterocedasticidade está presente nos dados e Não há teste geral de heterocedasticidade que seja livre de qualquer pressuposto a respeito de qual variável o termo de erro está correlacionado f Se um modelo de regressão for mal especificado isto é uma variável importante é omiti da os resíduos de MQO mostrarão um padrão distinto g Se o regressor que tem uma variância não constante for incorretamente omitido de um modelo os resíduos MQO serão heterocedásticos 112 Em uma regressão de salários médios W contra o número de funcionários N para uma amostra randômica de 30 empresas foram obtidos os seguintes resultados da regressão47 1 2 a Como se interpreta as duas regressões b O que o autor está supondo ao passar da Equação 1 para a Equação 2 Ele estaria preo cupado com a heterocedasticidade Como se pode saber c É possível relacionar os coeficientes angulares e os interceptos dos dois modelos d Podese comparar os valores R2 dos dois modelos Por quê 113 a É possível estimar os parâmetros dos modelos pelo método dos mínimos quadrados ordinários Por quê b Se não for é possível sugerir um método informal ou formal de estimar os parâmetros de tais modelos Veja o Capítulo 14 114 Embora os modelos logarítmicos mostrados na Equação 11612 reduzam com frequência a heterocedasticidade é preciso estar atento às propriedades do termo de erro de tais modelos Por exemplo o modelo 1 pode ser escrito como 2 a Se ln ui precisa ter expectativa zero qual deverá ser a distribuição de ui b Se Eui 1 Eln ui 0 Por quê c Se Eln ui não for zero o que deve ser feito para que se torne zero 115 Mostre que Ø2 da Equação 1138 também pode ser expresso como Veja SalVatOre Dominick Managerial Economics mcGrawhill New York 1989 p 157 ECONOBOOKParte02indb 405 23112010 071858 406 Parte Dois Relaxamento das hipóteses do modelo clássico 406 Parte Dois Relaxamento das hipóteses do modelo clássico e a var Ø2 dada na Equação 1139 também pode ser expressa como em que y i Yi Y e x i Xi X representam desvios das médias ponderadas Y e X defini das como 116 Para fins pedagógicos Hanushek e Jackson estimaram o seguinte modelo 1 em que Ct despesa agregada privada de consumo no ano t PNBt produto nacional bruto no ano t e D despesas com defesa nacional no ano t sendo o objetivo da análise estudar o efeito das despesas com defesa contra outras despesas na economia Postulando que æt 2 æ2 PNBt2 eles transformam 1 e estimam 2 Os resultados empíricos baseados nos dados para 19461975 foram os seguintes erros padrão entre parênteses48 a O que os autores pressupõem sobre a natureza da heterocedasticidade É possível justificála b Compare os resultados das duas regressões A transformação do modelo original contribuiu para os resultados isto é reduziu os erros padrão estimados Por quê c É possível comparar os dois valores R2 Por quê Sugestão examine as variáveis depen dentes 117 Consulte a regressão estimada nas Equações 1162 e 1163 Os resultados da regressão são bem semelhantes O que explicaria esse resultado 118 Prove que se wi w uma constante para cada i Ø2 e ØO2 bem como suas variâncias são idên ticas 119 Consulte as fórmulas 1122 e 1123 Suponha que em que æ2 é uma constante e ki são pesos conhecidos não necessariamente todos iguais Usando esse pressuposto mostre que a variância da Equação 1122 pode ser expressa como haNUSheK eric a e JaCKSON John e Statistical Methods for Social Scientists academic New York 1977 p 160 ECONOBOOKParte02indb 406 23112010 071900 Capítulo 11 Heterocedasticidade o que acontece se a variância do erro não é constante 407 Capítulo 11 Heterocedasticidade o que acontece se a variância do erro não é constante 407 Tabela 116 Tamanho do ativo milhões de dólares Fonte Quartely Financial Report for Manufacturing Corporations Federal Trade Commission and the Securities and Exchange Commission US govermment vários números O primeiro termo no lado direito é a fórmula de variância dada na Equação 1123 isto é var ØO2 sob homocedasticidade O que se pode dizer sobre a natureza da relação entre var ØO2 sob heterocedasticidade e sob homocedasticidade Sugestão examine o segundo termo no lado direito da fórmula anterior É possível tirar qualquer conclusão geral sobre a relação entre as Equações 1122 e 1123 1110 No modelo informase que a var ui æ2X i 2 Mostre que exercícios aplicados 1111 Para os dados da Tabela 111 calcule a regressão da remuneração média Y contra a produti vidade média X tratando o número de funcionários como a unidade de observação Interpre te seus resultados e veja se estão de acordo com os da Equação 1153 a Da regressão anterior obtenha os resíduos uOi b Seguindo o teste de Park faça a regressão ln uOi 2 contra ln Xi e verifique a regressão 1154 c Seguindo a abordagem de Glejser faça a regressão uOi contra Xi e depois faça a regressão e comente seus resultados d Encontre a correlação por ordem entre uOi e Xi e comente sobre a natureza da heteroce dasticidade se houver presente nos dados 1112 A Tabela 116 apresenta dados relativos à razão vendasdinheiro em caixa de indústrias de ma nufatura norteamericanas classificadas pelo tamanho do ativo para o 1º trimestre de 1971 ao 4º trimestre de 1974 Dados trimestrais A razão vendasdinheiro em caixa pode ser consi derada uma medida da velocidade da renda no setor empresarial isto é o número de vezes que um dólar gira a Para cada tamanho de ativo calcule a média e o desvio padrão da razão vendasdinheiro em caixa b Trace graficamente o valor médio contra o desvio padrão como calculado em a usando o tamanho do ativo como unidade de observação ECONOBOOKParte02indb 407 23112010 071901 408 Parte Dois Relaxamento das hipóteses do modelo clássico 408 Parte Dois Relaxamento das hipóteses do modelo clássico c Por meio de um modelo de regressão adequado decida se o desvio padrão da razão aumen ta com o valor médio Se não for esse o caso como o resultado poderia ser explicado d Se há uma relação estatisticamente significativa entre os dois como se transformariam os dados de modo que não haja heterocedasticidade 1113 Teste de homogeneidade da variância de Bartlett Suponha que haja k variâncias amostrais independentes s1 2 s2 2 sk 2 com f1 f2 fk graus de liberdade cada uma de populações dis tribuídas normalmente com média μ e variância æi 2 Suponha ainda que desejemos testar a hipótese nula H0 æ1 2 æ2 2 æk 2 æ2 isto é cada variância da amostra é uma estimativa da mesma variância populacional æ249 Se a hipótese nula for verdadeira então fornece uma estimativa da estimativa comum combinada da variância populacional æ2 em que fi ni 1 sendo ni o número de observações no iésimo grupo e Bartlett mostrou que a hipótese nula pode ser testada por meio da razão AB distribuída aproximadamente como a distribuição 2 com k 1 graus de liberdade em que e Aplique o teste de Bartlett aos dados da Tabela 111 e verifique se a hipótese de que as variân cias populacionais da remuneração de funcionários são as mesmas para cada tamanho de estabelecimento não pode ser rejeitada no nível de 5 de significância Nota fi o grau de liberdade de cada variância amostral é 9 uma vez que ni para cada amos tra classe de emprego é 10 1114 Considere o seguinte modelo de regressão que passa pela origem Foi informado que u1 ª N 0 æ2 e u2 ª N 0 2æ2 e que eles são estatisticamente indepen dentes Se X1 1 e X2 1 obtenha a estimativa de mínimos quadrados ponderados MQP de Ø e de sua variância Se nesta situação for pressuposto incorretamente que as duas variâncias do erro são iguais digamos iguais a æ2 qual será o estimador de MQO de Ø E sua variância Compare as estimativas com as obtidas pelo método dos MQP À que conclu são geral podese chegar50 1115 A Tabela 117 apresenta dados de 81 carros sobre MPG milhas por galão de combustível HP potência do motor VOL espaço interno em metros cúbicos PV velocidade máxima milhas por hora e PV peso do veículo em 100 libras a Considere o modelo a seguir Estime os parâmetros desse modelo e interprete os resultados Eles fazem sentido econo micamente b Seria de esperar que a variância do erro no modelo anterior seja heterocedástica Por quê Veja Properties of Sufficiency and Satatistical tests Proceeding of the Royal Society of London A vol 160 1937 p 268 adaptado de SeBer F a F Linear regression analysis Nova York John Wiley Sons 1977 p 64 ECONOBOOKParte02indb 408 23112010 071902 Capítulo 11 Heterocedasticidade o que acontece se a variância do erro não é constante 409 Capítulo 11 Heterocedasticidade o que acontece se a variância do erro não é constante 409 Tabela 117 Nota VOL espaço interno em pés cúbicos HP potência do motor MPG milhas por galão VM velocidade máxima milhas por hora PV peso do veículo em 100 libras Observação número da observação as marcas dos carros não foram reveladas Fonte US Environmental Protection Agency 1991 Relatório EPAAACTAB9102 c Use o teste de White para descobrir se a variância de erro é heterocedástica d Obtenha os erros padrão consistentes com a heterocedasticidade e valores t e compare seus resultados com aqueles obtidos pelos MQO e Se a heterocedasticidade for comprovada como os dados seriam transformados para que a variância seja homocedástica Mostre os cálculos necessários ECONOBOOKParte02indb 409 23112010 071903 410 Parte Dois Relaxamento das hipóteses do modelo clássico 410 Parte Dois Relaxamento das hipóteses do modelo clássico 1116 Gastos com alimentação na Índia Na Tabela 28 temos os dados sobre gastos com alimenta ção e despesas totais para 55 famílias indianas a Faça a regressão dos gastos em alimentação contra as despesas totais e examine os resí duos obtidos dessa regressão b Faça um gráfico dos resíduos obtidos em a contra as despesas totais e veja se há qual quer padrão sistemático c Se o gráfico em b sugerir heterocedasticidade aplique os testes de Park Glejser e White para verificar se as impressões de heterocedasticidade observadas em b são confirma das pelos testes d Obtenha os erros padrão consistentes para heterocedasticidade de White e compareos com os dos MQP Decida se vale a pena corrigir a heterocedasticidade neste exemplo 1117 Repita o Exercício 1116 mas dessa vez faça a regressão do logaritmo de gastos com alimen tação contra o logaritmo de despesas totais Se é observada heterocedasticidade no modelo linear do Exercício 1116 mas não no modelo de logaritmo linear a que conclusão é possível chegar Mostre todos os cálculos necessários 1118 Um atalho para o teste de White Como notado no texto o teste de White pode consumir graus de liberdade se houver vários regressores e se introduzirmos todos os regressores seus termos elevados ao quadrado e seus produtos cruzados Em vez de estimar regressões como a Equação 11522 por que simplesmente não efetuar a seguinte regressão em que YOi são os valores estimados Y regressandos do modelo que você está estimando Afinal YOi é apenas a média ponderada dos regressores com os coeficientes de regressão es timados servindo como pesos Obtenha o valor de R2 da regressão anterior e use a Equação 11522 para testar a hipótese de que não há heterocedasticidade Aplique o teste anterior para o exemplo de gastos com alimentação do Exercício 1116 1119 Retorne ao exemplo de PD discutido na Seção 117 Exercício 1110 Repita o exemplo usando lucros como regressor A priori você esperaria que seus resultados fossem diferentes daqueles que usam vendas como o regressor Por quê 1120 A Tabela 118 apresenta dados sobre salários médios de professores de estatística em tempo integral em universidades de pesquisa nos Estados Unidos para o ano acadêmico de 2007 a Trace um gráfico dos salários médios contra os anos de exercício da atividade como uma medida dos anos de experiência Para traçar o gráfico suponha que os salários médios referemse ao ponto médio dos anos em ordem Assim o salário de 124578 na ordem 45 referese aos 45 anos na ordem e assim por diante Para o último grupo suponha que a ordem seja 3133 Tabela 118 Salários médios de professores de estatística em tempo integral 2007 Fonte Americal Statistical Association 2007 Salary Report ECONOBOOKParte02indb 410 23112010 071904 Capítulo 11 Heterocedasticidade o que acontece se a variância do erro não é constante 411 Capítulo 11 Heterocedasticidade o que acontece se a variância do erro não é constante 411 Tabela 119 Preços das ações e ao consumidor período pósSegunda Guerra Mundial através de 1969 Fonte CAGAN Philip Common stock values and inflation the historical record of many countries National Bureau of Economic Research Supl mar 1974 Tabela 1 p 4 b Considere os seguintes modelos de regressão 1 2 em que Y salário médio X anos no cargo medidos no ponto médio do intervalo e u e v são os termos de erro Que argumentos poderiam ser usados para defender por que o modelo 2 poderia ser preferível ao modelo 1 Por meio dos dados calcule os modelos c Se for observada heterocedasticidade no modelo 1 mas não no modelo 2 a que conclu são se poderia chegar Mostre os cálculos necessários d Se a heterocedasticidade é observada no modelo 2 como transformaríamos os dados de modo que no modelo transformado não houvesse heterocedasticidade 1121 Tendo os dados SQR1 com base nas 30 primeiras observações 55 graus de liberdade 25 SQR2 com base nas 30 últimas observações 140 graus de liberdade 25 Efetue o teste GoldfeldQuandt de heterocedasticidade no nível de 5 de significância 1122 A Tabela 119 apresenta dados sobre a mudança percentual por ano para preços de ações Y e preços X de consumo para um corte transversal de 20 países a Trace os dados em um diagrama de dispersão b Faça a regressão de Y contra X e examine os resíduos dessa regressão O que você observa c Uma vez que os dados para o Chile parecem atípicos discrepantes repita a regressão em b excluindo os dados do Chile Agora examine os resíduos dessa regressão O que se observa d Se com base nos resultados em b concluise que havia heterocedasticidade na variân cia do erro mas com base nos resultados em c essa conclusão é invalidada a que con clusões gerais você pode chegar ECONOBOOKParte02indb 411 23112010 071905 412 Parte Dois Relaxamento das hipóteses do modelo clássico 412 Parte Dois Relaxamento das hipóteses do modelo clássico 1123 A Tabela 1110 do site apresenta dados sobre salário e dados relacionados a 447 executivos das 500 das melhores empresas segundo a revista Fortune Os dados incluem salário salá rio e bonificações para 1999 tot rem remuneração total do CEO para 1999 gestão nú mero de anos como CEO 0 se for menos que 6 meses idade idade do CEO vendas receita total de vendas da empresa para 1998 lucro lucro para 1998 para a empresa e ati vos ativo total da empresa em 1998 a Estime a regressão a seguir desses dados e obtenha a estatística de BreuschPagan Godfrey para verificar a heterocedasticidade salárioi Ø1 gestãoi Ø2 idadei Ø3 vendasi Ø4 lucrosi Ø5 ativosi Ø6 ui Parece haver um problema com a heterocedasticidade b Agora crie um segundo modelo usando o ln salário como variável dependente Há qual quer aprimoramento na heterocedasticidade c Crie diagramas de dispersão do salário contra cada uma das variáveis independentes É possível discernir qualis variávelis estáão contribuindo para o problema Que suges tões poderiam ser dadas para resolver isso Qual seria o modelo final Apêndice 11A 11a1 prova da equação 1122 Do Apêndice 3A Seção 3A3 temos uma vez que as expectativas dos termos do produto cruzado são zero pois pressupõese que não haja correlação serial visto que ki são conhecidos Por quê visto que E uOi 2 æi 2 1122 11a2 O método de mínimos quadrados ponderados Para ilustrar o método usamos o modelo de duas variáveis Yi Ø1 Ø2Xi ui O método de mínimos quadrados não ponderados minimiza 1 para obtermos as estimativas enquanto o método de mínimos quadrados ponderados minimiza a soma ponde rada dos resíduos elevados ao quadrado ECONOBOOKParte02indb 412 23112010 071906 Capítulo 11 Heterocedasticidade o que acontece se a variância do erro não é constante 413 Capítulo 11 Heterocedasticidade o que acontece se a variância do erro não é constante 413 2 em que Ø1 e Ø2 são estimadores dos números quadrados ponderados e os pesos wi são tais que 3 isto é os pesos são inversamente proporcionais à variância de ui ou Yi condicional ao Xi dado entendendose que var ui Xi var Yi Xi æi 2 Diferenciando a Equação 2 com relação a ØO1 e ØO2 obtemos Igualando as expressões anteriores a zero obtemos as duas equações normais a seguir 4 5 Note a semelhança entre essas equações normais e as equações normais dos quadrados mínimos não ponderados Resolvendo essas equações simultaneamente obtemos 6 e 1138 7 A variância de ØO2 da Equação 1139 pode ser obtida tal como a variância de ØO2 do Apêndice 3A Seção 3A3 Como se pode verificar prontamente essas médias pon deradas coincidem com as médias usuais e não ponderadas Y e X quando wi w uma constante para todo i 11a3 prova que e Í2 Í2 na presença de heterocedasticidade Considere o modelo de duas variáveis 1 em que var ui æi 2 Agora 2 Notando que ØO1 Ø1 D ØO2 Ø2 X C u e substituindo isto na Equação 2 e subtraindo as expecta tivas dos dois lados obtemos ECONOBOOKParte02indb 413 23112010 071909 414 Parte Dois Relaxamento das hipóteses do modelo clássico 414 Parte Dois Relaxamento das hipóteses do modelo clássico 3 em que é usada a Equação 1122 Como você pode ver da Equação 3 se há homocedasticidade ou seja æi 2 æ2 para cada i E æO2 æ2 Por tanto o valor esperado calculado da forma convencional não será igual ao verdadeiro æ2 na presença de heterocedasticidade51 11a4 erros padrão robustos de White Para ter uma ideia dos erros padrão de White corrigidos para heterocedascidade considere o modelo de regressão de duas variáveis 1 Como mostra a Equação 1122 2 Como os æi 2 não são diretamente observáveis White sugere que se use uOi 2 o resíduo elevado ao quadrado para cada i em lugar de æi 2 e calculese a var ØO2 como se segue 3 White mostrou que a Equação 3 é um estimador consistente da Equação 2 isto é quando o tamanho da amostra aumenta indefinidamente a Equação 3 converge para a Equação 252 Por sinal note que se o seu software não contém procedimento de cálculo do erro padrão robusto de White é possível fazer isso como mostrado na Equação 3 efetuandose a regressão usual MQO obtendose os resí duos dessa regressão e então usandose a fórmula 3 O procedimento de White pode ser generalizado para o modelo de regressão com k variáveis 4 A variância de qualquer coeficiente de regressão parcial por exemplo ØOj é obtida como se segue 5 em que uOi são os resíduos obtidos da regressão original 4 e wO j são os resíduos obtidos da regressão auxiliar do regressor Xj contra os regressores remanescentes na Equação 4 Obviamente esse é um procedimento que consome tempo pois você terá de estimar a Equação 5 para cada variável X É claro que todo esse trabalho pode ser evitado se você tiver um programa de estatística que faça isso Programas como PCGIVE EViews MICROFIT SHAZAM STATA e LIMDEP agora obtêm os erros padrão robustos para heterocedasticidade de White com facilidade mais detalhes podem ser obtidos em KmeNta Jan Elements of econometrics 2 ed Nova York macmillan 1986 p 276278 Para ser mais exato n vezes a equação 3 converge em probabilidade para E Xi πX2u2 i æX 2 2 que é o limi te da probabilidade de n vezes a equação 2 em que n é o tamanho da amostra πx é o valor esperado de X e æX 2 é a variância da população de X Para mais detalhes veja WOOlDriDGe Jeffrey m Introductory econometrics a modern approach SouthWestern Publishing 2000 p 250 ECONOBOOKParte02indb 414 23112010 071910 415 Autocorrelação o que acontece se os termos de erro são correlacionados O leitor recordará que de modo geral há três tipos de dados disponíveis para a análise aplicada 1 corte transversal 2 séries temporais e 3 combinações de corte transversal e séries temporais conhecidos como dados combinados Ao desenvolvermos o modelo clássico de regressão linear MCRL na Parte 1 elaboramos várias hipóteses que foram examinadas na Seção 71 Contudo nem todas essas hipóteses seriam válidas para qualquer tipo de dados Na verdade vimos no capítulo an terior que a hipótese da homocedasticidade ou igual variância do erro nem sempre é sustentável em dados de corte transversal Em outras palavras os dados de corte transversal muitas vezes são afeta dos pelo problema da heterocedasticidade Em estudos de corte transversal os dados muitas vezes são coletados por meio de amostras aleató rias de unidades como domicílios para análise da função de consumo ou empresas para análise de estudos relativos ao investimento de modo que não há razões a priori para considerar que o termo de erro pertencente a um domicílio ou empresa seja correlacionado ao termo de erro de outro domicílio ou empresa Se por acaso tal correlação é observada nas unidades do corte transversal ela é denomi nada autocorrelação espacial correlação no espaço e não ao longo do tempo Contudo é importan te recordar que na análise de corte transversal o ordenamento dos dados deve ter alguma lógica ou interesse econômico para poder determinar se a autocorrelação espacial está ou não presente A situação tende a ser muito diferente se estivermos lidando com séries temporais pois as obser vações de tais dados seguem um ordenamento natural de modo que observações sucessivas costu mam apresentar intercorrelações especialmente se o intervalo de tempo entre observações sucessivas for curto como um dia uma semana ou um mês e não um ano Quando observamos índices de pre ços de ações como o Dow Jones ou o SP 500 durante dias sucessivos não é raro verificar que esses índices sobem ou descem por vários dias seguidos Obviamente em situações como essa a hipótese de ausência de autocorrelação ou ausência de correlação serial nos termos de erro que embasa o modelo clássico de regressão linear não será respeitada Neste capítulo examinaremos criticamente essa hipótese para podermos responder às seguintes perguntas 1 Qual a natureza da autocorrelação 2 Quais suas consequências teóricas e práticas 3 Como a hipótese da ausência de autocorrelação relacionase com os termos de erro ut não observáveis como saber se ela está presente em dada situação Observe que agora emprega mos o subscrito t para destacar que estamos lidando com séries temporais 4 Como corrigir o problema da autocorrelação Capítulo 12 ECONOBOOKParte02indb 415 23112010 071910 416 Parte Dois Relaxamento das hipóteses do modelo clássico O leitor verá que este capítulo assemelhase sob muitos aspectos ao anterior sobre heterocedas ticidade em que nas duas situações os estimadores de MQO habituais embora lineares não tendenciosos e assintoticamente ou seja em grandes amostras distribuídos de modo normal1 não mais apresentam variância mínima entre todos os estimadores lineares não tendenciosos Em resumo eles não são eficientes em relação a outros estimadores lineares e não tendenciosos Em outras palavras não são MELNT Melhores Estimadores Lienares Não Tendenciosos Em con sequência os testes t F e x2 podem não ser válidos 121 A natureza do problema A autocorrelação pode ser definida como correlação entre integrantes de séries de observações ordenadas no tempo como as séries temporais ou no espaço como nos dados de corte transversal2 No contexto da regressão o modelo clássico de regressão linear pressupõe que essa autocorrelação não existe nos termos de erro ui Simbolicamente 325 Em outras palavras o modelo clássico pressupõe que o termo de erro relacionado a qualquer uma das observações não é influenciado pelo termo de erro de qualquer outra observação Por exem plo se estamos lidando com uma série temporal trimestral para estimação da regressão da produção contra a mão de obra e o capital e se uma greve afeta a produção de um trimestre não há razão para acreditar que essa perturbação prolonguese afetando o trimestre seguinte Ou seja se a produção for menor neste trimestre não há razão para supor que será menor no trimestre seguinte Do mesmo modo se estamos empregando dados de corte transversal em uma regressão das despe sas de uma família sobre a renda familiar o efeito de um aumento da renda da família nesses gastos não deverá afetar as despesas de outra família Contudo se for verificada essa dependência teremos autocorrelação Simbolicamente 1211 Em tal situação a perturbação provocada por uma greve neste trimestre pode afetar a produção do próximo ou os aumentos da despesa de uma família podem levar outra a aumentar seu consumo para não ficar para trás Antes de entender por que a autocorrelação existe é fundamental esclarecer algumas questões terminológicas Embora hoje seja uma prática comum tratar os termos autocorrelação e correlação serial como sinônimos alguns autores preferem fazer distinção entre eles Por exemplo Tintner de fine autocorrelação como uma correlação defasada entre determinada série com ela mesma com uma defasagem de algumas unidades de tempo enquanto reserva o termo correlação serial para correlação defasada entre duas séries diferentes3 Assim a correlação entre séries temporais como u1 u2 u10 e u2 u3 u11 em que a primeira é a segunda defasada em um período é autocorre lação enquanto a correlação entre séries temporais como u1 u2 u10 e v2 v3 v11 em que u e v são duas séries temporais distintas é chamada de correlação serial Embora a distinção entre os dois termos possa ser útil neste livro trataremos como sinônimos A Figura 121 apresenta alguns padrões plausíveis de presença e de ausência de autocorrelação As Figuras 121a a d mostram que há alguns padrões discerníveis entre os u A Figura 121a mostra um padrão cíclico as Figuras b e c sugerem tendências lineares ascendentes e descendentes nos 1 Veja GreeNe William h Econometric analysis 4 ed NJ Prentice hall 2000 cap 11 e rUDD Paul a An introduction to classical econometric theory Oxford University Press 2000 cap 19 2 KeNDall maurice G BUCKlaND William r A dictionary of statistical terms Nova York hafner Publishing Company 1971 p8 3 tiNtNer Gerhard Econometrics Nova York John Wiley Sons 1965 ECONOBOOKParte02indb 416 23112010 071911 Capítulo 12 Autocorrelação o que acontece se os termos de erro são correlacionados 417 termos de erro enquanto a Figura 121d indica que termos de tendência linear e quadrática estão presentes Somente a Figura 121e indica ausência de padrão sistemático confirmando a hipótese de ausência de autocorrelação do modelo de regressão linear clássico A questão que se apresenta é por que ocorre correlação serial As razões são várias e a seguir trataremos de algumas delas Inércia Uma característica marcante da maioria das séries temporais econômicas é a inércia ou lentidão Como sabemos séries temporais como o PNB os índices de preços a produção o emprego e o de semprego registram ciclos econômicos Partindo do fundo da recessão quando tem início a recupe ração econômica a maioria dessas séries começam a moverse em um sentido ascendente Nesse movimento o valor da série em um ponto do tempo é maior que o anterior Há um impulso embu 0 Tempo 0 Tempo 0 Tempo 0 Tempo uu 0 Tempo a b c d e uu uu uu uu Figura 121 Padrões de presença e ausência de autocorrelação ECONOBOOKParte02indb 417 23112010 071912 418 Parte Dois Relaxamento das hipóteses do modelo clássico tido nele que continua até que algo aconteça um aumento na taxa de juros nos impostos ou em ambos para desacelerálo Portanto em regressões que envolvem séries temporais as observações sucessivas tendem a ser interdependentes Viés de especificação o caso das variáveis excluídas Na análise aplicada o pesquisador muitas vezes inicia com um modelo de regressão plausível que pode não ser o mais perfeito Depois ele estuda os resultados para verificar se estão de acordo com as expectativas a priori Se não estiverem começa a cirurgia Por exemplo o pesquisador pode fazer um gráfico dos resíduos uOi obtidos na regressão ajustada e observar padrões como os que aparecem na Figura 121 Esses resíduos que são proxies de ui podem sugerir que algumas variáveis origi nalmente candidatas mas que acabaram por várias razões não sendo incluídas no modelo deve riam entrar nele Esse é o caso do viés de especificação da variável excluída Muitas vezes a inclusão de tais variáveis elimina o padrão de correlação observado entre os resíduos Por exemplo suponha o seguinte modelo de demanda 1212 em que Y D quantidade de carne bovina demandada X2 D preço da carne bovina X3 D renda do con sumidor X4 D preço da carne suína e t D tempo4 Contudo por alguma razão estimamos a seguinte regressão 1213 Agora se a Equação 1212 for o modelo correto ou a verdade ou a relação verdadeira es timar a Equação 1213 equivale a fazer vt D Ø4X4t C ut e na medida em que o preço da carne suína afeta o consumo de carne bovina o termo de erro v refletirá um padrão sistemático criando assim uma falsa autocorrelação Um teste simples para verificar isso seria utilizar tanto a Equação 1212 quanto a Equação 1213 e ver se a autocorrelação observada no segundo modelo desaparece quan do se estima o primeiro5 A mecânica efetiva para detectar a autocorrelação será examinada na Seção 126 na qual mostraremos que a representação gráfica dos resíduos das regressões 1212 e 1213 muitas vezes esclarece bastante a correlação serial Viés de especificação forma funcional incorreta Suponha que o modelo verdadeiro ou correto em um estudo de custo e produção seja o seguinte Custo marginali D Ø1 C Ø2 Produçãoi C Ø3 Produção2 i C ui 1214 mas ajustemos o modelo Custo marginali D Æ1 C Æ2 Produçãoi C vi 1215 A curva de custo marginal correspondente ao modelo verdadeiro está na Figura 122 junto com a curva linear de custo incorreta Como vemos na Figura 122 entre os pontos A e B a curva linear de custo marginal superestima rá de forma consistente o verdadeiro custo marginal enquanto fora desses pontos ela o subestimará também de modo consistente Esse resultado é esperado porque o termo de erro vi é de fato igual a produção2 C ui e portanto estará incluindo sistematicamente o efeito do termo produção2 sobre o custo marginal Nesse caso vi refletirá a autocorrelação devido ao uso de uma forma funcional incor reta No Capítulo 13 consideraremos vários métodos para detectar o viés de especificação 4 Por uma questão de convenção usaremos o subscrito t para denotar séries temporais e i para dados de corte transversal 5 Se for verificado que o verdadeiro problema é o viés de especificação e não a autocorrelação então como será demonstrado no Capítulo 13 os estimadores de mQO dos parâmetros da equação 1213 poderão ser tenden ciosos e inconsistentes ECONOBOOKParte02indb 418 23112010 071912 Capítulo 12 Autocorrelação o que acontece se os termos de erro são correlacionados 419 O fenômeno da teia de aranha A oferta de muitos produtos agrícolas reflete o chamado fenômeno da teia de aranha em que a oferta reage ao preço com a defasagem de um período porque as decisões de oferta levam tempo para serem implementadas período de gestação No início do plantio da safra deste ano os agricultores estão influenciados pelo preço vigente no ano anterior de modo que sua função de oferta é Ofertat D Ø1 C Ø2Pt 1 C ut 1216 Imagine que no final do período t o preço Pt é menor que Pt 1 Portanto no período t C 1 os agri cultores podem decidir produzir menos que em t Obviamente nessa situação não se pode esperar que os termos de erro ut sejam aleatórios porque se os agricultores produzem demais no ano t eles ten derão a reduzir a produção em t C 1 e assim por diante gerando o padrão da teia de aranha Defasagens Em uma regressão de despesas sobre renda cujos dados são séries temporais verificamos não poucas vezes que as despesas do período atual dependem dentre outras coisas das despesas do perío do anterior Isto é Consumot D Ø1 C Ø2 rendat C Ø3 Consumot 1 C ut 1217 Uma regressão desse tipo é conhecida como autorregressão porque uma das variáveis explanatórias é o valor defasado da variável dependente Examinaremos esses modelos no Capítulo 17 A lógica desses modelos é simples Os consumidores não alteram facilmente seus hábitos de consumo por motivos psicológicos tecnológicos ou institucionais Agora se ne gligenciarmos o termo defasado na Equação 1217 o termo de erro resultante refletirá um padrão sistemático decorrente da influência do consumo defasado sobre o consumo atual Manipulação dos dados Na análise aplicada os dados brutos muitas vezes são manipulados Por exemplo em regres sões de séries temporais que envolvem dados trimestrais muitas vezes os dados são obtidos somando três observações mensais e dividindo a soma por três Essas médias suavizam os dados amenizando as flutuações dos dados mensais Portanto a representação gráfica dos dados trimestrais é muito me nos irregular que a dos dados mensais e essa mesma regularidade pode gerar um padrão sistemático nos termos de erro introduzindo a autocorrelação Outra fonte de manipulação é a interpolação ou a extrapolação de dados Por exemplo nos Estados Unidos o Censo Demográfico é realizado a cada dez anos o mais recente é o de 2000 e o anterior foi em 1990 Agora se houver necessidade de obter dados para algum ano no período intercensitário 19902000 a prática comum é fazer a interpolação Figura 122 Viés de especificação forma funcional incorreta A B 0 Custo marginal da produção Produção ECONOBOOKParte02indb 419 23112010 071913 420 Parte Dois Relaxamento das hipóteses do modelo clássico com base em algum pressuposto ad hoc Todas essas técnicas de massagem dos dados impõem a eles um padrão sistemático que pode não existir nos dados originais6 Transformação de dados Como exemplo considere o seguinte modelo Yt β1 β2Xt ut 1218 em que Y D despesas e X D renda Como a Equação 1218 aplicase em todos os períodos isso é válido também no período anterior t 1 Podemos escrever a Equação 1218 como 1219 Yt1 Xt1 e ut1 são conhecidos como os valores defasados de Y X e u respectivamente aqui de fasado em um período Veremos a importância dos valores defasados mais adiante neste capítulo bem como em diversas partes do livro Agora se subtrairmos a Equação 1219 da Equação 1218 obteremos 12110 em que 1 conhecido como operador de primeira diferença indica que devemos tomar sucessivas diferenças das variáveis em questão Assim e 1ut D ut ut 1 Para fins práticos escrevemos a Equação 12110 como 12111 em que vt D 1ut D ut ut 1 Equação 1219 é conhecida como forma de nível e a Equação 12110 é conhecida como a forma de primeira diferença Ambas são frequentemente utilizadas na análise aplicada Por exem plo se na Equação 1219 Y e X representam os logaritmos das despesas de consumo e renda então na Equação 12110 1Y e 1X representarão mudanças nos logaritmos das despesas de consumo e renda Como sabemos uma alteração no logaritmo de uma variável é uma mudança relativa ou uma variação percentual se a primeira é multiplicada por 100 Em vez de estudarmos as relações entre as variáveis da forma de nível podemos concentrarnos em suas relações na forma de crescimento Se o termo de erro na Equação 1218 satisfizer as hipóteses padrão dos MQO principalmente a de ausência de autocorrelação é possível provar que o termo de erro vt na Equação 12111 é auto correlacionado Veja o Apêndice 12A Seção 12A1 Podese notar aqui que modelos similares à Equação 12111 são conhecidos como modelos de regressão dinâmicos modelos que envolvem regressandos defasados Estudaremos esses modelos de forma aprofundada no Capítulo 17 O sentido do exemplo anterior é que às vezes a autocorrelação pode ser induzida como um re sultado da transformação do modelo original Ausência de estacionariedade Mencionamos no Capítulo 1 que ao lidarmos com séries temporais podemos ter a necessidade de descobrir se alguma delas é estacionária Embora tratemos do tópico das séries temporais não es tacionárias em mais detalhes nos capítulos sobre econometria de séries temporais na Parte 5 do livro em termos gerais uma série temporal é estacionária se suas características por exemplo a média variância e covariância não variam ao longo do tempo Se esse não for o caso temos uma série não estacionária 6 Veja GreeNe William h op cit p 526 ECONOBOOKParte02indb 420 23112010 071914 Capítulo 12 Autocorrelação o que acontece se os termos de erro são correlacionados 421 Como veremos na Parte 5 em um modelo de regressão como a Equação 1218 é perfeitamen te possível que tanto Y quanto X sejam não estacionários e portanto o erro u também seja não esta cionário7 Nesse caso o termo de erro apresentará autocorrelação Em síntese há várias razões pelas quais o termo de erro em um modelo de regressão pode ser autocorrelacionado No restante do capítulo procuraremos investigar com alguns detalhes os proble mas provocados pela autocorrelação e o que pode ser feito para serem resolvidos Convém notar também que a autocorrelação pode ser tanto positiva Figura 123a quanto nega tiva embora a maior parte das séries temporais econômicas em geral apresente autocorrelação positiva pois em sua maioria evolui para cima ou para baixo por longos períodos e não apresenta oscilações constantes tais como a da Figura 123b 122 Estimativa de MQO na presença de autocorrelação O que acontecerá aos estimadores de MQO e suas variâncias se introduzirmos autocorrelação nos termos de erro supondo que Eutut C s 0 s 0 mas mantivermos todas as outras hipóteses do modelo clássico8 Observe novamente que estamos usando agora o subscrito t nos termos de erro para destacar que lidamos com séries temporais Voltemos ao modelo de regressão de duas variáveis para explicar as ideias básicas envolvidas a saber Yt D Ø1 C Ø2Xt C ut Para avançar precisamos imaginar que o mecanismo que gera ut para 7 Como veremos na parte 5 mesmo que Y e X não sejam estacionários é possível que u seja exploraremos as implicações de tal situação mais adiante 8 Se s D 0 obtemos Eu2 t Como Eut D 0 por hipótese Eu2 t representa a variância do termo de erro o que ob viamente é diferente de zero por quê Figura 123 Autocorrelação positiva a e negativa b ut1 0 Tempo ut ut ut ut a b Tempo ut1 0 ECONOBOOKParte02indb 421 23112010 071914 422 Parte Dois Relaxamento das hipóteses do modelo clássico Eutut C s 0 s 0 é um pressuposto demasiado geral para ter utilidade prática Como ponto de partida ou primeira aproximação podemos supor que os termos de erro são gerados pelo seguinte mecanismo 1221 em que Ω é conhecido como coeficiente de autocovariância e t é o termo de erro estocástico tal que atenda à hipótese padrão dos MQO 1222 Na literatura de engenharia um termo de erro com as propriedades anteriores é frequentemente chamado de ruído branco white noise O que a Equação 1221 postula é que o valor do termo de erro no período t é igual a Ω vezes o seu valor no período anterior acrescido de um termo de erro puramente aleatório O esquema 1221 é conhecido como processo autorregressivo de primeira ordem de Markov ou simplesmente processo autorregressivo de primeira ordem normalmente designado como AR 1 A denominação autorregressivo é adequada porque a Equação 1221 pode ser interpretada como a regressão de ut na sua própria defasagem de um período Tratase de primeira ordem porque ut e o valor imediatamente anterior estão envolvidos a defasagem máxima é 1 Se o modelo fosse ut D Ω1ut1 C Ω2ut 2 C t seria um AR 2 ou processo autorregressivo de segunda ordem e assim por diante Iremos analisar esses processos de ordem mais elevadas nos capítulos sobre econometria de séries temporais na Parte 5 Vale mencionar que Ω coeficiente de autocovariância na Equação 1221 também pode ser interpretado como o coeficiente de autocorrelação de primeira ordem ou mais precisamente o coeficiente de autocorrelação de defasagem 19 Dado o processo AR1 podese demonstrar que veja o Apêndice 12A Seção 12A2 1223 1224 cor 1225 em que covut utCs representa a covariância entre termos de erro separados por s períodos e corut utCs é a correlação entre termos de erro separados por s períodos Note que devido à propriedade de simetria das covariâncias e correlações covut utCs D covut uts e corut utCs D corut uts 9 esta denominação pode ser facilmente justificada Por definição o coeficiente populacional de correlação entre ut e ut1 é uma vez que Eut D 0 para cada t e varut D varut1 porque estamos mantendo a hipótese de homocedasti cidade O leitor pode ver que Ω é também o coeficiente angular de regressão de ut contra varut1 ECONOBOOKParte02indb 422 23112010 071916 Capítulo 12 Autocorrelação o que acontece se os termos de erro são correlacionados 423 Como Ω é uma constante com valor entre 1 e C1 a Equação 1223 mostra que sob o proces so AR1 a variância de ut ainda é homocedástica mas ut está correlacionado não só com o seu valor passado imediato mas também com os valores de vários períodos atrás É fundamental salientar que Ω 1 ou seja o valor absoluto de Ω é inferior a 1 Se por exemplo Ω for 1 as variâncias e covariân cias listadas não estarão definidas Se Ω 1 dizemos que o processo AR1 dado na Equação 1221 é estacionário a média variância e covariância de ut não variam ao longo do tempo Se Ω for inferior a 1 é evidente pela Equação 1224 que o valor da covariância diminuirá à medida que retrocedermos ao passado distante Veremos a utilidade dos resultados anteriores em breve Uma razão para usar o processo AR1 não está apenas em sua simplicidade em comparação com processos AR de ordem mais elevada mas também porque em muitas aplicações tem sido bastante útil Além disso uma quantidade considerável de trabalhos teóricos e práticos já foram feitos usando o processo AR1 Agora retornaremos ao nosso modelo de regressão de duas variáveis Yt Ø1 C Ø2Xt C utVimos no Capítulo 3 que o estimador do coeficiente angular obtido pelo método dos MQO é 1226 e sua variância é dada por 1227 em que as letras minúsculas como de costume denotam desvios em relação à média Agora sob o processo AR1 podemos demonstrar que a variância deste estimador é 1228 em que var ØO2AR1 significa a variância de ØO2 sob um processo autorregressivo de primeira ordem Uma comparação da Equação 1228 com a Equação 1227 mostra que a primeira é igual à segunda multiplicada por um termo que depende de Ω bem como das autocorrelações amostrais entre os valores assumidos pelo regressor X com várias defasagens10 E em geral não podemos dizer se var ØO2 é menor ou maior que var ØO2AR1 veja a Equação 1241 Obviamente se Ω for igual a zero as duas fórmulas coincidirão por quê Além disso se as correlações entre os valores sucessi vos do regressor forem muito pequenas a variância habitual do estimador angular calculado segundo o método dos MQO não será seriamente tendenciosa Mas como princípio geral as duas variâncias não serão iguais Para uma ideia sobre a diferença entre as variâncias das Equações 1227 e 1228 suponha que o regressor X também siga o esquema autorregressivo de primeira ordem com um coeficiente de autocorrelação de r Então podemos demonstrar que a Equação 1228 reduzse a 1229 Se por exemplo r D 06 e Ω D 08 empregando a Equação 1229 podemos verificar que var ØO2AR1 D 28461 var ØO2MQO Em outras palavras var ØO2AR1 A fórmula de MQO 1227 subestimará a variância de ØO2AR1 em cerca de 65 Como você perceberá essa resposta é específica para determinado valor de r e Ω Entretanto o importante neste exercício é mostrar que uma aplicação cega das fórmulas habituais de MQO para calcular as variâncias e erros padrão dos estimadores de MQO poderia conduzir a resultados profundamente equivocados 10 Observe que o termo é a correlação entre Xt e Xt C 1 ou Xt 1 já que o coeficiente de corre lação é simétrico é a correlação entre os X defasados de dois períodos e assim por diante ECONOBOOKParte02indb 423 23112010 071917 424 Parte Dois Relaxamento das hipóteses do modelo clássico Suponhamos que continuemos empregando o estimador de MQO ØO2 e que ajustemos a variância habitual levando em conta o processo AR1 Ou seja empregamos ØO2 da Equação 1226 mas usa mos a fórmula de variância da Equação 1228 Quais são agora as propriedades de ØO2 É fácil provar que ØO2 ainda é linear e não tendencioso De fato como mostra o Apêndice 3A Seção 3A2 a hipótese de ausência de correlação serial como a ausência de heterocedasticidade não é exigida para provar que ØO2 é não tendencioso Mas será que ØO2 ainda é MELNT Infelizmente não na classe de estimadores lineares não tendenciosos ele não tem variância mínima Em suma ØO2 embora linear e não tendencioso não é eficiente em termos relativos O leitor notará que esse resultado é bastante semelhan te à conclusão de que ØO2 é menos eficiente na presença de heterocedasticidade Vimos que o estimador de mínimos quadrados ponderados ØO2 da Equação 1138 é um caso especial de estimador de mínimos quadrados generalizados MQG que se mostrou eficiente No caso de autocorrelação podemos encon trar um estimador que seja MELNT A resposta é sim como pode ser visto na seção seguinte 123 O estimador BLUE na presença de autocorrelação Continuando com o modelo de duas variáveis e supondo o processo AR1 podemos mostrar que o estimador BLUE de Ø2 é fornecido pela seguinte expressão11 1231 em que C é um fator de correção que pode ser desconsiderado na prática Observe que o subscrito t agora se estende de t D 2 a t D n e sua variância é dada por 1232 em que D também é um fator de correção que pode ser desconsiderado na prática Veja o Exercício 1218 O estimador ØO2 MQG como sugere o sobrescrito é obtido pelo método MQG Como mencionado no Capítulo 11 em MQG incorporamos qualquer informação adicional disponível por exemplo a natureza da heterocedasticidade ou da autocorrelação diretamente no processo de estimação median te a transformação de variáveis enquanto no método dos MQO essas informações não são levadas em conta diretamente Como o leitor pode ver o estimador de GLS Ø2 dado na Equação 1231 incor pora o parâmetro de autocorrelação Ω à fórmula de estimação enquanto a fórmula de MQO da Equa ção 1226 apenas o ignora De maneira intuitiva essa é a razão pela qual o estimador de MQG é BLUE e não o estimador de MQO o estimador de MQG aproveita mais as informações disponíveis12 Nem é tão importante acrescentar que se Ω D 0 não existe qualquer informação adicional a ser consi derada e por conseguinte tanto os estimadores de MQG quanto os de MQO são idênticos Em suma com a autocorrelação é o estimador da Equação 1231 que é BLUE e a variância mínima é dada agora pela Equação 1232 e não pela 1228 e obviamente não pela Equação 1227 11 Uma demonstração é encontrada em KmeNta Jan Elements of econometrics Nova York macmillan 1971 p 274275 O fator de correção C pertence à primeira observação Y1 X1 Sobre esse ponto veja o exercício 1218 12 a demonstração formal de que à ØO 2 mQG é BlUe pode ser encontrada em KmeNta ibid mas a cansativa de monstração algébrica pode ser consideravelmente simplificada usando a notação matricial Veja JOhNStON J Econometric methods 3 ed Nova York mcGrawhill 1984 p 291293 ECONOBOOKParte02indb 424 23112010 071918 Capítulo 12 Autocorrelação o que acontece se os termos de erro são correlacionados 425 Uma observação técnica Como já salientado no capítulo anterior o teorema de GaussMarkov fornece apenas a condição suficiente para que o MQO seja MELNT As condições necessárias e suficientes para tanto estão no teorema de Kruskal mencionado no capítulo anterior Em alguns casos pode ocorrer de MQO ser MELNT apesar da autocorrelação Na prática esses casos são pouco frequentes O que acontece se insistirmos em trabalhar com os procedimentos habituais de MQO apesar da autocorrelação A resposta é dada na próxima seção 124 Consequências do uso dos MQO na presença de autocorrelação Como no caso da heterocedasticidade na presença de autocorrelação os estimadores de MQO ainda são lineares e não tendenciosos bem como consistentes e com distribuição normal assintótica mas deixam de ser eficientes de ter variância mínima O que acontece então com os procedimentos habituais de teste de hipóteses se continuarmos a utilizar os estimadores de MQO Novamente como no caso de heterocedasticidade distinguimos duas situação Por questões pedagógicas continuare mos trabalhando com o modelo de duas variáveis embora o exame a seguir possa ser estendido à regressão múltipla sem muita complicação13 estimação por meio de MQO considerando a autocorrelação Como se observa ØO2 não é MELNT e mesmo empregando a var ØO2AR1 os intervalos de confian ça obtidos a partir daí são suscetíveis de serem mais amplos do que os baseados no procedimento dos MQG Como mostra Kmenta é provável que este seja o caso mesmo que o tamanho da amostra aumente indefinidamente14 Isto é ØO2 não é assintoticamente eficiente A implicação dessa constata ção para o teste de hipótese é clara estamos propensos a declarar que um coeficiente é estatisticamente insignificante não diferente de zero embora na realidade com base no procedimento correto de MQG possa não ser Essa diferença pode ser vista na Figura 124 Nela mostramos os intervalos de confiança de 95 calculados segundo os MQO AR1 e os MQG supondo que o verdadeiro Ø2 D 0 Considere determinada estimativa de Ø2 por exemplo b2 Como b2 encontrase no intervalo de con fiança de MQO poderíamos aceitar a hipótese de que o verdadeiro Ø2 seja zero com 95 de confian ça Mas se tivéssemos de utilizar o intervalo de confiança de MQG correto poderíamos rejeitar a hipótese nula de que o verdadeiro Ø2 é igual a zero pois b2 está na área de rejeição A mensagem é para estabelecermos intervalos de confiança e testar hipóteses devemos usar os MQG e não os MQO mesmo que os estimadores obtidos por estes últimos sejam não tenden ciosos e consistentes No entanto convém consultar a Seção 1211 posteriormente estimação por meio de MQO não considerando a autocorrelação A situação tornase potencialmente muito grave se além de não utlilizarmos ØO2 também continua mos a usar que ignora por completo o problema da autocorrelação Em outras 13 mas a álgebra matricial tornase quase uma necessidade para evitar manipulações algébricas tediosas 14 Veja KmeNta op cit p 277278 Figura 124 Intervalos de confiança de 95 dados pelos MQG e pelos MQO 0 H0 2 0 β β2 b2 Intervalo de confiança de 95 dado pelos MQG Intervalo de confiança de 95 dado pelos MQO ECONOBOOKParte02indb 425 23112010 071919 426 Parte Dois Relaxamento das hipóteses do modelo clássico palavras se acreditarmos erroneamente que as hipóteses habituais do modelo clássico mantêmse válidas Os erros surgirão pelas seguintes razões 1 A variância residual provavelmente subestimará o verdadeiro æ2 2 Como resultado seremos levados a superestimar R2 3 Mesmo que æ 2 não esteja subestimado a var ØO2 pode subestimar a var ØO2AR1 Equação 1228 sua variância sob a autocorrelação de primeira ordem embora esta última seja ineficiente em comparação com a var ØO2MQG 4 Por isso os testes comuns de significância t e F deixam de ser válidos e se aplicados prova velmente nos levarão a conclusões extremamente equivocadas sobre a significância estatística dos coeficientes de regressão estimados Para demonstrarmos algumas dessas proposições voltemos ao modelo de duas variáveis Já vi mos no Capítulo 3 que sob a hipótese clássica fornece um estimador não tendencioso de æ 2 isto é EæO 2 D æ 2 Mas se houver autocorrelação dada por AR1 podemos demonstrar que 1241 em que que pode ser interpretado como o coeficiente de correlação amos tral entre os valores sucessivos dos X15 Se Ω e r forem ambos positivos o que não é improvável para a maioria das séries temporais econômicas evidenciase pela Equação 1241 que EæO 2 æ2 a fórmula habitual da variância residual em média subestimará o verdadeiro æ 2 Em outras palavras æO 2 terá um viés descendente Desnecessário dizer que esse viés do æO 2 será transmitido à var ØO2 porque na prática estimamos esta última por meio da fórmulas Mas mesmo que æ 2 não seja subestimado a var ØO2 é um estimador tendencioso da var ØO2 AR1 o que pode ser facilmente visto comparandose a Equação 1227 com a 122816 já que as duas fórmulas não são iguais Na verdade se Ω é positivo o que é verdadeiro na maioria das séries tempo rais econômicas e se os X forem positivamente correlacionados também verdadeiro na maioria das séries temporais econômicas então é claro que 1242 ou seja a variância de ØO2 calculado por MQO subestima sua variância calculada sob AR 1 veja a Equação 1229 Se usarmos var ØO2 estaremos inflando a precisão ou exatidão subestimaremos o erro padrão do estimador ØO2 Como resultado ao calcularmos a razão t como t D ØO2ep ØO2 sob a hipótese de que Ø2 D 0 estaremos superestimando o valor t e portanto a significância estatística do Ø2 estimado A situação tende a piorar se além disso æ 2 for subestimado como mencionado anterior mente Para ver como o método dos MQO tende a subestimar æ 2 e a variância de ØO2 vamos realizar o experimento de Monte Carlo a seguir Suponha que saibamos que no modelo com duas variá veis o verdadeiro Ø1 D 1 e Ø2 D 08 Por isso a FRP estocástica é 1243 15 Ver Goldfeld S m Quandt r e Nonlinear methods in econometrics amsterdã North holland Publishing Company 1972 p 183 Note que se os erros estão positivamente autocorrelacionados o valor de R2 tende a apresentar viés ascendente isto é tende a ser maior do que o R2 na ausência de tal correlação 16 Uma demonstração formal é encontrada em KmeNta opcit p 281 ECONOBOOKParte02indb 426 23112010 071920 Capítulo 12 Autocorrelação o que acontece se os termos de erro são correlacionados 427 Assim 1244 que nos dá a verdadeira linha de regressão populacional Supondo que os ut sejam gerados pelo pro cesso autorregressivo de primeira ordem como 1245 em que t satisfaz todas as hipóteses dos MQO Imagine ainda por conveniência que t distribuise normalmente com média zero e variância unitária D 1 A Equação 1245 postula que os termos de Tabela 121 Exemplo hipotético de termos de erro correlacionados de modo positivo Nota extraído de A million ramdom digits and one hundred thousand desviates Santa Monica Calif Rand Corporation 1950 valor inicial assumido Figura 125 Correlação gerada pelo processo ut D 07ut 1 C t Tabela 121 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 0 Tempo ut ECONOBOOKParte02indb 427 23112010 071921 428 Parte Dois Relaxamento das hipóteses do modelo clássico erro sucessivos estão positivamente correlacionados com um coeficiente de autocorrelação de C07 um grau de dependência bastante alto Agora usando uma tabela de números aleatórios normais com média zero e variância unitária geramos os 10 números aleatórios apresentados na Tabela 121 e em seguida pelo processo 1245 é criado ut Para começar é necessário especificar o valor inicial de u por exemplo u0 D 5 Traçando o ut gerado na Tabela 121 obtemos a Figura 125 o que mostra que inicialmente cada ut sucessivo é mais alto que seus valores anteriores e posteriormente em geral é menor do que seus valores anteriores indicando geralmente uma autocorrelação positiva Agora suponha que os valores dos X sejam fixados em 1 2 3 10 De acordo com esses X po demos gerar uma amostra de 10 valores de Y com base na Equação 1243 e dos valores de ut apre sentados na Tabela 121 Os detalhes estão na Tabela 122 Usando os dados da Tabela 122 se fizermos a regressão de Y contra X obteremos a seguinte regressão amostral 1246 Tabela 122 Geração de Y valores amostrais Nota elaborado com base na Tabela 121 Figura 126 A verdadeira FRP e a linha de regressão estimada para os dados da Tabela 122 2 4 6 8 10 2 4 6 8 10 Y u1 u1 Yt 65452 03051Xt Yt 1 08Xt Verdadeira FRP Verdadeiro Y X 0 ECONOBOOKParte02indb 428 23112010 071922 Capítulo 12 Autocorrelação o que acontece se os termos de erro são correlacionados 429 A verdadeira linha de regressão é dada pela Equação 1244 Ambas as linhas de regressão aparecem na Figura 126 o que mostra claramente quanto a linha de regressão ajustada distorce a verdadeira linha de regressão ela subestima significativamente o verdadeiro coeficiente angular mas superestima o verdadeiro intercepto Observe que ainda assim os estimadores de MQO são não tendenciosos A Figura 126 também mostra a razão pela qual a verdadeira variância de ui tende a ser subesti mada pelo estimador æO 2 que é calculada a partir de uOi Os uOi geralmente estão próximos da linha ajustada devido ao procedimento dos MQO mas desviamse substancialmente da verdadeira FRP Eles não apresentam uma imagem correta de ui Para entender me lhor a extensão da subestimação do verdadeiro æ 2 suponha outro experimento de amostragem Com os Xt e os t apresentados nas Tabelas 121 e 122 imaginemos que Ω D 0 ou seja nenhuma autocorrelação A nova amostra de valores de Y está na Tabela 123 A regressão com base na Tabela 123 é a seguinte 1247 Essa regressão aproximase muito mais da verdadeira porque agora os Y são essencialmente aleatórios Observe que æO 2 aumentou de 08114 Ω D 07 para 09752 Ω D 0 Também observe que os erros padrão de ØO1 e ØO2 aumentaram Esse resultado está de acordo com os resultados teóricos con siderados anteriormente 125 Relação entre salários e produtividade no setor empresarial dos Estados Unidos 19602005 Agora que já examinamos as consequências da autocorrelação a pergunta óbvia é como pode mos detectála e corrigila Antes de tratarmos desses tópicos é útil considerar um exemplo concreto A Tabela 124 apresenta dados relativos a índices de remuneração real por hora Y e produção por hora X no setor empresarial da economia norteamericana referentes ao período 1960 2005 a base dos índices é 1992 D 100 Na Figura 127 temos a representação gráfica dos dados em Y e X Como se espera que a relação entre remuneração real e produtividade da mão de obra seja positiva não surpreende que as duas variáveis apresentem relação positiva O que surpreende é que a relação entre as duas é quase linear embora haja alguns indícios de que quando os valores da produtividade são mais elevados a relação Tabela 123 Amostra de valores de Y com correlação serial igual a zero Nota uma vez que não há autocorrelação ut e t são idênticos Os t são os da Tabela 121 ECONOBOOKParte02indb 429 23112010 071923 430 Parte Dois Relaxamento das hipóteses do modelo clássico entre as variáveis tornase ligeiramente não linear Portanto decidimos estimar um modelo linear e outro loglinear com os seguintes resultados 1251 em que d é a estatística de DurbinWatson que examinaremos adiante 1252 Uma vez que esse modelo é doublelog o coeficiente angular representa a elasticidade Neste caso vemos que se a produtividade do trabalho aumenta 1 a remuneração média aumenta cerca de 065 Qualitativamente ambos os modelos apresentam resultados semelhantes Nos dois casos os coe ficientes estimados são altamente significativos como indicado pelos valores elevados de t No modelo linear se o índice de produtividade aumenta em uma unidade o índice de remuneração sobe em média 067 unidades No modelo logarítmico como o coeficiente angular é a elasticidade por quê verificamos que se o índice de produtividade aumenta 1 o índice de remuneração real au menta em média 065 Até que ponto os resultados apresentados nas Equações 1251 e 1252 são confiáveis se há autocorrelação Como afirmado anteriormente se há autocorrelação os erros padrão estimados são tendenciosos e como consequência as razões t estimadas não são confiáveis Obviamente precisa mos detectar se nossos dados são autocorrelacionados Na seção seguinte examinaremos vários mé todos de detecção da autocorrelação e ilustraremos com o modelo loglinear 1252 Tabela 124 Índices de remuneração real e de produtividade 19602005 Índice de números 1992 D 100 dados trimestrais sazonais ajustados Fonte Economic Report of the President 2007 Tabela B 49 Notas Y D índice de remuneração real por hora setor empresarial 1992 D 100 X D índice de produção setor empresarial 1992 D 100 ECONOBOOKParte02indb 430 23112010 071924 Capítulo 12 Autocorrelação o que acontece se os termos de erro são correlacionados 431 126 Detecção de autocorrelação i Método gráfico Lembrese de que a hipótese da ausência da autocorrelação do modelo clássico referese aos ter mos de erro da população ut que não são observados diretamente O que temos são suas proxies os resíduos uOt que podem ser obtidos pelo procedimento habitual dos MQO Embora os uOt não sejam a mesma coisa que ut17 muitas vezes um exame visual dos uO dá algumas pistas sobre a provável pre sença de autocorrelação dos uO Na verdade um exame visual de uOt ou uOi 2 pode fornecer informações 17 mesmo que os termos de erro sejam homocedásticos e não correlacionados seus estimadores os resíduos uOt são heterocedásticos e autocorrelacionados Veja maDDala G S Introduction to econometrics 2 ed Nova York macmillan 1992 p 480481 Contudo podese demonstrar que à medida que a amostra aumenta in definidamente os resíduos tendem a convergir para seus verdadeiros valores os ut Veja maliNVaUD e Statistical methods of econometrics 2 ed amsterdã Northholland Publishers 1970 p 88 Figura 127 Índice de remuneração Y e índice de produtividade X Estados Unidos 19602005 5040 60 80 100 120 140 160 60 70 80 90 100 130 120 110 1960 1995 1965 1970 1975 1980 1985 1990 2000 2005 8 6 2 4 0 2 4 SDRES 100S1 6 Ano Figura 128 Resíduos ampliados 100 vezes efetivos e padronizados da regressão dos salários contra a produtividade forma logarítmica modelo 1252 ECONOBOOKParte02indb 431 23112010 071925 432 Parte Dois Relaxamento das hipóteses do modelo clássico úteis não apenas quanto à autocorrelação mas também quanto à heterocedasticidade abordada no capítulo anterior à inadequação ou aos vieses de especificação como veremos no próximo capí tulo Como observa um autor A importância de elaborar e analisar gráficos dos resíduos como parte rotineira da análise estatística deve ser destacada Além de fornecer um resumo simples para entender um problema complexo eles permitem o exame simultâneo dos dados como um agregado ao mesmo tempo em que exibem o com portamento dos casos individuais18 Existem várias maneiras de analisar os resíduos Podemos apenas plotálos contra o tempo uma plotagem sequencial no tempo como fizemos na Figura 128 que mostra os resíduos obtidos por meio da regressão dos salários contra a produtividade 1252 Os valores desses resíduos são apre sentados na Tabela 125 com alguns outros dados Como alternativa podemos plotar os resíduos padronizados contra o tempo que também estão na Figura 128 e na Tabela 125 Os resíduos padronizados são simplesmente os resíduos uOt divididos pelo erro padrão da regressão ou seja uOtæO Observe que uOt e æO são medidos na mesma uni dade em que o regressando Y Os valores dos resíduos padronizados portanto serão números puros sem unidade de medida e podem ser comparados com os resíduos padronizados de outras regres sões Além disso os resíduos padronizados como uOt têm média zero por quê e uma variância aproximadamente unitária19 Em grandes amostras uOtæO apresenta uma distribuição aproximada mente normal com média zero e variância unitária Em nosso exemplo æO D 26755 18 WeiSBerG Stanford Applied linear regression Nova York John Wiley Sons p 120 1980 19 Na verdade os resíduos chamados de Studentizados são os que têm variância unitária mas na prática os resíduos padronizados darão a mesma imagem e por isso podemos confiar neles Sobre esse assunto veja DraPer Norman Smith harry Applied regression analysis 3 ed Nova York John Wiley Sons 1998 p 207208 Tabela 125 Resíduos efetivos padronizados e defasados Notas RES1 D resíduos da regressão salário contra produtividade forma logarítmica RES1 1 D resíduos com defasagem de um período RESP D resíduos padronizados D resíduos erro padrão de estimativa ECONOBOOKParte02indb 432 23112010 071925 Capítulo 12 Autocorrelação o que acontece se os termos de erro são correlacionados 433 Examinando a plotagem sequencial no tempo da Figura 128 observamos que tantos uOt quanto os uOt padronizados exibem o padrão visto na Figura 121d sugerindo que os ut talvez não sejam aleatórios De maneira diferente podemos plotar uOt contra uOt1 isto é os resíduos no período t contra seu valor em t 1 uma espécie de teste aplicado do processo AR1 Se os resíduos forem não aleató rios devemos obter uma imagem semelhante às da Figura 123 Essa forma de representar os resíduos está na Figura 129 para o caso da regressão saláriosprodutividade e os dados que lhe dão origem são os da Tabela 125 Como a figura mostra a maioria dos resíduos agrupase no segundo nordeste e no quarto sudoeste quadrantes sugerindo forte correlação positiva nos resíduos O método gráfico que acabamos de ver embora poderoso e sugestivo é de natureza subjetiva ou qualitativa Mas existem vários testes quantitativos que podem ser usados para complementar a abor dagem puramente qualitativa Veremos alguns deles a seguir ii O teste das carreiras Se examinarmos cuidadosamente a Figura 128 notaremos uma característica peculiar inicial mente temos vários resíduos negativos depois uma série de resíduos positivos e novamente vários resíduos negativos Se esses resíduos fossem puramente aleatórios poderíamos observar um padrão desse tipo Intuitivamente parece improvável E podemos testar tal fato mediante o chamado teste das car reiras também conhecido como teste de Geary um teste não paramétrico20 Para explicarmos o teste de carreiras simplesmente anotemos os sinais C ou dos resíduos obtidos por meio da regressão dos salários contra a produtividade apresentados na primeira coluna da Tabela 125 1261 Dessa forma há 8 resíduos negativos seguidos por 21 positivos e depois há mais 11 resíduos negativos seguidos por 3 positivos seguidos por 3 negativos para um total de 46 observações Definiremos uma carreira como uma sequência ininterrupta de um símbolo ou atributo tais como C ou Definiremos em seguida a extensão da carreira como o número de elementos que a formam Na sequência mostrada na Equação 1261 há 5 carreiras uma carreira de 8 menos com tamanho 8 uma carreira de 21 mais com tamanho 21 outra de 11 menos com tamanho 11 uma carreira de 3 mais com tamanho 3 e outra de 3 menos com tamanho 3 Para facilitar a visualização as várias carreiras estão entre parênteses Examinando como as carreiras comportamse em uma sequência de observações rigorosamente aleatórias podemos derivar um teste de aleatoriedade das carreiras A pergunta a ser feita é as 5 carreiras observadas em nosso exemplo ilustrativo de 46 observações são de mais ou de menos em relação ao número de carreiras esperado em uma sequência rigorosamente aleatória de 46 observa ções Se houver carreiras demais isso significaria que no nosso exemplo os resíduos frequentemen te alteram o sinal indicando uma correlação serial negativa veja a Figura 123b Da mesma forma se houver poucas carreiras isso sugerirá um autocorrelação positiva como na Figura 123a A priori a Figura 128 indicaria correlação positiva dos resíduos Agora façamos N D número total de observações D N1 C N2 N1 D número de sinais C resíduos C N2 D número de sinais resíduos R D número de carreiras 20 Nos testes não paramétricos não fazemos hipóteses sobre a distribuição de probabilidade das quais as observações são extraídas Sobre o teste de GearY veja GearY r C relative efficiency of count sign changes for assessing residual autoregression in least squares regression Biometrika 1970 v 57 p 123127 ECONOBOOKParte02indb 433 23112010 071926 434 Parte Dois Relaxamento das hipóteses do modelo clássico Sob a hipótese nula de que os resultados sucessivos aqui resíduos são independentes e supondo que N1 10 e N2 10 o número de carreiras apresentadas é assintoticamente normalmente distri buído com Variação Média 1262 Nota N D N1 C N2 Se a hipótese nula de aleatoriedade for sustentável de acordo com as propriedades da distribuição normal deveríamos esperar que 1263 Isto é 95 de probabilidade de que o intervalo acima inclua R Portanto podemos recorrer à se guinte regra Regra de decisão Não rejeite a hipótese nula de aleatoriedade com 95 de confiança se R o número de carreiras ficar no intervalo de confiança citado rejeitea se o R estimado ficar fora desses li mites Nota o pesquisador deverá escolher o nível de confiança desejado Voltando ao nosso exemplo sabemos que N1 o número de sinais positivos é de 24 e N2 o núme ro de sinais negativos é de 22 e que R D 5 Utilizando as fórmulas indicadas na Equação 1262 obtemos 1264 Figura 129 Resíduos atuais contra resíduos defasados 6 6 4 2 Res11 Res1 0 2 4 4 2 0 2 I II IV III 4 ECONOBOOKParte02indb 434 23112010 071927 Capítulo 12 Autocorrelação o que acontece se os termos de erro são correlacionados 435 Logo o intervalo de confiança de 95 para R em nosso exemplo é Obviamente esse intervalo não inclui o número 5 Podemos rejeitar com 95 de confiança a hipótese de que os resíduos da regressão dos salários contra a produtividade sejam aleatórios Em outras pala vras os resíduos apresentam autocorrelação Como regra geral se houver autocorrelação positiva o número de carreiras será pequeno se a autocorrelação for negativa o número de carreiras será grande Claro que por meio da Equação 1262 podemos saber se temos muitas ou poucas carreiras Swed e Eisenhart elaboraram tabelas especiais que dão valores críticos para as carreiras esperadas em uma sequência aleatória de N observações se N1 ou N2 for menor do que 20 Essas tabelas são apresentadas na Tabela D6 do Apêndice D Desse modo o leitor poderá verificar que os resíduos da regressão dos salários contra a produtividade são de fato não aleatórios na verdade estão correla cionados positivamente iii O teste d de DurbinWatson21 O teste mais famoso para a detecção serial é o desenvolvido pelos estatísticos Durbin e Watson Popularmente conhecido como estatística d de DurbinWatson ele é definido como 1265 que é apenas a razão da soma das diferenças elevadas ao quadrado entre resíduos sucessivos e a SQR Note que no numerador da estatística d o número de observações é n 1 porque perdese uma observação no cálculo das diferenças sucessivas Uma grande vantagem da estatística d é que ela se baseia nos resíduos estimados que costumam ser calculados na análise de regressão Em razão dessa vantagem agora se tornou prática comum informar o d de DurbiWatson com outras medidas como o R2 o R2 ajustado t e F Embora atual mente seja empregado como rotina é importante estar atento às hipóteses que fundamentam a estatística d 1 O modelo de regressão inclui o termo de intercepto Se não estiver presente como no caso da regressão que passa pela origem é essencial refazer a regressão incluindo o intercepto para obter a SQR22 2 As variáveis explanatórias os X são não estocásticas ou fixas em amostras repetidas 3 Os termos de erro ut são gerados pelo processo autorregressivo de primeira ordem ut D Ωut1 C t Portanto não podem ser usado para detectar processos autorregressivos de ordem mais elevada 4 Pressupõese que o termo de erro ut seja distribuído normalmente 5 O modelo de regressão não inclui os valores defasados da variável dependente como uma das variáveis explanatórias O teste não pode ser aplicado a modelos do seguinte tipo 1266 em que Yt1 é o valor de Y com defasagem de um período Tais modelos são conhecidos como modelos autorregressivos que estudaremos no Capítulo 17 21 DUrBiN J WatSON G S testing for serial correlation in leastsquares regression Biometrika 1951 v 38 p 159171 22 entretanto r W Farebrother calculou os valores d quando o intercepto está ausente do modelo Veja the DurbinWatson test for serial correlation when there is no intercept in the regression Econometrica 1980 v 48 p 15531563 ECONOBOOKParte02indb 435 23112010 071928 436 Parte Dois Relaxamento das hipóteses do modelo clássico 6 Não faltam observações nos dados Em nossa regressão de saláriosprodutividade para o período de 19602005 se por alguma razão estivessem faltanto observações para por exem plo 1978 e 1982 a estatística d não faria concessão para essas observações faltantes23 É difícil derivar a amostragem ou probabilidade exata da estatística d dada na Equação 1265 porque como mostraram Durbin e Watson isso depende de uma maneira complicada dos valores de X presentes em uma amostra24 Essa dificuldade deveria ser compreensível porque d é calculado dos uOt que evidentemente dependem de determinados X Diferentemente dos testes t F ou 2 não há um único valor crítico que leve à rejeição ou à aceitação nos termos de erro ui No entanto Durbin e Watson conseguiram determinar um limite inferior dL e um superior dU tal que se o d calculado da Equação 1265 estiver fora desses valores críticos podese tomar uma decisão a respeito da presen ça de correlação serial positiva ou negativa Além disso esses limites dependem apenas do número de observações n e do número de variáveis explanatórias e não dos valores assumidos por essas va riáveis Os limites para n de 6 a 200 e até 20 variáveis explanatórias foram tabulados por Durbin e Watson e estão na Tabela D5 do Apêndice D O procedimento seguido no teste pode ser explicado melhor com auxílio da Figura 1210 que mostra que os limites de d são 0 e 4 Estes podem ser estabelecidos como se segue Expandimos a Equação 1265 para obter 1267 Uma vez que diferem apenas em uma observação são aproximadamente iguais Assim sendo a Equação 1267 pode ser escrita como 1268 em que º significa aproximadamente Agora vamos definir 1269 23 Para mais detalhes veja KOrOSi Gabor matYaS laszlo SZeKeY istvan P Practical econometrics inglaterra avebury Press 1992 p 8889 24 Veja a discussão sobre o teste exato de DurbinWatson mais à frente nesta seção Figura 1210 Estatística d de DurbinWatson Rejeitar H0 Evidência de autocorrela ção positiva Zona de indecisão Não rejeitar H0 ou H 0 ou ambas Zona de indecisão Rejeitar H 0 Evidência de autocorrela ção negativa 2 4 dU 4 dL 4 d dU dL 0 Legenda H0 Ausência de autocorrelação positiva H 0 Ausência de autocorrelação negativa ECONOBOOKParte02indb 436 23112010 071930 Capítulo 12 Autocorrelação o que acontece se os termos de erro são correlacionados 437 como o coeficiente de autocorrelação de primeira ordem amostral um estimador de Ω Veja a nota de rodapé 9 Usando a Equação 1269 podemos expressar a Equação 1268 como 12610 Mas como 1 Ω 1 a Equação 12610 implica que 12611 Esses são os limites de d qualquer valor estimado de d deve ficar entre esses limites É evidente da Equação 12610 que se ΩO D 0 d D 2 isto é se não houver correlação serial de primeira ordem esperase que d seja em torno de 2 Como regra prática se constatarmos que d é igual a 2 em uma aplicação podemos supor que não há correlação de primeira ordem seja positiva ou negativa Se ΩO D C1 indicando correlação positiva perfeita nos resíduos d º 0 Quanto mais próximo d for de 0 maior a evidência da correlação serial positiva Essa relação deveria ser evidente da Equação 1265 porque se houver autocorrelação positiva os uOt se juntarão e suas diferenças tenderão a ser pequenas Como resultado a soma dos quadrados do numerador será menor que a do denominador que permanece um valor único para qualquer regressão dada Se ΩO D 1 isto é há correlação negativa perfeita entre os resíduos sucessivos d º 4 Quanto mais próximo d estiver de 4 maior a evidência de correlação serial negativa Novamente examinan do a Equação 1265 isso é compreensível Pois se há autocorrelação negativa um uOt positivo tenderá a ser seguido de um uOt negativo e viceversa de modo que uOt uOt1 em geral será maior que uOt Em consequência o numerador de d será comparativamente maior que o denominador As etapas envolvidas no teste de DurbinWatson são apresentadas a seguir supondose que as hipóteses que o fundamentam sejam respeitadas 1 Efetuase a regressão por meio de MQO obtendose os resíduos 2 Calculase d da Equação 1265 Atualmente a maioria dos programas de computador tem esse recurso 3 Para um dado tamanho amostral e número de variáveis explanatórias determine os valores dL e dU críticos 4 Agora siga as regras de decisão apresentadas na Tabela 126 Para facilitar sua consulta essas regras também estão na Figura 1210 Para ilustrarmos o mecanismo retomemos nossa regressão de saláriosprodutividade Dos dados apre sentados na Tabela 125 o valor d estimado pode ser mostrado como 02175 sugerindo que há uma corre lação serial positiva nos resíduos Das tabelas de DurbinWatson constatamos que para 46 observações e uma variável explanatória dL D 1475 e dU D 1566 ao nível de 5 Uma vez que o d calculado 02175 está abaixo de dL não podemos rejeitar a hipótese de que há correlação serial positiva nos resíduos Embora seja extremamente usado o teste d tem uma grande desvantagem se cair na zona de indecisão não se pode concluir se há ou não autocorrelação de primeira ordem Para resolver esse problema vários autores propuseram modificações do teste d mas são bastante complicadas e estão além do escopo deste livro25 Em muitas situações no entanto constatouse que o limite 25 Para detalhes veja FOmBY thomas B hill r Carter JOhNSON Stanley r Advanced econometric methods Nova York Springer Verlag 1984 p 225228 Tabela 126 Teste d de Durbin Watson Regras de decisão Não há autocorrelação negativa Não há autocorrelação negativa Sem decisão Rejeitar Rejeitar Sem decisão ECONOBOOKParte02indb 437 23112010 071931 438 Parte Dois Relaxamento das hipóteses do modelo clássico superior dU é aproximadamente o verdadeiro limite de significância e portanto no caso em que d fica na zona de indecisão podese usar o seguinte teste d modificado dado o nível de signi ficância Æ 1 H0 Ω D 0 versus H1 Ω 0 Rejeitar H0 ao nível Æ se d dU Isto é há autocorrelação positiva estatisticamente significativa 2 H0 Ω D 0 versus H1 Ω 0 Rejeitar H0 ao nível Æ se o nível estimado 4 d dU Isto é há evidência estatisticamente significativa de autocorrelação negativa 3 H0 Ω D 0 versus H1 Ω 0 Rejeitar H0 ao nível 2Æ se d dU ou 4 d dU Isto é há evi dência estatisticamente significativa de autocorrelação positiva ou negativa Podese salientar que a zona de indecisão estreitase à medida que o tamanho da amostra aumenta o que pode ser visto claramente nas tabelas de DurbinWatson Por exemplo com 4 regressores e 20 observações os valores inferior e superior de d a 5 são 0894 e 1828 respectivamente mas esses valores são 1515 e 1739 se o tamanho da amostra for 75 O programa SHAZAM efetua um teste exato ou seja ele dá o pvalor a probabilidade exata do valor d calculado Com as facilidades de cálculo em computador que temos atualmente não é mais difícil encontrar o valor p calculado da estatística d Usando o SHAZAM versão 9 para nossa regres são de salários contra produtividade verificamos que o valorp do d calculado de 02176 é praticamen te zero reconfirmando assim nossa conclusão anterior baseada nas tabelas de DurbinWatson O teste d de DurbinWatson tornouse tão respeitado que os usuários muitas vezes se esquecem das hipóteses que o fundamentam Em especial as hipóteses de que 1 as variáveis explanatórias ou regressores são não estocásticas 2 o termo de erro segue a distribuição normal 3 os modelos de regressão não incluem os valores defasados do regressando e 4 apenas a correlação serial de pri meira ordem é levada em conta Devemos acrescentar também que uma estatística significativa d pode não indicar necessariamente autocorrelação Em vez disso ela pode ser indicação de omissão de variáveis relevantes no modelo Se um modelo de regressão contém valores defasados do regressando o valor d em tais casos é frequentemente em torno de 2 o que sugere que não há autocorrelação de primeira ordem em tais modelos Há um viés embutido contra descobrir autocorrelação de primeira ordem em tais modelos Isso não significa que os modelos autoregressivos não sofram do problema de autocorrelação De fato Durbin desenvolveu o chamado teste h para testar correlação serial em tais modelos Mas esse teste não é tão poderoso no sentido estatístico quanto o teste de BreuschGodfrey discutido rapi damente de modo que não há necessidade de usar o teste h Entretanto devido à sua importância histórica ele é abordado no Exercício 1236 Além disso se o termo de erro ut não for NIID o teste d usado como rotina pode não ser confiá vel26 Nesse sentido o teste de carreiras tem a vantagem de não fazer nenhum pressuposto quanto à distribuição de probabilidade do termo de erro Se a amostra for grande infinita em termos técni cos podemos empregar o teste d de DurbinWatson já que é possível demosntrar que27 12612 Em amostras grandes a estatística d transformada na Equação 12612 segue a distribuição pa drão normal A propósito tendo em vista a relação entre d e ΩO o coeficiente de autocorrelação de primeira ordem estimado mostrado na Equação 12610 seguese que 12613 26 Para uma discussão avançada veja mittelhammer ron C JUDGe George G miller Douglas J Econometric foundations Nova York Cambridge University Press 2000 p 550 27 Veja DaViDSON James Econometric theory Nova York Blackwell Publishers 2000 p 161 ECONOBOOKParte02indb 438 23112010 071931 Capítulo 12 Autocorrelação o que acontece se os termos de erro são correlacionados 439 isto é em amostras grandes a raiz quadrada do tamanho da amostra vezes o coeficiente de autocor relação de primeira ordem estimado também segue a distribuição normal padrão Para ilustrar do teste para o exemplo de salários contra produtividade verificamos que d D 02176 com n D 46 Portanto da Equação 12612 verificamos que Assintoticamente se a hipótese nula de correlação de primeira ordem igual a zero for verdadei ra a probabilidade de obter um valor Z uma variável normal padronizada de 60447 ou mais será extremamente pequena Lembrese de que para uma distribuição normal padrão o valor Z crítico bicaudal a 5 é de apenas 196 e a 1 é de cerca de 258 Embora o tamanho de nossa amostra seja de apenas 40 observações para fins práticos pode ser suficientemente grande para permitir o uso da aproximação normal A conclusão é a mesma os resíduos da regressão dos salários contra a produti vidade apresentam autocorrelação O problema mais sério com o teste d é o pressuposto de que os regressores são não estocásticos ou seja seus valores são fixos em amostragens repetidas Se esse não for o caso o teste d não é váli do nem em amostras finitas ou pequenas nem nas grandes28 E uma vez que em geral é difícil susten tar esse pressuposto em modelos econômicos envolvendo dados de séries temporais um autor afirma que a estatística de DurbinWatson pode não ser útil em econometria que envolve séries temporais29 Segundo ele existem testes mais úteis de autocorrelação mas todos baseiamse em amostras grandes Discutiremos um desses testes a seguir o teste de BreuschGodfrey iV um teste geral de autocorrelação o teste de breuschgodfrey bg30 Para evitar algumas das armadilhas do teste d de DurbinWatson os estatísticos Breusch e Godfrey desenvolveram um teste de autocorrelação que é genérico no sentido de que não permite 1 regressores não estocásticos como os valores defasados do regressando 2 esquemas autorregressi vos de ordem superior como AR1 AR2 etc e 3 médias móveis simples ou de ordem mais elevada de termos de erro de ruído branco como t na Equação 122131 Sem entrar em detalhes matemáticos que podem ser obtidos nas referências o teste BG que também é conhecido como teste LM32 é feito como se segue usamos o modelo de regressão de duas variáveis para ilustrar o teste embora muitos regressores possam ser acrescentados a ele Além disso valores defasados do regressando podem ser adicionados ao modelo Seja 12614 Supomos que o termo de erro ut siga um esquema autorregressivo de ordem p ARp como se segue 12615 em que t é um termo de erro de ruído branco como examinado anteriormente Como se vê é uma simples extensão do processo AR1 A hipótese nula H0 a ser testada é que H0 Ω1 D Ω2 D D Ωp D 0 12616 28 ibid p 161 29 haYaShi Fumio Econometrics Princeton NJ Princeton University Press 2000 p 45 30 Veja GODFreY l G testing against general autoregressive and moving average error models when the regressor includes lagged dependent variables Econometrica v 46 p 12931302 1978 e BreUSCh t S testing for autocorrelation in dynamic linear models Australian Economic Papers 1978 v 17 p 334355 31 Por exemplo na regressão Yt D Ø1 C Ø2 Xt C ut o termo de erro pode ser representado como ut D t C 1 t1 C 2 t2 que indica uma média móvel de três períodos do termo de ruído branco t 32 O teste se baseia no princípio do multiplicador de lagrange mencionado no Capítulo 8 ECONOBOOKParte02indb 439 23112010 071932 440 Parte Dois Relaxamento das hipóteses do modelo clássico Ou seja não há correlação serial de qualquer ordem O teste BG envolve as seguintes etapas 1 Estime a Equação 12614 pelo MQO e obtenha os resíduos uOt 2 Faça a regressão uOt contra o Xt original se houver mais de uma variável X no modelo original incluaas também e uOt1 uOt2 uOtp em que os últimos são os valores defasados dos resíduos estimados na etapa 1 Assim se p D 4 introduziremos os quatro valores defasados dos resíduos como regressores adicionais no modelo Note que para fazer essa regressão teremos apenas n p observações por quê Em suma efetue a seguinte regressão 12617 e obtenha R2 dessa regressão auxiliar33 3 Se o tamanho da amostra for grande tecnicamente infinito Breusch e Godfrey mostraram que 12618 Assintoticamente n p vezes o valor R2 obtido da regressão auxiliar 12617 segue a distribui ção do quiquadrado com p graus de liberdade Se em uma aplicação n p R2 excede o valor crítico do quiquadrado no nível de significância escolhido rejeitamos a hipótese nula em que pelo menos Ω na Equação 12615 é estátisco e significamente diferente de zero Os seguintes pontos práticos do teste BG podem ser observados 1 Os regressores incluídos no modelo de regressão podem conter valores defasados do regres sando Y ou seja Yt1 Yt2 etc podem parecer como variáveis explanatórias Compare esse modelo com a restrição do teste de DurbinWatson de que pode não haver valores defasados do regressando entre os regressores 2 Como notado o teste BG é aplicável mesmo que os termos de erro sigam um processo de média móvel MA de ordem p isto é que os ut sejam gerados como se segue 12619 em que t é um termo de erro de ruído branco ou seja o termo de erro que satisfaz todas as hipóteses clássicas Nos capítulos sobre séries temporais econométricas estudaremos detalhadamente os proces sos autorregressivos e de médias móveis de ordem p 3 Se na Equação 12615 p D 1 significando autorregressão de primeira ordem o teste BG é conhecido como teste M de Durbin 4 Uma desvantagem do teste BG é que o valor de p a duração da defasagem não pode ser especificado de antemão É inevitável fazer experimentações com o valor p Às vezes pode se usar os chamados critérios de informação de Akaike e Schwarz para selecionar o núme ro de defasagens Discutiremos esses critérios no Capítulo 13 e nos capítulos sobre econo metria de séries temporais 5 Dados os valores das variáveis X e os valores defasados de u o teste supõe que a variância de u na Equação 12615 seja homocedástica 33 a razão para o regressor original X ser incluído no modelo é que podemos considerar que X pode não ser estri tamente não estocástico mas se for estritamente não estocástico poderá ser omitido do modelo Sobre isso veja WOOlDriDGe Jeffrey m Introductory econometrics a modern approach SouthWestern Publishing Co 2003 p 386 ECONOBOOKParte02indb 440 23112010 071933 Capítulo 12 Autocorrelação o que acontece se os termos de erro são correlacionados 441 Ilustração do teste BG relação salários contra produtividade Para ilustrarmos o teste ele será aplicado ao nosso exemplo Usando um processo ar6 obtivemos os resultados do exercício 1225 Dos resultados de regressão podemos ver que n p D 40 e R 2 D 07498 ao multiplicarmos esses dois obtemos um valor de quiquadra do de 29992 Para 6 graus de liberdade por quê a probabilidade de obter um valor de quiquadrado de 29992 ou maior é extremamente pequena a tabela de quiquadrado no apêndice D4 mostra que a probabilidade de obter um valor de quiquadrado de 185476 ou maior é de apenas 0005 Para o mesmo grau de liberdade a probabilidade de obter um valor de quiquadrado de cerca de 30 deve ser mínima Na realidade o verdadeiro valor p é quase zero Portanto concluímos que para nosso exemplo pelo menos uma das seis autocorrelações deve ser não zero tentando variar as durações da defasagem de 1 para 6 verificamos que apenas o coefi ciente ar1 é significativo sugerindo que não há necessidade de considerar mais de uma defasagem em síntese o teste BG nesse caso é o teste M de Durbin por que tantos testes de autocorrelação A resposta a esta pergunta é não existe um teste que tenha sido considerado sem dúvida alguma o melhor o mais eficiente no sentido estatístico e por isso o analista ainda se vê na posição nada invejada de considerar diversos procedimentos de teste para detectar a presença ou estrutura ou ambas de autocorrelação34 Evidentemente um argumento semelhante pode ser apresentado sobre os vários testes de heterocedasticidade discutidos no capítulo anterior 127 O que fazer ao depararse com a autocorrelação medidas corretivas Se depois de aplicarmos um ou mais testes diagnósticos de autocorrelação discutidos na seção anterior verificamos a presença dela o que fazer Temos quatro opções 1 Tentar verificar se é um caso de autocorrelação pura e não o resultado da especificação equivocada do modelo Como discutimos na Seção 121 às vezes observamos padrões em resíduos porque o modelo é mal especificado ou seja excluiu algumas variáveis importan tes ou porque sua forma funcional é incorreta 2 Se for autocorrelação pura podemos usar a transformação adequada do modelo original de modo que no modelo transformado não tenhamos o problema de autocorrelação pura Como no caso de heterocedasticidade teremos de usar algum tipo de método de mínimos quadrados generalizados MQG 3 Em amostras grandes podemos usar o método de NeweyWest para obter os erros padrão dos estimadores de MQO que estão corrigidos para a autocorrelação Esse método na verda de é uma extensão do de erros padrão consistentes para heterocedastividade de White exa minado no capítulo anterior 4 Em algumas situações podemos continuar a usar o método dos MQO Devido à importância de cada um desses tópicos dedicaremos uma seção a cada um deles 34 mittelhammer ron C et al op cit p 547 lembrese de que a eficiência de um teste estatístico é 1 menos a probabilidade de cometer um erro tipo ii ou seja 1 menos a probabilidade de aceitar uma hipótese falsa a eficiência máxima de um teste é 1 e a mínima é 0 Quanto mais próxima a eficiência de um teste estiver de zero pior será ele e quanto mais próxima de 1 mais eficiente será O que esses autores estão dizendo es sencialmente é que não há um teste de autocorrelação que seja sempre o mais eficiente ECONOBOOKParte02indb 441 23112010 071933 442 Parte Dois Relaxamento das hipóteses do modelo clássico 128 Especificação equivocada do modelo versus autocorrelação pura Retomaremos a regressão dos salários contra produtividade da Equação 1252 Nela vimos que o valor d era de 02176 e com base no teste d de DurbinWatson concluímos que havia correlação positiva no termo de erro Essa correlação poderia ter surgido porque o modelo não havia sido espe cificado corretamente Uma vez que os dados que fundamentam a regressão 1251 são séries tem porais é bem possível que tanto os salários quanto a produtividade mostrem tendências Se for esse o caso precisamos incluir a variável tempo ou tendência t no modelo para ver a relação entre salá rios e produtividade líquida das tendências nas duas variáveis Para tanto incluímos a variável de tendência na Equação 1251 e obtivemos os seguintes resultados 1281 É fácil interpretar esse modelo com o tempo o índice de salários reais foi diminuindo em 075 uni dade ao ano Depois de considerar isso se o índice de produtividade subiu em uma unidade em mé dia a remuneração geral subiu em cerca de uma unidade O que é interessante notar é que ao considerar a variável de tendência o valor d ainda é muito baixo sugerindo que a Equação 1281 apresenta autocorrelação pura e não necessariamente erro de especificação Como sabemos que a Equação 1281 é a especificação correta Para tanto fazemos a regressão de Y contra X e X 2 para testar a possibilidade de que o índice de salário real possa estar relacionado não linearmente com o índice de produtividade Os resultados dessa regressão são os seguintes 1282 A interpretação dos resultados deverá ser feita pelo leitor Para nossa finalidade veja o DurbinWatson que ainda está baixo sugerindo que ainda temos correlação serial positiva nos resíduos Podemos concluir da análise anterior que nossa regressão salários contra produtividade provavel mente apresenta autocorrelação pura e não necessariamente do viés de especificação Conhecendo as consequências da autocorrelação podemos desejar fazer alguma ação corretiva Faremos isso em breve Por sinal para todas as regressões de salários contra produtividade que apresentamos aplicamos o teste de normalidade de JarqueBera e verificamos que os resíduos tinham distribuição normal o que nos tranquiliza pois o teste d pressupõe a normalidade do termo de erro 129 Correção da autocorrelação pura o método dos mínimos quadrados generalizados MQG Conhecendo as consequências da autocorrelação principalmente a falta de eficiência dos estima dores podemos precisar corrigir o problema A correção depende do conhecimento que se tem da natureza da interdependência entre os termos de erro ou seja do conhecimento da estrutura da auto correlação Para começar consideraremos o modelo de regressão de duas variáveis 1291 ECONOBOOKParte02indb 442 23112010 071934 Capítulo 12 Autocorrelação o que acontece se os termos de erro são correlacionados 443 e que o termo de erro siga o processo AR1 a saber 1292 Agora consideraremos dois casos 1 Ω é conhecido e 2 Ω não é conhecido mas precisa ser esti mado Quando Ω é conhecido Se o coeficiente de autocorrelação de primeira ordem for conhecido o problema da autocorrela ção pode ser resolvido facilmente Se a Equação 1291 for verdadeira no tempo t também será no tempo t 1 Portanto 1293 Multiplicando a Equação 1293 por Ω em ambos os lados obtemos 1294 Subtraindo a Equação 1294 da 1291 temos 1295 em que t D ut Ωut1 Podemos expressar a Equação 1295 como 1296 Uma vez que o termo de erro na Equação 1296 satisfaz as hipóteses usuais de MQO podemos aplicar o MQO às variáveis transformadas Y e X e obter estimadores com todas as propriedades óti mas a saber MELNT De fato efetuar a Equação 1296 equivale a empregar os mínimos quadrados generalizados MQG examinados no capítulo anterior lembrese de que os MQG nada mais são do que os MQO aplicados ao modelo transformado que atende às hipóteses clássicas A regressão 1295 é conhecida como equação em diferenças generalizadas ou quase equa ção de diferença Ela envolve o cálculo de uma regressão de Y contra X não na forma original mas na forma de diferenças obtida subtraindo uma proporção D Ω do valor de uma variável no período anterior ao seu valor no período atual Nesse processo de obtenção de diferenças perdemos uma observação porque a primeira não tem antecedente Para evitar a perda de uma observação a primei ra observação em Y e X é transformada como se segue35 Essa transforma ção é conhecida como transformação de PraisWinsten Quando Ω não é conhecido Embora conceitualmente seja de aplicação direta o método da diferença generalizada dado na Equação 1295 é de difícil implementação porque na prática Ω raramente é conhecido Portanto precisamos encontrar maneiras de estimar Ω Há várias possibilidades O método da primeira diferença Uma vez que Ω esteja entre 0 e ß1 podemos começar das duas posições extremas Em um dos extremos Ω D 0 não há correlação serial de primeira ordem e no outro Ω H ß 1 há correlação 35 a perda de uma observação pode não ser muito grave em amostras grandes mas pode fazer diferença subs tancial nos resultados em pequenas amostras Sem transformar a primeira observação como indicado a variân cia de erro não será homocedástica Sobre isso veja WOOlDriDGe Jeffrey op cit p 388 Sobre resultados de monte Carlo veja DaViDSON russel maCKiNNON James G Estimation and inference in econometrics Nova York Oxford University Press 1993 tabela 101 p 349 ECONOBOOKParte02indb 443 23112010 071935 444 Parte Dois Relaxamento das hipóteses do modelo clássico perfeita positiva ou negativa Na verdade quando efetuamos a regressão em geral pressupomos que não haja autocorrelação e então usamos o teste de DurbinWatson ou outro teste para mostrar se esse pressuposto justificase Se no entanto Ω D C1 a Equação 1295 da diferença generalizada reduz se à equação de primeira diferença ou 1297 em que D é o operador de primeira diferença apresentado na Equação 12110 Uma vez que o termo de erro na Equação 1297 está livre da correlação serial de primeira or dem por quê para efetuarmos a regressão 1297 só precisamos calcular as primeiras diferenças tanto do regressando quanto dos regressores e efetuar a regressão com essas diferenças A transformação de primeira diferença pode ser adequada se o coeficiente de autocorrelação for muito alto por exemplo superior a 08 ou o d de DurbinWatson for muito baixo Maddala propôs esta regra prática geral use a forma de primeira diferença sempre que d R236 Este é o caso de nossa regressão de salários contra produtividade 1252 em que verificamos que d D 02176 e r2 D 09845 A regressão de primeira diferença para nosso exemplo ilustrativo será apresentada adiante Um aspecto interessante do modelo de primeiras diferenças é que ele não tem intercepto Para estimarmos 1297 temos de recorrer à rotina da regressão que passa pela origem suprime o termo de intercepto que atualmente faz parte da maioria dos programas de computador Contudo se esque cermos de excluir o termo de intercepto do modelo e estimarmos o seguinte modelo que o inclui 1298 o modelo original deve ter um termo de tendência incluído e Ø1 representa o coeficiente da variável de tendência37 Portanto um benefício acidental de introduzir o modelo de primeiras diferenças é testar quanto à presença de uma variável de tendência no modelo original Retornando à regressão de salários contra produtividade 1252 e dado o processo AR1 e um valor baixo de d em relação a r2 voltamos a efetuar a Equação 1252 na forma de primeira diferen ça sem o termo de intercepto lembrese de que a Equação 1252 está na forma de nível Os resul tados são os seguintes38 1299 Em comparação com a regressão em forma de nível 1252 vemos que o coeficiente angular não mu dou muito mas o valor de r2 caiu consideravelmente Em geral é esse o caso porque tomando as primei ras diferenças estamos essencialmente estudando o comportamento de variáveis em torno de seus valores de tendência linear Evidentemente não podemos comparar o r2 da Equação 1299 direta mente com aquele do r2 da Equação 1252 porque as variáveis dependentes nos dois modelos são diferentes39 Além disso note que em comparação com a regressão original o valor d aumentou acen tuadamente talvez indicando que haja pouca autocorrelação na regressão de primeiras diferenças40 36 maDDala op cit p 232 37 É fácil mostrar isso Seja Yt D Æ1 C Ø1t C Ø2Xt C ut Portanto Yt1 D Æ C Ø1t 1 C Ø2 Xt1 C ut1 Subtraindo o último do primeiro obteremos DYt D Ø1 C Ø2D Xt C t que mostra que o termo de intercepto nessa equação é de fato o coeficiente da variável de tendência no modelo original lembrese de que estamos supondo que Ω D 1 38 No exercício 1238 pediuse que fosse calculado esse modelo incluindo o termo constante 39 a comparação de r2 na forma de nível e de primeiras diferenças é um pouco complicada Para uma discussão mais detalhada sobre o assunto veja maDDala op cit Capítulo 6 40 Não se sabe com certeza se o d calculado na regressão de primeiras diferenças pode ser interpretado da mesma maneira que o foi na forma de nível original da regressão entretanto aplicando o teste de carreiras podemos ver que não há evidência de autocorrelação nos resíduos da regressão de primeiras diferenças ECONOBOOKParte02indb 444 23112010 071936 Capítulo 12 Autocorrelação o que acontece se os termos de erro são correlacionados 445 Outro aspecto interessante da transformação em primeiras diferenças relacionase às proprieda des de estacionariedade da série temporal subjacente Voltemos à Equação 1221 que descreve o processo AR1 Agora se de fato Ω D 1 então está claro das Equações 1223 e 1224 que a série ut é não estacionária pois as variâncias e covariâncias tornamse infinitas É por isso que quan do discutimos esse tópico impusemos a restrição de que Ω 1 Mas está claro da Equação 1221 que se o coeficiente de autocorrelação for de fato 1 então a Equação 1221 tornase ou 12910 Ou seja são os ut de primeira diferença que se tornam estacionários pois são iguais a t que é um termo de erro de ruído branco O ponto da discussão anterior é que se a série temporal original for não estacionária muito frequentemente suas primeiras diferenças tornamse estacionárias E portanto a transformação em primeiras diferenças serve a um propósito duplo pois pode nos livrar da autocorrelação de primeira ordem e também tornar a série temporal estacionária Voltaremos a esse assunto na Par te 5 em que discutiremos a econometria da análise de séries temporais com certa profundidade Mencionamos que a transformação em primeiras diferenças pode ser adequada se Ω for alto ou d for baixo Em termos estritos a transformação em primeiras diferenças é válida apenas se Ω D 1 De fato existe um teste chamado teste de BerenbluttWebb41 para verificar a hipótese de que Ω D 1 O teste estatístico que eles usam é denominado estatística g e pode ser definido como se segue 12911 em que uOt são os resíduos de MQO da regressão original na forma de nível e et são os resíduos de MQO da regressão de primeiras diferenças Lembrese de que na forma de primeiras diferenças não há intercepto Para testarmos a significância da estatística g supondo que a regressão em forma de nível conte nha o termo de intercepto podemos recorrer às tabelas de DurbinWatson sendo que agora a hipóte se nula será Ω D 1 e não a hipótese de DurbinWatson de que Ω D 0 Voltando à regressão de saláriosprodutividade para a regressão original 1252 obtemos Colocando esses valores na estatística g dada na Equação 12911 obtemos 12912 Consultando a tabela de DurbinWatson para 45 observações o número mais próximo de 45 observa ções e 1 variável explanatória Apêndice D Tabela D5 verificamos que dL D 1288 e dU D1376 no nível de 5 Como o g observado está situado abaixo do limite inferior de d não rejeitamos a hipó tese de que o verdadeiro Ω D 1 Lembrese de que embora usemos as mesmas tabelas de Durbin Watson agora a hipótese nula é que Ω D 1 e não que Ω D 0 Tendo em vista esse achado os resultados na Equação 1299 podem ser aceitáveis O Ω com base na estatística d de DurbinWatson Se não podemos usar a transformação das primeiras diferenças porque Ω não está suficientemen te próximo da unidade temos um método fácil de calculálo por meio da relação entre d e Ω estabe lecida anteriormente na Equação 12610 da qual podemos estimar Ω como se segue 12913 41 BereNBlUtt i i WeBB G i a new test for autocorrelated errors in the linear regression model Journal of the Royal Statistical Society 1973 série B v 35 n1 p 3350 ECONOBOOKParte02indb 445 23112010 071937 446 Parte Dois Relaxamento das hipóteses do modelo clássico Assim em amostras razoavelmente grandes podese obter Ω da Equação 12913 e usála para trans formar os dados como mostrado na equação das diferenças generalizadas 1295 Lembrese de que a relação entre Ω e d dada na Equação 12913 pode não ser verdadeira em pequenas amostras para as quais Theil e Nagar propuseram uma modificação apresentada no Exercício 126 Em nossa regressão de salários e produtividade 1252 obtemos um valor d de 02176 Usando esse valor na Equação 12913 obtemos ΩO º 08912 Usando esse valor de Ω estimado podemos estimar a regressão 1295 Basta subtrairmos 08912 vezes o valor anterior de Y de seu valor cor rente e do mesmo modo subtrair 08912 vezes o valor anterior de X de seu valor corrente e efetuar a regressão de MQO contra as variáveis assim transformadas como na Equação 1296 em que Y t D Yt 08912Yt1 e X t D Xt 08912 Xt1 O Ω estimado dos resíduos Se o processo AR1 ut D Ωut1 C t for válido uma maneira simples de estimar Ω é fazer a re gressão dos resíduos uOt contra uOt1 pois os uOt são estimadores consistentes do verdadeiro ut como visto anteriormente Ou seja efetuamos a seguinte regressão 12914 em que uOt são os resíduos obtidos da regressão forma de nível original e vt são o termo de erro dessa regressão Note que não há necessidade de introduzir o termo de intercepto dessa na Equação 12914 pois sabemos que a soma dos resíduos de MQO é igual a zero Os resíduos de nossa regressão de salários contra produtividade dados na Equação 1251 já estão na Tabela 125 Usando esses resíduos obtivemos os seguintes resultados da regressão 12915 Como mostra essa regressão ΩO D 08678 Usando a estimativa podemos transformar o modelo original como foi feito com a Equação 1296 Uma vez que o Ω estimado por esse procedimento é aproximadamente o mesmo que aquele obtido do d de DurbinWatson os resultados da regressão usando o Ω da Equação 12915 não deveriam ser muito diferentes daqueles obtidos do Ω estimado do d de DurbinWatson Deixamos essa verificação para o leitor Métodos iterativos de calcular Ω Todos os métodos de calcular Ω discutidos anteriormente fornecem apenas uma única estimativa de Ω Mas há os chamados métodos iterativos que calculam Ω iterativamente ou seja por aproxima ção sucessiva começando com um valor inicial de Ω Entre os métodos podemos mencionar os se guintes o procedimento iterativo de CochraneOrcutt o procedimento em duas etapas de Durbin e o procedimento de varredura ou busca de HildrethLu Destes o mais conhecido é o método iterativo de CochranOrcutt Para poupar espaço os métodos iterativos são discutidos por exercícios Lembrese de que o objetivo desses métodos é fornecer uma estimativa de Ω que pode ser usada para obter as estimativas de MQG dos parâmetros Uma vantagem do método iterativo de CochraneOrcutt é que ele pode ser usado para calcular não só um processo AR1 mas também processos autorregressivos de ordem superior como uOt D ΩO1uOt1 C ΩO2 uOt2 C vt que são AR2 Tendo obtido os dois Ωs podemos estender facilmente a equação de diferenças generalizadas 1296 Evi dentemente o computador agora pode fazer tudo isso Voltando à nossa equação de salários contra produtividade e supondo um processo AR1 usamos o método iterativo de CochraneOrcutt que fornece as seguintes estimativas de Ω 08876 09944 e 08827 O último valor de 08827 agora pode ser usado para transformar o modelo original como na Equação 1296 e estimálo por MQO É claro que aplicar MQO no modelo transformado é simples mente o MQG Os resultados são os seguintes ECONOBOOKParte02indb 446 23112010 071938 Capítulo 12 Autocorrelação o que acontece se os termos de erro são correlacionados 447 O STATA pode estimar os coeficientes do modelo com Ω Por exemplo se supomos o AR1 o STATA produz os seguintes resultados 12916 Desses resultados podemos ver que o estimado ΩO é º 08827 o que não é muito diferente do ΩO na Equação 12915 Como observado anteriormente na equação de diferenças generalizadas 1296 perdemos uma observação porque a primeira delas não tem antecedentes Para evitarmos perder a primeira observa ção podemos utilizar a transformação de PraisWinsten Usando essa transformação e o STATA versão 10 obtemos os seguintes resultados de nossa regressão de salários e produtividade 12917 Nessa transformação Ω foi de 09193 obtido depois de 13 iterações Devemos ressaltar que se não transformarmos a primeira observação à moda de PraisWinsten e excluirmos aquela observação os resultados às vezes serão substancialmente diferentes principalmente em pequenas amostras Note que o Ω obtido aqui não é muito diferente daquele da Equação 12915 Comentários gerais Há vários pontos sobre correção para a autocorrelação usando os diversos métodos discutidos Em primeiro lugar uma vez que os estimadores de MQO são consistentes apesar da autocorrela ção em grandes amostras faz pouca diferença se estimamos Ω do d de DurbinWatson ou da regressão dos resíduos no período corrente contra os resíduos no período anterior ou do procedimento iterativo de CochraneOrcutt porque todos eles fornecem estimativas consistentes do verdadeiro Ω Em segundo lugar os vários métodos discutidos são basicamente de duas etapas Na primeira obtemos uma esti mativa do Ω desconhecido e na segunda etapa usamos essa estimativa para transformar as variáveis para a equação de diferenças generalizadas o que é basicamente MQG Uma vez que usamos ΩO em vez do verdadeiro Ω todos esses métodos de estimação são conhecidos na literatura específica como métodos de mínimos quadrados generalizados factíveis MQGF ou MQG estimados MQGE Em terceiro lugar é importante observar que sempre que usamos um método MQGF ou um MQGE para estimar os parâmetros do modelo transformado os coeficientes estimados não te rão necessariamente as propriedades ótimas do modelo clássico como BLUE principalmente em pequenas amostras Sem entrar em aspectos técnicos complexos podese afirmar que como princípio geral sempre que usamos um estimador em lugar de seu valor verdadeiro os coefi cientes estimados de MQO podem ter as propriedades ótimas usuais assintoticamente ou seja em grandes amostras Também os procedimentos convencionais de teste de hipóteses são fa lando em termos estritos válidos assintoticamente Em pequenas amostras portanto é preciso ter cuidado para interpretar os resultados estimados Quarto ao usar um MQGE se não incluirmos a primeira observação como originalmente foi o caso com o procedimento de CochraneOrcutt não só os valores numéricos mas também a eficiên cia dos estimadores pode ser afetada adversamente sobretudo se o tamanho da amostra for pequeno e se os regressores não forem não estocásticos42 Em pequenas amostras é importante manter a pri meira observação à la PraisWinsten Evidentemente se o tamanho da amostra for razoavelmente grande o MQGE com ou sem a primeira observação dará resultados similares Por sinal na litera 42 isto acontece principalmente se os regressores exibem uma tendência que é bem comum em dados econômicos ECONOBOOKParte02indb 447 23112010 071938 448 Parte Dois Relaxamento das hipóteses do modelo clássico tura específica os MQGE com a transformação de PraisWinsten são conhecidos de forma sintética como MQGE completos ou MQGEC 1210 O método de NeweyWest para corrigir os erros padrão do MQO Em vez de usar os métodos de MQGF discutidos na seção anterior podemos usar ainda o MQO mas corrigir os errospadrão para autocorrelação por um procedimento desenvolvido por Newey e West43 Esse é uma extensão dos errospadrão consistentes para heterocedasticidade que discutimos no capítulo anterior Os erros padrão corrigidos são conhecidos como erros padrão consistentes para heterocedasticidade e autocorrelação CHA ou simplesmente erros padrão de Newey West Não apresentamos os cálculos matemáticos envolvidos no procedimento de NeweyWest porque são muito complexos44 Programas modernos de computador atualmente efetuam esses cálcu los É importante destacar que em termos estritos o procedimento de NeweyWest é válido em grandes amostras e pode não ser adequado em pequenas amostras Mas em grandes amostras agora temos um método que produz erros padrão corrigidos para autocorrelação de modo que não precisa mos ficar preocupados com as transformações de MQGE discutidas na seção anterior Se uma amostra é razoavelmente grande devese usar o procedimento de NeweyWest para corrigir os erros padrão dos MQO não só em situações de autocorrelação mas em casos de heterocedasticidade pois o méto do CHA pode lidar com ambas ao contrário do método White designado especificamente para hete rocedasticidade Mais uma vez voltemos à nossa regressão de salários e produtividade 1251 Sabemos que essa regressão apresenta autocorrelação Nossa amostra de 46 observações é razoavelmente grande então podemos usar o procedimento CHA Com o EViews 4 obtemos os resultados da regressão 12101 em que denota erros padrão CHA Comparando essa regressão com a Equação 1251 verificamos que em ambas os coeficientes estimados e o valor r2 são os mesmos Mas é importante notar que os erros padrão CHA são muito maiores que os obtidos pelos MQO e assim as razões t no primeiro caso são muito menores que as razões t dos MQO Isso mostra que os MQO subestimaram de fato os verdadeiros erros padrão Curiosamente as estatísticas d dos dois modelos 1251 e 12101 são as mesmas Mas não se preocupe pois o procedimento CHA já levou em conta a correção dos erros padrão dos MQO 1211 MQO versus MQGF e CHA O pesquisador deparase com o seguinte problema na presença de autocorrelação os estimadores de MQO embora não tendenciosos consistentes e assintoticamente normalmente distribuídos não são eficientes Portanto o procedimento habitual de inferência com base nos testes t F e 2 deixa de ser adequado Por outro lado os procedimentos de MQGF e de NeweyWest geram estimadores efi cientes mas cujas propriedades em amostras pequenas ou finitas não estão bem documentadas Isso significa que em amostras pequenas eles podem ser na verdade piores que os MQO Em um estudo 43 NeWeY W K WeSt K a simple positive semidefinite heteroscedasticity and autocorrelation consistent covariance matrix Econometrica v 55 p 703708 1987 44 Se você tiver conhecimentos de álgebra matricial o método é discutido em GreeNe op cit 4 ed p 462463 ECONOBOOKParte02indb 448 23112010 071939 Capítulo 12 Autocorrelação o que acontece se os termos de erro são correlacionados 449 de Monte Carlo Griliches e Rao45 verificaram que se a amostra for relativamente pequena e o coefi ciente de autocorrelação Ω for menor que 03 o MQO será tão bom ou melhor que MQGF Como questão prática podese usar o MQO em pequenas amostras em que o Ω estimado seja por exemplo menor que 03 Evidentemente o que é uma amostra grande ou pequena são questões relativas e deve se recorrer a um julgamento baseado na prática Se você tiver apenas 15 ou 20 observações a amostra pode ser pequena mas se tiver 50 ou mais observações ela poderá ser razoavelmente grande 1212 Aspectos adicionais da autocorrelação Variáveis dummy e autocorrelação No Capítulo 9 consideramos os modelos de regressão da dummy binária Em particular lembre se do modelo de regressão de poupança contra renda para o período de 19701995 nos Estados Unidos apresentado na Equação 951 o que por conveniência é reproduzido a seguir 12121 em que Y D poupança X D renda D D 1 para observações no período 19821995 D D 0 para observações no período 19701981 Os resultados da regressão baseados nesse modelo estão na Equação 954 Naturalmente o modelo foi estimado com os pressupostos usuais de MQO Mas agora suponha que ut siga um processo autorregressivo de primeira ordem AR1 Ou seja ut D Ωut1 C t Normalmente se Ω for conhecida ou puder ser estimada por um dos métodos discu tidos podemos usar o método das diferenças generalizadas para estimar os parâmetros do modelo que está livre da autocorrelação de primeira ordem Entretanto a presença da variável binária D impõe um problema especial note que a variável binária apenas classifica uma observação como pertencente ao primeiro ou segundo período Como fazemos para transformála Podemos ver o se guinte procedimento46 1 Na Equação 12121 os valores de D são zero para todas as observações no primeiro perío do no período 2 o valor de D para as primeiras observações é 11 Ω em vez de 1 e 1 para todas as outras observações 2 A variável Xt é transformada como Xt Ω Xt1 Note que perdemos uma observação nessa transformação a não ser que recorramos à transformação de PraisWinsten para a primeira observação como notado anteriormente 3 O valor de Dt Xt é zero para todas as observações no primeiro período Nota Dt é zero no primeiro período no segundo período a primeira observação assume o valor de Dt Xt D Xt e as observações remanescentes no segundo período passam a ser Dt Xt DtΩ Xt1 D Xt Ω Xt1 Nota o valor de Dt no segundo período é 1 Como aponta a discussão anterior uma observação fundamental é a primeira observação no segundo período Se ela for tratada da maneira sugerida não deverá haver problema para estimar regressões como a Equação 12121 sujeitas à autocorrelação AR1 No Exercício 1237 o leitor é solicitado a efetuar essa transformação para os dados na poupança e renda para os Estados Unidos apresentados no Capítulo 9 45 GriliCheS Z raO P Small sample properties of several twostage regression methods in the context of autocorrelated errors Journal of the American Statistical Association 1969 v 64 p 253272 46 Veja maDDala op cit p 321322 ECONOBOOKParte02indb 449 23112010 071939 450 Parte Dois Relaxamento das hipóteses do modelo clássico Modelos arCH e garCH Assim como o termo de erro u no tempo t pode estar correlacionado com o termo de erro no tem po t 1 em um processo AR1 ou com os vários termos de erro defasados em um processo geral ARp pode haver autocorrelação na variância æ2 no tempo t com seus valores defasados em um ou mais períodos Tal autocorrelação foi observada pelos pesquisadores na previsão de séries temporais como preços de ações taxas de inflação e taxas de câmbio Essa autocorrelação recebe nomes como heterocedasticidade condicional autorregressiva ARCH do inglês autoregressive conditional he teroscedasticity se a variância do erro estiver relacionada com o termo de erro elevado ao quadrado no período anterior e heterocedasticidade condicional autorregressiva generalizada GARCH do inglês generalized autoregressive conditional heteroscedasticity se a variância do erro estiver relacionada com os termos de erro elevados ao quadrado em vários períodos anteriores Como esse tópico pertence à grande área de econometria de séries temporais discutiremos este assunto de forma mais aprofundada na Parte 4 O nosso objetivo é mostrar que a autocorrelação não está confinada apenas a relações entre erros de termos antigos e atuais mas também a relações entre erros de variações antigos e atuais Coexistência de autocorrelação e heterocedasticidade O que acontece se um modelo é afetado não só pela heterocedasticidade mas pela autocorrelação Será possível resolver o problema sequencialmente isto é cuidar primeiro da heterocedasticidade e depois da autocorrelação Na verdade um autor afirma A autorregressão só pode ser detectada depois de controlar a heterocedasticidade47 Mas será que é possível formular um teste onipotente que resolva esse e outros problemas como o da especificação do modelo simultaneamente Sim esses testes exis tem mas seu exame vai muito além de nossos limites É melhor deixálos para as referências48 Entre tanto como observado anteriormente podemos usar os erros padrão ECHA pois consideram tanto a autocorrelação quanto a heterocedasticidade contanto que a amostra seja razoavelmente grande 1213 Exemplo conclusivo No Exemplo 102 apresentamos dados sobre consumo renda riqueza e taxas de juros para os Estados Unidos tudo em termos reais Com base nesses dados estimamos a seguinte função de consumo para os Estados Unidos para o período de 19472000 efetuando a regressão do logarit mo de consumo sobre os logaritmos de renda e riqueza Não expressamos a taxa de juros na forma logarítmica porque os dados reais da taxa de juros foram negativos 47 Sayrs lois W Pooled time series analysis Califórnia Sage Publications 1989 p 19 48 Veja WOOlDriDGe Jeffrey m op cit p 402403 e Bera a K JarQUe C m efficient tests for normality homoscedasticity and serial independence of regression residuals monte Carlo evidence Economic Letters 1981 v 7 p 313318 ECONOBOOKParte02indb 450 23112010 071940 Capítulo 12 Autocorrelação o que acontece se os termos de erro são correlacionados 451 Como esperado as elasticidades de renda e riqueza são positivas e a semielasticidade da taxa de juros é negativa Embora os coeficientes estimados pareçam ser estatisticamente significativos em termos individuais precisamos verificar a possível autocorrelação no termo de erro Como sabemos na presença de autocorrelação os erros padrão estimados podem ser subestimados Examinando a estatística d de DurbinWatson parece que os termos de erro na função de consumo apresentam au tocorrelação de primeiro grau verifique isso Para tanto estimamos a função de consumo permitindo a autocorrelação para AR1 Os resulta dos são os seguintes Esses resultados mostram claramente que nossa regressão apresenta autocorrelação Deixamos ao leitor a remoção da autocorrelação usando algumas das transformações discutidas neste capítulo Você pode usar o Ω estimado de 06124 para as transformações A seguir apresentamos os resultados com base nos erros padrão de NeweyWest CHA ou em inglês HCA que levam em conta a autocorrelação A principal diferença entre a primeira e a última das regressões é que os erros padrão dos coefi cientes estimados mudaram substancialmente Apesar disso os coeficientes angulares estimados ain da são altamente significativos do ponto de vista estatístico Entretanto não há garantia de que este será sempre o caso ECONOBOOKParte02indb 451 23112010 071941 452 Parte Dois Relaxamento das hipóteses do modelo clássico Resumo e conclusões 1 Se a hipótese do modelo clássico de regressão linear de que os termos de erro ut que entram na função de regressão populacional FRP são aleatórios ou não correlacionados for desrespeita da surge o problema de autocorrelação ou correlação serial 2 A autocorrelação pode surgir por diversas razões como inércia ou lentidão das séries temporais econômicas de viés de especificação resultante da exclusão de importantes variáveis excludentes do modelo ou da utilização incorreta da forma funcional o fenômeno da teia de aranha do mas sageamento dos dados e de sua transformação Como resultado convém distinguir entre a auto correlação pura e a autocorrelação induzida devido a um ou mais fatores já discutidos 3 Embora na presença de autocorrelação os estimadores de MQO permaneçam não tendenciosos consistentes e com distribuição normal assintótica eles perdem a eficiência Como consequência os testes habituais t F e 2 não podem ser aplicados legitimamente Desse modo pode ser necessário recorrer a correções 4 A ação corretiva depende da natureza da interdependência entre os termos de erro ut Uma vez que os termos de erro são inobserváveis a prática comum é supor que eles sejam gerados por algum mecanismo 5 O mecanismo pressuposto em geral é o esquema autorregressivo de primeira ordem de Markov que supõe que o termo de erro no período de tempo corrente seja linearmente relacionado ao termo de erro no período de tempo anterior o coeficiente de autocorrelação Ω que dá a extensão da interdependência Esse mecanismo é conhecido como processo AR1 6 Se o processo AR1 for válido e o coeficiente de autocorrelação conhecido o problema de cor relação serial pode ser combatido facilmente transformando os dados por meio de um procedi mento de diferenças generalizadas O processo AR1 pode ser generalizado para um ARp Também podemos pressupor um processo de média móvel MA ou uma mistura dos dois proces sos AR e MA conhecida como ARMA Esse tópico será discutido nos capítulos sobre econo metria de séries temporais 7 Mesmo se usarmos um processo AR1 o coeficiente de autocorrelação não é conhecido a priori Consideramos vários métodos de estimar Ω como o d de DurbinWatson o d modificado de TheilNagar o procedimento iterativo CochraneOrcutt CO o método CO em duas etapas e o procedimento em duas etapas de Durbin Em amostras grandes esses métodos em geral criam estimativas similares de Ω embora em pequenas amostras tenham resultados diferentes Na práti ca o método CO iterativo tornouse muito usado 8 Usando qualquer um dos métodos discutidos podemos utilizar o método das diferenças generaliza das para calcular os parâmetros do modelo transformado por MQO que em essência redunda em MQG Na medida em que estimamos Ω ΩO chamamos o método de estimação de MQG factível ou estimável ou resumidamente MQGF ou MQGE 9 Ao usar o MQGE é preciso ter cautela para excluir a primeira observação em pequenas mostras a inclusão ou exclusão da primeira observação pode fazer uma diferença marcante nos resultados Portanto em pequenas amostras é aconselhável transformar a primeira observação de acordo com o procedimento de PraisWinsten Em grandes amostras faz pouca diferença se a primeira obser vação é incluída ou não 10 É muito importante notar que o método de MQGE tem as propriedades estatísticas ótimas apenas em grandes amostras Em pequenas amostras os MQO podem ser melhores que os MQGE prin cipalmente se Ω 03 11 Em vez de usar os MQGE podemos usar os MQO mas corrigir os erros padrão para autocor relação pelo procedimento de NeweyWest CHA Em termos estritos esse procedimento é válido em grandes amostras Uma vantagem do procedimento CHA é que não só corrige para autocorrelação mas também para heterocedasticidade se houver 12 Evidentemente antes da correção vem a detecção da autocorrelação Há métodos formais e infor mais de detecção Entre os informais podemos simplesmente plotar os resíduos reais ou padroni ECONOBOOKParte02indb 452 23112010 071941 Capítulo 12 Autocorrelação o que acontece se os termos de erro são correlacionados 453 zado ou plotar os atuais resíduos contra os antigos Entre os métodos formais podese usar o teste de carreiras o teste d de DurbinWatson o teste da normalidade assintótica o teste de Berenblutt Webb e o BreuschGodfrey BG Destes o preferido e mais empregado é o teste d de DurbinWatson Apesar de seu passado respeitável ele apresenta sérias limitações É melhor usar o teste BG pois é mais geral no sentido de que permite ambas as estruturas de erro AR e MA bem como a pre sença do regressando defasado como variável explanatória Lembrese de que é um teste de amostra grande 13 Neste capítulo também discutimos brevemente a detecção de autocorrelação na presença de variáveis binárias como regressores exerCíCiOS 121 Diga se as afirmações seguintes são verdadeiras ou falsas Justifique brevemente sua resposta a Quando a autocorrelação está presente os estimadores de MQO são tendenciosos bem como ineficientes b O teste d de DurbinWatson pressupõe que o termo de erro ut é homocedástico c A transformação de primeira diferença para eliminação da autocorrelação pressupõe que o coeficiente de autocorrelação ρ seja igual a 1 d Os valores de R2 de dois modelos um deles envolvendo regressão na forma de primeira diferença e o outro na forma de nível não podem ser comparados diretamente e Um d de DurbinWatson significativo não implica necessariamente a existência de autocor relação de primeira ordem f Na presença de autocorrelação a variância e os erros padrão dos valores previstos são ineficientes g A exclusão de uma ou mais variáveis importantes de um modelo de regressão pode propi ciar um valor d significativo h No processo AR1 um teste da hipótese de que ρ D 1 pode ser feito pela estatística g de BerenbluttWebb ou o d de DurbinWatson i Na regressão da primeira diferença de Y contra as primeiras diferenças de X se existir um termo constante e um termo de tendência linear significa que no modelo original há um termo de tendência linear e outro de tendência quadrática 122 Dada uma amostra de 50 observações e 4 variáveis explanatórias o que se pode dizer sobre a autocorrelação se a d D 105 b d D 140 c d D 250 d d D 397 123 Ao estudar as mudanças na participação dos trabalhadores no valor adicionado lucro partici pativo Gujarati considerou os seguintes modelos49 Modelo A Yt D Ø0 C Ø1t C ut Modelo B Yt D Æ0 C Æ1t C ut Æ2t2 C ut em que Y D participação dos trabalhadores e t D tempo Com base em dados anuais relativos ao período 19491964 foram obtidos os seguintes resultados para a indústria de mineração GUJarati Damodar labors share in manufacturing industries Industrial and Labor Relations Review out 1969 v 23 n1 p 6575 ECONOBOOKParte02indb 453 23112010 071941 454 Parte Dois Relaxamento das hipóteses do modelo clássico em que os números entre parênteses são as razões t a Existe correlação serial no modelo A E no modelo B b O que explica a correlação serial c Como poderíamos distinguir uma autocorrelação pura do viés de especificação 124 Detecção da autocorrelação o teste da razão de Von Neumann Supondo que os resíduos de uOt sejam extrações aleatórias de uma distribuição normal von Neumann demonstrou que para grandes n a razão50 conhecida como razão de von Neumann apresenta uma distribuição aproximadamente nor mal com média a Se n for suficientemente grande como poderíamos empregar a razão de von Neumann para testar a existência de autocorrelação b Qual a relação entre o d de DurbinWatson e a razão de von Neumann c A estatística d situase entre 0 e 4 Quais são os limites correspondentes para a razão de Von Neumann d Uma vez que a relação depende da hipótese de que os uO são extrações aleatórias de uma distribuição normal como essa hipótese é válida para os resíduos de MQO e Suponhamos que em uma aplicação verificase que a razão seja 288 com 100 observações Teste a hipótese de que não há correlação serial nos dados Nota B I Hart tabulou os valores críticos da razão de von Neumann para amostras de até 60 observações51 125 Em uma sequência de 17 resíduos 11 positivos e 6 negativos o número de carreiras foi de 3 Existe evidência de autocorrelação A resposta seria diferente se houvesse 14 carreiras 126 Estimativa de TheilNagar para ρ com base na estatística d Theil e Nagar sugeriram que em pequenas amostras em vez de estimar ρ como 1 d 2 ele deve ser estimado como em que n D número total de observações d D d de DurbinWatson e k D número dos coefi cientes incluindo o intercepto a serem estimados Mostre que em grandes amostras a estimativa de Ω é igual àquela obtida pela fórmula mais simples 1 d 2 127 Estimativa de Ω o procedimento de varredura ou busca de HildrethLu Como no esquema autorregressivo de primeira ordem 52 NeUmaNN J von Distribution of the ratio of the mean square sucessive difference to the variance Annals of Mathematical Statistics 1941 v 12 p 367395 O quadro pode ser encontrado em JOhNStON op cit 3 ed p 559 hilDreth G lU J Y Demand relations with autocorrelated disturbances michigan State University agri cultural experiment Station tech Bull 276 nov 1960 454 Parte Dois Relaxamento das hipóteses do modelo clássico ECONOBOOKParte02indb 454 23112010 071942 Capítulo 12 Autocorrelação o que acontece se os termos de erro são correlacionados 455 esperase que ρ situese entre 1 e C 1 Hildreth e Lu sugeriram um procedimento sistemáti co de varredura ou busca para localizálo Eles recomendam que se selecione ρ entre 1 e C 1 utilizando por exemplo intervalos de 01 unidade e transformese os dados por meio da equação de diferenças generalizadas 1265 Assim é possível escolher ρ entre 09 08 08 09 Para cada um dos ρ efetuamos a equação de diferenças generalizadas e obtemos as SQR associada Hildreth e Lu sugerem que se escolha o ρ que minimize as SQR ou seja maximizando o R2 Se necessário maior refinamento eles sugerem que se em preguem intervalos ainda menores por exemplo 001 unidade como 099 098 090 091 e assim por diante a Quais as vantagens do procedimento HildrethLu b Como sabemos se o valor de ρ selecionado para a transformação dos dados garantirá de fato um mínimo 128 Estimando de ρ o procedimento iterativo de CochraneOrcutt CO Para ilustrar este pro cedimento considere o seguinte modelo com duas variáveis 53 1 e o processo AR1 2 Cochrane e Orcutt recomendaram os seguintes passos para estimar ρ 1 Calcule a Equação 1 recorrendo aos MQO e obtenha os resíduos uOt Aliás note que você pode ter mais de uma variável X no modelo 2 Utilizando os resíduos obtidos na etapa 1 calcule a seguinte regressão 3 que é a contrapartida aplicada da Equação 2 54 3 Usando o ΩO obtido na Equação 3 calcule a equação de diferenças generalizadas 1296 4 Na medida em que a priori não se sabe se o ΩO obtido por meio da Equação 3 é o melhor estimador de ρ substitua os valores de ØO1 e ØO 2 calculados no passo 3 da regressão origi nal Equação 1 e obtenha os novos resíduos por exemplo um uO t como 4 que podem ser facilmente calculados já que Yt Xt ØO 1 e ØO 2 são todos conhecidos 5 Agora estime a seguinte regressão 5 que é semelhante à Equação 3 e oferece assim a segunda estimativa de ρ Uma vez que não sabemos se essa segunda estimativa de ρ é a melhor vamos para a terceira rodada de estimativa e assim por diante É por isso que o procedimento CO é chamado de iterativo Mas até que ponto devemos continuar as rodadas A recomendação é que se inter rompam as iterações quando as estimativas sucessivas de ρ diferirem por menos de 001 ou 0005 No exemplo dos salários da produtividade foram necessárias cerca de sete iterações antes que parássemos COChraNe D OrCUtt Gh applications of leastsquares regressions to relationships containing autocorrelated error terms Journal of American Statistical Association 1949 v 44 p 3261 Note que embora tendencioso ΩO é um estimador consistente do verdadeiro Ω Capítulo 12 Autocorrelação o que acontece se os termos de erro são correlacionados 455 ECONOBOOKParte02indb 455 23112010 071944 456 Parte Dois Relaxamento das hipóteses do modelo clássico a Utilize o procedimento iterativo de CochraneOrcutt para estimar ρ para a regressão de salário e produtividade Equação 1252 Quantas iterações foram necessárias antes de obter a estimativa final de ρ b Utilizando a estimativa final de ρ obtida em a calcule a regressão de salários e produtivi dade excluindo a primeira observação bem como mantendo a primeira observação Que diferença podemos ver nos resultados c Você acha importante manter a primeira observação para transformar os dados e resolver o problema de autocorrelação 129 Estimação de ρ o procedimento de CochraneOrcutt em duas etapas Esta é uma versão abreviada do procedimento iterativo Na etapa 1 estimamos ρ por meio da primeira iteração ou seja da Equação 3 do exercício anterior e na etapa 2 usamos essa estimativa de Ω para rodar a equação em diferenças generalizadas como na Equação 4 do exercício anterior Às vezes na prática esse procedimento em duas etapas gera resultados bastante semelhantes aos obtidos pelo processo iterativo CO mais elaborado Aplique este método em duas etapas à regressão dos salários contra a produtividade 1251 dada neste capítulo e compare seus resultados com os obtidos por meio do método iterativo Preste atenção em especial à primeira observação quando da transformação 1210 Estimação de ρ o método em duas etapas de Durbin Para explicarmos este método pode mos escrever a equação em diferenças generalizadas 1295 do seguinte modo 55 1 Durbin sugere o seguinte procedimento em duas etapas para estimar ρ Em primeiro lugar trate a Equação 1 como um modelo de regressão múltipla fazendo a regressão Yt em Xt Xt1 e Yt1 e trate o valor estimado do coeficiente de regressão Yt1 D ΩO como uma estima tiva de Ω Em segundo lugar tendo obtido ΩO useo para estimar os parâmetros da equação em diferenças generalizadas 1295 ou sua equivalente a Equação 1296 a Aplique o método de Durbin em duas etapas à regressão dos salários contra a produtivi dade examinada no texto e compare os resultados obtidos com os dados do procedimento iterativo de CochraneOrcutt e os do método em duas etapas de CO Comente a quali dade de seus resultados b Se examinarmos a Equação 1 observaremos que o coeficiente de Xt1 D ΩØ2 é igual a menos 1 vezes o produto do coeficiente de Xt D Ø2 e o coeficiente Yt1 D Ω Como poderíamos testar se os coeficientes obedecem à restrição 1211 Ao medir os retornos de escala da oferta de eletricidade Nerlove empregou dados relativos a um corte transversal de 145 fornecedoras privadas dos Estados Unidos em 1955 e calculou a regressão do logaritmo dos custos totais contra os logaritmos dos salários do preço do ca pital e do preço do combustível Ele verificou que os resíduos estimados por essa regressão apresentavam correlação serial de acordo com o d de DurbinWatson Para encontrar uma correção apresentou graficamente os resíduos estimados do logaritmo da produção e obteve a Figura 1211 a O que mostra a figura b Como podemos ficar livres da correlação serial nessa situação 1212 Os resíduos de uma regressão plotados contra o tempo aparecem no diagrama de dispersão da Figura 1212 O resíduo extremo assinalado por um círculo é chamado de discrepante outliers Um dado discrepante é uma observação cujo valor excede de maneira considerá vel talvez em três ou quatro desvios padrão o valor médio de todas as observações DUrBiN J estimation of parameters in timeseries regression models Journal of a Royal Statistical Society 1960 série B v 22 p 139153 456 Parte Dois Relaxamento das hipóteses do modelo clássico ECONOBOOKParte02indb 456 23112010 071944 Capítulo 12 Autocorrelação o que acontece se os termos de erro são correlacionados 457 a Quais as razões da existência dos dadoss discrepantes b Se houver dados discrepantes essas observações deveriam ser descartadas e a regressão calculada com as observações restantes c O d de DurbinWatson aplicase quando há dados discrepantes 1213 Com base na estatística d de DurbinWatson como podemos distinguir a autocorrelação pura do viés de especificação 1214 Suponha que no modelo os u sejam de fato serialmente independentes O que aconteceria nessa situação se supondo que ut D Ωut1 C 1 empregássemos a regressão de diferenças generalizadas Discuta em particular as propriedades do termo de erro t 1215 Em um estudo para determinação dos preços do produto final a custos de produção no Reino Unido foram obtidos os seguintes resultados de uma regressão com base em dados anuais relativos ao período 19511969 Capítulo 12 Autocorrelação o que acontece se os termos de erro são correlacionados 457 Figura 1211 Resíduos da regressão estudada por Nerlove Adaptação de Nerlove Marc Return to scale in electric supply In Christ Carl F et al Measurement in Economics Stanford Calif Stanford University Press 1963 log da produção 0 ui Resíduos da regressão Figura 1212 Resíduos de uma regressão hipotética plotados contra o tempo Tempo 0 ut Resíduos da regressão ECONOBOOKParte02indb 457 23112010 071946 458 Parte Dois Relaxamento das hipóteses do modelo clássico em que PF D preços do produto final a custos de produção W D salários e ordenados por pessoa empregada X D produto interno bruto por pessoa empregada M D preços das impor tações Mt1 D preços das importações com defasagem de um ano e PFt1 D preços do produto final a custo de produção no ano anterior56 Com 18 observações e 5 variáveis explanatórias os valores de d inferior e superior foram de 0 71 e de 206 no nível de 5 o valor d estimado de 254 indica que não se registra au tocorrelação positiva Comente 1216 Cite as circunstâncias sob as quais o emprego de cada um dos seguintes métodos de estima ção do coeficiente de autocorrelação de primeira ordem ρ pode ser adequado a Regressão de primeira diferença b Regressão das médias móveis c Transformação de TheilNagar d Procedimento iterativo de Cochrane e Orcutt e Procedimento de varredura de HildrethLu f Procedimento em duas etapas de Durbin 1217 Considere o modelo em que isto é o termo de erro segue um processo AR2 e t é um termo de erro de ruído branco Esboce os passos a serem seguidos para estimar este modelo levando em conta a autorregres são de segunda ordem 1218 Incluindo o fator de correção C a fórmula para ØO2 MQG apresentada na Equação 1231 é Dada essa fórmula e a Equação 1231 encontre a expressão para o fator de correção C 1219 Demonstre que calcular a Equação 1295 equivale a estimar o MQG discutido na Seção 123 excluindo a primeira observação de Y e de X 1220 Os resíduos estimados da regressão 1299 apresentam os seguintes sinais que por facili dade são separados por parênteses Com base no teste das carreiras você rejeitaria a hipótese nula de que não há autocorrelação nos resíduos 1221 Teste de correlação serial de ordem mais elevada Suponha que tenhamos séries temporais de dados em uma base trimestral Nos modelos de regressão que envolvem dados trimestrais pode ser mais adequado supor um processo AR4 como o seguinte em lugar do AR1 dado na Equação 1221 isto é suponha que o termo de erro atual correlacionese com o do mesmo trimestre do ano anterior em vez de se correlacionarse com o do trimestre imediatamente anterior Fonte Prices and Earnings in 19511969 an econometric assessment Department of employment her majestys Stationery Office 1971 tabela C p 37 equação 63 Opcional 458 Parte Dois Relaxamento das hipóteses do modelo clássico ECONOBOOKParte02indb 458 23112010 071947 Capítulo 12 Autocorrelação o que acontece se os termos de erro são correlacionados 459 Para testar a hipótese de que Ω4 D 0 Wallis sugere a seguinte modificação do teste d de DurbinWatson 57 O procedimento de teste segue a mesma rotina examinada no texto para o teste d Wallis elaborou as tabelas de d4 que podem ser encontradas em seu artigo original Imagine agora que tenhamos dados mensais O teste de DurbinWatson poderia ser generali zado para levar em conta esses dados Em caso positivo mostre a fórmula adequada para d12 1222 Suponha que você precise estimar a seguinte regressão em que Y é produto L é mão de obra K é capital e D é o operador de primeira diferença Como interpretaríamos Ø1 nesse modelo Poderíamos considerálo uma estimativa de mu dança tecnológica Justifique sua resposta 1223 Como observado no texto Maddala sugeriu que se o d de DurbinWatson for menor do que R2 podemos calcular a regressão na forma de primeira diferença Qual a lógica que embasa essa sugestão 1224 Consulte a Equação 1241 Suponha que r D 0 mas Ω 0 Qual o efeito sobre a EæO 2 se a 0 Ω 1 e b 1 Ω 0 Quando o viés de æO 2 será razoavelmente pequeno 1225 Os resíduos da regressão dos salários contra a produtividade apresentados na Equação 1252 foram gerados usando uma regressão contra resíduos defasados em seis períodos AR6 obtendose os seguintes resultados a Com base no resultado anterior o que se pode dizer sobre a natureza da autocorrelação nos dados de salários e produtividade b Se considerarmos que um processo AR1 caracteriza a autocorrelação nos dados deve ríamos usar uma transformação de primeiras diferenças para eliminálas Justifique sua resposta WalliS Kenneth testing for fourth order autocorrelation in quarterly regression equations Econometrica 1972 v 40 p 617636 as tabelas de d4 também podem ser encontradas em JOhNStON J op cit 3 ed p 558 Capítulo 12 Autocorrelação o que acontece se os termos de erro são correlacionados 459 ECONOBOOKParte02indb 459 23112010 071948 460 Parte Dois Relaxamento das hipóteses do modelo clássico exercícios aplicados 1226 Passemos aos dados sobre a indústria do cobre da Tabela 127 a Estime com esses dados o seguinte modelo de regressão Interprete os resultados b Obtenha os resíduos e os resíduos padronizados da regressão e faça um gráfico O que poderíamos dizer sobre a presença de autocorrelação nesses resíduos c Calcule a estatística d de DurbinWatson e comente a natureza da autocorrelação presen te nos dados d Faça o teste das carreiras e verifique se sua resposta difere daquela dada em c e Como poderíamos verificar se um processo ARp descreve melhor a autocorrelação do que o processo AR1 Nota guarde os dados para uso posterior Veja o Exercício 1228 460 Parte Dois Relaxamento das hipóteses do modelo clássico Tabela 127 Determinantes do preço interno do cobre nos Estados Unidos 19511980 Nota os dados foram coletados por Gary R Smith com base em fontes como American Metal Market Metals Week e publicações do Departamento do Comércio dos Estados Unidos C D média de 12 meses dos preços internos de cobre centavos de dólar por librapeso PNB D PNB anual em bilhões de I D média de 12 meses do índice de produção industrial L D média de 12 meses dos preços do cobre na London Metal Exchange em libras esterlinas P D número de prédios construídos por ano milhões de unidades A D média de 12 meses do preço do alumínio em centavos de dólar por librapeso ECONOBOOKParte02indb 460 23112010 071948 Capítulo 12 Autocorrelação o que acontece se os termos de erro são correlacionados 461 1227 Tendo os dados na Tabela 128 a Verifique se o d de DurbinWatson é igual a 04148 b Há correlação serial positiva nos termos de erro c Em caso afirmativo estime Ω por meio de i Método de TheilNagar ii Procedimento de Durbin em duas fases iii Método de CochraneOrcutt d Use o método de TheilNagar para transformar os dados e faça a regressão com os dados transformados e A regressão estimada em d apresenta autocorrelação Em caso afirmativo como você se livra dela 1228 Consulte o Exercício 1226 e os dados apresentados na Tabela 127 Se os resultados deste exercício revelarem autocorrelação serial a Recorra ao procedimento em dois estágios de CochraneOrcutt e obtenha as estimativas dos MQG factíveis viáveis ou a regressão de diferenças generalizadas e compare seus resultados b Se o Ω estimado por meio do método de CochraneOrcutt em a diferir substancialmente daqueles estimados por meio da estatística d qual método de estimativa Ω você escolhe ria e por quê 1229 Consulte o Exemplo 74 Omita as variáveis X 2 e X 3 faça a regressão e examine os resíduos em busca de correlação serial Se for encontrada a correlação serial como você a explicaria Quais medidas corretivas você sugere 1230 Consulte o Exercício 721 Nesses dados a autocorrelação é esperada a priori Portanto su gerese que seja feita a regressão do logaritmo da oferta real de moeda contra os logaritmos da renda nacional em termos reais e da taxa de juros de longo prazo na forma de primeiras diferenças Calcule esta regressão e depois recalculea em sua forma original A hipótese que embasa a transformação em primeiras diferenças foi atendida Em caso negativo que tipo de viés poderá resusltar dessa transformação Ilustre com os dados que tem em mãos 1231 O uso do d de DurbinWatson para verificar a ausência de linearidade Continue com o Exercício 1229 Organize os resíduos obtidos na regressão segundo os valores crescentes de X Usando a fórmula dada na Equação 1265 estime d por meio dos resíduos rearranjados Se o valor d calculado indicar autocorrelação implica que o modelo linear não é adequado e que Capítulo 12 Autocorrelação o que acontece se os termos de erro são correlacionados 461 Tabela 128 O Nota ECONOBOOKParte02indb 461 23112010 071949 462 Parte Dois Relaxamento das hipóteses do modelo clássico 462 Parte Dois Relaxamento das hipóteses do modelo clássico o modelo deveria incluir os termos X 2 i e X 3 i Você poderia apresentar uma justificativa intui tiva para esse procedimento Veja se a sua resposta está de acordo com a de Henri Theil58 1232 Consulte o Exercício 1122 Obtenha os resíduos e verifique se apresentam autocorrelação Caso a correlação serial seja detectada como poderia ser corrigida Qual o sentido da corre lação serial nesse caso 1233 Experimento de Monte Carlo Consulte as Tabelas 121 e 122 Com os dados relativos a t e Xt encontrados gere uma amostra com 10 valores de Y com base no modelo em que ut D 09ut1 C t Suponha u0 D 10 a Calcule a regressão e comente os resultados b Suponha agora que u0 D 17 Repita este exercício 10 vezes e comente os resultados c Mantenha as condições anteriores intactas mas seja agora ρ D 03 em em vez de ρ D 09 Compare os resultados com os obtidos em b 1234 Utilizando os dados da Tabela 129 estime o modelo em que Y D estoques e X D vendas ambos medidos em bilhões de dólares a Calcule a regressão anterior b Verifique se os resíduos estimados apresentam autocorrelação positiva aplicando i o teste de DurbinWatson e ii o teste de normalidade para grandes amostras da Equação 12613 c Se Ω for positivo aplique o teste BerenbluttWebb para testar a hipótese de que Ω D 1 theil henri Introduction to econometrics englewood Cliffs NJ Prentice hall 1978 p 307308 Tabela 129 Estoque e vendas na indústria de transformação dos Estados Unidos 19501991 milhões de dólares 224619 236698 242686 239847 250394 242002 251708 269843 289973 299766 319558 324984 335991 350715 330875 326227 334616 359081 394615 411663 Os dados anuais são médias de dados mensais sem ajustamento sazonal Os dados de fim de período com ajustamento sazonal a partir de 1982 não são comparáveis com os do período anterior Fonte Economic Report of the President 1993 Tabela B 53 p 408 ECONOBOOKParte02indb 462 23112010 071950 Capítulo 12 Autocorrelação o que acontece se os termos de erro são correlacionados 463 Capítulo 12 Autocorrelação o que acontece se os termos de erro são correlacionados 463 d Se desconfiar que a estrutura autorregressiva do erro é de ordem p utilize o teste de BreuschGodfrey para verificar isso Como você escolheria a ordem de p e Com base nos resultados desse teste como transformaria os dados para eliminar autocor relação Mostre todos os cálculos f Repita as etapas anteriores usando o seguinte modelo g Como decidir entre as especificações linear e loglinear Mostre explicitamente os testes aplicados 1235 A Tabela 1210 apresenta dados relativos à taxa de retorno real sobre ações TRRt e à infla ção no período t Inft bem como a taxa de crescimento da produção no período t C 1 CPt C 1 todos em para a economia dos Estados Unidos no período de 19541981 a Estime a regressão de TRRt contra a inflação b Estime a regressão de TRRt contra CPt C 1 e Inft c Comente os resultados das duas regressões tendo em vista a observação de Eugene Fama segundo quem a correlação negativa simples entre os retornos reais sobre as ações e a inflação é espúria porque resulta de duas relações estruturais uma relação positiva entre os retornos reais atuais sobre a ações e o crescimento esperado da produção medido por CPt C 1 e uma relação negativa entre o crescimento esperado e a inflação atual d Seria de esperar autocorrelação em qualquer uma das regressões estimadas em a e b Por quê Se for constatada a autocorrelação tome as medidas adequadas para eliminála e apresente os resultados revistos Tabela 1210 Estados Unidos Taxa de retorno crescimento da produção e inflação 19541981 ECONOBOOKParte02indb 463 23112010 071951 464 Parte Dois Relaxamento das hipóteses do modelo clássico 464 Parte Dois Relaxamento das hipóteses do modelo clássico 1236 A estatística h de Durbin Considere o seguinte modelo de determinação salarial em que Y D salários D índice de remuneração real por hora X D produtividade D índice de produção por hora a Utilizando os dados da Tabela 124 estime o modelo e interprete os resultados b Uma vez que o modelo contém o regressando defasado como regressor o teste d de DurbinWatson não é adequado para detectar se existe correlação serial nos dados Para tais modelos chamados autorregressivos Durbin formulou a chamada estatística h que visa detectar a autocorrelação de primeira ordem definida como59 em que n D tamanho da amostra var ØO3 D variância do coeficiente da variedade defasada Yt1 defasado ΩO D estimativa da correlação serial de primeira ordem No caso de grandes amostras em termos técnicos assintóticas Durbin demonstrou que sob a hipótese nula de ρ D 0 isto é a estatística h segue a distribuição normal padrão Com base nas propriedades de dis tribuição normal sabemos que a probabilidade de h 196 é cerca de 5 Portanto se em uma aplicação h 196 podemos rejeitar a hipótese nula de que ρ D 0 isto é existem evidências de autocorrelação de primeira ordem no modelo autorregressivo Para aplicar o teste procedemos da seguinte forma em primeiro lugar estimamos o modelo referido por MQO não se preocupe com qualquer problema de estimativa nesta fase Em segundo lugar note a varØO3 neste modelo bem como o d estatístico calculado habitualmen te Terceiro usando o valor d obtenha ΩO º 1 d2 É interessante notar que embora não possamos usar o valor d para testar a correlação serial nesse modelo podemos utilizálo para obter uma estimativa de ρ Em quarto lugar calculamos a estatística h Em quinto lugar se o tamanho da amostra for razoavelmente grande e se o h calculado for superior a 196 podemos concluir que há indícios de autocorrelação de primeira ordem É claro que podemos usar o nível de significância que desejarmos Aplique o teste h ao modelo autorregressivo de determinação de salários dado anteriormente tire conclusões adequadas e compare esses resultados com os da regressão 1251 1237 Variáveis dummy e autocorrelação Consulte a regressão de renda e poupança discutida no Capítulo 9 Usando os dados apresentados na Tabela 92 e supondo um processo AR1 es time novamente a regressão rendapoupança tendo em conta a autocorrelação Preste especial atenção à transformação da variável binária Compare seus resultados com os apre sentados no Capítulo 9 1238 Usando os dados de salárioprodutividade apresentados na Tabela 124 calcule o modelo 1298 e compare seus resultados com os que figuram na regressão 1299 Que con clusões podem ser tiradas DUrBiN J testing for serial correlation in leastsquares regression when some of the regressors are lagged dependent variables Econometrica v 38 p 410421 ECONOBOOKParte02indb 464 23112010 071952 Capítulo 12 Autocorrelação o que acontece se os termos de erro são correlacionados 465 Capítulo 12 Autocorrelação o que acontece se os termos de erro são correlacionados 465 Apêndice 12A 12a1 prova de que o erro no termo vt na equação 12111 está autocorrelacionado Desde que vt D ut ut1 é fácil mostrar que E vt D E ut ut1 D E ut E ut1 D 0 desde que E u D 0 para cada t Agora a var vt D var ut ut1 D var ut C ut1 D 2æ2 uma vez que a variância de cada ut é æ2 e os u são distribuídos independentemente Daí vt é homocedástico Mas que obviamente não é igual a zero Assim embora os u não estejam autocorrelacionados os v estão 12a2 prova das equações 1223 1224 e 1225 Sob AR1 1 Portanto 2 Assim 3 porque os u e s não estão correlacionados Desde que a var ut D var ut1 D æ2 e var t D æ2 obtemos 4 Agora multiplicamos a Equação 1 por ut1 e tomamos as expectativas de ambos os lados para obter Observando que a covariância entre ut1 e t é igual a zero por quê e que var ut D var ut1 D æ2 1 Ω2 obtemos 5 Continuando desta forma e assim por diante Agora o coeficiente de correlação é a razão de covariância em relação à variância Por isso e assim por diante ECONOBOOKParte02indb 465 23112010 071954 466 Modelagem econométrica especificação de modelo e teste diagnóstico Não se pode aplicar os conceitos de econometria de um modo mecânico é preciso compreensão intuição e habilidade1 em geral atravessamos pontes sem nos preocuparmos com a solidez de sua construção porque temos confiança de que alguém verificou rigorosamente seus princípios de engenharia e prática Os economistas devem fazer o mesmo com modelos ou fazer a advertência não nos responsabilizamos se o uso provocar um acidente2 Ao longo dos anos a busca dos economistas pela verdade levou à ideia de que são pessoas que pro curam um gato preto em uma sala escura quando não há nenhum e os econometristas costumam ser acusados de têlo encontrado 3 Uma das hipóteses do modelo clássico de regressão linear MCRL a de número 9 é que o mo delo de regressão usado na análise esteja especificado corretamente se o modelo não for especifi cado corretamente teremos o problema de erro de especificação de modelo ou viés de especificação de modelo Neste capítulo examinaremos a fundo essa hipótese porque procurar o modelo correto é como buscar o Santo Graal Em particular examinaremos as seguintes questões 1 Como se faz para encontrar o modelo correto Em outras palavras quais os critérios de escolha de um modelo para análise aplicada 2 Que tipos de erros de especificação provavelmente encontraremos na prática 3 Quais as consequências dos erros de especificação 4 Como são detectados os erros de especificação Em outras palavras quais as ferramentas de diagnóstico que podemos empregar 5 Depois de detectar os erros de especificação que medidas podem ser adotadas e quais os benefícios que elas proporcionam 6 Como se avalia o desempenho de modelos alternativos A especificação e avaliação de modelos é um tópico vasto e têm sido realizados extensos traba lhos empíricos nesta área Além disso há diferenças filosóficas a respeito do assunto Embora não 1 CUthBertSON Keith hall Stephen G taYlOr mark P Applied econometrics techniques michigan University Press 1992 p 68 2 heNDrY David F Dynamic econometrics reino Unido Oxford University Press 1995 p 68 3 KeNNeDY Peter A guide to econometrics 3 ed Cambridge mass the mit Press 1992 p 82 Capítulo 13 ECONOBOOKParte02indb 466 23112010 071954 Capítulo 13 Modelagem econométrica especificação de modelo e teste diagnóstico 467 possamos fazer plena justiça a esse tópico em apenas um capítulo esperamos tratar de algumas ques tões fundamentais envolvidas na especificação e avaliação do modelo 131 Critérios de seleção de modelos De acordo com Hendry e Richard um modelo escolhido para análise aplicada deve satisfazer os seguintes critérios4 1 Ser confirmado pelos dados as previsões feitas com base no modelo devem ser logicamente possíveis 2 Ser consistente com a teoria ele deve fazer sentido do ponto de vista econômico Por exemplo se a hipótese de renda permanente de Milton Friedman for válida o valor do intercepto na re gressão do consumo permanente contra a renda permanente deve ser igual a zero 3 Ter regressores fracamente exógenos as variáveis explanatórias ou regressores não devem ser correlacionadas com o termo de erro Podese acrescentar que em algumas situações os regres sores exógenos podem ser estritamente exógenos Uma variável estritamente exógena é inde pendente de valores correntes futuros e passados do termo de erro 4 Exibir constância dos parâmetros os valores dos parâmetros devem ser estáveis Caso contrário será difícil fazer uma previsão Como observa Friedman O único teste relevante da validade de uma hi pótese modelo é a comparação de suas previsões com a experiência5 Na ausência de constância dos parâmetros as previsões não serão confiáveis 5 Mostrar consistência de dados os resíduos estimados do modelo devem ser puramente aleató rios tecnicamente ruídos brancos Em outras palavras se o modelo de regressão for adequado os resíduos desse modelo devem ser ruídos brancos Se esse não for o caso há algum erro de especificação no modelo Logo iremos explorar a natureza dos erros de especificação 6 Ser abrangente o modelo deve abanger ou incluir todos os modelos concorrentes no sentido de que seja capaz de explicar seus resultados Em resumo os outros modelos não podem ser mais aprimo rados que o modelo escolhido Uma coisa é relacionar os critérios de bom modelo e outra é desenvolvêlo na prática é prová vel que se cometam vários erros de especificação de modelo discutidos na próxima seção 132 Tipos de erros de especificação Suponha que com base nos critérios relacionados cheguemos a um modelo que aceitamos como satisfatório Para darmos um exemplo concreto seja este modelo Yi D Ø1 C Ø2 Xi C Ø3 X 2 i C Ø4 X 3 i C u1i 1321 em que Y D custo total de produção e X D produção A Equação 1321 é o exemplo conhecido de uma função cúbica de custo total Mas suponha que por alguma razão por exemplo preguiça de fazer o diagrama de dispersão um pesquisador decida usar o seguinte modelo 1322 4 heNDrY D F richard J F the econometric analysis of economic time series International Statistical Review 1983 v 51 p 333 5 FrieDmaN milton the methodology of positive economics in Essays in positive economics Chicago University of Chicago Press 1953 p 7 ECONOBOOKParte02indb 467 23112010 071954 468 Parte Dois Relaxamento das hipóteses do modelo clássico Observe que mudamos a notação para distinguir esse modelo do verdadeiro Já que pressupomos que a Equação 1321 seja verdadeira adotar a Equação 1322 constitui ria um erro de especificação e o erro consiste na omissão de uma variável relevante X 3 i Portanto o termo de erro u2i na Equação 1322 é de fato 1323 Veremos em breve a importância dessa relação Agora suponha que outro pesquisador use o seguinte modelo 1324 Se a Equação 1321 for a verdadeira a Equação 1324 também constituirá um erro de especifi cação que consiste em incluir uma variável desnecessária ou irrelevante no sentido de que o ver dadeiro modelo pressupõe que 5 seja igual a zero O novo termo de erro é de fato já que 5 H 0 no modelo verdadeiro Por que 1325 Agora suponha ainda que outro pesquisador postule o seguinte modelo 1326 Em relação ao modelo verdadeiro a Equação 1326 também constituiria viés de especificação sendo este o uso da forma funcional errada na Equação 1321 Y aparece linearmente enquanto na Equação 1326 ele aparece de forma loglinear Por fim considere o pesquisador que usa o seguinte modelo 1327 em que Y i D Yi C i e X i D Xi C wi i e wi representam erros de medida O que a Equação 1327 diz é que em vez de usarmos os verdadeiros Yi e Xi estamos usando suas proxies Y i e X i que podem conter erros de medida Portanto na Equação 1327 cometemos o viés de erro de medida Em trabalhos aplicados os dados são repletos de erros de aproximação ou erros de cobertura incompleta ou apenas de omissão de algumas observações Nas ciências sociais dependemos com frequência de dados secundários e em geral não temos como conhecer os tipos de erros se houver cometidos pelo órgão encarregado da coleta dos dados primários Outro tipo de erro de especificação relacionase à forma como o erro estocástico ui ou ut entra no modelo de regressão Considere por exemplo o seguinte modelo de regressão bivariado sem o termo de intercepto 1328 em que o termo de erro estocástico entra de forma multiplicativa com a propriedade de que ui satisfaz as hipóteses do modelo clássico de regressão linear em comparação com o seguinte modelo 1329 em que o termo de erro entra de forma aditiva Embora as variáveis sejam as mesmas nos dois mo delos denotamos o coeficiente angular na Equação 1328 por Ø e o coeficiente angular na Equação 1329 por Æ Agora se a equação 1328 for o modelo correto ou verdadeiro estimar Æ nos daria uma estimativa não tendenciosa do verdadeiro Ø Isto é EÆO D Ø Se esse não for o caso a es pecificação estocástica imprópria do termo de erro constituirá outra causa de erro de especificação ECONOBOOKParte02indb 468 23112010 071956 Capítulo 13 Modelagem econométrica especificação de modelo e teste diagnóstico 469 Um erro de especificação que às vezes é desprezado é a interação entre os regressores isto é o efeito multiplicativo de um ou mais regressores no regressando Para ilustrar considere a seguin te função salário simplificada Gênero Educaçãoi Gêneroi 13210 Nesse modelo a mudança nos salários relativos com respeito à educação depende não só da edu cação mas também do gênero Gênero Da mesma forma a mudança nos salá rios relativos com relação ao gênero depende não só deste mas também da educação Para resumir ao desenvolver um modelo aplicado é provável que se cometa um ou mais dos se guintes erros de especificação 1 Omissão de uma ou mais variáveis relevantes 2 Inclusão de uma ou mais variáveis desnecessárias 3 Adoção da forma funcional errada 4 Erros de medida 5 Especificação incorreta do termo de erro estocástico 6 Pressuposição de que o termo de erro tem distribuição normal Antes de passar a examinar esses erros de especificação detalhadamente convém distinguir entre erros de especificação de modelo e erros de especificação equivocada de modelos Os quatro pri meiros tipos de erro discutidos são de especificação do modelo por natureza pois temos em mente um modelo verdadeiro mas de algum modo não estimamos o modelo correto Nos erros de estima ção equivocada não sabemos qual é o verdadeiro modelo Nesse contexto podemos relembrar a controvérsia entre keynesianos e os monetaristas Estes dão primazia à moeda para explicar variações no PIB enquanto os keynesianos ressaltam o papel das despesas do governo para explicar essas va riações Eles poderiam ser considerados modelos concorrentes Consideraremos a seguir os modelos com erros de especificação e examinaremos os erros dos modelos mal especificados 133 Consequências dos modelos com erros de especificação Quaisquer que sejam as origens dos erros de especificação quais são as consequências Para não complicarmos a discussão responderemos a essa pergunta no contexto do modelo de três variáveis e consideraremos nesta seção os dois primeiros tipos de erros de especificação discutidos anterior mente a saber 1 modelos subespecificados isto é omissão de variáveis relevantes e 2 mode los sobreespecíficos isto é inclusão de variáveis irrelevantes Nossa discussão aqui pode ser facilmente generalizada para mais de dois regressores mas com cálculos algébricos cansativos6 a álgebra matricial tornase quase uma necessidade quando vamos além de casos com três variáveis Omissão de uma variável relevante subespecificação Suponha que o verdadeiro modelo seja 1331 mas por alguma razão ajustamos o seguinte modelo 1332 6 No entanto vale consultar o exercício 1332 ECONOBOOKParte02indb 469 23112010 071957 470 Parte Dois Relaxamento das hipóteses do modelo clássico As consequências de omitir a variável X3 são as seguintes 1 Se a variável não incluída ou omitida X3 estiver correlacionada com a variável incluída X2 isto é r2 3 o coeficiente de correlação entre as duas variáveis não será zero e ÆO1 e ÆO2 serão tendenciosos e inconsistentes Isto é EÆO1 Ø1 e EÆO2 Ø2 e o viés não desaparecerá quando o tamanho da amostra aumentar 2 Mesmo que X2 e X3 não sejam correlacionados ÆO1 é tendencioso embora ÆO2 agora não seja tendencioso 3 A variância do termo de erro æ2 está estimada incorretamente 4 A variância medida de modo convencional de é um estimador tendencioso ØO2 da variância do verdadeiro estimador 5 Em consequência os procedimentos habituais para determinar os intervalos de confiança e o teste de hipóteses provavelmente conduzirão a conclusões equivocadas quanto à significância estatística dos parâmetros estimados 6 Outra consequência é que as previsões baseadas no modelo incorreto e os intervalos de pre visão confiança não serão confiáveis Embora a demonstração de cada um desses pontos vá muito além do escopo deste livro7 mostra mos no Apêndice 13A Seção 13A1 que 1333 em que b3 2 é o coeficiente angular na regressão da variável excluída X3 contra a variável incluída Como mostra a Equação 1333 ÆO2 é tendencioso a menos que Ø3 ou b3 2 ou ambos sejam iguais a zero Descartamos a possibilidade de Ø3 ser zero porque antes de mais nada nesse caso não temos erro de especificação O coeficiente b3 2 será zero se X2 e X3 não forem correlacionados o que é improvável na maioria dos dados econômicos Em geral a extensão do viés dependerá do termo de viés Ø3 b3 2 Se por exemplo Ø3 for positivo X3 tiver efeito positivo em Y e b3 2 for positivo X2 e X3 forem correlacionados positivamente ÆO2 em média irá superestimar o verdadeiro Ø2 viés positivo Mas esse resultado não deveria surpreender pois X2 representa não só seu efeito direto sobre Y mas também seu efeito indireto via X3 sobre Y Em resumo X2 tem crédito pela influência que seria atribuída corretamente a X3 sendo este impedi do de mostrar seus efeitos explicitamente porque não lhe foi permitido entrar no modelo Como exemplo concreto considere o discutido no Capítulo 7 Exemplo 71 exeMplO 131 Exemplo ilustrativo retomando a mortalidade infantil Fazendo a regressão da mortalidade infantil mi contra o PNB per capita PNBpc e a taxa de alfabetização feminina taF obtivemos os resultados da equação 762 dan do os valores dos coeficientes parciais angulares das duas variáveis como 00056 e 22316 respectivamente mas se agora excluirmos a variável taF obtemos os resul tados mostrados na equação 772 Se consideramos a equação 762 como o mo delo correto então a equação 772 será um modelo com espeficiação equivocada pois omite a variável relevante taF agora você pode ver que no modelo correto o coeficiente da variável PNBpc era 00056 enquanto no modelo incorreto 772 agora é 00114 Continua 7 Para um tratamento algébrico veja KmeNta Jan Elements of econometrics Nova York macmillan 1971 p 391399 aqueles que tiverem formação em álgebra matricial podem consultar JOhNStON J Econometrics methods 4 ed Nova York mcGrawhill 1997 p 119112 ECONOBOOKParte02indb 470 23112010 071957 Capítulo 13 Modelagem econométrica especificação de modelo e teste diagnóstico 471 exeMplO 131 Continuação em termos absolutos agora o PNBpc tem um impacto maior na mi comparado ao mo delo verdadeiro mas se efetuamos a regressão da taF contra o PiBpc regressão da variável contra a variável incluída o coeficiente angular nessa regressão b3 2 em termos da equação 1333 será 0002568 isso sugere que quando o PiBpc aumenta em uma unidade em média a taF sobe 000256 unidades mas se a taF subir nesse montante seu efeito na mi será 22316 000256 D ØO3 b3 2 D 000543 Portanto da equação 1333 temos ØO2 C ØO3 b3 2 D 00056 C 22316000256 º 00111 que é o valor do coeficiente do PNBpc obtido no modelo incorreto 7729 Como ilustra este exemplo o verdadeiro impacto do PiBpc sobre a mi é muito menor 00056 do que o sugerido pelo modelo incorreto 772 a saber 00114 8 9 Agora vamos examinar as variâncias de ÆO2 e ØO2 1334 1335 em que FIV uma medida da colinearidade é o fator de inflação da variância D 11 r 2 2 3 dis cutido no Capítulo 10 e r2 3 é o coeficiente de correlação entre as variáveis X2 e X3 conhecemos as Equa ções 1334 e 1335 dos Capítulos 3 e 7 Como as fórmulas 1334 e 1335 não são idênticas em geral a var ÆO2 será diferente da var ØO2 Mas sabemos que a var ØO2 é não tendenciosa Por quê Portanto a var ÆO2 é tendenciosa confirmando desse modo a afirmação feita no item 4 anterior Uma vez que 0 r 2 2 3 1 poderia parecer que neste caso var ÆO2 var ØO2 Agora enfrentamos um dilema embora ÆO2 seja tendencio so sua variância é menor que aquela do estimador não tendencioso ØO2 é claro que estamos descar tando o caso em que r2 3 D 0 já que na prática há correlação entre os regressores Há um tradeoff envolvido aqui10 Porém a história não terminou pois o æ2 estimado do modelo 1332 e aquele estimado do mo delo verdadeiro 1331 não são os mesmos uma vez que a soma dos quadrados dos resíduos SQR dos dois modelos e seus graus de liberdade gl são diferentes Você pode recordar que obtemos uma estimativa de æ2 como æO2 D SQRgl que depende do número de regressores incluídos no modelo bem como dos gl D n número de parâmetros estimados Agora se acrescentamos variáveis ao modelo o SQR em geral diminui lembrese de que à medida que mais variáveis forem acrescentadas ao modelo o R2 aumenta mas os graus de liberdade diminuem porque são estimados mais parâme tros A diminuição do SQR poderá ou não ser suficiente para compensar a perda dos graus de liber dade devido à adição dos regressores o resultado líquido dependerá dessa diminuição É bem possível que se um regressor tiver um forte impacto sobre o regressando por exemplo ele pode reduzir o SQR mais do que a perda dos graus de liberdade como resultado de sua adição ao modelo a inclusão de tais variáveis não só reduzirá o viés mas também aumentará a precisão reduzirá os erros padrão dos estimadores 8 Os resultados da regressão são pc 9 Note que nos verdadeiros modelos de ØO2 e ØO3 estão as estimativas não tendenciosas de seus verdadeiros valores 10 Para contornar o tradeoff entre viés e eficiência poderíamos escolher minimizar o quadrado do erro médio Qem visto que ele responde tanto pelo viés quanto pela eficiência Sobre o Qem veja o apêndice estatístico Apêndice A Veja também o exercício 136 ECONOBOOKParte02indb 471 23112010 071958 472 Parte Dois Relaxamento das hipóteses do modelo clássico Por outro lado se as variáveis relevantes tiverem um impacto apenas marginal sobre o regressando e se estiverem altamente correlacionadas se o FIV for maior poderemos reduzir o viés nos coeficien tes das variáveis já incluídas no modelo mas aumentar seus erros padrão tornálos menos eficientes De fato o tradeoff nesta situação entre viés e precisão pode ser substancial Como podemos ver o tradeoff dependerá da importância relativa dos vários regressores Para concluirmos vamos considerar o caso especial em que r2 3 D 0 isto é X2 e X3 não estão cor relacionados Isso resultará em b3 2 igual a zero por quê Portanto podemos ver com base em 1333 que agora ÆO2 é não tendencioso11 Além disso parece das Equações 1334 e 1335 que as variâncias de ÆO2 e ØO2 são iguais Haverá problema em excluir a variável X3 do modelo embora teoricamente ela possa ser relevante Em geral a resposta é não pois neste caso como observado anteriormente a var ÆO2 estimada da Equação 1334 ainda será tendenciosa e portanto nossos procedimentos de teste de hipóteses provavelmente permanecerão pouco confiáveis12 Além disso na maioria das pesquisas econômicas X2 e X3 serão correlacionados criando os problemas discutidos anteriormente Está claro que uma vez que um modelo é formulado com base na teoria relevante não é aconselhável excluir uma variável desse modelo inclusão de uma variável irrelevante sobreespecificação Agora vamos supor que 1336 seja o modelo verdadeiro mas que ajustamos o seguinte 1337 e assim cometemos o erro de especificação de incluir uma variável desnecessária no modelo As consequências desse erro de especificação são 1 Os estimadores de MQO dos parâmetros do modelo incorreto são todos não tendenciosos e consistentes isto é EÆ1 D Ø1 EÆO2 D Ø2 e EÆO3 D Ø3 D 0 2 A variância do erro æ 2 é estimada corretamente 3 Os intervalos de confiança e os procedimentos de teste de hipóteses habituais permanecem válidos 4 Entretanto os Æ estimados em geral serão ineficientes suas variâncias em geral serão maio res que aquelas dos ØO do modelo verdadeiro As demonstrações de algumas dessas afirmati vas podem ser encontradas no Apêndice 13A Seção 13A2 O que nos interessa aqui é a relativa ineficiência dos ÆO e isto pode ser mostrado facilmente Da fórmula habitual de MQO sabemos que 1338 var ˆα2 σ 2 x2 2i 1 r2 23 1339 Portanto 11 Note no entanto que ÆO1 ainda é tendencioso o que pode ser visto intuitivamente como segue sabemos que ØO1 D Y ØO2 X 2 ØO3 X 3 enquanto ÆO1 D Y ÆO2 X 2 e mesmo que ÆO1 D ØO2 os dois estimadores do intercepto serão diferentes 12 Para maiores detalhes veja DarNell adrian C a dictionary of econometrics edward elgar Publisher 1994 p 371372 ECONOBOOKParte02indb 472 23112010 071959 Capítulo 13 Modelagem econométrica especificação de modelo e teste diagnóstico 473 13310 Como 0 r 2 2 3 1 seguese que a var ÆO2 var ØO2 isto é a variância de ÆO2 em geral é maior do que a variância de ØO2 embora em média ÆO2 D Ø2 ie EÆO2 D Ø2 Essa constatação implica que a inclusão da variável desnecessária X3 torna a variância de ÆO2 maior do que o necessário tornando ÆO2 menos preciso Isso também vale para ÆO1 Note a assimetria nos dois tipos de viés de especificação considerados Se excluímos uma variável relevante os coeficientes das variáveis mantidas no modelo em geral serão tendenciosos e inconsisten tes a variância do erro será estimada incorretamente e os procedimentos usuais de teste de hipótese se tornarão inválidos Por outro lado a inclusão de uma variável irrelevante no modelo ainda nos dá esti mativas não tendenciosas e consistentes dos coeficientes no modelo verdadeiro a variância do erro é estimada corretamente e os métodos convencionais de teste de hipóteses continuam válidos a única desvantagem que ocorre com a inclusão da variável supérflua é que as variâncias estimadas dos coefi cientes aumentam e como resultado nossas inferências probabilísticas sobre os parâmetros são menos exatas Uma conclusão indesejada aqui seria que é melhor incluir variáveis irrelevantes que omitir as relevantes mas essa filosofia não deve ser adotada porque a adição de variáveis desnecessárias levará à perda da eficiência dos estimadores e pode acarretar também o problema de multicolinearidade por quê para não mencionar a perda de graus de liberdade Portanto Em geral a melhor abordagem é incluir apenas variáveis explanatórias que em termos teóricos influenciam diretamente a variável dependente e que não são explicadas pelas outras variáveis incluídas13 134 Testes dos erros de especificação Saber as consequências dos erros de especificação é uma coisa mas descobrir se esses erros foram cometidos é outra bem diferente pois não nos dispomos deliberadamente a cometer esses erros Com muita frequência os vieses de especificação surgem inadvertidamente talvez devido à nossa incapa cidade de formular o modelo com a máxima precisão possível uma vez que a teoria subjacente é inconsistente ou porque não temos os dados adequados para testar o modelo Como observa Davidson devido à natureza não experimental da economia nunca temos certeza de como os dados observados foram gerados O teste de qualquer hipótese em economia sempre depende de hipóteses adicionais necessárias para especificar um modelo razoavelmente parcimonioso que pode ou não pode ser justificado14 A questão prática então não é por que cometemos erros de especificação pois em geral isso acon tece mas sim como detectálos Uma vez constatados erros de especificação as formas de corrigilos aparecem Se por exemplo podemos mostrar que uma variável foi omitida inadequadamente de um modelo a correção óbvia é incluíla na análise supondo evidentemente que os dados sobre a variá vel estejam disponíveis Nesta seção discutiremos alguns testes que podemos usar para detectar erros de especificação Detectando a presença de variáveis desnecessárias Suponha que tenhamos desenvolvido um modelo com k variáveis para explicar um fenômeno 1341 13 iNtriliGatOr michael D Econometric models techniques and applications englewood Cliffs NJ Prentice hall 1978 p 189 lembrese do Occams razor principle 14 DaViDSON James Econometric theory Oxford reino Unido Blackwell Publishers2000 p 153 ECONOBOOKParte02indb 473 23112010 072000 474 Parte Dois Relaxamento das hipóteses do modelo clássico Entretanto não temos certeza de que a variável Xk realmente pertence ao modelo Uma maneira simples de descobrir é testar a significância do Øk estimado com o teste t usual t D ØOkep ØOk Mas suponhamos que não estejamos certos de que por exemplo X3 e X4 pertencem legitimamente ao modelo Podemos verificar facilmente aplicando o teste F discutido no Capítulo 8 Detectar a presen ça de uma variável ou variáveis irrelevante não é uma tarefa difícil No entanto é muito importante lembrar que ao realizarmos esses testes de significância temos um modelo específico em mente Aceitamos que esse modelo representa a hipótese mantida ou a ver dadeira por mais precária que possa ser Dado esse modelo podemos descobrir se um ou mais re gressores são realmente relevantes aplicando os testes t e F habituais Mas observe cuidadosamente que não deveríamos usar os testes t e F iterativamente para construir um modelo não deveríamos dizer que inicialmente Y está relacionado com X2 só porque ØO2 é estatisticamente significativo e então expandir o modelo para incluir X3 e decidir manter essa variável no modelo se ØO3 for estatisticamente significativo e assim por diante Essa estratégia de construção de um modelo é chamada de abordagem de baixo para cima começa com um modelo menor expandindoo gradativamente também referida de maneira pejorativa como data mining garimpagem de dados Outros nomes que ela recebe são regression fishing data grubbing data snooping e number crunching O objetivo básico de data mining é desenvolver o melhor modelo após os diversos testes diagnós ticos de modo que o modelo escolhido no final seja um bom modelo no sentido de que todos os coeficientes estimados tenham os sinais corretos sejam estatisticamente significativos com base nos testes t e F apresentem um valor R2 razoavelmente alto e um valor aceitável para o d de Durbin Watson em torno de 2 etc Os puristas desprezam a prática de data mining Nas palavras de William Pool é sempre perigoso fazer da regularidade aplicada a base em vez da implicação da teoria econômica15 Segue uma razão para condenar o data mining Nível de significância nominal versus nível verdadeiro na presença de data mining Um dos perigos no data mining que o pesquisador desavisado enfrenta é que os níveis convencio nais de significância Æ como 1 5 ou 10 não são os verdadeiros níveis de significância Lovell sugeriu que se há c regressores candidatos dentre os quais k são finalmente selecionados k c com base no data mining o verdadeiro nível de significância Æ está relacionado ao nível nominal de significância Æ como se segue16 1342 ou aproximadamente como 1343 Por exemplo se c D 15 k D 5 e Æ D 5 de acordo com a Equação 1343 o verdadeiro nível de significância é 1555 D 15 Portanto se um pesquisador usa a prática do data mining e se leciona 5 de 15 regressores e relata apenas os resultados do modelo condensado ao nível de signifi cância nominal de 5 e declara que os resultados são estatisticamente significativos devese considerar essa conclusão com certa cautela pois sabemos que o verdadeiro nível de significância é de fato 15 Devese notar que se c D k não há data mining os níveis de significância verdadeiro e nominal são os mesmos Evidentemente na prática a maioria dos pesquisadores relata apenas os resultados de sua regressão final sem revelar necessariamente todo o data mining ou o préteste que foi feito17 15 POOl William is inflation too low The Cato Journal v 18 n 3 p 456 1999 16 lOVell m Data mining Review of Economics and Statistics v 65 p 112 1983 17 Para uma discussão detalhada de préteste e os viéses que este pode acarretar veja WallaCe t D Pretest estimation in regression a survey American Journal of Agricultural Economics v 59 p 431443 1977 ECONOBOOKParte02indb 474 23112010 072001 Capítulo 13 Modelagem econométrica especificação de modelo e teste diagnóstico 475 Apesar de suas desvantagens óbvias há um reconhecimento crescente principalmente entre os profissionais que trabalham com econometria aplicada de que a abordagem purista contrária ao data mining à construção do modelo não é sustentável Como observa Zaman Infelizmente a experiência com dados reais mostra que tal abordagem não é viável nem desejável Não é viável porque é uma teoria econômica rara que leva a um modelo único Não é desejável porque um aspecto crucial da aprendizagem dos dados é entender que tipos de modelos são e não são apoiados por dados Mesmo que por rara sorte os modelos iniciais mostremse adequados com frequência é impor tante explorar e identificar que tipos de modelos adaptamse ou não aos dados18 Kerry Patterson expressa uma visão semelhante sustentando que Esta abordagem data mining sugere que a teoria econômica e a especificação aplicada deveriam in teragir em vez de serem mantidas separadas19 Em vez de examinarmos detidamente na controvérsia sobre a abordagem de data mining versus purista na construção do modelo podemos endossar a visão expressa por Peter Kennedy Essa especificação de modelo precisa ser uma combinação bem ponderada de teoria e dados e esses procedimentos de teste usados na busca de especificação deveriam ser definidos para minimizar os custos de data mining Exemplos de tais procedimentos são a separação de dados para testes de previsão fora da amostra ajuste de níveis de significância a la Lovell e evitar critérios questionáveis como maximizar R220 Se examinarmos o data mining em uma perspectiva mais ampla como um processo de descoberta de regularidades aplicadas que poderiam sugerir erros eou omissões em modelos teóricos existen tes ele tem um papel muito útil a desempenhar Citando Kennedy novamente a arte do econome trista aplicado consiste em levar em conta uma teoria voltada para os dados enquanto evita os perigos consideráveis no data mining21 Testes para omissão de variáveis e forma funcional incorreta Na prática nunca temos certeza de que o modelo adotado para teste aplicado é a verdade somente a verdade nada mais que a verdade Com base na teoria ou na introspecção e em trabalhos aplicados desenvolvemos um modelo que acreditamos captar a essência do assunto estudado Submetemos o modelo ao teste aplicado Depois de obtermos os resultados começamos a dissecação tendo em mente os critérios de um bom modelo discutido anteriormente É nessa etapa que sabemos se o modelo escolhi do é adequado Ao determinarmos a adequação do modelo examinamos alguns aspectos amplos dos re sultados como o valor do R 2 as razões t estimadas os sinais dos coeficientes estimados em relação às expectativas anteriores a estatística de DurbinWatson e outros Se esses diagnósticos forem razoá veis afirmamos que o modelo escolhido é uma representação adequada da realidade Seguindo o mesmo raciocínio se os resultados não forem animadores porque o valor de R 2 é muito baixo ou porque muito poucos coeficientes são estatisticamente significativos ou têm os sinais corretos ou porque o d de DurbinWatson é muito baixo começamos a ficar preocupados com a adequação do modelo e procuramos formas de corrigilo talvez tenhamos omitido uma variável importante ou usamos a forma funcional errada ou ainda não calculamos a primeira diferença da série temporal para remover a correlação serial e assim por diante Para auxiliar a determinar se a inadequação do modelo devese a esses problemas podemos usar os métodos a seguir 18 ZamaN asad Statistical foundations for econometric techniques Nova York academic Press 1996 p 226 19 PatterSON Kerry An introduction to applied econometrics Nova York St martins Press 2000 p 10 20 KeNNeDY Peter Sinning in the basement what are the rules the ten commandments of applied econometrics manuscrito não publicado 21 KeNNeDY op cit p 13 ECONOBOOKParte02indb 475 23112010 072001 476 Parte Dois Relaxamento das hipóteses do modelo clássico Exame de resíduos Como se discutiu no Capítulo 12 o exame dos resíduos é um bom diagnóstico visual para detectar a autocorrelação ou a heterocedasticidade Mas esses resíduos também podem ser examinados prin cipalmente em dados de corte transversal para detectar erros de especificação de modelo como a omissão de uma variável importante ou de uma forma funcional incorreta Se de fato esses erros fo ram cometidos um gráfico dos resíduos mostrará padrões distintos Para ilustrarmos reconsideraremos a função cúbica de custo total vista no Capítulo 7 Suponha que a verdadeira função de custo total seja descrita como se segue em que Y D custo total e X D produção 1344 mas um pesquisador ajuste a seguinte função quadrática 1345 e outro pesquisador ajuste a seguinte função linear 1346 Embora saibamos que os dois pesquisadores cometeram erros de especificação para fins pedagó gicos vejamos como os resíduos estimados aparecem nos três modelos Os dados de custoprodução estão na Tabela 74 A Figura 131 mostra claramente que à medida que nos movemos da esquerda para a direita nos aproximamos da verdade não só os resíduos são menores em valores absolutos mas eles não exibem as oscilações cíclicas pronunciadas associadas aos modelos mal ajustados Portanto fica claro que vale examinar o gráfico dos resíduos se houver erros de especificação os resíduos exibirão padrões marcantes A estatística d de DurbinWatson mais uma vez Se examinarmos o d de DurbinWatson calculado na Tabela 131 vemos que para a função linear de custo o d estimado é 0716 sugerindo que há correlação positiva nos resíduos estimados para n D 10 e k D 1 os valores críticos de d são dL D 0879 e dU D 1320 Da mesma forma o valor de d calculado na função de custo quadrático é 1038 enquanto os valores críticos a 5 são dL D 0697 e dU D 1641 indicando indecisão Mas se usamos o teste d modificado veja Capítulo 12 pode Figura 131 Resíduos uOi de funções de custo total a linear b quadrática e c cúbica X 0 ui Resíduos Produção a b c ECONOBOOKParte02indb 476 23112010 072002 Capítulo 13 Modelagem econométrica especificação de modelo e teste diagnóstico 477 mos dizer que há correlação positiva nos resíduos pois o valor calculado de d é menor que dU Para a função cúbica de custo a verdadeira especificação o valor estimado de d não indica qualquer correlação positiva nos resíduos22 A correlação positiva observada nos resíduos quando ajustamos o modelo linear ou quadrático não é uma medida da correlação serial de primeira ordem mas de erros de especificação do mo delo A correlação observada reflete o simples fato de que uma ou mais variáveis que pertencem ao modelo estão incluídas no termo de erro e precisam ser retiradas e introduzidas como variáveis expla natórias se excluirmos o X 3 i da função de custo como mostra a Equação 1323 o termo de erro no modelo mal especificado 1322 será de fato u1i C Ø4 X 3 i e exibirá um padrão sistemático por exemplo uma correlação positiva se X 3 i afetar Y significativamente Para usarmos o teste de DurbinWatson com o objetivo de detectar os erros de especificação de modelo procederemos da seguinte forma 1 Do modelo em questão obtemos os resíduos de mínimos quadrados ordinários MQO 2 Se acreditamos que o modelo suposto esteja mal especificado uma vez que exclui uma variá vel explanatória relevante por exemplo Z do modelo ordenamos os resíduos obtidos no Passo 1 de acordo com valores crescentes de Z Nota a variável Z poderia ser uma das variá veis X incluídas no modelo assumido ou poderia ser uma função daquela variável como X 2 ou X 3 3 Calculamos a estatística d com base nos resíduos assim ordenados pela fórmula usual d a saber Nota o subscrito t é o índice da observação e não significa necessariamente que os dados sejam relativos a uma série temporal 22 No contexto um valor de d D 2 não significará erro de especificação Por quê Tabela 131 Resíduos estimados das funções linear quadrática e cúbica de custo total modelo cúbico Número da observação modelo linear modelo quarático Yi H 166467 C 19933Xi R2 H 08409 19021 3066 R2 H 08210 8752 6502 d H 0716 Yi H 222383 80250Xi C 2542Xi2 R2 H 09284 23488 9809 0869 R2 H 09079 9468 0818 2925 d H 1038 Yi H 141767 C 63478Xi 12962Xi2 C 0939Xi3 R2 H 09983 6375 4778 09856 00592 R2 H 09975 22238 13285 13151 15861 d H 270 O O O ECONOBOOKParte02indb 477 23112010 072003 478 Parte Dois Relaxamento das hipóteses do modelo clássico 4 Das tabelas de DurbinWatson se o valor estimado de d for significativo então poderemos aceitar a hipótese de má especificação do modelo Se esse for o caso as medidas corretivas ficarão claras Em nosso exemplo de custo a variável Z D X produto já foi ordenada23 Portanto não temos de calcular a estatística d novamente Como vimos a estatística d para as funções de custo linear e quadrática sugere erros de especificação As medidas corretivas estão claras introduzimos os termos cúbico e quadrático na função de custo linear e o termo cúbico na função de custo quadrática Em resumo estimamos o modelo cúbico de custo O teste RESET de Ramsey Ramsey propôs um teste geral para detectar erros de especificação chamado RESET do inglês regression specification error test24 Ilustraremos apenas sua versão mais simples Para fixarmos as ideias continuaremos com nosso exemplo de custoprodução e vamos supor que a função de custo seja linear na produção como 1346 em que Y D custo total e X D produção Agora se representarmos graficamente os resíduos uOi obtidos dessa regressão contra YOi o Yi estimado pelo modelo obteremos o gráfico da Figura 132 Embora sejam necessariamente iguais a zero por quê Veja o Capítulo 3 a figura mostra um padrão de mudança da média dos resíduos com YOi Isso sugere que se introduzirmos YOi na Equação 1346 como regressor ele deve aumentar o R2 e se o aumento de R2 for estatisticamente significa tivo com base no teste F discutido no Capítulo 8 esse sugerirá que a função de custo linear 1346 foi mal especificada Essa é a essência da ideia do RESET As etapas na aplicação do RESET são 1 Do modelo escolhido isto é a Equação 1346 obtemos o Yi estimado YOi 2 Recalculamos a Equação 1346 introduzindo de algum modo YOi como regressores adicionalis Da Figura 132 observamos que há uma relação curvilínea entre uOi e YOi suge rindo que podemos introduzir YO 2 i e YO 3 i como regressores adicionais Calculamos 1347 3 Seja o R2 obtido da Equação 1347 R 2 novo e aquele obtido da Equação 1346 R 2 velho Po demos usar o teste F introduzido na Equação 8418 a saber número de parâmetros no novo modelo velho 8418 para verificar se o aumento em R2 decorrente da utilização da Equação 1347 é estatistica mente significativo 4 Se o valor calculado de F for significativo por exemplo a 5 podemos aceitar a hipótese de que a especificação do modelo 1346 estava errada Voltando ao nosso exemplo temos os seguintes resultados erros padrão entre parênteses 1348 23 Não importa se ordenamos à uO i de acordo com X i 2 ou X i 3 uma vez que são funções de xi que já é ordenada 24 ramSeY J B tests for specification errors in classical linear least squares regression analysis Journal of the Royal Statistical Society série B v 31 p 3503711969 ECONOBOOKParte02indb 478 23112010 072004 Capítulo 13 Modelagem econométrica especificação de modelo e teste diagnóstico 479 1349 Nota YO 2 i e YO 3 i na Equação 1349 são obtidos da Equação 1348 Agora aplicando o teste F encontramos 13410 O leitor pode verificar facilmente que o valor de F é altamente significativo indicando que o modelo 1348 está mal especificado Evidentemente chegamos à mesma conclusão com base no exame visual dos resíduos bem como no valor d de DurbinWatson Devese acrescentar que uma vez estimado YOi esta é uma variável aleatória e portanto os testes habituais de significância aplicamse se a amostra for razoavelmente grande Uma vantagem do RESET é sua facilidade de aplicação pois não exige que se especifique qual é o modelo alternativo Mas essa também é uma desvantagem porque saber que um modelo é mal es pecificado não nos ajuda necessariamente na escolha de uma alternativa melhor Como ressalta um autor Na prática o teste RESET pode não ser muito eficiente para detectar qualquer alternativa específica a um modelo proposto e sua utilidade reside em servir como indicador geral de que há algo de errado Por essa razão um teste como o RESET às vezes é descrito como um recurso para identificar uma falha na especificação em oposição a um teste de especificação Essa distinção é bastante sutil mas a ideia bá sica é que um teste de especificação examina determinado aspecto de uma equação tendo em mente a Figura 132 Resíduos uOi e Y estimado da função linear de custo Yi D 1 C 2 Xi C ui 0 ui Y 150 200 300 400 250 350 ECONOBOOKParte02indb 479 23112010 072005 480 Parte Dois Relaxamento das hipóteses do modelo clássico hipótese nula e alternativa Um teste de erro de especificação por outro lado pode detectar várias alter nativas e indica que há algo de errado sob a hipótese nula sem dar necessariamente clara orientação quanto à hipótese alternativa que será adequada25 O teste do multiplicador de Lagrange ML para acréscimo de variáveis Esta é uma alternativa ao teste RESET de Ramsey Para ilustrar esse teste continuaremos com o exemplo anterior Se comparamos a função linear de custo 1346 com a cúbica 1344 veremos que a primeira é uma versão restrita da segunda lembrese do exame dos mínimos quadrados res tritos no Capítulo 8 A regressão restrita 1346 pressupõe que os coeficientes dos termos quadrá tico e cúbico são iguais a zero Para testar isso o ML segue as seguintes etapas 1 Estimase a regresão restrita 1346 pelo MQO e obtêmse os resíduos uOi 2 Se de fato a regressão não restrita 1344 for a verdadeira regressão os resíduos obtidos em 1346 deverão estar relacionados com os termos quadrático e cúbico isto é X 2 i e X 3 i 3 Isto sugere que se faça a regressão dos uOi obtidos na etapa 1 contra todos os regressores in clusive aqueles da regressão restrita o que neste caso daria 13411 em que v é um termo de erro com as propriedades usuais 4 Para uma amostra grande Engle mostrou que n o tamanho da amostra vezes o R2 estimado da regressão auxiliar 13411 segue uma distribuição quiquadrado com um número de graus de liberdade igual às restrições impostas pela regressão restrita que no exempo são duas visto que os termos X 2 i e X 3 i foram tirados do modelo26 Simbolicamente temse 13412 em que asy significa assintoticamente isto é em grandes amostras 5 Se o valor do quiquadrado obtido na Equação 13412 excede o valor crítico ao nível de significância escolhido rejeitase a regressão restrita Caso contrário ela não é rejeitada Para o nosso exemplo os resultados foram 13413 em que Y é o custo total e X é a produção Os erros padrão dessa regressão já foram dados na Tabela 131 Quando fazemos uma regressão dos resíduos da Equação 13413 como sugerido na Etapa 3 obtemos os seguintes resultados 13414 Embora o tamanho de nossa amostra de 10 observações não seja grande só para ilustrar o meca nismo ML obtemos nR2 D 1009896 D 9896 Da tabela do quiquadrado observamos que para 2 graus de liberdade o valor crítico do quiquadrado a 1 é cerca de 921 Portanto o valor observado 25 SteWart Jon Gill len Econometrics 2 ed europa Prenticehall 1998 p 69 26 eNGle r F a general approach to lagrangian multiplier model diagnostics Journal of Econometrics 1982 v 20 p 83104 ECONOBOOKParte02indb 480 23112010 072006 Capítulo 13 Modelagem econométrica especificação de modelo e teste diagnóstico 481 de 9896 é significativo ao nível de 1 e nossa conclusão seria rejeitar a regressão restrita a função linear de custo Chegamos a uma conclusão parecida com base no teste RESET de Ramsey 135 Erros de medida Supusemos implicitamente que a variável dependente Y e as variáveis explanatórias os X são medidas sem erro Logo na regressão de despesas de consumo sobre renda e riqueza das famílias pressupomos que os dados relativos a essas variáveis sejam exatos não são estimativas conjetu ras extrapoladas interpoladas ou arredondadas de modo sistemático como até a casa das centenas de dólares e assim por diante Infelizmente esse ideal não é alcançado na prática por diversas razões como erros por falta de respostas erros de transcrição e de cálculo Quaisquer que sejam as razões o erro de medição pode ser um problema complicado pois constitui outro exemplo de viés de especifi cação cujas consequências são mencionadas a seguir erros de medida da variável dependente Y Considere o seguinte modelo 1351 em que Y i D despesas permanentes de consumo27 Xi D renda corrente ui D termo de erro estocástico Como não podemos medir Y i diretamente podemos usar uma variável de despesas observável Yi tal que 1352 em que i denota erros de medida em Y i Portanto em vez de calcularmos a Equação 1351 esti mamos 1353 em que vi D ui C i é um termo composto de erro contendo o termo de erro da população que pode ser chamado de termo de erro da equação e o termo de erro de medida Suponha simplesmente que Eui D Ei D 0 cov Xi ui D 0 que é uma hipótese da regressão linear clássica e cov Xi i D 0 isto é os erros de medida em Y i não estão correlacionados com Xi e cov Xi i D 0 isto é o erro da equação e o erro de medida não estão correlacionados Com essas hipóteses podemos ver que o Ø estimado da Equação 1351 ou da Equação 1353 será um esti mador não tendencioso do verdadeiro Ø veja o Exercício 137 os erros de medida da variável de pendente Y não destroem a propriedade de ausência de viés dos estimadores de MQO No entanto as variâncias e os erros padrão de Ø calculados por meio das Equações 1351 e 1353 serão diferen tes porque ao empregarmos as fórmulas habituais veja o Capítulo 3 obteremos 1354 27 esta frase devese a milton Friedman Veja também o exercício 138 ECONOBOOKParte02indb 481 23112010 072007 482 Parte Dois Relaxamento das hipóteses do modelo clássico 1355 Obviamente a segunda variância é maior que a primeira28 Embora os erros de medida na variá vel dependente ainda deem estimativas não tendenciosas dos parâmetros e suas variâncias as variâncias estimadas agora são maiores que no caso em que não há tais erros de medida erros de medida na variável explanatória X Agora suponha que no lugar da Equação 1351 tenhamos o seguinte modelo 1356 em que Yi D despesas atuais de consumo X i D renda permanente ui D termo de erro da equação Suponha que em vez de observarmos X i observamos 1357 em que wi representa erros de medida em X i Portanto em vez de calcularmos a Equação 1356 estimamos 1358 em que zi D ui Øwi um composto de erros da equação e de medida Agora mesmo que suponhamos que wi tenha média zero seja serialmente independente e não esteja correlacionado a ui não podemos mais supor que o termo de erro zi seja independente da variável explanatória Xi porque supondo Ezi 0 1359 Assim a variável explanatória e o termo de erro na Equação 1358 estão correlacionados o que viola a hipótese crucial do modelo clássico de regressão linear de que a variável explanatória não está correlacionada com o termo de erro estocástico Se essa hipótese não for respeitada podese mostrar que os estimadores de MQO não só são tendenciosos mas também inconsistentes eles continuam tendenciosos mesmo que o tamanho da amostra n aumente indefinidamente29 28 mas note que essa variância ainda é não tendenciosa porque sob as condições estabelecidas o termo de erro composto vi ui i satisfaz as hipóteses básicas do método de mínimos quadrados 29 Como mostra o apêndice a ØO é um estimador consistente de Ø se quando n aumenta indefinidamente a distribuição amostral de ØO acaba convergindo para o verdadeiro Ø tecnicamente isso é representado por plim n1ØO D Ø Como notado no apêndice a a consistência é uma propriedade em grande escala e usada com frequência para estudar um estimador quando suas propriedades finitas ou de amostras pequenas não ten denciosidade não puderem ser determinadas ECONOBOOKParte02indb 482 23112010 072008 Capítulo 13 Modelagem econométrica especificação de modelo e teste diagnóstico 483 No caso do modelo 1358 demonstrase na Seção 13A do Apêndice 13A que 13510 em que æ 2 w e æ 2 X são as variâncias de wi e X respectivamente e plim ØO indica o limite da probabili dade de ØO Como esperamos que o termo entre parênteses seja menor que 1 por quê a Equação 13510 mostra que mesmo que o tamanho da amostra aumente indefinidamente ØO não convergirá para Ø De fato se consideramos Ø positivo ØO subestimará Ø isto é é viesado em torno de zero Eviden temente se não houver erros de medida em X por exemplo æ 2 w D 0 ØO fornecerá um estimador consistente de Ø Os erros de medição impõem um sério problema quando estão presentes nas variáveis explana tórias porque tornam impossível a estimação de parâmetros consistentes Evidentemente como vi mos se eles estiverem apenas na variável dependente os estimadores permanecerão não tendenciosos e portanto consistentes Se houver erros de medida nas variávelis explanatórias qual será a solução Não é fácil responder No extremo podemos supor que se æ 2 w for pequeno comparado a æ 2 X para todos os fins práticos podemos ignorar o problema e proceder à estimação usual com MQO Obviamente a questão aqui é que não podemos observar ou medir æ 2 w e æ 2 X e não há como avaliar suas magnitudes relativas Outra correção sugerida é o uso de variáveis instrumentais ou proxy que embora estejam alta mente correlacionadas com as variáveis originais X não estão correlacionadas com os termos de erro da equação e de medida ui e wi Se for possível encontrar essas variáveis proxy obteremos uma estimativa consistente de Ø Mas é muito mais fácil falar do que fazer isso Na prática não é fácil encontrar boas proxies com frequência estamos em situação de reclamar do mau tempo sem sermos capazes de fazer muito para mudálo Além disso não é fácil verificar se a variável instrumental se lecionada é de fato independente dos termos de erro ui e wi Na literatura específica há outras sugestões para resolver o problema30 Mas a maioria delas é especí fica a determinada situação e baseiase em hipóteses restritivas Não há resposta satisfatória ao problema de erros de medida É por isso que é tão importante medir os dados com a máxima exatidão possível exeMplO 132 Concluímos esta seção com um exemplo elaborado para destacar os aspectos aborda dos a tabela 132 apresenta dados hipotéticos sobre as verdadeiras despesas de consumo Y a verdadeira renda X o consumo medido Y e a renda medida X a tabela também explica como essas variáveis foram medidas31 Erros de medida apenas na variável dependente Y Com base nos dados apresen tados a verdadeira função de consumo é 13511 Continua 31 30 Veja FOmBY thomas B hill r Carter JOhNSON Stanley r Advanced econometric methods Nova York SpringerVerlag 1984 p 273277 Veja também KeNNeDY op cit p 138140 para uma discussão de re gressão ponderada e também de variáveis instrumentais Veja ainda maDDala G S Introduction to econome trics 3 ed Nova York John Wiley Sons 2001 p 437462 e PariS Quirino robust estimators of errorsinariables models part i Working Paper N 04007 200 Department of agricultural and resource economics University of California at Davis ago 2004 31 estou débito com Kenneth J White pela construção deste exemplo Veja seu Computer Handbook Using SHAZAM para ser utilizado com Damodar Gujarati Basic Economotrics September 1985 pp 11121 ECONOBOOKParte02indb 483 23112010 072009 484 Parte Dois Relaxamento das hipóteses do modelo clássico Tabela 132 Dados hipotéticos de Y verdadeiras despesas de consumo de X verdadeira renda de Y consumo medido e de X renda medida todos os dados em dólar Nota pressupomos que os dados relativos X sejam apresentados Ao derivarmos as outras variáveis foram feitos os seguintes pressupostos 1 Eui D Ei D Ewi D 0 2 cov X u D cov X D cov u D cov w u D cov w D 0 3 æ 2 u 100 æ 2 D 36 e æ 2 w D 36 e 4 Y i D 25 C 06X i C ui Yi D Y i C i e Xi D X i C wi enquanto se usamos Yi em lugar de Yi obtemos 13512 Como mostram esses resultados e de acordo com a teoria os coeficientes estimados con tinuam os mesmos O único efeito dos erros de medida na variável dependente é que os erros padrão estimados dos coeficientes tendem a ser maiores veja a equação 1355 o que a equação 13512 mostra claramente a propósito note que os coeficientes de re gressão nas equações 13511 e 13512 são os mesmos porque a amostra foi gerada para ajustarse às hipóteses do modelo de erros de medida erros de medida em X Sabemos que a verdadeira regressão é a equação 13511 Su ponha agora que em vez de usarmos X i usamos Xi Nota na realidade X i raramente é observável Os resultados da regressão são 13513 esses resultados estão de acordo com a teoria quando há erros de medição nas variávelis explanatórias os coeficientes estimados são tendenciosos Felizmente neste exemplo o viés é bem pequeno da equação 13510 é evidente que o viés depende de æ 2wæ 2 X e ao gerar os dados considerouse que æ 2w D 36 e æ 2 X D 3667 o que tornou o fator de viés bastante pequeno cerca de 098 D 363667 Cabe ao leitor verificar o que acontece quando há erros de medição tanto em Y quanto em X isto é se fizermos a regressão de Yi contra Xi em vez de Y i contra X i veja o exercício 1323 ECONOBOOKParte02indb 484 23112010 072010 Capítulo 13 Modelagem econométrica especificação de modelo e teste diagnóstico 485 136 Especificação incorreta do termo de erro estocástico Um problema comum que um pesquisador enfrenta é a especificação do termo de erro ui que entra no modelo de regressão Uma vez que o termo de erro não é diretamente observável não há maneira de determinar com facilidade a forma como ele entra no modelo Para tanto vamos retornar aos mo delos apresentados nas Equações 1328 e 1329 Para tornar a exposição mais simples consideramos que não há intercepto no modelo Supomos ainda que ui na Equação 1328 é tal que ui satisfaz as hipóteses usuais dos MQO Se considerarmos que a Equação 1328 é o modelo correto mas estimarmos a Equação 1329 quais serão as consequências Na Seção 13A4 do Apêndice 13A demonstramos que se ln ui ª N 0 æ2 então 1361 Como resultado 1362 em que e é a base do logaritmo natural Como se vê ÆO é um estimador tendencioso pois seu valor médio não é igual ao verdadeiro Ø Teremos mais a dizer sobre a especificação do termo de erro estocástico no capítulo sobre modelos de regressão não lineares nos parâmetros 137 Modelos aninhados nested versus não aninhados nonnested Ao efetuarmos os testes de especificação convém distinguir entre modelos aninhados nested e não aninhados nonnested Para tanto considere os modelos a seguir Dizemos que o Modelo B está aninhado no Modelo A porque é um caso especial do Modelo A se estimarmos o Modelo A e testarmos a hipótese de que Ø4 D Ø5 D 0 e não a rejeitarmos com base por exemplo no teste F32 o Modelo A se reduzirá ao Modelo B Se acrescentarmos a variável X4 ao Modelo B o Modelo A será reduzido ao Modelo B se Ø5 for zero aqui usaremos o teste t para verifi car a hipótese de que o coeficiente de X5 é zero Embora não tivéssemos dado essa denominação os testes de erro de especificação que discutimos no Capítulo 8 são essencialmente testes de hipóteses aninhadas Agora considere os modelos a seguir em que os X e os Z são variáveis diferentes Esses modelos são denominados não aninhados porque não podemos definir um deles como um caso especial do outro Dizemos que os Modelos C e D não são aninhados porque um não pode derivar como um caso especial do outro Em economia como em outras ciências mais de uma teoria pode concorrer para a explicação de um fenômeno Os monetaristas 32 em termos gerais podese usar o teste de razão probabilística ou o teste de Wald ou o teste do multiplicador de lagrange que discutimos brevemente no Capítulo 8 ECONOBOOKParte02indb 485 23112010 072011 486 Parte Dois Relaxamento das hipóteses do modelo clássico dão destaque à moeda como explicação das variações no PNB enquanto os keynesianos atribuemnas aos gastos do governo Podese ressaltar aqui que é possível que os Modelos C e D contenham regressores em comum Por exemplo X3 poderia ser incluído no Modelo D e Z2 poderia ser incluído no Modelo C Mesmo assim esses são modelos não aninhados porque o C não contém Z3 e o D não contém X2 Ainda que as mesmas variáveis entrem no modelo a forma funcional pode tornar os dois modelos não aninhados Por exemplo considere o modelo Os Modelos D e E não são aninhados pois um não pode derivar como caso especial do outro Como já examinamos os testes para os modelos aninhados os testes t e F na seção a seguir discutiremos alguns dos testes de modelos não aninhados que antes chamamos de erros de especifi cação do modelo 138 Testes de hipóteses não aninhados nonnested De acordo com Harvey33 há duas formas de testar as hipóteses não aninhadas 1 a abordagem discriminatória na qual dados dois ou mais modelos concorrentes escolhese um modelo com base em alguns critérios de qualidade do ajustamento e 2 a abordagem discernente terminologia nos sa em que ao investigarmos um modelo levamos em conta informações fornecidas por outros mo delos Consideraremos essas abordagens rapidamente a abordagem discriminatória Vamos considerar os Modelos C e D da Seção 137 Uma vez que ambos envolvem a mesma va riável dependente podemos escolher entre dois ou mais modelos com base no critério da qualidade do ajustamento como o R2 ou o R2 ajustado que já discutimos Mas lembrese de que ao comparar mos dois ou mais modelos o regressando deve ser o mesmo Além desses critérios há outros que também são usados Incluem o critério de informação de Akaike CIA do inglês AIC Akaikes information criterion o de Schwarz CIS do inglês SIC Schwarzs information criterion ou BIC Bayesian information criterion e o critério Cp de Mallow que serão examinados na Seção 139 A maioria dos programas estatísticos modernos já traz embutidos em suas rotinas de regressão um ou mais desses critérios Na última seção deste capítulo ilustraremos os critérios usando um exemplo extenso Com base em um ou mais deles poderemos selecionar um modelo que apresente o R 2 mais alto ou o menor valor de CIA ou de CIS etc a abordagem discernente O teste F não aninhado ou o teste F abrangente Considere os Modelos C e D introduzidos na Seção 137 Como escolhemos entre os dois mode los Com essa finalidade estimemos o seguinte modelo aninhado ou híbrido Observe que o Modelo F aninha ou abrange os Modelos C e D mas o Modelo C não está aninha do em D e D não está aninhado em C de modo que eles são modelos não aninhados Agora se o Modelo C estiver correto 4 D 5 D 0 enquanto se o Modelo D for correto teremos 2 D 3 D 0 Esse teste pode ser feito por meio do teste usual F daí o nome teste F não aninhado No entanto esse procedimento de teste apresenta problemas Primeiro se os X e os Z estiverem altamente correlacionados como observado no capítulo sobre multicolinearidade é bem provável 33 harVeY andrew The econometric analysis of time series 2 ed Cambridge mass the mit Press 1990 cap 5 ECONOBOOKParte02indb 486 23112010 072011 Capítulo 13 Modelagem econométrica especificação de modelo e teste diagnóstico 487 que um ou mais dos sejam pouco significativos individualmente do ponto de vista estatístico em bora com base no teste F seja possível rejeitar a hipótese de que todos os coeficientes angulares são simultaneamente iguais a zero Nesse caso não temos como decidir se o modelo correto é C ou D Em segundo lugar há outro problema Suponha que escolhemos o Modelo C como a hipótese ou modelo de referência e constatamos que todos os seus coeficientes são significativos Agora acres centamos Z2 ou Z3 ou ambos ao modelo e verificamos usando o teste F que sua contribuição margi nal à soma dos quadrados explicados pela regressão SQE é estatisticamente insignificante Portanto decidimos escolher o Modelo C Mas imagine que tivéssemos escolhido o Modelo D como referência e descobrimos que todos os seus coeficientes eram estatisticamente significativos Quando acrescentamos X2 ou X3 ou ambos a esse modelo verificamos novamente usando o teste F que sua contribuição incremental à SQE é insignificante Portanto teríamos escolhido o Modelo C como o correto Daí a escolha da hipótese de referência poderá determinar o resultado da escolha do modelo34 principalmente se houver gran de multicolinearidade nos regressores concorrentes Por fim o Modelo F aninhado artificialmente pode não ter grande significado econômico exeMplO 133 Um exemplo ilustrativo o modelo de St Louis Para determinar se as variações no PNB nominal podem ser explicadas pelas variações na oferta de moeda monetarismo ou por alterações nos gastos do governo keynesianismo consideraremos os modelos 1381 1382 em que Y t D taxa de crescimento do PNB nominal no período t M t D taxa de crescimento da oferta de moeda versão m1 no período t E t D taxa de crescimento dos gastos do governo em termos de pleno emprego no período t Note que as equações 1381 e 1382 são exemplos de modelos com defasagens dis tribuídas assunto que será discutido profundamente no Capítulo 17 Por enquanto obser ve que o efeito de uma unidade de variação na oferta de moeda ou nos gastos do governo sobre o PNB distribuise em um período de tempo e não é instantâneo Uma vez que pode ser difícil decidir a priori entre os dois modelos concorrentes combi naremos os dois modelos como mostrado a seguir 1383 esse modelo aninhado é uma das formas como o famoso modelo de St louis Federal reserv Bank de St louis um banco que segue a escola monetarista foi estimado Os re sultados desse modelo para o período que vai do primeiro trimestre de 1953 até o quarto trimestre de 1976 para os estados Unidos são os seguintes razões t entre parênteses35 Continua 35 34 FOmBY thomas B hill r Carter JOhNSON Stanley r Advanced econometric methods Nova York Springer Verlag 1984 p 416 35 Veja CarlSON Keith m Does the St louis equation now believe in fiscal policy Review Federal Reserve Bank of St Louis fev 1978 v 60 n 2 p 17 tabela iV ECONOBOOKParte02indb 487 23112010 072012 488 Parte Dois Relaxamento das hipóteses do modelo clássico exeMplO 133 Continuação 1384 O que esses resultados sugerem sobre a superioridade de um modelo sobre o ou tro Se considerarmos o efeito cumulativo de uma unidade de variação em M e E sobre Y obtemos respectivamente sendo que o primeiro é esta tisticamente significativo e o segundo não essa comparação tenderia a apoiar a afirmação monetarista de que são as variações na oferta de moeda que determinam as variações no PNB nominal O leitor poderá fazer uma avaliação crítica dessa afirmação como exercício Teste J de DavidsonMacKinnon36 Devido aos problemas citados no procedimento de teste F não aninhado têm sido sugeridas algu mas alternativas Uma delas é o teste J de DavidsonMackinnon Para ilustrar o teste suponha que desejamos comparar a hipótese ou Modelo C com a hipótese ou Modelo D O teste J é feito como segue 1 Estimamos o Modelo D e dele obtemos os valores Y estimados YO D i 2 Acrescentamos o valor previsto na Etapa 1 como um regressor adicional ao Modelo C e es timamos o seguinte modelo 1385 em que os valores de YO D i são obtidos da Etapa 1 Este modelo é um exemplo do princípio abrangente como no método de Hendry 3 Usando o teste t teste a hipótese de que Æ4 D 0 4 Se a hipótese de que Æ4 D 0 não for rejeitada poderemos aceitar isto é não rejeitar o Mo delo C como sendo o verdadeiro modelo porque o YO D i incluído na Equação 1385 que representa a influência das variáveis não incluídas no Modelo C não tem poder explanativo além daquele já fornecido pelo Modelo C Em outras palavras o Modelo C abrange o Mo delo D no sentido de que este último não contém nenhuma informação adicional que possa aprimorar o desempenho do Modelo C Da mesma forma se a hipótese nula for rejeitada o Modelo C não poderá ser o modelo verdadeiro por quê 5 Agora revertemos os papéis das hipóteses ou os Modelos C e D Estimamos C usamos os valores de Y estimados por esse modelo como o regressor na Equação 1385 repetimos a Etapa 4 e decidimos se aceitamos o Modelo D em vez do C Mais especificamente estima mos o seguinte modelo 1386 36 DaViDSON r J G maCKiNNON r Several tests for model specification in the presence of alternative hypotheses Econometrica 1981 v 49 p 781793 ECONOBOOKParte02indb 488 23112010 072013 Capítulo 13 Modelagem econométrica especificação de modelo e teste diagnóstico 489 em que YO C i são os valores estimados do Modelo C Agora testamos a hipótese de que Ø4 D 0 Se essa hipótese não for rejeitada escolhemos o Modelo D em vez de C Se a hipótese de que Ø4 D 0 for rejeitada escolhemos C em vez de D já que o Modelo D não aprimora o desempenho de C Embora intuitivamente isso seja atraente o teste J tem alguns problemas Uma vez que os testes dados em 1385 e 1386 são realizados de modo independente temos os seguintes re sultados prováveis Hipótese Æ4 D 0 Hipótese Ø4 D 0 Não rejeitar Rejeitar Não rejeitar aceitar tanto C quanto D aceitar D rejeitar C Rejeitar aceitar C rejeitar D rejeitar tanto C quanto D Como mostra a tabela não conseguiremos obter uma resposta clara se o procedimento do teste J levar à aceitação ou rejeição de ambos os modelos No caso de ambos os modelos serem rejeitados nenhum deles nos ajudará a explicar o comportamento de Y Da mesma forma se ambos os modelos forem aceitos como observa Kmenta os dados aparentemente não são ricos o suficiente para dis criminar entre as duas hipóteses modelos37 Outro problema com o teste J é que quando usamos a estatística t para verificar a significância da variável Y estimada pelos modelos 1385 e 1386 a estatística t tem a distribuição normal padrão apenas assintoticamente isto é em grandes amostras Portanto o teste J pode não ser muito poderoso no sentido estatístico em pequenas amostras pois tende a rejeitar a hipótese ou o modelo verdadei ro mais frequentemente do que deveria exeMplO 134 Despesas de consumo pessoal e renda pessoal disponível Para ilustrar o teste J considere os dados na tabela 133 que apresenta dados sobre as despesas de consumo pessoal per capita DCPC e a renda pessoal disponível per capita rPPC ambas medidas em dólares 2009 para os estados Unidos no período de 19702005 Considere os seguintes modelos rivais modelo a DCPCT D Æ1 C Æ2rPPCT C Æ3rPPCT1 C UT 1387 modelo B DCPCT D Ø1 C Ø2rPPCT C Ø3DCPCT1 C UT 1388 O modelo a estabelece que DCPC depende de rPPC nos períodos atual e anterior sendo um exemplo do que denominamos modelo de defasagens distribuídas veja o Capítu lo 17 O modelo B postula que DCPC depende de rPPC no período atual e de DCPC no período anterior o que o faz representar o que conhecemos como modelo autorregres sivo veja o Capítulo 17 Uma razão para a inclusão do valor defasado de DCPC é que o modelo visa refletir a inércia ou persistência dos hábitos Os resultados das estimativas separadas desses modelos foram 1389 13810 Continua 37 KmeNta Jan op cit p 597 ECONOBOOKParte02indb 489 23112010 072014 490 Parte Dois Relaxamento das hipóteses do modelo clássico exeMplO 134 Continuação Tabela 133 Despesas de consumo pessoal per capita DCPC e renda pessoal disponível per capita RPPC EUA 19702005 Fonte Economic Report of the President 2007 Se tivéssemos de escolher entre esses dois modelos com base na abordagem discri minatória usando o critério R2 mais elevado provavelmente escolheríamos o modelo B 13810 ambas as variáveis estatisticamente significativas enquanto no modelo a 1389 somente a rPPC atual é estatisticamente significativa mas pode haver proble ma de colinearidade Para fins de previsão não há muita diferença entre os dois valores R2 estimados Para aplicar o teste J suponha que o modelo a seja a hipótese nula ou o modelo man tido e o modelo B seja a hipótese alternativa Seguindo as etapas do teste J discutidas usamos os valores DCPC estimados do modelo 13810 como um regressor adicional no modelo a O resultado dessa regressão é o seguinte RPPC RPPC 13811 em que do lado direito da equação 13811 representa os valores estimados DCPC com base no modelo B original 13810 Uma vez que o coeficiente dessa variável é esta tisticamente significativo com um t estatístico de 1206 após o procedimento do teste J temos de rejeitar o modelo a em favor do modelo B agora suponhamos que o modelo B seja a hipótese mantida e o a seja a alternativa Se guindo exatamente o mesmo procedimento obtemos os seguintes resultados RPPC 13812 Continua ECONOBOOKParte02indb 490 23112010 072015 Capítulo 13 Modelagem econométrica especificação de modelo e teste diagnóstico 491 exeMplO 134 Continuação em que no lado direito da equação 13812 representa os valores estimados do modelo a original 1389 Nessa regressão o coeficiente de também é estatisti camente significativo com um t estatístico de 405 isso sugere que agora deveríamos rejeitar o modelo B em favor do a tudo isso nos diz que nenhum modelo é extremamente útil para explicar o comporta mento da despesa de consumo pessoal per capita nos estados Unidos durante o período 19702005 evidentemente consideramos apenas dois modelos concorrentes na realida de pode haver mais de dois O procedimento do teste J pode ser estendido para múltiplas comparações do modelo embora a análise possa tornarse complexa rapidamente este exemplo mostra de maneira clara por que o modelo clássico de regressão linear pressupõe que o modelo de regressão usado na análise seja corretamente especificado ao desenvolver um modelo é crucial prestar atenção ao fenômeno que está sendo modelado Outros testes para a seleção de modelos O teste J que discutimos é apenas um de um grupo de testes para seleção de modelo Há o teste Cox o teste JA e o teste P o teste abrangente de MizonRichard e variantes desses Evidentemen te não podemos discutir esses testes especializados mas o leitor poderá consultar as referências cita das nas várias notas de rodapé38 139 Critérios para seleção de modelos Nesta seção discutiremos vários critérios para escolher entre modelos concorrentes eou com parar modelos para fins de previsão Aqui vamos dintinguir entre a previsão dentro e fora da amostra A primeira diz basicamente como o modelo escolhido ajustase aos dados de determina da amostra A previsão fora da amostra procura determinar como um modelo ajustado prevê os valores futuros do regressando dados os valores dos regressores Vários critérios são usados para esse fim Discutiremos especialmente estes critérios 1 R2 2 R2 ajustado D R 2 3 critério de informação de Akaike CIA 4 critério de informação de Schwarz CIS 5 critério C p de Mallows e 6 previsão 2 quiquadrado Todos visam minimizar a soma dos quadrados dos resíduos SQR ou aumentar o valor de R2 Entretanto com exceção do primeiro os critérios 2 3 4 e 5 impõem um ônus por incluir um número cada vez maior de regressores Assim há um tradeoff entre a qualidade do ajuste do modelo e sua complexidade julgada pelo nú mero de regressores O critério R2 Sabemos que uma das medidas da qualidade do ajustamento de um modelo de regressão é R2 definido como 1391 R2 situase necessariamente entre 0 e 1 Quanto mais próximo de 1 melhor o ajustamento Mas o R2 apresenta problemas Primeiro ele mede a qualidade do ajustamento dentro da amostra no sentido da proximidade entre os valores estimados de Y e seu valor observado na amostra dada Não há garantia de que faça uma boa previsão das observações fora da amostra Um segundo problema é que na comparação de dois ou mais R2 a variável dependente ou regressando deve ser a mesma Terceiro e o mais importante um R2 não pode cair quando mais variáveis são acrescentadas ao mo delo Portanto sempre existe a tentação de maximizar o R2 acrescentando mais variáveis ao modelo Adicionar mais variáveis ao modelo pode aumentar R2 mas também pode aumentar a variância do erro de previsão 38 Veja também BaltaGi Badi h Econometrics Nova York Springer 1998 p 209222 ECONOBOOKParte02indb 491 23112010 072016 492 Parte Dois Relaxamento das hipóteses do modelo clássico R2 ajustado Como medida corretiva para compensar o efeito de adição de regressores que aumentam o valor de R2 Henry Theil desenvolveu o R2 ajustado denotado por R 2 que estudamos no Capítulo 7 Lem brese de que 1392 Como podemos ver dessa fórmula R 2 R2 mostra como o R2 ajustado corrige o acréscimo de regressores Como notamos no Capítulo 8 ao contrário do R2 o R2 ajustado aumentará apenas se o valor t absoluto da variável adicionada for maior que 1 Portanto para fins de comparação R 2 é uma medida melhor que R2 Mas novamente lembrese de que o regressando deve ser o mesmo para que a comparação seja válida Critério de informação de akaike Cia A ideia de impor uma medida corretiva pelo acréscimo de regressores ao modelo foi levada adian te no critério CIA definido como 1393 em que k é o número de regressores incluindo o intercepto e n é o número de observações Por con veniência matemática a Equação 1393 é escrita como 1394 em que ln CIA D logaritmo natural de CIA e 2kn D fator de correção Alguns textos e programas definem CIA apenas em termos de sua transformação logarítmica de modo que não há necessidade de colocar ln antes de CIA Como se vê na fórmula o critério de informação de Akaike impõe uma me dida corretiva mais dura que R 2 pelo acréscimo de regressores Ao compararmos dois ou mais mode los o modelo com o valor mais baixo de CIA é preferido Uma vantagem do CIA é que é útil não só dentro da amostra mas também fora dela prevendo o desempenho de um modelo de regressão Tam bém é útil tanto para modelos aninhados quanto não aninhados Ele também tem sido usado para de terminar a extensão da defasagem em um modelo ARp Critério de informação de Schwarz CiS Semelhante ao CIA o critério CIS é definido como 1395 ou na forma logarítmica n 1396 ECONOBOOKParte02indb 492 23112010 072017 Capítulo 13 Modelagem econométrica especificação de modelo e teste diagnóstico 493 em que kn ln n é o fator de correção O CIS impõe medidas corretivas mais duras que o CIA como fica evidente ao comparar a Equação 1396 com a 1394 Como o CIA quanto mais baixo o valor do CIS melhor o modelo Novamente como o CIA o CIS pode ser usado para comparar o desem penho do modelo quando as previsões são feitas dentro e fora da amostra O critério Cp de Mallows Supondo um modelo consistindo em k regressores inclusive o intercepto Seja æO2 como de costu me o estimador do verdadeiro æ2 Mas suponha que só escolhamos p regressores p k e obtemos a SQR da regressão usando esses p regressores Seja SQRp a soma dos quadrados dos resíduos com os p regressores Agora C P Mallows desenvolveu o seguinte critério para seleção de modelos co nhecido como critério Cp 1397 em que n é o número de observações Sabemos que E æO2 é um estimador não tendencioso do verdadeiro æ2 Se o modelo com p regres sores for adequado na medida em que não sofre da falta de ajustamento podese demonstrar39 que ESQRp D n pæ2 Em consequência é quase certo que 1398 Ao selecionarmos um modelo de acordo com o critério Cp procuramos um que tenha um valor baixo de Cp quase igual a p Em outras palavras seguindo o princípio da parcimônia selecionaremos um modelo com p regressores p k que se ajuste bem aos dados Na prática em geral representamos graficamente o Cp calculado da Equação 1397 contra p Um modelo adequado aparecerá como um ponto próximo da linha Cp D p como vemos na Figura 133 Essa figura mostra que o Modelo A pode ser preferível ao B pois está mais próximo da linha Cp D p que o Modelo B 39 DraPer Norman D Smith harry Applied regression analysis 3 ed Nova York John Wiley Sons 1998 p 332 Veja este livro para conhecer alguns exemplos elaborados de Cp Figura 133 Gráfico Cp de Mallows Cp p Cp p B A ECONOBOOKParte02indb 493 23112010 072018 494 Parte Dois Relaxamento das hipóteses do modelo clássico uma advertência sobre os critérios de seleção de modelos Discutimos vários critérios de seleção de modelos Porém eles devem ser considerados como um complemento aos vários testes de especificação discutidos neste capítulo Alguns dos critérios discu tidos são puramente descritivos e podem não ter propriedades teóricas consistentes Outros podem até dar abertura ao data mining No entanto são usados com tanta frequência que o leitor precisa estar atento Nenhum desses critérios é necessariamente superior aos demais40 A maioria dos programas de computador modernos inclui atualmente R2 R2 ajustado CIA e CIS O critério Cp de Mallows não costuma ser dado embora possa ser calculado facilmente por meio de sua definição previsão quiquadrado 2 Suponha um modelo de regressão embasado em n observações e que desejemos usálo para pre ver os valores médios do regressando de t observações adicionais Como mencionado convém re servar parte dos dados da amostra para verificar como o modelo estimado prevê as observações não incluídas na amostra o período pósamostra O teste de previsão do quiquadrado é definido como 1399 em que uOi é o erro de previsão feito para o período i D n C 1 n C 2 C n C t usando os parâme tros obtidos na regressão ajustada e os valores dos regressores no período pósamostra e æO2 é o esti mador de MQO para o æ2 com base na regressão ajustada Se por hipótese os valores dos parâmetros não mudaram entre os períodos amostral e pósamos tral podese constatar que a estatística dada na Equação 1399 segue a distribuição de quiquadra do com t graus de liberdade em que t é o número de períodos para o qual a previsão é feita Como observam Charemza e Deadman o teste de previsão 2 tem fraco poder estatístico o que significa que a probabilidade de rejeitar corretamente uma falsa hipótese nula é baixa e portanto deve ser usado como um indicador e não como um teste definitivo41 1310 Tópicos adicionais sobre modelagem econométrica Como observado na introdução deste capítulo o tópico da modelagem econométrica e dos testes de diagnósticos é tão extenso e evolui tanto que comporta livros especializados a respeito Na seção anterior tocamos em alguns dos principais pontos relativos a essa área Nesta seção abordaremos alguns aspectos adicionais que os pesquisadores podem considerar úteis na prática Particularmente consideraremos os seguintes tópicos 1 dados discrepantes alavancagem e influência 2 míni mos quadrados recursivos e 3 teste de falhas de previsão de Chow Examinaremos rapidamen te cada um desses tópicos Dados discrepantes alavancagem e influência42 Lembrese de que ao minimizar a soma dos quadrados dos resíduos SQR os MQO dão igual peso a todas as observações da amostra Mas nem toda observação pode ter igual influência nos re sultados de regressão devido à presença de três tipos especiais de dados pontuais chamados dados 40 Para uma discussão proveitosa veja DieBOlD Elements of forecasting 2 ed South Western Publishing 2001 p 8389 em resumo Diebold recomenda o critério CiS 41 CharemZa Wojciech W DeaDmaN Derek F New directions in econometric practice a general to specific mo delling cointegration and vector autoregression 2 ed edward elgar Publishers 1997 p 30 Veja também p 250252 para conhecer a opinião deles sobre os vários critérios de seleção de modelos 42 a discussão a seguir é influenciada por mUKherJee Chandan White howard WYUtS marc Econometrics and data analysis for developing countries Nova York routledge 1998 p 137148 ECONOBOOKParte02indb 494 23112010 072018 Capítulo 13 Modelagem econométrica especificação de modelo e teste diagnóstico 495 discrepantes pontos de alavancagem e pontos de influência É importante saber o que são eles e como influenciam a análise de regressão No contexto da regressão um dado discrepante pode ser definido como uma observação com um resíduo grande Lembrese de que uOi D Yi YOi isto é o resíduo representa a diferença positiva ou negativa entre o valor real do regressando e seu valor estimado do modelo de regressão Quando dizemos que um resíduo é grande estamos fazendo uma comparação com os outros resíduos e com frequência esses resíduos chamam a nossa atenção imediatamente devido a sua grande distância ver tical em relação à linha de regressão estimada Note que nos dados estabelecidos pode haver mais de um dado discrepante Já encontramos um exemplo disso no Exercício 1122 em que era pedido que se efetuasse a regressão da variação percentual dos preços das ações Y contra a variação nos preços ao consumidor X para uma amostra de 20 países Uma observação relativa ao Chile era um dado discrepante Dizemos que um dado pontual exerce grande alavancagem se estiver desproporcionalmente distante da maioria dos valores de um ou mais regressores Por que o ponto de alavancagem interes sa Porque ele é capaz de puxar a linha de regressão para si próprio distorcendo assim o coeficien te angular da linha de regressão Se isso acontecer de fato chamaremos tal ponto de alavancagem de dados de ponto de influência Remover esse ponto dos dados da amostra pode afetar fortemen te a linha de regressão Voltando ao Exercício 1122 o leitor verá que se fizer a regressão de Y contra X incluindo a observação do Chile o coeficiente angular será positivo e altamente significa tivo do ponto de vista estatístico Mas se excluirmos a observação relativa ao Chile o coeficiente angular será praticamente igual a zero Essa observação tem alavancagem e também é uma observa ção com influência Para esclarecer ainda mais a natureza dos dados discrepantes pontos de alavancagem e de influên cia considere o diagrama na Figura 134 que é autoexplicativo43 43 adaptado de FOX John Applied regression analysis linear models and related methods Califórnia Sage Publications 1997 p 268 Y X a Y X b Y X c Fonte adaptado de FOX john op cit p 268 Em cada um dos gráficos a linha cheia representa a linha de MQO para todos os dados e a linha pontilhada representa a linha de MQO excluindose um dado discrepante denotado por um Em a o dado discrepante está próximo do valor médio de X e tem baixa alavancagem e pouca influência sobre os coeficientes de regressão Em b o dado discrepante está distante do valor médio de X e tem alta alavancagem bem como uma influência substancial sobre os coeficientes de regressão Em c o dado discrepante tem alta alavancagem mas pouca influência sobre os coeficientes de regressão porque está de acordo com o restante das observações Figura 134 ECONOBOOKParte02indb 495 23112010 072019 496 Parte Dois Relaxamento das hipóteses do modelo clássico Como lidamos com esses pontos Deveríamos excluílos e concentrar nossa atenção nos dados remanescentes De acordo com Draper e Smith A rejeição automática de dados discrepantes nem sempre é um procedimento sensato Às vezes o dado discrepante está fornecendo informações que outros não podem fornecer devido ao fato de que ele decorre de uma combinação incomum de circunstâncias que podem ser de interesse vital e exigem mais investigação e não rejeição Como regra geral os dados discrepantes só devem ser rejeitados se pude rem ser atribuídos a causas como erros de registro das observações ou problemas de precisão de apare lhos em um experimento físico Caso contrário merecem investigação cuidadosa44 Que testes podem ser usados para detectar dados discrepantes e pontos de alavancagem Há vá rios testes discutidos na literatura específica mas não são abordados aqui porque estão além do es copo deste livro45 Programas como SHAZAM e MICROFIT têm rotinas para detectar dados discrepantes pontos de alavancagem e de influência Mínimos quadrados recursivos No Capítulo 8 examinamos a questão da estabilidade estrutural de um modelo de regressão envol vendo dados de séries temporais e mostramos como o teste Chow pode ser empregado com esta fi nalidade Você pode lembrar que naquele capítulo discutimos uma função de poupança simples poupança como função de renda para os Estados Unidos durante o período 19702005 Vimos que a relação entre poupança e renda provavelmente mudou por volta de 1982 Conhecendo o ponto de quebra estrutural conseguimos confirmar isso aplicando o teste Chow Mas o que acontece se não conhecemos o ponto ou pontos de quebra estrutural É nesse caso que podemos usar os mínimos quadrados recursivos MQR A ideia básica dos MQR é muito simples e pode ser explicada com a regressão da poupança contra a renda Yt D Ø1 C Ø2 Xt C ut em que Y D poupança e X D renda e a amostra é referente ao período 19702005 Veja os dados na Tabela 811 Suponha que usando primeiro os dados 19701974 estimamos a função poupança e obtemos as estimativas de Ø1 e Ø2 Então usamos os dados para 19701975 e estimamos novamente a função poupança obtendo as estimativas dos dois parâmetros Depois usamos os dados para 19701976 e estimamos novamente o modelo da poupança Dessa forma continuamos adicionando um dado de Y e X até esgotarmos toda a amostra Como podemos imaginar cada regressão dará um novo con junto de estimativas de Ø1 e Ø2 Se representarmos graficamente os valores estimados desses parâme tros contra cada iteração veremos como os valores dos parâmetros estimados alteramse Se o modelo considerado for estável do ponto de vista estrutural as alterações nos valores estimados dos dois pa râmetros serão pequenas e essencialmente aleatórias No entanto se os valores estimados dos parâmetros mudarem significativamente isso indicaria uma quebra estrutural Por isso o MQR é uma ferramenta útil de aplicar com dados de séries temporais já que o tempo é organizado cronolo gicamente Também é uma ferramenta diagnóstica útil em dados de corte transversal em que os da dos são ordenados por alguma variável de tamanho ou escala como o emprego ou o total dos ativos da empresa O Exercício 1330 pede a aplicação dos MQR aos dados de poupança apresenta dos na Tabela 811 44 DraPer Norman r Smith harry op cit p 76 45 Veja algumas fontes acessíveis reNCher alvin C Linear models in statistics Nova York John Wiley Sons 2000 p 219224 atKiNSON a C Plots transformations and regression an introduction to graphical methods of diagnostic regression analysis Nova York Oxford University Press 1985 cap 3 SeN ashis SriVaStaVa muni Regression analysis theory methods and applications Nova York SpringerVerlag 1990 cap 8 e FOX John op cit cap 11 ECONOBOOKParte02indb 496 23112010 072019 Capítulo 13 Modelagem econométrica especificação de modelo e teste diagnóstico 497 Programas como SHAZAM EViews e MICROFIT agora efetuam estimativas dos mínimos qua drados recursivos como rotina Os RELS também geram resíduos recursivos usados como base para vários testes diagnóticos46 Teste de falhas de previsão de Chow Já discutimos o teste da estabilidade estrutural de Chow no Capítulo 8 Chow mostrou que esse teste pode ser modificado para verificar o poder preditivo de um modelo de regressão Novamente vamos voltar à regressão da poupança contra a renda nos Estados Unidos para o período de 19701995 Imagine que estimamos a regressão para o período de 19701981 obtendo ØO17081 e ØO27081 que são os coeficientes de intercepto e angular estimados com base nos dados para o período de referên cia Empregando os valores observados da renda no período 19821995 e os valores de intercepto e angular para o período 19701981 prevemos os valores da poupança para cada um dos anos de 1982 a 1995 A lógica aqui é que se não houver uma grande mudança estrutural nos valores dos parâme tros os valores da poupança estimados para o período 19821995 com base nas estimativas dos parâ metros feitas no período anterior não deverão ser muito diferentes dos valores observados da poupança no período posterior Se houver uma grande diferença entre os valores observados e previs tos para o período posterior isso causará dúvidas sobre a estabilidade da relação entre poupança e renda para todo o período Para sabermos se a diferença entre o valor observado e o estimado da poupança é grande ou pe quena podemos efetuar o teste F como se segue 13101 em que n1 D número de observações no primeiro período 19701981 que foi tomado como base na regressão inicial n2 D número de observações no segundo período ou de previsão SQR quando a equação é estimada para todas as observações n1 C n2 e quando a equação é estimada para as primeiras n1 observações e k é o número de parâmetros estimados dois no caso Se os erros tiverem em distribuição normal de forma independente e idêntica a estatística F dada na Equação 13101 segue a distribuição F com n2 e n1 graus de liberdade respectivamente No Exercí cio 1331 pedese a aplicação do teste de falhas de previsão de Chow para verificar se a relação entre a poupança e a renda foi de fato alterada A propósito note a semelhança entre esse teste e o de pre visão 2 examinado anteriormente Dados faltantes No trabalho aplicado não é incomum descobrir que às vezes faltam observações nos dados amos trais Por exemplo nos dados de séries temporais pode haver lacunas decorrentes das circunstâncias especiais Durante a Segunda Guerra Mundial dados sobre variáveis macro não eram disponíveis nem publicados por razões estratégicas Em dados de corte tranversal não é raro constatar que faltam informações sobre alguns indivíduos principalmente em dados coletados de pesquisas feitas com questionários Também em dados obtidos de painéis com o tempo alguns entrevistados deixam de responder ou de fornecer informações a todas as perguntas Qualquer que seja a razão a falta de dados é um problema que todo pesquisador enfrenta de vez em quando A questão é como lidar com isso Há uma maneira de imputar valores às observações que faltam Essa não é uma pergunta fácil de responder Embora haja soluções elaboradas sugeridas na litera tura específica não trataremos delas aqui por serem muito complexas47 No entanto discutiremos 46 Para detalhes veja JOhNStON Jack DiNarDO John Econometric methods 4 ed Nova York mcGrawhill 1997 p 117121 47 Para um tratamento completo mas bastante avançado do assunto veja CamerON a Colin triVeDi Pravin K Microeconometrics methods and applications Nova York Cambridge University Press 2005 cap 27 p 923941 ECONOBOOKParte02indb 497 23112010 072020 498 Parte Dois Relaxamento das hipóteses do modelo clássico dois casos48 No primeiro as razões para os dados que faltam são independentes das observações disponíveis chamadas por Darnell de caso ignorável Na segunda situação além de dados disponí veis incompletos as observações que faltam podem estar sistematicamente relacionadas com os da dos disponíveis Esse é um caso mais sério pois pode resultar do viés de autosseleção os dados observados não são de fato coletados aleatoriamente No caso ignorável podemos apenas ignorar as observações que faltam e usar aquelas que estão disponíveis A maioria dos programas estatísticos faz isso automaticamente Desse modo o tamanho da amostra será reduzido e podemos não ser capazes de obter estimativas exatas dos coeficientes de regressão Poderíamos usar os dados disponíveis no entanto para esclarecer as observações que faltam Consideraremos três possibilidades 1 De um número total de observações de N temos dados completos sobre N1 N1 N tanto para o regressando quanto para os k regressores denotados por Y1 e X1 respectivamente Y1 é vetor de N1 observações e X1 é um vetor linha com k regressores 2 Para algumas observações N2 N há dados completos sobre o regressando denotados por Y2 mas observações incompletas sobre alguns X2 novamente estes são vetores 3 Para algumas observações N3 N não há dados sobre Y mas dados completos sobre X denotados por X3 No primeiro caso a regressão de Y1 sobre X1 produzirá estimativas dos coeficientes de regressão que são não tendenciosos mas podem não ser eficientes porque ignoramos as observações N2 e N3 As outras duas situações são bastante complicadas e deixamos para o leitor consultar as referências para as soluções49 1311 Exemplos conclusivos Concluímos este capítulo com dois exemplos que ilustram um ou mais pontos aqui abordados O primeiro deles sobre determinação de salário usa dados de corte transversal e o segundo que consi dera a função consumo real para os EUA usa dados de série temporal 1 um modelo para determinação de salário por hora Para examinarmos quais os fatores que determinam o salário por hora vamos considerar um mo delo baseado em Mincer que se tornou conhecido entre os economistas do trabalho Esse modelo tem a seguinte forma50 13111 em que ln salário D logaritmo natural do salário por hora Edu D anos de escolaridade Exp D ex periência no mercado de trabalho Fe D 1 se for mulher 0 caso contrário NW D 1 se não for branco 0 caso contrário UN D 1 se for sindicalizado 0 caso contrário e WK D 1 trabalhadores que não recebem por hora 0 caso contrário Para os trabalhadores que não recebem por hora o salário por hora é calcu lado como os ganhos semanais divididos pelo número de horas trabalhadas Outras variáveis poderiam ser adicionadas a esse modelo Algumas delas são origem étnica esta do civil número de filhos com menos de 6 anos e riqueza ou renda obtida que não do trabalho Por ora trabalharemos com o modelo da Equação 13111 48 a discussão a seguir baseiase em DarNell adrian C A dictionary of econometrics lyne reino Unido edward elgar Publishing 1994 p 256258 49 além das referências já citadas veja aFiFi a a elaShOFF r m missing observations in multivariate statistics Journal of the American Statistical Association 1967 v 61 p 5956041966 e v 62 p 1029 50 Veja miNCer J School experience and earnings Nova York Columbia University Press 1974 ECONOBOOKParte02indb 498 23112010 072020 Capítulo 13 Modelagem econométrica especificação de modelo e teste diagnóstico 499 Os dados consistem em 1289 pessoas entrevistadas em março de 1985 como parte da Current Population Survey CPS um levantamento conduzido periodicamente pelo US Census Bureau órgão que realiza o censo demográfico nos Estados Unidos Esses dados foram coletados original mente por Paul Rudd51 A priori poderíamos esperar ter uma influência positiva nos salários As variáveis binárias Fe e NW devem ter um impacto negativo nos salários se houver um tipo de discriminação e esperase que UN tenha um impacto positivo em virtude da incerteza da renda Quando todas as variáveis binárias tiverem um valor de zero a Equação 13111 reduzse a 13112 que é a função salário para um trabalhador branco do gênero masculino não sindicalizado que ganha por hora Essa é a categoria de base de referência Agora vamos apresentar os resultados de regressão e discutilos A primeira observação a fazer é que todos os coeficientes estimados são individualmente alta mente significativos pois os pvalores são muito baixos A estátisca F também é muito alto sugerin do que coletivamente todas as variáveis são importantes do ponto de vista estatístico Em comparação ao trabalhador tomado como referência o salário médio de uma trabalhadora e de um trabalhador não branco é mais baixo Os trabalhadores sindicalizados e aqueles que recebem por semana ganham em média salários mais altos Em que medida esse modelo é adequado 13111 tendo em vista as variáveis que consideramos É possível que mulheres não brancas que trabalham ganhem menos que as mulheres brancas É pos sível que mulheres não brancas e não sindicalizadas ganhem menos que as mulheres brancas e não sindicalizadas Em outras palavras há qualquer efeito interativo entre os regressores quantitativos e as variáveis binárias 51 rUDD Paul a An introduction to classical econometric theory Nova York Oxford University Press 2000 Não incluímos dados sobre idade porque são altamente colineares com a experiência de emprego Tabela 134 Resultados da regressão no EViews com base na Equação 13111 ECONOBOOKParte02indb 499 23112010 072021 500 Parte Dois Relaxamento das hipóteses do modelo clássico Os programas de estatística têm rotinas para responder a essas perguntas Por exemplo o EViews tem esse recurso Depois de estimar um modelo se você achar que algumas variáveis podem ser adi cionadas ao modelo mas não tem certeza da importância delas faça o teste de variáveis omitidas Para tanto suponha que a Equação 13111 tenha sido estimada e agora queiramos descobrir se os produtos de Fe e NW FE e UN e FE e WK deveriam ser adicionados ao modelo para levar em conta a interação entre as variáveis explanatórias Usando a rotina do EViews 6 obtemos a seguinte resposta a hipótese nula é que essas três variáveis adicionadas não têm efeito no modelo estimado Como poderíamos suspeitar podemos usar o teste F discutido no Capítulo 8 para avaliar a con tribuição incremental ou marginal das variáveis adicionadas e testar a hipótese nula Para nosso exemplo os resultados são os seguintes Não rejeitamos a hipótese nula de que a interação entre mulhernão branca mulhersindicato e mulhertrabalhadores que ganham salários por semana coletivamente não tenha impacto significati vo no modelo estimado dado na Tabela 134 pois o valor F estimado de 08053 não é estatisticamen te significativo com pvalor cerca de 49 Deixamos isso para o leitor tentar outras combinações dos regressores para avaliar sua contri buição ao modelo original Antes de prosseguir o modelo 13111 sugere que a influência da experiência sobre o logaritmo dos salários é linear isto é mantendo as demais variáveis constantes o aumento relativo nos salários lembrese de que o regressando está na forma logarítmica permanece o mesmo para o acréscimo de cada ano na experiência profissional Essa hipótese pode ser verdadeira com alguns anos de ex periência mas como a economia do trabalo sugere à medida que os trabalhadores ficam mais ve lhos a proporção de aumento nos salários diminui Para verificarmos se esse é o caso em nosso exemplo adicionamos o termo de experiência elevado ao quadrado ao nosso modelo inicial e obti vemos os seguintes resultados Tabela 135 Resultados parciais com o EViews usando interações Tabela 136 Resultados do EViews com a experiência elevada ao quadrado ECONOBOOKParte02indb 500 23112010 072022 Capítulo 13 Modelagem econométrica especificação de modelo e teste diagnóstico 501 O termo de experiência elevado ao quadrado não só é negativo mas também é altamente signifi cativo do ponto de vista estatístico Ele está de acordo com o comportamento do mercado de trabalho com o tempo a taxa de crescimento de salários desacelera Aproveitamos esta oportunidade para discutir os critérios de Akaike e Schwarz Como o R2 esses são os testes da qualidade do ajustamento do modelo estimado a diferença é que sob o critério R2 quanto mais alto for o seu valor mais o modelo explica o comportamento do regressando Por outro lado sob os cri térios de Akaike e Schwarz quanto mais baixo for o valor dessas estatísticas melhor será o modelo Todos esses critérios fazem sentido se queremos comparar dois ou mais modelos Se você com parar o modelo da Tabela 134 com o da Tabela 136 que tem a experiência elevada ao quadrado como um regressor adicional verá que o modelo na Tabela 136 é preferível ao da 134 com base nos três critérios A propósito note que em ambos os modelos os valores de R2 parecem baixos mas estes valo res baixos são observados tipicamente nos dados de corte transversal com um grande número de observações No entanto note que esse valor baixo de R2 é significativo estatisticamente em am bos os modelos a estatística F calculada é altamente significativa lembrese da relação entre F e R2 discutida no Capítulo 8 Vamos continuar com o modelo estendido da Tabela 136 Embora pareça satisfatório explo raremos alguns pontos Primeiro uma vez que estamos lidando com dados de corte transversal há chances de que o modelo sofra de heterocedasticidade Logo precisamos descobrir se esse é o caso Aplicamos vários dos testes de heterocedasticidade discutidos no capítulo 11 e descobrimos que o modelo de fato sofre de heterocedasticidade O leitor deveria verificar essa afirmação Para fazermos a correção para a heterocedasticidade observada podemos obter os erros padrão consistentes para heterocedasticidade de White discutidos no Capítulo 11 Os resultados estão na tabela a seguir Como esperávamos há algumas mudanças nos erros padrão estimados tomados individual e coletivamente ao explicarmos o comportamento dos salários relativos Tabela 137 Resultados do EViews usando a correção de White dos erros padrão ECONOBOOKParte02indb 501 23112010 072023 502 Parte Dois Relaxamento das hipóteses do modelo clássico Agora vamos examinar se os termos de erro são normalmente distribuídos O histograma dos re síduos obtidos do modelo na Tabela 137 é apresentado na Figura 135 A estatística de JarqueBera JB rejeita a hipótese de distribuição normal dos erros pois é alta e o pvalor é praticamente zero observe que para uma variável normalmente distribuída os coeficien tes de simetria e curtose são respectivamente 0 e 3 E então Nosso procedimento de teste da hipótese até aqui consistiu no pressuposto de que o termo de erro no modelo de regressão apresenta distribuição normal Isso significa que não podemos usar legitimamente os testes t e F para verificar as hipóteses na regressão do salário A resposta é não Como notado no capítulo os estimadores MQO são distribuídos assintoticamen te com o caveat observado no capítulo a saber que o termo de erro tem variância finita é homocedás tico e o valor médio do termo de erro dados os valores das variáveis explanatórias é zero Como resultado podemos continuar a usar os testes usuais t e F contanto que a amostra seja razoavelmente grande A propósito podese observar que não precisamos da hipótese de normalidade para obter os estimadores MQO Mesmo sem a hipótese de normalidade os estimadores MQO são os melhores es timadores não tendenciosos MELNT sob as condiçoes do teorema de GaussMarkov Qual o tamanho da amostra Não há resposta definitiva para essa pergunta mas o tamanho da amostra de 1289 observações na regressão de salários parece ser razoavelmente grande Há dados discrepantes em nossa regressão de salários Podese ter uma ideia disso por meio do gráfico da Figura 136 que apresenta os valores observado e estimado da variável Figura 135 Histograma dos resíduos obtidos da regressão na Tabela 137 320 200 240 280 160 120 80 40 0 125 00 125 250 375 500 Séries Resíduos Amostra 11289 No observações 1289 Média 938e09 Mediana 0850280 Máximo 4892719 Mínimo 2058590 Desv padrão 6324574 Simetria 1721323 Curtose 1072500 JarqueBera 3841617 Probabilidade 0000000 Figura 136 Resíduos versus valores estimados da variável dependente logaritmo do salário 300 250 500 750 1000 1250 20 10 10 20 0 30 40 50 Logaritmo do salário estimado Resíduos ECONOBOOKParte02indb 502 23112010 072023 Capítulo 13 Modelagem econométrica especificação de modelo e teste diagnóstico 503 dependente ln salário e os resíduos que são diferenças entre os valores observado e estimado do regressando Embora o valor médio dos resíduos seja sempre zero por quê o gráfico na Figura 136 mos tra que há vários resíduos que parecem grandes em valor absoluto comparados à maioria dos resíduos É possível que haja dados discrepantes nos dados Fornecemos as estatísticas primárias sobre as três variáveis quantitativas na Tabela 138 para ajudar o leitor a decidir se de fato há da dos discrepantes Tabela 138 2 Função de consumo real para os estados unidos 19472000 No Capítulo 10 consideramos a função de consumo para os Estados Unidos para o período de 19472000 A forma específica da função de consumo que consideramos foi Interest 13113 em que TC YD W e Interest são respectivamente cosumo total a renda disponível pessoal a rique za além da taxa de juros tudo em termos reais Os resultados baseados em nossos dados são os seguintes Tabela 139 Resultados da equação de regressão 13113 ECONOBOOKParte02indb 503 23112010 072024 504 Parte Dois Relaxamento das hipóteses do modelo clássico Já que TC YD e riqueza entram na forma logarítmica os coeficientes angulares de YD e riqueza são respectivamente elasticidades da renda e riqueza Como era de esperar essas elasticidades são positivas e altamente significativas em termos estatísticos Numericamente as elasticidades renda e riqueza são cerca de 080 e 020 O coeficiente da variável taxa de juros representa a semielasticidade por quê Mantendo as demais variáveis constantes os resultados mostram que se a taxa de juros subir em 1 ponto percentual a despesa real de consumo descerá em cerca de 027 Note que a se mielasticidade estimada também é altamente significativa em termos estatísticos Veja o resumo de alguns dados estatísticos O valor de R2 é muito alto chegando a quase 100 O valor de F também é altamente significativo em termos estatísticos sugerindo que não só indivi dualmente mas também de maneira coletiva todas as variáveis explanatórias têm um impacto signi ficativo nas despesas de consumo Entretanto a estatística de DurbinWatson sugere que há uma correlação serial entre os erros no modelo Se consultarmos as tabelas de DurbinWatson Tabela D5 no Apêndice D vemos que para 55 observações o número mais próximo de 54 e três variáveis explanatórias os valores críticos d são 1452 e 1681 Como o valor d observado em nosso exemplo 12892 está abaixo dos valores críticos de d podemos concluir que os erros em nossa função de consumo estão correlacionados po sitivamente Essa não deveria ser uma constatação surpreendente na maioria das vezes as regressões em série temporais apresentam autocorrelação Antes de aceitarmos essa conclusão vamos descobrir se há erros de especificação Como sabe mos às vezes a autocorrelação pode ser evidente porque omitimos algumas variáveis importantes Para tanto consideraremos a regressão obtida na Tabela 1310 Tabela 1310 A variável adicional nesse modelo é a interação dos logaritmos da renda e riqueza disponíveis Esse termo de interação é altamente significativo Agora a variável juros tornouse menos significati va pvalor de cerca de 8 embora tenha o sinal negativo Mas o valor d de DurbinWatson aumen tou de cerca de 128 para cerca de 153 Os valores críticos a 5 de significância agora são 1378 e 1721 O valor d observado 153 situase entre esses valores sugerindo que com base na estatística de DurbinWatson não podemos determi nar se temos ou não autocorrelação Entretanto o valor d observado está mais próximo do limite su perior Como visto no capítulo sobre autocorrelação alguns autores sugerem usar o limite superior da estatística d aproximadamente como o verdadeiro limite de significância se o valor d calculado ECONOBOOKParte02indb 504 23112010 072025 Capítulo 13 Modelagem econométrica especificação de modelo e teste diagnóstico 505 estiver abaixo do limite superior há evidência de autocorrelação positiva Por esse critério no exem plo podemos concluir que nosso modelo sofre de autocorrelação positiva Também aplicamos o teste de autocorrelação de BreuschGodfrey discutido no Capítulo 12 Adicionando os dois termos defasados dos resíduos estimados na Equação 12615 ao modelo na Tabela 139 obtemos os seguintes resultados Tabela 1311 O F reportado no topo da tabela testa a hipótese de que os dois resíduos defasados no mode lo têm valores iguais a zero Essa hipótese é rejeitada porque o F é significativo ao nível apro ximado de 5 Para resumir parece haver autocorrelação no termo de erro Podemos aplicar um ou mais procedimentos discutidos no Capítulo 12 para remover a autocorrelação Para pouparmos espa ço deixamos essa tarefa ao leitor Na Tabela 1312 relatamos os resultados da análise de regressão que apresentam os erros padrão de NeweyWest ou CHA que levam em conta a autocorrelação O tamanho de nossa amostra de 54 observações é grande o suficiente para usar os erros padrão CHA Se você comparar esses resultados com os da Tabela 139 observará que os coeficientes de regressão permanecem os mesmos mas os erros padrão são um pouco diferentes Neste capítulo discutimos o teste de falha de previsão de Chow Temos um período amostral que se estende de 1947 a 2000 Nesse período tivemos vários ciclos de negócio a maioria de curta dura ção Por exemplo houve uma recessão em 1990 e outra em 2000 O comportamento das despesas de consumo em relação à renda riqueza e taxa de juros é diferente durante as recessões Para elucidarmos a questão vamos considerar a recessão de 1990 e aplicar o teste de falha de previsão de Chow Os detalhes desse teste já foram discutidos no capítulo Usando o teste de falha na previsão de Chow na versão 6 do EViews obtemos os resultados da Tabela 1313 ECONOBOOKParte02indb 505 23112010 072026 506 Parte Dois Relaxamento das hipóteses do modelo clássico Tabela 1312 Tabela 1313 Teste de falha de previsão de Chow O F estatístico dado na parte superior da Tabela 1313 sugere que provavelmente não há diferença substancial na função de consumo pré e pós 1990 pois seu pvalor não é significativo ao nível de 5 Mas se escolhermos o nível de significância de 10 o valor F será estatisticamente significativo Podemos examinar esse problema de um modo diferente No Capítulo 8 discutimos um tes te de estabilidade de parâmetro Para verificarmos se há qualquer alteração estatisticamente significativa nos coeficientes de regressão da função de consumo usamos o teste Chow discuti do na Seção 87 do Capítulo 8 e obtivemos os resultados da Tabela 1314 ECONOBOOKParte02indb 506 23112010 072026 Capítulo 13 Modelagem econométrica especificação de modelo e teste diagnóstico 507 Parece que a função consumo pré e pós 1990 é estatisticamente diferente pois o F estatístico calculado seguindo a Equação 874 é altamente significativo em termos estatísticos porque o pvalor é de apenas 00052 O leitor é incentivado a aplicar os testes de previsão de falhas e de estabilidade de Chow para determinar se a função consumo pré e pós 2000 mudou Para tanto você terá de ir além dos dados de 2000 Observe também que para aplicar esses testes o número de observações deve ser maior que o número de coeficientes estimados Esgotamos todos os testes diagnósticos que podemos aplicar aos nossos dados de consumo mas a análise fornecida até aqui deve dar uma boa ideia sobre como podemos aplicar os diversos testes 1312 Erros não normais e regressores estocásticos Nesta seção discutiremos dois tópicos de natureza avançada a distribuição não normal do termo de erro e regressores estocásticos ou aleatórios e sua importância prática 1 O que acontece se o termo de erro não tem distribuição normal No modelo clássico de regressão linear normal MCRLN discutido no Capítulo 4 supusemos que o termo de erro u segue a distribuição normal Recorremos ao teorema central do limite TCL para justificar a hipótese de normalidade Devido a essa hipótese conseguimos estabelecer que os estimadores MQO também são normalmente distribuídos Como resultado conseguimos fazer o tes te de hipótese usando os testes t e F independentemente do tamanho da amostra Também discutimos o emprego dos testes de normalidade JarqueBera e AndersonDarling para verificar se os erros estimados são distribuídos normalmente em qualquer aplicação prática O que acontece se os erros não são normalmente distribuídos Podemos dizer que os estima dores MQO ainda são MELNT isto é eles são não tendenciosos e na categoria de estimadores lineares que mostram variância mínima Isso não deveria surpreender pois para estabelecer o teorema de GaussMarkov BLUE não precisamos da hipótese de normalidade Então qual é o problema O problema é que precisamos de distribuições amostrais ou de probabilidade dos estimadores de MQO Sem isso não podemos abraçar qualquer teste de hipótese relativo aos verdadeiros valo res desses estimadores Como é mostrado nos Capítulos 3 e 7 os estimadores MQO são funções lineares da variável dependente Y e o próprio Y é uma função linear do termo de erro estocástico u supondo que as variáveis explanatórias sejam não estocásticas ou fixas na amostragem repetida Por fim precisamos da distribuição probabilística de u Como foi notado o modelo clássico de regressão linear normal MCRLN pressupõe que o termo de erro siga a distribuição normal com média zero e variância constante Usando o teorema central do limite TCL para justificar a normalidade do termo de erro conseguimos mostrar que os próprios estimadores MQO têm distribuição normal com médias e variância discutidas nos Capítulos 4 e 7 Isso por sua vez permitiu usar as estatísticas t e F no teste de hipótese em amostras pequenas ou finitas bem como em amostras grandes O papel da hipótese de normalidade é fundamental princi palmente em amostras pequenas Tabela 1314 Teste da estabilidade de parâmetro de Chow ECONOBOOKParte02indb 507 23112010 072027 508 Parte Dois Relaxamento das hipóteses do modelo clássico Mas e se não pudermos manter a hipótese de normalidade com base nos vários testes de normali dade Temos duas opções A primeira é o método de reamostragem bootstrapping e a segunda é recorrer à teoria de amostras grandes ou propriedades assintóticas Uma discussão do método de reamostragem que está sendo assimilada gradualmente pela econo metria nos distanciará do assunto deste livro A ideia básica do método de reamostragem é utilizar ou regurgitar determinada amostra várias vezes e obter as distribuições amostrais dos parâmetros de interesse estimadores MQO para nossa finalidade O leitor poderá consultar as referências para sa ber como isso é feito na prática52 A propósito o termo bootstrapping bootstrap é a tira atrás da bota ou lingueta que se puxa para calçála é usado em expressão popular na língua inglesa e quer dizer melhorar na vida à custa de seu próprio esforço A outra abordagem para lidar com termos de erro não normais consiste em usar a teoria de amos tras grandes ou assintótica O Apêndice 3A7 do Capítulo 3 deu uma ideia desse assunto em que mostramos que os estimadores MQO são consistentes Como discutido no Apêndice A um estima dor é consistente se aborda o valor verdadeiro do estimador à medida que o tamanho da amostra au menta veja a Figura A11 no Apêndice A Mas como isso nos ajuda a testar a hipótese Ainda podemos usar os testes t e F Podemos mos trar que sob as hipóteses de GaussMarkov os estimadores MQO têm distribuição assintótica nor mal com médias e variâncias discutidas nos Capítulos 4 e 753 Como resultado os testes t e F desenvolvidos sob a hipótese da normalidade são aproximadamente válidos em amostras grandes A aproximação tornase boa à medida que o tamanho da amostra cresce54 2 Variáveis explanatórias estocásticas No Capítulo 3 introduzimos o modelo clássico de regressão linear em parâmetro sob alguns pres supostos simplificadores Um deles foi que as variáveis explanatórias ou regressores eram fixas ou não estocásticas ou se estocásticas eram independentes do termo de erro Chamamos o primeiro caso de regressor fixo e o segundo de regressor aleatório No caso do regressor fixo já conhecemos as propriedades dos estimadores de MQO veja os Capí tulos 5 e 8 No caso do regressor aleatório se procedermos com o pressuposto de que nossa análise é condicional aos valores dados dos regressores as propriedades dos estimadores de MQO que estuda mos sob o caso do regressor fixo deverão ser válidas Se no caso do regressor aleatório supusermos que esses regressores e o termo de erro são distribuídos independentemente os estimadores de MQO ainda serão não tendenciosos mas perderão a eficiência55 A situação fica complicada quando o termo de erro não é normalmente distribuído ou os regres sores são estocásticos ou ambos Nesse caso é difícil fazer qualquer afirmação geral a respeito das propriedades de amostras finitas dos estimadores de MQO Entretanto sob certas condições pode mos invocar o teorema do limite central para estabelecer os estimadores de MQO de normalidade assintótica Embora as demonstrações estejam além do escopo deste livro podem ser encontradas em outras fontes56 52 Para uma discussão informal veja mOONeY Christopher Z DUVal robert D Bootstrapping a nonparametric approach to statistical inference Sage Califórnia University Press 1993 Para uma discussão formal veja DaViDSON russell maCKiNNON James G Econometric theory and methods Nova York Oxford University Press 2004 p 159166 53 lembre das hipóteses de Gaussmarkov a saber o valor esperado do termo de erro é zero o termo de erro e cada uma das variáveis explanatórias são independentes a variância do erro é homocedástica e não há auto correlação no termo de erro também se pressupõe que a matriz de variânciacovariância das variáveis expla natórias seja finita relaxamos a condição de independência entre o termo de erro e os regressores e supomos a condição mais fraca de que elas não são correlacionadas 54 a prova da normalidade assintótica dos estimadores mQO está além do escopo deste livro Veja StOCK James h WatSON mark W Introduction to econometrics 2 ed Boston Pearsonaddison Wesley 2007 p 710711 55 Para detalhes técnicos veja GreeNe William h Econometric analysis 6 ed Nova Jersey PearsonPrenticehall 2008 p 4950 56 Veja GreeNe op cit ECONOBOOKParte02indb 508 23112010 072027 Capítulo 13 Modelagem econométrica especificação de modelo e teste diagnóstico 509 1313 Uma palavra ao pesquisador Este capítulo tratou de muitas questões Não há dúvida de que a construção de modelos seja uma arte e também uma ciência Um pesquisador prático pode ficar perplexo diante das sutilezas teóricas e de tantas ferramentas diagnósticas Mas vale lembrar da advertência de Martin Feldstein de que o profissional que lida com econometria aplicada como o teórico logo descobre pela experiência que um modelo útil não é aquele verdadeiro ou realista mas aquele que é parcimonioso plausível e informativo57 Peter Kennedy da Simon Fraser University no Canadá defende os dez mandamentos da econo metria aplicada58 1 Usarás senso comum e a teoria econômica 2 Deverás fazer as perguntas certas colocar a relevância à frente da elegância matemática 3 Conhecerás o contexto não realizarás análise estatística sem conhecimento 4 Examinarás os dados 5 Não adorarás a complexidade Usarás o princípio KISS isto é manterás tudo estocastica mente simples do inglês keep it stochastically simple 6 Examinarás demoradamente e com rigor os resultados 7 Estarás atento aos custos de data mining 8 Estarás disposto a conciliar não venerarás as prescrições dos manuais 9 Não confundirás significância com substância não confundirás significância estatística com significância prática 10 Na presença de questões delicadas farás tua confissão deverás anteciparse às críticas Se desejar o leitor poderá ler o artigo de Kennedy para entender a convicção que o leva a defender os dez mandamentos Alguns deles podem parecer irônicos mas há certa verdade em cada um Resumo e conclusões 1 O pressuposto do modelo clássico de regressão linear de que o modelo econométrico usado na análise está corretamente especificado tem dois sentidos Um deles é que não há erros de especi ficação da equação e o segundo é que não há erros de especificação do modelo Neste capítulo o foco principal foi nos erros de especificação da equação 2 Os erros de especificação da equação examinados neste capítulo foram 1 omissão de uma ou mais variáveis importantes 2 inclusão de uma variável supérflua 3 adoção da forma funcional equivocada 4 especificação incorreta do termo de erro ui e 5 erros de medida no regressando e regressores 3 Quando se omitem do modelo variáveis legítimas as consequências são muito graves os estimadores de MQO das variáveis mantidas no modelo não apenas são tendenciosos mas também inconsistentes Além disso as variâncias e os erros padrão dessas variáveis são calculados de forma incorreta tornando ineficientes os procedimentos habituais de teste de hipóteses 4 As consequências da inclusão de variáveis irrelevantes no modelo felizmente são menos graves os estimadores dos coeficientes de variáveis relevantes e também irrelevantes con tinuam sendo não tendenciosos e consistentes e a variância do erro æ2 continua sendo esti mada corretamente O único problema é que as variâncias estimadas tendem a ser maiores 57 FelDSteiN martin S inflation tax rules and investment some econometric evidence Econometrica v 30 1982 p 829 58 KeNNeDY Peter op cit p 1718 ECONOBOOKParte02indb 509 23112010 072027 510 Parte Dois Relaxamento das hipóteses do modelo clássico que o necessário resultando em estimativa menos exata dos parâmetros Os intervalos de confiança tendem a ser maiores que o necessário 5 Para detectarmos os erros de especificação da equação consideramos vários testes como 1 o exame dos resíduos 2 a estatística de DurbinWatson 3 o teste RESET de Ramsey e 4 o teste do multiplicador de Lagrange 6 Um tipo especial de erro de especificação referese à medição dos valores do regressando e dos regressores Se há erros de medição apenas no regressando os estimadores de MQO continuam não tendenciosos e consistentes mas tornamse menos eficientes Se há erros de medição nos regressores os estimadores de MQO passam a ser tendenciosos e incon sistentes 7 Mesmo que se suspeite ou detecte erros de medição as soluções não costumam ser fáceis O uso de variáveis proxy ou instrumentais é teoricamente atraente mas nem sempre é prático Por isso é muito importante na prática que o pesquisador seja cuidadoso quanto às fontes dos dados que emprega como eles foram coletados que definições foram usadas etc Dados coletados por agências oficiais com frequência vêm com várias notas de rodapé e o pesqui sador deve chamar a atenção do leitor para elas 8 Os erros de especificação do modelo podem ser tão sérios quanto os de especificação da equação Em particular distinguimos entre modelos aninhados e não aninhados Para decidir quanto ao modelo adequado discutimos o teste F não aninhado ou abrangente o teste F e o teste J de DavidsonMacKinnon e apontamos as limitações de cada teste 9 A escolha de modelos empíricos em pesquisas práticas resulta em um variedade de critérios Discutimos alguns deles como os critérios de informação de Akaike e de Schwarz o critério Cp de Mallows e o critério de previsão 2 Discutimos as vantagens e desvantagens desses critérios e também advertimos o leitor de que esses critérios não são absolutos mas sim complementares a uma cuidadosa análise de especificação 10 Também examinamos os seguintes tópicos adicionais 1 dados discrepantes alavancagem e influência 2 mínimos quadrados recursivos e 3 teste de falhas de previsão de Chow Abordamos o papel de cada um no trabalho aplicado 11 Discutimos rapidamente dois casos especiais a não normalidade do termo de erro estocásti co e regressores aleatórios e o papel da teoria de amostras grandes ou assintóticas em situa ções em que as propriedades de amostras pequenas ou finitas dos estimadores de MQO não podem ser estabelecidas 12 Concluímos o capítulo apresentando os dez mandamentos da econometria aplicada de Peter Kennedy Esses mandamentos têm por objetivo levar o pesquisador a ir além dos aspectos puramente técnicos da econometria exerCíCiOS 131 Retome a função de demanda para frangos estimada na Equação 8623 Considerando os atri butos de um bom modelo discutido na Seção 131 você poderia dizer que essa função de deman da está especificada corretamente 132 Suponha que o modelo verdadeiro seja 1 mas em vez de se ajustar a essa regressão passando pela origem ajustamos o modelo usual com o intercepto 2 Avalie as consequências deste erro de especificação ECONOBOOKParte02indb 510 23112010 072028 Capítulo 13 Modelagem econométrica especificação de modelo e teste diagnóstico 511 133 Continue com o Exercício 132 mas suponha que o modelo 2 seja o verdadeiro Discuta as consequências de se ajustar o modelo 1 com erro de especificação 134 Suponha que o modelo verdadeiro seja 1 mas que acrescentamos uma variável irrelevante X3 ao modelo irrelevante no sentido de que o verdadeiro coeficiente Ø3 ligado à variável X3 seja zero e estimamos 2 a R2 e o R2 ajustado para o modelo 2 seriam maiores que aqueles para o modelo 1 b As estimativas de Ø1 e Ø2 obtidas do modelo 2 são não tendenciosas c A inclusão da variável irrelevante X3 afetou as variâncias de ØO1 e ØO2 135 Considere a seguinte função de produção CobbDouglas verdadeira em que Y D produção L1 D mão de obra na produção L2 D mão de obra fora da produção K D capital Mas suponha que a regressão usada na pesquisa aplicada seja Supondo que tenham sido usados dados de corte transversal relaticos às variáveis relevantes a EØO1 D Æ1 e EØO2 D Æ3 b A resposta dada em a será válida se soubermos que L2 é um insumo irrelevante na função de produção Mostre as derivações necessárias 136 Retorne às Equações 1334 e 1335 Como se pode ver ÆO2 embora tendenciosa tem uma variância menor que ØO2 que é não tendenciosa Qual seria sua decisão diante do tradeoff entre tendenciosidade e variância menor Dica o EQM erro quadrático médio para os dois estimadores é expresso como Sobre o EQM veja o Apêndice A 137 Mostre que o Ø estimado da Equação 1351 ou da 1353 fornece uma estimativa não tendencio sa do verdadeiro Ø 138 De acordo com a hipótese da renda permanente de Friedman podemos escrever 1 em que Y i D despesas de consumo permanentes e X i D renda permanente Em vez de observarmos as variáveis permanentes observamos Capítulo 13 Modelagem econométrica especificação de modelo e teste diagnóstico 511 ECONOBOOKParte02indb 511 23112010 072029 512 Parte Dois Relaxamento das hipóteses do modelo clássico em que Yi e Xi são as quantidades que podem ser observadas ou medidas e ui e vi são erros de medição em Y e X respectivamente Usando as quantidades observáveis podemos escrever a função de consumo como 2 Supondo que 1 Eui D Evi D 0 2 var ui D æ2 u e var vi D æ2 v 3 cov Y i ui D 0 cov X i vi D 0 e 4 cov ui X i D cov vi Y i D cov ui vi D 0 mostre que em grandes amostras o Ø estimado da Equação 2 pode ser expresso como plim a O que você pode dizer sobre a natureza do viés em ØO b Se o tamanho da amostra aumentar indefinidamente o Ø estimado tenderá a igualarse ao verdadeiro Ø 139 Modelo de formação de preços de ativos com risco O modelo de formação de preços de ativos com risco CAPM da moderna teoria do investimento postula a seguinte relação entre a taxa média de retorno de um título ação medida em determinado período e a volatilidade do tí tulo chamada de coeficiente beta a volatilidade como medida de risco 1 em que R i D taxa média de retorno do título i Øi D verdadeiro coeficiente beta do título i ui D termo de erro estocástico O verdadeiro Øi não é diretamente observável mas é medido como se segue 2 em que rit D taxa de retorno do título i para o período t rmt D taxa de retorno de mercado para o período t esta é a taxa de retorno para algum índi ce de mercado amplo como o índice SP para títulos de empresas industriais et D termo residual e Ø é uma estimativa do verdadeiro coeficiente beta Na prática em vez de estimar a Equa ção 1 estimase 3 em que Ø i são obtidos da regressão 2 Mas uma vez que os Ø i são estimados a relação entre o verdadeiro Ø e Ø pode ser escrita como 4 em que vi pode ser chamado erro de medida 512 Parte Dois Relaxamento das hipóteses do modelo clássico ECONOBOOKParte02indb 512 23112010 072031 Capítulo 13 Modelagem econométrica especificação de modelo e teste diagnóstico 513 a Qual será o efeito desse erro de medida na estimativa de Æ2 b O Æ2 estimado da Equação 3 fornece uma estimativa não tendenciosa do verdadeiro Æ2 Se não fornecer será uma estimativa consistente de Æ2 Se não for que medidas corretivas você sugere 1310 Considere o modelo 1 Para descobrir se o modelo tem erro de especificação por omitir a variável X3 do modelo você decide regredir os resíduos obtidos do modelo 1 somente na variável X3 Nota há um intercepto nesta regressão O teste do multiplicador de Lagrange ML no entanto exige que se efetue a regressão dos resíduos do modelo 1 contra X2 e X3 e uma constante Por que é provável que este procedimento seja inadequado 1311 Considere o modelo Na prática medimos X i por Xi tal que a Xi D X i C 5 b Xi D 3X i c Xi D X i C i em que i é um termo puramente aleatório com as propriedade usuais Qual será o efeito desses erros de medida sobre a estimativa dos verdadeiros Ø1 e Ø2 1312 Retorne às Equações 1331 e 1332 De uma maneira semelhante à Equação 1333 mostre que em que b3 2 é o coeficiente angular na regressão da variável omitida X3 contra a variável incluída X2 1313 Avalie criticamente a seguinte opinião de Leamer Meu interesse em metaestatística a teoria da inferência que decorre realmente dos dados vem de minhas observações do trabalho dos economistas A opinião de que a teoria econométrica é irrele vante é mantida pela maioria dos economistas É esperado que a ampla lacuna entre a teoria e a prática econométrica cause tensão nos profissionais De fato um equilíbrio permeia nossos encon tros profissionais e publicações Estamos tranquilamente divididos entre um clero celibatário de estatísticos teóricos de um lado e uma legião de analistas de dados pecadores inveterados de ou tro Os padres têm o poder de dizer o que é pecado e são reverenciados por seus dons Não se espe ra que os pecadores evitem pecar eles só precisam confessar francamente seus erros 1314 Avalie a seguinte afirmação de Henry Theil Dados os conhecimentos atuais o procedimento mais sensato é fazer uma interpretação não rigo rosa dos coeficientes de confiança e dos limites de significância quando se calculam intervalos de confiança e testes estatísticos por meio da regressão final da forma convencional Isto é um coe ficiente de confiança de 95 pode na verdade ser um coeficiente de 80 e um nível de signifi cância de 1 pode ser um nível de 10 Capítulo 13 Modelagem econométrica especificação de modelo e teste diagnóstico 513 Veja maDDala op cit p 477 leamer edward e Specification searches ad hoc inference with Nonexperimental Data Nova York John Wiley Sons 1978 p vi theil henry Principles of econometrics Nova York John Wiley Sons 1971 p 605606 ECONOBOOKParte02indb 513 23112010 072032 514 Parte Dois Relaxamento das hipóteses do modelo clássico 1315 Comentando os métodos econométricos praticados na década de 1950 e início dos anos 1960 Blaug afirmou grande parte dela da pesquisa aplicada é como jogar tênis com a rede abaixada em lugar de tentar refutar as previsões comprováveis os economistas modernos ficam muito frequentemente sa tisfeitos em demonstrar que o mundo real conformase às suas previsões substituindo assim a falsifi cação a la Popper o que é difícil pela fácil verificação Você concorda com essa opinião Pode ser interessante consultar o livro de Blaug para en tender melhor a visão dele 1316 De acordo com Blaug não existe uma lógica da comprovação mas sim da refutação O que ele quis dizer com isso 1317 Consulte o modelo de St Louis discutido no texto Lembrando dos problemas associados ao teste F aninhado avalie criticamente os resultados apresentados na regressão 1384 1318 Suponha que o verdadeiro modelo seja 3 4 mas que se tenha estimado Se forem usadas as observações de Y em X D 3 2 1 0 1 2 3 e estimado o modelo incorreto que viés resultará nessas estimativas 1319 Para ver se a variável X 2 i pertence ao modelo Yi D Ø1 C Ø2 Xi C ui o teste RESET de Ramsey estimaria o modelo linear obtendo os valores estimados de Yi com base neste modelo YOi D ØO1 C ØO2 Xi e então estimaria o modelo Yi D Æ1 C Æ2 Xi C Æ3YO 2 i C vi e testaria a signi ficância de Æ3 Demonstre que se ÆO3 for estatisticamente significativo na equação an terior RESET isto seria equivalente a estimar o seguinte modelo diretamente Dica Substitua por YOi na regressão RESET 1320 Indique se estas afirmações são verdadeiras ou falsas a Uma observação pode ser influente sem constituir um dado discrepante b Uma observação pode ser um dado discrepante sem ser influente c Uma observação pode ser tanto um dado discrepante quanto influente d Se no modelo for estatisticamente significativo deve mos reter o termo linear Xi mesmo que ØO2 seja estatisticamente insignificante e Se estimarmos o modelo Yi D Ø1 C Ø2 X2i C Ø3 X3i C ui ou Yi D Æ1 C Ø2x2i C Ø3x3i C ui por MQO a linha de regressão estimada será a mesma em que x2i D exercícios aplicados 1321 Use os dados do Exercício 719 relativos à demanda de frangos Suponha que lhe digam que a verdadeira função de demanda é 1 514 Parte Dois Relaxamento das hipóteses do modelo clássico BlaUG m The methodology of economics Or how economists explain Nova York Cambridge University Press 1980 p 256 ibid p 14 adaptado de SeBeir G a F Linear regression analysis Nova York John Wiley Sons 1977 p 176 adaptado de Peterson Kerry op cit p 184185 adaptado de DraPer Norman r Smith harry op cit p 606607 ECONOBOOKParte02indb 514 23112010 072033 Capítulo 13 Modelagem econométrica especificação de modelo e teste diagnóstico 515 mas você discorda e calcula a seguinte função de demanda 2 em que Y D consumo per capita de frango libraspeso X2 D renda real disponível per capita X3 D preço do frango no varejo X6 D preço real composto de carnes que substituem o frango a Efetue os testes RESET e ML de erros de especificação supondo que a função de de manda 1 dada seja a verdadeira b Suponha que ØO6 na Equação 1 seja estatisticamente insignificante Isso indica que não há erro de especificação se ajustarmos a Equação 2 aos dados c Se ØO6 for insignificante isso indica que não deveríamos introduzir o preço de um ou mais produtos substitutos como argumento na função de demanda 1322 Continue o Exercício 1321 Estritamente para fins pedagógicos suponha que o modelo 2 seja a verdadeira função de demanda a Se agora estimarmos o modelo 1 que tipo de erro de especificação será cometido nes te caso b Quais as consequências teóricas desse erro de especificação Ilustre com os dados dis poníveis 1323 O modelo verdadeiro é 1 mas devido aos erros de medida estimados 2 em que Yi D Y i C i e Xi D X i C wi em que i e wi são erros de medida Usando os dados da Tabela 132 documente as consequências de estimar o modelo 2 em vez de o modelo verdadeiro 1 1324 Experimento de Monte Carlo Dez indivíduos tinham as seguintes rendas semanais perma nentes 200 220 240 260 280 300 320 340 380 e 400 O consumo permanente Y i estava relacionado com a renda permanente X i como 1 Cada um desses indivíduos tinha renda transitória igual a 100 vezes um número aleatório ui tirado de uma população normal com média D 0 e æ2 D 1 isto é variável normal padrão Suponha que não haja componente transitório no consumo O consumo medido e o consu mo permanente são iguais a Extraia 10 números aleatórios de uma população normal com média zero e variância unitária e obtenha 10 números para a renda medida Xi D X i C 100ui b Estime a regressão do consumo permanente D observado contra a renda observada usando os dados obtidos em a e compare seus resultados com os da Equação 1 A priori o intercepto deveria ser zero por quê É esse o caso Por quê c Repita a 100 vezes e obtenha 100 regressões como mostrado em b e compare seus resultados com a verdadeira regressão 1 Que conclusões gerais você tira Capítulo 13 Modelagem econométrica especificação de modelo e teste diagnóstico 515 adaptado de DOUGhertY Christopher Introduction to econometrics Nova York Oxford University Press 1992 p 253256 ECONOBOOKParte02indb 515 23112010 072034 516 Parte Dois Relaxamento das hipóteses do modelo clássico 516 Parte Dois Relaxamento das hipóteses do modelo clássico 1325 Retome o Exercício 826 Com as definições das variáveis dadas lá considere os seguin tes modelos para explicar Y Usando o teste F aninhado como você escolheria entre os dois modelos 1326 Continue com o Exercício 1325 Usando o teste J como você decidiria entre os dois mo delos 1327 Retorne ao Exercício 719 relacionado à demanda de frango nos Estados Unidos Nele fo ram apresentados cinco modelos a Qual a diferença entre o modelo 1 e o modelo 2 Se o modelo 2 estiver correto e você estimar o modelo 1 que tipo de erro cometerá Que teste aplicaria a equação de erro de especificação ou o erro de seleção de modelo Mostre os cálculos necessários b Entre os modelos 1 e 5 qual você escolheria Que testes usaria e por quê 1328 Retorne à Tabela 811 que apresenta os dados sobre poupança pessoal Y e renda pessoal disponível X para o período de 19702005 Agora considere os seguintes modelos Como você faria a escolha entre esses dois modelos Descreva com clareza os procedimen tos de teste a serem usados e mostre todos os cálculos Suponha que alguém afirme que a variável taxa de juros pertença à função de poupança Como você testaria isso Faça coleta dos dados de Letras do Tesouro durante três meses como um proxy para os juros e apresen te a demonstração de sua resposta 1329 Use os dados do Exercício 1328 Para familiarizarse com os mínimos quadrados recursi vos estime a função de poupança para 19701981 19701985 19701990 e 19701995 Comente sobre a estabilidade dos coeficientes estimados nas funções de poupança 1330 Continue com o Exercício 1329 mas agora use os dados atualizados na Tabela 810 a Suponha que você faça uma estimativa da função de poupança para 19701981 Usando os parâmetros estimados e os dados da renda pessoal disponível de 19822000 calcule a pou pança prevista para o último período e use o teste de falha de previsão para descobrir se ele rejeita a hipótese de que a função de poupança entre os dois períodos de tempo não mudou b Agora estime a função de poupança para os dados de 20002005 Compare os resultados da função para o período 19822000 usando o mesmo método teste de falhas de previsão de Chow Há mudança significativa na função de poupança entre os dois períodos 1331 Omissão de uma variável no modelo de regressão com k variáveis Consulte a Equação 1333 que mostra o viés na omissão da variável X3 do modelo Yi D Ø1 C Ø2X2i C Ø3 X3i C ui Isso pode ser generalizado como se segue no modelo de k variáveis Yi D Ø1 C Ø2 X2i C C Øk Xki C ui suponha que a variável Xk seja omitida Então podese demonstrar que o viés decorrente da omissão da variável no coeficiente angular da variável incluída Xj é em que bkj é o coeficiente angular parcial de Xj na regressão auxiliar da variável excluída Xk em todas as variáveis explanatórias incluídas no modelo Retome o Exercício 1321 Descubra o viés dos coeficientes na Equação 1 se excluirmos a variável ln X6 do modelo Essa exclusão é grave Mostre os cálculos necessários isso pode ser generalizado para o caso em que mais de uma variável relevante X seja excluída do modelo Sobre isso veja mUKherJee Chandan et al op cit p 215 ECONOBOOKParte02indb 516 23112010 072035 Capítulo 13 Modelagem econométrica especificação de modelo e teste diagnóstico 517 Capítulo 13 Modelagem econométrica especificação de modelo e teste diagnóstico 517 Apêndice 13A 13a1 a prova de que Eb1 2 D Ø2 C Ø3 b3 2 Na forma de desvio o modelo de regressão populacional com três variáveis pode ser escrito como 1 Primeiro multiplicando por x2 e então por x3 as equações normais usuais são 2 3 Dividindo a Equação 2 por em ambos os lados obtemos 4 Agora relembrando que A Equação 4 pode ser escrita como 5 Tomando o valor esperado da Equação 5 em ambos os lados obtemos 6 em que usamos os fatos de que a para uma dada amostra b32 é uma quantidade conhecida fixa b Ø2 e Ø3 são constantes e c ui não está correlacionado com X2i nem com X3i 13a2 Consequências de incluir uma variável irrelevante a propriedade de não tendenciosidade Para o verdadeiro modelo 1336 temos 1 e sabemos que ele não é tendencioso Para o modelo 1337 obtemos 2 3 ECONOBOOKParte02indb 517 23112010 072038 518 Parte Dois Relaxamento das hipóteses do modelo clássico 518 Parte Dois Relaxamento das hipóteses do modelo clássico Substituindo yi do modelo 3 no modelo 2 e simplificando obtemos 4 isto é ÆO2 permanece não tendencioso Também obtemos 5 Substituindo yi do modelo 3 no modelo 5 e simplificando obtemos 6 que é seu valor no modelo verdadeiro já que X3 está ausente do modelo verdadeiro 13a3 a prova da equação 13510 Temos 1 2 Portanto na forma de desvio temos 3 4 Agora quando usamos 5 obtemos Como não podemos subtrair as expectativas dessa expressão pois a expectativa da razão entre duas variáveis não é igual à razão de suas expectativas Nota o operador de expectativas E é linear primeiro dividimos cada termo do numerador e do denominador por n e tomamos o limite de probabilidade plim veja o Apêndice A para detalhes do plim de ECONOBOOKParte02indb 518 23112010 072040 Capítulo 13 Modelagem econométrica especificação de modelo e teste diagnóstico 519 Capítulo 13 Modelagem econométrica especificação de modelo e teste diagnóstico 519 Agora o limite de probabilidade da razão de duas variáveis é a razão de seus limites de probabilidade Aplicando essa regra e tomando o plim de cada termo obtemos plim em que æ2 X e æ2 w são variâncias de X e de w quando o tamanho da amostra aumenta indefinidamente e usamos o fato de que enquanto o tamanho da amostra aumenta indefinidamente não há correlação entre os erros u e w bem como entre eles e o verdadeiro X Da expressão anterior obtemos plim que é o resultado exigido 13a4 a prova da equação 1362 Uma vez que não há intercepto no modelo a estimativa de Æ de acordo com a fórmula da regressão que passa pela origem é a seguinte 1 Substituindo Y do modelo verdadeiro 1328 obtemos 2 A teoria estatística mostra que ln ui N 0 æ2 então ª 3 Portanto em que se usa o fato de que os X são não estocásticos e cada ui tem um valor esperado de eæ22 Como EÆO Ø ÆO é um estimador tendencioso de Ø ECONOBOOKParte02indb 519 23112010 072041 521 Tópicos em econometria Na Parte 1 introduzimos o modelo clássico de regressão linear com todas as suas hipóteses Na Parte 2 examinamos detalhadamente as consequências que se seguem quando uma ou mais dessas hipóteses não são satisfeitas e o que pode ser feito nessa situação Na Parte 3 estudaremos algumas técnicas econométricas selecionadas e bastante aplicadas Examinaremos principalmente os seguintes tópicos 1 modelos de regressão não linear nos parâmetros 2 modelos de regressão de resposta qualitativa 3 modelos de regressão com dados em painel e 4 modelos econométricos dinâmicos No Capítulo 14 veremos modelos intrinsecamente não lineares nos parâmetros Com a grande disponibilidade de programas especializados não há mais dificuldade para estimar esses modelos Embora os cálculos matemáticos possam assustar alguns leitores as ideias básicas dos modelos de regressão não linear nos parâmetros podem ser explicadas intuitivamente Este capítulo mostra com auxílio de exemplos adequados como esses modelos podem ser estimados e interpretados No Capítulo 15 trataremos de modelos de regressão cuja variável dependente é de natureza qua litativa Esse capítulo complementa portanto o Capítulo 9 em que examinamos os modelos em que as variáveis explanatórias eram de natureza qualitativa O objetivo básico do Capítulo 15 é a formu lação de modelos em que o regressando é do tipo sim ou não Como os MQO impõem vários proble mas à estimativa de tais modelos foram elaboradas diversas alternativas Aqui trataremos de duas delas os modelos logit e probit Também examinaremos diversas variantes dos modelos de escolha qualitativa como o modelo Tobit e o modelo de regressão de Poisson Discutiremos ainda breve mente algumas extensões de tais modelos como o probit ordenado o logit ordenado e o logit multinomial No Capítulo 16 discutiremos os modelos de regressão com dados em painel Estes combinam observações de séries temporais e de corte transversal Embora ao combinarmos essas observações aumentemos o tamanho da amostra os modelos de regressão lançam vários desafios para sua estima ção No Capítulo 16 examinaremos apenas os aspectos essenciais e daremos orientações para os leitores aprofundarem esse estudo No Capítulo 17 trataremos dos modelos de regressão que incluem valores atuais e passados ou defasados das variáveis explanatórias bem como os que incluem um ou mais valores defasados da variável dependente como uma das variáveis explanatórias Estes são denominados respectivamente modelos com defasagens distribuídas e modelos autorregressivos Embora sejam extremamente úteis na econometria empírica apresentam alguns problemas de estimação especiais por não segui rem uma ou mais das hipóteses do modelo clássico de regressão Consideramos esses problemas no contexto dos modelos de Koyck de expectativas adaptativas EA e de ajustamento parcial Também destacaremos as críticas feitas ao modelo EA pelos defensores da chamada escola das expectativas racionais ER 3 Parte ECONOBOOKParte02indb 521 23112010 072041 523 Modelos de regressão não linear A principal ênfase deste livro é nos modelos de regressão linear ou seja modelos com parâmetros lineares eou que possam ser transformados de modo que tenham parâmetros lineares No entanto em certas ocasiões as razões teóricas ou empíricas levamnos a considerar modelos não lineares nos parâmetros1 Neste capítulo veremos esses modelos e suas características especiais 141 Modelos de regressão intrinsecamente linear e não linear Quando começamos nossa discussão de modelos de regressão linear no Capítulo 2 afirmamos que neste livro nos ocuparíamos basicamente dos modelos de regressão linear nos parâmetros poden do ter ou não variáveis não lineares Se voltarmos à Tabela 23 veremos que um modelo que é linear nos parâmetros e nas variáveis é de regressão linear do mesmo modo que um modelo linear nos pa râmetros mas não nas variáveis Por outro lado se o modelo é não linear nos parâmetros ele será de regressão não linear nos parâmetros mesmo se as variáveis forem lineares ou não Porém é preciso estar atento pois alguns modelos podem parecer não lineares nos parâmetros mas são inerente ou intrinsecamente lineares porque com as devidas transformações podem tor narse modelos de regressão linear nos parâmetros Mas se eles não puderem ser linearizados nos parâmetros serão denominados modelos de regressão intrinsecamente não linear De agora em diante ao falar de modelos de regressão não linear estaremos considerando que sejam modelos de regressão intrinsecamente não linear Nós os chamaremos de MRINL Para deixar bem clara a distinção entre os dois retomaremos os Exercícios 26 e 27 No primeiro deles os modelos a b e c são de regressão linear porque ele são todos lineares nos parâmetros O modelo d é uma mistura pois Ø2 é linear mas ln Ø1 não é Mas se fazemos Æ D In Ø1 então esse modelo é linear em Æ e Ø2 No Exercício 27 os modelos d e e são de regressão intrinsecamente não linear pois não há uma maneira simples de tornálos lineares O modelo c é obviamente o de uma regressão linear Mas e os modelos a e b Tirando os logaritmos dos dois lados de a obtemos ln Yi D Ø1 C Ø2 Xi C ui que é linear nos parâmetros Portanto o modelo a é um modelo de regressão intrinsecamente linear O modelo b é um exemplo da função de distribuição de probabilidade logística e será estudado no Capítulo 15 Aparentemente tratase de um modelo de regressão não linear mas um simples artifício matemático consegue transformálo em um modelo de regressão linear a saber 1 Observamos no Capítulo 4 que sob a premissa de normalidade do termo de erro os estimadores de mQO não são apenas os melhores estimadores lineares não tendenciosos melNt mas também os melhores estimadores não tendenciosos em toda a classe de estimadores lineares ou não mas se não seguirmos a premissa da nor malidade é possível como ressaltam Davidson e mcKinnon obter estimadores não lineares eou tendenciosos que podem ter melhor desempenho que os estimadores de mQO Veja DaViDSON russell maCKiNNON Ja mes G Estimation and inference in econometrics Nova York Oxford University Press 1993 p 161 Capítulo 14 ECONOBOOKParte02indb 523 23112010 072042 524 Parte três Tópicos em econometria 1411 Portanto o Modelo b é intrinsecamente linear Veremos a utilidade de modelos como a Equação 1411 no próximo capítulo Agora considere a função de produção CobbDouglas CD Sendo Y D produção X2 D insu mo trabalho e X3 D insumo capital escreveremos esta função de três maneiras diferentes 1412 ou 1412a em que Æ D ln Ø1 Assim neste formato a função CD é intrinsecamente linear Agora considere esta versão da função CD 1413 ou 1413a em que Æ D ln Ø1 Este modelo também é linear nos parâmetros Mas agora considere a seguinte versão da função CD 1414 Como notamos as versões CD 1412a e 1413a são modelos de regressão intrinsecamente linear nos parâmetros mas não há como transformar a Equação 1414 de modo que o modelo transfor mado possa tornarse linear nos parâmetros2 Portanto a Equação 1414 é intrinsecamente um modelo de regressão não linear Outra função conhecida mas intrinsecamente não linear é a função de produção com elasticidade de substituição constante CES sendo a função CobbDouglas um caso especial A função CES tem a seguinte forma 1415 em que Y D produção K insumo capital L D insumo trabalho A parâmetro de escala D parâmetro de distribuição 0 1 Ø D parâmetro de substituição Ø 13 Não importa de que forma o termo de erro estocástico ui é incluído nesta função de produção não há como tornála um modelo de regressão linear nos parâmetros é intrinsecamente um modelo de regressão não linear 142 Estimação dos modelos de regressão linear e não linear Para entender a diferença entre a estimação dos modelos de regressão linear e não linear consi dere os seguintes modelos 1421 1422 2 Se tentarmos transformar o modelo em logaritmo ele não funcionará porque ln A C B in A C in B 3 Para propriedades da função de produção CeS veja iNtriliGatOr michael D BODKiN ronald hSiaO Cheng Econometric models techniques and applications 2 ed Prentice hall 1996 p 294295 ECONOBOOKParte02indb 524 23112010 072044 Capítulo 14 Modelos de regressão não linear 525 A esta altura sabemos que a Equação 1421 é um modelo de regressão linear enquanto a Equa ção 1422 é não linear A regressão 1422 é conhecida como modelo de regressão exponencial sendo muitas vezes empregada para medir o crescimento de uma variável como a população o PIB ou a oferta de moeda Suponha que desejemos estimar os parâmetros desses dois modelos pelos mínimos quadrados ordinários Os MQO minimizarão a soma dos quadrados dos resíduos SQR que no caso do modelo 1421 é 1423 em que como de costume ØO1 e ØO2 são os estimadores de MQO dos verdadeiros Ø Diferenciando a expressão anterior em relação às duas incógnitas obtemos as equações normais apresentadas nas Equações 314 e 315 Resolvendo as equações simultaneamente obteremos os estimadores de MQO dados nas Equações 316 e 317 Observe atentamente que nessas equações as incógnitas Ø estão do lado esquerdo e os valores conhecidos X e Y do lado direito Como resultado obtemos as soluções explícitas para os dois termos Agora vejamos o que acontece se tentarmos minimizar as SQR da Equação 1422 Como é apresentado no Apêndice 14A Seção 14A1 as equações normais que correspondem às Equações 314 e 315 são as seguintes 1424 1425 Ao contrário das equações normais do modelo de regressão linear as do modelo não linear apre sentam incógnitas os ØO dos dois lados das equações Em consequência não podemos obter soluções explícitas para as incógnitas com base nos valores conhecidos Em outras palavras as incógnitas es tão expressas em termos delas mesmas e dos dados Embora possamos aplicar o método dos mínimos quadrados para estimar os parâmetros dos modelos de regressão não linear não podemos obter solu ções explícitas para as incógnitas Devemos mencionar que os MQO aplicados aos modelos de re gressão não linear são conhecidos como mínimos quadrados não lineares MQNL E agora qual a solução É o que veremos a seguir 143 Estimação de modelos de regressão não linear o método da tentativa e erro Para começarmos vejamos um exemplo concreto Os dados da Tabela 141 relacionam as taxas de administração que um importante fundo mútuo dos Estados Unidos paga a seus agentes de inves timentos pela gestão dos ativos Essas taxas dependem do valor líquido dos ativos do fundo Como se vê quanto mais elevado o valor líquido dos ativos do fundo menores são as taxas de administração de acordo com a Figura 141 Para entendermos como o modelo de regressão exponencial na Equação 1422 ajusta os dados da tabela 141 podemos prosseguir por meio de tentativa e erro Imagine que inicialmente façamos Ø1 D 045 e Ø2 D 001 Esses valores são puros palpites às vezes com base em experiência anterior ou em trabalho empírico anterior ou obtidos pelo ajustamento de um modelo de regressão linear embora ele possa não ser adequado Neste estágio não precisamos ficar preocupados com a maneira como os dados foram obtidos Como conhecemos os valores de Ø1 e Ø2 podemos escrever a Equação 1422 como 1431 ECONOBOOKParte02indb 525 23112010 072044 526 Parte três Tópicos em econometria Portanto 1432 Como Y X Ø1 e Ø2 são conhecidos podemos encontrar facilmente a soma dos quadrados dos erros na Equação 14324 Lembrese de que nos MQO nosso objetivo é encontrar os valores dos parâmetros desconhecidos que tornam a soma dos quadrados dos resíduos a menor possível Isso acontecerá se os valores estimados de Y do modelo forem o mais próximos possível dos valores observados de Y Com os valores dados obtemos Mas como sabemos que obtivemos a menor soma possível dos erros que podemos obter O que acontece se escolhermos outro valor para Ø1 e Ø2 por exemplo 050 e 001 respectivamente Repetindo o procedimento que acabamos de expor verificamos que agora obtemos Obviamente essa soma dos quadrados dos erros é muito menor que a obtida anteriormente igual a 03044 Mas como sabemos que conseguimos a menor soma dos quadrados dos erros possível se ao escolhermos outro conjunto de valores para os Ø obteremos ainda outra soma dos quadrados dos erros Como vemos esse processo de tentativa e erro ou iterativo pode ser implementado facil mente E se tivéssemos tempo e paciência infinitos o processo de tentativa e erro poderia pro 4 Note que chamamos 2 iu de a soma dos quadrados dos erros e não como usualmente de a soma dos qua drados dos resíduos porque estamos supondo que os valores dos parâmetros sejam conhecidos Tabela 141 Taxas de assessoria cobradas e montante dos ativos Taxa Ativo representa o valor líquido do ativo em bilhões de dólares FIGURa 141 Relação de taxas de assessoria e os ativos de fundo 0360 10 20 30 40 Ativos de fundo em bilhões de dólares 50 60 70 040 044 048 Taxas 052 056 CAP14indd 526 23112010 085738 Capítulo 14 Modelos de regressão não linear 527 duzir valores de Ø1 e Ø2 capazes de garantir a menor soma possível dos quadrados dos erros Mas poderíamos perguntar como passamos de Precisamos de algum tipo de algoritmo que nos indique como passamos de um conjunto de valo res das incógnitas para outro até parar Felizmente esses algoritmos estão disponíveis e serão discu tidos na próxima seção 144 Abordagens para estimar modelos de regressão não linear MRNL Há vários procedimentos ou algoritmos para estimar os MRNLs 1 a busca direta ou tentativa e erro 2 a otimização direta e 3 a linearização iterativa5 Método da busca direta ou da tentativa e erro ou método livre de derivada Na seção anterior mostramos o funcionamento deste método Embora seja intuitivamente atraen te por não exigir o recurso a métodos de cálculo como os outros em geral ele não é usado Primeiro se um modelo de regressão intrinsecamente não linear envolve vários parâmetros o método tornase muito trabalhoso e dispendioso em termos de recursos computacionais Por exemplo se um modelo de regressão intrinsecamente não linear envolve 5 parâmetros e 25 valores alternativos para cada um deles será necessário calcular a soma dos quadrados dos erros 255 D 9765625 vezes Em segundo lugar não há garantia de que o conjunto final de valores dos parâmetros que for selecionado propor cionará a soma dos quadrados dos erros absolutamente mínima Na linguagem de cálculo é possível obter um mínimo local não absoluto Na verdade nenhum método garante a obtenção de um mínimo geral Otimização direta Na otimização direta derivamos a soma dos quadrados dos erros em relação a cada coeficiente ou parâmetro desconhecido igualamos a zero a equação resultante e resolvemos simultaneamente as equações normais resultantes Já vimos isso nas Equações 1424 e 1425 Mas como elas mos tram não podem ser resolvidas explícita ou analiticamente Fazse necessário algum procedimento iterativo Um deles é o chamado método da descida mais íngreme que não será examinado em detalhes pois é muito complexo mas o leitor interessado encontrará sugestões de leitura nas referên cias Como o método da tentativa e erro o da descida mais íngreme também recorre a valores iniciais provisórios dos parâmetros desconhecidos mas depois tornase mais sistemático que o da tentativa e erro Uma de suas desvantagens é que pode ser extremamente demorado para chegar aos valores fi nais dos parâmetros Método da linearização iterativa Neste método linearizamos uma equação não linear em torno de alguns valores iniciais dos parâmetros A equação linea rizada é então estimada por MQO e os valores escolhidos inicialmente são ajustados Esses valores ajustados são usados para relinearizar o modelo e novamente o estima mos por MQO e reajustamos os valores estimados O processo continua até que não haja mais alte rações substanciais nos valores estimados a partir das últimas iterações A principal técnica usada para a linearização de uma equação não linear é a expansão de séries de Taylor do cálculo Na Seção 5 a discussão a seguir teve como fontes as seguintes obras PiNDYCK robert S rUBiNFelD Daniel l Econometric models and economic forecasts 4 ed Nova York mcGrawhill 1998 cap 10 DraPer Norman r Smith harry Applied regression analysis 3 ed John Wiley Sons 1998 cap 24 GOlDBerGer arthur S A course in econometrics harvard University Press 1991 cap 29 DaViDSON russell maCKiNNON James op cit p 201207 FOX John Applied regression analysis linear models and related methods Sage Publications 1997 p 393400 e GallaNt ronald Nonlinear statistical models John Wiley and Sons 1987 ECONOBOOKParte02indb 527 23112010 072046 528 Parte três Tópicos em econometria 14A2 do Apêndice 14A mostraremos alguns detalhes básicos do método A estimação do modelo de regressão intrinsecamente não linear é sistematizada em dois algoritmos conhecidos como o método iterativo de GaussNewton e o método iterativo de NewtonRaphson Como um ou ambos os mé todos já estão incorporados a vários programas de computador e uma vez que o exame de seus detalhes nos levaria muito além do escopo deste livro não há necessidade de examinálos detidamente6 Na próxima seção examinaremos alguns exemplos que empregam esses métodos7 145 Exemplos ilustrativos exeMplO 141 Taxas de assessoria em fundos mútuos Consulte os dados da tabela 141 e o mriNl 1422 Por meio da rotina de regressão não linear do eViews 6 que usa o método de linearização7 obtemos os seguintes resultados de regressão os coeficientes seus erros padrão e seus valores t são apresentado em forma tabular Variável Coeficiente erro padrão Valor t pValor intercepto 05089 00074 682246 00000 ativo 00059 000048 123150 00000 Desses resultados podemos escrever o modelo estimado como 1451 antes de discutirmos esses resultados podemos notar que se não fornecermos os valores iniciais dos parâmetros para iniciar o processo de linearização o eViews fará isso O eViews preci sou de cinco iterações para obter os resultados da equação 1451 No entanto você pode fornecer seus próprios valores iniciais para começar o processo Para demonstrarmos escolhe mos o valor inicial de Ø1 D 045 e Ø2 D 001 Obtivemos os mesmos resultados da equação 1451 mas precisamos de oito iterações É importante observar que menos iterações serão necessárias se os seus valores iniciais não estiverem muito distantes dos valores finais em alguns casos podemos escolher os valores iniciais dos parâmetros efetuando a regressão de mQO do regressando contra os regressores ignorando a não linearidade Por exemplo com os dados da tabela 141 se você tivesse de fazer a regressão da taxa contra os ativos a estimativa de mQO para Ø1 seria de 05028 e a de Ø2 seria 0002 que estão muito próximos dos valores finais dos dados na equação 1451 Para detalhes técnicos consulte o apêndice 14a Seção 14a3 Vejamos agora as propriedades dos estimadores de mínimos quadrados não lineares mQNl recordese de que no caso de modelos de regressão linear com termos de erro normalmente distribuídos foi possível formular procedimentos de inferência exatos testes de hipóteses para pequenas e grandes amostras recorrendo aos testes t F e 2 infelizmente não é esse o caso com os mrNls mesmo com termos de erros distribuídos normalmente Os estimadores de mínimos quadrados não lineares não estão normalmente distribuídos não são não tendenciosos e não têm variância mínima em amostras finitas pequenas Como re sultado não podemos usar o teste t para verificar a significância de um coeficiente indivi dual nem o teste F para verificar a significância geral da regressão estimada porque não é possível obter uma estimativa não tendenciosa da variância de erro æ2 com base nos Continua 6 Outro método às vezes usado chamado de Método de Marquard é um meiotermo entre o da descida mais íngreme e o da linearização ou série de tayor O leitor interessado poderá consultar as referências para saber detalhes sobre ele 7 O eViews oferece três opções a subida quadrática Newtonraphson e Berndthallhallhausman a opção pa drão é a subida quadrática uma variação do método de Newtonraphson ECONOBOOKParte02indb 528 23112010 072047 Capítulo 14 Modelos de regressão não linear 529 EXEMPLO 141 Continuação resíduos estimados Além disso a soma dos resíduos a diferença entre os valores Y reais e os valores Y estimados por meio do MRINL não resulta necessariamente em zero A soma de SQE e SQR não é necessariamente igual à SQT e portanto R2 D SQESQT pode não ser uma estatística descritiva para tais modelos Entretanto podemos calcular R2 como 1452 em que Y D regressando e i i i Y Y u ˆ ˆ em que iYˆ são os valores estimados de Y para o mode lo de regressão não linear ajustado Em consequência as inferências sobre os parâmetros de regressão na regressão não linear em geral se baseiam na teoria das amostras grandes Essa teoria nos diz que quando as amos tras são grandes os estimadores de mínimos quadrados e de máxima verossimilhança de mo delos de regressão não linear com termos de erros normais distribuemse quase normalmente são quase não tendenciosos e têm variância muito próxima da mínima A teoria das grandes amostras também se aplica quando os termos de erro não são normalmente distribuídos8 Em resumo todos os procedimentos de inferência para MRNL são para amostras grandes ou assintóticas Voltando ao Exemplo 141 a estatística t da Equação 1451 só será signifi cativa se interpretada no contexto de amostras grandes Nesse sentido podemos dizer que os coeficientes estimados da Equação 1451 são estatisticamente significativos considera dos de maneira individual Voltando à Equação 1451 como podemos encontrar a taxa de variação de Y D taxa com relação a X tamanho do ativo Por meio das regras básicas de derivadas veremos que a taxa de variação de Y com relação a X é 1453 Portanto a variação da taxa cobrada depende dos valores dos ativos Por exemplo se X D 20 milhões a taxa de variação esperada do valor cobrado será segundo 1453 cerca de 00031 Naturalmente a resposta dependerá do valor de X usado nos cálculos Com base no R2 calculado por meio de 1452 o R2 de 09385 sugere que o modelo de regressão não linear escolhido ajustase bem aos dados da Tabela 141 O valor de Durbin Watson estimado 03493 sugere que há autocorrelação ou um possível erro de especifica ção do modelo Embora existam procedimentos para resolver esses problemas bem como o da heterocedasticidade dos MRNL não os abordaremos aqui O leitor interessado pode consultar as referências 8 EXEMPLO 142 A função de produção CobbDouglas para a economia mexicana Tome os dados apresentados no Exercício 149 Tabela 143 Eles se referem à economia mexicana para os anos de 19551974 Veremos se o MRNL da Equação 1414 ajustase aos dados observando que Y produção X2 trabalho e X3 capital Usando o EViews 6 obti vemos os seguintes resultados de regressão após 32 iterações Variável Coeficiente Erro padrão Valor t pValor Intercepto 05292 02712 19511 00677 Trabalho 01810 01412 12814 02173 Capital 08827 00708 124658 00000 Portanto a estimativa da função de produção de CobbDouglas é Trabalho 1454 Interpretada assintoticamente a equação mostra que apenas o coeficiente do capital é signi ficativo neste modelo No Exercício 149 pedese uma comparação desses resultados com os obtidos na função de produção multiplicativa de CobbDouglas da Equação 1412 8 NETER John KUTNER Michael H NACHTSHEIM Christopher J WASSERMAN William Applied regression analysis 3 ed Irwin 1996 p 548549 CAP14indd 529 23112010 085808 530 Parte três Tópicos em econometria exeMplO 143 Crescimento da população dos Estados Unidos 19702007 a tabela do exercício 148 apresenta os dados sobre a população total nos estados Unidos para o período de 19702007 Um modelo logístico do seguinte tipo é usado com fre quência para medir o crescimento de algumas populações seres humanos bactérias etc 1455 em que Y população em milhões t tempo medido cronologicamente e os Ø são os parâmetros este modelo é não linear nos parâmetros não há uma forma simples de convertêlo em um que seja linear nos parâmetros Note um aspecto interessante neste modelo embora haja ape nas duas variáveis população e tempo há três parâmetros desconhecidos o que mostra que em um mrNl pode haver mais parâmetros que variáveis Uma tentativa de ajustar a equação 1455 para nossos dados não foi bemsucedida já que todos os coeficientes estimados eram estatisticamente insignificantes É provável que isso não seja surpresa porque se representarmos graficamente a população contra o tempo obteremos a Figura 142 Figura 142 População versus Ano 1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2002 2004 2006 2008 200000 Ano 220000 240000 260000 280000 População 300000 320000 essa figura mostra que há uma relação quase linear entre as duas variáveis Se traçarmos o gráfico do logaritmo da população contra o tempo obteremos a seguinte figura Figura 143 Logaritmo da população versus ano 1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2002 2004 2006 2008 1220 Ano 1245 1240 1230 1235 1225 1250 1255 Logaritmo População 1260 1265 Continua ECONOBOOKParte02indb 530 23112010 072049 Capítulo 14 Modelos de regressão não linear 531 exeMplO 143 Continuação O coeficiente angular dessa figura multiplicado por 100 dá a taxa de crescimento da população Por quê De fato se fizermos a regressão do logaritmo da população contra o tempo obteremos os seguintes resultados essa tabela mostra que no período de 19702007 a população dos estados Unidos cres ceu na taxa aproximada de 106 ao ano O valor R2 de 0998 sugere que há um ajustamen to quase perfeito este exemplo ressalta um ponto importante às vezes um modelo linear nos parâmetros pode ser preferível a um modelo não linear nos parâmetros exeMplO 144 Transformação BoxCox população dos EUA 19702007 No apêndice 6a5 consideramos brevemente a transformação de BoxCox Continuemos com o exemplo 143 mas supondo o seguinte modelo População D Ø1 C Ø2 ano C u Como notado no apêndice 6a5 dependendo do valor de temos as seguintes possibilidades O primeiro é um modelo inverso o segundo é um modelo semilogarítmico que já estima mos no exemplo 143 e o terceiro é um modelo linear nas variáveis Qual deles é adequado para a população a rotina BoxCox no Stata Versão 10 pode ser usada para responder a essa pergunta Probabilidade de valor Ω quiquadrado H0 do teste Log de verossimilhança restrita estatística LR quiquadrado Continua ECONOBOOKParte02indb 531 23112010 072050 532 Parte três Tópicos em econometria exeMplO 144 Continuação Nota em nossa notação teta µ é o mesmo que a tabela mostra que com base no teste da razão de verossimilhança rV não podemos rejeitar nenhum desses valores como valo res possíveis para o poder da população isto é no exemplo modelos semilogarítmicos in versos lineares são candidatos a representar o comportamento da população no período amostral 19702007 Portanto apresentamos os resultados obtidos com os três modelos em todos esses modelos os coeficientes estimados são altamente significativos em termos estatísticos mas note que os valores de R2 não são diretamente comparáveis porque a variá vel dependente é diferente nos três modelos este exemplo mostra como as técnicas de estimação não lineares podem ser aplicadas em situações concretas Resumo e conclusões Os principais pontos discutidos neste capítulo podem ser resumidos como 1 Embora os modelos de regressão linear predominem na teoria e na prática há ocasiões em que os modelos de regressão não linear nos parâmetros são úteis 2 A matemática que fundamenta os modelos de regressão linear é comparativamente simples per mitindo a obtenção de soluções explícitas ou analíticas para os coeficientes desses modelos A teoria da inferência de amostras pequenas e grandes desses modelos tem ampla aceitação 3 Em contrapartida para modelos de regressão intrinsecamente não linear MRINL os valores dos parâmetros não podem ser obtidos explicitamente Eles precisam ser estimados numericamente isto é por procedimentos iterativos 4 Há vários métodos para obtermos os MRINLs como 1 tentativa e erro 2 mínimos quadrados não lineares MQNL e 3 linearização através da expansão da série de Taylor 5 Programas de computador agora têm rotinas bem estabelecidas como GaussNewton Newton Raphson e Marquard Estas são rotinas iterativas 6 Os estimadores de mínimos quadrados não lineares não têm propriedades ideais em amostras finitas mas em amostras grandes apresentam essas propriedades Portanto os resultados dos MQNL em amostras pequenas devem ser interpretados com cautela 7 Autocorrelação heterocedasticidade e problemas de especificação de modelo podem afetar os modelos de regressão linear bem como os MRINL 8 Ilustramos os MQNL com vários exemplos Com a disponibilidade de pacotes em softwares amigáveis a estimação dos MRINL não deve mais ser um mistério Portanto o leitor não deveria evitar esses modelos sempre que tiver razões teóricas ou práticas para usálos De fato se voltar mos ao Exercício 1210 veremos pela Equação 1 que ele é intrinsecamente um modelo de re gressão não linear que deveria ser estimado como tal ECONOBOOKParte02indb 532 23112010 072050 Capítulo 14 Modelos de regressão não linear 533 exerCíCiOS 141 O que significam modelos de regressão intrinsecamente linear e intrinsecamente não linear Dê exemplos 142 Uma vez que o termo de erro da função de produção CobbDouglas pode ser incluído de modo multiplicativo ou aditivo como poderíamos decidir qual deles empregar 143 Qual a diferença entre a estimação por MQO e por mínimos quadrados não lineares MQNL 144 A relação entre pressão e temperatura do vapor saturado pode ser expressa como em que Y D pressão e t D temperatura Usando o método de mínimos quadrados não lineares MQNL obtenha as equações normais para esse modelo 145 Indique se as seguintes afirmações são verdadeiras ou falsas Justifique sua resposta a A inferência estatística das regressões de mínimos quadrados não lineares não pode ser feita com base nos testes t F e 2 mesmo que se suponha que o termo de erro seja distri buído normalmente b O coeficiente de determinação R2 não é um número particularmente útil para um MRINL 146 Como se faria a linearização da função de produção CES examinada neste capítulo Mostre as etapas necessárias 147 Os modelos que descrevem o comportamento de uma variável com o tempo são chamados de modelos de crescimento São usados em diversos campos como economia biologia botânica ecologia e demografia Os modelos de crecimento podem assumir várias formas tanto lineares quanto não lineares Considere os modelos a seguir em que Y é a variável cujo crescimento desejamos medir t é o tempo medido cronologicamente e ut é o termo de erro estocástico a Yt D Ø1 C Ø2t C ut b ln Yt D Ø1 C Ø2t C ut c Modelo de crescimento logístico d Modelo de crescimento de Gompertz Verifique as propriedades desses modelos considerando o crescimento de Y em relação ao tempo exercícios aplicados 148 A Tabela 142 apresenta a população dos Estados Unidos em milhões de pessoas para o perío do de 19702007 Ajuste os modelos de crescimento do Exercício 147 e decida qual deles permite um ajustamento melhor Interprete os parâmetros do modelo 149 A Tabela 143 apresenta dados sobre o PIB real mão de obra e capital para o México para o período de 19551974 Veja se a função de produção multiplicativa de CobbDouglas da Equação 1412a ajustase a esses dados Compare seus resultados com os obtidos ao ajustar a função de produção aditiva de CobbDouglas da Equação 1414 cujos resultados são apresentados no Exemplo 142 Qual delas ajustase melhor Capítulo 14 Modelos de regressão não linear 533 adaptado de Draper e Smith op cit p 554 ECONOBOOKParte02indb 533 23112010 072051 534 Parte três Tópicos em econometria Tabela 143 Dados da função de produção para a economia mexicana Notas PIB em milhões de pesos de 1960 Mão de obra em millhões de pessoas Capital em milhões de pesos de 1960 Fonte ELIAS Victor J Sources of growth a study of seven Latin American economies International Center for Economic Growth ICS Press San Francisco 1992 Tabelas E5 E12 E14 Apêndice 14A 14a1 Derivação de equações 1424 e 1425 Escreva a Equação 1422 como 1 Portanto 2 534 Parte três Tópicos em econometria Tabela 142 População norte americana milhões Fonte Economic Report of the President 2008 ECONOBOOKParte02indb 534 23112010 072052 Capítulo 14 Modelos de regressão não linear 535 A soma dos quadrados dos erros é assim uma função de Ø1 e Ø2 já que os valores de Y e X são conhecidos Para minimizarmos a soma dos quadrados dos erros temos de obter as derivadas parciais em relação às duas incógnitas o que dá 3 4 De acordo com a condição de primeira ordem para otimização igualando as equações anteriores a zero e resolvendoas simultaneamente obtemos as Equações 1424 e 1425 Note que ao diferenciar a soma dos quadrados dos erros empregamos a regra de cadeia 14a2 O método de linearização Os estudantes familiarizados com o cálculo se lembrarão do teorema de Taylor que afirma que qualquer função arbitrária f X que seja contínua e tenha uma derivada de nésima ordem pode ser aproximada em torno de um ponto X D X0 por uma função polinomial e um resto da seguinte maneira 1 em que f X0 é a primeira derivada de f X avaliada em X D X0 f X0 é a segunda derivada de f X avaliada em X D X0 e assim por diante em que n leiase fatorial de n representa nn 1n 2º 1 com a con venção de que 0 D 1 e R representa o resto Se tomamos n D 1 obtemos uma aproximação linear escolhendo n D 2 obtemos uma aproximação polinomial de segundo grau Como podemos esperar quanto mais alta for a ordem do polinômio melhor será a aproximação da função original A série dada na Equação 1 é chamada de expansão da série de Taylor fX em torno do ponto X D X0 Como exemplo imagine a função Suponha que desejemos aproximála no ponto X D 0 Agora obtemos Daí podemos obter as seguintes aproximações A aproximação de terceira ordem reproduz exatamente a equação original O objetivo da aproximação da série de Taylor em geral é escolher um polinômio de ordem inferior esperan do que o resto seja desprezível Costumase usálo para aproximar uma função não linear por meio de uma função linear excluindo os termos de ordem mais elevada A aproximação das séries de Taylor pode ser facilmente estendida a uma função com mais de um X Por exemplo considere a seguinte função 2 Capítulo 14 Modelos de regressão não linear 535 ECONOBOOKParte02indb 535 23112010 072054 536 Parte três Tópicos em econometria e suponha que desejemos expandila em torno de X D a e Z D b O teorema de Taylor mostra que 3 em que fx D derivada parcial da função com relação a X fxx D segunda derivada parcial da função em relação a X e procedemos de forma análoga para a variável Z Se quisermos uma aproximação linear à função usaremos os dois primeiros termos da Equação 3 se quisermos uma aproximação quadrática de segundo grau usare mos os três primeiros termos da Equação 3 e assim por diante 14a3 aproximação linear à função exponencial dada em 1422 A função considerada é 1 Nota para facilitar a manipulação eliminamos os subscritos referentes à observação Lembrese de que nesta função as incógnitas são os coeficientes Ø Vamos linearizar esta função em Ø1 D Ø 1 e Ø2 D Ø 2 em que as quantidades destacadas com asterisco são os valores fixos dados Para linearizarmos procedemos da seguinte maneira 2 em que fØ1 e fØ2 são as derivadas parciais da função 1 com respeito às incógnitas e essas derivadas serão ava liadas segundo os valores presumidos marcados por asterisco dos parâmetros desconhecidos Note que usa mos apenas as primeiras derivadas na expressão anterior uma vez que estamos linearizando a função Agora suponha que Ø 1 D 045 e Ø 2 D 001 que são palpites sobre o verdadeiro valor dos coeficientes Agora 3 pelas regras padrão da derivação Avaliando essas derivadas aos valores dados e revertendo para a Equação 2 obtemos 4 que escrevemos como 5 em que 6 Agora seja Usando essas definições e adicionando o termo de erro ui podemos finalmente escrever a Equação 5 como 7 e encontramos com um modelo de regressão linear Uma vez que Y i X1i e X2i podem ser calculados prontamen te com base nos dados podemos estimar facilmente a Equação 7 pelos MQO e obter os valores de Æ1 e Æ2 Então da Equação 6 obtemos 8 536 Parte três Tópicos em econometria ECONOBOOKParte02indb 536 23112010 072057 Capítulo 14 Modelos de regressão não linear 537 Vamos chamar esses valores de Ø1 e Ø2 respectivamente Usando os valores revisados podemos começar o processo iterativo dado na Equação 2 obtendo outro conjunto de valores dos coeficientes Ø Podemos conti nuar efetuando a iteração ou linearização até que não haja alteração substancial nos valores dos coeficientes Ø No Exemplo 141 foram necessárias cinco iterações mas para o exemplo da função CobbDouglas para economia mexicana Exemplo 142 efetuaramse 32 iterações A lógica que fundamenta essas iterações é o procedimento que acabamos de ilustrar Para a estrutura de taxas de fundos mútuos em 143 Y X1 e X2 da Equação 6 são os mostrados na Tabe la 144 os dados básicos são apresentados na Tabela 141 Desses valores os resultados da regressão corres pondentes à Equação 7 são Dependent variable Y Method Least squares Variable Coefficient Std Error tStatistic Prob X1 0022739 0014126 1609705 01385 X2 0010693 0000790 1352990 00000 R2 0968324 DurbinWatson d statistic 0308883 Agora usando a Equação 8 o leitor pode verificar que 9 Compare esses números com os palpites iniciais de 045 e 001 respectivamente para os dois parâmetros Usando as novas estimativas na Equação 9 podemos dar início ao procedimento iterativo mais uma vez e continuar até que haja convergência no sentido de que a rodada final das estimativas não seja muito diferen te da rodada anterior Poderemos precisar de menos iterações se nosso palpite inicial for mais próximo dos valores finais Além disso note que usamos apenas o termo linear na expansão das séries de Taylor Se tivésse mos de usar os termos quadráticos ou de ordem superior na expansão talvez chegaríamos aos valores finais mais rapidamente mas em muitas aplicações a aproximação linear provou ser muito boa Capítulo 14 Modelos de regressão não linear 537 Tabela 144 ECONOBOOKParte02indb 537 23112010 072057 538 Modelos de regressão de resposta qualitativa Em todos os modelos de regressão que consideramos até agora consideramos implicitamente que o regressando a variável dependente ou variável de resposta Y é quantitativa enquanto as variáveis explanatórias são quantitativas qualitativas ou binárias ou uma combinação delas De fato no Capítulo 9 sobre variáveis binárias vimos como os regressores binários são introduzidos em um modelo de regressão e que papel desempenham em situações específicas Neste capítulo consideraremos vários modelos em que o regressando em si é de natureza quali tativa Embora cada vez mais utilizados em várias áreas das ciências sociais e da pesquisa médica os modelos de regressão de resposta qualitativa impõem desafios interessantes de estimação e interpre tação Neste capítulo apenas tocaremos em alguns dos principais temas desta área deixando os por menores para livros mais especializados1 151 A natureza dos modelos de resposta qualitativa Suponha que queiramos estudar a decisão dos homens adultos de participar da força de trabalho que denominamos PFT Uma vez que um adulto está ou não na força de trabalho a PFT é uma decisão do tipo sim ou não A variável de resposta ou regressando pode ter apenas dois valores 1 quando a pessoa está na força de trabalho e 0 se ela não está Em outras palavras o regressando é uma variável binária ou dicotômica Pesquisas sobre economia do trabalho sugerem que a decisão é uma função da taxa de desemprego do salário médio da escolaridade da renda familiar etc Como outro exemplo considere as eleições presidenciais nos Estados Unidos Suponhamos que existam dois partidos políticos Democrata e Republicano A variável dependente aqui é a opção de voto entre os dois partidos políticos Seja Y 1 se o voto for para um candidato democrata e Y 0 se o voto for para um candidato republicano Uma quantidade considerável de pesquisas sobre este tema foi feita pelo economista Ray Fair da Universidade de Yale e por diversos cientistas políticos2 Algumas das variáveis utilizadas na escolha do voto são a taxa de crescimento do PIB taxas de de semprego e inflação se o candidato está candidatandose à reeleição etc Para nossos objetivos o importante é que o regressando é uma variável qualitativa Podemos pensar em vários outros exemplos em que o regressando tem natureza qualitativa Uma família tem casa própria ou não ela tem seguro contra invalidez ou não tanto o marido como a mu 1 No nível introdutório o leitor poderá encontrar as seguintes fontes muito úteis POWerS Daniel aXie Yu Statistical methods for categorical data analysis academic Press 2000 alDriCh John h NelSON Forrest Line ar probability logit and probit models Sage Publications 1984 e liaO tim Futing Interpreting probability mo dels logit probit and other generalized linear models Sage Publications 1994 Para uma revisão geral da literatura específica veja maDDala G S Limiteddependent and qualitative variables in econometrics Cambridge University Press 1983 2 Veja por exemplo Fair ray econometrics and presidential elections Journal of Economic Perspective p 89102 1996 e leWiSBeCK michael S Economics and elections the major western democracies ann arbor University of michigan Press 1980 Capítulo 15 ECONOBOOKParte02indb 538 23112010 072058 Capítulo 15 Modelos de regressão de resposta qualitativa 539 lher estão na força de trabalho ou apenas a esposa está Da mesma forma uma certa droga é ou não eficaz na cura de uma doença Uma empresa decide declarar dividendos em ações ou não um senador decide votar em favor do corte de um imposto ou não um presidente norteamericano decide vetar ou sancionar uma lei etc Não temos de restringir a variável de resposta apenas às categorias dicotômicas simnão Voltando ao exemplo de eleições presidenciais suponha que haja três partidos Democrata Republicano e Inde pendente A variável de resposta nesse caso será tricotômica Em geral podemos ter uma variável de escolha policotômica ou de múltiplas categorias O que planejamos fazer é considerar primeiro o regressando dicotômico e então considerar várias extensões do modelo básico Mas antes é importante notar uma diferença fundamental entre um modelo de regressão em que o regressando Y é quantitativo e um modelo em que é qualitativo Em um modelo no qual Y é quantitativo nosso objetivo é estimar seu valor esperado ou médio dados os valores dos regressores Conforme o Capítulo 2 o que desejamos é EYi X1i X2i Xki em que os regressores X são quantitativos e qualitativos Em modelos nos quais Y é qualitativo nosso objetivo é encontrar a probabilidade de que algo aconteça como o voto em um candidato democrata ou a aquisição da casa própria ou pertencer a um sindicato ou participar de um esporte etc Portanto os modelos de regressão de escolha qualitativa são muitas vezes conhecidos como modelos de probabilidade Neste capítulo procuraremos responder às seguintes perguntas 1 Como estimar modelos de escolha qualitativa Podemos apenas estimálos usando os proce dimentos habituais dos MQO 2 Há problemas especiais de inferência Em outras palavras os procedimentos de teste de hipóteses são diferentes dos que aprendemos até agora 3 Se um regressando for qualitativo como poderemos medir a qualidade do ajustamento desses modelos O R2 calculado da forma convencional tem algum valor no caso desses modelos 4 De que maneira estimamos e interpretamos os modelos de regressão policotômicos Como lidar com modelos em que o regressando é ordinal ou seja uma variável de categorias or denadas como escolaridade menos de 8 anos de 8 a 11 anos 12 anos mais de 13 anos ou o regressando é nominal ou seja não há ordenação como raça negros brancos hispâni cos asiáticos e outros 5 De que modo modelamos fenômenos como o número anual de consultas médicas o número de patentes registradas por uma empresa em certo ano o número de artigos publicados por um docente em um ano o número de telefonemas atendidos em um intervalo de cinco mi nutos ou o número de automóveis que passam por uma cabine de pedágio em cinco minu tos Esses fenômenos chamados de dados contáveis ou eventos raros são um exemplo do processo de probabilidade Poisson Neste capítulo daremos respostas elementares a algumas dessas perguntas pois alguns desses tópicos são bastante avançados e exigem uma base de matemática e estatística acima daquela pressu posta neste livro As referências nas notas de rodapé podem ser consultadas para maiores detalhes Começaremos o estudo dos modelos de escolha qualitativa considerando primeiro o modelo de regressão de escolha binária Há quatro abordagens para formular um modelo probabilístico para uma variável de escolha binária 1 O modelo de probabilidade linear MPL 2 O modelo logit 3 O modelo probit 4 O modelo tobit Dada a sua simplicidade comparativa e a possibilidade de estimálo por MQO começaremos com o modelo de probabilidade linear deixando os outros três para as próximas seções ECONOBOOKParte02indb 539 23112010 072058 540 Parte três Tópicos em econometria 152 O modelo de probabilidade linear MPL Considere o seguinte modelo de regressão 1521 em que X renda familiar e Y 1 se a família tiver um imóvel e 0 se não tiver O 1521 parece ser um modelo típico de regressão linear mas como o regressando é binário ou dicotômico ele é chamado de modelo de probabilidade linear MPL Isso ocorre porque a expecta tiva condicional de Yi dado Xi EYi Xi pode ser interpretada como probabilidade condicional de que o evento ocorra dado Xi isto é Pr Yi 1 Xi Assim em nosso exemplo EYi Xi apresenta a probabilidade de uma família ter um imóvel e cuja renda é dada pelo montante Xi A justificativa do nome modelo de probabilidade linear para modelos como a Equação 1521 pode ser vista a seguir Supondo Eui 0 como de costume para obter estimadores não tendencio sos obtemos 1522 Agora se Pi probabilidade de que Yi 1 de que o evento ocorra e 1 Pi probabili dade de que Yi 0 de que o evento não ocorra a variável Yi tem a seguinte distribuição de probabilidade Isto é Yi segue a distribuição de probabilidade de Bernoulli Por definição de esperança matemática obtemos 1523 Comparando a Equação 1522 com a 1523 podemos igualar 1524 ou seja a esperança condicional do modelo 1521 pode de fato ser interpretada como a probabilidade condicional de Yi Em geral a esperança de uma variável de Bernoulli é a probabilidade de que a variável aleatória seja igual a 1 Observe que se houver n experimentos independentes cada um com uma proba bilidade p de sucesso e probabilidade 1 p de fracasso e X desses experimentos representarem o número de sucessos dizemos que X segue a distribuição binomial A média de uma distribuição bino mial é np e sua variância é np1 p O termo sucesso é definido no contexto do problema Uma vez que a probabilidade Pi deve estar entre 0 e 1 temos a restrição 1525 ou seja a esperança ou probabilidade condicional deve estar entre 0 e 1 Pela discussão anterior pode parecer que os MQO são estendidos com facilidade aos modelos de regressão com variáveis dependentes binárias Talvez não haja nada de novo nisso Infelizmente não é esse o caso pois o modelo de probabilidade linear apresenta vários problemas ECONOBOOKParte02indb 540 23112010 072059 Capítulo 15 Modelos de regressão de resposta qualitativa 541 ausência de normalidade dos termos de erro ui Embora os MQO não exijam que os termos de erro ui sejam normalmente distribuídos consi deramos tal distribuição para fins de inferência estatística3 No entanto a hipótese de normalidade de ui não se sustenta no caso dos modelos de probabilidade linear porque como Yi os termos de erro ui também assumem apenas dois valores eles também seguem a distribuição de Bernoulli Isso pode ser visto claramente se escrevermos 1521 como 1526 A distribuição de probabilidade de ui é 1527 Obviamente não podemos pressupor que os ui sejam normalmente distribuídos eles seguem a distribuição de Bernoulli Mas o fato de não observarmos a validade da hipótese de normalidade pode não ser tão fundamen tal quanto parece porque sabemos que as estimativas pontuais de MQO ainda permanecem não ten denciosas recordese de que se o objetivo for a estimação pontual a hipótese de normalidade deixa de ser necessária Além disso à medida que o tamanho da amostra aumenta indefinidamente a teoria estatística mostra que os estimadores de MQO tendem no geral a distribuirse normalmente4 Em consequência no caso de grandes amostras a inferência estatística dos modelos de probabilidade li near seguirá os procedimentos habituais de MQO sob a hipótese de normalidade Variâncias heterocedásticas dos termos de erro Mesmo que Eui 0 e cov ui uj 0 para i j inexistência de correlação serial não se pode mais afirmar que no MPL os termos de erro são homocedásticos No entanto não é de surpreender que sejam Como mostra a teoria estatística para uma distribuição de Bernoulli a média e a variância teóricas são respectivamente p e p1 p em que p é a probabilidade de sucesso de ocorrência de alguma coisa mostrando que a variância é uma função da média Portanto a variância do erro é he terocedástica Para a distribuição do termo de erro da Equação 1527 aplicando a definição de variância o leitor deveria verificar que veja o Exercício 1510 1528 a variância do termo de erro no MPL é heterocedástica Como a variân cia de ui depende dos valores de X e por isso não é homocedástica Já sabemos que na presença da heterocedasticidade os estimadores de MQO embora não sejam tendenciosos não são eficientes isto é não têm variância mínima Mas o problema da heterocedasti cidade como o problema da distribuição não normal não é insuperável No Capítulo 11 discutimos vários métodos para lidar com o problema da heterocedasticidade Como a variância de ui depende de EYi Xi uma forma de resolver o problema da heterocedasticidade é transformar o modelo 1521 dividindoo por 3 lembrese de que recomendamos que a hipótese de normalidade fosse verificada por meio dos testes de nor malidade adequados como o teste de JarqueBera 4 a demonstração apoiase no teorema central do limite e pode ser encontrada em maliNVaUD e Statistical methods of econometrics Chicago rand mcNally 1966 p 195197 Se os regressores forem considerados estocásticos e tiverem em conjunto distribuição normal os testes F e t ainda podem ser aplicados mesmo que os termos de erro não tenham distribuição normal também convém ter em mente que à medida que o tamanho da amostra cresce indefinidamente a distribuição binomial converge para a distribuição normal ECONOBOOKParte02indb 541 23112010 072100 542 Parte três Tópicos em econometria isto é 1529 Como podemos verificar o termo de erro transformado na Equação 1529 é homocedásti co Depois de calcularmos a Equação 1521 podemos estimar a Equação 1529 pelos MQO que não é nada mais do que os mínimos quadrados ponderados MQP com os wi servindo como pesos Na teoria o que acabamos de descrever é válido mas na prática a verdadeira E Yi Xi é desco nhecida os pesos wi são desconhecidos Para estimar wi podemos usar o seguinte procedimento em duas etapas5 Etapa 1 Fazemos a regressão de MQO 1521 apesar do problema da heterocedasticidade e obtemos YOi estimativa da verdadeira EYi Xi Então obtemos wOi YOi 1 YOi a estimativa de wi Etapa 2 Usamos o wi para transformar os dados como mostramos na Equação 1529 e calculamos a equação transformada por MQO os mínimos quadrados ponderados Esse procedimento será ilustrado em breve porém podemos usar os erros padrão corrigidos para heterocedasticidade de White para lidar com a heterocedasticidade contanto que a amostra seja razoavel mente grande Mesmo corrigindo para heterocedasticidade primeiro precisamos tratar outro problema que afeta o MPL impossibilidade de satisfazer 0 eYi Xi 1 Como EYi Xi nos modelos de probabilidade linear mede a probabilidade condicional de que o evento Y ocorra dado X ele se situa necessariamente entre 0 e 1 Embora isso seja verdade a priori nada garante que os YOi os estimadores de EYi Xi satisfaçam necessariamente essa restrição e esse é o problema real da estimativa dos modelos de probabilidade linear por MQO Tal fato acontece porque os MQO não levam em conta a restrição de que 0 EYi 1 uma restrição de desigualdade Há duas maneiras de verificar se o YOi estimado situase entre 0 e 1 Uma delas é estimar o MPL pelo método habitual de MQO e constatar se YOi situase entre 0 e 1 Se alguns forem menores que 0 nega tivos consideraremos que YOi seja zero nesses casos se forem maiores que 1 consideraremos que se jam iguais a 1 O segundo procedimento é formular uma técnica de estimação que garanta que as probabilidades condicionais YOi estarão entre 0 e 1 Os modelos logit e probit garantirão que as proba bilidades estimadas de fato situamse entre os limites lógicos 0 e 1 O valor de R2 como medida de qualidade do ajustamento é questionável O R2 calculado da forma convencional é de valor limitado quando se trata de modelos de es colha dicotômica Para ver por que considere a Figura 151 Correspondendo a um dado X Y é 0 ou 1 Portanto todos os valores de Y ficarão ao longo do eixo X ou da linha correspondente a 1 Em geral não se espera que nenhum MPL ajustese bem a um gráfico de dispersão seja o modelo de probabilidade linear irrestrito Figura 151a seja o truncado ou restrito Figura 151b um modelo de probabilidade linear estimado dessa maneira não ficará fora da faixa lógica 01 Em 5 a justificativa deste procedimento pode ser vista em GOlDBerGer arthur S Econometric theory Nova York John Wiley Sons 1964 p 249250 esta justificativa apoiase praticamente em uma grande amostra como a que discutimos ao tratar dos mínimos quadrados generalizados no capítulo dedicado à heterocedasticidade veja a Seção 116 ECONOBOOKParte02indb 542 23112010 072101 Capítulo 15 Modelos de regressão de resposta qualitativa 543 consequência o R2 calculado da forma convencional costuma situarse muito abaixo de 1 Na maioria das aplicações práticas o R2 situase entre 02 e 06 Nesses modelos R2 será alto por exemplo acima de 08 apenas quando os dados observados aglomeraremse em torno dos pontos A e B Figura 151c pois é fácil determinar a reta ao unir os dois pontos A e B Nesse caso o Yi previsto estará muito próximo ou de 0 ou de 1 Por essas razões John Aldrich e Forrest Nelson afirmam que o uso do coeficiente de determinação como estatística sintética deveria ser evitado em modelos com a variável dependente qualitativa6 exeMplO 151 MPL um exemplo numérico Para ilustrarmos alguns pontos da seção anterior apresentaremos um exemplo numérico a tabela 151 fornece dados fictícios relativos à posse da casa própria Y 1 possui uma casa 0 não possui uma casa e renda familiar X milhares de dólares para 40 famílias Com base nesses dados o mPl estimado pelo mQO apresentou os seguintes resultados 15210 Primeiro vamos interpretar a regressão O intercepto de 09457 apresenta a probabilida de de que uma família com renda zero tenha uma casa Como esse valor é negativo e a probabilidade não pode ser negativa tratamos o valor como zero o que aqui se justifica7 O valor da inclinação de 01021 indica que por uma variação de uma unidade na renda neste caso 1000 em média a probabilidade de possuir uma casa própria aumenta em 01021 ou cerca de 10 Continua 7 6 alDriCh e NelSON op cit p 15 Para outras medidas da qualidade do ajuste em modelos que envolvem regressandos binários veja amemiYa t Qualitative response models Journal of Economic Literature 1981 v 19 p 331354 7 Podese interpretar por alto o valor extremamente negativo como quase uma improbabilidade de se ter uma casa própria quando a renda é zero Y 0 X MPL irrestrito Y 0 X MPL restrito 0 X MPL 1 a b c 1 1 B A Y Figura 151 Modelos de probabilidade linear ECONOBOOKParte02indb 543 23112010 072102 544 Parte três Tópicos em econometria exeMplO 151 Continuação evidentemente dado o nível particular de renda podemos estimar a probabilidade real de ter uma casa por meio da equação 15210 Para X 12 12000 a probabilidade esti mada de possuir uma casa própria é Tabela 151 Dados hipotéticos relativos à posse da casa própria Y 1 se tiver casa própria 0 se não tiver e renda X milhares de dólares isto é a probabilidade de que uma família com renda de 12000 tenha casa própria é de cerca de 28 a tabela 152 mostra as probabilidades estimadas YOi para vários níveis de renda listados O aspecto mais notável dessa tabela é que seis valores estimados são negativos e seis estão acima de 1 demonstrando claramente o que expusemos anterior mente que embora EYi Xi seja positiva e menor que 1 seus estimadores YOi não preci sam ser necessariamente positivos ou menores que 1 essa é uma das razões pela qual o mPl não é o modelo recomendado quando a variável dependente for dicotômica mesmo que os Yi estimados fossem todos positivos e menores que 1 o modelo de probabilidade linear ainda apresentaria o problema de heterocedasticidade o que pode ser visto facilmente pela equação 1528 em consequência não podemos contar com os erros padrão estimados dados na equação 15210 Por quê mas podemos usar o procedimento dos mínimos quadrados ponderados mQP discutido anteriormente para obter estimativas mais eficientes dos erros padrão Os pesos necessários wO i exigidos para a aplicação dos mQP também aparecem na tabela 152 mas note que como os Yi são negativos e alguns outros são superiores a 1 os wO i correspondente a esses valores serão negativos Não podemos usar essas observações em mQP por quê reduzindo assim o número de observações de 40 para 28 neste exemplo8 Omitindo essas observações a re gressão de mQP é Continua 8 8 Para evitar a perda de graus de liberdade podemos fazer YOi D 001 quando os Yi estimados forem negativos e YOi D 099 quando forem superiores ou iguais a 1 Veja o exercício 151 ECONOBOOKParte02indb 544 23112010 072102 Capítulo 15 Modelos de regressão de resposta qualitativa 545 exeMplO 151 Continuação 15211 Tabela 152 Y real Y estimado e pesos wi para o exemplo de posse de casa própria Tratado como zero para evitar probabilidades negativas Tratado como unidade para evitar unidades acima de 1 YOi1 YOi esses resultados mostram que comparados à equação 15210 os erros padrão esti mados são menores e correspondentemente as razões t estimadas em valores absolu tos são maiores mas tais resultados devem ser considerados com reserva uma vez que ao calcularmos a equação 15211 tivemos de excluir 12 observações além disso uma vez que os wi são estimados os procedimentos estatísticos habituais de teste de hipóteses são em termos estritos válidos em amostras grandes veja o Capítulo 11 153 Aplicações do modelo de probabilidade linear MPL Antes que pacotes computacionais para estimar os modelos logit e probit que serão discutidos em breve fossem acessíveis o modelo de probabilidade linear era muito usado tendo em vista sua simplicidade Seguem algumas dessas aplicações ECONOBOOKParte02indb 545 23112010 072103 546 Parte três Tópicos em econometria exeMplO 152 O estudo CohenRea Lerman9 em um estudo preparado para o US Department of labour Departamento do trabalho dos estados Unidos Cohen rea e lerman examinaram a participação na força de trabalho de várias categorias ocupacionais como função de diversas variáveis socioeconômicas e de mográficas em todas as regressões a variável dependente era binária assumindo o valor de 1 se a pessoa estivesse empregada e 0 em caso contrário Na tabela 153 reproduzimos um dos vários regressores antes de interpretarmos os resultados vale destacarmos estes aspectos a regressão ante rior foi estimada por mQO Para levarem em conta a heterocedasticidade os autores adota ram o procedimento em duas etapas já visto em algumas de suas estimativas mas verificaram que os erros padrão das estimativas assim obtidas não diferiam significativamente daquelas em que não havia qualquer ajustamento para a heterocedasticidade talvez esse resultado tivesse a ver apenas com o tamanho da amostra que era de 25 mil observações Com esse os valores t estimados podem ser examinados quanto à significância estatística pelos proce dimentos habituais de mQO mesmo que o termo de erro assuma valores dicotômicos O R2 estimado 0175 pode parecer baixo mas por ser uma amostra grande ainda é significativo de acordo com o teste F apresentado na Seção 84 Por fim observamos como os autores misturaram variáveis quantitativas e qualitativas e como levaram em consideração os efeitos da interação Voltando à interpretação dos resultados vemos que cada coeficiente angular apresenta a taxa de variação da probabilidade condicional de que um evento ocorra dada uma unidade de alteração no valor da variável explanatória Por exemplo o coeficiente de 02753 da variável acima de 65 anos indica que mantendose todos os demais fatores constantes a probabilidade de participação na força de trabalho das mulheres desse grupo etário é cerca de 27 menor que na categoriabase das mulheres entre 22 e 54 anos Do mesmo modo o coeficiente da variável mais de 16 anos de estudo 03061 indica que tudo o mais manti do constante a probabilidade de que as mulheres com esse nível de escolaridade participem da força de trabalho é cerca de 31 maior em comparação com as mulheres com menos de 5 anos de estudo a categoriabase agora considere o termo de interação estado civil e idade a tabela mostra que a probabilidade de participação da força de trabalho é cerca de 29 para aquelas mulheres que nunca se casaram comparada à categoriabase e menor em cerca de 28 para aquelas que têm mais de 65 anos novamente em relação à categoriabase mas a pro babilidade de participação de mulheres que nunca se casaran e têm 65 anos ou mais é cerca de 20 menor comparada com a categoriabase isso implica que as mulheres com 65 anos ou mais mas que nunca se casaram têm mais probabilidade de participar da força de trabalho que aquelas de mesma faixa etária e que são casadas ou enquadradas em outras categorias Seguindo este procedimento o leitor pode interpretar facilmente o resto dos coeficientes dados na tabela 153 Das informações é fácil obter as estimativas das probabilidades condi cionais de participação de mão de obra das várias categorias Se queremos encontrar a pro babilidade para mulheres casadas outras com 22 a 54 anos com 12 a 15 anos de estudo com taxa de desemprego de 25 a 34 a mudança de emprego de 35 a 649 relativa a oportunidades de emprego de 74 e mais e com rFmPS de 7500 ou mais obtemos 04368 01523 02231 00213 00301 00571 02455 06326 em outras palavras a probabilidade da participação na força de trabalho pelas mulheres com as características anteriores é estimada em cerca de 63 Continua 9 9 COheN malcolm S rea Jr Samuel a lermaN robert i A micro model of labor supply BlS Staff Paper 4 US Department of labor 1970 ECONOBOOKParte02indb 546 23112010 072103 Capítulo 15 Modelos de regressão de resposta qualitativa 547 exeMplO 152 Continuação Tabela 153 Regressão da participação na força de trabalho de mulheres com 22 anos ou mais morando nas 96 maiores áreas estatísticas metropolitanas padrão AEMP variável dependente dentro ou fora da força de trabalho durante 1966 Fonte COHEN Malcolm S REA JR Samuel A LERMAN Robert I A micro model of labor supply BLS Staff Paper 4 US Department of La bor 1970 Tabela F6 p 212213 Nota indica a categoriabase ou aquela omitida RFMPS renda familiar menos o próprio salário ECONOBOOKParte02indb 547 23112010 072104 548 Parte três Tópicos em econometria exeMplO 153 Previsão de classificação de um título Com base em séries temporais combinadas e dados de corte transversal de 200 títulos aa alta qualidade e Baa qualidade média no período de 19611966 Joseph Cappelleri esti mou o seguinte modelo de previsão da classificação de títulos10 em que Yi 1 se a classificação de títulos for aa classificação de moody 0 se a classificação de título for Baa classificação de moody X4 desvio padrão da taxa de lucro uma medida da variabilidade da taxa de lucro X5 ativos líquidos totais milhares de dólares uma medida de tamanho A priori esperase que Ø2 e Ø4 sejam negativos por quê e esperase que Ø3 e Ø5 sejam posi tivos após a correção da heterocedasticidade e a autocorrelação de primeira ordem Cappelleri obteve os seguintes resultados11 1531 Nota 0378E7 indica 00000000378 etc todos os coeficientes exceto de X4 têm os sinais corretos Deixamos aos estudantes de finanças explicar o sinal positivo do coeficiente da variabilidade da taxa de lucro pois seria de esperar que quanto maior a variabilidade nos lucros menor a probabilidade de o título obter uma classificação aa da moodys tudo o mais mantido constante a interpretação da regressão é direta Por exemplo 00486 ligada a X3 indica que mantendo os demais fatores iguais um aumento de um ponto percentual na taxa de lu cro levará em média a um aumento aproximado de 005 na probabilidade de um título obter classificação aa Do mesmo modo se o quadrado do coeficiente alavancado au menta em 1 unidade a probabilidade de um título ser classificado como um título aa diminui em 002 10 11 10 CaPPelleri Joseph Predicting a bond rating trabalho final não publicado CUNY O modelo usado no artigo é uma modificação do modelo empregado por POGUe thomas F SOlDOFSKY robert m What is in a bond rating Journal of Financial and Quantitative Analysis jun 1969 p 201228 11 algumas das probabilidades estimadas antes de corrigir para heterocedasticidade foram negativas e algumas estavam acima de 1 nesses casos considerouse que fossem iguais a 001 e 099 respectivamente para facilitar o cálculo dos pesos wi ECONOBOOKParte02indb 548 23112010 072105 Capítulo 15 Modelos de regressão de resposta qualitativa 549 exeMplO 154 Quem tem cartão de débito Como os cartões de crédito os cartões de débito agora são bastante usados pelos consu midores São preferidos pelos fornecedores porque quando usamos um cartão de débito o valor da compra é deduzido automaticamente de nossa conta corrente ou outra conta designada Para verificar quais os fatores que determinam o uso do cartão de débito obtive mos dados de 60 clientes e consideramos o modelo a seguir12 em que Y 1 para o portador do cartão de débito 0 em caso contrário X2 saldo bancário em dólares X3 número de transações no caixa eletrônico Ce X4 1 se os juros forem depositados em conta 0 se não forem depositados em conta Uma vez que o modelo de probabilidade linear mPl mostra heterocedasticidade apresen tamos os resultados usuais de mQO corrigidos para heterocedasticidade em forma tabular Nota denota erros padrão corrigidos para heterocedasticidade significativo ao nível de 5 Quanto mais altos forem os juros pagos sobre os saldos em conta menor a tendência de ter um cartão de débito embora a variável caixa eletrônico não seja significativa note que ela tem sinal negativo talvez isso se deva às taxas cobradas de transações em caixas eletrônicos Não há uma grande diferença entre os erros padrão estimados com e sem correção para heterocedasticidade Para pouparmos espaço não apresentamos os valores ajustados as probabilidades estimadas mas todos estavam dentro dos limites de 0 e 1 entretanto não há garantia de que isso acontecerá em todos os casos 12 154 Alternativas ao MPL Como vimos o MPL é afetado por vários problemas como 1 a não normalidade de ui 2 a he terocedasticidade de ui 3 a possibilidade de YOi fora da faixa 01 e 4 os valores em geral mais baixos de R2 Mas esses problemas são superáveis Por exemplo podemos usar os MQP para resolver o problema da heterocedasticidade ou aumentar o tamanho da amostra para minimizar o problema da não normalidade Ao apelarmos para os mínimos quadrados restritos MQR ou para técnicas de pro gramação matemáticas podemos até fazer as probabilidades estimadas ficarem no intervalo 01 Contudo o problema fundamental do modelo de probabilidade linear é que ele não é logicamen te um modelo muito atraente porque presupõe que Pi E Y 1 X aumenta linearmente com X isto é o efeito marginal ou incremental de X permanece constante o tempo todo Em nosso exemplo da casa própria verificamos que quando X aumenta em uma unidade 1000 a probabilidade de possuir uma casa própria aumenta sempre na mesma quantia de 010 E isso acontece quer o nível de renda seja 8 mil 10 mil 18 mil ou 22 mil Isso parece irrealista na realidade se esperaria que Pi estivesse relacionado não linearmente a Xi com uma renda muito baixa uma família não terá 12 Os dados usados na análise são obtidos de liND Douglas a marChal William G maSON robert D Statistical techniques in business and economics 11 ed mcGrawhill 2002 apêndice N p 775776 Não utili zamos todas as variáveis empregadas pelos autores ECONOBOOKParte02indb 549 23112010 072106 550 Parte três Tópicos em econometria uma casa própria mas com um nível suficientemente alto de renda por exemplo X é muito prová vel que tenha Qualquer aumento de renda além de X teria pouco efeito sobre a probabilidade de possuir uma casa própria Nos dois extremos da distribuição de renda a probabilidade de possuir uma moradia praticamente não seria afetada por um pequeno aumento de renda Portanto o que precisamos é um modelo probabilidade que tenha esses dois aspectos 1 quan do Xi aumenta Pi EY 1 X aumenta mas nunca fica fora do intervalo 01 e 2 a relação entre Pi e Xi é não linear ou seja aproximase de zero a taxas cada vez menores quando Xi fica menor e aproximase de 1 a taxas cada vez menores à medida que Xi aumenta bastante13 Geometricamente o modelo que queremos se pareceria com a Figura 152 Note nesse modelo que a probabilidade fica entre 0 e 1 e que ela varia não linearmente com X O leitor perceberá que a curva sigmóide ou em forma de S da figura assemelhase muito à fun ção de distribuição acumulada FDA de uma variável aleatória14 Portanto podese usar a FDA para modelar regressões em que a variável de escolha é dicotômica assumindo valores entre 0 e 1 A questão prática agora é que FDA Embora todas as FDAs tenham forma de S para cada variável aleatória há uma única FDA Por razões históricas e práticas as FDAs escolhidas para representar esses modelos são 1 logística e 2 normal a primeira dando origem ao modelo logit e a segunda ao modelo probit ou normit Embora um exame detalhado desses modelos esteja além do escopo deste livro indicaremos de modo informal como se calculam tais modelos e como podem ser interpretados P 0 X FDA 1 155 O modelo logit Continuaremos com nosso exemplo de casa própria para explicar as ideias básicas que fun damentam o modelo logit Lembrese de que ao explicar a propriedade em relação à renda o MPL foi 1551 13 alDriCh John NelSON Forrest op cit p 26 14 Como discutido no Apêndice A a FDa de uma variável aleatória X é apenas a probabilidade de que esta as suma um valor menor ou igual a x0 em que x0 é um valor numérico especificado de X em suma F X a FDa de X é F X x0 P X x0 Figura 152 Uma função de distribuição acumulada FDA ECONOBOOKParte02indb 550 23112010 072106 Capítulo 15 Modelos de regressão de resposta qualitativa 551 em que X é a renda e Pi EYi 1 Xi indica que a família tem casa própria Mas agora considere a seguinte representação de casa própria 1552 Para facilitarmos a exposição escrevemos a Equação 1552 como 1553 em que Zi Ø1 Ø2Xi A Equação 1553 representa o que é conhecido como função de distribuição logística acumulada15 É fácil verificar que como Zi varia de a Pi varia entre 0 e 1 e que Pi está relacionado não linearmente a Zi ou seja Xi satisfazendo os dois requisitos considerados anteriormente16 Mas pa rece que ao satisfazermos esses requisitos criamos um problema de estimação porque Pi é não linear não só em X mas também no Ø como pode ser visto claramente na Equação 1552 Isso significa que não podemos usar o procedimento conhecido de MQO para estimar os parâmetros17 Mas esse problema é mais aparente do que real porque a Equação 1552 pode ser linearizada o que pode ser mostrado a seguir Se Pi a probabilidade de ter casa própria é dada pela Equação 1553 então 1 Pi a proba bilidade de não ter casa própria é 1554 Portanto podemos escrever 1555 Agora Pi1 Pi é apenas a razão de chances em favor de ter uma casa própria menos a razão da probabilidade de que uma família possua a casa contra a probabilidade de que não a possua As sim Pi 08 significa que as chances são de 4 para 1 a favor de a família ter casa própria Se toma mos o logaritmo natural da Equação 1555 obtemos um resultado muito interessante a saber 1556 15 O modelo logístico tem sido usado extensamente para analisar fenômenos de crescimento como população PiB oferta de moeda etc Para detalhes teóricos e práticos dos modelos logit e probit veja Kramer J S The logit model for economists londres edward arnold Publishers 1991 e maDDala G S op cit 16 Note que quando Zi eZi tende a zero e quando Zi eZi aumenta indefinidamente lembrese de que e 271828 17 evidentemente poderíamos usar técnicas de estimação não lineares discutidas no Capítulo 14 Veja também a Seção 158 ECONOBOOKParte02indb 551 23112010 072107 552 Parte três Tópicos em econometria ou seja L o logaritmo da razão de chances não é apenas linear em X mas também do ponto de vista de estimação linear nos parâmetros18 L é chamado de logit daí o nome modelo logit para aqueles como a Equação 1556 Veja estas características do modelo logit 1 Quando P vai de 0 a 1 quando Z varia de a o logit L vai de a Embora as probabilidades fiquem por necessidade entre 0 e 1 os logits não são limitados 2 Embora L seja linear em X as probabilidades em si não são Esta propriedade contrasta com o modelo MPL 1551 em que as probabilidades aumentam linearmente com X19 3 Embora tenhamos incluído apenas uma variável X ou regressor no modelo anterior podemos acrescentar tantos regressores quantos forem permitidos de acordo com a teoria que funda menta esse procedimento 4 Se L o logit for positivo significa que quando o valor dos regressores aumenta as chances de o regressando ser igual a 1 indicando que algum evento de interesse acontece aumentam Se L for negativo as chances de o regressando ser igual a 1 diminuem à medida que o valor de X aumenta Em outras palavras o logit tornase negativo e cada vez maior à medida que a razão de chances diminui de 1 para 0 e tornase cada vez maior e positivo quando as chances aumen tam infinitamente a partir de 120 5 Em termos mais formais a interpretação do modelo logit dada na Equação 1556 é a se guinte Ø2 o coeficiente angular mede a variação em L para uma unidade de variação em X ou seja indica quanto o logaritmo das chances favoráveis à posse da casa própria varia em resposta a mudanças de uma unidades por exemplo 1000 na renda O intercepto Ø1 é o valor do logaritmo das chances favoráveis à posse da casa própria quando a renda é igual a zero Como a maioria das interpretações de interceptos esta pode não ter qualquer sentido físico 6 De acordo com o nível de renda por exemplo X se de fato quisermos calcular não as chances favoráveis à posse da casa própria mas a própria probabilidade de ser dono da casa isso pode ser feito diretamente por meio da Equação 1553 uma vez que as estimativas de Ø1 e Ø2 estão disponíveis Isso no entanto levanta a questão mais importante como estimamos Ø1 e Ø2 A resposta é apresentada na próxima seção 7 Enquanto o MPL supõe que Pi está linearmente relacionado a Xi o modelo logit supõe que o log da razão de chances esteja linearmente relacionado a Xi 156 Estimação do modelo logit Para fins de estimação escrevemos a Equação 1556 da seguinte maneira 1561 Discutiremos rapidamente as propriedades do termo de erro estocástico ui 18 lembre que a hipótese de linearidade dos mQO não exige que a variável X seja necessariamente linear Sendo assim podemos incluir X2 X3 etc como regressores no modelo Para nossos objetivos o fundamental é a line aridade nos parâmetros 19 Usando cálculo podemos mostrar que d PdX Ø2 P1 P que indica que a taxa de variação da probabilida de com relação a X envolve não só Ø2 mas também o nível de probabilidade do qual a variação é medida veremos mais sobre o assunto na Seção 157 Observe que o efeito de uma unidade de variação em Xi sobre P é máximo quando P 05 e mínimo quando P está próximo de 0 ou 1 20 esta observação devese a David Garson ECONOBOOKParte02indb 552 23112010 072108 Capítulo 15 Modelos de regressão de resposta qualitativa 553 Para calcularmos a Equação 1561 precisamos além de Xi dos valores do regressando ou logit Li Isso depende do tipo de dados que temos para análise Distinguimos dois tipos de dados 1 dados em nível individual ou micro e 2 dados agrupados ou replicados Dados individuais Se temos dados sobre cada família como no caso da Tabela 151 a estimativa por meio dos MQO da Equação 1561 é inviável É fácil de verificar isso Em termos dos dados apresentados na Tabela 151 Pi 1 se uma família tem casa própria e Pi 0 se não tem casa própria Mas se colocamos esses valores diretamente em logit Li obtemos Obviamente essas expressões não fazem sentido Se os dados estão no nível individual ou micro não podemos estimar 1561 pelo procedimento normal dos MQO Nessa situação podemos recorrer ao método da máxima verossimilhança MV para estimar os parâmetros Embora já tenhamos visto superficialmente esse método no apêndice do Capítulo 4 sua aplicação neste contexto será examinada na Seção 15A1 do Apêndice 15A que poderá ser consultado por aqueles que desejam se aprofundar mais21 Programas especializados como MICROFIT EViews LIMDEP SHAZAM PCGIVE STATA e MINITAB possuem rotinas para estimar o modelo logit no nível individual Iremos ilustrar o uso do método da MV mais à frente neste capítulo Dados agrupados ou replicados Agora considere os dados apresentados na Tabela 154 Ela apresenta dados sobre várias famílias agrupadas ou replicadas observações repetidas de acordo com o nível de renda e o número de famí lias que têm casa própria em cada nível de renda Correspondendo a cada nível de renda Xi há Ni famílias ni entre as quais são proprietários de imóveis ni Ni Portanto se calculamos 1562 21 Para uma discussão comparativamente simples da máxima verossimilhança no contexto do modelo logit veja alDriCh John NelSON Forrest op cit p 4954 Veja também DemarSi alfred Logit modeling practical applications Newbury Park Califórnia Sage Publications 1992 Tabela 154 Dados hipotéticos sobre Xi renda Ni número de famílias com renda Xi e ni número de famílias que possuem casa própria ECONOBOOKParte02indb 553 23112010 072109 554 Parte três Tópicos em econometria a frequencia relativa podemos usála como uma estimativa do verdadeiro Pi correspondendo a cada Xi Se Ni for bem grande POi será uma boa estimativa de Pi22 Usando o Pi estimado podemos obter o logit estimado como 1563 que será uma estimativa boa do verdadeiro logit Li se o número de observações Ni em cada Xi for ra zoavelmente grande Em resumo tendo os dados agrupados ou replicados como na Tabela 154 podemos obter os dados relativos à variável dependente os logits para calcular o modelo 1561 Será possível aplicar os MQO a 1563 e estimar os parâmetros da maneira habitual Nem sempre pois ainda não fala mos nada a respeito das propriedades do termo de erro estocástico É possível demonstrar que se Ni for bem grande e se cada observação em uma classe de renda Xi distribuise independentemente como variável binomial então 1564 ui segue a distribuição normal com média zero e variância igual a 1Ni Pi 1 Pi 23 Portanto como no caso do MPL o termo de erro no modelo logit é heterocedástico Em vez de usarmos o MQO teremos de usar os mínimos quadrados ponderados MQP Para fins empíricos no entanto substituiremos a incógnita Pi por POi e usaremos 1565 como estimador de æ2 Agora descreveremos as várias etapas para estimar a regressão logit 1561 1 Para cada nível de renda X calcule a probabilidade de ter casa própria como POi niNi 2 Para cada Xi obtenha o logit como24 3 Para resolver o problema da heterocedasticidade transforme a Equação 1561 da seguinte maneira25 1566 22 recordese da estatística elementar que a probabilidade de um evento é o limite da frequência relativa quan do o tamanho da amostra tornase infinitamente grande 23 Como mostra a teoria elementar da probabilidade P i a proporção de sucessos neste caso a posse da casa própria segue a distribuição binomial com média igual ao verdadeiro Pi e variância igual a Pi 1 Pi Ni e quando Ni aumenta indefinidamente a distribuição binomial aproximase da distribuição normal as proprie dades distributivas de ui dadas na equação 1564 decorrem dessa teoria básica Para detalhes veja theil henry On the relationships involving qualitative variables American Journal of Sociology jul 1970 v 76 p 103154 24 Como POi H ni Ni Li pode ser expresso como LOi H in ni Ni ni Vale mencionar que para evitar que POi assuma o valor de 0 ou 1 na prática LOi é medido como recomendase como regra prática que Ni seja no mínimo 5 em cada valor de Xi Para maiores detalhes veja COX D r Analysis of binary data londres methuen 1970 p 33 25 Se estimamos a equação 1561 desconsiderando a heterocedasticidade os estimadores embora não tenden ciosos não serão eficientes como vimos no Capítulo 11 ECONOBOOKParte02indb 554 23112010 072110 Capítulo 15 Modelos de regressão de resposta qualitativa 555 que escrevemos como 1567 em que os pesos wi Ni POi 1 POi Li Li transformado ou ponderado X i Xi transfor mado ou ponderado e vi termo de erro transformado É fácil verificar que o termo de erro transformado vi é homocedástico tendo em mente que a variância do erro original é æ 2 u 1NiPi1 Pi 4 Estimamos a Equação 1566 por MQO lembrese de que os MQP são os MQO sobre os dados transformados Observe que na Equação 1566 não há termo de intercepto introduzido explicitamente por quê Teremos de usar a regressão que passa pela origem para calcular a Equação 1566 5 Estabelecemos intervalos de confiança eou testamos hipóteses dentro do habitual marco de refe rência dos MQO mas tendo em mente que todas as conclusões só serão rigorosamente válidas se a amostra for suficientemente grande por quê No caso de pequenas amostras os resultados estimados terão de ser interpretados com extremo cuidado 157 O modelo logit agrupado Glogit um exemplo numérico Para ilustrarmos a teoria que acabamos de discutir empregaremos os dados da Tabela 154 Como eles são agrupados o modelo logit baseado nesses dados será chamado de modelo logit agrupado glogit para resumir Os dados brutos necessários e outros cálculos relevantes para a implementação do glogit estão na Tabela 155 Os resultados da regressão de mínimos quadrados ponderados 1567 baseados nos dados da Tabela 155 são os seguintes observe que não há in tercepto na Equação 1567 daí o procedimento de regressão que passa pela origem é adequado neste caso 1571 O R2 é o coeficiente de correlação elevado ao quadrado entre o Li observado e o estimado Li e X i são os Li e Xi ponderados como mostra a Equação 1566 Embora tenhamos apresentado os cálculos do logit agrupado na Tabela 155 por razões pedagógicas isso pode ser feito facilmente utilizando o co mando glogit logit agrupado no programa STATA interpretação do modelo logit estimado Como interpretamos a Equação 1571 Há várias m5aneiras algumas intuitivas e outras não Interpretação do logit Como a Equação 1571 mostra o coeficiente angular estimado sugere que para o aumento de uma unidade 1000 na renda ponderada o log ponderado das chances de ter casa própria aumenta em 008 unidade Esta interpretação mecânica no entanto não é muito convincente Interpretação das chances Lembrese de que Li ln Pi1 Pi Portanto tomando o antilogaritmo do logit esti mado obtemos Pi1 Pi a razão de chances Logo tomando o antilogaritmo da Equação 1571 obtemos ECONOBOOKParte02indb 555 23112010 072111 556 Parte três Tópicos em econometria Tabela 155 Dados para calcular o modelo logit para a posse da casa prória ECONOBOOKParte02indb 556 23112010 072111 Capítulo 15 Modelos de regressão de resposta qualitativa 557 1572 Usando uma calculadora podemos verificar facilmente que e007862 10817 Isso significa que para uma unidade de aumento da renda ponderada as chances ponderadas favoráveis à posse da casa própria aumentam em 10817 ou cerca de 817 Em geral se tomamos o antilogaritmo do jésimo coeficiente angular no caso em que haja mais de um regressor no modelo subtraímos 1 dele e multiplicamos o resultado por 100 obtemos a variação percentual das chances em favor de um au mento de uma unidade no jésimo regressor Se você quer efetuar a análise em termos do logit não ponderado basta dividir o Li estimado por A Tabela 156 apresenta os logits estimados ponderados e não ponderados para cada observação e alguns outros dados que discutiremos em breve Cálculo de probabilidades Uma vez que a linguagem de logit e a razão de chances podem ser desconhecidas para alguns leitores podemos calcular a probabilidade de ter casa própria em certo nível de renda Suponha que desejemos calcular essa probabilidade em X 20 20000 Inserindo esse valor na Equação 1571 obtemos LO i 009311 e dividindo por veja a Tabela 155 obtemos LOi 002226 Portanto ao nível de renda de 20000 temos Portanto Resolvendo isso para Lstar e Xstar são da Tabela 155 Logit é o logit não ponderado Probabilidade é a probabilidade estimada de ter casa própria Variação da probabilidade por unidade de alteração na renda Calculado a partir de ØO2 PO 1 PO 007862PO 1 PO Tabela 156 L X OL estimado probabilidade e variação da probabilidade ECONOBOOKParte02indb 557 23112010 072113 558 Parte três Tópicos em econometria o leitor pode ver que a probabilidade estimada é 04945 Ou seja dada a renda de 20 mil a proba bilidade de uma família ter casa própria é de aproximadamente 49 A Tabela 156 apresenta as probabilidades calculadas nos vários níveis de renda Como mostra a tabela a probabilidade de ter casa própria aumenta com a renda mas não linearlmente com o modelo de probabilidade linear Cálculo da variação da probabilidade De acordo com a Tabela 156 a probabilidade de ter casa própria depende do nível de renda Como calculamos a taxa de variação das probabilidades à medida que a renda muda Segundo a nota de rodapé 19 isso não depende apenas do coeficiente angular estimado Ø2 mas também do nível de probabilidade do qual a variação é medida esta última depende obviamente do nível de renda em que a probabilidade é calculada Para ilustrarmos suponha que desejemos medir a variação na probabilidade de termos uma casa com renda no nível de 20 mil Da nota de rodapé 19 a variação na probabilidade para uma unidade aumentar do nível 20 mil é ØO 1 PO PO 00786200505604944 001965 Fica como exercício para o leitor mostrar que ao nível de renda de 40 mil a variação na proba bilidade é de 001135 A Tabela 156 apresenta a variação na probabilidade de ter casa própria em vários níveis de renda essas probabilidades também estão na Figura 153 Para concluirmos nossa discussão do modelo glogit apresentamos os resultados com base nos MQO ou regressão não ponderada para o exemplo relativo à casa própria 1573 A comparação dessa regressão com a regressão de mínimos quadrados ponderados da Equação 1571 é deixada para o leitor 158 O modelo logit para dados não agrupados ou individuais Para iniciar considere os dados da Tabela 157 Sendo Y 1 se a nota final de um aluno na prova do curso de microeconomia fosse A e Y 0 se o conceito final fosse B ou C Spector e Mazzeo usaram a pontuação média GPA o TUCE e o Sistema de Instrução Personalizado PSI como previsores do conceito dado para classificar o aproveitamento do aluno O modelo logit pode ser escrito como Figura 153 Variação na probabilidade em relação à renda 00115 10 15 20 25 X renda mil 30 35 40 45 0012 0013 0014 0015 Variação na probabilidade 0016 0017 0018 0019 0020 ECONOBOOKParte02indb 558 23112010 072114 Capítulo 15 Modelos de regressão de resposta qualitativa 559 1581 Como observado na Seção 156 não podemos apenas colocar Pi 1 se uma família possui casa própria e zero se não possui No caso nem os MQO nem os mínimos quadrados ponderados MQP são úteis Precisamos recorrer a procedimentos de estimação não lineares usando o método da máxi ma verossimilhança Os detalhes desse método são apresentados na Seção 15A1 do Apêndice 15A Como a maioria dos programas estatísticos modernos inclui rotinas para estimar modelos logit com base em dados não agrupados apresentaremos os resultados do modelo 1581 empregando os da dos da Tabela 157 e mostraremos como interpretar os resultados apresentados de forma tabular na Tabela 158 e obtidos com auxílio do Eviews 6 Antes de interpretarmos os resultados façamos algumas observações gerais 1 Por estarmos usando o método de máxima verossimilhança que em geral é um método de amostras grandes os erros padrão estimados são assintóticos 2 Como resultado em vez de utilizarmos a estatística t para avaliar a significância estatística de um coeficiente usamos a estatística Z normal Portanto as inferências baseiamse na tabela normal Lembrese de que se o tamanho da amostra for razoavelmente grande a disribuição t convergirá para a distribuição normal 3 Como observado anteriormente a medida convencional da qualidade do ajustamento R2 não é particularmente significativa nos modelos com regressando binário Medidas seme lhantes a R2 chamadas pseudo R2 são disponíveis e há uma variedade delas26 O EViews apresenta uma dessas medidas o R2 de McFadden denotado por R2 McF cujo valor em nossos 26 Para uma discussão acessível veja lONG J Scott Regression models for categorical and limited dependent variables Newbury Park Califórnia Sage Publications 1997 p 102113 Tabela 157 Dados sobre o efeito do Sistema de Instrução Personalizado PSI em pontos que indicam o aproveitamento do aluno Notas Y 1 se o conceito final for A 0 se for B ou C TUCE pontuação em prova dada no início do semestre para testar o conhecimento inicial de macroeconomia PSI 1 se um novo método de ensino for usado 0 em caso contrário GPA média de pontos no início do curso Fonte SPECTOR L MAZZEO M Probit analysis and economic education Journal of Economic Education v 11 p 3744 1980 ECONOBOOKParte02indb 559 23112010 072115 560 Parte três Tópicos em econometria exemplos é 0374027 Como R2 R2 McF também varia entre 0 e 1 Outra medida comparativa mente simples da qualidade do ajustamento é o count R2 definido como 1582 Uma vez que o regressando no modelo logit assume valor 1 ou zero se a probabilidade prevista for maior que 05 classificamos como 1 mas se for menor que 05 classificamos como 0 Então contamos o número de previsões corretas e calculamos o R2 como dado na Equação 1582 Apre sentaremos um rápido exemplo disso Devese notar no entanto que em modelos de regressando binário a qualidade do ajustamento é de importância secundária O que importa são os sinais esperados dos coeficientes de regressão e sua significância estatística eou prática 4 Para testar a hipótese nula de que todos os coeficientes angulares são simultaneamente iguais a zero o equivalente do teste F para o modelo de regressão linear é a estatística da ra zão de verossimilhança Dada a hipótese nula a estatística da razão de verossimilhança RV segue a distribuição de 2 com o número de graus de liberdade igual ao número de variáveis explanatórias três nesse exemplo Nota o termo de intercepto é excluído para calcular os graus de liberdade Agora vamos interpretar os resultados de regressão dados na Equação 1581 Cada coeficiente angular nessa equação é um coeficiente angular parcial e mede a variação no logit estimado para uma variação unitária do valor do regressor dado mantendose tudo o mais constante O coeficiente GPA de 28261 indica que mantidas as demais variáveis constantes se o GPA aumenta em uma unidade o logit estimado aumenta em média cerca de 283 unidades sugerindo uma relação positiva entre os dois Como se vê todos os demais regressores têm um efeito positivo sobre o logit embora estatis ticamente o efeito de TUCE não seja significativo Contudo todos os regressores em conjunto têm um impacto significativo na nota final já que a estatística RV é 1540 cujo valor p é cerca de 00015 que é muito pequeno Como observado uma interpretação mais significativa está em termos de chances que são obti das tomandose o antilogaritmo dos vários coeficientes angulares Se tomarmos o antilogaritmo do coeficiente PSI de 23786 obteremos 107897 e23786 Isso sugere que os estudantes submetidos ao novo método de ensino têm dez vezes mais chances de obterem A do que aqueles que não são subme tidos a ele tudo o mais mantido constante 27 tecnicamente isto é definido como 1 llFurllFr em que llFur é a função logarítmica não restrita de veros similhança na qual estão incluídos todos os regressores do modelo e llFr é a função logarítmica restrita de verossimilhança na qual está incluído apenas o intercepto Conceitualmente llFur é equivalente à SQr e llFr é o equivalente de SQt no modelo de regresão linear Tabela 158 Regressão de dados da Equação 1581 ECONOBOOKParte02indb 560 23112010 072115 Capítulo 15 Modelos de regressão de resposta qualitativa 561 Imagine que desejemos calcular a probabilidade efetiva de um estudante obter conceito A Con sidere o caso do estudante número 10 na Tabela 157 Colocando os dados observados desse estudan te no modelo estimado logit da Tabela 158 o leitor pode verificar que o valor estimado do logit para esse estudante é 08178 Com auxílio da Equação 1552 o leitor constatará facilmente que a proba bilidade estimada é de 069351 Como a nota final efetiva desse estudante foi um A e como nosso modelo logit atribui uma probabilidade igual a 1 para um estudante que receba A a probabilidade estimada de 069351 não é exatamente igual a 1 mas está próxima Lembrese do count R2 definido anteriormente A Tabela 159 dá os valores efetivo e previsto do regressando para nosso exemplo ilustrativo Dela podemos observar que de 32 observações havia seis previsões incorretas os estudantes 14 19 24 26 31 e 32 Desse modo o valor do count R2 é 2632 08125 enquanto o valor R2 de McFadden é 03740 Embora esses dois valo res não sejam diretamente comparáveis eles dão ideia das ordens de grandeza Além disso não devemos exagerar a importância da qualidade do ajustamento em modelos em que o regressando é dicotômico Previsões incorretas Tabela 159 Valores efetivo e observado baseados na regressão da Tabela 158 ECONOBOOKParte02indb 561 23112010 072116 562 Parte três Tópicos em econometria exeMplO 155 Quem tem cartão de débito Análise logit Já vimos os resultados do modelo de probabilidade linear aplicados aos dados de car tão de débito então vamos ver como o modelo logit funciona Os resultados são os se guintes O sinal positivo do Saldo e os sinais negativos do Caixa eletrônico e da taxa de Juros são parecidos com o mPl embora não possamos comparar diretamente os dois a interpretação dos coeficientes no modelo logit é diferente daquela do mPl Por exemplo se a taxa de juros sobe em 1 ponto percentual o logit diminui em cerca de 135 mantendose as demais variá veis constantes Se tomamos o antilogaritmo de 1352086 obtemos aproximadamente 02587 isso significa que se a taxa de juros for paga sobre o saldo bancário em média ape nas um quarto dos clientes provavelmente tem cartões de crédito Da estatística rV estimada vemos que coletivamente as três variáveis são significativas do ponto de vista estatístico aproximadamente ao nível de 85 Se usarmos o nível convencio nal de 5 de significância essas variáveis terão significância marginal O valor R2 de mcFadden é bem baixo Usando os dados o leitor pode descobrir o valor do count R2 Como observado diferentemente do mPl os coeficientes angulares não nos dão a taxa de variação da probabilidade para uma unidade de variação no regressor temos de calculálos como mostra a tabela 156 Felizmente essa tarefa manual não é necessária pois progra mas estatísticos como o Stata podem fazer isso Para nosso exemplo os resultados são os seguintes efeitos marginais após o logit Y Prdébito previsto 042512423 dydx representa a variação discreta da variável dummy de 0 para 1 Continua ECONOBOOKParte02indb 562 23112010 072117 Capítulo 15 Modelos de regressão de resposta qualitativa 563 exeMplO 155 Continuação O coeficiente de 0000305 sugere que os clientes com saldos mais altos têm uma proba bilidade 003 maior de possuir cartão de débito mas se a taxa de juros subir em 1 ponto percentual a probabilidade de terem cartão de débito cai 30 O coeficiente do caixa eletrô nico embora estatisticamente insignificante sugere que se as transações em caixa eletônico subirem em uma unidade a probabilidade de ter cartão de débito abaixa cerca de 29 159 O modelo probit Como observamos para explicar o comportamento de uma variável dependente dicotômica tere mos de usar uma função de distribuição acumulada FDA escolhida adequadamente O modelo logit usa a função logística acumulada como mostra a Equação 1552 Mas esta não é a única FDA que podemos utilizar Em algumas aplicações a FDA normal tem sido útil O modelo de estimação que emerge da FDA normal28 é conhecido como modelo probit embora às vezes também seja conhecido como modelo normit Em princípio se poderia substituir a FDA normal em lugar da FDA logística na Equação 1552 e continuar como na Seção 165 Em vez de seguirmos essa rotina apresentare mos o modelo probit com base na teoria da utilidade ou na perspectiva da escolha racional sobre o comportamento desenvolvida por McFadden29 Para motivarmos o modelo probit consideremos que em nosso exemplo da casa própria a deci são da iésima família de ter uma casa própria ou não depende de um índice de utilidade não obser vável Ii também conhecido como variável latente que é determinado por uma ou mais variáveis explanatórias por exemplo a renda Xi de tal modo que quanto maior for o valor do índice Ii maior a probabilidade de uma família ter uma casa Expressamos o índice Ii como 1591 em que Xi é a renda da iésima família Como o índice não observável relacionase com a decisão real de ter uma casa Como antes seja Y 1 se a família tiver uma casa e Y 0 se não tiver Agora é razoável supor que há um nível crítico ou limiar do índice que chamamos de I i tal que se Ii exceder I i a família terá uma casa caso contrário não terá O limiar I i como Ii não é observável mas se supusermos que ele se distri bui normalmente com a mesma média e variância é possível não apenas estimar os parâmetros do índice dado em 1591 mas obter algumas informações sobre o próprio índice não observável O cálculo é apresentado a seguir Dada a hipótese da normalidade a probabilidade de que I i seja menor ou igual a Ii pode ser cal culada por meio da FDA normal padronizada como30 1592 28 Veja o apêndice a para uma discussão da FDa normal Para uma breve explicação se uma variável X segue a distribuição normal com média π e variância æ2 sua FDa é e sua FDa é em que X0 é um valor específico de X 29 mcFaDDeN D Conditional logit analysis of qualitative choice behavior in ZaremBKa P ed Frontiers in econometrics Nova York academic Press 1973 30 Uma distribuição normal com média zero e variância unitária 1 é conhecida como uma variável padrão ou padronizada ou normal padrão veja o Apêndice A ECONOBOOKParte02indb 563 23112010 072118 564 Parte trés Tépicos em econometria FIGURA 154 P F P F Modelo probit a Ed dado J lése P a partir da ordenada P 3p P I 1 P b dado P lése I a partir da abscissa A 0 0 T By By X I FP a b em que PY X indica a probabilidade de um evento ocorrer dados 0s valores das variavelis explanatérias X e em que Z a varidvel normal padrao isto é Z N0 0 F é a FDA normal padrao neste contexto escrita explicitamente da seguinte forma FI 1 fi 22 d e Z M20 Jco 1593 1 Bit B2X 29 edz V20 Como P representa a probabilidade de um evento ocorrer no caso a probabilidade de ter uma casa propria ele é medido pela area da curva normal padrao de oo a J como mostra a Figura 154a Agora para obtermos informag6es sobre J o indice de utilidade bem como sobre f e 65 toma mos 0 inverso da Equagao 1592 para obter 1 j 1 A Fi FOP 1594 Bit PoXi em que F 60 inverso da FDA normal O significado de tudo isso fica claro na Figura 154 No painel a da figura obtemos da ordenada a probabilidade acumulada de ter casa propria dado Jj en quanto no painel b obtemos da abscissa o valor de J dado o valor de P que é apenas o inverso da primeira Mas como obtemos concretamente o indice J e estimamos f e 8 Como no caso do modelo logit a resposta depende de termos dados agrupados ou nao agrupados Consideraremos os dois casos in dividualmente Estimagao do probit com dados agrupados gprobit Usaremos os mesmos dados que os utilizados para o glogit da Tabela 154 Como ja temos P a frequéncia relativa a medida aplicada da probabilidade de ter uma casa propria com varios niveis de renda como mostra a Tabela 155 podemos usala para obter Jda FDA normal como mostra a Tabela 1510 ou da Figura 155 Capitulo 15 Modelos de regressGo de resposta qualitativa 565 TABELA 1510 6 1p P i FP Estimando o indice J da FDA normal 020 08416 padrao 024 07063 030 05244 035 03853 045 01257 051 00251 060 02533 066 04125 075 06745 080 08416 Notas 1 P sao extraidos da Tabela 155 2 J sao estimativas da FDA normal padrao Uma vez que estimamos estimar 6 e 6 é relativamente simples como mostramos rapidamen te Observe que na linguagem da andlise probit o indice de utilidade nao observavel J conhecido como desvio normal equivalente dne ou simplesmente normit Uma vez que o desvio normal equivalente ou J sera negativo sempre que P 05 na pratica o nimero 5 é adicionado ao desvio e o resultado é chamado de probit FIGURA 155 1 FDA normal a 066 Y 0 04 EXEMPLO 156 Continuaremos com o exemplo da casa propria Ja apresentamos os resultados do mode Ilustracdo do lo glogit referente a este exemplo O resultado do probit agrupado gprobit com os mesmos gprobit dados é o seguinte utilizando o Com os desvios normais equivalentes dados na Tabela 1510 os resultados da re exemplo da casa gressdo sao os mostrados na Tabela 15113 Os resultados da regressdo baseados nos probits P desvios normais equivalentes 5 séo apresentados na Tabela 1512 propria Com excegao do termo de intercepto esses resultados sao idénticos aos da tabela ante rior mas isso nado deveria ser uma surpresa Por qué TABELA 1511 Dependent Variable I Variable Coefficient Std Error tStatistic Probability Cc 10166 00572 177473 10397E07 Income 004846 000247 195585 48547E08 R097951 DurbinWatson statistic 091384 Continua 31 Os resultados a seguir nao sdo correlacionados para heterocedasticidade Veja o Exercicio 1512 para o proce dimento adequado usado na correcao da heterocedasticidade 566 Parte três Tópicos em econometria exeMplO 156 Continuação Tabela 1512 Nota estes resultados não estão corrigidos para heterocedasticidade veja o Exercício 1512 Interpretação das estimativas do probit na Tabela 1511 Como interpretamos os resultados anteriores Suponha que desejemos encontrar o efeito de uma variação unitária em X renda medida em milhares de dólares sobre a probabilidade de Y 1 ou seja uma família comprar uma casa Para tanto veja a Equação 1592 Queremos derivar essa função com relação a X a taxa de variação da probabilidade em relação à renda Essa derivada é 159532 em que f Ø1 Ø2 Xi é a função de densidade de probabilidade normal padrão em Ø1 Ø2 Xi Como você perceberá essa avaliação dependerá do valor das variáveis X Vamos tomar o valor de X da Tabela 155 por exemplo X 6 milhares de dólares Usando os valores estimados dos parâmetros dados na Tabela 1511 queremos encontrar a função de densidade normal em f 10166 0048466 f 072548 Se nos referirmos às tabelas de distribuição normal verificamos que para Z 072548 a densidade normal é cerca de 0306633 Agora multiplicando esse valor pelo coeficiente angular de 004846 obtemos 001485 Isso indica que começando com a renda de 6 mil se a renda subir 1 mil a probabilidade de uma família comprar uma casa subirá cerca de 14 Compare este resulta do com o da Tabela 156 Como podemos ver comparado com os modelos logit e MPL o cálculo de variações na probabi lidade usando o modelo probit é um pouco trabalhoso Em vez de calcular as variações na probabilidade suponha que você queira encontrar as probabi lidades estimadas do modelo gprobit Isso pode ser feito facilmente Usandose os dados da Tabela 1511 e inserindo os valores de X da Tabela 155 o leitor pode verificar que os valores dne até dois dígitos são os seguintes dne estimado Agora programas como MINITAB podem calcular facilmente as probabilidades acumuladas associadas aos vários dne Por exemplo correspondendo a um valor dne 063 a probabilidade es timada é de 02647 e correspondendo a um valor dne de 043 a probabilidade estimada é de 06691 Se compararmos essas estimativas com os valores reais dados na Tabela 155 verificaremos que as 32 Usamos a regra das derivadas em cadeia em que t Ø1 Ø2 Xi 33 Note que o padrão normal Z pode variar de a mas a função de densidade f Z é sempre positiva ECONOBOOKParte02indb 566 23112010 072121 Capítulo 15 Modelos de regressão de resposta qualitativa 567 duas estão bem próximas sugerindo que o modelo ajustado é bom Graficamente o que fizemos já foi apresentado na Figura 154 O modelo probit para dados não agrupados ou individuais Retomaremos a Tabela 157 em que se apresentam as notas finais de 32 alunos para as variâncias GPA TUCE e PSI Os resultados da regressão logit estão na Tabela 158 Vejamos agora os resulta dos probit para os mesmos dados Observe que como no caso do modelo logit para dados não agrupados teremos de recorrer a um procedimento de estimação não linear embasado no método da máxima verossimilhança Os resultados dessa regressão calculada pelo EViews 6 estão na Tabela 1513 Qualitativamente os resultados do modelo probit são comparáveis aos obtidos do modelo logit no que se refere à significância estatística individual dos coeficientes das variáveis GPA e PSI Cole tivamente todos os coeficientes são estatisticamente significativos já que o valor de estatística da razão de verossimilhança é de 155458 com um valor p de 00014 Por motivos examinados nas próximas seções não podemos comparar os coeficientes de regressão logit e probit Para fins de comparação apresentamos os resultados com base no modelo de probabilidade linear MPL para os conceitos da Tabela 1514 Novamente em termos qualitativos os resultados MPL são semelhantes aos modelos logit e probit no sentido de que o GPA e o PSI são estatisticamente signifi cativos mas o TUCE não Além disso as variáveis explanatórias juntas têm um impacto significativo no conceito pois o valor F de 66456 é estatisticamente significativo porque seu pvalor é de apenas 00015 Tabela 1513 Tabela 1514 O efeito marginal de uma variação unitária no valor de um regressor nos vários modelos de regressão No modelo de regressão linear o coeficiente angular mede a variação do valor médio do regres sando para uma variação unitária no valor de um regressor mantidas constantes as demais variáveis ECONOBOOKParte02indb 567 23112010 072122 568 Parte três Tópicos em econometria No modelo de probabilidade linear o coeficiente angular mede diretamente a variação na proba bilidade de um evento ocorrer como o resultado de uma variação unitária no valor de um regressor com o efeito de todas as outras variáveis mantidas constantes No modelo logit o coeficiente angular de uma variável dá a variação no logaritmo das chances associadas a uma variação unitária naquela variável novamente mantendo as demais variáveis cons tantes Mas como observado para o modelo logit a taxa de variação na probabilidade de um evento acontecer é dada por Øj Pi 1 Pi em que Øj é o coeficiente regressão parcial do jésimo regressor Mas ao avaliar Pi todas as variáveis incluídas na análise são envolvidas No modelo probit como vimos anteriormente a taxa de variação na probabilidade é compli cada e é dada por Øj f Zi em que f Zi é a função de densidade da variável normal padrão e Zi Ø1 Ø2 X2i Øk Xki isto é o modelo de regressão usado na análise Tanto no modelo logit quanto no modelo probit todos os regressores estão envolvidos no cálculo das variações na probabilidade enquanto no MPL apenas o jésimo regressor está envolvido Essa diferença pode ser uma razão para a preferência do modelo MPL Programas de estatística como o STATA calculam a taxa de variação da probabilidade para os modelos logit e probit com mais faci lidade Não há mais necessidade de escolher o MPL só pela simplicidade dos cálculos 1510 Modelos logit e probit Embora no caso do exemplo das notas finais os modelos de probabilidade linear logit e probit oferecessem do ponto de vista qualitativo resultados semelhantes restringiremos nossa atenção aos modelos logit e probit devido aos problemas do modelo de probabilidade linear já mencionados Entre logit e probit qual o preferível Na maioria das aplicações os modelos são bastante parecidos a principal diferença está na distribuição logística que tem caudas ligeiramente mais pesadas como podemos ver na Figura 156 Ou seja a probabilidade condicional Pi aproximase de 0 ou 1 com um ritmo mais lento no logit que no probit Podemos ver isso mais claramente na Tabela 1515 Não há razões convincentes para preferir um dos modelos ao outro Na prática muitos pesquisadores esco lhem o modelo logit por sua relativa simplicidade matemática Embora os modelos sejam semelhantes devese ficar atento ao interpretar os coeficientes estima dos pelos dois modelos Por exemplo para nosso exemplo de conceitos na escola o coeficiente de GPA de 16258 do modelo probit veja a Tabela 1513 e 28261 do modelo logit veja a Tabela 158 não são diretamente comparáveis Isso porque embora a distribuição logística padrão a base do logit e a normal padrão a base do probit tenham ambas média zero suas variâncias são diferentes 1 para a normal padrão como já sabemos e º23 para a logística em que º º 227 Portanto se multi plicarmos o coeficiente probit por 181 que é aproximadamente obteremos aproximada mente o coeficiente logit Para nosso exemplo o coeficiente probit de GPA é 16258 Multiplicando isso por 181 obtemos 294 que está próximo do coeficiente logit Por outro lado se multiplicarmos o coeficiente logit por 055 1181 obteremos o coeficiente probit 0 1 P Probit Logit Figura 156 Distribuições acumuladas logit e probit ECONOBOOKParte02indb 568 23112010 072123 Capítulo 15 Modelos de regressão de resposta qualitativa 569 Amemiya sugere no entanto a multiplicação de uma estimativa logit por 0625 para ter uma es timativa melhor da estimativa probit correspondente34 Por outro lado multiplicando um coeficiente probit por 16 10625 temos o coeficiente logit correspondente A propósito Amemiya também mostrou que os coeficiente de MPL são relacionados como se segue e Deixamos para o leitor verificar se essas aproximações são válidas para o exemplo da pontuação final de curso Para concluirmos nossa discussão sobre o MPL e os modelos logit e probit vamos considerar um exemplo extenso 35 exeMplO 157 Fumar ou não fumar Para descobrirmos quais fatores determinam se uma pessoa será ou não fumante obtivemos dados de 1196 indivíduos35 Para cada indivíduo há informações sobre edu cação idade renda e o preço de cigarros em 1979 a variável dependente é o fumante sendo 1fumantes e 0não fumantes mais análises serão realizadas no exercício 1520 e os dados podem ser encontrados na tabela 1528 no site deste livro Para fins de compa ração apresentamos os resultados com base nos modelos mPl logit e probit em forma tabular veja a tabela 1516 esses resultados foram obtidos da versão 10 do Stata Continua 34 amemiYa t Qualitative response model a survey Journal of economic literature 1981 v 19 p 481536 35 estes dados são de murray michael P Econometrics a modern introduction Boston PearsonaddisonWesley 2006 e estão disponíveis em wwwawbccommurray Tabela 1515 Valores das funções de probabilidade acumulada ECONOBOOKParte02indb 569 23112010 072123 570 Parte três Tópicos em econometria exeMplO 157 Continuação Tabela 1516 Notas Os dados entre parênteses são razões t para o MPL e razões Z para o logit e probit Para o logit e o probit os valores de R2 são pseudorazões R2 embora os coeficientes dos três modelos não sejam diretamente comparáveis qualitati vamente são semelhantes assim idade educação e preço dos cigarros têm impacto nega tivo em fumar e a renda tem impacto positivo estatisticamente o efeito renda é zero e o efeito preço é significativo ao nível aproximado de 8 No exercício 1520 pedese que seja aplicado o fator de conversão para se obter vários coeficientes comparáveis Na tabela 1517 apresentamos o efeito marginal de cada variável sobre a probabilidade de fumar para cada tipo de modelo Tabela 1517 Nota exceto a renda os coeficientes estimados apresentam alta significância estatística para idade e escolaridade e apresentam significância ao nível aproximado de 8 para o preço de cigarros Como reconheceremos o efeito marginal de uma variável sobre a probabilidade de fumar para o mPl é obtido dos coeficientes de regressão estimados mas para os modelos logit e probit eles precisam ser calculados como apresentado no capítulo É interessante que os efeitos marginais sejam bastante parecidos para os três modelos Por exemplo se o nível de escolaridade aumenta em média a probabilidade de alguém se tornar um fumante diminui em cerca de 2 1511 O modelo tobit Uma extensão do modelo probit é o tobit originalmente desenvolvido por James Tobin Prêmio Nobel de economia Para explicarmos esse modelo continuaremos com o exemplo da casa própria No modelo probit nossa preocupação era estimar a probabilidade de ter casa própria como função de algumas variáveis socioeconômicas No modelo tobit nosso interesse é verificar o montante em dinheiro que uma pessoa ou família gasta em uma casa em relação a variáveis socioeconômicas Agora enfrentamos um dilema se um consumidor não compra uma casa obviamente não temos dados sobre despesas com habitação para esses consumidores temos dados apenas para os consu midores que realmente compram uma casa Os consumidores são divididos em dois grupos um consistindo em por exemplo n1 consumido res sobre os quais temos informação a respeito dos regressores por exemplo renda taxa de juros de ECONOBOOKParte02indb 570 23112010 072124 Capítulo 15 Modelos de regressão de resposta qualitativa 571 hipotecas número de pessoas na família etc bem como do regressando montante de despesas com habitação e outro consistindo em n2 consumidores sobre quem temos informação apenas dos regres sores mas não do regressando Uma amostra em que as informações do regressando são disponíveis apenas para algumas observações é conhecida como amostra censurada36 Portanto o modelo tobit é conhecido também como um modelo de regressão censurado Alguns autores chamam esses modelos de modelos de regressão com variável dependente limitada devido à restrição imposta aos valores assumidos pelos regressando Estatisticamente podemos expressar o modelo tobit como 15111 em que LD lado direito Nota variáveis adicionais X podem ser incluídas facilmente ao modelo Podemos calcular a regressão 15111 usando apenas n1 observações e não nos preocupando com as n2 observações remanescentes A resposta é não pois as estimativas MQO dos parâmetros obtidas do subconjunto de n1 observações serão tendenciosas e inconsistentes são tendenciosas mesmo as sintoticamente37 Para tanto considere a Figura 157 Se Y não for observado em virtude da censura todas essas observações n2 denotadas por cruzes ficarão no eixo horizontal Se Y for observado as observa ções n1 denotadas por pontos ficarão no plano XY Tornase claro intuitivamente que se estimar mos uma linha de regressão com base apenas em n1 observações o intercepto e os coeficientes angulares resultantes tenderão a ser diferentes do que se todas as n1 n2 forem levadas em consideração Como podemos estimar os modelos tobit ou de regressão censurada como a Equação 15111 O mecanismo real envolve o método de máxima verossimilhança que é bastante complexo e está além do escopo deste livro mas o leitor poderá obter mais informações sobre o método consultando as referências38 36 Uma amostra censurada deve ser distinguida de uma amostra truncada em que as informações dos regres sores estão disponíveis apenas se o regressando for observado Não trataremos desse assunto aqui mas o leitor interessado pode consultar GreeNe William h Econometric analysis 4 ed englewood Cliffs NJ Prentice hall cap 19 Para uma discussão menos complexa veja KeNNeDY Peter A guide to econometrics 4 ed Cambridge mass the mit Press 1998 cap 16 37 O viés surge do fato de que se consideramos apenas as n1 observações e omitimos as outras não há garantia de que E ui será necessariamente zero e sem E ui 0 não podemos garantir que as estimativas do mQO serão não tendenciosas esse viés é abordado no apêndice 3a equações 4 e 5 38 Veja GreeNe op cit Uma discussão um pouco menos técnica pode ser encontrada em BreeN richard Regression models censored sample selected or truncated data Newbury Park Califórnia Sage Publications1996 Figura 157 Diagrama de dispersão do montante gasto na compra de casa própria versus renda Y X Despesas com habitação dados de despesas não disponíveis mas dados de renda disponíveis dados disponíveis de despesa e renda Renda ECONOBOOKParte02indb 571 23112010 072125 572 Parte três Tópicos em econometria James Heckman propôs um método alternativo ao da máxima verossimilhança MV que é com parativamente simples39 Consiste em um procedimento de estimação em duas etapas Na primeira calculamos a probabilidade de um consumidor ter casa própria o que é feito com base no modelo probit Na segunda calculamos o modelo 15111 acrescentando uma variável chamada razão in versa de Mills ou taxa de risco que é derivada da estimativa probit Para o mecanismo real veja o artigo de Heckman O procedimento de Heckman resulta em estimativas consistentes dos parâmetros da Equação 15111 mas não são tão eficientes quanto as estimativas de MV Uma vez que os progra mas de estatística mais modernos seguem a rotina da MV pode ser preferível usálos em vez do proce dimento Heckman de duas etapas ilustração do modelo tobit o modelo de ray Fair de casos extraconjugais40 Em um artigo interessante e inovador do ponto de vista teórico Ray Fair coletou uma amostra de 601 homens e mulheres casados pela primeira vez e analisou suas respostas a uma pergunta sobre casos extraconjugais41 As variáveis usadas neste estudo são definidas como se segue Y número de casos no ano anterior 0 1 2 3 410 codificados como 7 Z1 0 para mulheres e 1 para homens Z2 idade Z3 número de anos casado Z4 filhos 0 se não tiver filhos e 1 se tiver Z5 religiosidade em uma escala de 1 a 5 1 sendo ateu Z6 escolaridade primário 9 segundo grau 12 doutorado ou outro 20 Z7 ocupação segundo a escala Hollingshead 17 Z8 autoavaliação no casamento 1 muito infeliz 5 muito feliz Valores entre parênteses são os valores t Valores entre parênteses são os valores Z normal padrão Nota no total há 601 observações das quais 451 têm valores zero para a variável dependente número de casos extraconjugais e 150 têm valores não iguais a zero Das 601 respostas 451 indivíduos não tiveram casos extraconjugais e 150 indivíduos tiveram um ou mais casos Nos termos da Figura 157 se traçarmos o gráfico do número de casos no eixo vertical e por exemplo escolaridade no eixo horizontal haverá 451 observações ao longo do eixo horizontal Temos uma amostra censurada e um modelo tobit pode ser adequado 39 heCKmaN J J Sample selection bias as a specification error Econometrica v 47 p 153161 40 Fair ray a theory of extramarital affairs Journal of Political Economy v 86 1978 p 4561 leia httpfair modeleconyaleedurayfairpdf1978DatZiP sobre os dados 41 em 1969 Psychology Today publicou um questionário com 101 perguntas sobre gênero e pediu aos leitores para enviarem suas respostas Na edição de julho de 1970 os resultados da pesquisa foram discutidos com base em 2 mil respostas coletadas na forma eletrônica ray Fair extraiu a amostra de 601 dessas respostas Tabela 1518 Estimativas de MQO e tobit de casos extraconjugais ECONOBOOKParte02indb 572 23112010 072125 Capítulo 15 Modelos de regressão de resposta qualitativa 573 A Tabela 1518 dá estimativas do modelo anterior usando tanto os procedimentos MQO inade quado quanto os de máxima verossimilhança adequado Como podemos ver o MQO inclui 451 indivíduos que não tiveram casos extraconjugais e 150 que tiveram um ou mais casos O método da MV leva isso em conta explicitamente mas o método MQO não leva daí a diferença entre as duas estimativas Por razões já discutidas devese contar com a MV e não com os MQO Os coeficientes nos dois modelos podem ser interpretados como qualquer outro coeficiente de regressão O coeficien te negativo de Z8 felicidade conjugal significa que quanto maior a felicidade conjugal menor a in cidência de casos extraconjugais talvez um achado não surpreendente Veja que se estivermos interessados na probabilidade de casos extraconjugais e não no número de tais casos podemos usar o modelo probit atribuindo Y 0 para aqueles que não tiveram casos extraconjugais e Y 1 para aqueles que tiveram tais casos dando os resultados da Tabela 1519 Com o conhecimento da modelagem probit os leitores são capazes de interpretar os resultados probit dessa tabela 1512 Modelagem de dados contáveis o modelo de regressão de Poisson Há muitos fenômenos cujo regressando é do tipo contável como o número anual de viagens fei tas por uma família o número de patentes registradas anualmente por uma empresa o número de visitas anuais ao dentista ou ao médico o número de idas semanais ao armazém o número de multas recebidas ao ano por estacionamento em local proibido ou por excesso de velocidade o número de dias passados no hospital em certo período o número de carros que passam pela cabine de pedágio em um intervalo de cinco minutos e assim por diante Em cada um desses casos a variável subjacente é discreta assumindo apenas um número finito de valores Às vezes os dados contáveis também se refe rem a ocorrências raras ou infrequentes como ser atingido por um raio mais de uma vez na mesma semana ganhar na loteria mais de uma vez em um espaço de duas semanas ou ter mais de um enfarte em um mês Como modelamos esses fenômenos Tabela 1519 ECONOBOOKParte02indb 573 23112010 072126 574 Parte três Tópicos em econometria Assim como a distribuição de Bernoulli foi escolhida para o modelo de decisão simnão no mode lo de probabilidade linear a distribuição probabilística adequada especificamente para dados contá veis é a de Poisson A distribuição de Poisson é dada por 42 15121 em que f Y denota a probabilidade de que a variável Y assuma valores inteiros não negativos e Y leiase fatorial de Y é representado por Y Y Y 1 Y 2 2 1 Pode ser demonstrado que 15122 15123 Note um aspecto interessante da distribuição de Poisson sua variância é a mesma que o valor médio O modelo de regressão de Poisson pode ser escrito como 15124 em que os Y são distribuídos independentemente como variáveis aleatórias de Poisson com média µi para cada indivíduo expresso como 15125 em que os X são algumas da variáveis que poderiam afetar o valor médio Por exemplo se nossa variável discreta for o número de visitas do Metropolitan Museum of Art em Nova York em determi nado ano esse número dependerá de variáveis como renda do consumidor preço da entrada distância do museu e taxas de estacionamento Para fins de estimação escrevemos o modelo como 15126 sendo µ substituído pela Equação 5125 Como podemos ver o modelo de regressão resultante terá parâmetros não lineares necessitando da estimação de uma regressão não linear discutida no capítulo anterior Vamos considerar um exemplo concreto para entender como tudo isso funciona 43 exeMplO 158 Estudo geriátrico da frequência de quedas Os dados usados aqui foram coletados por Neter et al43 e relacionamse a 100 indivíduos com 65 anos ou mais O objetivo do estudo foi registrar o número de quedas Y sofridas por esses indivíduos em relação ao gênero X2 1 mulher e 0 para homens um índice de equilíbrio X3 e um índice de força X4 Quanto mais alto for o índice de equilíbrio mais estável será o sujeito e quanto mais alto o índice de força mais forte será o sujeito Para des cobrir se a educação ou a educação mais exercícios aeróbicos têm efeito no número de que das os autores introduziram uma variável adicional X1 chamada de variável de intervenção tal que X1 0 se apenas educação e X1 1 se educação mais treinamento em exercício aeró bico Os sujeitos foram distribuídos aleatoriamente entre os dois métodos de intervenção Usando o eViews obtivemos o resultado da tabela 1520 Continua 42 Consulte qualquer livro padrão sobre estatística para detalhes dessa distribuição 43 Neter John KUtNer michael h NaChtSheim Christopher J WaSSermaN William Applied regression models 3 ed Chicago irwin 1996 Os dados foram obtidos do disco de dados incluído no livro e referemse ao exercício 1428 ECONOBOOKParte02indb 574 23112010 072128 Capítulo 15 Modelos de regressão de resposta qualitativa 575 exeMplO 158 Continuação Tabela 1520 Nota EXP significa e a base do logaritmo natural elevado à potência indicada em Interpretação dos resultados lembrese de que o que obtivemos na tabela 1520 é o valor médio estimado para o iésimo indivíduo πOi isto é o que estimamos é 15127 Para descobrirmos o valor efetivo médio para a iésima pessoa precisamos introduzir os va lores das diversas variáveis X correspondentes àquela pessoa Por exemplo o indivíduo 99 tinha os seguintes valores Y 4 X1 0 X2 1 X3 50 e X4 56 Colocando esses valores na equação 15127 obtemos 33538 como o valor médio estimado para o 99º indivíduo O valor efetivo de Y para esse indivíduo foi 4 agora se queremos determinar a probabilidade de um indivíduo similar ao de número 99 ter menos de 5 quedas por ano podemos ter esse resultado como se segue também podemos descobrir o efeito marginal ou parcial de um regressor sobre o valor médio de Y do seguinte modo em termos de nosso exemplo ilustrativo suponha que dese jamos conhecer o efeito de um aumento unitário no índice de força X4 sobre o Y médio Uma vez que 15128 queremos encontrar π X4 Usando a regra da cadeia do cálculo podemos demonstrar fa cilmente que este é igual a 15129 Continua ECONOBOOKParte02indb 575 23112010 072129 576 Parte três Tópicos em econometria exeMplO 158 Continuação isto é a taxa de variação do valor médio com relação a um regressor é igual ao coeficiente desse regressor multiplicado pelo valor médio Naturalmente o valor médio π dependerá dos valores assumidos por todos os regressores no modelo isso é parecido com os modelos logit e probit que discutimos anteriormente em que a contribuição marginal de uma variável também dependia dos valores assumidos por todas as variáveis no modelo retornando à significância estatística dos coeficientes individuais vemos que o intercepto e a variável X2 são estatisticamente insignificantes tomados individualmente mas note que os erros padrão da tabela são assintóticos e por isso os valores t devem ser interpretados assintoticamen te Como visto anteriormente em geral os resultados de todos os procedimentos de estimação iterativa não linear são válidos apenas para amostras grandes Para concluirmos nossa discussão do modelo de regressão de Poisson podemos notar que o modelo impõe pressupostos restritivos visto que a média e a variância do modelo de Poisson são constantes e que a probabilidade de uma ocorrência é constante em qualquer ponto do tempo 1513 Outros tópicos sobre modelos de escolha qualitativa Como observado no início os modelos de escolha qualitativa são um assunto muito vasto O que apresentamos neste capítulo são alguns dos modelos básicos Para aqueles que desejarem saber mais sobre o assunto apresentaremos brevemente alguns outros modelos Não nos deteremos neles pois isso nos levaria para muito além do escopo deste livro Modelos logit e probit ordinais Nos modelos logit e probit bivariados estávamos interessados em modelar uma variável de res posta do tipo sim ou não Mas muitas vezes a variável resposta ou regressando pode ter mais de dois resultados e estes são de natureza ordinal ou seja não podem ser expressos em uma escala de in tervalo Com frequência em uma pesquisa do tipo questionário as respostas são postas em termos de uma escala Likert como concordo totalmente concordo parcialmente ou discordo totalmente Ou as respostas a uma pesquisa sobre instrução são segundo grau incompleto segundo grau comple to curso superior ou curso profissionalizante Muitas vezes essas respostas são codificadas como 0 segunto grau incompleto 1 segundo grau completo 2 curso superior ou 3 pósgraduação Tratamse de escalas ordinais porque está clara a hierarquia entre as categorias mas não podemos dizer que 2 curso superior equivale a duas vezes 1 segundo grau completo ou que 3 pósgrauda ção seja 3 vezes 1 segundo grau completo Para estudar fenômenos como esses é preciso estender os modelos logit e probit bivariados para levar em conta as várias categorias hierárquicas A aritmética tornase muito complexa pois temos de recorrer a distribuições de probabilidade normais e logísticas em múltiplos estágios para levar em conta as várias categorias hierarquizadas O leitor interessado na matemática subjacente e em algu mas das aplicações pode consultar os textos de Greene e Maddala já mencionados Em um nível mais superficial o leitor pode recorrer ao artigo de Liao44 Pacotes estatísticos como LIMDEP EViews STATA e SHAZAM incluem rotinas para estimar modelos logit e probit ordenados Modelos logit e probit multinomiais Nos modelos probit e logit ordenados a variável de resposta tem mais de duas categorias ordenadas ou classificadas mas há situações em que o regressando não é ordenado Veja por exemplo a escolha de meio de transporte para ir ao trabalho As opções podem ser bicicleta motocicleta automóvel ônibus ou trem Embora essas sejam respostas categóricas não há classificação ou ordem são de caráter essencialmente nominal Para outro exemplo considere as classificações ocupacionais como não qualificado semiqualificado e altamente qualificado Novamente não há ordenamento De modo 44 liaO tim Futing op cit ECONOBOOKParte02indb 576 23112010 072129 Capítulo 15 Modelos de regressão de resposta qualitativa 577 semelhante as opções ocupacionais como autônomo contratado em empresa trabalhar para o go verno local e para o governo federal têm um caráter essencialmente nominal As técnicas dos modelos logit e probit multinomiais podem ser empregadas para estudar essas ca tegorias nominais Novamente a matemática é um tanto complicada As referências citadas anterior mente darão os fundamentos dessas técnicas e programas de estatística citados anteriormente podem ser usados para implementar esses modelos se o uso deles for necessário em casos específicos Modelos de duração Considere perguntas como estas 1 o que determina a duração dos períodos de desemprego 2 O que determina a vida útil de uma lâmpada 3 Quais os fatores que determinam a duração de uma greve 4 O que determina o tempo de sobrevivência de um paciente soropositivo Essas são indagações relacionadas aos modelos de duração conhecidos como análise de sobre vivência ou análise timetoevent Em cada um dos exemplos citados a variávelchave é a extensão ou o período de tempo modelado como variável aleatória Novamente a matemática envolve as funções de distribuição acumulada FDA e as funções de distribuição de probabilidade FDP das distribuições de probabilidade adequadas Embora os detalhes técnicos possam ser tediosos há li vros acessíveis sobre o assunto45 Programas estatísticos como STATA e LIMDEP podem estimar prontamente tais modelos de duração Eles têm exemplos para ajudar o pesquisador no uso de tais modelos Resumo e conclusões 1 Os modelos de escolha qualitativa referemse aos modelos em que a variável resposta ou regressando não é quantitativa ou uma escala de intervalo 2 O modelo de escolha qualitativa mais simples é o modelo de probabilidade linear em que o regressando é do tipo simnão ou presenteausente 3 O modelo de regressão binária mais simples possível é o de probabilidade linear em que a regres são de escolha qualitativa é feita contra as variáveis explanatórias por meio do método de padrão MQO Nesse caso a simplicidade pode não ser uma virtude pois o modelo de probabilidade li near sofre de vários problemas de estimação Mesmo que alguns dos problemas de estimação possam ser superados a debilidade fundamental desse modelo é que ele pressupõe que a proba bilidade de ocorrência de alguma coisa aumente linearmente com o nível do regressor Essa é uma hipótese muito restritiva que pode ser evitada se empregarmos os modelos logit e probit 4 No modelo logit a variável dependente é o logaritmo da razão de chances que é uma função li near dos regressores A função de probabilidade subjacente ao modelo logit é a distribuição logís tica Se os dados disponíveis forem agrupados podemos recorrer aos MQO para calcular os parâmetros do modelo logit desde que levemos em conta explicitamente a natureza hetero cedástica do termo de erro Se os dados forem disponíveis no nível individual ou micro é necessário seguir os procedimentos de estimação não lineares nos parâmetros 5 Se escolhermos a distribuição normal como a distribuição de probabilidade adequada podemos usar o modelo probit Esse é um pouco difícil em termos de cálculo matemático pois envolve integrais Mas para todos os fins tanto o modelo logit quanto o probit dão resultados semelhantes Na prática a opção depende portanto da facilidade de cálculo o que não é um problema sério com os programas de estatística sofisticados que atualmente estão disponíveis 6 Se a variável de escolha for do tipo contável o modelo usado com mais frequência no trabalho aplicado é o da regressão de Poisson que se baseia na distribuição de probabilidade de Poisson 7 Um modelo que está intimamente relacionado ao modelo probit é o tobit também conhecido como modelo de regressão censurada Neste a variável de escolha é observada apenas se forem atendidas certas condições Assim a questão de quanto se gasta em um carro só será 45 Veja por exemplo hOSmer Jr DaViD W lemeShOW Stanley Applied survival analysis Nova York John Wiley Sons 1999 ECONOBOOKParte02indb 577 23112010 072129 578 Parte três Tópicos em econometria significativa diante da decisão de comprar um automóvel Entretanto Maddala observa que o modelo tobit é aplicável somente onde a variável latente a variável básica subjacente a um fenômeno pode em princípio assumir valores negativos e os valores zero observados são consequência da censura e da impossibilidade de observação46 8 Há várias extensões dos modelos de regressão com escolha qualitativa Estes incluem o logit e o probit ordenados e nominais O raciocínio que fundamenta esses modelos é o mesmo que o dos modelos logit e probit mais simples embora os cálculos matemáticos fiquem bem complicados 9 Por fim consideramos brevemente os chamados modelos de duração em que a duração de um fenômeno como desemprego ou doença depende de vários fatores Em tais modelos a duração ou o período tornase a variável de interesse de pesquisa exerCíCiOS 151 Consulte os dados da Tabela 152 Se YOi for negativo suponha que ele seja igual a 001 e se for maior que 1 suponha que seja igual a 099 Calcule novamente os pesos wi e estime o MPL usando os MQP Compare os resultados obtidos com aqueles dados na Equação 15211 e comenteos 152 Para os dados relativos à casa própria apresentados na Tabela 151 as estimativas de máxima verossimilhança do modelo logit são Comente esses resultados tendo em mente que todos os valores da renda acima de 16 mil dólares correspondem a Y 1 e todos os valores de renda inferiores a 16 correspondem a 0 A priori o que você poderia esperar em tal situação 153 Ao estudar a compra de bens duráveis Y Y 1 em caso de compra Y 0 se não houver com pra como uma função de diversas variáveis para um total de 762 famílias Janet A Fisher obteve os seguintes resultados de MPL Renda disponível 1957 X1 Notas todas as variáveis financeiras estão em milhares de dólares Condição de moradia imóvel alugado 1 se alugado 0 em caso contrário Condição de moradia casa própria 1 se tem casa 0 caso contrário Fonte FISHER Janet A An analysis of consumer goods expenditure The Review of Economics and Statistics v 64 n 1 p 67 tabela 1 1962 46 maDDala G S Introduction to econometrics 2 ed Nova York macmillan 1992 p 342 an analysis of consumer goods expenditure The Review of Economics and Statistics 1962 v 64 n 1 p 6471 ECONOBOOKParte02indb 578 23112010 072130 Capítulo 15 Modelos de regressão de resposta qualitativa 579 a Faça um comentário geral a respeito da equação estimada b Como o coeficiente de 00051 associado à variável da conta corrente poderia ser interpre tado Como se justificaria o sinal negativo desta variável c Qual a razão para introduzirem as variáveis idade elevada ao quadrado e o número de fi lhos Por que em ambos os casos o sinal é negativo d Supondo valores zero para todas as variáveis exceto a renda determine a probabilidade condicional de uma família cuja renda é de 20000 para comprar um bem durável e Estime a probabilidade condicional de ter bens duráveis dado X1 15000 X3 3000 X4 5000 X6 0 X7 1 X8 500 X9 300 X10 0 X11 35 X13 1 X14 2 X16 0 154 O valor de R2 na regressão de participação na força de trabalho dada na Tabela 153 é 0175 que é bem baixo É possível testar esse valor para significância estatística Que teste podemos usar e por quê Comente de modo geral sobre o valor de R2 nesses modelos 155 Calcule as probabilidades de ter casa própria em vários níveis de renda da regressão 1571 Representeos graficamente contra a renda e comente a relação resultante 156 Na regressão probit dada na Tabela 1511 mostre que o intercepto é igual a πxæx e a incli nação é igual a 1æx em que πx e æx são a média e o desvio padrão de X 157 Dos dados para 54 áreas estatísticas metropolitanas padrão SMSA Demaris estimou o se guinte modelo logit para explicar o alto índice de homicídios versus índices baixos em que O a chance de alto índice de homicídio P população em milhares de habitantes de 1980 C taxa de crescimento populacional de 1970 a 1980 R quociente de alfabetização e os ep são os erros padrão assintóticos a Como poderíamos interpretar os diversos coeficientes b Quais dos coeficientes são estatisticamente significativos em termos individuais c Qual o efeito de um aumento de um ponto percentual no quociente de alfabetização sobre as chances de ter um índice mais alto de homicídios d Qual o efeito de um aumento de um ponto percentual na taxa de crescimento populacional sobre as chances de uma taxa de homicídios mais alta 158 Compare e comente as regressões MQO e MQP nas Equações 1573 e 1571 exercícios aplicados 159 Da pesquisa de orçamentos familiares feita pelo Dutch Central Bureau of Statistics em 1980 J S Cramer obteve o seguinte modelo logit baseado em uma amostra de 2820 famílias Os resultados apresentados aqui se baseiam no método de máxima verossimilhança e referemse à terceira iteração O objetivo do modelo logit era determinar a posse de um carro como função logarítmica da renda A posse de carro era uma variável binária Y 1 se uma família tivesse carro zero se não tivesse Capítulo 15 Modelos de regressão de resposta qualitativa 579 Opcional DemariS op cit p 46 Cramer J S An introduction to the logit model for economist 2 ed publicado e distribuído por timberlake Consultants ltd 2001 p 33 estes resultados são reproduzidos do programa de estatística PCGiVe 10 publica do por timberlake Consultants p 51 ECONOBOOKParte02indb 579 23112010 072130 580 Parte três Tópicos em econometria gl em que LOi logit estimado e ln Renda é o logaritmo da renda O 2 mede a qualidade do ajusta mento do modelo a Interprete o modelo logit estimado b Do modelo logit estimado como você obteria a expressão para a probabilidade de ter um carro c Qual a probabilidade de uma família com renda de 20 mil ter um carro E com um nível de renda de 25 mil Qual a taxa de variação da probabilidade com o nível de renda de 20 mil d Comente a significância estatística do modelo logit estimado 1510 Estabeleça a Equação 1528 1511 Em um estudo importante das taxas de graduação de todos os alunos da faculdade e apenas dos matriculados negros Bowen e Bok obtiveram os resultados apresentados na Tabela 1521 baseados no modelo logit a Qual a conclusão geral que podemos tirar sobre as notas de graduação de todos os matricu lados e dos negros matriculados b A razão de chances é a razão entre duas possibilidades Compare dois grupos de todos os matriculados um com um SAT maior que 1299 e o outro com SAT inferior a 1000 a ca tegoriabase A razão de chances de 1393 indica que as chances de os matriculados na primeira categoria são 39 mais altas que aqueles na segunda As várias razões de chances mostradas na tabela estão de acordo com uma expectativa a priori c O que podemos dizer sobre a significância estatística dos parâmetros estimados O que dizer da significância geral do modelo estimado 1512 No modelo probit da Tabela 1511 o termo de erro ui tem esta variância em que fi é a função de densidade normal padrão avaliada em F 1Pi a Dada a variância de ui como você transformaria o modelo na Tabela 1510 para que o ter mo de erro resultante fosse eliminado b Use os dados da Tabela 1510 para mostrar os dados transformados c Estime o modelo probit com base nos dados transformados e compare os resultados com aqueles baseados nos dados originais 1513 Uma vez que R2 como medida da qualidade do ajustamento não é particularmente adequado para os modelos de variáveis dependentes dicotômicas uma alternativa sugerida é o teste 2 descrito a seguir em que Ni número de observações na iésima célula 580 Parte três Tópicos em econometria BOWeN William G BOK Derek The shape of the river long term consequences of considering race in college and university admissions Princeton NJ Princeton University Press 1998 p 381 ECONOBOOKParte02indb 580 23112010 072131 Capítulo 15 Modelos de regressão de resposta qualitativa 581 Tabela 1521 Modelo de regressão logística para prever a taxa de graduação dos alunos da turma que entrou em 1989 status Notas os coeficientes em negrito são significativos no nível de 005 outros coeficientes não são As categorias omitidas no modelo são brancos homens SAT 1000 os demais 90 do segundo grau SES médio SEL3 instituição mista As notas de graduação referemse aos 6 primeiros anos de estudo como definido nas notas da Tabela D31 do Apêndice D As categorias de seletividade institucional são definidas nas notas da Tabela D31 do Apêndice D Veja o Apêndice B para definição do status socio econômico SES SEL1 instituições com notas médias combinadas do SAT de 1300 e mais SEL2 instituições com notas médias combinadas do SAT entre 1150 e 1299 SEL3 instituições com notas médias combinadas do SAT abaixo de 1150 Fonte BOWEN e BOK op cit p 381 POi probabilidade efetiva da ocorrência de um evento niNi P I probabilidade estimada G número de células o número de níveis em que Xi é medido por exemplo 10 na Tabela 154 Podemos mostrar que para amostras grandes 2 é distribuído de acordo com uma distribuição 2 com G k graus de liberdade em que k é o número de parâmetros no modelo estimado k G Aplique o teste 2 anterior à regressão 1571 e comente sobre a qualidade resultante do ajus tamento e comparecom o valor de R2 reportado 1514 A Tabela 1522 apresenta dados sobre os resultados de aspersão de rotenone em diversas concentrações sobre maços de crisântemos de cerca de 50 flores Desenvolva um modelo Capítulo 15 Modelos de regressão de resposta qualitativa 581 ECONOBOOKParte02indb 581 23112010 072132 582 Parte três Tópicos em econometria adequado para expressar a probabilidade de as flores morrerem como função do log de X o log de dosagem e comente os resultados Calcule também o teste 2 do ajustamento discuti do no Exercício 1513 1515 Treze candidados a um programa de pósgraduação tiveram pontuações quantitativas em provas escritas e orais no GRE conforme a Tabela 1523 Seis estudantes foram admitidos no programa a Use o MPL para prever a probabilidade de admissão ao programa com base em pontuações quantitativas em provas escritas e orais no GRE b Este é um modelo satisfatório Em caso negativo quais alternativas você sugere 1516 Para estudarem a eficácia de um cupom de desconto no preço de uma embalagem de 6 garra fas de dois litros de regrigerante Douglas Montgomery e Elizabeth Peck coletaram os dados que aparecem na Tabela 1524 Uma amostra de 5500 foi elaborada selecionando aleatoria mente 11 categorias de desconto e distribuindo entre elas grupos de 500 consumidores A va riável de resposta era verificar se os consumidores resgatavam os cupons no prazo de um mês a Veja se o modelo logit encaixase nos dados tratando a taxa de resgate como variável de pendente e o desconto como variável explanatória b Veja se o modelo probit funciona tão bem quanto o logit Tabela 1522 Estudo de toxicidade do Rotenone em Crisântemos Fonte FENNET D J Probit analysis Londres Cambridge University Press 1964 Tabela 1523 Pontuação do GRE Fonte MORRISON Donald F Applied linear statistical methods Englewood Cliffs NJ PrenticeHall Inc 1983 p 279 adaptado 582 Parte três Tópicos em econometria ECONOBOOKParte02indb 582 23112010 072133 Capítulo 15 Modelos de regressão de resposta qualitativa 583 Número de cupons resgastados c Qual a taxa de resgate prevista se o desconto no preço for de 17 centavos d Calcule o desconto no preço para o qual 70 dos cupons serão resgatados 1517 Para descobrirem quem tem conta bancária conta corrente poupança etc e quem não tem John Caskey e Andrew Peterson estimaram um modelo probit para os anos de 1977 e 1989 usando os dados sobre famílias norteamericanas Os resultados são dados na Tabela 1525 Os valores dos coeficientes angulares da tabela medem o efeito implícito de uma variação unitária em um regressor sobre a probabilidade de uma família ter conta em banco sen do esses efeitos marginais calculados como os valores médios dos regressores incluídos no modelo a Para 1977 qual o efeito do estado civil em ter uma conta bancária E para 1989 Esses re sultados fazem sentido do ponto de vista econômico b Por que o coeficiente para a variável minoria é negativo nos anos de 1977 e 1989 c Como podemos explicar o sinal negativo para a variável número de filhos d O que sugere o quiquadrado dado na tabela Dica veja o Exercício 1513 1518 Estudo de Monte Carlo Para ajudar a entender o modelo probit William Becker e Donald Waldman consideraram o seguinte Então seja Yi 1 3X i em que i é normal padrão com média zero e variância uni tária eles geraram uma amostra de 35 observações segundo a Tabela 1526 a Dos dados em Y e X desta tabela é possível calcular um MPL Lembrese de que o verda deiro EY X 1 3X b Dado X 048 estime EY X 048 e compareo com o verdadeiro EY X 048 Note que X 048 c Usando os dados em Y e X da Tabela 1526 calcule um modelo probit Você pode usar o programa estatístico que preferir O modelo probit estimado dos autores é o seguinte Descubra o PY 1 X 048 isto é PY1 0 X 048 Veja se a sua resposta está de acordo com a resposta dos autores de 064 Tabela 1524 Preço de refrigerantes com cupom de desconto Fonte MONTGOMERY Douglas C PECK Elizabeth A Introduction to linear regression analysis Nova York John Wiley Sons 1982 p 243 notação alterada Capítulo 15 Modelos de regressão de resposta qualitativa 583 BeCKer William e WalDmaN Donald m a graphical interpretation of probit coefficients Journal of Economic Education 1989 v 20 n 4 p 371378 ECONOBOOKParte02indb 583 23112010 072134 584 Parte três Tópicos em econometria Tabela 1525 Regressões probit em que a variável dependente é ter depósito em conta corrente observações Renda milhares de dólares de 1991 Inclinação implícita Inclinação implícita Números entre parênteses são estatísticas t Fonte CASKEY John P PETERSON Andrew Who has a bank account and who doesnt 1977 and 1989 Trabalho de pesquisa 9310 Federal Reserve Bank of Kansas City out 1993 Tabela 1526 Dados hipotéticos gerados pelo modelo Y 1 3X e Y 1 se Y 0 Fonte BECKER William E WALDMAN Donald M A graphical interpretation of probit coefficients Journal of Economic Education 1989 Tabela 1 p 373 584 Parte três Tópicos em econometria ECONOBOOKParte02indb 584 23112010 072135 Capítulo 15 Modelos de regressão de resposta qualitativa 585 d O desvio padrão da amostra dos valores X da Tabela 1526 é 031 Qual a variação prevista na probabilidade se X é um desvio padrão acima do valor médio isto é o que é PY 1 X 079 A resposta dos autores é 025 1519 A Tabela 1527 do site do livro apresenta dados para 2 mil mulheres a respeito do trabalho 1 se a mulher trabalhar 0 se não trabalhar idade estado civil 1 casada 0 não casada número de filhos e escolaridade número de anos de estudo De um total de 2 mil mulheres 657 foram registradas ganhando salário a Com esses dados estime o modelo de probabilidade linear MPL b Com os mesmos dados estime um modelo logit e obtenha os efeitos marginais das diversas variáveis c Repita b para o modelo probit d Qual modelo você escolheria Por quê 1520 Para o exemplo de fumantes discutido no texto veja a Secção 1510 baixe os dados do site do livro na Tabela 1528 Veja se o produto da escolaridade pela renda o efeito interação tem alguma influência na probabilidade de tornarse fumante 1521 Baixe os dados Benign que se referem à Tabela 1529 do site do livro A variável câncer é uma variável dummy em que 1 tinha câncer de mama e 0 não tinha câncer de mama Usando as variáveis idade idade da pessoa HIGD grau de escolaridade CHK 0 se a pessoa não fazia exames regulares e 1 se a pessoa fazia exames regulares AGPI idade da primeira gravidez abortos número de abortos e peso peso da pessoa efetue uma regressão logística para concluir se essas variáveis são úteis do ponto de vista estatístico para prever se uma mulher contrairá câncer de mama ou não Apêndice 15A 15a1 estimativa da máxima verossimilhança dos modelos logit e probit para dados individuais não agrupados Como no texto suponha que estejamos interessados em calcular a probabilidade de um indivíduo ter uma casa dada sua renda X Consideramos que essa probabilidade possa ser expressa pela função logística 1552 reproduzida abaixo por conveniência 1 Não observamos diretamente Pi mas apenas o resultado Y 1 se um indivíduo tiver casa 0 se não tiver Uma vez que cada Yi é uma variável aleatória de Bernoulli podemos escrever 2 3 Suponha que tenhamos uma amostra aleatória de n observações Se fiYi denotar a probabilidade de que Yi 1 ou 0 a probabilidade conjunta de observar os n valores Y isto é f Y1 Y2 Yn é dada como Capítulo 15 Modelos de regressão de resposta qualitativa 585 Dados fornecidos sobre 50 mulheres que receberam o diagnóstico de câncer de mama e 150 com recomenda ção de controles para idade com três controles por caso entrevistadores treinados administraram um questio nário estruturado padronizado para coletarem informações de cada pessoa veja PaStiDeS et al 1983 e PaStiDeS et al 1985 a discussão a seguir baseiase em Neter John KUtNer michael h NaChSteim Christopher J WaSSer maN William Applied linear statistical models 4 ed irwin 1996 p 573574 ECONOBOOKParte02indb 585 23112010 072135 586 Parte três Tópicos em econometria 4 em que é o operador de produtório Note que podemos escrever a função de densidade da probabilidade conjunta como um produto das funções de densidade individuais porque cada Yi tem a mesma função densida de logística A probabilidade conjunta da Equação 4 é conhecida como função de verossimilhança FV A Equação 4 é um pouco trabalhosa para manipular mas se tomarmos o seu logaritmo natural obtemos a função de verossimilhança logarítmica FVL 5 Da Equação 1 é fácil verificar que 6 bem como 7 Usando as Equações 6 e 7 podemos escrever a FVL 5 como 8 Como podemos depreender da Equação 8 a função de verossimilhança logarítmica é uma função dos parâmetros Ø1 e Ø2 visto que os Xi são conhecidos Na MV nosso objetivo é maximizar a FV ou FVL ou seja obter os valores dos parâmetros desconhecidos de modo que a probabilidade de observar os Y dados seja a mais alta possível Com essa finalidade diferenciamos a Equação 8 parcialmente com relação a cada incógnita igualamos as expressões resultantes a zero e resolve mos Podemos então aplicar a condição de maximização de segunda ordem para verificar se os valores dos parâ metros que obtivemos maximizam realmente a FV Portanto temos de diferenciar a Equação 8 com relação a Ø1 e Ø2 e prosseguir como indicado Como você perceberá as expressões resultantes tornamse altamente não lineares nos parâmetros e não podem ser obtidas soluções explíticas É por isso que temos de usar um dos métodos de estimação não linear discutidos no capítulo anterior para obter soluções numéricas Uma vez que os valores numéricos Ø1 e Ø2 são obtidos podemos calcular facilmente a Equação 1 O procedimento de máxima verossimilhança para o modelo probit é semelhante àquele para o modelo logit exceto que na Equação 1 usamos a função de distribuição acumulada FDA em vez da função de distribuição acumulada logística A expressão resultante tornase bem complicada mas a ideia geral é a mesma Logo não continuaremos o procedimento 586 Parte três Tópicos em econometria ECONOBOOKParte02indb 586 23112010 072136 587 Modelos de regressão com dados em painel No Capítulo 1 discutimos brevemente os tipos de dados que em geral estão disponíveis para a análise aplicada as séries temporais os cortes transversais e os painéis Nas séries temporais observamos os valores de uma ou mais variáveis em um período de tempo como o PNB ao longo de vários trimestres ou anos Nos dados de corte transversal coletamse dados relativos a uma ou mais variáveis para várias unidades ou entidades amostrais no mesmo período como as taxas de crimina lidade para os 50 estados norteamericanos em determinado ano Nos dados em painel a mesma unidade de corte transversal uma família uma empresa um estado é acompanhada ao longo do tempo Em síntese os dados em painel têm uma dimensão espacial e outra temporal Já vimos exemplos disso na Tabela 11 em que apresentamos dados da produção e dos preços dos ovos nos 50 Estados norteamericanos no período de 1990 e 1991 Para cada um desses anos os dados de produção e dos preços dos ovos representam uma amostra de corte transversal Para cada Estado há duas observações de séries temporais para produção de ovos e seus preços Assim temos um total de 100 observações combinadas de produção e preços de ovos Outro exemplo de dados em painel foi apresentado na Tabela 12 que contém dados sobre inves timento valor da empresa e estoque de capital para quatro empresas referentes ao período de 19351954 Os dados para cada empresa no período de 19351954 constituem dados em série temporal com 20 observações os dados para todas as quatro empresas referentes a determinado ano são um exemplo de dados de corte tranversal com apenas quatro observações e dados para todas as empresas e todos os anos são exemplos de dados em painel com um total de 80 observações Há outros nomes para dados em painel como dados empilhados do inglês pooled data agrupan do observações de séries temporais e de corte transversal combinação de séries temporais e dados de corte transversal painel de microdados dados longitudinais um estudo ao longo do tempo de uma variável ou grupo de sujeitos análise histórica de eventos estudar o movimento ao longo do tempo de indivíduos através de sucessivos estados ou condições e análise de corte por exemplo acompanhar a carreira dos formandos de 1965 de uma escola de administração Embora haja varia ções sutis todos esses nomes conotam essencialmente o movimento no tempo de unidades de corte transversal Usamos o termo dados em painel em sentido genérico para incluir um ou mais desses termos e chamaremos esses modelos de regressão baseados em tais dados de modelos de regressão com dados em painel Os dados em painel agora estão sendo usados cada vez mais em pesquisa econômica Alguns dos conjuntos de dados em painel conhecidos são 1 O Panel Study of Income Dynamics PSID conduzido pelo Instituto de Pesquisa Social da Universidade de Michigan Iniciado em 1968 a cada ano o Instituto coleta dados sobre cerca de 5 mil famílias relativos a diversas variáveis socioeconômicas e demográficas 2 O Escritório do Censo do Departamento de Comércio conduz uma pesquisa similar ao PSID chamada de Survey of Income and Program Participation SIPP Quatro vezes por ano os entrevistados respondem sobre sua condição econômica Capítulo 16 ECONOBOOKParte02indb 587 23112010 072137 588 Parte três Tópicos em econometria 3 O German SocioEconomic Panel GESOEP estudou 1761 indivíduos no período entre 1984 e 2002 Informações sobre ano de nascimento gênero satisfação com a vida estado civil ganhos com trabalho e horas de trabalho por ano foram coletadas para cada indivíduo para o período de 1984 a 2002 Há também muitos outros levantamentos conduzidos por várias agências governamentais como Household Income and Labor Dynamics in Australia Survey HILDA British Household Panel Survey BHPS Korean Labor and Income Panel Study KLIPS Vale uma advertência o tópico de regressões de dados em painel é vasto e algumas operações matemáticas e estatísticas são bastante complicadas Só pretendemos abordar algumas noções essen ciais dos modelos de regressão de dados em painel deixando os detalhes para as referências1 Mas saiba que algumas dessas referências são altamente técnicas Felizmente programas simples como LIMDEP PCGIVE SAS STATA SHAZAM e EViews entre outros tornaram a tarefa de imple mentar regressões de dados em painel bem fácil 161 Por que dados em painel Quais as vantagens dos dados em painel sobre dados de corte transversal ou de séries tem porais Baltagi enumera as seguintes vantagens dos dados em painel2 1 Uma vez que os dados em painel se relacionam a indivíduos empresas Estados países etc com o tempo tende a haver heterogeneidade nessas unidades As técnicas de estimação dos dados em painel podem levar em consideração a heterogeneidade explicitamente permitindo variáveis específicas ao sujeito como mostraremos rapidamente Usamos o termo sujeito em sentido genérico para incluir microunidades como indivíduos empresas Estados e países 2 Combinando séries temporais com observações de corte transversal os dados em painel ofere cem dados mais informativos maior variabilidade menos colinearidade entre variáveis mais graus de liberdade e mais eficiência 3 Estudando repetidas observações em corte transversal os dados em painel são mais adequa dos para examinar a dinâmica da mudança Períodos de desemprego rotatividade no empre go e mobilidade da mão de obra são analisados de maneira mais apropriada com dados em painel 4 Os dados em painel podem detectar e medir melhor os efeitos que simplesmente não podem ser observados em um corte transversal puro ou em uma série temporal pura Por exemplo os efeitos das leis de salário mínimo sobre o emprego e ganhos poderão ser estudados mais adequadamente se incluirmos ondas sucessivas de aumentos de salários nos salários míni mos estadual eou federal 1 algumas das referências são ChamBerlaiN G Panel data in Handbook of econometrics v ii GriliCheS Z iNtriliGatOr m D Org Northholland Publishers 1984 cap 22 hSiaO C Analysis of panel data Cambrid ge University Press 1986 JUDGe G G hill r C GriFFithS W e lUtKePOhl h lee t C Introduction to the theory and practice of econometrics 2 ed Nova York John Wiley Sons 1985 cap 11 GreeNe W h Econo metric analysis 6 ed englewood Cliffs NJ Prenticehall 2008 cap 9 BaltaGi Badi h Econometric analysis of panel data Nova York John Wiley and Sons 1995 e WOOlDriDGe J m Econometric analysis of cross section and panel data Cambridge mass mit Press 1999 Para um tratamento detalhado do assunto com aplica ções empíricas veja FreeS edward W Longitudinal and panel data analysis and applications in the social sciences Nova York Cambridge University Press 2004 2 BaltaGi op cit p 36 ECONOBOOKParte02indb 588 23112010 072137 Capítulo 16 Modelos de regressão com dados em painel 589 5 Dados em painel permitem estudar modelos de comportamento mais complicados Por exemplo fenômenos como economias de escala e mudança tecnológica podem ser mais bem conduzidos pelos dados em painel do que apenas pelo corte transversal ou pelas séries tem porais 6 Ao disponibilizar os dados referentes a milhares de unidades os dados em painel podem minimizar o viés que poderia resultar se estivéssemos trabalhando com um agregado de in divíduos ou empresas Em suma os dados em painel podem enriquecer a análise aplicada ao ponto de ser impossível usarmos apenas dados de séries temporais ou de corte transversal Isso não deve sugerir que não haja problemas com a modelagem com dados em painel Discutiremos esses problemas depois de tratar mos da teoria e apresentarmos alguns exemplos 162 Dados em painel um exemplo ilustrativo Para introduzirmos o assunto consideremos os dados apresentados na Tabela 161 no site do li vrotexto coletados originalmente pelo Professor Moshe Kim e reproduzidos de William Greene3 Os dados analisam os custos de seis empresas de transporte aéreo para o período de 19701984 para um total de 90 observações de dados em painel As variáveis são definidas como I nome da empresa aérea T ano Q produção em receita por milhaspassageiro um número índice CT custo total em 1000 PF preço do combustível e LF fator de carga a utilização média da capacidade do voo Suponha que estejamos interessados em descobrir como o custo total CT comportase em rela ção ao produto Q ao preço do combustível PF e ao fator de carga LF Em resumo desejamos estimar uma função de custo da empresa aérea Como calculamos essa função Evidentemente po demos estimar a função de custo para cada empresa aérea usando os dados para 19701984 uma re gressão de séries temporais Isso pode ser feito com o procedimento habitual de mínimos quadrados ordinários MQO Teremos ao todo seis funções de custo uma para cada empresa aérea Mas então desprezamos as informações sobre as outras empresas aéreas que operam no mesmo ambiente regu lador Também podemos estimar uma função de custo de corte tranversal uma regressão de corte trans versal Teremos ao todo 15 regressões de corte transversal uma para cada ano Mas isso não faria muito sentido no atual contexto pois temos apenas seis observações por ano e há três variáveis ex planatórias mais o termo de intercepto teremos poucos graus de liberdade para uma análise signi ficativa Também não iremos explorar a natureza do painel para nossos dados Os dados em painel de nosso exemplo são chamados de painel balanceado um painel é dito balanceado se cada unidade de corte transversal empresas indivíduos etc em o mesmo número de observações Se cada unidade tiver um número diferente de observações teremos um painel desba lanceado Na maior parte deste capítulo lidaremos com painéis balanceados Na literatura de painel de dados também temos os termos painel curto e painel longo Em um painel curto o número de sujeitos de corte transversal N é maior que o número de períodos de tempo T Em um painel longo T é maior que N À medida que tivermos um painel curto ou longo escolheremos a técnica de estima ção adequada Quais são as opções Há quatro possibilidades 1 Modelo MQO para dados empilhados pooled data Simplesmente empilhamos todas as 90 observações e estimamos uma regressão grande desprezando a natureza de corte transversal e de séries temporais de nossos dados 3 GreeNe William h Econometric analysis 6 ed 2008 Disponível em httppagessternnyueduwgreentext econometricanalysishtm ECONOBOOKParte02indb 589 23112010 072137 590 Parte três Tópicos em econometria 2 O modelo de mínimos quadrados com variáveis dummies para efeitos fixos MQVD Combinamos todas as 90 observações mas deixamos que cada unidade de corte transversal empresa aérea em nosso exemplo tenha sua própria variável dummy intercepto 3 O modelo de efeitos fixos dentro de um grupo fixed effects withingrup model Combi namos todas as 90 observações mas para cada empresa aérea expressamos cada variável como um desvio de seu valor médio e então estimamos uma regressão de MQO contra es ses valores corrigidos para a média 4 O modelo de efeitos aleatórios MEA Ao contrário do modelo MQVD em que permiti mos que cada empresa aérea tenha seu próprio valor de intercepto pressupomos que os va lores de intercepto sejam extraídos aleatoriamente de uma população bem maior de empresas aéreas Agora discutiremos cada um desses métodos usando os dados da Tabela 161 Veja o site do li vrotexto 163 Modelo de regressão MQO para dados empilhados ou modelo de coeficientes constantes Considere o modelo a seguir CT 1631 em que i é o iésimo indivíduo e t é o período de tempo para as variáveis que definimos anteriormente Escolhemos a função de custo linear para fins ilustrativos mas no Exercício 1610 caberá ao leitor esti mar uma função loglinear ou doublelog e neste último caso os coeficientes angulares darão as estima tivas de elasticidade Note que combinamos todas as 90 observações mas estamos pressupondo que os coeficientes de regressão sejam os mesmos para todas as linhas aéreas Ou seja não há distinção entre as empresas aéreas uma linha aérea é tão boa quanto a outra um pressuposto que pode ser difícil de manter Supõese que as variáveis explanatórias sejam não estocásticas Se forem estocásticas não serão correlacionadas com o termo de erro Às vezes supõese que as variáveis explanatórias sejam estri tamente exógenas Uma variável será estritamente exógena se não depender de valores correntes passados e futuros do termo de erro uit Supõese ainda que o termo de erro seja uit iid 0 æ 2 u isto é que ele seja distribuído idêntica e independentemente com média zero e variância constante Com a finalidade de testar a hipótese podemos considerar que o termo de erro também seja normalmente distribuído Observe a notação com duplo subscrito na Equação 1631 que deveria ser autoexplicativa Primeiro vamos apresentar os resultados da equação estimada 1631 e depois discutiremos al guns dos problemas com esse modelo Os resultados da regressão baseados no EViews versão 6 são apresentados na Tabela 162 Se examinarmos os resultados da regressão para dados empilhados pooled regression e apli carmos os critérios convencionais veremos que todos os coeficientes de regressão não só são alta mente significativos em termos estatísticos mas também estão de acordo com as expectativas e notaremos também que o valor R2 é muito alto O único deslize é que a estatística estimada de DurbinWatson é bem baixa sugerindo que talvez não haja autocorrelação eou correlação espacial nos dados Evidentemente como sabemos um DurbinWatson baixo também se deveria a erros de especificação ECONOBOOKParte02indb 590 23112010 072137 Capítulo 16 Modelos de regressão com dados em painel 591 O principal problema desse modelo é que ele não distingue entre as diversas empresas aéreas nem diz se a resposta do custo total às variáveis explanatórias ao longo do tempo é a mesma para todas as empresas Em outras palavras ao juntarmos diferentes empresas aéreas em períodos diferentes ca muflamos a heterogeneidade individualidade ou originalidade que possa existir entre as empresas aéreas Outra forma de afirmar isso é que a individualidade de cada sujeito está incluída no termo de erro uit Em consequência é bem possível que o termo de erro possa estar correlacionado com alguns dos regressores incluídos no modelo Se for esse o caso os coeficientes estimados na Equação 1631 podem ser tendenciosos e inconsistentes Lembrese de que uma das hipóteses importantes do modelo clássico de regressão linear é que não haja correlação entre os regressores e o termo de erro Para entendermos como o termo de erro pode estar correlacionado com os regressores vamos considerar a seguinte revisão do modelo 1631 CT 1632 em que a variável adicional M qualidade gerencial ou filosofia gerencial Das variáveis incluídas na Equação 1632 apenas a variável M é invariante no tempo ou constante no tempo porque varia entre os indivíduos mas é constante ao longo do tempo para determinado indivíduo empresa aérea Embora seja invariante em termos de tempo a variável M não é diretamente observável e portan to não podemos medir sua contribuição para a função de custo Podemos entretanto fazer isso indi retamente se escrevermos a Equação 1632 como CT 1633 em que Æi chamado efeito não observado ou heterogeneidade reflete o impacto de M sobre o custo Note que por simplicidade mostramos apenas o efeito não observado de M sobre o custo mas na rea lidade pode haver mais efeitos não observados por exemplo a natureza da propriedade privada ou pública se uma empresa é de capital aberto ou fechado se o CEO é homem ou mulher etc Embora tais variáveis possam diferir entre os indivíduos empresas aéreas provavelmente permanecerão as mesmas para um dado indivíduo sobre todo o período da amostra Uma vez que Æi não é diretamente observável por que não considerála aleatória e incluíla no termo de erro uit e considerar o termo de erro vit Æi uit Agora escrevemos a Equação 1633 como CT 1634 Tabela 162 ECONOBOOKParte02indb 591 23112010 072139 592 Parte três Tópicos em econometria Mas se o termo Æi incluído no termo de erro vit está correlacionado com qualquer um dos regres sores na Equação 1634 temos uma violação de uma das hipóteses principais do modelo clássico de regressão linear ou seja que o termo de erro não está correlacionado com os regressores Como sabemos nessa situação as estimativas de MQO não são apenas tendenciosas mas também inconsis tentes Há uma possibilidade real de que o Æi não observável esteja correlacionado com um ou mais re gressores Por exemplo a direção de uma empresa aérea pode ser perspicaz o suficiente para comprar combustível na bolsa de futuros a fim de evitar severas flutuações de preço Isso terá o efeito de re duzir o custo dos serviços de transporte aéreo Como resultado dessa correlação podese mostrar que cov vit vis æ 2 u t s que é diferente de zero e portanto a heterogeneidade não observada induz a autocorrelação e teremos de prestar atenção nisso Mostraremos mais tarde como esse problema pode ser corrigido Portanto a questão é como lidamos com efeitos não observáveis ou com a heterogeneidade de modo que possamos obter estimativas consistentes eou eficientes dos parâmetros das variáveis de maior interesse que são produto preço do combustível e fator de carga em nosso caso Nosso inte resse principal pode não ser a obtenção do impacto das variáveis não observáveis porque elas permanecem as mesmas para um dado sujeito É por isso que esses efeitos não observáveis ou a heterogeneidade são chamados de parâmetros de sujeira nuisance parameters Como devemos proceder Agora nos voltaremos para essa questão 164 O modelo de mínimos quadrados com variáveis dummy para efeitos fixos MQVD O modelo de mínimos quadrados com variáveis dummy para efeitos fixos MQVD conta com a heterogeneidade entre indivíduos permitindo que cada um tenha seu próprio intercepto como mos tra o modelo 1641 Continuaremos com o nosso exemplo de empresas aéreas CT 1641 Observe que colocamos o subscrito i no termo de intercepto para sugerir que os interceptos das seis empresas aéreas podem ser diferentes A diferença pode ser devida a aspectos especiais de cada uma como estilo gerencial filosofia gerencial ou tipo de mercado que cada organização está servindo Na literatura específica o modelo 1641 é conhecido como modelo de regressão de efeitos fixos MEF O termo efeitos fixos devese ao fato de que embora o intercepto possa diferir entre os indivíduos no caso seis empresas aéreas o intercepto de cada indivíduo não varia com o tempo ele é invariante no tempo Note que se tivéssemos de escrever o intercepto como Ø1it ele sugeriria que o intercepto de cada indivíduo é variante no tempo Podemos observar que esse modelo dado na Equação 1641 pressupõe que os coeficientes angulares dos regressores não variam entre indiví duos nem com o tempo Antes de prosseguirmos pode ser útil visualizarmos a diferença entre o modelo de regressão para dados empilhados pooled regression e o modelo MQVD Para simplificarmos pressupomos que desejamos fazer a regressão do custo total apenas contra o produto Na Figura 161 mostramos essa função de custo estimada para duas empresas aéreas separadamente bem como a função de custo se agrupamos os dados para as duas empresas isso equivale a desprezar os efeitos fixos4 Podemos ver da Figura 161 como a regressão com dados empilhados pode tornar tendenciosa a estimativa do coeficiente angular 4 adaptado de notas não publicadas de alan Duncan ECONOBOOKParte02indb 592 23112010 072139 Capítulo 16 Modelos de regressão com dados em painel 593 Como permitimos que o intercepto com efeito fixo varie entre as empresas Podemos fazer isso facilmente usando a técnica da variável dummy principalmente a técnica das variáveis dummies de intercepto diferencial que aprendemos no Capítulo 9 Agora escrevemos a Equação 1641 como CT 1642 em que D2i 1 para a empresa aérea 2 0 caso contrário D3i 1 para a empresa aérea 3 0 caso con trário e assim por diante Note que uma vez que temos seis empresas aéreas introduzimos apenas cinco variáveis dummies para evitar cair na armadilha da variável dummy a situação de colineari dade perfeita Aqui estamos tratando a empresa aérea 1 como categoria de base ou referência Evi dentemente podemos escolher qualquer empresa aérea como ponto de referência Como resultado o intercepto Æ1 é o valor do intercepto da empresa aérea 1 e os outros coeficientes Æ representam quanto os valores de intercepto das outras empresas aéreas diferem daqueles da primeira Assim Æ2 indica quanto o valor do intercepto da segunda empresa aérea difere de Æ1 A soma Æ1 Æ2 dá o valor real do intercepto para a empresa 2 Os valores de intercepto das outras empresas aéreas podem ser calcu lados de forma semelhante Lembrese de que se você quiser introduzir uma variável dummy para cada empresa terá de excluir o intercepto comum caso contrário cairá na armadilha da variável dummy Os resultados do modelo 1642 para nossos dados são apresentados na Tabela 163 A primeira coisa a notar é que todos os coeficientes de intercepto diferencial são altamente significativos estatis ticamente sugerindo que talvez as seis empresas aéreas sejam heterogêneas e portanto os resultados da regressão para dados empilhados na Tabela 162 podem ser duvidosos Os valores dos coeficientes angulares das Tabelas 162 e 163 também são diferentes novamente lançando dúvidas sobre os re sultados apresentados na Tabela 162 Parece que o modelo 1641 é melhor que o 1631 A pro pósito note que o MQO aplicado a um modelo de efeito fixo produz estimadores que são chamados de estimadores de efeito fixo Podemos fornecer um teste formal dos dois modelos Em relação ao 1641 o 1631 é um modelo restrito no sentido de que impõe um intercepto comum para todas as empresas aéreas Pode mos usar o teste F restrito discutido no Capítulo 8 Usando a Fórmula 8610 o leitor poderá veri ficar que neste caso o valor de F é Produto Grupo 1 Grupo 2 Coeficiente angular tendencioso quando os efeitos fixos são ignorados Custo total Yit Xit 2 Æ 1 Æ EYitXit Æ2 Ø Xit EYitXit Æ1 Ø Xit Figura 161 Viés decorrente do fato de ignoraremse os efeitos fixos ECONOBOOKParte02indb 593 23112010 072140 594 Parte três Tópicos em econometria Nota os valores restrito e irrestrito de R2 são obtidos das Tabelas 161 e 162 Observe ainda que o número de restrições é 5 por quê A hipótese nula aqui é que todos os interceptos diferenciais são iguais a zero O valor calculado de F para os 5 graus de liberdade no numerador e 81 no denominador é altamente significativo em termos estatísticos Rejeitamos a hipótese nula de que todos os interceptos diferenciais são zero Se o valor F não for estatisticamente significativo poderíamos concluir que não há diferença nos inter ceptos das seis empresas Nesse caso teríamos agrupado todas as 90 observações como fizemos na regressão para dados empilhados na Tabela 162 O modelo 1641 é conhecido como efeitos fixos unidirecionais oneway porque permitimos que os interceptos difiram entre as empresas Mas também podemos permitir o efeito do tempo se acreditarmos que a função de custo muda com o tempo devido a fatores como mudanças tecnológi cas mudanças nas regulamentações do governo eou políticas tributárias e outros efeitos Tal efeito do tempo pode ser considerado facilmente se introduzirmos as variáveis dummies de tempo uma para cada ano de 1970 até 1984 Como temos dados para 15 anos podemos introduzir 14 variáveis dummies por quê e estender o modelo 1641 adicionando essas variáveis Se fizermos isso o modelo re sultante será chamado de modelo de efeitos fixos bidirecionais twoway porque permitimos os efeitos tanto do indivíduo quanto do tempo Neste exemplo se adicionarmos as dummies de tempo teremos ao todo 23 coeficientes para esti mar o intercepto comum cinco variáveis dummies das empresas aéreas 14 variáveis dummies de tempo e três coeficientes angulares Como podemos ver consumiremos vários graus de liberdade Além disso se decidirmos permitir que os coeficientes angulares difiram entre as empresas podemos fazer as cinco váriaveis das empresas aéreas interagirem com cada uma das três variáveis explanató rias e introduzir os coeficientes dummies de inclinação diferenciais Teremos de estimar 15 coefi cientes adicionais cinco variáveis dummies interagiram com três variáveis explanatórias Como se isso não bastasse se fizermos as 14 variáveis dummies de tempo interagirem com as três variáveis explanatórias teremos no total 42 coeficientes adicionais para estimar Como podemos ver não tere mos qualquer grau de liberdade uma advertência quanto ao uso do modelo de efeitos fixos Como sugere a discussão anterior o modelo MQVD apresenta vários problemas que precisam ser lembrados Primeiro se introduzirmos variáveis dummies demais teremos um problema de falta de Tabela 163 ECONOBOOKParte02indb 594 23112010 072141 Capítulo 16 Modelos de regressão com dados em painel 595 graus de liberdade Ou seja não teremos observações suficientes para fazer uma análise estatística significativa Em segundo lugar com diversas variáveis dummies no modelo tanto individuais quan to interativas ou multiplicativas há sempre a possibilidade de multicolinearidade o que poderia difi cultar a estimação exata de um ou mais parâmetros Em terceiro lugar em algumas situações o modelo MQVD pode não ser capaz de identificar o impacto das variáveis que não mudam ao longo do tempo Suponha que desejemos estimar uma fun ção de salário para um grupo de trabalhadores usando dados em painel Além do salário uma função de salário pode incluir idade experiência e educação como variáveis explanatórias Suponha que também decidíssemos adicionar gênero cor e raça como variáveis adicionais no modelo Uma vez que essas variáveis não mudarão com o tempo para um indivíduo a abordagem das MQVD pode não identificar o impacto dessas variáveis invariantes no tempo sobre os salários Em outros termos os interceptos específicos a um sujeito absorvem toda a heterogeneidade que possa existir nas variáveis dependente e explanatória A propósito as variáveis que não variam no tempo às vezes são chamadas de nuisance variable ou lurking variable Quarto temos de pensar cuidadosamente no termo de erro uit Os resultados que apresentamos nas Equações 1631 e 1641 baseiamse no pressuposto de que o termo de erro segue as hipóteses clássicas a saber uit ª N0 æ2 Uma vez que o índice i referese a observações de corte tranversal e t à série temporal a hipótese clássica para uit pode ter de ser modificada Há várias possibilidades que incluem 1 Pressupomos que a variância de erro é a mesma para todas as unidades de corte tranversal ou podemos considerar que a variância de erro seja heterocedástica5 2 Para cada indivíduo podemos supor que não haja autocorrelação ao longo do tempo Assim em nosso exemplo ilustrativo consideramos que o termo de erro da função de custo para a empresa 1 seja não autocorrelacionado ou que ele seja autocorrelacionado por exemplo do tipo AR1 3 Durante algum tempo é possível que o termo de erro para a empresa 1 esteja correlacio nado com o termo de erro por exemplo da empresa 26 Ou podemos supor que não haja correlação Há ainda outras combinações e permutações do termo de erro Como você perceberá rapidamen te aceitar uma ou duas dessas possibilidades tornará a análise muito mais complicada Exigências de espaço e de cálculos matemáticos impedemnos de considerar todas as possibilidades As referên cias na nota de rodapé 1 discutem alguns desses tópicos No entanto alguns desses problemas po dem ser atenuados se considerarmos as alternativas discutidas nas duas seções seguintes 165 O estimador de efeito fixo dentro do grupo DG Uma forma de estimarmos uma regressão para dados empilhados é eliminar o efeito fixo Ø1i expressando os valores das variáveis dependente e explanatória para cada empresa como desvios de seus respectivos valores médios Para a empresa 1 obteremos os valores médios amostrais de CT Q PF e LF respectivamente e subtraímos dos valores individuais dessas variá veis Os valores resultantes são chamados corrigidos para a média Fazemos isso para cada empresa e combinamos todos os 90 valores corrigidos para a média e efetuamos uma regressão de MQO 5 O Stata fornece erros padrão corrigidos para heterocedasticidade nos modelos de regressão com dados em painel 6 isso leva ao chamado modelo de regressão aparentemente não relacionada originalmente proposto por arnold Zellner Veja ZellNer a an efficient method of estimating seemingly unrelated regressions and tests for aggregation bias Journal of the American Statistical Association 1962 v 57 p 348368 ECONOBOOKParte02indb 595 23112010 072141 596 Parte três Tópicos em econometria Se tcit qit p fit e l fit representam os valores corrigidos para a média agora efetuamos a regres são ct 1651 em que i 1 2 6 e t 1 2 15 Veja que a Equação 1651 não tem um termo de intercepto Por quê Retomando nosso exemplo obtemos os resultados na Tabela 164 Nota o prefixo DM significa que os valores são corrigidos para a média ou expressos como desvios de suas médias de amostra Observe a diferença entre a regressão para dados empilhados da Tabela 162 e a regressão para dados empilhados da Tabela 164 A primeira apenas ignora a heterogeneidade entre as seis empresas enquanto a última leva isso em conta não pelo método da variável dummy mas eliminandoo por diferenciações das observações amostrais em torno de suas médias amostrais A diferença entre os dois é óbvia como mostra a Figura 162 Tabela 164 Figura 162 Estimador dentro do grupo Produto Custo total Yit Xit 2 Æ Æ1 EYitXit ØXit Fonte Alan Duncan Crosssection and panel data econometrics notas não publicadas de leitura adaptadas ECONOBOOKParte02indb 596 23112010 072142 Capítulo 16 Modelos de regressão com dados em painel 597 Podese mostrar que o estimador DG produz estimativas consistentes dos coeficientes angulares enquanto a regressão para dados empilhados ordinária pode não produzir Devese acrescentar no entanto que os estimadores DG embora consistentes são ineficientes têm variâncias maiores com paradas aos resultados de regressão com dados empilhados ordinários7 Observe que os coeficientes angulares do Q PF e LF são idênticos nas Tabelas 163 e 164 Isso ocorre porque matematicamente os dois modelos são idênticos Por sinal os coeficientes de regressão estimados pelo método DG são chamados de estimadores DG Uma desvantagem do estimador DG pode ser explicada com o seguinte modelo de regressão de salários Raça 1652 Nesta função de salário as variáveis como gênero escolaridade e raça são invariantes no tempo Se usamos os estimadores DG essas variáveis no tempo serão eliminadas por causa da diferencia ção Como resultado não saberemos como o salário reage a essas variáveis que não mudam ao longo do tempo8 Mas esse é o preço que temos de pagar para evitar a correlação entre o termo de erro Æi incluído em vit e as variáveis explanatórias Outra desvantagem do estimador DG é que ele pode distorcer os valores de parâmetro e certamente eliminar qualquer efeito a longo prazo9 Em geral quando diferenciamos uma variável removemos o componente daquela variável a longo prazo Ficamos com o valor da variável a curto prazo Trataremos disso mais à frente quando discutirmos a econometria das séries temporais Ao usarmos MQVD obtivemos as estimativas diretas dos interceptos para cada empresa aérea Como podemos obter as estimativas dos interceptos usando o método DG Para o exemplo de empre sas aéreas eles são obtidos como 1653 em que as barras sobre as variáveis denotam os valores médios amostrais das variáveis da iésima empresa Ou seja obtemos o valor do intercepto da iésima empresa aérea subtraindo do valor médio da variável dependente os valores médios das variáveis explanatórias para aquela empresa vezes os coe ficientes angulares estimados dos estimadores DG Note que os coeficientes angulares estimados permanecem os mesmos para todas as empresas como mostra a Tabela 164 Pode ser observado que o intercepto estimado na Equação 1653 é parecido com o intercepto que estimamos no modelo de regressão linear padrão o que pode ser visto da Equação 7421 Deixamos para o leitor encontrar os interceptos das seis empresas da maneira apresenta e verificar que são os mesmos que os valores de interceptos derivados na Tabela 163 salvo por erros de arredondamento Podemos notar que o intercepto estimado para cada empresa representa as características indi víduoespecíficas de cada empresa mas não seremos capazes de identificar essas características individualmente Assim o intercepto Æ1 para a empresa 1 representa a filosofia gerencial daquela empresa a composição de sua diretoria a personalidade do CEO o gênero do CEO etc Todas essas características de heterogeneidade são incluídas no valor do intercepto Como veremos tais caracte rísticas podem ser incluídas no modelo de efeitos aleatórios 7 a razão para isso é que quando expressamos variáveis como desvios de seus valores médios a variação nesses valores corrigidos para a média será muito menor que a variação nos valores originais das variáveis Nesse caso a variação no termo de erro uit pode ser relativamente grande levando assim a erros padrão maiores dos coe ficientes estimados 8 isto também é válido para o modelo mQVD 9 aSteriOU Dimitrius hall Stephen G Applied econometrics a modern approach Nova York Palgrave macmillan 2007 p 347 ECONOBOOKParte02indb 597 23112010 072143 598 Parte três Tópicos em econometria A propósito notamos que uma alternativa ao estimador DG é o método de primeiras diferenças No método DG expressamos cada variável como um desvio do valor médio daquela variável No método de primeiras diferenças para cada sujeito tomamos diferenças sucessivas das variáveis Assim para a empresa 1 subtraímos a primeira observação de CT da segunda observação de CT a segunda observação de CT da terceira observação de CT e assim por diante Fazemos isso para cada uma das variáveis remanescentes e repetimos o processo para as cinco empresas aéreas remanescen tes Depois temos apenas 14 observações para cada empresa uma vez que a primeira não tem valor anterior Como resultado agora temos 84 observações em vez das 90 originais Fazemos a regressão dos valores de primeira diferença da variável CT contra os valores de primeira diferença das variáveis explanatórias como se segue CT 1654 em que 1CTit CTit CTi t1 Como notado no Capítulo 11 1 é chamado de operador de primeira diferença10 Por sinal observe que o termo de erro original agora é substituído pela diferença entre os valores atuais e anteriores do termo de erro Se não houver autocorrelação do termo de erro original o termo de erro transformado será is e portanto ele impõe os tipos de problemas de estimação que discuti mos no Capítulo 11 Contudo se as variáveis explanatórias forem estritamente exógenas o estima dor de primeira diferença será não tendencioso dados os valores das variáveis explanatórias Note também que o método de primeira diferença tem as mesmas desvantagens que o método DG no sentido de que as variáveis explanatórias que permanecem fixas ao longo do tempo para um indivíduo são eliminadas na transformação das primeiras diferenças Pode ser destacado que os estimadores de primeiras diferenças e de efeitos fixos são os mesmos quando temos apenas dois períodos de tempo mas se houver mais que dois períodos eles diferirão As razões são bastante complexas e o leitor interessado poderá consultar as referências11 Deixamos para o leitor um exercício de aplicação do método das primeiras diferenças a nosso exemplo de em presas aéreas e a comparação dos resultados com os outros estimadores de efeitos fixos 166 O modelo de efeitos aleatórios MEA Falando sobre a modelagem de efeitos fixos Kmenta escreve12 Uma questão óbvia relacionada ao modelo de covariância isto é MQVD é determinar se a inclusão de variáveis dummies e a consequente perda de graus de liberdade é realmente necessária O raciocínio subjacente ao modelo de covariância é que ao especificarmos o modelo de regressão deixamos de in cluir variáveis explanatórias relevantes que não se alteram ao longo do tempo e possivelmente outras que mudam ao longo do tempo mas que têm o mesmo valor para todas as unidades de corte transversal e que a inclusão das variáveis dummies seja uma cobertura de nossa ignorância Se as variáveis dummies representam de fato a falta de conhecimento sobre o verdadeiro mode lo por que não expressar isso por meio do termo de erro É exatamente essa a abordagem sugerida pelos proponentes do chamado modelo de componentes dos erros MCE ou modelo de efeitos aleatórios MEA que agora ilustraremos com a função de custo para nossas empresas A ideia básica é começar com a Equação 1641 10 Note que a equação 1653 não tem termo de intercepto por quê mas podemos incluílo se houver uma variável de tendência no modelo original 11 Veja particularmente WOOlDriDGe Jeffrey m Econometric analysis of cross section and panel data Cambridge mass mit Press 2002 p 279283 12 KmeNta Jan Elements of econometrics 2 ed Nova York macmillan 1986 p 633 ECONOBOOKParte02indb 598 23112010 072143 Capítulo 16 Modelos de regressão com dados em painel 599 CT 1661 Em vez de tratarmos Ø1i como fixo pressupomos que ele seja uma variável aleatória com valor médio de Ø1 nenhum subscrito i aqui O valor de intercepto para uma empresa pode ser expresso como 1662 em que i é um termo de erro com um valor médio nulo e variância æ 2 O que estamos dizendo em essência é que as seis empresas incluídas em nossa amostra foram ti radas de um universo muito maior de empresas e que elas têm um valor médio comum para o inter cepto Ø1 As diferenças individuais de cada empresa se refletem no termo de erro i Substituindo a Equação 1662 na Equação 1661 obtemos CT 1663 em que 1664 O termo de erro composto wit consiste em dois componentes i que é o componente de corte trans versal ou específico dos indivíduos e uit que é o elemento de erro combinado da série temporal e corte transversal e às vezes chamado de termo idiossincrático porque varia com o corte transversal isto é o indivíduo e também com o tempo O modelo de componentes dos erros MCE recebe esse nome porque o termo de erro composto consiste em dois ou mais erros As hipóteses habituais feitas pelo MCE são que 1665 isto é os componentes de erro individual não estão correlacionados entre si nem com as unidades de corte transversal e de série temporal Também é muito importante observar que wit não está correla cionado com qualquer uma das variáveis explanatórias incluídas no modelo Uma vez que i é um componente de wit é impossível que este esteja correlacionado com as variáveis explanatórias Se for esse o caso o MCE resultará em estimativa inconsistente dos coeficientes de regressão Logo dis cutiremos o teste de Hausman que nos informará em dada aplicação se wit está correlacionado com as variáveis explanatórias isto é se MCE é o modelo adequado Observe a diferença entre o modelo de efeitos fixos e o de componente dos erros No primeiro a unidade de corte transversal tem seu próprio valor fixo de intercepto em todos esses N valores para N unidades de corte transversal Já no modelo de componente dos erros por outro lado o intercepto comum representa o valor médio de todos os interceptos de corte tranversal e o componente de erro i representa o desvio aleatório do intercepto individual desse valor médio Lembrese no en tanto de que i não é diretamente observável ele é o que se conhece como uma variável não obser vável ou latente Como resultado dos pressupostos estabelecidos na Equação 1665 seguese que 1666 1667 ECONOBOOKParte02indb 599 23112010 072145 600 Parte três Tópicos em econometria Agora se æ 2 0 não há diferença entre os modelos 1631 e 1663 e podemos apenas com binar todas as observações de corte tranversal e de série temporal e efetuar a regressão para dados empilhados como fizemos na Equação 1631 Isso acontece porque nessa situação ou não há efei tos específicos a um sujeito ou todos eles foram considerados nas variáveis explanatórias Como mostra a Equação 1667 o termo de erro é homocedástico Contudo podemos demons trar que wit e wis t s são correlacionados os termos de erro de uma unidade de corte transversal em dois pontos diferentes no tempo estão correlacionados O coeficiente de correlação wit wis é dado por 1668 Atenção a dois aspectos especiais do coeficiente de correlação anterior Primeiro para qualquer unidade de corte transversal o valor da correlação entre os termos de erro em dois períodos diferentes de tempo permanece o mesmo não importa quanto os dois períodos de tempo estão distantes como está claro da Equação 1668 Isso contrasta acentuadamente com o processo AR1 discutido no Capítulo 12 em que constatamos que a correlação entre períodos diminui ao longo do tempo Segun do a estrutura de correlação da Equação 1668 permanece a mesma para todas as unidades de corte transversal ela é idêntica para todos os indivíduos Se não levarmos essa estrutura de correlação em conta e estimarmos a Equação 1663 por MQO os estimadores resultantes serão ineficientes O método mais adequado aqui é o dos mínimos quadrados generalizados MQG Não discutiremos a matemática dos MQG neste contexto devido a sua complexidade13 Uma vez que a maioria dos programas estatísticos modernos agora tem rotinas para estimar o modelo de componente dos erros bem como o modelo de efeitos fixos apresentaremos os resultados apenas para nosso exemplo ilustrativo Mas antes podemos estender facilmente a Equação 1642 para permitir que um componente de erro aleatório leve em conta variações ao longo do tempo veja o Exercício 166 Os resultados da estimação da função de custo de empresas aéreas pelo modelo de componentes dos erros são apresentados na Tabela 165 Note esses aspectos do MEA O valor médio do inter cepto é 1074293 Os valores diferenciais do intercepto das seis entidades são dados no final da re gressão A empresa número 1 por exemplo tem um valor de intercepto que é 270615 unidades mais baixo que aquele valor do intercepto comum de 1074293 o valor real do intercepto para essa em presa é então 1631857 Por outro lado o valor do intercepto da empresa número 6 é 57383 unida des mais alto que o valor comum do intercepto o valor real do intercepto para essa empresa aérea é 1074293 57383 ou 1648123 Os valores do intercepto para as outras empresas aéreas podem ser derivados de modo semelhante Entretanto veja que se você acrescentar os valores diferenciais do intercepto de todas as seis empresas a soma será 0 como deveria ser por quê Se você comparar os resultados do efeito fixo e as regressões de efeito aleatório perceberá que há diferenças substanciais entre os dois A questão importante agora é que resultados são confiáveis Em outras palavras qual deveria ser a escolha entre os dois modelos Podemos aplicar o teste de Hausman para elucidar a questão A hipótese nula subjacente ao teste de Hausman é que os estimadores do modelo de efeito fixo e do modelo de componentes dos erros não diferem substancialmente O teste estatístico desenvolvido por Hausman tem uma distribuição assintótica 2 Se a hipótese nula for rejeitada a conclusão é que o MCE não é adequado porque os efeitos alea tórios provavelmente estão correlacionados com um ou mais regressores Nesse caso o modelo de efeitos fixos é preferível aos de efeitos aleatórioscompo nentes dos erros Para nosso exemplo os resultados do teste de Hausman são semelhantes aos mos trados na Tabela 166 13 Veja KmeNta op cit p 625630 ECONOBOOKParte02indb 600 23112010 072145 Capítulo 16 Modelos de regressão com dados em painel 601 Tabela 165 Tabela 166 O teste de Hausman rejeita claramente a hipótese nula pois o valor 2 estimado para 3 graus de liberdade é altamente significativo se a hipótese nula for verdadeira a probabilidade de obter um valor de quiquadrado de até 4962 ou maior seria praticamente zero Como resultado podemos re jeitar o MCE e preferir o modelo de efeitos fixos Por sinal a última parte da tabela compara os coe ficientes de efeito fixo e de efeito aleatório de cada variável e como a última coluna mostra no nosso exemplo as diferenças são estatisticamente significativas Teste do multiplicador de lagrange de breusch e pagan14 Além do teste de Hausman também podemos usar o teste de BreuschPagan BP para verifi car a hipótese de que não há efeitos aleatórios isto é æ 2 u na Equação 1667 é zero Esse teste está 14 BreUSCh t PaGaN a r the lagrange multiplier test and its application to model specification in econometrics Review of Economic Studies 1980 v 47 p 239253 ECONOBOOKParte02indb 601 23112010 072146 602 Parte três Tópicos em econometria incluído em programas de computador como o STATA Sob a hipótese nula o BP segue uma dis tribuição de quiquadrado com 1 grau de liberdade há apenas 1 grau de liberdade porque estamos testando a hipótese única de que æ 2 u 0 Não apresentaremos a fórmula que fundamenta o teste pois é bastante complicada Retomando nosso exemplo das empresas aéreas uma aplicação do teste BP produz um quiquadrado de 061 Com 1 grau de liberdade o p valor de obter um valor de quiquadrado de 061 ou maior é cerca de 43 Portanto não rejeitamos a hipótese nula Em outras palavras o modelo de efeitos alea tórios não é adequado neste exemplo O teste BP reforça o teste de Hausman que também constatou que o modelo de efeitos aleatórios não é adequado para nosso exemplo de empresas aéreas 167 Propriedades de vários estimadores15 Discutimos vários métodos de estimação de modelos de regressão em painel linear como esti madores para dados agrupados estimadores de efeitos fixos que incluem estimadores de mínimos quadrados com variável dummy de mínimos quadrados linear estimadores dentro de grupos esti madores de primeiras diferenças e estimadores de efeitos aleatórios Quais suas propriedades estatís ticas Uma vez que os dados em painel em geral envolvem um grande número de observações nos concentraremos na propriedade da consistência desses estimadores Estimadores para dados empilhados Supondo que os coeficientes angulares sejam constantes entre os indivíduos se o termo de erro na Equação 1631 não estiver correlacionado com os regressores os estimadores para dados empilha dos serão consistentes Entretanto como observado os termos de erro provavelmente estão correla cionados ao longo do tempo para um dado indivíduo Portanto os erros padrão corrigidos para painel devem ser usados para testar a hipótese Verifique se o programa estatístico que você usa tem esse recurso caso contrário os erros padrão calculados podem estar subestimados Devese notar que se o modelo de efeitos fixos for adequado mas usarmos o estimador para dados empilhados os coe ficientes estimados serão inconsistentes Estimadores de efeitos fixos Mesmo que se pressuponha que o modelo subjacente seja com dados empilhados ou de efeito aleatório os estimadores de efeitos fixos são sempre consistentes Estimadores de efeito aleatório O modelo de efeitos aleatórios é consistente mesmo que o verdadeiro modelo seja o estimador para dados empilhados No entanto se o verdadeiro modelo for de efeitos fixos o estimador de efei tos aleatórios será inconsistente Para demonstrações e maiores detalhes sobre essas propriedades consulte os livrostextos de Cameron e Trivedi Greene e Wooldridge citados nas notas de rodapé 168 Modelo de efeitos fixos versus modelo de efeitos aleatórios algumas orientações O desafio que um pesquisador enfrenta é qual modelo é melhor o de efeitos fixos MEF ou o modelo de componente dos erros MCE A resposta a essa pergunta depende do pressuposto que fazemos sobre a correlação provável entre o componente de erro i específico ao corte transversal ou individual e os regressores X 15 a discussão a seguir é extraída de CamerON a Colin triVeDi Pravin K Microeconometrics methods and applications Nova York Cambridge University Press Cambridge 2005 cap 21 ECONOBOOKParte02indb 602 23112010 072146 Capítulo 16 Modelos de regressão com dados em painel 603 Se considerarmos que i e os X não estão correlacionados o modelo de componente dos erros pode ser adequado mas se i e os X estiverem correlacionados o modelo de efeitos fixos pode ser adequado A hipótese subjacente ao modelo de componente dos erros é que os i são extrações aleatórias de uma população muito maior mas às vezes este pode não ser o caso Por exemplo suponha que dese jemos estudar a taxa de criminalidade em 50 Estados dos Estados Unidos Naturalmente nesse caso a hipótese de que os 50 Estados são uma amostra aleatória não se sustenta Tendo em mente essas duas abordagens o que mais podemos verificar na escolha entre o modelo de efeitos fixos e o de componente dos erros As observações de Judge et al feitas a esse respeito podem ser úteis16 1 Se T o número de dados da séries temporais for grande e N o número de unidades de cor te transversal for pequeno provavelmente haverá uma diferença pequena nos valores dos parâmetros estimados pelo modelo de efeitos fixos e o de componente de erros Logo a es colha aqui se baseia na conveniência computacional Nesse aspecto o modelo de efeitos fi xos pode ser preferível 2 Quando N é grande e T é pequeno um painel curto as estimativas obtidas pelos dois méto dos podem diferir significativamente Lembrese de que no MCE Ø1i Ø1 i em que i é o componente aleatório de corte transversal enquanto no modelo de efeitos fixos tratamos Ø1i como fixo e não aleatório Nesse último caso a inferência estatística é condicional às unidades de corte transversal observadas na amostra Isso é adequado se acreditarmos real mente que as unidades individuais ou de corte transversal da amostra não são extrações aleatórias de uma amostra maior Nesse caso o modelo de efeitos fixos é adequado Porém se as unidades de corte transversal na amostra forem consideradas extrações aleatórias o modelo de componente dos erros será adequado pois nesse caso a inferência estatística é incondicional 3 Se o componente dos erros individual i e um ou mais regressores são correlacionados os estimadores de componente dos erros são tendenciosos enquanto aqueles obtidos do mode lo de efeitos fixos são não tendenciosos 4 Se N for grande e T pequeno e se as premissas subjacentes ao modelo de componente dos erros os estimadores do modelo de componente dos erros são mais eficientes que o modelo de efeitos fixos 5 Ao contrário do modelo de efeitos fixos o modelo de componente dos erros pode esti mar coeficientes das variáveis que não mudam ao longo do tempo como gênero e raça O modelo de efeitos fixos controla variáveis que não mudam ao longo do tempo mas não pode estimálas diretamente como está claro dos modelos MQVD ou modelos de estimador dentro do grupo Por outro lado o modelo de efeitos fixos controla todas as variáveis que não mudam ao longo do tempo por quê enquanto o modelo de compo nente dos erros pode estimar apenas essas variáveis que não mudam ao longo do tempo da forma como são introduzidas explicitamente no modelo Apesar do teste de Hausman é importante ter em mente a advertência feita por Johnston e Di Nardo Ao decidirem entre os modelos de efeitos fixos e de efeitos aleatórios eles alegam que não existe uma regra simples para ajudar o pesquisador a ir além da Scylla de efeitos fixos e o Charybdis de erro de medição e seleção dinâmica Embora sejam um aprimoramento em relação aos dados de corte transversal os dados em painel não oferecem a cura para os problemas do econometrista17 16 JUDGe et al op cit p 489491 17 JOhNStON Jack DiNarDO John Econometric methods 4 ed Nova York mcGrawhill 1997 p 403 ECONOBOOKParte02indb 603 23112010 072147 604 Parte três Tópicos em econometria 169 Regressão de dados em painel alguns comentários conclusivos Como observado no início a modelagem de dados em painel é um assunto vasto e complexo mal arranhamos a superfície Entre os vários tópicos que não discutimos estão 1 O teste de hipóteses com dados em painel 2 A heterocedasticidade e a autocorrelação no modelo de componente dos erros 3 Dados em painel desbalanceados 4 Modelos dinâmicos de dados em painel em que os valores defasados do regressando apare cem como uma variável explanatória 5 Equações simultâneas envolvendo dados em painel 6 Variáveis dependentes qualitativas e dados em painel 7 Raízes unitárias em dados em painel sobre raízes unitárias veja o Capítulo 21 Um ou mais desses tópicos podem ser encontrados nas referências citadas neste capítulo e o leitor é convidado a consultálos para aprender mais sobre o assunto Essas referências também citam vá rios estudos aplicados em diversas áreas econômicas e de negócio que têm usado modelos de regres são com dados em painel O iniciante é aconselhado a ler algumas dessas aplicações para ter uma ideia de como os pesquisadores têm implementado tais modelos18 19 1610 Alguns exemplos ilustrativos exeMplO 161 Produtividade e investimento público Para descobrir por que a produtividade caiu e qual é o papel do investimento público alicia munnell estudou dados sobre produtividade em 48 estados continentais norteame ricanos durante 17 anos de 1970 a 1986 para um total de 816 observações19 Usando esses dados estimamos a regressão para dados empilhados na tabela 167 Note que essa regressão não leva em conta a natureza dos dados em painel Tabela 167 Continua 18 Para maiores detalhes e aplicações concretas veja alliSON Paul D Fixed effects regression methods for longitudinal data using SAS Carolina do Norte SaS institute Cary 2005 19 Os dados de munnell estão disponíveis em wwwawbccommurray ECONOBOOKParte02indb 604 23112010 072147 Capítulo 16 Modelos de regressão com dados em painel 605 exeMplO 161 Continuação a variável dependente nesse modelo é o GSP produto bruto estadual e as variáveis ex planatórias são PriVCaP capital privado PUBCaP capital público Water fornecimento de água e UNemP taxa de desemprego Nota L representa logaritmo natural todas as variáveis têm o sinal esperado e todas são individual e coletivamente significati vas do ponto de vista estatístico supondose que todas as hipóteses do modelo clássico de regressão linear sejam mantidas Para levarmos em conta a dimensão do painel na tabela 168 estimamos um modelo de efeitos fixos usando 47 variáveis dummies para os 48 estados para evitar cair na armadilha da variável dummy Tabela 168 Tabela 169 Para pouparmos espaço apresentaremos apenas os coeficientes de regressão estimados e não os coeficientes de cada variável dummy mas devese acrescentar que as variáveis dummies dos 47 estados eram significativas do ponto de vista estatístico Continua ECONOBOOKParte02indb 605 23112010 072148 606 Parte três Tópicos em econometria exeMplO 161 Continuação Podemos ver que há diferenças substanciais entre a regressão para dados empilhados e a de efeitos fixos que questionam os resultados da regressão para dados empilhados Para verificar mos se o modelo de efeitos aleatórios é mais adequado nesse caso apresentamos os resultados do modelo de regressão de efeitos aleatórios na tabela 169 Para escolhermos entre os dois modelos usamos o teste de hausman que apresenta os resultados da tabela 1610 Uma vez que o valor estimado do quiquadrado é altamente significativo do ponto de vista estatístico rejeitamos a hipótese de que não há diferença significativa nos coeficientes estimados dos dois modelos Parece haver correlação entre o termo de erro e um ou mais regressores logo podemos rejeitar o modelo de efeitos aleatórios em favor do modelo de efeitos fixos No entanto como a última parte da tabela 1610 mostra nem todos os coefi cientes diferem nos dois modelos Por exemplo não há uma diferença estatisticamente significativa nos valores do coeficiente de LUNemP nos dois modelos Tabela 1610 exeMplO 162 Demanda por energia elétrica nos EUA em seu artigo maddala et al consideraram a demanda de energia elétrica e gás natural em residências em 49 estados norteamericanos para o período de 19701990 o havaí não foi incluído na análise20 Neste exemplo só iremos considerar a demanda por eletricidade residencial Primeiro apresentamos os resultados com base na estimação de efeitos fixos tabela 1611 e então na estimação de efeitos aleatórios tabela 1612 seguida por uma comparação dos dois modelos Tabela 1611 Continua 20 20 maDDala G S trOSt robert P li hongyi JOUtZ Frederick estimation of shortrun and longrun elasticities of demand from panel data using shrikdage estimators Journal of Business and Economic Statistics jan 1997 v 15 n 1 p 90100 ECONOBOOKParte02indb 606 23112010 072149 Capítulo 16 Modelos de regressão com dados em painel 607 exeMplO 162 Continuação em que log eSrCBPC logaritmo natural do consumo de eletricidade residencial per capita em bilhões logreSrCD logaritmo natural do preço real de eletricidade de 1987 e logYDPC logaritmo natural da renda real per capita disponível para 1987 Uma vez que este é um modelo de log duplo os coeficientes angulares estimados repre sentam elasticidades mantendose os demais fatores constantes se a renda real per capita subir 1 o consumo médio de eletricidade subirá cerca de 1 Da mesma forma manten dose os demais fatores constantes se o preço real da energia elétrica subir 1 o consumo médio de eletricidade cairá cerca de 06 todas as elasticidades estimadas são estatistica mente significativas Os resultados do modelo de erro aleatório estão na tabela 1612 Parece que não há mui ta diferença nos dois modelos mas podemos usar o teste de hausman para descobrir se é este o caso Os resultados desse teste são semelhantes aos da tabela 1613 embora os coeficientes dos dois modelos nas tabelas 1611 e 1612 sejam bem parecidos o teste de hausman mostra que este não é o caso O valor do quiquadrado é altamente significativo estatisticamente Portanto podemos escolher o modelo de efeitos fixos ao mo delo de efeitos aleatórios Tabela 1612 Continua ECONOBOOKParte02indb 607 23112010 072150 608 Parte três Tópicos em econometria exeMplO 162 Continuação Tabela 1613 Este exemplo ressalta o ponto importante de que quando o tamanho da amostra é grande em nosso caso 980 observações mesmo pequenas diferenças nos coeficientes estimados dos dois modelos podem ser estatisticamente significativas Os coeficientes da variável logreSrCD nos dois modelos parecem razoavelmente próximos mas estatisticamente não são exeMplO 163 Consumo de cerveja renda e imposto sobre a cerveja Para avaliar o impacto do imposto sobre a cerveja no consumo de cerveja Philip Cook investigou a relação entre os dois depois de admitir o efeitorenda21 seus dados são relativos a 50 estados e a Washington DC para o período de 19752000 neste exemplo estudare mos a relação de vendas de cerveja per capita e renda tudo no nível estadual apresenta remos os resultados dos modelos de mQO para dados empilhados de efeitos fixos e de efeitos aleatórios em forma tabular na tabela 1614 a variável dependente são as vendas de cerveja per capita esses resultados são interessantes em se tratando de uma teoria econômica esperaríamos uma relação negativa entre o consumo de cerveja e os impostos sobre a bebida que é o caso para os três modelos o efeitorenda negativo sobre o consumo de cerveja sugeriria que a cerveja é um bem inferior ou seja aquele em que a demanda diminui quando a renda dos consumidores aumenta Para nossos propósitos é interessante notar a diferença nos coeficientes estimados apa rentemente não há muita diferença nos coeficientes estimados entre o modelo de efeitos fixos e o modelo de componentes dos erros De fato o teste de hausman produz um valor de quiquadrado de 34 que não é significativo para 2 graus de liberdade a um nível de 5 o p valor é 01783 Os resultados baseados no mQO no entanto são completamente diferentes o coeficien te da variável imposto sobre cerveja em valor absoluto é muito menor que o obtido do modelo de efeitos fixos ou do mo delo de componentes dos erros a variável renda embora tenha sinal negativo não é estatisticamente signifi cativa enquanto os outros dois modelos mostram que ela é altamente significativa este exemplo mostra claramente o que poderia acontecer se negligenciássemos a estru tura em painel dos dados e estimássemos uma regressão para dados empilhados Continua 21 21 Os dados usados aqui são obtidos do site de mUrPhY michael P Econometrics a modern introduction Boston Pearsonaddison Wesley 2006 Os dados originais foram coletados por Philip Cook para seu livro Paying the tab the costs and benefits of alcohol control Princeton Nova Jersey Princeton University Press 2007 ECONOBOOKParte02indb 608 23112010 072151 Capítulo 16 Modelos de regressão com dados em painel 609 exeMplO 163 Continuação Tabela 1614 Imposto sobre a cerveja 6 Notas Os dados entre parênteses são razões t estimadas 354e6 H 000000354 Resumo e conclusões 1 Os modelos de regressão em painel baseiamse em dados em painel Estes consistem em observações sobre as mesmas unidades de corte transversal ou individuais em vários perío dos de tempo 2 Várias são as vantagens de usar dados em painel Primeiro eles aumentam consideravel mente o tamanho da amostra Em segundo lugar ao estudarmos observações repetidas de corte transversal os dados em painel são mais adequados para estudar a dinâmica da mu dança Terceiro os dados em painel permitem estudar modelos comportamentais mais complicados 3 Apesar de suas vantagens substanciais os dados em painel impõem vários problemas de estimação e inferência Uma vez que esses dados envolvem tanto dimensões temporais quanto de corte transversal os problemas inerentes aos dados de corte transversal por exem plo heterocedasticidade e de séries temporais por exemplo autocorrelação precisam ser tratados Há também alguns problemas adicionais como de correlação cruzada de unidades individuais no mesmo ponto no tempo 4 Há várias técnicas de estimação para tratar de um ou mais desses problemas As duas mais destacadas são 1 o modelo de efeitos fixos MEF e 2 o modelo de efeitos aleatórios MEA ou modelo de componentes dos erros MCE 5 No MEF o intercepto do modelo de regressão pode diferir entre indivíduos em reconhe cimento ao fato de que cada indivíduo ou unidade de corte transversal pode ter caracte rísticas especiais próprias Para levarmos em conta os diferentes interceptos podemos usar variáveis dummies O modelo de efeitos fixos que usa variáveis dummies é conhecido como modelo de mínimos quadrados com variáveis dummies para efeitos fixos MQVD O FEM é adequado em situações em que o intercepto específico ao indivíduo pode estar correlacionado com um ou mais regressores Uma desvantagem do MQVD é que ele con some muitos graus de liberdade quando o número de unidades de corte transversal N é muito grande e nesse caso temos de introduzir N variáveis dummies mas suprimir o ter mo de intercepto comum 6 Uma alternativa ao MEF é o modelo de componentes dos erros MCE Nele supõese que o intercepto de uma unidade individual seja extraído aleatoriamente de uma população muito maior com um valor médio constante O intercepto individual é então expresso como um desvio desse valor médio constante Uma vantagem do MCE sobre o MEF é que ele é eco nômico nos graus de liberdade e não temos de estimar N interceptos de corte transversal Só precisamos estimar o valor médio do intercepto e sua variância O MCE é adequado em si tuações em que cada unidade do intercepto aleatório do corte transversal não está correla cionada com os regressores Outra vantagem do MCE é que podemos introduzir variáveis Capítulo 16 Modelos de regressão com dados em painel 609 ECONOBOOKParte02indb 609 23112010 072151 610 Parte três Tópicos em econometria como gênero religião e raça que permanecem constantes para um dado indivíduo No MEF não podemos fazer isso porque todas essas variáveis são colineares com o intercepto espe cífico ao indivíduo Além disso se usamos o estimador dentro do grupo ou o estimador de primeiras diferenças toda a invariância no tempo desaparecerá 7 O teste de Hausman pode ser usado para decidir entre o MEF e o MCE Também podemos usar o teste de BreuschPagan para verificar se o MCE é adequado 8 Apesar de sua crescente utilização em pesquisa aplicada e apesar da crescente disponibili dade de tais dados as regressões de dados em painel podem não ser adequadas em todas as situações É preciso usar o julgamneto prático em cada caso 9 Há problemas específicos com os dados em painel que precisam ser considerados O mais sério é o do atrito pelo qual por uma razão ou por outra os indivíduos do painel desaparecem ao longo do tempo e nos levantamentos subsequentes ou cortes transver sais permanecem menos indivíduos no painel Mesmo que não haja atrito ao longo do tempo os indivíduos podem não querer ou mesmo se recusarem a responder a algumas perguntas exerCíCiOS 161 Quais os aspectos especiais de a dados de corte transversal b dados de séries temporais e c dados em painel 162 O que se entende por modelo de efeitos fixos MEF Uma vez que os dados em painel têm dimensões temporais e espaciais como o modelo de efeitos fixos permite ambas as dimen sões 163 O que se entende por modelo de componentes dos erros MCE Como ele difere do modelo dos efeitos fixos Quando o modelo de componentes dos erros é adequado E quando o mode lo de efeitos fixos é adequado 164 Há diferença entre o modelo de mínimos quadrados com variáveis dummies o estimador de dentro de um grupo e modelos de primeiras diferenças 165 Quando os modelos de regressão de dados em painel são inadequados Dê exemplos 166 Como você estenderia o modelo 1642 para ter um componente de erro temporal Anote o modelo 167 Consulte os dados sobre produção de ovos e seus preços apresentados na Tabela 11 Qual modelo pode ser adequado aqui o de efeitos fixos MEF ou o de componentes dos erros MCE Por quê 168 Para os investimentos apresentados na Tabela 12 qual modelo você escolheria o de efeitos fixos ou o de efeitos aleatórios Por quê 169 Com base no Michigan Income Dynamics Study Hausman tentou estimar um modelo de salá rios ou ganhos usando uma amostra de 629 formandos no segundo grau que foi seguida por um período de seis anos dando assim no total 3774 observações A variável dependente nesse estudo foi o logaritmo do salário e as variáveis explanatórias foram idade dividida em várias faixas etárias desemprego no ano anterior problemas de saúde no ano anterior traba lho como autônomo região de residência para formandos no Sul Sul 1 e 0 em caso contrá rio e área de residência para um formando da área rural Rural 1 e 0 nos demais casos Hausman usou tanto o modelo de efeitos fixos quanto o de componentes dos erros Os resulta dos estão na Tabela 1615 erros padrão entre parênteses 610 Parte três Tópicos em econometria ECONOBOOKParte02indb 610 23112010 072151 Capítulo 16 Modelos de regressão com dados em painel 611 Capítulo 16 Modelos de regressão com dados em painel 611 Desempregado no ano anterior a Esses resultados econômicos fazem sentido b Existe uma grande diferença nos resultados produzidos pelos dois modelos Em caso afir mativo o que poderia responder pelas diferenças c Com base nos dados apresentados na tabela que modelo se houver você escolheria exercícios aplicados 1610 Consulte o exemplo da empresa aérea discutido no texto Em vez do modelo linear da Equa ção 1642 estime um modelo de regressão loglinear e compare seus resultados com os da Tabela 162 1611 Consulte os dados da Tabela 11 a Seja Y ovos produzidos em milhões e X preço dos ovos centavos por dúzia Estime o modelo para os anos de 1990 e 1991 separadamente b Agrupe as observações para os dois anos e estime a regressão para dados empilhados Que pressupostos você está fazendo ao agrupar os dados c Use o modelo de efeitos fixos distinguindo os dois anos e apresente resultados de regressão d Você pode usar o modelo de efeitos fixos distinguindo os 50 Estados Por quê e Faria sentido distinguir tanto o efeito Estado quanto o efeito ano Nesse caso quantas va riáveis dummies você teria de introduzir f O modelo de componentes de erro seria adequado para modelar a produção de ovos Por quê Veja se você consegue estimar esse modelo usando por exemplo o EViews 1612 Continue com o Exercício 1611 Antes de efetuar a regressão para dados empilhados você quer descobrir se os dados podem ser empilhados Para tanto use o teste de Chow discutido no Capítulo 8 Mostre os cálculos necessários envolvidos e determine se a regressão para dados empilhados faz sentido 1613 Use os dados de investimento apresentados na Tabela 16 a Estime a função de investimento de Grunfeld para cada empresa b Agora agrupe os dados para todas as empresas e estime a função de investimento de Grunfeld pelos MQO c Use o MQVD para estimar a função investimento e compare seus resultados com a regres são para dados empilhados estimada em b Tabela 1615 Equações de salários variável dependente logaritmo de salários Fonte reproduzido de HSIAO Cheng Analysis of panel data Cambridge University Press 1986 p 42 Fonte original HAUSMAN J A Specification tests in econometrics Econometrica vl 46 p 12511271 1978 ECONOBOOKParte02indb 611 23112010 072152 612 Parte três Tópicos em econometria 612 Parte três Tópicos em econometria d Como você decidiria entre a regressão para dados empilhados e o MQVD Mostre os cál culos necessários 1614 A Tabela 1616 apresenta dados sobre a taxa de remuneração por hora no setor de manufatura em dólares americanos Y e a taxa de desemprego civil X índice 1992 D 100 para o Canadá o Reino Unido e os Estados Unidos para o período de 19802006 Considere o modelo 1 Notas DES Taxa de desemprego REM Índice de remuneração por hora em dólares americanos 1992100 CAN Canadá RU Reino Unido a A priori qual a relação esperada entre Y e X Por quê b Estime o modelo da Equação 1 para cada país c Estime o modelo agrupando todas as 81 observações d Estime o modelo de efeitos fixos e Estime o modelo de componentes dos erros f Qual o melhor modelo o MEF ou o MCE Justifique sua resposta Dica aplique o teste de Hausman 1615 Baltagi e Griffin consideraram a seguinte função de demanda por gasolina Tabela1616 Taxa de desemprego e remuneração por hora em manufatura nos Estados Unidos Canadá e Reino Unido 19802006 Fonte Economic Report of the President janeiro 2008 Tabela B109 BaltaGi B h GriFFiN J m Gasoline demand in the OeCD an application of pooling and testing procedures European Economic Review v 22 p 117137 1983 Os dados para 18 países da OeCD para os anos 19601978 estão disponíveis em httpwwwwileycomlegacywileychibaltagisuppGasolinedat ou no site do livro tabela 1617 ECONOBOOKParte02indb 612 23112010 072153 Capítulo 16 Modelos de regressão com dados em painel 613 em que Y consumo de gasolina por carro X2 renda real per capita X3 preço real da gasolina X4 número de carros per capita i código do país em todos os 18 países inte grantes da OECD Organização para a Cooperação e Desenvolvimento Econômico e t observações anuais de 19601978 Nota os valores na tabela já estão em logaritmo a Estime a função de demanda agrupando os dados para todos os 18 países um total de 342 observações b Estime um modelo de efeitos fixos usando os mesmos dados c Estime um modelo de componentes aleatórios usando os mesmos dados d De sua análise qual modelo descreve melhor a demanda de gasolina nos 18 países da OECD Justifique sua resposta 1616 O artigo de Subhayu Bandyopadhyay e Howard J Wall The determinants of aid in the postcold war era Review Federal Reserve Bank of St Louis v 89 n 6 p 533547 nov dez 2007 usa dados em painel para estimar a resposta da ajuda recipiente a necessidades econômicas e físicas dos países direitos civispolíticos e efetividade do governo Os dados referemse a 135 países para um período de três anos O artigo e os dados estão disponíveis em httpresearchstlouisfedorgpublicationsreviewpast2007 v 89 n 10 novdez Os dados podem ser encontrados ainda na Tabela 1618 do site do livro Estime o modelo dos autores dado na página 534 para o artigo deles usando um estimador de efeitos aleatórios Compare seus resultados com aqueles dos estimadores de efeitos fixos e para dados empilha dos pelos autores na Tabela 2 do artigo deles Qual modelo é adequado aqui o de efeitos fixos ou o de efeitos aleatórios Por quê 1617 Consulte o exemplo de empresas aéreas discutido no texto Para cada empresa aérea estime uma função de custo com série logarítmica Como essas regressões comparamse com os mo delos de efeitos fixos e aleatórios discutidos no capítulo Você estimaria também as 15 funções logarítmicas de custo de corte transversal Por quê Capítulo 16 Modelos de regressão com dados em painel 613 ECONOBOOKParte02indb 613 23112010 072153 614 Modelos econométricos dinâmicos modelos autorregressivos e com defasagens distribuídas Na análise de regressão envolvendo dados de séries temporais se o modelo de regressão incluir não só os valores correntes mas também os defasados passados das variáveis explanatórias os X será chamado de modelo de defasagens distribuídas Se o modelo incluir um ou mais valores defa sados da variável dependente entre suas variáveis explanatórias será denominado modelo autorre gressivo Assim representa um modelo de defasagens distribuídas enquanto é exemplo de um modelo autorregressivo Este também é chamado de modelo dinâmico por retratar a trajetória da variável dependente no tempo em relação a seus valores passados Os modelos autorregressivo e de defasagens distribuídas são usados extensamente na análise econométrica e serão examinados neste capítulo com a finalidade de esclarecer o seguinte 1 Qual é o papel das defasagens na economia 2 Quais as razões para defasagens 3 Existe justificativa teórica para os modelos defasados usados comumente em econometria empírica 4 Qual é a relação se houver entre o modelo de defasagem autorregressivo e o de defasagens dis tribuídas Um pode derivar do outro 5 Cite alguns problemas estatísticos envolvidos na estimação desses modelos 6 A relação leadlag entre variáveis implica causalidade Nesse caso como a medimos 171 O papel do tempo ou defasagem em economia Em economia a dependência de uma variável Y a variável dependente sobre outras variáveis X a variável explanatória raramente é imediata Com muita frequência Y responde a X com lapsos de tempo Esse lapso é chamado de defasagem Para ilustrar a natureza das defasagens consideremos vários exemplos Capítulo 17 ECONOBOOKParte04indb 614 23112010 072438 Capítulo 17 Modelos econométricos dinâmicos modelos autorregressivos e com defasagens distribuídas 615 ExEmplo 171 A função consumo Suponhamos que uma pessoa receba um aumento de salário de 2 mil no pagamento anual e que este seja um aumento permanente ou seja será mantido Qual o efeito des se aumento na renda sobre as despesas de consumo anual da pessoa Depois de um aumento na renda as pessoas em geral não se apressam em gastálo imedia tamente Assim aquele que recebeu pode decidir aumentar as despesas de consumo em 800 no primeiro ano após o aumento de salário na renda e mais 600 no próximo ano e outros 400 no ano seguinte economizando o restante No final do terceiro ano as despesas de con sumo anual terão aumentado 1800 Podemos assim escrever a função consumo como 1711 em que Y é a despesa de consumo e X a renda A Equação 1711 mostra que o efeito de um aumento na renda de 2 mil é distribuí do por um período de 3 anos Modelos como a Equação 1711 são portanto chamados de modelos de defasagens distribuídas porque o efeito de uma dada causa renda espalhase por vários períodos Geometricamente o modelo de defasagens distribuídas 1711 está na Figura 171 ou alternativamente na Figura 172 Figura 171 Exemplo de defasagens distribuídas Despesas de consumo 1800 800 600 400 Tempo t2 t3 0 t1 Figura 172 Efeito de uma alteração unitária em X no período t sobre Y no período t e subsequentes Tempo t 1 t 4 t 3 t 2 β1 03 t β0 04 β1 02 β0 Xt β4 Xt β3Xt β2Xt β1Xt Efeito sobre Y Em termos gerais podemos escrever 1712 que é um modelo de defasagens distribuídas com um número de defasagens k finito no tempo O coefi ciente Ø0 é conhecido como multiplicador de curto prazo ou de impacto porque dá a variação do valor médio de Y em decorrência da variação unitária de X no mesmo período1 Se a variação em X for 1 Tecnicamente Ø0 é a derivada parcial de Y com relação a Xt Ø1 é a derivada parcial com relação a Xt1 Ø2 com relação a Xt2 e assim por diante Simbolicamente Yt Xtk D Øk ECONOBOOKParte04indb 615 23112010 072440 616 Parte Três Tópicos em econometria mantida no mesmo nível a partir daí Ø0 C Ø1 dá a variação no valor médio Y no período seguinte Ø0 C Ø1 C Ø2 no período subsequente e assim por diante Essas somas parciais são chamadas de multiplicadores interinos ou intermediários Depois de k períodos obtemos 1713 conhecido como multiplicador de defasagens de longo prazo ou total desde que exista a soma Ø a ser discutida adiante Se definimos 1714 obtemos o Øi padronizado Somas parciais do Øi padronizado dão a proporção do impacto a longo prazo ou total sentido por um certo período de tempo Voltando à regressão do consumo 1711 vemos que o multiplicador de curto prazo que nada mais é do que a propensão marginal a consumir PMC é 04 enquanto o multiplicador de longo prazo que é a propensão marginal a consumir a longo prazo é 04 C 03 C 02 D 09 Ou seja após um aumento de 1 na renda o consumidor aumentará seu nível de consumo em cerca de 040 no ano do aumento em mais 030 no ano seguinte e outros 020 no ano subsequente O impacto de um aumento de 1 na renda a longo prazo é portanto de 090 Se dividimos cada Øi por 09 obte mos respectivamente 044 033 e 023 que indicam que 44 do impacto total de uma variação uni tária de X sobre Y é sentido imediatamente 77 depois de um ano e 100 no final do segundo ano ExEmplo 172 Criação de moeda pelos bancos demanda por depósitos Suponha que o Banco Central injete 1 mil de moeda nova no sistema bancário com prando títulos do governo Qual será a quantia total de moeda bancária ou demanda por depósitos que será gerada Seguindo o sistema de reservas fracionárias se supusermos que por lei os bancos devem manter uma reserva de 20 para garantir os depósitos gerados então pelo conhecido pro cesso multiplicador a quantia total de depósitos em dinheiro a ser gerada será igual a 100011 08 D 5000 Evidentemente 5 mil em depósitos em dinheiro não serão criados do dia para a noite O processo leva tempo o que pode ser mostrado esquematica mente na Figura 173 Figura 173 Expansão cumulativa em depósitos bancários reserva inicial de 1 mil e requisito de 20 de reserva 5000 4000 3000 2000 1000 Final Inicial 1000 1 2 3 4 5 6 7 Estágio em expansão 328 409 512 640 800 ECONOBOOKParte04indb 616 23112010 072440 Capítulo 17 Modelos econométricos dinâmicos modelos autorregressivos e com defasagens distribuídas 617 ExEmplo 173 Relação entre moeda e preços De acordo com os monetaristas a inflação é essencialmente um fenômeno monetário no sentido que um aumento contínuo no nível geral de preços devese à taxa de expan são da oferta de moeda em excesso em relação à quantidade de moeda realmente de mandada pelas unidades econômicas Evidentemente essa ligação entre inflação e mudanças na oferta de moeda não é imediata Estudos mostraram que a defasagem entre as duas é em torno de 3 a aproximadamente 20 trimestres Os resultados em determina do estudo estão na Tabela 1712 na qual vemos que o efeito de uma variação de 1 na oferta de moeda no conceito de M1B D moeda manual C demanda por depósitos em instituições financeiras é sentido no período de 20 trimestres O impacto a longo prazo de uma variação de 1 na oferta de moeda sobre a inflação é de aproximadamente que é estatisticamente significativo enquanto o impacto a curto prazo é de aproximadamente 004 que não é significativo embora os multiplicadores intermediá rios pareçam significativo de modo geral Vale mencionar que uma vez que P e M são dados em forma percentual o mi Øi em nossa notação usual dá a elasticidade de P com relação a M isto é a resposta percentual de preços a um aumento de 1 na oferta de moeda Assim m0 D 0041 significa que para um aumento de 1 na oferta de moeda a elasticidadepreço a curto prazo é de cerca de 004 A elasticidade em longo prazo é de 103 implicando que em longo prazo um aumento de 1 na oferta de moeda reflete se aproximadamente no mesmo aumento percentual nos preços A curto prazo um au mento de 1 na oferta de moeda é acompanhado a longo prazo por um aumento de 1 na taxa de inflação TabEla 171 Estimativa da equação moedapreços especificação original Fonte Carlson Keith M The lag from money to prices Review Federal Reserve Bank of St Louis out 1980 Tabela 1 p 4 Notas P D taxa de crescimento geométrico anual do deflator do PNB M D taxa de crescimento geométrico anual do M1B 23 ExEmplo 174 Defasagem entre despesas com P D e produtividade A decisão de investir em pesquisa e desenvolvimento PD e seu retorno em termos do aumento da produtividade envolve uma defasagem considerável na verdade várias defasagens como a defasagem entre o investimento de recursos e o tempo em que as invenções começam a aparecer a defasagem entre o nascimento de uma ideia e seu desenvolvimento até a etapa de aplicação comercial e a defasagem introduzida pelo pro cesso de difusão leva tempo até que todas as máquinas antigas sejam substituídas por máquinas melhores3 2 CArlSON Keith M The lag from money to prices Review Federal reserve Bank of St louis out 1980 Tabe la 1 p 4 3 GriliChES Zvi Distributed lags a survey Econometrica jan1967 v 36 n 1 p 1649 ECONOBOOKParte04indb 617 23112010 072441 618 Parte Três Tópicos em econometria ExEmplo 175 A curva J da economia internacional Os estudantes de economia internacional conhecem o que é chamado de curva J que mostra a relação entre a balança comercial e a depreciação do câmbio Depois da deprecia ção da moeda de um país por exemplo devido à desvalorização inicialmente a balança comercial deteriorase para mais adiante melhorar mantido tudo o mais constante A curva é apresentada na Figura 174 Figura 174 A curva J Fonte Krugman Paul R Obstfeld Maurice International economics theory and practice 3 ed Harper Collins Nova York Harper Collins 1994 p 465 2 1 3 Tempo A depreciação real ocorre e iniciase a curva J Conta corrente em unidades de produção nacional Efeito de longo prazo da depreciação real em conta corrente Fim da curva J ExEmplo 176 O modelo do acelerador do investimento Em sua forma mais simples o princípio de aceleração da teoria de investimento diz que o investimento é proporcional a mudanças no produto Simbolicamente It D ØXt Xt1 Ø 0 1715 em que It é o investimento no período t Xt é a produção no período t e Xt1 é o produto no período t 1 Os exemplos anteriores são apenas uma amostra do uso de defasagens em economia Sem dúvida o leitor poderá extrair vários exemplos de sua própria experiência 172 A razão das defasagens4 Embora os exemplos citados na Seção 171 apontem para a natureza de fenômenos defasados eles não explicam plenamente por que as defasagens ocorrem Há três razões principais 1 Razões psicológicas Como resultado da força do hábito inércia as pessoas não mudam seus hábi tos de consumo imediatamente após uma redução no preço ou um aumento na renda talvez porque de imediato o processo de mudança possa envolver uma desutilidade imediata Por isso aqueles que ficam milionários de repente ao ganhar na loteria podem não mudar os estilos de vida aos quais estão acostumados há muito tempo porque não sabem como reagir imediatamente a um ganho ines perado Evidentemente depois de um tempo razoável podem aprender a viver com sua fortuna recémadquiri da Além disso muitas vezes as pessoas não sabem se a mudança é permanente ou transitória Assim a reação a um aumento em minha renda dependerá de ele ser ou não perma nente Se for apenas um ganho adicional e nos períodos subsequentes minha renda voltar ao nível anterior poderei economizar todo o aumento enquanto outra pessoa em minha posição poderá de cidir torrálo 4 Esta seção baseiase em NErlOVE Marc Distributed lags and demand analysis for agricultural and other commodities Agricultural handbook n 141 US Department of Agriculture jun 1958 ECONOBOOKParte04indb 618 23112010 072441 Capítulo 17 Modelos econométricos dinâmicos modelos autorregressivos e com defasagens distribuídas 619 2 Razões tecnológicas Suponha que o preço de capital relativo à mão de obra tenha uma queda tornando economicamente viável a substituição do capital por trabalho Evidentemente aumentar o capital leva tempo o período de gestação Além disso se esperamos que a queda no preço seja temporária as empresas podem não se apressar para substituir capital por mão de obra principal mente se esperam que depois de uma queda temporária nos preços de capital este possa ter um aumento que vá além de seu nível anterior Às vezes o conhecimento imperfeito também res ponde pelas defasagens Atualmente o mercado de computadores pessoais está ligado a todos os tipos de computadores com preços e especificações variados Além disso desde a sua introdução no final da década de 1970 os preços da maioria deles têm caído acentuadamente Como resul tado os consumidores potenciais podem hesitar em comprar até que tenham tido tempo para exami nar as especificações e preços de todas as marcas concorrentes Eles podem hesitar em comprar esperando que haja queda dos preços ou inovações 3 Razões institucionais Estas razões também contribuem para defasagens Por exemplo as obriga ções contratuais podem impedir as empresas de mudar de uma fonte de mão de obra ou matéria prima para outra Outro exemplo são aqueles que substituíram fundos em contaspoupança de longo prazo por fundos com prazo fixo com durações de um dois três ou sete anos e estão es sencialmente presos embora as condições do mercado financeiro possam ser tais que rendi mentos mais altos estejam disponíveis em outra parte Da mesma forma os empregadores dão frequentemente a seus funcionários opção entre vários planos de saúde mas uma vez feita a es colha o funcionário não pode mais mudar para outro plano durante o prazo mínimo de um ano Embora isso possa ser feito por conveniência administrativa o funcionário estará impedido de mudar durante um ano Pelas razões que acabamos de discutir a defasagem ocupa um papel central na economia Isso se reflete claramente na metodologia de curto prazolongo prazo da economia É por essa razão que di zemos que a elasticidaderenda ou a elasticidadepreço a curto prazo em geral são menores em valo res absolutos que as elasticidades correspondentes a longo prazo ou que a propensão marginal ao consumo a curto prazo é menor que aquela a longo prazo 173 Estimação de modelos com defasagens distribuídas Considerando que os modelos com defasagens distribuídas possuam um importante papel em economia como estimálos Especificamente suponha que tenhamos o seguinte modelo de defasa gens distribuídas em uma variável explanatória5 1731 em que não definimos a duração da defasagem ou seja quanto recuamos no passado Este é o chama do modelo de defasagens infinito enquanto na Equação 1712 temos o modelo finito de defasa gens distribuídas pelo fato de o número de defasagens k ser especificado Continuaremos a usar a Equação 1731 porque é fácil de calcular matematicamente como veremos6 Como estimamos Æ e o Ø da Equação 1731 Podemos adotar duas abordagens 1 a estimativa ad hoc e 2 restrições a priori do Ø supondo que os Ø sigam um padrão sistemático Consideraremos a estimação ad hoc nesta seção e a outra abordagem na Seção 174 Estimação ad hoc dos modelos de defasagens distribuídas Já que se supõe que a variável explanatória Xt seja não estocástica ou pelo menos não correlacio nada com o termo de erro ut Xt1 Xt2 e assim por diante também são não estocásticas Em princí pio os mínimos quadrados ordinários podem ser aplicados à Equação 1731 Esta é a abordagem 5 Se houver mais de uma variável explanatória no modelo cada variável pode ter um efeito defasado sobre Y Apenas por simplicidade supomos apenas uma variável explanatória 6 Na prática entretanto os coeficientes dos valores de X mais distantes têm um efeito desprezível sobre Y ECONOBOOKParte04indb 619 23112010 072442 620 Parte Três Tópicos em econometria seguida por Alt7 e Tinbergen8 Eles sugerem que para estimar a Equação 1731 podemos proceder sequencialmente ou seja primeiro fazendo a regressão de Yt contra Xt depois a regressão de Yt con tra Xt e Xt1 em seguida a regressão de Yt contra Xt Xt1 e Xt2 e assim sucessivamente O procedi mento sequencial é descontinuado quando os coeficientes de regressão das variáveis defasadas começam a tornarse estatisticamente insignificantes eou o coeficiente de pelo menos uma das variá veis muda o sinal de positivo para negativo ou viceversa De acordo com esse preceito Alt fez a regressão de consumo de combustível de Y sobre novos pedidos X Com base nos dados trimestrais para o período de 19301939 os resultados foram os seguintes Alt escolheu a segunda regressão como a melhor pois nas duas últimas equações o sinal do Xt2 não estava estável e na última o sinal de Xt3 foi negativo o que pode ser difícil de interpretar em termos econômicos Embora aparentemente simples a estimação ad hoc apresenta várias desvantagens como as seguintes 1 Não existe a priori uma orientação sobre a qual será a duração máxima da defasagem9 2 Ao estimaremse defasagens sucessivas restam menos graus de liberdade tornando a inferência es tatística mais incerta Economistas em geral não contam com longas séries de dados que lhes permi tam estimar inúmeras defasagens 3 Mais importante nas séries temporais econômicas os valores sucessivos defasagens tendem a estar altamente correlacionados com o que o fantasma da multicolinearidade faz sua aparição Como mencionado no Capítulo 10 a multicolinearidade conduz a estimativas pouco precisas isto é os errospadrão tendem a ser grandes em relação aos coeficientes estimados Em consequência com base nas razões t estimadas podem indicar equivocadamente que um coeficiente defasado é estatisticamente insignificante 4 A busca sequencial pela duração da defasagem leva o pesquisador a recorrer ao processo de data mining Também como notamos na Seção 134 o verdadeiro nível de significância para testar hipó teses estatísticas tornase uma questão importante em buscas sequenciais veja a Equação 1342 Em vista dos problemas apresentados o procedimento de estimação ad hoc seria pouco recomen dável Claramente algumas considerações a priori ou teóricas devem ser tratadas para conhecermos melhor os vários Ø e sermos capazes de abordar o problema de estimação de um modo mais eficiente 174 A abordagem de Koyck dos modelos de defasagens distribuídas Koyck propôs um método engenhoso de estimar os modelos com defasagens distribuídas Supo nha que começamos com um modelo de defasagens distribuídas no infinito 1731 Atribuindo o mesmo sinal aos Ø Koyck supõe que eles declinam geometricamente como segue10 174111 7 AlT F F Distributed lags Econometrica v 10 p 113128 1942 8 TiNBErGEN J longterm foreign trade elasticities Metroeconomica v 1 p 174185 1949 9 Se a duração da defasagem k estiver especificada incorretamente nos depararemos com o problema de erros de especificação discutido no Capítulo 13 lembrese também da advertência sobre o data mining 10 KOyCK l M Distributed lags and investment analysis Amsterdã North holland Publishing Company 1954 11 Às vezes também escrito como ECONOBOOKParte04indb 620 23112010 072443 Capítulo 17 Modelos econométricos dinâmicos modelos autorregressivos e com defasagens distribuídas 621 em que tal que 0 1 é conhecido como a taxa de declínio ou queda das defasagens distribuí das e em que 1 é a velocidade de ajustamento O que a Equação 1741 postula é que cada coeficiente sucessivo de Ø é numericamente menor que o Ø anterior esta afirmação se segue de 1 o que implica que quando se volta ao passado distante o efeito dessa defasagem sobre Yt tornase cada vez menor um pressuposto bem plausível Afinal as rendas atuais e do passado recente afetam a atual despesa com consumo mais fortemente que a renda no passado distante Geometricamente o esquema de Koyck é apresentado na Figura 175 Como mostra a figura o valor do coeficiente de defasagem Øk depende além do Ø0 comum do valor de Quanto mais próximo estiver de 1 mais lenta será a taxa de declínio no Øk enquanto que quanto mais próximo estiver de zero mais rápido será o declínio em Øk No primeiro caso os valores de X exercerão impacto considerável em Yt enquanto no último caso sua influência sobre Yt desaparecerá rapidamente Esse padrão pode ser visto claramente por meio da seguinte tabela Observe os seguintes aspectos do esquema de Koyck 1 ao pressupor valores não negativos para Koyck descarta a mudança de sinal dos Ø 2 ao pressupor 1 pressupõe que ele atribui menos peso para os Ø distantes que aos atuais e 3 assegura que a soma dos Ø que dá o multiplicador de longo prazo seja finita ou seja 174212 Por razões dadas na nota de rodapé 12 12 isto acontece porque Já que a expressão entre parênteses do lado direito é uma série geométrica infinita cujo somatório é 11 desde que 0 1 Vale notar que se Øk for definido como na nota 11 assegurando assim que a soma dos pesos 1 k seja 1 l 1 2 Defasagem tempo 0 βk λ l 3 4 λ l 1 4 λ Figura 175 O esquema de Koyck distribuição geométrica declinante ECONOBOOKParte04indb 621 23112010 072444 622 Parte Três Tópicos em econometria Como resultado da Equação 1741 o modelo defasado infinito 1731 pode ser escrito como 1743 Como está o modelo ainda não se presta a uma estimação fácil já que resta estimar ainda um grande número literalmente infinito de parâmetros e o parâmetro entra de forma altamente não linear em termos estritos o método de análise de regressão linear nos parâmetros não pode ser aplicado a tal modelo Mas Koyck sugere uma saída engenhosa Ele defasa a Equação 1743 em um período para obter 1744 Então multiplica a Equação 1744 por para obter 1745 Subtraindo a Equação 1745 da Equação 1743 obtémse 1746 ou rearranjando 1747 em que vt D ut ut 1 é uma média móvel de ut e ut1 O procedimento que acabamos de descrever é conhecido como transformação de Koyck Com parando a Equação 1747 com a Equação 1731 vemos a enorme simplificação efetuada por Koyck Enquanto antes tínhamos de estimar Æ e um número infinito de Ø agora temos de estimar apenas três incógnitas Æ Ø0 e Agora não há razão para esperar que ocorra multicolinearidade Em certo sentido a multicolinearidade é resolvida substituindose Xt1 Xt2 por uma única variárel a saber Yt1 Mas note os seguintes aspectos da transformação de Koyck 1 Começamos com um modelo de defasagens distribuídas mas acabamos com um modelo autor regressivo porque Yt1 aparece como uma das variáveis explanatórias Essa transformação mostra como se pode converter um modelo de defasagens distribuídas em um autorregressivo 2 O aparecimento de Yt1 provavelmente cria alguns problemas estatísticos Yt1 como Yt é es tocástico o que significa que temos uma variável explanatória estocástica no modelo Lembrese de que a teoria clássica de mínimos quadrados fundamentase na premissa de que as variáveis explanatórias são não estocásticas ou se forem são distribuídas independentemente do termo de erro estocástico Daí devemos descobrir se Yt1 satisfaz esse pressuposto Retornaremos a esse ponto na Seção 178 3 No modelo original 1731 o termo de erro era ut enquanto no modelo transformado ele é vt D ut ut 1 As propriedades estatísticas de vt dependem do que se pressupõe sobre as propriedades estatísticas de ut pois como será mostrado depois se os ut originais estiverem correlacionados serial mente os vt o serão Portanto podemos ter de enfrentar o problema da correlação serial além da variável explanatória estocástica Yt1 Faremos isso na Seção 178 4 A presença de Y defasado viola um dos pressupostos subjacentes ao teste d de DurbinWatson Teremos de desenvolver uma alternativa para testar a correlação serial na presença do Y defasado Uma alternativa é o teste h de Durbin discutido na Seção 1710 Como vimos na Equação 1714 ao efetuarmos as somas parciais dos Øi padronizados temos a proporção do impacto a longo prazo ou total sentido por um determinado período de tempo Na prá tica a defasagem média ou mediana é usada com frequência para caracterizar a natureza da estrutura defasada de um modelo de defasagens distribuídas ECONOBOOKParte04indb 622 23112010 072445 Capítulo 17 Modelos econométricos dinâmicos modelos autorregressivos e com defasagens distribuídas 623 a defasagem mediana A defasagem mediana é o tempo exigido para completar a primeira metade ou 50 da mudança total em Y que segue a uma alteração unitária em X Para o modelo de Koyck a defasagem mediana é a seguinte veja o Exercício 176 1748 Assim se D 02 a defasagem mediana será 04306 mas se D 08 a defasagem mediana será 31067 Em palavras no primeiro caso 50 da mudança total em Y é realizada em menos da metade do período enquanto no último leva mais de 3 períodos para completar 50 da variação Mas esse contraste não deveria surpreender pois como sabemos quanto mais alto o valor de menor a velo cidade do ajustamento e quanto menor o valor de maior a velocidade do ajustamento a defasagem média Contanto que todos os Øk sejam positivos a defasagem média é definida como 1749 que é simplesmente a média ponderada de todas as defasagens envolvidas com os respectivos coefi cientes Ø servindo como pesos Em suma é a média ponderada das defasagens no tempo Para o modelo de Koyck a defasagem média é ver Exercício 177 17410 Assim se a defasagem média é 1 Da discussão anterior fica claro que as defasagens média e mediana servem como uma medida síntese da velocidade com a qual Y responde a X No exemplo da Tabela 171 a defasagem média é de aproximadamente 11 trimestres mostrando que leva algum tempo em média para que o efei to das mudanças na oferta de moeda seja percebido na variação de preços ExEmplo 177 Despesas de consumo pessoal per capita DCPC e renda pessoal disponível per capita RPDPC Este exemplo examina as despesas de consumo pessoal per capita em relação à renda pessoal disponível per capita ambas expressas em dólares de 2000 para os Estados Unidos para o período de 19592006 Como ilustração do modelo de Koyck considere os dados apresentados na Tabela 172 A regressão de DCPC contra rPDPC e DCPC defasado deu os resultados da Tabela 173 A função consumo nessa tabela pode ser chamada de função consumo a curto prazo Faremos a derivação da função consumo de longo prazo rapidamente Usando o valor estimado de podemos calcular os coeficientes da defasagens distribuí das Se Ø0 º 02139 Ø1 H 0213907971 º 01704 Ø2 H 02139079712 º 00231 e assim por diante que são os multiplicadores de curto e médio prazo Por fim usando a Equação 1742 podemos obter o multiplicador de longo prazo ou seja o impacto total de variação na renda sobre o consumo depois que todos os efeitos defasados forem levados em conta o que no exemplo tornase Continua ECONOBOOKParte04indb 623 23112010 072446 624 Parte Três Tópicos em econometria ExEmplo 177 Continuação TabEla 172 DCPC e RPDPC 19592006 Fonte Economic Report of the President 2007 Tabela B31 Notas DCPC H Despesas de consumo pessoal per capita em dólares de 2000 RPDP H Renda pessoal disponível per capita em dólares de 2000 TabEla 173 Em palavras um aumento sustentado de um dólar na renda pessoal disponível per capita eventualmente levará a um aumento de cerca de 105 dólar nas despesas de consumo pes soal per capita sendo o impacto imediato ou de curto prazo de apenas 21 centavos A função consumo a longo prazo agora pode ser escrita como Continua ECONOBOOKParte04indb 624 23112010 072448 Capítulo 17 Modelos econométricos dinâmicos modelos autorregressivos e com defasagens distribuídas 625 ExEmplo 177 Continuação Esta pode ser obtida dividindose a função consumo de curto prazo dada na Tabela 173 por 02029 em ambos os lados e excluindose o termo defasado da renda pessoal disponível per capita13 A longo prazo a propensão marginal a consumir PMC é de aproximadamente 1 isso significa que quando os consumidores tiverem tempo para habituaremse ao aumento de um dólar na renda pessoal disponível per capita aumentarão suas despesas de consumo pes soal em quase um dólar A curto prazo no entanto como mostra a Tabela 173 a PMC é de apenas 21 centavos Qual é a razão para tamanha diferença entre a PMC a curto e a longo prazo A resposta pode ser encontrada nas defasagens mediana e média Dado H 07971 a defa sagem mediana é e a defasagem média é Parece que as despesas de consumo pessoal reais ajustamse à renda pessoal disponível com uma defasagem substancial lembrese de que quanto maior for o valor de entre 0 e 1 mais tempo levará para que o impacto total de uma variação no valor da variável explanató ria seja sentido sobre a variável dependente 13 175 Racionalização do modelo de Koyck o modelo de expectativas adaptativas Embora seja muito claro o modelo de Koyck 1747 é ad hoc já que foi obtido por um processo puramente algébrico ele não dispõe de base teórica Mas essa desvantagem pode ser suplantada se adotarmos uma perspectiva diferente Suponha o seguinte modelo 1751 em que Y D demanda por moeda saldos reais em dinheiro X D taxa de juros de equilíbrio ótima esperada a longo prazo ou normal u D termo de erro A Equação 1751 postula que a demanda por moeda é uma função da taxa de juros esperada isto é antecipada Como a variável de expectativa X não é diretamente observável propomos a seguinte hipótese sobre como as expectativas são formadas 175214 13 Em equilíbrio todos os valores das despesas de consumo pessoal serão os mesmos Portanto DCPCt H DCPCt1 Ao fazermos essa substituição deveríamos obter a função consumo a longo prazo 14 Às vezes o modelo é expresso como ECONOBOOKParte04indb 625 23112010 072449 626 Parte Três Tópicos em econometria em que tal que 0 1 é conhecido como o coeficiente de expectativa A hipótese 1752 é conhecida como a expectativa adaptativa a expectativa progressiva ou a hipótese do aprendiza do pelo erro que Cagan15 e Friedman16 tornaram conhecida A Equação 1752 implica que os agentes econômicos adaptarão suas expectativas de acordo com a experiência passada e que em particular aprenderão com seus erros17 Mais especificamente a Equação 1752 estabelece que as expectativas são revistas a cada período por uma fração da diferença entre o valor corrente da variável e seu valor esperado anterior Assim para nosso modelo isso significaria que as expectativas sobre taxas de juro são revistas a cada período por uma fração da discrepância entre a taxa de juros observada no período corrente e o que foi seu valor previsto no período anterior Outra forma de dizer isso seria escrever a Equação 1752 como 1753 que mostra que o valor esperado da taxa de juros no tempo t é uma média ponderada do valor obser vado da taxa de juros no tempo t e seu valor esperado no período anterior com pesos de e 1 respectivamente Se D 1 X t D Xt significando que as expectativas são estáticas ou seja condi ções prevalentes hoje serão mantidas em todos os períodos subsequentes Os valores futuros espera dos então se tornam idênticos aos valores atuais18 Substituindo a Equação 1753 na Equação 1751 obtemos 1754 Agora defasamos a Equação 1751 de um período multiplicamos por 1 e subtraímos o produto da Equação 1754 Depois de manipulações algébricas simples obtemos 1755 em que vt D ut 1 ut1 Antes de prosseguirmos observemos a diferença entre a Equação 1751 e a Equação 1755 Na primeira Ø1 mede a resposta média de Y a uma variação unitária em X o valor de equilíbrio ou de longo prazo de X Na Equação 1755 por outro lado Ø1 mede a resposta média de Y a uma variação unitária no valor real ou observado de X Essas respostas não serão as mesmas naturalmen te a menos que D 1 isto é os valores atual e de longo prazo de X sejam os mesmos Na prática primeiro estimamos a Equação 1755 Uma vez obtida uma estimativa de do coeficiente do Y defasado podemos calcular facilmente Ø1 simplesmente dividindo o coeficiente de Xt D Ø1 por A semelhança entre o modelo de expectativas adaptativas 1755 e o modelo de Koyck 1747 deve ser evidente embora a interpretação dos coeficientes nos dois modelos seja diferen te Observe que como o modelo de Koyck o de expectativas adaptativas é autorregressivo e seu termo de erro é similar ao de Koyck Voltaremos à estimação do modelo das expectativas adapta tivas na Seção 178 e a alguns exemplos na Seção 1712 Agora que já esboçamos o modelo EA cabe perguntar até que ponto é realista É verdade que ele é mais convincente que a abordagem 15 CAGAN P The monetary dynamics of hyperinflations in FriEDMAN M Ed Studies in the quantity theory of money Chicago University of Chicago Press 1956 16 FriEDMAN M A theory of the consumption function National Bureau of Economic research Princeton NJ Princeton University Press 1957 17 ShAw G K Rational expectations an elementary exposition Nova york St Martins Press 1984 p 25 18 ibid p 1920 ECONOBOOKParte04indb 626 23112010 072450 Capítulo 17 Modelos econométricos dinâmicos modelos autorregressivos e com defasagens distribuídas 627 puramente algébrica de Koyck mas a hipótese das expectativas adaptativas é razoável A seu fa vor podemos dizer o seguinte Ele nos oferece um meio bem simples de modelar expectativas dentro da teoria econômica enquanto postulamos um comportamento de parte dos agentes econômicos que parece muito sensato A crença de que as pessoas aprendem com a experiência é obviamente um ponto de partida mais sensato que o pressuposto implícito de que elas sejam totalmente desprovidas de memória característica da tese das expectativas estáticas Além disso a afirmação de que as experiências mais antigas influenciam menos que as mais recentes também está de acordo com o senso comum e parece confirmarse pela simples observação19 Até aparecer a hipótese das expectativas racionais ER proposta inicialmente por J Muth e mais tarde divulgada por Robert Lucas e Thomas Sargent a hipótese das expectativas foi bastante popular na economia empírica Os proponentes da hipótese das expectativas racionais ER afirmam que a hipótese das expectativas adaptativas é inadequada porque depende apenas dos valores passa dos de uma variável para formular expectativas20 enquanto a hipótese das ER pressupõe que os agentes econômicos individuais recorrem a informações atuais e relevantes que estão disponíveis para formar suas expectativas e não contam apenas com a experiência passada21 Em suma a hipó tese das ER sustenta que as expectativas são racionais no sentido de que incorporam eficientemen te todas as informações disponíveis no momento em que a expectativa é formulada22 e não apenas as informações passadas As críticas feitas pelos proponentes da hipótese das expectativas racionais contra a hipótese das expectativas adaptativas são bem fundamentadas embora a hipótese das expectativas racio nais também tenha muitos críticos23 Não há espaço aqui para ficarmos incomodados em abordar esse material bastante complicado Talvez possamos concordar com a afirmação de Stephen McNees No melhor dos casos a premissa das expectativas adaptativas pode ser defendida apenas como uma hipótese de trabalho em lugar de um mecanismo mais complexo talvez uma formulação de um mecanismo de expectativas cambiantes24 ExEmplo 178 Exemplo 177 Revisto Como a transformação de Koyck constitui a base do modelo de expectativas adaptativas os resultados apresentados na Tabela 173 também podem ser interpretados em termos da Equação 1755 Assim O ØO0 D 2529190 O ØO1 D 021389 e 1 O D 0797146 logo o coeficiente de expectativa O º 02028 e seguindo a discussão anterior sobre o modelo das EA podemos dizer que cerca de 20 da discrepância entre o DCPC efetivo e o esperado são eliminados em um ano 176 Outra justificativa do modelo de Koyck o modelo de ajuste de estoques ou de ajustamento parcial O modelo de expectativas adaptativas é uma maneira de justificar o modelo de Koyck Outra forma é fornecida por Marc Nerlove no chamado modelo de ajuste parcial MAP ou de ajuste de 19 ibid p 27 20 Como o modelo de Koyck podemos mostrar que sob o modelo EA as expectativas de uma variável são uma média ponderada exponencialmente dos valores passados dessa variável 21 ShAw G K op cit p 47 Para mais detalhes da hipótese Er veja ShEFFriN S M Rational expectations Nova york Cambridge University Press 1983 22 McNEES S K The Phillips curve forward or backwardlooking New England Economic Review julago 1979 p 50 23 Para uma avaliação crítica recente da hipótese Er veja lOVEll M C Test of the rational expectations hypothesis American Economic Review p 110124 mar 1966 24 McNEES S K op cit p 50 ECONOBOOKParte04indb 627 23112010 072450 628 Parte Três Tópicos em econometria estoque25 Para ilustrar esse modelo considere o modelo do acelerador flexível da teoria econômi ca que supõe que exista uma quantidade de equilíbrio ótima desejada ou a longo prazo de estoque de capital necessário para produzir uma dada produção de acordo com determinado estado de tecno logia taxa de juros etc Para simplificarmos suponhamos que esse nível desejado de capital Y t seja uma função linear da produção X como se segue 1761 Uma vez que o nível desejado de capital não é diretamente observável Nerlove postula a seguinte hipótese conhecida como hipótese de ajuste parcial ou de ajuste de estoques 176226 em que tal que 0 1 é conhecido como o coeficiente de ajuste e em que Yt Yt1 D mudan ça efetiva e Y t Yt1 mudança desejada Já que Yt Yt1 a variação no estoque de capital entre dois períodos não é nada além do inves timento a Equação 1762 pode alternativamente ser escrita como 1763 em que It D investmento no período t A Equação 1762 postula que a variação efetiva do estoque de capital investimento em qual quer período dado t é uma fração da variação desejada para aquele período Se D 1 isso signifi ca que o estoque real de capital é igual ao estoque desejado ou seja o estoque real ajustase ao estoque desejado imediatamente no mesmo período de tempo Entretanto se D 0 isso significa que nada muda uma vez que o estoque real no tempo t é o mesmo que aquele observado no período anterior Costumase esperar que situese entre esses dois extremos já que o ajustamento ao estoque de capital desejado tende a ser incompleto devido à rigidez inércia e obrigações contratuais etc daí o nome de modelo de ajuste parcial Note que o mecanismo de ajustamento 1762 também pode ser escrito como 1764 mostrando que o estoque de capital observado no tempo t é uma média ponderada do estoque de capital desejado naquele período e do estoque de capital existente no período de tempo anterior e 1 sendo os pesos Agora a substituição da Equação 1761 pela Equação 1764 resulta em 1765 Esse modelo é chamado de modelo de ajuste parcial MAP Uma vez que a Equação 1761 representa a demanda por estoque de capital de longo prazo ou de equilíbrio a Equação 1765 pode ser chamada de função de demanda de curto prazo por estoque de capital pois a curto prazo o estoque de capital existente pode não ser necessariamente igual ao seu nível a longo prazo Uma vez estimada a função de curto prazo 1765 e obtida a estimativa do coe ficiente de ajuste do coeficiente de Yt1 podemos derivar facilmente a função de longo prazo dividindo Ø0 e Ø1 por e omitindo o termo Y defasado que então dará a Equação 1761 25 NErlOVE Marc Distributed lags and demand analysis for agricultural and other commodities Op cit 26 Alguns autores não acrescentam o termo de erro ut à relação 1761 mas o acrescentam a esta relação acre ditando que se a primeira for realmente uma relação de equilíbrio não há escopo para o termo de erro en quanto o mecanismo de ajuste pode ser imperfeito e exigir o termo de erro Vale mencionar que a Equação 1762 às vezes também é escrita como ECONOBOOKParte04indb 628 23112010 072451 Capítulo 17 Modelos econométricos dinâmicos modelos autorregressivos e com defasagens distribuídas 629 Em termos geométricos o modelo de ajuste parcial pode ser mostrado como na Figura 17627 Nela Y é o estoque de capital desejado e Y1 o estoque de capital real e efetivo Para fins de ilustra ção suponha que D 05 Isso implica que a empresa planeja trabalhar com metade da defasagem da diferença entre o estoque desejado e efetivado a cada período Assim no primeiro período ela se move para Y2 com o investimento igual a Y2 Y1 o que por sua vez é igual a Y Y1 Em cada período subsequente ele reduz pela metade a diferença entre o estoque de capital no início do perío do e o estoque de capital desejado Y O modelo de ajuste parcial assemelhase ao modelo de Koyck e ao das expectativas adaptativas sob o ponto de vista de que também é autorregressivo Mas seu termo de erro é muito mais simples o termo de erro original ut multiplicado por uma constante Mas é preciso lembrar que embora tenham uma aparência semelhante as expectativas adaptativas e os modelos de ajuste parcial são conceitualmente muito diferentes O primeiro baseiase na incerteza sobre o futuro comportamento de preços das taxas de juros etc já em relação ao último a incerteza devese à rigidez técnica ou institucional à inércia ao custo da mudança etc No entanto teoricamente ambos os modelos são muito mais confiáveis que o de Koyck Uma vez que as expectativas adaptativas e os modelos de ajuste parcial têm uma aparência indis tinguível o de 02028 do modelo das expectativas adaptativas também pode ser interpretado como o coeficiente do modelo de ajuste do estoque se supusermos que este último funciona no presente caso isto é é o DCPC desejado ou especado que está relacionado linearmente ao RPDP corrente É importante lembrar que como os modelos de Koyck das expectativas adaptativas e do ajus te de estoques deixando de lado a diferença na aparência do termo de erro resultam no mesmo modelo final de estimação devemos estar extremamente atentos ao dizer ao leitor qual modelo o pesquisador está usando e por quê Assim os pesquisadores devem especificar as bases do modelo que empregam 177 Combinação dos modelos de expectativas adaptativas e de ajustamento parcial Considere o seguinte modelo 1771 em que Y t D estoque de capital desejado e X t D nível esperado de produção Opcional 27 Esta é adaptada da Figura 74 de DOrNBUSCh rudiger FiSChEr Stanley Macroeconomics 3 ed Nova york McGrawhill 1984 p 216 Figura 176 O ajuste gradual do estoque de capital Y Y2 Y1 0 Tempo Estoque de capital ECONOBOOKParte04indb 629 23112010 072452 630 Parte Três Tópicos em econometria Como nem Y t nem X t são diretamente observáveis podemos usar o mecanismo de ajuste parcial para Y t e o modelo de expectativas adaptativas para X t para chegar à seguinte equação estimável veja o Exercício 172 1772 em que vt D ut 1 ut1 Este modelo também é autorregressivo sendo que a única diferen ça do modelo de expectativas adaptativas é que Yt2 aparece junto com Yt1 como uma variável explanatória Como os modelos de Koyck e de ER o termo de erro na Equação 1772 segue um processo média móvel Outro aspecto desse modelo é que embora o modelo seja linear nos Æ ele não é linear nos parâmetros originais Uma aplicação reconhecida da Equação 1771 tem sido a hipótese de renda permanente de Friedman que estabelece que o consumo de longo prazo ou permanente é uma função da renda de longo prazo ou permanente28 A estimação da Equação 1772 apresenta os mesmos problemas de estimação que os do mode lo de Koyck ou de ER no sentido de que todos são autorregressivos com estruturas semelhantes de erros Além disso a Equação 1772 envolve alguns problemas de estimação não linear que iremos considerar rapidamente no Exercício 1710 mas não nos aprofundaremos neste livro 178 Estimação dos modelos autorregressivos De nossa discussão até aqui temos três modelos Koyck 1747 Expectativas adaptativas 1755 Ajustamento parcial 1765 Todos esses modelos têm a seguinte forma em comum 1781 ou seja todos têm natureza autorregressiva Portanto agora devemos examinar o problema de estima ção de tais modelos porque a teoria clássica dos mínimos quadrados pode não ser diretamente aplicá vel a eles Duas são as razões a presença de variáveis explanatórias estocásticas e a possibilidade de correlação serial Agora como foi observado para a aplicação da teoria clássica dos mínimos quadrados devese mostrar que a variável explanatória estocástica Yt1 é distribuída de modo independente do termo de erro vt Para determinarmos se isso acontece é essencial conhecermos as propriedades de vt Se supu sermos que o termo de erro original ut satisfaz todos os pressupostos clássicos tal que Eut D 0 var ut D æ2 o pressuposto da homocedasticidade e cov ut uts D 0 para s π 0 o pressuposto da 28 FriEDMAN Milton A theory of consumption function Princeton NJ Princeton University Press 1957 ECONOBOOKParte04indb 630 23112010 072453 Capítulo 17 Modelos econométricos dinâmicos modelos autorregressivos e com defasagens distribuídas 631 ausência de autocorrelação vt pode não herdar todas essas propriedades Considere por exemplo o termo de erro no modelo de Koyck que é vt D ut ut1 Dados os pressupostos acerca de ut po demos mostrar facilmente que vt está correlacionado serialmente porque 178229 que é diferente de zero a não ser que seja zero E uma vez que Yt1 aparece no modelo de Koyck como variável explanatória ela tenderá a ser correlacionada com vt através da presença de ut1 nela É possível demonstrar que 1783 que é igual à Equação 1782 O leitor pode verificar que isso ocorre com o modelo de expectativas adaptativas Qual a implicação de constatar que no modelo de Koyck e também no modelo de expectativas adaptativas a variável explanatória estocástica Yt1 está correlacionada com o termo de erro vt Como observado se uma variável explanatória em um modelo de regressão está correlacionada com o termo de erro estocástico os estimadores de MQO não são apenas tendenciosos mas também não são consistentes ou seja mesmo que o tamanho da amostra aumente indefinidamente os estimadores não se aproximam de seu verdadeiro valor populacional30 Portanto a estimação dos modelos de Koyck e adaptativo pelo procedimento usual de MQO pode levar a resultados seriamente equivocados Contudo o modelo de ajuste parcial é diferente Nele vt D ut em que 0 1 Logo se ut satis faz os pressupostos do modelo clássico de regressão linear dado anteriormente o mesmo ocorre com ut Assim a estimação de MQO do modelo de ajuste parcial renderá estimativas consistentes embora tendam a ser tendenciosas em amostras finitas ou pequenas31 Intuitivamente a razão para a consis tência é embora Yt1 dependa de ut1 e de todos os termos de erro anteriores ele não está relacionado ao termo de erro ut Contanto que ut seja independente serialmente Yt1 também será independente ou pelo menos não estará correlacionado com ut satisfazendo assim um pressuposto importante do MQO a saber o da não correlação entre as variáveis explanatórias e o termo de erro estocástico Embora a estimação por MQO do modelo de ajuste parcial ou do de estoque nos proporcione uma estimação consistente devido à estrutura simples do termo de erro não deveríamos imaginar que ele se aplique melhor que o modelo de Koyck ou das expectativas adaptativas32 O leitor é aconselhado a não fazer isso um modelo deveria ser escolhido com base em considerações teóri cas rigorosas e não simplesmente porque possibilita uma estimação estatística fácil Todo modelo deveria ser considerado por seu próprio mérito prestandose atenção ao aparecimento de termos de erro estocásticos Se em modelos como o de Koyck ou o das expectativas adaptativas os MQO não puderem ser aplicados diretamente é preciso encontrar formas de resolver o problema de estimação Existem vários métodos alternativos embora alguns deles sejam trabalhosos do ponto de vista do cálculo Na seção a seguir veremos um deles 29 30 A demonstração está além do escopo deste livro e pode ser encontrada em Griliches op cit p 3638 Con tudo o Capítulo 18 apresenta um esboço da demonstração em outro contexto Veja também Maeshiro Asa toshi Teaching regressions with a lagged dependent variable and autocorrelated disturbances The Journal of Economic Education v 27 n 1 p 7284 1996 31 Para a demonstração veja JOhNSTON J Econometric methods 3 ed Nova york McGrawhill 1984 p 360362 Veja também DOrAN h E GUiSE J w B Single equation methods in econometrics applied regression analysis Armidale NSw Austrália University of New England Teaching Monograph Series 3 1984 p 236244 32 Também como J Johnston observa op cit p 350 o padrão de ajustamento sugerido pelo modelo de ajustamento às vezes pode não ser plausível ECONOBOOKParte04indb 631 23112010 072454 632 Parte Três Tópicos em econometria 179 O método de variáveis instrumentais VI Os MQO não podem ser aplicados ao modelo de Koyck ou das expectativas adaptativas porque a variável explanatória Yt1 tende a estar correlacionada com o termo de erro vt Se de algum modo a correlação puder ser removida podese aplicar os MQO para obter estimativas consistentes como observado anteriormente Observe haverá um pequeno viés de amostra Como isso pode ser feito Liviatan propôs a seguinte solução33 Suponhamos que encontremos uma proxy para Yt1 que esteja altamente correlacionada com Yt1 mas não com vt em que vt é o termo de erro que aparece no modelo de expectativas adaptativas ou de Koyck Tal proxy é chamada de variável instrumental VI34 Liviatan sugere Xt1 como a variável instrumental para Yt1 e também que os parâmetros da regressão 1781 possam ser obtidos resol vendo as seguintes equações normais 1791 Note que se tivéssemos de aplicar os MQO diretamente à Equação 1781 as equações MQO normais seriam veja a Seção 74 1792 A diferença entre os dois conjuntos de equações normais deveria ficar imediatamente evidente Liviatan mostrou que os Æ estimados da Equação 1791 são consistentes enquanto aqueles estima dos na Equação 1792 podem não ser consistentes pois Yt1 e vt D ut ut1 ou ut 1 ut1 podem estar correlacionados enquanto Xt e Xt1 não estão correlacionados com vt Por quê Embo ra seja fácil de aplicar uma vez encontrada a proxy adequada a técnica de Liviatan tende a ser afe tada pelo problema da multicolinearidade porque Xt e Xt1 que entram nas equações normais de 1791 tendem a estar altamente correlacionadas como observado no Capítulo 12 a maioria das séries temporais econômicas costuma exibir um alto grau de correlação entre valores sucessivos A implicação é que embora o procedimento de Liviatan gere estimativas consistentes os estimadores tendem a ser ineficientes35 Antes de prosseguirmos surge uma pergunta óbvia como se encontra uma boa proxy para Yt1 de maneira que embora esteja altamente correlacionada a Yt1 ela não esteja correlacionada com vt Na literatura específica encontramos algumas sugestões que empregaremos como exercício veja o Exercício 175 Porém devese deixar claro que nem sempre é fácil encontrar boas proxies e nesse caso o método das variáveis instrumentais é de pouca valia e podemos ter de recorrer às técnicas de estimação de máxima verossimilhança que estão além do escopo deste livro36 33 liViATAN N Consistent estimation of distributed lags International Economic Review jan 1963 p 4452 v 4 34 Essas variáveis instrumentais são usadas com frequência nos modelos de equação simultâneos veja o Capítulo 20 35 Para ver como a eficiência dos estimadores pode ser aprimorada consulte KliEN lawrence r A textbook of econometrics 2 ed Englewood Cliffs NJ Prenticehall 1974 p 99 Veja também GrEENE william h Econome tric analysis 2 ed Nova york Macmillan 1993 p 535538 36 Para uma discussão sucinta dos métodos de máxima verossimilhança veja JOhNSTON Jop cit p 366371 bem como o Apêndice 4A e o Apêndice 15A ECONOBOOKParte04indb 632 23112010 072455 Capítulo 17 Modelos econométricos dinâmicos modelos autorregressivos e com defasagens distribuídas 633 Existe algum teste que possa ser usado para verificar se as variáveis instrumentais escolhidas são válidas Dennis Sargan formulou um teste chamado de teste de SARG com esse objetivo Ele será descrito no Apêndice 17A Seção 17A1 1710 Detectando a autocorrelação em modelos autorregressivos o teste h de Durbin Como vimos a probabilidade de haver correlação serial nos termos de erros vt torna o problema da estimação de modelos autorregressivos bastante complexo no modelo de ajuste de estoques o termo de erro vt não apresentaria correlação serial de primeira ordem se o termo de erro do mode lo original ut não estivesse serialmente correlacionado enquanto nos modelos de Koyck e das ex pectativas adaptativas vt estaria correlacionado serialmente mesmo se ut fosse serialmente independente A questão então é como sabemos se há correlação serial no termo de erro que aparece nos modelos autorregressivos Como observado no Capítulo 12 a estatística d de DurbinWatson não pode ser usada para detectar correlação serial de primeira ordem em modelos autorregressivos porque nesses modelos o valor calculado de d em geral tende para 2 que é o valor esperado de d em uma sequência verdadeiramen te aleatória Em outras palavras se calcularmos rotineiramente a estatística d para tais modelos ha verá um viés embutido que impede que se descubra a correlação serial de primeira ordem Apesar disso muitos pesquisadores calculam o valor d por falta de melhor alternativa Contudo recentemen te o próprio Durbin propôs um teste de correlação serial de primeira ordem para modelos autorregres sivos em grandes amostras37 Este é chamado de estatística h Já discutimos o teste h de Durbin no Exercício 1236 Por conveniência reproduzimos a estatísca h com uma ligeira mudança de notação 17101 em que n é o tamanho da amostra var ÆO 2 é a variância do Yt D Yt1 defasado na Equação 1781 e ΩO é a estimativa da correlação serial de primeira ordem Ω discutida pela primeira vez no Capítulo 12 Como observado no Exercício 1236 para uma amostra grande Durbin demonstrou que sob a hipótese nula Ω D 0 a estatística h da Equação 17101 segue a distribuição normal padrão Ou seja 17102 em que asy significa assintoticamente Na prática como observado no Capítulo 12 podese estimar Ω como 17103 É interessante observar que embora não possamos usar o d de Durbin para testar a autocorrelação nos modelos autorregressivos podemos usálo como parte do cálculo da estatística h Vamos ilustrar o uso da estatística h com nosso Exemplo 177 Neste exemplo n D 47 ΩO º 1 d 2 D 05190 observe d D 09619 e var ÆO 2 D var DCPCt1 D 007332 D 00053 Colocando esses valores na Equação 17101 obtemos 17104 37 DUrBiN J Testing for serial correlation in leastsquares regression when some of the regressors are lagged dependent variables Econometrica 1970 p 410421 v 38 ECONOBOOKParte04indb 633 23112010 072456 634 Parte Três Tópicos em econometria Como esse valor h tem a distribuição normal padrão sob a hipótese nula a probabilidade de obter um valor elevado de h é muito pequena Lembrese de que a probabilidade de uma variável normal padrão superar o valor de ß 3 é extremamente pequena No exemplo nossa conclusão é que há autocorre lação positiva Evidentemente lembrese de que h segue a distribuição normal padrão assintotica mente Nossa amostra de 47 observações é razoavelmente grande Note esses aspectos da estatística h 1 Não importa quantas variáveis X ou quantos valores defasados de Y estão incluídos no modelo de regressão Para calcular h precisamos considerar apenas a variância do coeficiente do Yt1 defasado 2 O teste não será aplicável se n var ÆO 2 for maior que 1 Por quê Na prática no entanto em geral isso não acontece 3 Como o teste é para grandes amostras sua aplicação em pequenas amostras não se justifica rigo rosamente como mostrado por Inder38 e Kiviet39 Foi sugerido que o teste de BreuschGodfrey BG também conhecido como o teste do multiplicador de Lagrange discutido no Capítulo 12 é mais eficiente estatisticamente não só nas amostras grandes mas também nas amostras finitas ou pequenas e portanto é preferível ao teste h40 A conclusão baseada no teste h de que nosso modelo é afetado pela autocorrelação é confirma da pelo teste de BreuschGodfrey BG apresentado na Equação 12617 Usando os sete valores defasados dos resíduos estimados por meio da regressão mostrada na Tabela 173 o teste BG da Equação 12618 obteve um valor 2 de 153869 Para sete graus de liberdade o número de resí duos defasados usados no teste BG a probabilidade de obter um valor de quiquadrado de 1538 ou maior é cerca de 3 o que é bem baixo Por essa razão precisamos corrigir os erros padrão na Tabela 173 o que pode ser feito pelo pro cedimento de NeweyWest HAC discutido no Capítulo 12 Os resultados são semelhantes aos da Tabela 174 Parece que os MQO subestimam os erros padrão dos coeficientes de regressão 38 iNDEr B An approximation to the null distribution of the Durbinwatson statistic in models containing lagged dependent variables Econometric Theory 1986 v 2 n 3 p 413428 39 KiViET J F On the vigour of some misspecification tests for modelling dynamic relationships Review of Economic Studies 1986 v 53 n 173 p 241262 40 KOrOSi Gabor MATyAS laszlo SZEKEly istvan P Practical econometrics Brookfield Vermont Ashgate Publishing Company 1992 p 92 TabEla 174 ECONOBOOKParte04indb 634 23112010 072456 Capítulo 17 Modelos econométricos dinâmicos modelos autorregressivos e com defasagens distribuídas 635 1711 Um exemplo numérico a demanda por moeda no Canadá primeiro trimestre de 1979 ao quarto trimestre de 1988 Para ilustrar o uso dos modelos discutidos até aqui considere uma das aplicações empíricas ante riores a demanda de moeda ou saldos monetários reais Em particular considere o modelo a se guir41 17111 em que M t D demanda por moeda desejada ou de longo prazo saldos monetários reais Rt D taxa de juros de longo prazo Yt D trenda nacional agregada real Para a estimação estatística a Equação 17111 pode ser expressa convenientemente em forma logarítmica como 17112 Como a variável de demanda desejada não pode ser diretamente observável supomos a seguinte hipótese de ajuste de estoque 17113 A Equação 17113 estabelece que uma porcentagem constante por quê da discrepância entre os saldos monetários real desejado e o efetivo seja eliminada em um único período ano Na forma logarítmica a Equação 17113 pode ser expressa como 17114 Substituindo ln M t da Equação 17112 na Equação 17114 e rearranjando obtemos 1711542 o que pode ser chamado de função demanda no curto prazo por moeda Por quê Como ilustração da demanda por saldos monetários reais de curto e longo prazo considere os dados apresentados na Tabela 175 Os dados trimestrais referemse ao Canadá para o período de 1979 a 1988 As variáveis são definidas como se segue M como definido pela oferta de moeda M1 dólares canadenses C milhões P deflator implícito dos preços 1981 D 100 PIB a preços cons tantes de 1981 C milhões e R taxa preferencial de juros para 90 dias 43 M1 foi deflacionado por P para obter dados para saldos monetários reais A priori esperase que a demanda real por moe da relacionese positivamente ao PIB efeito renda positivo e negativamente com R quanto mais alta for a taxa de juros maior será o custo de oportunidade de reter moeda já que M1 paga muito pouco juro se pagar 41 Para um modelo semelhante veja ChOw Gregory C On the longrun and shortrun demand for money Journal of Political Economy 1966 v 74 n 2 p 111131 Note que uma vantagem da função multiplicativa é que os expoentes das variáveis dão estimativas diretas de elasticidades veja o Capítulo 6 42 Vale mencionar que este modelo é essencialmente não linear nos parâmetros Portanto embora o MQO possa dar uma estimativa não tendenciosa de por exemplo Ø1 em conjunto poderá não nos oferecer estimativas não tendenciosas de Ø1 e individualmente principalmente se a amostra for pequena 43 Estes dados são obtidos de BhASKAr rAO B Ed Cointegration for the applied economist Nova york St Martins Press 1994 p 210213 Os dados originais são do primeiro trimestre de 1956 ao quarto trimestre de 1988 mas para fins de ilustração começamos nossa análise do primeiro trimestre de 1979 ECONOBOOKParte04indb 635 23112010 072457 636 Parte Três Tópicos em econometria Os resultados da regressão são os seguintes44 44 Note este aspecto dos erros padrão estimados O erro padrão por exemplo o coeficiente de ln Rt referese ao erro padrão de um estimador de Ø1 Não há uma maneira simples de obter os erros padrão de ØO1 e O individual mente com base no erro padrão de principalmente se a amostra for relativamente pequena Para amostras grandes no entanto os erros padrão individuais de ØO1 e O podem ser obtidos aproximadamente mas os cálculos são complexos Veja KMENTA Jan Elements of econometrics Nova york Macmillan 1971 p 444 TabEla 175 Moeda taxa de juros índice de preços e PIB Canadá Fonte RAO op cit p 210213 Notas M1 D C milhões P D deflator implícito dos preços 1981 D 100 R D taxa preferencial de juros para 90 dias PIB D C milhões preços de 1981 ECONOBOOKParte04indb 636 23112010 072458 Capítulo 17 Modelos econométricos dinâmicos modelos autorregressivos e com defasagens distribuídas 637 17116 A função de demanda estimada de curto prazo mostra que a elasticidade dos juros a curto prazo tem o sinal correto e que é estatisticamente significativa já que seu valor p é quase zero A elasticidade renda de curto prazo é surpreendentemente negativa embora estatisticamente não seja diferente de zero O coeficiente de ajustamento é D 1 09607 D 00393 e isso implica que apenas cerca de 4 da discrepância entre os saldos monetários efetivo e desejado sejam eliminados em um trimestre um ajustamento bastante lento Para voltar à função demanda de longo prazo 17112 basta dividir a função demanda de curto prazo por por quê e excluir o termo ln Mt1 Os resultados são 1711745 Como se pode ver a elasticidade da demanda por moeda de longo prazo em relação à taxa de juros é substancialmente maior em termos absolutos que a correspondente elasticidade de curto prazo o que também é válido para a elasticidaderenda embora no presente caso seu significado econômico e estatístico seja dúbio Observe que o d estimado de DurbinWatson é 24582 que está próximo de 2 Isso fundamenta nossa observação anterior de que nos modelos autorregressivos o d calculado em geral é próximo de 2 Portanto não deveríamos confiar no d calculado para constatar se houve correlação serial em nos sos dados O tamanho da amostra em nosso caso são 40 observações o que pode ser razoavelmente grande para aplicar o teste h No presente caso o leitor pode verificar que o valor h estimado é 15008 o que não é significativo a 5 de probabilidade talvez sugerindo que não haja autocorre lação de primeira ordem no termo de erro46 1712 Exemplos ilustrativos Nesta seção apresentamos alguns exemplos dos modelos de defasagens distribuídas para mostrar como os pesquisadores os empregam em estudos empíricos ExEmplo 179 O Fed e a taxa de juros real Para avaliar o efeito de M1 moeda manual C demanda por depósitos sobre um indicador de taxa de juros real de títulos de primeira linha G J Santoni e Courtenay C Stone 46 estimaram com base em dados mensais o seguinte modelo de defasagens distribuídas para os Estados Unidos 17121 em que rt D índice de Moody para títulos de primeira linha menos a taxa média dos 36 me ses anteriores de variação anual no índice dessazonalizado de preços ao consumidor usado como indicador da evolução da taxa de juros real e PMt D crescimento mensal M1 45 Note que não apresentamos os erros padrão dos coeficientes estimados por razões discutidas na nota de roda pé 44 46 The Fed and the real rate of interest Review Federal reserve Bank of St louis dez 1982 p 818 Continua ECONOBOOKParte04indb 637 23112010 072459 638 Parte Três Tópicos em econometria ExEmplo 179 Continuação De acordo com a doutrina da neutralidade da moeda as variáveis econômicas reais como produção emprego crescimento econômico e taxa de juros real não são influenciadas permanentemente pela expansão da moeda e portanto são essen cialmente inalteradas pela política monetária Dado esse argumento o FED o Banco Central americano não influencia permanentemente a taxa real de juros de forma al guma47 Se essa doutrina for válida deveríamos esperar que os coeficientes ai bem como seus somatórios sejam estatisticamente não diferentes de zero Para descobrir se é esse o caso os autores estimaram a Equação 17121 para dois períodos diferentes fevereiro de 1951 a setembro de 1979 e outubro de 1979 a novembro de 1982 o último consideran do a mudança na política monetária do FED que desde outubro de 1979 tem prestado mais atenção à taxa de crescimento da oferta de moeda do que à taxa de juros que foi a política no período anterior Os resultados da regressão são apresentados na Tabela 176 e parecem apoiar a doutrina da neutralidade da moeda já que para o período de fe vereiro de 1951 a setembro de 1979 a variação da moeda corrente e defasada não teve efeito estatisticamente significativo sobre o indicador de taxa de juros No mesmo perío do a doutrina da neutralidade também parece ter encontrado respaldo pois estatistica mente ai não é diferente de zero apenas o coeficiente a1 é significativo mas tem o sinal errado Por quê TabEla 176 Influência da variação mensal de M1 sobre o indicador da taxa de juros real para os títulos de primeira linha fevereiro de 1951 a novembro de 1982 Fonte SANTONI G J STONE Courtenay C The Fed and the real rate of interest Review Federal Reserve Bank of St Louis p 16 dez 1982 e t Valor absoluto t Significativamente diferente de zero no nível de 005 47 47 idid p 15 ECONOBOOKParte04indb 638 23112010 072500 Capítulo 17 Modelos econométricos dinâmicos modelos autorregressivos e com defasagens distribuídas 639 48 ExEmplo 1710 O consumo agregado a curto e a longo prazo para o Sri Lanka 1967 1993 Suponha que o consumo C relacionese linearmente à renda permanente X 17122 Uma vez que Xt não é diretamente observável precisamos especificar o mecanismo que gera renda permanente Suponha a hipótese de expectativas adaptativas especificada na Equação 1752 Usando a Equação 1752 e simplificando obtemos a seguinte equação para esti mar confira 1755 17123 em que Æ1 D Ø1 Æ2 D Ø2 Æ3 D 1 vt D ut 1 ut1 Como sabemos Ø2 dá a resposta média do consumo por exemplo um aumento de 1 na renda permanente enquanto Æ2 dá a resposta média de consumo para um aumento de 1 na renda corrente Dos dados anuais para o Sri lanka para o período de 19671993 dado na Tabela 177 os seguintes resultados de regressão foram obtidos48 17124 em que C D gastos de consumo privado e X D PiB ambos a preços constantes Também in troduzimos a taxa de juros real no modelo mas não foi estatisticamente significativa Os resultados mostram que a propensão marginal a consumir PMC é de 04043 suge rindo que o aumento de 1 rúpia na renda real corrente ou observada medida pelo PiB real aumentaria o consumo médio em cerca de 040 rúpia Mas se o aumento da renda for man tido finalmente a PMC gerada da renda permanente será Ø2 D Ø2 D 0404304991 D 08100 ou cerca de 081 rúpia Em outras palavras quando os consumidores tiverem tido tempo para ajustaremse à variação de uma rúpia na renda eles aumentarão seu consumo em cerca de 081 rúpia Agora suponha que nossa função consumo seja 17125 Nessa formulação o consumo permanente ou de longo prazo Ct é uma função linear da renda corrente ou observada Uma vez que Ct não é diretamente observável vamos recorrer ao modelo de ajuste parcial 1762 Usando esse modelo e depois de manipulações algébri cas obtemos 17126 Aparentemente esse modelo é indistinguível do modelo de expectativas adaptativas 17123 Portanto os resultados de regressão dados em 17124 são igualmente aplicáveis aqui Entretanto há uma grande diferença na interpretação dos dois modelos para não mencionar o problema de estimação associado com o caráter autorregressivo e a possível correlação serial do modelo 17123 48 Os dados são obtidos do disco de dados do livro de ChANDAN Mukherjee hOwArD white e MArC wuyts Econometrics and data analysis for developing countries Nova york routledge 1998 Os dados originais são das tabelas do Banco Mundial Continua ECONOBOOKParte04indb 639 23112010 072501 640 Parte Três Tópicos em econometria ExEmplo 1710 Continuação TabEla 177 Gastos de consumo privado e PIB Sri Lanka Fonte veja a nota de rodapé 48 Notas CON Priv D gastos de consumo privado PIB D Produto Interno Bruto O modelo 17125 é a função consumo de longo prazo ou equilíbrio enquanto o mo delo 17126 é a função consumo a curto prazo Ø2 mede a PMC de longo prazo enquanto Æ2 D Ø2 dá a PMC de curto prazo a primeira pode ser obtida da segunda dividindoa por o coeficiente de ajuste Voltando a 17124 agora podemos interpretar 04043 como a PMC de curto prazo Uma vez que D 04991 a PMC de longo prazo é 081 Note que o coeficiente de ajusta mento de aproximadamente 050 sugere que em qualquer período de tempo os consumido res só ajustam a metade do consumo que seria necessário para atingir seu nível desejado ou de longo prazo Este exemplo toca no ponto crucial de que aparentemente os modelos de expectativas adaptativas e de ajustamento parcial ou o modelo de Koyck são tão semelhantes que não conseguimos distinguir qual é a especificação correta apenas examinando a regressão esti mada como a Equação 17124 É por isso que é tão vital que se especifique o modelo es colhido para análise empírica e então procedase adequadamente Se o hábito ou inércia caracteriza o comportamento de consumo o modelo de ajuste parcial é adequado Por outro lado se o comportamento de consumo é projetado no sentido de que se baseia nas futuras expectativas de renda o modelo de expectativas adaptativas é adequado Nesse caso tere mos de prestar atenção ao problema de estimação para obter estimadores consistentes No primeiro caso o MQO fornecerá estimadores consistentes contanto que os pressupostos de MQO sejam respeitados 1713 A abordagem de Almon aos modelos de defasagens distribuídas a distribuição polinomial de defasagens ou de Almon49 Embora seja muito usado o modelo de defasagens distribuídas de Koyck baseiase no pressupos to de que os coeficientes Ø diminuem geometricamente à medida que a defasagem aumenta veja a Figura 175 Essa premissa pode ser restritiva demais em algumas situações Considere por exem plo a Figura 177 49 AlMON Shirley The distributed lag between capital appropriations and expenditures Econometrica jan 1965 v 33 p 178196 ECONOBOOKParte04indb 640 23112010 072501 Capítulo 17 Modelos econométricos dinâmicos modelos autorregressivos e com defasagens distribuídas 641 Na Figura 177a supõese que os Ø aumentem e em seguida diminuam enquanto na Figura 177c supõese que eles sigam um padrão cíclico Obviamente os modelos de defasagens distribuídas de Koyck não funcionarão nesses casos No entanto depois de examinar as Figuras 177a e c parece que se pode expressar Øi como função de i a duração da defasagem de tempo e ajustar curvas adequa das para refletir a relação funcional entre as duas como indicado nas Figuras 177b e d Essa aborda gem é exatamente a sugerida por Shirley Almon Para ilustrar sua técnica retomemos o modelo de defasagens distribuídas finitas considerado anteriormente 1712 Que pode ser escrito mais sinteticamente como 17131 Seguindo um teorema em matemática conhecido como teorema de Weierstrass Almon su põe que Øi pode ser aproximado por um polinômio de grau adequado em i a duração da defasa gem50 Por exemplo se o esquema de defasagem mostrado na Figura 177a pode ser aplicado podemos escrever 50 De modo geral o teorema afirma que em um intervalo fechado finito qualquer função contínua pode ser apro ximada uniformemente por um polinômio de um grau adequado Figura 177 Esquema polinomial de defasagens de Almon i 0 i i i bi β bi β bi β bi β 1 2 3 0 1 2 3 7 7 0 0 1 2 3 8 1 2 3 8 Defasagem Defasagem Defasagem Defasagem a b d c ECONOBOOKParte04indb 641 23112010 072502 642 Parte Três Tópicos em econometria 17132 que é um polinômio quadrático ou de segundo grau em i veja a Figura 177b No entanto se os Ø seguirem o padrão da Figura 177c podemos escrever 17133 que é um polinômio de terceiro grau em i veja a Figura 177d Em termos gerais podemos escrever 17134 que é um polinômio de mésimo grau em i Supõese que m o grau do polinômio seja menor que k a duração máxima da defasagem Para explicar como funciona o esquema de Almon suponhamos que os Ø sigam o padrão mostra do na Figura 177a e portanto a aproximação polinomial de segundo grau seja adequada Substituindo a Equação 17132 na Equação 17131 obtemos 17135 Definindo 17136 podemos escrever a Equação 17135 como 17137 No esquema de Almon fazse a regressão de Y contra as variáveis Z construídas e não contra as variáveis originais X Note que a Equação 17137 pode ser estimada pelo procedimento usual de MQO As estimativas de Æ e ai obtidas assim terão todas as propriedades estatísticas desejadas contanto que o termo de erro estocástico u satisfaça as premissas do modelo clássico de regressão linear A esse respeito a técnica de Almon tem vantagem sobre o método de Koyck porque como vimos este último apresenta sérios problemas de estimação que resultam da presença da variável explanatória estocástica Yt1 e sua provável correlação com o termo de erro Uma vez estimados os a da Equação 17137 os Ø originais podem ser estimados da Equação 17132 em termos mais gerais da Equação 17134 como se segue 17138 Antes de aplicarmos a técnica de Almon devemos resolver os seguintes problemas ECONOBOOKParte04indb 642 23112010 072504 Capítulo 17 Modelos econométricos dinâmicos modelos autorregressivos e com defasagens distribuídas 643 1 A duração máxima da defasagem k deve ser especificada antecipadamente Aqui talvez se possa seguir a orientação de Davidson e MacKinnon O melhor procedimento provavelmente seja primeiro resolver a questão da duração da defasagem co meçando com um valor muito grande de q a duração da defasagem e verificando se o ajustamento do modelo deteriorase significativamente quando o reduzimos sem impor qualquer restrição na forma das defasagens distribuídas51 Lembrese de que se há uma duração verdadeira da defasagem escolher uma defasagem pe quena leva ao viés da omissão de uma variável relevante cujas consequências como vimos no Capítulo 13 podem ser muito sérias Por outro lado escolher uma defasagem maior que o necessário levará ao viés da inclusão de variáveis irrelevantes cujas consequências são menos sérias os coe ficientes podem ser estimados consistentemente pelo MQO embora suas variâncias possam ser me nos eficientes Podese usar o critério de informação de Akaike ou de Schwarz discutido no Capítulo 13 para escolher a duração adequada da defasagem Esses critérios também podem ser usados para discutir o grau adequado do polinômio levando adiante a discussão feita no ponto 2 2 Tendo especificado k também devemos especificar o grau do polinômio m Em geral o grau do polinômio deveria ser de pelo menos um a mais do que os pontos de inflexão da curva que relaciona Øi a i Assim na Figura 177a há apenas um ponto de inflexão logo um polinômio de segundo grau será uma boa aproximação Na Figura 177c existem dois pontos de inflexão logo um polinômio de terceiro grau fornecerá uma boa aproximação Contudo a priori podemos desconhecer o número de pontos de inflexão existentes e dessa forma a escolha de m é altamente subjetiva Porém a teoria pode sugerir um modo específico em alguns casos Na prática esperase que um polinômio de grau mais alto por exemplo m D 2 ou 3 dê bons resultados Tendo escolhido determinado valor de m se desejamos verificar se um polinômio de grau mais alto proporcionará um melhor ajustamento pode mos proceder da forma apresentada a seguir Suponha que devemos decidir entre polinômios de segundo e terceiro graus Para o polinô mio de segundo grau a equação de estimação é aquela dada pela Equação 17137 Para o polinômio de terceiro grau a equação correspondente é 17139 em que Depois de efetuar a regressão 17139 se constatamos que a2 é estatis ticamente significativo mas a3 não é podemos pressupor que o polinômio de segundo grau fornece uma aproximação razoavelmente boa Por outro lado como Davidson e MacKinnon sugerem depois que q a duração da defasagem for determinado poderemos tentar determinar d o grau do polinômio uma vez mais começando com um valor grande e então reduzindo52 Entretanto devemos estar atentos ao problema da multicolinearidade que provavelmente aparece em virtude da forma como os Z são construídos por meio dos X como mostra a Equação 17136 veja também a Equação 171310 Como vimos no Capítulo 10 em casos de séria multicolineari dade aO3 pode mostrarse estatisticamente insignificante não porque o verdadeiro a3 é zero mas simplesmente porque a amostra que temos não nos permite avaliar o impacto separado de Z3 sobre Y Portanto em nosso exemplo antes de aceitarmos a conclusão de que o polinômio de terceiro grau não é a escolha correta devemos nos certificar de que o problema da multicolinearidade não é tão grave o que poderemos fazer se aplicarmos técnicas discutidas no Capítulo 10 3 Uma vez que m e k são especificados os Z podem ser construídos imediatamente Por exemplo se m D 2 e k D 5 os Z são 51 DAViDSON russel MACKiNNON James G Estimation and inference in econometrics Nova york Oxford Univer sity Press 1993 p 675676 52 ibid pp 675676 ECONOBOOKParte04indb 643 23112010 072504 644 Parte Três Tópicos em econometria 171310 Note que os Z são combinações lineares dos X originais Observe também por que os Z provavel mente mostram multicolinearidade Antes de passar para o exemplo numérico observe as vantagens do método de Almon Primeiro ele fornece um método flexível de incorporar uma variedade de estruturas de defasagem veja o Exer cício 1717 A técnica de Koyck por outro lado é bem rígida no sentido de que pressupõe que os Ø declinem geometricamente Em segundo lugar ao contrário da técnica de Koyck no método de Almon não temos de ficar preocupados com a presença da variável dependente defasada como uma variável explanatória no modelo e nos problemas que ele cria para estimação Por fim se um polinômio de grau suficientemente baixo puder ser ajustado o número de coeficientes a serem estimados os a será consideravelmente menor que o número original de coeficientes os Ø Vamos voltar a ressaltar a técnica de Almon Primeiro o grau do polinômio e o valor máximo da defasagem são em grande parte uma decisão subjetiva Em segundo lugar por razões apresentadas anteriormente as variáveis Z provavelmente exibem multicolinearidade Portanto em modelos como a Equação 17139 os a estimados provavelmente mostram grandes erros padrão relativos aos valores desses coeficientes resultando dessa forma em um ou mais coeficientes estatisticamente insignificantes com base no teste t convencional Mas isso não significa necessariamente que um ou mais dos coeficientes originais ØO também sejam estatisticamente insignificantes A demonstração dessa afirmação é um tanto complexa mas é sugerida no Exercício 1718 Como resultado o problema de multicolinearidade pode não ser tão sério quanto poderíamos imaginar Além disso como sabemos em casos de multicolinearidade mesmo que não possamos estimar um coeficiente com exatidão uma combinação linear desses coeficientes a função estimável pode ser estimada com mais exatidão ExEmplo 1711 Ilustração do modelo de defasagens distribuídas de Almon Para ilustrar a técnica de Almon a Tabela 178 apresenta dados sobre os estoques Y e vendas X para os Estados Unidos para o período de19541999 Para fins ilustrativos suponha que os estoques dependam das vendas no ano corrente e nos três anos anteriores como se segue 171311 Além disso suponha que Øi possa ser aproximado por um polinômio de segundo grau como o da Equação 17132 Então seguindo a Equação 17137 podemos escrever 171312 em que 171313 Continua ECONOBOOKParte04indb 644 23112010 072505 Capítulo 17 Modelos econométricos dinâmicos modelos autorregressivos e com defasagens distribuídas 645 ExEmplo 1711 Continuação As variáveis Z assim construídas são apresentadas na Tabela 178 Usando os dados em Y e os Z obtemos a seguinte regressão 171314 Observe uma vez que estamos usando uma defasagem de um ano o número total de observações foi reduzido de 46 para 43 TabEla 178 Indústria de transformação dos Estados Unidos Fonte Economic report of the president 2001 Tabela B57 p 340 Os Z são como mostrado na Equação 171313 Nota Y e X estão em milhões de dólares ajustados sazonalmente Continua ECONOBOOKParte04indb 645 23112010 072506 646 Parte Três Tópicos em econometria ExEmplo 1711 Continuação Um breve comentário sobre os resultados anteriores é necessário Das três variáveis Z apenas Z0 é estatisticamente significativa em termos individuais no nível de 5 no entanto o valor de F é tão alto que podemos rejeitar a hipótese nula de que coletivamente os Z não têm efeito sobre Y Como você pode suspeitar isso poderia muito bem acontecer devido à multicolinearidade Observe também que o valor de d calculado é muito baixo isso não implica necessariamente que os resíduos sejam afetados pela autocorrelação É mais provável que o baixo valor de d sugira que o modelo que usamos seja mal especificado Faremos um breve comentário sobre isso Dos a estimados dados na Equação 17133 podemos estimar facilmente os Ø originais como mostrado na Equação 17138 No exemplo em questão os resultados são os seguintes 171315 Assim o modelo estimado de defasagens distribuídas correspondente à Equação 171311 é 171316 Geometricamente os Øi estimados da Figura 178 Figura 178 Estrutura defasada do exemplo ilustrativo 05 08 10 15 20 25 30 35 40 45 Defasagem Beta 04 00 04 08 12 Nosso exemplo pode ser usado para destacar alguns aspectos adicionais do procedimento de de fasagem de Almon 1 Os erros padrão dos coeficientes a são obtidos diretamente da regressão de MQO 171314 mas os erros padrão de alguns dos coeficientes ØO nosso objetivo principal não podem mas podem ser deduzidos dos erros padrão dos coeficientes a estimados usandose uma fórmula conhecida da estatística dada no Exercício 1718 Naturalmente não há necessidade de fazer isso manual mente pois a maioria dos programas estatísticos faz isso Os erros padrão dados na Equação 171315 foram obtidos do EViews 6 2 Os ØO obtidos na Equação 171316 são chamados de estimativas irrestritas no sentido de que não há restrições a priori colocadas sobre eles Em algumas situações podemos querer impor as chamadas restrições de ponto extremo aos Ø supondo que Ø0 e Øk o késimo coeficiente ECONOBOOKParte04indb 646 23112010 072507 Capítulo 17 Modelos econométricos dinâmicos modelos autorregressivos e com defasagens distribuídas 647 de defasagem e o corrente sejam zero Devido a razões psicológicas institucionais ou técni cas o valor da variável explanatória no período corrente pode não ter qualquer impacto sobre o valor corrente do regressando justificando assim o valor de zero para Ø0 Pela mesma lógica além de um certo tempo o késimo coeficiente defasado pode não ter qualquer impacto sobre o regressando sustentando assim o pressuposto de que Øk é zero Em nosso exemplo do es toque o Exemplo 1711 o coeficiente de Xt3 tinha um sinal negativo o que pode não fazer sentido econômico Daí podese desejar restringir tal coeficiente a zero53 Evidentemente você não precisa restringir ambos os extremos poderia colocar a restrição apenas no primeiro coeficiente chamado de extremo próximo ou ao último chamado de coeficiente distante Para o exemplo dos estoques isso é ilustrado no Exercício 1728 Às vezes os Ø são estimados com a restrição de que sua soma seja 1 Mas não deveríamos colocar tais restrições despreocupada mente pois afetam os valores dos demais coeficientes defasados não restritos 3 Uma vez que a escolha do número de coeficientes defasados bem como do grau do polinômio é feita discricionariamente pelo pesquisador é inevitável errar e tentar várias especificações e por tanto tal prática é sujeita a acusação de data mining É aí que os critérios de informação de Akaike e Schwarz discutidos no Capítulo 13 podem ser úteis 4 Uma vez que estimamos a Equação 171316 usando três defasagens e o polinômio de segundo grau tratase de um modelo de mínimos quadrados restritos Suponha que decidamos usar as três defasagens mas não a abordagem polinomial de Almon Ou seja estimamos a Equação 171311 pelos MQO E então Primeiro vejamos os resultados 171317 Se compararmos esses resultados com os da Equação 171316 veremos que no geral R2 é pra ticamente o mesmo embora o padrão defasado em 171317 mostre uma forma curva mais acentuada que a exibida pela Equação 171316 A verificação do valor de R2 com base na Equação 171316 deverá ser feita pelo leitor Como este exemplo ilustra é preciso ter cuidado para usar a técnica de defasagens distribuídas de Almon já que os resultados poderiam ser sensíveis à escolha do grau do polinômio eou ao número de coeficientes defasados 1714 Causalidade em economia o teste de causalidade de Granger54 Voltando à Seção 14 observamos que embora a análise de regressão lide com a dependência de uma variável sobre outras variáveis ela não implica necessariamente causação Em outras palavras a existência de uma relação entre variáveis não prova causalidade ou a direção da influência Mas em regressões envolvendo dados de séries temporais a situação pode ser um pouco diferente porque como coloca o autor o tempo não volta Ou seja se o evento A acontece antes do evento B então é possível que A es teja causando B No entanto não é possível que B esteja causando A Em outras palavras os eventos passados podem levar ao acontecimento de eventos no presente Os eventos futuros não podem grifo nosso55 53 Para uma aplicação concreta veja BATTEN D B ThOrNTON Daniel Polynomial distributed lags and the estimation of the St louis equation Review Federal reserve Bank of St louis abr 1983 p 1325 54 Existe outro teste de causalidade que às vezes é usado o chamado teste de causalidade de Sims Ele será discutido através de um exercício 55 KOOP Gary Analysis of economic data Nova york John wiley Sons 2000 p 175 ECONOBOOKParte04indb 647 23112010 072508 648 Parte Três Tópicos em econometria Essa é a ideia aproximada do chamado teste de causalidade de Granger56 Mas devese observar que a questão da causalidade é profundamente filosófica com todos os tipos de controvérsias Em um extremo estão as pessoas que acreditam que tudo tenha uma causa e no outro estão aquelas que ne gam a existência de causação seja qual for57 O econometrista Edward Leamer prefere o termo prece dência a causalidade Francis Diebold prefere o termo causalidade preditiva Como ele escreve a afirmação yi causa yj é uma abreviação da afirmação mais exata porém mais longa yi contém informações úteis para prever yj no sentido dos mínimos quadrados lineares acima e além das histórias passadas das outras variáveis no sistema Para poupar espaço dizemos simplesmente que yi causa yj58 o teste de granger Para explicar o teste de Granger consideraremos a pergunta feita com frequência em macroeco nomia será o PIB que causa a oferta de moeda M PIB M ou será a oferta de moeda M que causa o PIB M PIB em que a seta aponta para a direção da causalidade O teste da causalida de de Granger pressupõe que as informações relevantes à previsão das respectivas variáveis prediti vas PIB e M estão contidas unicamente nos dados de série temporal dessas variáveis O teste envolve a estimação do seguinte par de regressões 17141 17142 Em que se supõe que os termos de erro u1t e u2t não estejam correlacionados A propósito observe que uma vez que temos duas variáveis estamos lidando com a causalidade bilateral Nos capítulos sobre séries temporais econométricas estenderemos isso à causalidade multivariada através da técni ca de vetores autorregressivos VAR A Equação 17141 postula que o PIB corrente esteja relacionado a seus próprios valores passa dos bem como àqueles de M e a Equação 17142 postula um comportamento semelhante para M Note que essas regressões podem ser expressas em forma de crescimento PIB e PM em que o ponto sobre a variável indica sua taxa de crescimento Agora distinguimos quatro casos 1 Uma causalidade unidirecional de M para PIB será indicada se os coeficientes estimados das defasagens de M na Equação 17141 forem estatisticamente diferentes de zero como grupo e o conjunto de coeficientes estimados do PIB na Equação 17142 não for estatisticamente dife rente de zero 2 Por outro lado a causalidade unidirecional do PIB a M existe se o conjunto de coeficientes de fasados na Equação 17141 não é estatisticamente diferente de zero e o conjunto dos coefi cientes do PIB na Equação 17142 é estatisticamente diferente de zero 3 Feedback ou causalidade bilateral será sugerido quando os conjuntos de coeficientes de M e PIB forem estatisticamente diferentes de zero em ambas as regressões 56 GrANGEr C w J investigating causal relations by econometric models and crossspectral methods Econometrica p 424438 jul 1969 Embora seja popularmente conhecido como teste de causalidade de Gran ger é adequado chamálo de teste de causalidade de WienerGranger pois anteriormente foi sugerido por wiener Veja wiener N The theory of prediction In BECKENBACK E F Ed Modern mathematics for engineers Nova york McGrawhill 1956 p 165190 57 Para uma excelente discussão desse tópico veja ZEllNEr Arnold Causality and econometrics Carnegie Rochester Conference Series 10 BrUNNEr K MElTZEr A h Eds Amsterdã North holland Publishing Company 1979 p 950 58 DiEBOlD Francis X Elements of forecasting 2 ed South western Publishing 2001 p 254 ECONOBOOKParte04indb 648 23112010 072508 Capítulo 17 Modelos econométricos dinâmicos modelos autorregressivos e com defasagens distribuídas 649 4 Por fim a independência será sugerida quando os conjuntos de coeficientes de M e PIB não forem estatisticamente significativos em nenhuma das regressões Em termos mais gerais uma vez que o futuro não pode prever o passado se a variável X Granger causa a variável Y variações em X deveriam preceder variações em Y Portanto em uma regressão de Y sobre outras variáveis incluindo seus próprios valores passados se incluirmos os valores passados ou defasados de X e ele aprimorar significativamente a previsão de Y poderemos dizer que X Granger causa Y Uma definição similar aplicase se Y Granger causa X Seguem as etapas envolvidas na implementação do teste de causalidade de Granger que serão ilustradas com o exemplo de PIBmoeda dado na Equação 17141 1 Calcule a regressão do PIB corrente contra todos os termos do PIB defasados e outras variáveis se houver mas não inclua as defasagens de M nessa regressão Como foi feito no Capítulo 8 esta é a regressão restrita Dessa regressão obtemos a soma dos quadrados dos resíduos SQRR 2 Agora efetue a regressão incluindo os termos de M defasados Na terminologia do Capítulo 8 esta é a regressão irrestrita Dessa regressão obtemos a soma de quadrados dos resíduos irrestritos SQRUR 3 A hipótese nula é H0 Æi D 0 i D 1 2 n ou seja os termos de M defasados não pertencem à regressão 4 Para testar essa hipótese aplicamos o teste F dado pela Equação 879 a saber 879 que segue a distribuição F com m e n k graus de liberdade No presente caso m é igual ao número de defasagens de M e k é o número de parâmetros estimados na regressão irrestrita 5 Se o valor calculado de F for maior que o valor crítico de F ao nível de significância escolhido rejeitaremos a hipótese nula e nesse caso os termos de defasagens de M pertencerão à regressão Essa é outra forma de dizer que M causa o PIB 6 As etapas de 1 a 5 podem ser repetidas para testar o modelo 17142 ou seja se a variação do PIB causa a de M Antes de ilustrarmos o teste de causalidade de Granger há várias observações que precisam ser feitas 1 Supõese que as duas variáveis PIB e M sejam estacionárias Discutimos o conceito de estacio nariedade em termos intuitivos anteriormente e ele será discutido mais formalmente no Capítulo 21 Às vezes tirar as primeiras diferenças das variáveis tornaas estacionárias se já não forem estacionárias em nível 2 O número de defasagens a ser introduzido nos testes de causalidade é uma questão prática impor tante Como no caso dos modelos de defasagens distribuídas pode ser preciso usar o critério de informação de Akaike ou Schwarz para fazer a escolha Mas deve ser acrescentado que a direção da causalidade pode depender do número de termos defasados incluídos 3 Supusemos que os termos de erro que entram no teste de causalidade não estão correlacionados Se não for esse o caso podemos fazer a transformação adequada como visto no Capítulo 1259 4 Uma vez que nosso interesse é testar a causalidade não é preciso apresentar os coeficientes esti mados dos modelos 17141 e 17142 explicitamente para poupar espaço apenas os resulta dos do teste F dado na Equação 879 bastarão 5 É preciso prevenirse contra a causalidade espúria Em nosso exemplo de PIBM suponha que seja considerada a taxa de juros por exemplo a taxa de juros de curto prazo É bem possível que a moeda 59 Para mais detalhes veja ChArEMZA wojciech w DEADMAN Derek F New directions in econometric practice general to specific modelling cointegration and vector autoregression 3 ed Edward Elgar Publishing 1997 capítulo 6 ECONOBOOKParte04indb 649 23112010 072509 650 Parte Três Tópicos em econometria seja a causada taxa de juros no sentido de Granger e esta por sua vez cause o PIB Por tanto se não considerarmos a taxa de juros e constatarmos que é a moeda que causa o PIB a causalidade observada entre o PIB e a moeda pode ser espúria60 Como observado uma maneira de lidar com isso é considerar um sistema de várias equações como vetores autorregressivos VAR que discutiremos em detalhes no Capítulo 22 61 ExEmplo 1712 Causalidade entre moeda e renda r w hafer usou o teste de Granger para descobrir a natureza da causalidade entre o PNB e não o PiB e M nos Estados Unidos para o período que vai do primeiro trimestre de 1960 até o quarto trimestre de 1980 Em vez de usar os valores brutos dessas variáveis utilizou as taxas de crescimento delas PNB e M e usou quatro defasagens de cada uma das variáveis das duas regressões apresentadas anteriormente Os resultados foram os seguintes61 a hipó tese nula em cada caso é que a variável considerada não causa no sentido de Granger a outra variável Direção da causalidade Valor de F Decisão M PN B 268 rejeitar PN B M 056 Não rejeitar Esses resultados sugerem que a direção da causalidade é da variação da moeda para a varia ção do PNB já que o F estimado é significativo no nível de 5 o valor crítico de F é 250 para 4 e 71 graus de liberdade Por outro lado não há causação reversa da variação do PNB para a da moeda já que o valor de F é insignificante ExEmplo 1713 Causalidade entre moeda e taxa de juros no Canadá Consulte os dados da Tabela 175 sobre o Canadá Suponha que desejemos verificar se existe causalidade entre a oferta de moeda e a taxa de juros no Canadá para os períodos tri mestrais de 19791988 Para mostrar que o teste de causalidade de Granger depende funda mentalmente do número de termos defasados introduzidos no modelos apresentamos a seguir os resultados do teste F usando várias defasagens trimestrais Em cada caso a hipó tese nula é de que a taxa de juros não causa no sentido de Granger variação na oferta de moeda e viceversa Note estes aspectos dos resultados anteriores do teste F até seis defasagens há causalida de bilateral entre a oferta de moeda e a taxa de juros Entretanto com oito defasagens não há relação estatisticamente discernível entre as duas variáveis isso reforça o ponto ressaltado anteriormente de que o resultado do teste de Granger é sensível ao número de defasagens introduzidas no modelo 60 Sobre esse assunto veja J h STOCK J h wATSON M w interpreting the evidence on moneyincome causality Journal of Econometrics 1989 v 40 p 783820 61 hAFEr r w The role of fiscal policy in the St louis equation Review Federal reserve Bank of St louis p 1722 jan 1982 Veja a nota de rodapé 12 para detalhes do procedimento ECONOBOOKParte04indb 650 23112010 072509 Capítulo 17 Modelos econométricos dinâmicos modelos autorregressivos e com defasagens distribuídas 651 ExEmplo 1714 Causalidade entre a taxa de crescimento do PIB e a taxa de poupança bruta em nove países do Leste Asiático Um estudo da causalidade bilateral entre a taxa de crescimento do PiB g e a taxa de poupança bruta s mostrou os resultados apresentados na Tabela 17962 Por comparação os resultados para os Estados Unidos também são apresentados na tabela De modo geral os resultados da Tabela 179 mostram que para a maioria dos países do leste Asiático a causa lidade vai da taxa de crescimento do PiB à taxa de poupança bruta Em contrapartida para os Estados Unidos para o período de 19501988 até a defasagem 3 a causalidade foi em ambas as direções mas para as defasagens 4 e 5 ela foi da taxa de crescimento do PiB até a taxa de poupança mas não na direção oposta TabEla 179 Testes de causalidade bivariada de Granger entre a taxa de crescimento real do PIB per capita e a taxa de poupança bruta Fonte World Bank The East Asian miracle economic growth and public policy Nova York Oxford University Press 1993 p 244 Tabela A52 A fonte original é SUMMERS Robert HESTON Alan The Penn world tables mark 5 an expanded set of international comparisons 195088 Quarterly Journal of Economics v 105 n 2 1991 Sig significativa NS não significativa Observe o crescimento é o crescimento do PIB real per capita a preços internacionais de 1985 Para concluir nossa discussão sobre a causalidade de Granger lembrese de que a questão que estamos examinando é se estatisticamente podemos detectar a direção da causalidade quando temporalmente há uma relação de leadlag entre duas variáveis Se a causalidade for estabelecida ela sugerirá que se pode usar uma variável para prever melhor a outra em vez de simplesmente considerar a história pregressa dessa outra variável No caso das economias do leste Asiático parece que podemos prever melhor a poupança bruta considerando os valores defasados da taxa de crescimento do PiB em vez de considerar apenas os valores defasados da taxa de poupança bruta uma observação sobre causalidade e exogeneidade Como estudaremos nos capítulos sobre modelos de equação simultânea na Parte 4 as variáveis econômicas são classificadas com frequência em duas categorias amplas endógena e exógena Em termos gerais as variáveis endógenas são o equivalente às variáveis X ou regressores em tal modelo contanto que as variáveis X não sejam correlacionadas com o termo de erro naquela equação63 62 Esses resultados são obtidos de The East Asian miracle economic growth and public policy publicado para o Ban co Mundial pela Oxford University Press 1993 p 244 Opcional 63 Naturalmente se as variáveis explanatórias incluem um ou mais termos defasados da variável endógena esse requisito pode não ser preenchido ECONOBOOKParte04indb 651 23112010 072510 652 Parte Três Tópicos em econometria Agora levantamos uma questão interessante suponha que em um teste de causalidade de Granger verifiquemos que uma variável X cause pelo método de Granger uma variável Y sem ser causada por esta isto é não há causalidade bilateral Podemos então tratar a variável X como exógena Em ou tras palavras podemos usar a causalidade de Granger ou a não causalidade para estabelecer a exo geneidade Para respondermos a essa questão precisamos distinguir três tipos de exogeneidade 1 fraca 2 forte e 3 super Para manter a exposição simples suponha que consideremos apenas duas variáveis Yt e Xt e suponha ainda que efetuemos a regressão de Yt contra Xt Diremos que Xt é fracamente exó geno se Yt também não explicar Xt Nesse caso a estimação e o teste do modelo de regressão podem ser feitos condicionais aos valores de Xt De fato ao retornar ao Capítulo 2 você perceberá que nos sa modelagem de regressão era condicional aos valores das variáveis X Xt será fortemente exógeno se os valores atual e defasado de Y não o explicarem isto é não existe relação de feedback E Xt será superexógeno se parâmetros na regressão de Y contra X não mudarem mesmo que os valores de X mudem isto é os valores do parâmetro não variam a mudanças nos valores de X Se esse for o caso a famosa crítica de Lucas pode perder sua força64 A razão para distinguir entre os três tipos de exogeneidade é que Em geral a fraca exogeneida de é tudo o que precisamos para estimar e testar a exogeneidade forte é necessária para prever e a superexogeneidade para análise de políticas65 Retornando à causalidade de Granger se uma variável por exemplo Y não causa outra variável por exemplo X podemos supor que esta última seja exógena Infelizmente a resposta é não Se esta mos falando de exogeneidade fraca podemos mostrar que a causalidade de Granger não é nem ne cessária nem suficiente para estabelecer a exogeneidade Por outro lado a causalidade de Granger é necessária mas não suficiente para a exogeneidade forte As demonstrações desses enunciados vão além do escopo deste livro66 Para nossos objetivos é melhor manter os conceitos de causalidade e exogeneidade de Granger separados e tratar o primeiro como uma ferramenta descritiva útil para da dos de séries temporais No Capítulo 19 discutiremos um teste que pode ser usado para verificar se uma variável pode ser tratada como exógena Resumo e conclusões 1 Por razões psicológicas tecnológicas e institucionais um regressando pode responder a um re gressor com uma defasagem de tempo Os modelos de regressão que levam em conta defasagens de tempo são conhecidos como modelos de regressão dinâmicos com defasagens 2 Existem dois tipos de modelo com defasagens com defasagens distribuídas e autorregressivo No primeiro os valores atual e com defasagens dos regressores são variáveis explanatórias No segundo os valores com defasagens do regressando aparecem como variáveis explanatórias 3 Um modelo de defasagens distribuídas puro pode ser estimado por MQO mas no caso há o pro blema de multicolinearidade uma vez que valores defasados sucessivos de um regressor tendem a estar correlacionados 4 Como resultado alguns métodos práticos foram elaborados Estes incluem o modelo de Koyck o de expectativas adaptativas e o mecanismo de ajustes parciais sendo o primeiro uma abordagem puramente algébrica e o segundo baseado em princípios econômicos 64 robert lucas Prêmio Nobel apresenta a proposição de que relações existentes entre variáveis econômicas podem mudar quando a política muda e nesse caso os parâmetros estimados de um modelo de regressão serão de pouca valia para previsão Sobre isso veja BlANChArD Oliver Macroeconomics Prentice hall 1997 p 371372 65 CUThBErTSON Keith hAll Stephen G TAylOr Mark P Applied econometric techniques University of Michigan Press 1992 p 100 66 Para uma discussão comparativamente simples veja MADDAlA G SIntroduction to econometrics 2 ed Nova york Macmillan 1992 p 394395 e também hENDry David F Dynamic econometrics Nova york Oxford University Press 1995 Capítulo 5 ECONOBOOKParte04indb 652 23112010 072510 Capítulo 17 Modelos econométricos dinâmicos modelos autorregressivos e com defasagens distribuídas 653 5 Um aspecto singular dos modelos de Koyck de expectativas adaptativas e de ajuste parcial é que todos têm natureza autorregressiva no sentido de que os valores defasados do regressando aparecem como uma das variáveis explanatórias 6 A autorregressividade impõe desafios à estimação se o regressando defasado está correlacionado com o termo de erro os estimadores de MQO de tais modelos são não apenas tendenciosos mas também inconsistentes Viés e inconsistência são o caso dos modelos de Koyck e de expectativas adaptativas o modelo de ajuste parcial é diferente no sentido de que pode ser estimado consis tentemente pelos MQO apesar da presença do regressando defasado 7 Para estimar os modelos de Koyck e de expectativas adaptativas o método mais popular é o da variável instrumental Esta é uma variável proxy para o regressando defasado mas com a pro priedade de que não está correlacionada ao termo do erro 8 Uma alternativa aos modelos de regressão que acabamos de discutir é o modelo polinomial com defasagens distribuídas de Almon que evita os problemas de estimação associados aos modelos autorregressivos O principal problema com a abordagem de Almon no entanto é que tanto a du ração da defasagem quanto o grau do polinômio devem ser especificados previamente Há métodos formais e informais para resolver a opção da duração da defasagem e o grau do polinômio 9 Apesar dos problemas de estimação que podem acumularse os modelos de distribuição de de fasagens e de autorregressão têm mostradose extremamente úteis em economia aplicada porque tornam a teoria econômica dinâmica ao levarem em conta explicitamente o papel do tempo Tais modelos ajudam a distinguir a curto e longo prazo as reações das variáveis dependentes a uma variação unitária no valor das variáveis explanatórias Assim esses modelos têm mostradose úteis para estimar a elasticidadepreço renda de substituição e outras a curto e a longo prazo67 10 Devido às defasagens envolvidas os modelos autorregressivo eou de defasagens distribuídas levantam a questão da causalidade em variáveis econômicas No trabalho aplicado a modelagem da causalidade de Granger tem recebido atenção considerável Porém é preciso ter cautela para usar a metodologia de Granger porque é muito sensível à duração da defasagem usada no modelo 11 Mesmo que uma variável X cause pelo método de Granger outra variável Y isso não significa que X seja exógeno Distinguimos três tipos de exogeneidade fraca forte e super e aponta mos a importância da distinção ExErcícios 171 Explique de maneira breve se as seguintes afirmações são verdadeiras falsas ou incertas a Todos os modelos econométricos são essencialmente dinâmicos b O modelo de Koyck não fará tanto sentido se alguns coeficientes das defasagens distribuí das forem positivos e alguns forem negativos c Se os modelos de expectativas adaptativas e o de Koyck forem estimados por MQO os estimadores serão tendenciosos mas consistentes d No modelo de ajuste parcial os estimadores de MQO são tendenciosos em amostras infinitas e Na presença de regressores estocásticos e de um termo de erro autocorrelacionado o método de variáveis instrumentais produzirá estimativas não tendenciosas bem como consistentes f Na presença de um regressando defasado como regressor a estatística d de DurbinWatson para detectar autocorrelação é praticamente inútil g O teste h de Durbin é válido tanto em amostras grandes quanto pequenas h O teste de Granger é um teste de precedência e não de causalidade 67 Para aplicações desses modelos veja hArBErGEr Arnold C Ed The demand for durable goods Chicago University of Chicago Press 1960 ECONOBOOKParte04indb 653 23112010 072510 654 Parte Três Tópicos em econometria 172 Deduza a Equação 1772 173 Demonstre a Equação 1783 174 Suponha que os preços sejam formados de acordo com a seguinte hipótese de expectativas adaptativas em que P é o preço esperado e P é o preço real Complete a tabela a seguir supondo que D 05 período P P t 3 100 110 t 2 125 t 1 155 t 185 t C 1 175 Considere o modelo Suponha que Yt1 e vt sejam correlacionados Para eliminar a correlação suponha que seja usada a seguinte abordagem da variável instrumental primeiro efetue a regressão de Yt contra X1t e X2t e obtenha o YOt estimado dessa regressão Então efetue a regressão de em que YOt1 são estimados da regressão de primeira ordem a Como esse procedimento remove a correlação entre Yt1 e vt no modelo original b Quais as vantagens do procedimento recomendado em relação à abordagem de Liviatan 176 a Escreva 1748 b Avalie a defasagem média para D 02 04 06 08 c Há alguma relação sistemática entre o valor de e o valor da defasagem média 177 a Prove que para o modelo de Koyck a defasagem média é a apresentada na Equação 17410 b Se for relativamente grande quais suas implicações 178 Usando a fórmula para a defasagem média dada na Equação 1749 verifique a defasagem média de 10959 trimestres relatados no exemplo da Tabela 171 179 Suponha em que M D demanda por saldos reais Y D renda real esperada e R D taxa de juros espera da Suponha que as expectativas sejam formuladas como se segue em que 1 e 2 são coeficientes de expectativa ambos situados entre 0 e 1 a Como poderíamos expressar Mt em termos das quantidades observáveis b Que problemas de estimação você prevê 654 Parte Três Tópicos em econometria Adaptado de ShAw G K op cit p 26 Opcional ECONOBOOKParte04indb 654 23112010 072511 Capítulo 17 Modelos econométricos dinâmicos modelos autorregressivos e com defasagens distribuídas 655 Capítulo 17 Modelos econométricos dinâmicos modelos autorregressivos e com defasagens distribuídas 655 1710 Se você estima a Equação 1772 pelos MQO pode derivar estimativas dos parâmetros originais Que problemas você prevê Para detalhes veja Roger N Waud 1711 Modelo de correlação serial Considere o seguinte modelo Suponha que ut siga o esquema de autorregressão de primeira ordem de Markov apresentado no Capítulo 12 a saber em que Ω é o coeficiente de autocorrelação de primeira ordem e onde t satisfaz todos os pressupostos do MQO clássico Então como mostrado no Capítulo 12 o modelo terá um termo de erro serialmente independente tornando possível a estimação por MQO Mas esse modelo de correlação serial como é chamado parece muito com de Koyck e com os modelos de expectativas adaptativas e de ajustamento parcial Como saberíamos em qual quer situação qual dos modelos precedentes é adequado 1712 Considere o modelo de Koyck ou no caso das expectativas adaptativas dado na Equação 1747 a saber Suponha no modelo original que ut siga o esquema de autorregressão de primeira ordem ut Ωu1t D t em que Ω é o coeficiente de autocorrelação e t satisfaz todos os pressupostos clássicos de MQO a Se Ω D o modelo de Koyck pode ser estimado por MQO b As estimativas assim obtidas não serão tendenciosas Consistentes Por quê c Em que medida é razoável supor que Ω D 1713 Modelo de defasagens distribuídas triangular ou aritmético Este modelo supõe que o estí mulo variável explanatória exerça seu maior impacto no atual período de tempo e então diminua em decréscimos de mesma magnitude à medida que se entra no passado distante Geometricamente ele é apresentado na Figura 179 Seguindo essa distribuição suponha que a seguinte sucessão de regressões seja efetuada etc e escolha a regressão que dá o R2 mais alto como a melhor regressão Comente essa estratégia Misspecification in the partial adjustment and adaptive expectations models International Economic Review jun 1968 v 9 n 2 p 204217 Para uma discussão do modelo de correlação serial veja GriliChES Zvi Distributed lags a survey Econometrica jan 1967 v 35 n 1º p 34 Este modelo foi proposto por FiShEr irving Note on a shortcut method for calculating distributed lags In ternational Statistical Bulletin 1937 p 323328 ECONOBOOKParte04indb 655 23112010 072512 656 Parte Três Tópicos em econometria 656 Parte Três Tópicos em econometria 1714 Dos dados trimestrais para o período de 19501960 F P R Brechling obteve a seguinte função de demanda de mão de obra para a economia inglesa os dados entre parênteses são os erros padrão em que E D Et Et1 Q D produção t D tempo A equação anterior baseouse no pressuposto de que o nível desejado de emprego E t é uma função da produção do tempo e do tempo elevado ao quadrado e sob a hipótese de que Et Et1 D E t Et1 em que o coeficiente de ajustamento situase entre 0 e 1 a Interprete a regressão anterior b Qual o valor de c Derive a função de demanda a longo prazo para a mão de obra por meio da função de demanda estimada a curto prazo d Como se poderia testar a correlação serial no modelo anterior 1715 Ao estudar a demanda de uma fazenda por tratores Griliches usou o seguinte modelo em que T D estoque desejado de tratores X1 D preço relativo de tratores X2 D taxa de juros Usando o modelo de ajuste de estoque ele obteve os seguintes resultados para o período de 19211957 em que os dados entre parênteses são os erros padrão estimados Figura 179 Esquema de defasagem triangular ou aritmético de Fisher 0 Tempo k β BrEChliNG F P r The relationship between output and employment in British manufacturing industries Review of Economic Studies v 32 jul 1965 GriliChES Zvi The demand for a durable input farm tractors in the United States 19211957 in hArBErGEr Arnold C Ed The demand for durable goods Chicago University of Chicago Press 1960 ECONOBOOKParte04indb 656 23112010 072513 Capítulo 17 Modelos econométricos dinâmicos modelos autorregressivos e com defasagens distribuídas 657 Capítulo 17 Modelos econométricos dinâmicos modelos autorregressivos e com defasagens distribuídas 657 a Qual o coeficiente estimado de ajustamento b Quais as elasticidadespreço de curto e longo prazo c Quais as elasticidadesjuros correspondentes d Quais as razões para as taxas alta e baixa de ajustamento neste modelo 1716 Sempre que a variável dependente defasada aparece como variável explanatória o R2 em geral é muito mais alto que em situações em que ela não é incluída Quais as razões para essa observação 1717 Considere os padrões de defasagem na Figura 1710 Que graus de polinômio se ajustariam às estruturas de defasagens e por quê Figura 1710 Estruturas de defasagens hipotéticas i 0 0 0 0 Defasagem Defasagem Tempo Tempo βi i β βi i β i i i 1718 Considere a Equação 17134 Para obter a variância de ØOi das variâncias de aOi usamos a seguinte fórmula a Usando a fórmula anterior encontre a variância de ØOi expressa como b Se as variâncias de aOi são grandes em relação a si mesmas a variância de ØOi também será grande Por quê ECONOBOOKParte04indb 657 23112010 072515 658 Parte Três Tópicos em econometria 658 Parte Três Tópicos em econometria 1719 Considere o seguinte modelo de distribuição de defasagens Suponha que Øi possa ser expresso adequadamente pelo polinômio de segundo grau como se segue Como você estimaria os Ø se queremos impor a restrição de que Ø0 D Ø4 D 0 1720 Modelo de defasagens distribuídas em forma de V invertido Considere o modelo de defasa gens distribuídas finito para o período k F DeLeeuw propôs a estrutura para os Ø como na Figura 1711 em que os Ø seguem a forma de V invertido Supondo para simplificar que k a duração máxima da defasagem seja um número par e pressupondo ainda que Ø0 e Øk sejam zero DeLeeuw sugere o seguinte esque ma para os Ø Como o esquema de DeLeeuw poderia ser usado para estimar os parâmetros do modelo an terior com defasagens distribuídas para o período k Figura 1711 Modelo V de defasagens distribuídas iβ k β i 0 1 2 3 Defasagem 1721 Retome ao Exercício 1215 Uma vez que o valor d mostrado lá é de pouca utilidade para detectar a autocorrelação de primeira ordem por quê como você testaria a autocorrela ção nesse caso Exercícios aplicados 1722 Considere o modelo a seguir Veja o artigo dele The demand for capital goods by manufacturers a study of quarterly time series Econometrica jul 1962 vol 30 n 3 p 407423 ECONOBOOKParte04indb 658 23112010 072516 Capítulo 17 Modelos econométricos dinâmicos modelos autorregressivos e com defasagens distribuídas 659 Capítulo 17 Modelos econométricos dinâmicos modelos autorregressivos e com defasagens distribuídas 659 TabEla 1710 Investimento na fábrica e nos equipamentos na manufatura Y e vendas de produtos manufaturados X2 em bilhões de dólares ajustados sazonalmente para os Estados Unidos referentes ao período 19701991 Fonte Economic Report of the President 1993 Dados sobre Y da Tabela B52 p 407 dados sobre X2 da Tabela 853 em que Y D desejado ou despesa desejada ou de longo prazo para a nova fábrica e equipa mento Xt D vendas e t D tempo Usando o modelo de ajustamento de estoque estime os parâ metros da função de demanda de curto e longo prazos para os gastos em nova fábrica e equipamento dados na Tabela 1710 Como poderíamos verificar se há correlação serial nos dados 1723 Use os dados do Exercício 1722 mas considere o seguinte modelo Usando o modelo de ajustamento de estoque por quê estime as elasticidades a curto e longo prazo dos gastos com a nova fábrica e equipamentos com relação às vendas Compare os resultados obtidos com aqueles do Exercício 1722 Qual modelo você escolheria e por quê Existe correlação serial nos dados Como podemos saber 1724 Use os dados do Exercício 1722 mas suponha que em que Xt são vendas desejadas Estime os parâmetros deste modelo e compare os resultados com aqueles do Exercício 1722 Como você decidiria qual o modelo adequado Com base na estatística h você concluiria que há correlação serial nos dados 1725 Suponha que alguém o convença de que a relação entre as despesas com novas instalações e equipamentos e as vendas sejam as seguintes em que Y é a despesa desejada e X as vendas desejadas ou esperadas Use os dados apre sentados no Exercício 1722 para estimar esse modelo e comente seus resultados 1726 Usando os dados do Exercício 1722 determine se a despesa com a fábrica causa no sentido de Granger vendas ou se as vendas causam no sentido de Granger as despesas com as novas instalações Use até seis defasagens e comente seus resultados Qual a conclusão im portante que podemos tirar deste exercício 1727 Suponha que as vendas no Exercício 1722 tenham um efeito de desafagens distribuídas so bre as despesas com as novas instalações e equipamento Aplique um modelo de defasagens de Almon adequado aos dados 1728 Estime novamente a Equação 171316 impondo 1 uma restrição quase finita 2 uma restrição quase infinita e 3 ambas as restrições finitas e compare seus resultados dados na Equação 171316 Qual a conlcusão geral que se pode tirar ECONOBOOKParte04indb 659 23112010 072517 660 Parte Três Tópicos em econometria 660 Parte Três Tópicos em econometria 1729 A Tabela 1711 apresenta dados sobre o investimento fixo privado em processamento de in formações e equipamento Y em bilhões de dólares vendas na fabricação total e comércio X2 em milhões de dólares e taxa de juros X3 classificação da Moody de títulos de primei ra linha os dados de Y e X2 são ajustados sazonalmente a Teste a causalidade bilateral entre Y e X2 atentando ao número de defasagens b Teste a causalidade bilateral entre Y e X3 novamente atentando ao número de defasa gens c Para considerar o efeito das defasagens distribuídas das vendas sobre o investimento suponha que você decida usar a técnica de desafagem de Almon Mostre o modelo esti mado depois de atentar ao número de defasagens bem como ao grau do polinômio 1730 A Tabela 1712 apresenta dados sobre índices de remuneração real por hora Y e produção por hora X2 sendo ambos os índices de base 1992 D 100 no setor comercial para a econo mia norteamericana para o período de 19601999 bem como a taxa de desemprego X3 para o mesmo período a A remuneração salarial determina a produtividade da mão de obra ou o inverso b Desenvolva um modelo adequado para testar sua conjectura em a fornecendo os dados estatísticos usuais c Você acha que a taxa de desemprego tem algum efeito sobre a remuneração salarial Em caso afirmativo como você consideraria esse fator Mostre a análise estatística necessária 1731 Em um teste da causalidade de Granger Christopher Sims explora o fato de que o futuro não pode causar o presente Para decidir se uma variável Y causa uma variável X Sims sugere que se estime o seguinte par de equações TabEla 1711 Investimentos vendas e taxas de juros Estados Unidos 19601999 Observações Investimento D D investimento fixo privado no processamento de informações equipamento e software bilhões de dólares ajustados sazonalmente vendas no total de produtos fabricados e comércio milhões de dólares ajustados sazonalmente Vendas D classificação da Moody de títulos de primeira linha Fonte Economic Report of the President 2001 Tabelas B18 B57e B73 SiMS C A Money income and causality American Economic Review 1972 v 62 p 540552 ECONOBOOKParte04indb 660 23112010 072518 Capítulo 17 Modelos econométricos dinâmicos modelos autorregressivos e com defasagens distribuídas 661 Capítulo 17 Modelos econométricos dinâmicos modelos autorregressivos e com defasagens distribuídas 661 1 2 Estas regressões incluem os valores defasados correntes e futuros ou lead dos regressores termos como Xt1 Xt2 etc são chamados de lead ou termos futuros Se Y deve causar X no sentido de Granger então deve haver uma relação entre Y e os valores futuros de X ou lead Portanto em vez de testar se deveríamos igualar o teste na Equação 1 a zero Se rejeitarmos essa hipótese a causalidade vai de Y para X e não de X para Y porque o futuro não pode causar o presente Comentários parecidos aplicamse à Equação 2 Para efetuarmos o teste de Sims estimamos a Equação 1 sem os termos futuros podemos chamálos de regressão restrita e estimamos a Equação 1 com os termos futuros chama dos de regressão irrestrita Então efetuamos o teste F como indicado na Equação 879 Se a estatística F for significativa por exemplo com 5 de probabilidade concluímos que é o Y que causa X no sentido de Granger Comentários semelhantes aplicamse à Equação 2 Qual teste escolhemos Granger ou Sims Podemos aplicar ambos os testes O único fator favorável ao teste de Granger é que ele usa menos graus de liberdade porque ele não usa os termos futuros Se a amostra não for suficientemente grande teremos que usar o teste de Sims com cautela TabEla 1712 Remuneração produtividade e taxa de desemprego nos Estados Unidos 19601999 Notas REM D D índice de remuneração real por hora 1992 D 100 PRODUTO D índice de produção por hora 1992 D 100 Taxa de desemprego Fonte Economic Report of the President 2001 Tabela B49 p 332 A escolha entre os testes de causalidade de Granger e Sims não está clara Para mais discussões sobre esses testes veja ChAMBErlAiN G The general equivalence of Granger and Sims causality Econometrica 1982 v 50 p 569582 ECONOBOOKParte04indb 661 23112010 072519 662 Parte Três Tópicos em econometria 662 Parte Três Tópicos em econometria Consulte os dados apresentados no Exercício 1234 Para fins pedagógicos aplique o teste de causalidade de Sims para determinar se são as vendas que causam gastos com instalações ou viceversa Use os dados dos quatro últimos anos como termos futuros em sua análise 1732 A Tabela 1713 apresenta alguns dados macroeconômicos para a economia grega referentes aos anos 19601995 Considere a seguinte função consumo em que DCDt D despesa de consumo privado desejada real no tempo t RPDt D renda priva da real disponível no tempo t TJRt D taxa de juros real no tempo t e ln representa logaritmo natural a Com base nos dados apresentados na Tabela 1713 estime a função consumo anterior esclarecendo como você mediu as despesas de consumo privado reais desejadas b Que problemas econométricos são encontrados ao estimar a função consumo anterior Como eles podem ser resolvidos Explique detalhadamente TabEla 1713 Dados macroeconômicos para a economia grega 19601995 Fonte SEDDIGHI H R LAWLER K A KATOS A V Econometrics a practical approach Londres Routledge 2000 p 158 PIB Nota todos os dados nominais são em preços constantes de mercado do ano de 1970 em milhões de dracmas A renda disponível privada é deflacionada pelo deflator de preço de consumo ECONOBOOKParte04indb 662 23112010 072520 Capítulo 17 Modelos econométricos dinâmicos modelos autorregressivos e com defasagens distribuídas 663 Capítulo 17 Modelos econométricos dinâmicos modelos autorregressivos e com defasagens distribuídas 663 1733 Usando os dados na Tabela 1713 desenvolva um modelo adequado para explicar o compor tamento do investimento bruto real na economia grega para o período de 19601995 Con sulte qualquer livro de macroeconomia para informações sobre o modelo acelerador de investimento Apêndice 17A 17a1 o teste de sargan para a validade dos instrumentos Suponha que usemos uma variável instrumental para substituir uma variável explanatória que esteja correlacionada com o termo de erro Qual a validade da variável instrumental ou seja como sabemos que os instrumentos escolhidos são independentes do termo de erro Sargan desenvolveu um SARG estatístico chamado de SARG para testar a validade dos instrumentos usados na variável instrumental VI As etapas envol vidas no SARG são as seguintes 1 Divida as variáveis incluídas em uma equação de regressão em dois grupos aqueles que são independentes do termo de erro por exemplo X1 X2 Xp e aqueles que não são independentes do termo de erro por exemplo Z1 Z2 Zq 2 Sejam W1 W2 Ws os instrumentos escolhidos para as variáveis Z em 1 em que s q 3 Estime a regressão original substituindo os Z pelos W isto é estime a regressão original pelo IV e obtenha os resíduos por exemplo uO 4 Faça a regressão de uO sobre uma constante todas as variáveis X e todas as variáveis W mas exclua todas as variáveis Z Obtenha R2 dessa regressão 5 Calcule agora a estatística SARG definida como 17a11 Em que n D o número de observações e k D o número de coeficientes na equação de regressão original Sob a hipótese nula de que os instrumentos são exógenos Sargan mostrou que o teste SARG tem assintoticamente a distribuição 2 com s q graus de liberdade onde s é o número de instrumentos isto é as variáveis em W e q é o número de regressores na equação original Se o qui quadrado calculado em uma aplicação é estatistica mente significativo rejeitamos a validade dos instrumentos Se não for estatisticamente significativo poderemos aceitar o instrumento escolhido como válido Deve ser enfatizado que s q isto é o número de instrumentos deve ser maior que q Se este não for o caso isto é s q o teste de SARG não será válido 6 A hipótese nula é que todos os instrumentos W são válidos Se o qui quadrado calculado exceder o valor crítico de qui quadrado rejeitaremos a hipótese nula o que significa que pelo menos um instrumento estará correlacionado com o termo de erro e portanto as estimativas IV baseadas nos instrumentos escolhidos não serão válidas SArGAN J D wages and prices in the United Kingdom a study in econometric methodology in hArT P E MillS G whiTAKEr J K Eds Econometric analysis for national economic planning londres Butterworths 1964 A discussão a seguir apoiase em SEDDiGhi h r lAwlEr K A KATOS A V Econometrics a practical approach Nova york routledge 2000 p 155156 ECONOBOOKParte04indb 663 23112010 072520 665 Modelos de equações simultâneas e econometria de séries temporais Uma rápida pesquisa nos trabalhos empíricos publicados sobre negócios e economia revela que muitas das relações econômicas são do tipo uniequacional equação única Por essa razão dedicamos as três primeiras partes deste livro ao debate sobre os modelos de regressão uniequacional Neles uma variável a variável dependente Y está expressa como uma função linear de uma ou mais variáveis as variáveis explanatórias os X Nesses modelos uma premissa básica é que a relação de causa e efeito se houver entre o Y e os X é unidirecional As variáveis explanatórias são a causa e a variável dependente é o efeito Entretanto há situações nas quais existe um fluxo de influência de mão dupla entre as variáveis econômicas ou seja uma variável econômica afeta outras variáveleis econômicas e é por sua vez afetada por elas Sendo assim na regressão da moeda M sobre a taxa de juros r a metodologia uniequacional supõe implicitamente que a taxa de juros é fixada por exemplo pelo Federal Reserve System e busca descobrir a qualidade da moeda necessária para trocas para cada nível da taxa de juros Mas o que acontece se a taxa de juros depender da demanda por moeda Nesse caso a aná lise de regressão condicional feita neste livro até aqui pode não ser adequada porque agora M depende de r e r depende de M Precisamos considerar duas equações uma que relacione M a r e outra que relacione r a M Isso nos leva a considerar os modelos de equações simultâneas modelos nos quais há mais do que uma equação de regressão uma para cada variável interdependente Na Parte 4 apresentaremos uma introdução bastante elementar e heurística ao complexo tema dos modelos de equações simultâneas e deixamos os detalhes para as referências No Capítulo 18 apresentaremos vários exemplos de modelos de equações simultâneas e mostra remos por que o método dos mínimos quadrados considerado anteriormente em geral não se aplica à estimativa dos parâmetros de cada uma das equações do modelo No Capítulo 19 consideraremos o conhecido problema da identificação Se em um sistema de equações simultâneas que contenha duas ou mais equações não for possível obter valores numéricos de cada parâmetro em cada equação porque as equações são empiricamente indistinguíveis ou mui to parecidas temos o problema da identificação Sendo assim na regressão da quantidade Q sobre o preço P a equação resultante é uma função de demanda ou uma função de oferta Q e P fazem parte de ambas as funções Se tivermos apenas dados sobre Q e P e nenhuma outra informação será difí cil senão impossível identificar a regressão como uma função de demanda ou oferta É fundamental resolvermos o problema da identificação antes de procedermos à estimação porque se não sabemos o que estamos estimando a estimação per se não tem sentido No Capítulo 19 mostraremos vários métodos para a resolução do problema da identificação No Capítulo 20 consideraremos vários métodos de estimação que são projetados especificamen te para estimar modelos de equações simultâneas e observaremos suas qualidades e limitações 4 Parte ECONOBOOKParte04indb 665 23112010 072521 667 Modelos de equações simultâneas Neste e nos dois próximos capítulos abordaremos os modelos de equações simultâneas Exami naremos em particular suas características especiais sua avaliação e alguns dos problemas estatísti cos a elas associados 181 A natureza dos modelos de equações simultâneas Nas Partes 1 e 3 deste livro preocupamonos exclusivamente com os modelos uniequacionais ou seja modelos em que há uma única variável dependente Y e uma ou mais variáveis explana tórias os X Nestes a ênfase está na estimativa eou previsão do valor médio de Y condicionado aos valores fixos das variáveis X A relação de causa e efeito se houver passará nesses modelos dos X para os Y Em muitas situações porém essa relação de causa e efeito de mão única ou unidirecional não é significativa Isso ocorre se Y estiver determinado pelos X e se alguns dos X por sua vez estiverem determinados por Y Em resumo existe uma relação de mão dupla ou simultânea entre Y e alguns dos X o que torna a distinção entre variáveis dependentes e explanatórias de valor duvidoso É me lhor agregar um conjunto de variáveis que possam ser determinadas simultaneamente pelo conjunto restante de variáveis exatamente o que é feito nos modelos de equações simultâneas Nesses mode los há mais de uma equação uma para cada variável endógena ou mútua ou conjuntamente depen dente1 E diferentemente dos modelos uniequacionais nos de equações simultâneas devemos estimar os parâmetros de uma equação única sem levar em consideração as informações oferecidas por outras equações do sistema O que ocorre se os parâmetros de cada equação forem estimados por meio da aplicação por exemplo do método dos MQO desconsiderandose outras equações do sistema Lembrese de que uma das hipóteses fundamentais do método dos MQO é que as variáveis explanatórias X são não estocásticas ou se forem estocásticas aleatórias estão distribuídas independentemente do termo de erro estocástico Se nenhuma dessas condições for atendida conforme mostramos os estimadores de mínimos quadrados não apenas estarão viesados mas também inconsistentes isso quer dizer que à medida que o tamanho da amostra aumenta indefinidamente os estimadores não convergem para seus verdadeiros valores populacionais Sendo assim no seguinte sistema de equações hipotético2 1811 1 No contexto dos modelos de equações simultâneas o conjunto de variáveis dependentes é chamado de variá veis endógenas e as variáveis realmente não estocásticas ou que assim podem ser consideradas são chamadas de variáveis exógenas ou predeterminadas Veja mais sobre esse tema no Capítulo 19 2 Essa notação econômica porém autoexplanatória será generalizada em mais de duas equações no Capítulo 19 Capítulo 18 668 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais 1812 em que Y1 e Y2 são variáveis mutuamente dependentes ou endógenas X1 é uma variável exógena e u1 e u2 são os termos de erro estocásticos as variáveis Y1 e Y2 são ambas estocásticas Desse modo a menos que se possa demonstrar que a variável explanatória estocástica Y2 em 1811 esteja dis tribuída independemente de u1 e a variável estocástica explanatória Y1 em 1812 esteja distribuída independentemente de u2 a aplicação dos MQO clássicos a essas equações individualmente consi deradas conduzirá a estimativas inconsistentes No restante deste capítulo daremos alguns exemplos de modelos de equações simultâneas e mostraremos o viés envolvido na aplicação direta do método dos mínimos quadrados a esses mo delos Após examinarmos o chamado problema da identificação no Capítulo 19 discutiremos no Capítulo 20 alguns dos métodos especiais desenvolvidos para lidar com os modelos de equações simultâneas 182 Exemplos de modelos de equações simultâneas ExEmplo 181 Modelo de oferta e demanda Como se sabe o preço P de um produto e a quantidade Q vendida são determinados pela intersecção das curvas de oferta e demanda desse mesmo produto Para simplificarmos Po demos supor que as curvas de oferta e demanda sejam lineares e se acrescentarmos os ter mos de erro estocásticos u1 e u2 podemos escrever as funções de oferta e demanda empíricas como 1821 1822 em que Qd D quantidade demandada Qs D quantidade ofertada t D tempo e os Æ e Ø são os parâmetros A priori esperase que Æ1 seja negativo curva de demanda inclinada para baixo e esperase que Ø1 seja positivo curva de oferta inclinada para cima Agora não é muito difícil ver que P e Q são variáveis conjuntamente dependentes Se por exemplo u1t em 1821 muda em decorrência das mudanças sobre as outras variá veis que afetam Q dt como a renda a saúde e os gostos a curva da demanda se desloca rá para cima se u1t for positivo e para baixo se u1t for negativo Essas mudanças estão na Figura 181 Conforme apresentado na figura um deslocamento na curva da demanda altera tanto P quanto Q De maneira semelhante uma mudança em u2t decorrente de greves do clima de restrições às importações ou a exportações etc deslocará a curva da oferta afetando novamente tanto P quanto Q Em virtude da dependência simultânea entre Q e P u1t e Pt em 1821 e u2t e Pt em 1822 não podem ser independentes Portanto uma regressão de Q contra P como se observa em 1821 violaria uma importante premissa do modelo clássico de regressão linear ou seja a premissa de que não há correlação entre as variáveleis explanatórias e o termo de erro Continua Capítulo 18 Modelos de equações simultâneas 669 ExEmplo 181 Continuação Figura 181 Interdependência entre preço e quantidade P Preço P0 0 Quantidade Q0 D0 S Q Q P Preço P0 0 Quantidade Q0 D0 S Q Q D1 Q1 P1 P Preço P0 0 Q0 D0 S Q D1 Q1 P1 Quantidade ExEmplo 182 Modelo keynesiano de determinação da renda Considere o modelo keynesiano simples de determinação da renda 1823 1824 em que C D despesa de consumo Y D renda I D investimento considerado exógeno S D poupança t D tempo u D termo de erro estocástico Ø0 e Ø1 D parâmetros O parâmetro Ø1 é conhecido como propensão marginal a consumir PMC montante de gastos adicionais com consumo que resulta do aumento de um dólar na renda De acordo com a teoria econômica esperase que Ø1 situese entre 0 e 1 A Equação 1823 correspon de à função consumo estocástica e a Equação 1824 corresponde à identidade da renda nacional e indica que a renda total é igual à despesa total de consumo mais a despesa total de investimento sendo que a despesa total de investimento é igual à poupança total O dia grama da Figura 182 ilustra esse dado Continua 670 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais ExEmplo 182 Continuação Com base na função consumo postulada e na Figura 182 fica claro que C e Y são inter dependentes e que não se espera que Yt na Equação 1823 seja independente do termo de erro porque quando ut se desloca em decorrência de uma variedade de fatores incluídos no termo de erro a função consumo também se desloca Por sua vez ela afeta Yt Mais uma vez o método clássico dos mínimos quadrados não pode ser aplicado à Equação 1823 Se for aplicado os estimadores obtidos serão inconsistentes conforme demons traremos adiante Figura 182 Modelo keynesiano de determinação da renda Renda nacional Consumo investimemento CI Y Y C I C I C 0 1Y 45º 0 Ø Ø ExEmplo 183 Modelos de saláriopreço Considere o seguinte modelo de determinação de salários nominais e preços do tipo cur va de Phillips 1825 1826 em que W D taxa de variação dos salários nominais UN D taxa de desemprego P D taxa de variação dos preços R D taxa de variação dos custos do capital M D taxa de variação do preço das matériasprimas importadas t D tempo u1 u2 D termos de erro estocásticos Na medida em que a variável preço P entra na equação dos salários e a variável salário W entra na equação dos preços as duas estão conjuntamente dependentes Sendo assim esperase que essas variáveis explanatórias estocáticas estejam correlacionadas com os ter mos de erro estocásticos relevantes o que novamente torna o método de MQO não apli cável para estimar os parâmetros das duas equações individualmente Capítulo 18 Modelos de equações simultâneas 671 ExEmplo 184 O modelo IS da macroeconomia Em sua forma não estocástica o famoso modelo iS ou do equilíbrio do mercado de bens3 pode ser expresso como 1829 1828 1829 18210 18211 18212 em que Y D renda nacional C D despesas de consumo I D investimento líquido planejado ou desejado G D nível dado de gastos do governo T D impostos Yd D renda disponível r D taxa de juros Se você substituir as Equações 18210 e 1828 pela Equação 1827 substituir a equa ção resultante por C e ainda substituir as Equações 1829 e 18211 pela Equação 18212 poderá obter a equação iS 18213 em que 18214 Figura 183 A curva IS A Equação 18213 é a equação do iS ou do equilíbrio do mercado de bens ou seja ela nos dá as combinações da taxa de juros e do nível de renda de maneira que o mercado de bens estabilizase ou mantémse em equilíbrio Geometricamente a curva iS está apresenta da na Figura 183 Renda Taxa de juros Y r IS 3 3 Os pontos de equilíbrio de mercado de bens ou curva iS mostram combinações de taxas de juros e níveis de produto de modo que as despesas planejadas igualemse à renda Ver DOrNBUSCh rudiger FiSChEr Stanley Macroeconomics 3 ed Nova york McGrawhill 1984 p 102 Observe que para simplificarmos desconsidera mos o setor do comércio internacional Continua 672 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais ExEmplo 184 Continuação O que aconteceria se estimássemos a função consumo 1827 isoladamente Podería mos obter estimativas não tendenciosas eou consistentes de Ø0 e Ø1 Esse resultado é impro vável porque o consumo depende da renda disponível que depende da renda nacional Y mas esta última depende de r e G bem como de outros parâmetros que entram em º0 Por tanto a menos que tomemos em consideração todas essas influências uma simples regres são de C contra Yd conduzirá obrigatoriamente a estimativas tendenciosas eou inconsistentes de Ø0 e Ø1 ExEmplo 185 O modelo LM A outra metade do famoso paradigma iSlM é a relação lM ou equilíbrio do mercado monetário o qual apresenta as combinações de taxas de juros e nível de renda as quais ajustam o mercado monetário ou seja igualam a demanda à oferta de dinheiro Em termos algébricos o modelo em sua forma não estocástica pode ser representado como 18215 18216 18217 em que Y D renda r D taxa de juros e M D nível hipotético de moeda determinado pelo FED igualando as funções de demanda e oferta e simplificando obtemos a equação lM 18218 em que 18219 Para dado M D M a curva lM representa a relação 18218 como vemos na Figura 184 As curvas iS e lM mostram respectivamente que há toda uma gama de taxas de juros compatíveis com o equilíbrio do mercado de bens e uma gama de taxas de juros compatí veis com o equilíbrio no mercado monetário Certamente apenas uma taxa de juros e um nível de renda serão simultaneamente compatíveis com os dois equilíbrios Para obtêlos tudo o que precisamos fazer é igualar as Equações 18213 e 18218 No Exercício 184 solicitamos que você demonstre os níveis da taxa de juros e da renda simultaneamente compatíveis com o equilíbrio do mercado de bens e monetário Figura 184 A curva LM Taxa de juros LMM M Renda Y r Capítulo 18 Modelos de equações simultâneas 673 ExEmplo 186 Modelos econométricos Tem sido feito um amplo uso dos modelos de equações simultâneas nos modelos econo métricos construídos por diversos econometristas Um dos pioneiros nesse campo foi o pro fessor lawrence Klein da wharton School da Universidade da Pensilvânia Seu modelo inicial conhecido como modelo de Klein I é o seguinte 18220 em que C D despesas de consumo I D despesas de investimento G D gastos do governo P D lucros W D folha de pagamento do setor privado W D folha de pagamento do setor público K D estoque de capital T D impostos Y D renda com o desconto dos impostos t D tempo u1 u2 e u3 D termos de erro estocástico4 No modelo anterior as variáveis C I W Y P e K são consideradas conjuntamente depen dentes ou endógenas e as variáveis Pt1 K t1 e Yt1 são consideradas predeterminadas5 Ao todo há seis equações incluindo as três identidades para estudar a interdependência das seis variáveis endógenas No Capítulo 20 veremos como esses modelos econométricos podem ser estimados No momento observe que em decorrência da interdependência que há entre as variáveis endó genas em geral elas não são independentes dos termos de erro estocástico o que por conseguinte torna inadequado aplicar o método dos MQO a uma equação individual do sistema Conforme mostraremos na Seção 183 os estimadores assim obtidos são inconsis tentes não convergem aos seus verdadeiros valores populacionais mesmo quando o tama nho da amostra é grande 45 183 O viés das equações simultâneas inconsistência dos estimadores de MQO Como já foi mencionado o método dos mínimos quadrados não pode ser aplicado para estimar uma única equação inserida em um sistema de equações simultâneas se uma ou mais variáveis expla natórias estiverem correlacionadas com o termo de erro da equação pois os estimadores assim obti dos serão inconsistentes Para demonstrar isso retomemos o modelo keynesiano de determinação da 4 KlEiN l r Economic fluctuations in the United States 19211941 Nova york John wiley Sons 1950 5 O elaborador do modelo deverá especificar quais das variáveis são endógenas e quais são predeterminadas Kt 1 e Yt 1 são predeterminadas porque no período t seus valores são conhecidos Esse tema será retomado no Capítulo 19 674 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais renda apresentado no Exemplo 182 Suponha que desejemos estimar os parâmetros da função con sumo 1823 Considerando que Eut D 0 EuOt 2 æ 2 Eut utC j D 0 para j 0 e cov It ut D 0 os quais são premissas do clássico modelo de regressão linear demonstramos primeiro que Yt e ut em 1823 estão correlacionados e então provamos que ØO1 é um estimador inconsistente de Ø1 Para demonstrarmos que Yt e ut estão correlacionados procedemos da seguinte maneira Substituí mos a Equação 1823 na Equação 1824 para obtermos ou seja 1831 Agora 1832 em que nos utilizamos do fato de que Eut D 0 e de que It sendo exógeno ou predeterminado porque foi fixado antecipadamente tem como valor esperado It Sendo assim a subtração da Equação 1832 da Equação 1831 resulta em 1833 Além disso ê 1834 de onde Equações 1835 Como æ 2 é positivo por hipótese por quê a covariância entre Y e u dada na Equação 1835 está fadada a ser diferente de zero6 Como resultado esperase que Yt e ut na Equação 1823 estejam correlacionados o que viola a premissa do modelo da regressão linear clássico de que os termos de erro estão independentes ou pelo menos não correlacionados com as variáveis explanatórias Conforme observamos anteriormente os estimadores de MQO nessa situação são inconsistentes Para demonstrarmos que o estimador de MQO ØO1 é um estimador inconsistente de Ø1 em decor rência da correlação entre Yt e ut procedemos da seguinte maneira 1836 6 Será maior do que zero na medida em que Ø1 a PMC estiver entre 0 e 1 e será negativa se Ø1 for maior do que a unidade Certamente um valor de PMC maior do que a unidade não faria muito sentido econômico Desse modo na verdade é esperado que a covariância entre Yt e ut seja positiva Capítulo 18 Modelos de equações simultâneas 675 em que as minúsculas como de costume indicam desvios em relação aos valores médios da amostra Substituindo por Ct da Equação 1823 obtemos 1837 em que na última etapa utilizamos o fato de que por quê Se considerarmos a expectativa de Equação 1837 de ambos os lados obteremos 1838 Infelizmente não podemos avaliar pois o operador de expectativas é um ope rador linear Observe EAB EAEB Porém intuitivamente deveria estar claro que a menos que o termo seja zero ØO1 é um estimador viesado de Ø1 Mas não demonstramos na Equação 1835 que a covariância entre Y e u é não zero e por conseguinte ØO1 não deveria ser vie sado A resposta é não pois cov Yt ut um conceito populacional não é na verdade o mesmo que o qual é uma medida da amostra embora pelo fato de o tamanho da amostra aumentar inde finidamente esta última tenda a tornarse a primeira Mas se o tamanho da amostra aumenta indefi nidamente podemos recorrer ao conceito do estimador consistente e descobrir o que acontece com ØO1 quando n o tamanho da amostra aumenta indefinidamente Em resumo quando não podemos avaliar explicitamente o valor esperado de um estimador como na Equação 1838 podemos voltar nossa atenção para o seu comportamento em uma grande amostra Agora dizemos que um estimador é consistente se o seu limite em probabilidade7 ou plim abreviando do inglês probability limit for igual a seu verdadeiro valor populacional Sendo assim para demonstrar que ØO1 da Equação 1837 é inconsistente devemos provar que seu plim não é igual ao verdadeiro Ø1 Aplicando as regras do limite em probabilidade à Equação 1837 obtemos8 1839 em que na segunda etapa dividimos pelo número total de observações na amostra n de modo que as quantidades entre parênteses são agora a covariância amostral entre Y e u e a variância amostral de Y respectivamente Em palavras a Equação 1839 afirma que o limite em probabilidade de ØO1 é igual ao verdadeiro Ø1 mais o quociente do plim da covariância amostral entre Y e u para o plim da variância amostral de Y Agora na medida em que o tamanho da amostra n aumenta indefinidamente podese esperar que a covariância amostral entre Y e u aproximese da verdadeira covariância populacional EYt EYt ut Eut que por meio da Equação 1835 é igual a æ 21 Ø1 De maneira semelhante à medida que n tende a ser infinito a variância da amostra de Y aproximará a sua variância populacio nal por exemplo æY 2 Portanto a Equação 1838 pode ser escrita como 7 Ver Apêndice A para uma definição do limite em probabilidade 8 Como afirmamos no apêndice a o plim de uma constante por exemplo Ø1 é a mesma constante e o plim de AB D plim Aplim B Observe entretanto que EAB π EAEB 676 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais 18310 Dado que 0 Ø1 1 e que æ 2 e æY 2 são positivos é óbvio que com base na Equação 18310 plim ØO1 será sempre maior que Ø1 ou seja ØO1 superestimará o verdadeiro Ø19 Em outras palavras ØO1 é um estimador viesado e o viés não desaparecerá não importando o tamanho da amostra 184 O viés das equações simultâneas um exemplo numérico Para demonstrar alguns dos pontos indicados na seção anterior retomemos o modelo keynesiano simples de determinação da renda do Exemplo 182 e vamos prosseguir com o seguinte experimento de Monte Carlo10 Imaginemos que os valores de investimento sejam os apresentados na coluna 3 da Tabela 181 Em seguida suponhamos que Os ut assim gerados são mostrados na coluna 4 Para a função consumo 1823 imagine que os valores dos parâmetros verdadeiros sejam conhe cidos e sejam Ø0 D 2 e Ø1 D 08 Com base nos valores considerados de Ø0 e Ø1 e os gerados de ut podemos gerar os valores de renda Yt da Equação 1831 os quais são apresentados na coluna 1 da Tabela 181 Uma vez que Yt são conhe cidos e conhecendo Ø0 Ø1 e ut é possível gerar facilmente os valores de consumo Ct da Equação 1823 Os C assim gerados são apresentados na coluna 2 Desde que os verdadeiros Ø0 e Ø1 sejam conhecidos e na medida em que os erros na amostra são exatamente os mesmos que os verdadeiros erros em virtude de como formulamos o experimento de Monte Carlo se utilizássemos os dados da Tabela 181 para fazer a regressão de Ct contra Yt deveríamos obter Ø0 D 2 e Ø1 D 08 se os MQO fossem não viesados Porém por meio da Equação 1837 sabemos que não será esse o caso se o regressor Yt e o termo de erro ut estiverem correlacio nados Agora não é muito difícil verificar com base em nossos dados que a covariância amostral entre Yt e ut é Então como a Equação 1837 mostra devemos ter 1841 Ou seja ØO1 apresenta um viés superior a 002065 9 Em geral porém a direção do viés dependerá da estrutura do modelo específico e dos valores verdadeiros dos coeficientes de regressão 10 Este é um empréstimo de whiTE Kenneth J hOrSMAN Nancy G wyATT Justin B SHAZAM computer hand book for econometrics for use with basic econometrics Nova york McGrawhill 1985 p 131134 Capítulo 18 Modelos de equações simultâneas 677 Agora vamos fazer a regressão de Ct contra Yt utilizando os dados fornecidos na Tabela 181 Os resultados da regressão são 1842 Conforme esperado o Ø1 estimado é precisamente aquele previsto pela Equação 1841 Cabe observar que o Ø0 também é viesado Em geral a magnitude do viés de ØO1 depende de Ø1 æ 2 e varY e principalmente do grau de covariância entre Y e u11 Como Kenneth White et al observam é disso que trata o viés das equa ções simultâneas Diferentemente dos modelos de equação única não podemos mais afirmar que as variáveis que estão do lado direito da equação não estão correlacionadas com o termo de erro12 Devese ter em vista que esse viés permanece mesmo em grandes amostras Em decorrência das consequências potencialmente sérias da aplicação dos MQO nos modelos de equações simultâneas há um teste de simultaneidade que nos possa dizer se em determinado caso temos o problema da simultaneidade Uma versão do teste de especificação de Hausman pode ser utilizada com essa finalidade conforme analisaremos no Capítulo 19 11 Ver Equação 1835 12 Op cit p 133134 Yt 1 Ct 2 It 3 ut 4 1815697 1615697 20 03686055 1959980 1759980 20 08004084E01 2193468 1973468 22 01869357 2155145 1935145 22 01102906 2188427 1948427 24 02314535E01 2242648 2002648 24 08529544E01 2540940 2280940 26 04818807 2269523 2009523 26 06095481E01 2436465 2156465 28 07292983E01 2439334 2159334 28 07866819E01 2409215 2109215 30 01815703 2487450 2187450 30 02509900E01 2531580 2211580 32 01368398 2630465 2310465 32 06092946E01 2578235 2238235 34 02435298 2608018 2268018 34 01839638 2724440 2364440 36 01511200 2800963 2440963 36 01926739E02 3089301 2709301 38 03786015 2898706 2518706 38 02588852E02 TabEla 181 Fonte White Kenneth J Horsman Nancy G Wyatt Justin B SHAZAM Computer Handbook for Econometrics for Use with Damodar Gujarati Basic Econometrics p 132 set 1985 678 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais Some further evidence on supply and demand functions for money Journal of Finance v 19 p 240283 maio 1964 Demand and supply Functions for money in the United States Econometrica out 1964 v 32 n 4 p 476 509 OUDET Bruno A The variation of the return on stocks in periods of inflation Journal of Financial and Quantitative Analysis mar 1973 v 8 n 2 p 247258 Resumo e conclusões 1 Diferentemente dos modelos de equação única nos modelos de equações simultâneas há mais do que uma variável dependente ou endógena envolvida o que torna necessário que haja tantas equações quanto o número de variáveis endógenas 2 Uma característica exclusiva dos modelos de equações simultâneas é que a variável endógena isto é o regressando em uma equação pode aparecer como uma variável explanatória isto é regressor em uma outra equação do sistema 3 Como consequência essa variável explanatória endógena tornase estocástica e está normal mente correlacionada ao termo de erro da equação em que aparece como variável explanatória 4 Nessa situação o método clássico dos MQO não pode ser aplicado porque os estimadores obti dos não são consistentes ou seja não convergem para seus verdadeiros valores populacionais independentemente de quão grande seja o tamanho da amostra 5 O experimento de Monte Carlo apresentado no texto mostra a natureza do viés envolvido na aplicação dos MQO para estimar os parâmetros de uma equação de regressão em que o regressor está correlacionado com o termo de erro o que corresponde exatamente ao caso dos modelos de equações simultâneas 6 Dado que os modelos de equações simultâneas são frequentemente empregados especialmente nos modelos de econometria técnicas alternativas para estimação têm sido formuladas por diver sos autores Essas técnicas serão analisadas no Capítulo 20 após abordarmos o tópico problemas de identificação no Capítulo 19 item que logicamente antecede a estimação ExErcícios 181 Desenvolva um modelo de equações simultâneas para a oferta e demanda de dentistas nos Estados Unidos Especifique as variáveis endógenas e exógenas do modelo 182 Desenvolva um modelo simples da demanda e da oferta de dinheiro nos Estados Unidos e compare seu modelo com aqueles desenvolvidos por K Brunner A H Meltzer e R Tiegen 183 a Para o modelo de oferta e demanda do Exemplo 181 obtenha a expressão para o limite em probabilidade de ÆO1 b Sob quais condições esse limite em probabilidade será igual ao verdadeiro Æ1 184 Para o modelo ISLM debatido no texto encontre o nível da taxa de juros e da renda simulta neamente compatível com o equilíbrio do mercado de bens e de moeda 185 Para estudar a relação entre a inflação e o rendimento das ações ordinárias Bruno Oudet uti lizouse do seguinte modelo em que L D base monetária real per capita Y D renda real per capita I D taxa de inflação esperada Capítulo 18 Modelos de equações simultâneas 679 NIS D variável de novas emissões E D retornos das ações esperados em fins de períodos representados pelos quo cientes defasados dos preços das ações Rbt D rendimentos dos títulos de dívidas Rst D retornos das ações ordinárias a Apresente uma justificativa teórica para esse modelo e verifique se o seu raciocínio está de acordo com o de Oudet b Quais as variáveis endógenas do modelo Quais as variáveis exógenas c Você consideraria o Rbt endógeno ou exógeno 186 No artigo A Model of the Distribution of Branded Personal Products in Jamaica John U Farley e Harold J Levitt desenvolveram o seguinte modelo os produtos de cuidados pessoais considerados foram creme de barbear creme para pele papel higiênico e creme dental em que Y1 D percentual de lojas que estocam o produto Y2 D vendas em unidadesmês Y3 D índice de contato direto com o importador e o fabricante do produto Y4 D índice da atividade atacadista na área Y5 D índice de quantidade do estoque de marcas para o produto ou seja o número médio de marcas do produto estocadas pelas lojas que vendem o produto X1 D públicoalvo do produto X2 D renda per capita da localidade em que a área está situada X3 D distância entre o centro de gravidade populacional e Kingston X4 D distância entre o centro populacional e o centro atacadista mais próximo a Você conseguiria identificar as variáveis endógenas e exógenas desse modelo b Uma ou mais equações do modelo podem ser estimadas pelo método dos mínimos quadra dos Por quê 187 Para estudar a relação entre o gasto com propaganda e a venda de cigarros Frank Bass utilizou o seguinte modelo em que Y1 D logaritmo de vendas de cigarros com filtro número de cigarros dividido pela população com idade acima de 20 anos Y2 D logaritmo de vendas de cigarros sem filtro número de cigarros dividido pela população com idade acima de 20 anos Capítulo 18 Modelos de equações simultâneas 679 Journal of Marketing Research nov 1968 p 362368 A simultaneous equation regression study of advertising and sales of cigarettes Journal of Marketing Research ago 1969 v 6 p 291300 680 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais Y3 D logaritmo dos dólares gastos com a propaganda de cigarros com filtro dividido pela população com idade acima de 20 anos e pelo índice de preços da propa ganda Y4 D logaritmo dos dólares gastos com a propaganda de cigarros sem filtro dividido pela população com idade acima de 20 anos e pelo índice de preços da propa ganda X1 D logaritmo da renda pessoal disponível dividido pela população com idade acima de 20 anos e pelo índice de preços ao consumidor X2 D logaritmo do preço do maço de cigarros sem filtro dividido pelo índice de preços ao consumidor a Nesse modelo os Y são endógenos e os X são exógenos Por que o autor considra X2 exógeno b Se X2 fosse tratado como uma variável endógena como você modificaria o modelo 188 G Menges elaborou o seguinte modelo econométrico para a economia da Alemanha Ociden tal em que Y D renda nacional I D formação líquida de capital C D consumo pessoal Q D lucros P D índice do custo de vida R D produtividade industrial t D tempo u D termos de erro estocásticos a Quais das variáveis você consideraria endógenas E exógenas b Há alguma equação no sistema que possa ser estimada pelo método uniequacional dos mínimos quadrados c Qual o motivo que está por trás da inclusão da variável P na função consumo 189 L E Gallaway e P E Smith elaboraram um modelo simples para a economia dos Estados Unidos como vemos a seguir em que Y D produto nacional bruto C D despesa de consumo pessoal I D investimento privado interno bruto 680 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais MENGES G Ein ökonometriches modell der bundesrepublik deutschland vier strukturgleichungen IFO Studien 1959 v 5 p 122 A quarterly econometric model of the United States Journal of American Statistical Association 1961 v 56 p 379383 Capítulo 18 Modelos de equações simultâneas 681 G D gasto do governo mais investimento estrangeiro líquido YD D renda disponível ou com os impostos descontados M D oferta de moeda no início do trimestre Z D renda patrimonial antes do desconto dos impostos t D tempo u1 u2 e u3 D termos de erro estocásticos Todas as variáveis são medidas na forma de primeira diferença Com base nos dados trimestrais do período entre 19481957 os autores aplicaram o método dos mínimos quadrados a cada uma das equações e obtiveram os seguintes resultados a Como você justificaria o uso do método dos mínimos quadrados nesse caso b Por que os valores de R2 estão tão baixos Exercícios aplicados 1810 A Tabela 182 fornece dados sobre o Y produto interno bruto I investimento interno pri vado bruto e C despesa de consumo pessoal nos Estados Unidos durante o período entre 19702006 Todos os dados estão em bilhões de dólares de 1996 Suponha que C esteja Capítulo 18 Modelos de equações simultâneas 681 ano C I Y ano C I Y 1970 24519 4271 37719 1989 46750 9262 69814 1971 25455 4757 38986 1990 47703 8951 71125 1972 27013 5321 41050 1991 47784 8222 71005 1973 28338 5944 43415 1992 49348 8890 73366 1974 28123 5506 43196 1993 50998 9683 75327 1975 28769 4531 43112 1994 52907 10996 78355 1976 30355 5447 45409 1995 54335 11340 80317 1977 31641 6270 47505 1996 56194 12343 83289 1978 33031 7026 50150 1997 58318 13877 87035 1979 33834 7250 51734 1998 61258 15241 90669 1980 33741 6453 51617 1999 64386 16426 94703 1981 34222 7049 52917 2000 67394 17355 98170 1982 34703 6060 51893 2001 69104 15984 98907 1983 36686 6625 54238 2002 70993 15571 100488 1984 38633 8577 58136 2003 72953 16131 103010 1985 40640 8497 60537 2004 75614 17702 106758 1986 42289 8439 62636 2005 78036 18693 110034 1987 43698 8700 64751 2006 80441 19195 113194 1988 45469 8905 67427 Notas C D despesa de consumo pessoal I D Investimento privado interno bruto Y D produto interno bruto Fonte Economic Report of the President 2008 Tabela B2 TabEla 182 Despesa de consumo pessoal investimento privado interno bruto e PIB Estados Unidos 19702006 bilhões de dólares de 1996 682 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais linearmente relacionado com Y como no modelo keynesiano simples de determinação da renda do Exemplo 182 Obtenha as estimativas de MQO dos parâmetros da função consu mo Guarde os resultados para retomar os mesmos dados utilizandose dos métodos apre sentados no Capítulo 20 1811 Por meio dos dados do Exercício 1810 faça a regressão do investimento interno bruto I sobre o PIB e reserve os resultados para examinálos em um capítulo posterior 1812 Considere a identidade macroeconômica PIB Como anteriormente imagine que e seguindo o modelo do acelerador macroeconômico faça em que u e v são termos de erro Com base nos dados do Exercício 1810 estime o modelo acelerador e reserve os resultados para estudos posteriores 1813 Demanda e oferta de gasolina A Tabela 183 que se encontra no site do livro fornece dados sobre algumas das variáveis que determinam a demanda e a oferta de gasolina nos Estados Unidos entre janeiro de 1978 e agosto de 2002 As variáveis são preço da gasolina centa vos por galão quantidade de gasolina milhares de barris diários sem chumbo renda pes soal bilhões de dólares vendas de carros milhões de carros por ano a Elabore um modelo MQO de oferta e demanda para o consumo de gasolina b Quais as variáveis endógenas e exógenas no modelo a c Se você estimar as funções de demanda e oferta desenvolvidas por você por meio dos MQO seus resultados serão confiáveis Por quê d Guarde as estimativas MQO de suas funções de demanda e oferta para retomálas após discu tirmos o Capítulo 20 1814 A Tabela 184 encontrada no site do livro oferece dados macroeconômicos sobre diversas variáveis para a economia americana nos trimestres 1951I a 2000IV As variáveis são as seguintes Ano D data Tri D trimestre PIBR D PIB real bilhões de dólares GCR D gastos com consumo real IRSP D investimento real do setor privado DRG D despesa real do go verno RPDR D renda pessoal disponível real IPCU D índice de preços ao consumidor M1 D estoque nominal de moeda TLT D média trimestal da taxa de letras do Tesouro de final do mês dos últimos 90 dias Pop D população em milhões interpolar os números do final do ano utilizando a taxa de crescimento constante por trimestre Infl D taxa de inflação a pri meira observação foi perdida e TJP D taxa de juros real posterior D TLTInfl a primeira observação foi perdida Utilizandose esses dados elabore um modelo macroeconômico simples da economia norteamericana Você deverá avaliar esse modelo no Capítulo 20 682 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais Esses dados foram extraídos do site de SChMiDT Stephen J Econometrics Nova york McGrawhill 2005 Veja www mhhecomeconomics Esses dados pertencem originalmente ao Department of Commerce Bureau of Economic Analysis eles foram extraídos de wwweconomagiccom e reproduzidos por Greene william h Econometric analysis 6 ed 2008 Tabela F51 p1083 683 O problema da identificação Neste capítulo consideramos a natureza e o significado do problema da identificação O ponto central do problema de identificaçao é o seguinte retomar o modelo de oferta e demanda introduzido na Seção 182 Suponha que tenhamos dados apenas da série temporal Q e P e nenhuma informação adicional como renda do consumidor preço vigente no período prévio e condições climáticas O problema da identificação consiste em procurar uma resposta para esta pergunta oferecidos apenas os dados de P e Q como saberemos se estamos estimando a função demanda ou a função oferta Como alternativa se pensarmos que estamos ajustando uma função demanda como garantiremos que ela é de fato a função demanda que estimamos e não outra coisa qualquer Um momento de reflexão revelará que uma resposta à pergunta anterior é necessária antes que alguém resolva estimar os parâmetros de nossa função demanda Neste capítulo demonstraremos como o problema da identificação é resolvido Primeiro introduziremos algumas poucas notações e definições e então ilustraremos o problema da identificação com vários exemplos Isso será seguido de regras que podem ser utilizadas para descobrir se uma equação em um modelo de equação simul tânea está identificada isto é se corresponde à relação que realmente estamos estimando seja ela a função demanda ou função oferta ou ainda outra coisa qualquer 191 Notações e definições Para facilitarmos nossa discussão introduziremos as seguintes notações e definições O modelo geral de M equações com M endógenas ou conjuntamente dependentes pode ser escri to como a Equação 1911 1911 em que Y1 Y2 YM D M variáveis endógenas ou conjuntamente dependentes X1 X2 XK D K variáveis predeterminadas uma dessas variáveis X pode ser igual a 1 para permitir o termo de intercepto em cada equação Capítulo 19 684 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais u1 u2 uM D M número total de observações de distúrbios estocásticos t D 1 2 T D número total de observações Ø D coeficientes das variáveis endógenas D coeficientes das variáveis predeterminadas Observe que nem toda variável precisa aparecer em cada equação De fato vemos na Seção 192 que isso não deve acontecer se uma equação puder ser identificada Como mostra a Equação 1911 as variáveis que introduzem um modelo de equação simultânea são de dois tipos endógenas isto é aquelas cujos valores são determinadas no modelo e predeter minadas isto é aquelas cujos valores são determinadas fora do modelo As variáveis endógenas são tratadas como estocásticas enquanto as predeterminadas são tratadas como não estocásticas As variáveis predeterminadas dividemse em duas categorias exógenas as quais podem ser cor rentes ou defasadas e endógenas defasadas Então X1t é uma variável exógena do tempo presente enquanto X1t1 é uma variável exógena defasada com uma defasagem em um período de tempo Yt1 é uma variável endógena defasada com uma defasagem em um período de tempo mas posto que o valor de Y1t1 é conhecido no momento atual t ele é observado como não estocástico sendo portanto uma variável predeterminada1 Em resumo variáveis exógenas correntes exógenas defasa das e endógenas defasadas são consideradas predeterminadas seus valores não são determinados pelo modelo no período atual É tarefa do formulador do modelo especificar quais variáveis são endógenas e quais são prede terminadas Embora variáveis não econômicas como temperatura e chuvas sejam claramente exó genas ou predeterminadas o formulador do modelo deve ter grande cuidado na classificação de variáveis econômicas como endógenas ou predeterminadas ele deve defender a classificação com bases teóricas ou apriorísticas Mais à frente neste capítulo forneceremos um teste estatístico de exogeneidade As equações que aparecem em 1911 são conhecidas como estruturais ou comportamentais porque podem retratar a estrutura de um modelo econômico de uma economia ou o comportamento de um agente econômico por exemplo consumidor ou produtor Os Ø e são conhecidos como parâmetros estruturais ou coeficientes Com base nas equações estruturais podese solucionar as variáveis endógenas M e derivar as equações de forma reduzida e os coeficientes de forma reduzida associados Uma equação de forma reduzida é aquela que expressa uma variável endógena apenas em termos das variáveis predeterminadas e os distúrbios estocásticos Para ilustrar considere o modelo keynesiano de de terminação de renda que apresentamos no Capítulo 18 1823 1824 Nesse modelo C consumo e Y renda são as variáveis endógenas e I gasto com investimento é considerada uma variável exógena Ambas as equações são estruturais de modo que a Equação 1824 é uma identidade Como normalmente ocorre presumimos que o Ø1 o PMC fique entre 0 e 1 Se a Equação 1823 for substituída pela Equação 1824 obteremos após manipulação algé brica simples 1912 1 Supomos implicitamente aqui que os distúrbios estocásticos os u estão serialmente não correlacionados Se esse não for o caso Yt1 será correlacionado com o termo de erro do período corrente ut Portanto não pode mos tratálo como predeterminado Capítulo 19 O problema da identificação 685 em que 1913 A Equação 1912 é uma equação na forma reduzida ela expressa a variável endógena Y ape nas como uma função da variável exógena I ou predeterminada e do termo de distúrbio estocástico u 50 e 51 são os coeficientes associados na forma reduzida Observe que esses coeficientes na forma reduzida são combinações não lineares dos coeficientes estruturalis Ao substituirmos o valor Y da Equação 1912 por C da Equação 1823 obteremos outra equação na forma reduzida 1914 em que 1915 Os coeficientes na forma reduzida como 51 e 53 são também conhecidos como multiplicado res de impacto ou de curto prazo porque medem o impacto imediato sobre a variável endógena de uma mudança de unidade no valor da variável exógena2 Se no modelo keynesiano anterior o gasto com investimento é aumentado por por exemplo 1 e se o PMC presumese ser 08 então da Equa ção 1913 obtemos 51 D 5 Esse resultado significa que aumentar o investimento em 1 imediata mente levará isto é no período de tempo atual a um aumento na renda de 5 isto é um aumento quintuplicado De forma semelhante sob as condições presumidas a Equação 1915 mostra que 53 D 4 significando que o aumento de 1 no gasto em investimento levará imediatamente a um aumento de 4 no gasto em consumo No contexto dos modelos econométricos equações como a 1824 ou quantidade demandada igual à quantidade ofertada são conhecidas como condições de equilíbrio A identidade 1824 afirma que a renda agregada Y deve ser igual ao consumo agregado isto é o gasto em con sumo mais o gasto em investimento Quando o equilíbrio é atingido as variáveis endógenas assu mem seus valores de equilíbrio3 Observe uma característica interessante das equações de forma reduzida Visto que apenas as va riáveis predeterminadas e os distúrbios estocásticos aparecem nos lados direitos dessas equações e posto que as variáveis predeterminadas são presumidas como não correlacionadas com os termos de distúrbio o método MQO pode ser aplicado para estimar os coeficientes das equações de forma redu zida as 5 Com base nos coeficientes de forma reduzida estimados podese estimar os coeficientes estruturais os Ø como mostrado anteriormente Esse procedimento é conhecido como mínimos qua drados indiretos MQI e os coeficientes estruturais estimados são chamados de estimativas MQI 2 Nos modelos econométricos as variáveis exógenas têm um papel crucial Muito frequentemente tais variáveis estão sob o controle direto do governo São exemplos a taxa de impostos pessoais e corporativos subsídios segurodesemprego etc 3 Para mais detalhes veja KMENTA Jan Elements of econometrics 2 ed Nova york Macmillan 1986 p 723731 686 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais Estudaremos o método dos MQI em detalhes no Capítulo 20 Por enquanto observe que uma vez que os coeficientes de forma reduzida podem ser estimados pelo método dos MQO e uma vez que esses coeficientes são combinações de coeficientes estruturais existe a possibilidade de que os coefi cientes estruturais possam ser recuperados por meio dos coeficientes de forma reduzida e é a esti mação dos parâmetros estruturais que em última análise nos interessa Como se podem recuperar os coeficientes estruturais por meio dos coeficientes de forma reduzida A resposta é dada na Seção 192 uma resposta que revela o ponto central do problema da identificação 192 O problema da identificação Por problema da identificação entendemos a possibilidade de obter os parâmetros de uma equa ção estrutural por meio dos coeficientes estimados na forma reduzida Se isso puder ser feito dizemos que a equação particular é identificada Do contrário dizemos que a equação em consideração é não identificada ou subidentificada Uma equação identificada pode tanto ser exatamente ou completamente ou precisamente identi ficada ou sobreidentificada Dizse que é exatamente identificada se valores numéricos exatos dos parâmetros estruturais podem ser obtidos Dizse ser sobreidentificada se mais do que um valor nu mérico pode ser obtido por alguns dos parâmetros das equações estruturais As circunstâncias sob as quais cada um desses casos ocorre serão expostas em seguida O problema da identificação surge porque diferentes grupos de coeficientes estruturais podem ser compatíveis com o mesmo grupo de dados Em outras palavras uma dada equação de forma reduzida pode ser compatível com diferentes equações estruturais ou diferentes hipóteses modelos e pode ser difícil afirmar qual hipótese específica modelo estamos investigando No restante desta seção examinaremos vários exemplos para mostrar a natureza do problema da identificação subidentificação Considere mais uma vez o modelo de oferta e demanda 1821 e 1822 juntamente com o market clearing condição de equilíbrio de mercado em que a demanda é igual à oferta Pelo marketclearing obtemos 1921 Solucionando a Equação 1921 obtemos os preços de equilíbrio 1922 em que 1923 1924 Substituindo Pt da Equação 1922 pela Equação 1821 ou 1822 obtemos a seguinte quanti dade de equilíbrio 1925 em que 1926 Capítulo 19 O problema da identificação 687 1927 Observe que os termos de erro vt e wt são combinações lineares dos termos de erro originais u1 e u2 As Equações 1922 e 1925 são equações na forma reduzida Agora nosso modelo de oferta e demanda contém quatro coeficientes estruturais Æ0 Æ1 Ø0 e Ø1 mas não há um caminho único para estimálos Por quê A resposta está nos coeficientes de forma reduzida dados nas Equações 1923 e 1926 Esses coeficientes contêm todos os quatro parâmetros estruturais mas não há maneira pela qual as quatro incógnitas estruturais possam ser estimadas com base apenas em dois coeficientes de forma reduzida Lembrese de que na álgebra do ensino médio aprendemos que para estimar quatro incógnitas devemos ter quatro equações independentes e em geral para estimar k incógnitas de vemos ter k equações independentes Sendo assim se executarmos a regressão na forma reduzida 1922 e 1925 veremos que não há variáveis explanatórias apenas as constantes e essas sim plesmente fornecerão os valores médios de P e Q por quê O que tudo isso significa é que apresentados os dados da série temporal em P preço e Q quan tidade e nenhuma outra informação não há outra forma de o pesquisador poder garantir se está esti mando a função demanda ou a função oferta Isto é um dado Pt e um Qt representam o ponto de intersecção das curvas de oferta e demanda apropriadas porque a condição de equilíbrio é que a de manda seja igual à oferta Isso pode ser observado com clareza no diagrama de dispersão exibido na Figura 191 A Figura 191a apresenta poucos pontos de dispersão relacionando Q a P Cada ponto de dispersão representa a intersecção de uma curva de demanda e de oferta como mostra a Figura 191b Agora considere um único ponto como o da Figura 191c Não há como termos certeza sobre qual curva de oferta e demanda de toda uma família de curvas exibidas naquele painel gerou aquele ponto Certa mente alguma informação adicional sobre a natureza das curvas de oferta e demanda fazse necessá ria Por exemplo se a curva de demanda deslocase ao longo do tempo devido à mudança na renda gostos etc mas a curva de oferta permanece relativamente estável como na Figura 191d os pontos Figura 191 Funções hipotéticas de oferta e demanda e o problema da identificação 0 Quantidade a Q P Preço 0 Quantidade b Q P Preço D D D D S S S S S1 D1 S3 S2 D3 D2 0 Quantidade c Q P Preço 0 Quantidade e Q P Preço 0 Quantidade d Q P Preço D S1 D5 S S5 S4 S3 S2 D3 D1 D2 D4 688 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais de dispersão traçam uma curva de oferta Nessa situação dizemos que a curva de oferta é identifica da Igualmente se a curva de oferta muda ao longo do tempo devido às mudanças nas condições climáticas no caso das commodities agrícolas ou outros fatores externos mas a curva de demanda permanece relativamente estável como na Figura 191e os pontos de dispersão traçam uma curva de demanda Nesse caso dizemos que a curva de demanda é identificada Há uma alternativa e talvez uma maneira mais esclarecedora de observar o problema da identifi cação Suponha que multipliquemos a Equação 1821 por 0 1 e a Equação 1822 por 1 para obter as seguintes equações observe eliminamos os sobrescritos de Q 1928 1929 A soma dessas duas equações resulta na seguinte combinação linear das equações de oferta e demanda originais 19210 em que 19211 A equação falsa ou híbrida 19210 é empiricamente indistinguível tanto da Equação 1821 ou da Equação 1822 porque elas envolvem a regressão de Q e P Se temos os dados da série tem poral em P e Q apenas quaisquer das Equações 1821 1822 ou 19210 podem ser compatíveis com os mesmos dados Em outras palavras os mesmos dados podem ser compatíveis com as hipó teses 1821 1822 ou 19210 e não é possível dizer qual dessas hipóteses estamos testando Para que uma equação seja identificada isto é para que seus parâmetros sejam estimados devese mostrar que o conjunto de dados apresentado não produzirá uma equação estrutural que pareça simi lar na aparência àquela na qual estamos interessados Se passamos a estimar a função demanda devemos mostrar que os dados oferecidos não são consistentes com a função oferta ou com alguma equação híbrida identificação precisa ou exata Não podemos identificar a função demanda ou a função oferta vista anteriormente porque as mes mas variáveis P e Q estão presentes em ambas as funções e não há informação adicional como indica do na Figura 191d ou e Mas suponha que consideremos o seguinte modelo de oferta e demanda 19212 19213 em que I D renda do consumidor uma variável exógena e todas as outras variáveis são definidas como anteriormente Perceba que a única diferença entre o modelo anterior e nosso modelo de oferta e demanda origi nal é que há uma variável adicional na função demanda em outras palavras a renda Com base na teoria econômica da demanda sabemos que a renda é normalmente um determinante importante da demanda para a maioria dos bens e serviços Sua inclusão na função demanda dará alguma informação adicional sobre o comportamento do consumidor Para a maioria das commodities esperase que a renda tenha um efeito positivo sobre o consumo Æ2 0 Por meio da condição de equilíbrio quantidade demandada D quantidade ofertada temos 19214 Capítulo 19 O problema da identificação 689 Solucionar a Equação 19214 fornece o seguinte valor de equilíbrio de Pt 19215 em que o coeficiente de forma reduzida é 19216 e Substituindo o valor de equilíbrio de Pt na função demanda precedente ou na função oferta obte mos a seguinte quantidade de equilíbrio 19217 em que 19218 e Uma vez que 19215 e 19217 são ambas equações na forma reduzida o método de mínimos quadrados ordinários MQO pode ser aplicado para estimar seus parâmetros Agora o modelo de oferta e demanda 19212 e 1923 contém cinco coeficientes estruturais Æ0 Æ1 Æ2 Ø0 e Ø1 Mas há apenas quatro equações para estimálos em outras palavras os quatro coeficientes de forma redu zida 50 51 52 53 dados nas Equações 19216 e 19218 Portanto uma única solução de todos os coeficientes estruturais não é possível Contudo podese mostrar que os parâmetros da função oferta podem ser identificados estimados porque 19219 Mas não há uma única maneira de estimar os parâmetros da função demanda ela permanece subidentificada Observe que o coeficiente estrutural Ø1 é uma função não linear dos coeficientes de forma reduzida que coloca alguns problemas quando é necessário estimar o erro padrão da estimada Ø1 como poderemos ver no Capítulo 20 Para verificarmos que a função demanda 19212 não pode ser identificada estimada vamos multiplicála por 0 1 e 19213 por 1 e somálas para obter a seguinte equação hí brida 19220 690 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais em que 19221 e A equação 19220 é observacionalmente indistinguível da função demanda 19212 embora seja distinguível da função oferta 19213 que não contém a variável I como uma variável explana tória Portanto a função demanda permanece não identificada Observe um fato interessante é a presença de uma variável adicional na função demanda que nos habilita a identificar a função oferta Por quê A inclusão da variável renda na equação da demanda fornecenos alguma informação adicional sobre a variabilidade da função como indicado na Figura 191d A figura mostra como a intersecção da curva de oferta estável com a mudança da curva de demanda por conta das mudanças na renda habilitanos a traçar identificar a curva de oferta Como será apresentado em breve com frequência a possibilidade de identificar uma equação depen de de ela excluir uma ou mais variáveis que estão incluídas em outras equações no modelo Mas consideremos o seguinte modelo de oferta e demanda 19212 19222 em que a função demanda permanece como antes mas a função oferta inclui uma variável explanatória adicional o preço defasado em um período A função oferta postula que a quantidade de uma commodity ofertada depende do período de preço atual e prévio um modelo frequentemente utilizado para expli car a oferta de muitas commodities agrícolas Observe que Pt1 é uma variável predeterminada porque seu valor é conhecido no período t Pelo mecanismo marketclearing temos 19223 Solucionando essa equação obtemos o seguinte preço de equilíbrio 19224 em que 19225 Substituindo o preço de equilíbrio na equação de demanda ou de oferta obtemos a corresponden te quantidade de equilíbrio 19226 Capítulo 19 O problema da identificação 691 em que os coeficientes de forma reduzida são 19227 e O modelo de oferta e demanda apresentado nas Equações 19212 e 19222 contém seis coeficientes estruturais Æ0 Æ1 Æ2 Ø0 Ø1 e Ø2 e há seis coeficientes de forma reduzida 50 51 52 53 54 e 55 para estimálos Os parâmetros de ambas as equações de oferta e demanda podem ser identificados e o sistema como um todo pode ser identificado No Exercício 192 soli citase que o leitor expresse os seis coeficientes estruturais em termos dos seis coeficientes de for ma reduzida dados previamente para mostrar que a estimativa única do modelo é possível Para verificarmos como as funções de oferta e demanda anteriores são identificadas podemos também recorrer ao artifício de multiplicar a equação de demanda 19212 por 0 1 e a equação de oferta 19222 por 1 e somálas para obter uma equação híbrida Essa equação con terá as variáveis predeterminadas It e Pt1 portanto ela será observacionalmente diferente tanto da demanda quanto da equação de oferta porque a anterior não contém Pt1 e as últimas não contém It superidentificação Para certos bens e serviços a renda e a riqueza do consumidor são importantes determinantes da demanda Vamos modificar a função demanda 19212 como se segue mantendo a função oferta como antes 19228 19222 em que além das variáveis já definidas R representa riqueza para a maioria dos bens e serviços es perase que a riqueza bem como a renda tenha um efeito positivo sobre o consumo Igualando demanda e oferta obtemos o preço e a quantidade de equilíbrio seguintes 19229 19230 em que 19231 692 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais O modelo de oferta e demanda anterior contém sete coeficientes estruturais mas há oito equações para estimálos os oito coeficientes de forma reduzida dados na Equação 19231 isto é o núme ro de equações é maior do que o número de incógnitas Como resultado uma única estimativa de todos os parâmetros de nosso modelo não é possível o que pode ser facilmente demonstrado Por meio dos coeficientes de forma reduzida podemos obter 19232 ou 19233 isto é há duas estimativas de coeficiente de preço na função oferta e não há garantia de que esse dois valores ou soluções serão idênticos4 Além disso uma vez que Ø1 aparece nos denominadores de todos os coeficientes de forma reduzida a ambiguidade na estimação de Ø1 será transmitida para outras es timativas também Por que a função oferta foi identificada no sistema 19212 e 19222 mas não no sistema 19228 e 19222 embora em ambos os casos a função oferta permaneça a mesma A resposta é que temos muita informação ou excesso de informações para identificar a curva de oferta Essa situação é o oposto do caso da subidentificação na qual há muito pouca informação O excesso de informação resulta do fato de que no modelo 19212 e 19222 a exclusão da variável renda por meio da função oferta era o suficiente para identificála mas no modelo 19228 e 19222 a função oferta exclui não apenas a variável renda mas também a variável riqueza Em outras palavras no úl timo modelo incluímos muitas restrições na função oferta ao requerêla para excluir mais variáveis do que o necessário para identificála Contudo essa situação não implica que a superidentificação seja necessariamente má porque veremos no Capítulo 20 como podemos lidar com o problema do excesso de informação ou do excesso de restrições Agora já vimos todos os casos Como a discussão anterior mostra uma equação em um modelo de equação simultânea pode ser subidentificada ou identificada tanto super como exatamente O mo delo como um todo é identificado se cada equação nele é identificada Para assegurarmos a identifi cação lançamos mão das equações de forma reduzida Mas na Seção 193 consideraremos uma alternativa e talvez um método mais rápido para determinar se uma equação em um modelo de equa ção simultânea é ou não identificada 193 Regras para a identificação Como demonstram os exemplos na Seção 192 em princípio é possível utilizarse de equações de forma reduzida para determinar a identificação de uma equação em um sistema de equações simultâ neas Mas esses exemplos também mostram quanto o processo pode ser trabalhoso e demorado Fe lizmente não é essencial utilizar tal procedimento As chamadas condições de posto de identificação auxiliam na tarefa ao fornecer uma rotina sistemática Para entendermos as condições de posto introduzimos as seguintes notações M D número de variáveis endógenas no modelo m D número de variáveis endógenas em uma dada equação K D número de variáveis predeterminadas no modelo incluindo o intercepto k D número de variáveis predeterminadas em uma dada equação 4 Note a diferença entre sub e superidentificação No caso anterior é impossível obter estimativas dos parâmetros estruturais enquanto no último caso podem haver muitas estimativas de um ou mais coeficientes estruturais Capítulo 19 O problema da identificação 693 a condição de posto de identificação5 Uma condição de identificação necessária mas não suficiente conhecida como condição de posto pode ser enunciada de duas formas diferentes mas equivalentes como a seguir a condição de identificação necessária bem como suficiente será apresentada mais à frente Definição 191 Em um modelo de M equações simultâneas para que uma equação seja identificada devese excluir ao menos M 1 das variáveis endógenas e também predeterminadas que aparecem no modelo Se excluirmos exatamente M 1 das variáveis a equação será iden tificada Se excluirmos mais do que M 1 variáveis ela será superidentificada Definição 192 Em um modelo de M equações simultâneas para que uma equação seja identificada o número de variáveis predeterminadas excluídas da equação não deve ser menor do que o número de variáveis endógenas incluídas naquela equação menos 1 isto é 1931 Se K k D m 1 a equação é assim identificada mas se K k m 1 ela é superidentificada No Exercício 191 solicitamos ao leitor que prove que as duas definições anteriores de identifica ção são equivalentes Para ilustrarmos a condição de posto voltemos aos nossos exemplos anteriores ExEmplo 191 1821 1822 Este modelo possui duas variáveis endógenas P e Q e nenhuma variável predeterminada Para serem identificadas cada uma das equações deve excluir ao menos a variável M 1 D 1 Uma vez que não é esse o caso nenhuma equação é identificada ExEmplo 192 19212 19213 Neste modelo Q e P são endógenas e I é exógena Aplicando a condição de posto dada na Equação 1931 vemos que a função demanda não é identificada Por outro lado a função oferta é identificada porque exclui exatamente a M 1 D 1 variável It ExEmplo 193 19212 19222 Dado que Pt e Qt são endógenas e It e Pt1 são predeterminadas a Equação 19212 exclui exatamente uma variável Pt1 e a Equação 19222 também exclui exatamente uma variável It Portanto cada equação é identificada pela condição de posto O modelo como um todo é identificado 5 O termo ordem referese à ordem de uma matriz isto é o número de linhas e colunas presentes em uma ma triz Veja o Apêndice B 694 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais ExEmplo 194 19228 19222 Neste modelo Pt e Qt são endógenas e It Rt e Pt1 são predeterminadas A função deman da exclui exatamente uma variável Pt1 e portanto pela condição de posto ela é exatamente identificada Mas a função oferta exclui duas variáveis It e Rt e desse modo ela é sobreiden tificada Como observado anteriormente neste caso há duas formas de estimar Ø1 o coefi ciente da variável preço Observe aqui uma pequena complicação Pela condição de posto a função demanda é identificada Mas se tentarmos estimar os parâmetros dessa equação com base nos coefi cientes de forma reduzida dados na Equação 19231 as estimativas não serão únicas porque Ø1 utilizado nos cálculos engloba dois valores e devemos decidir qual deles é apro priado Essa dificuldade pode ser eliminada porque conforme demonstrado no Capítulo 20 em casos de superidentificação o método de mínimos quadrados indiretos não é apropriado e deve ser descartado em favor de outros Um deles é o dos mínimos quadrados em dois estágios que discutiremos amplamente no Capítulo 20 Como mostram os exemplos anteriores a identificação de uma equação em um modelo de equações simultâneas é possível se essa equação exclui uma ou mais variáveis presentes em outras equações do modelo Essa situação é conhecida como critério de exclusão de variáveis ou critério de restrições zero os coeficientes de variáveis que não aparecem em uma equação são considerados com valores zero Esse critério é o método mais utilizado para assegurar ou de terminar a identificação de uma equação Entretanto note que o critério de restrições zero é baseado em uma expectativa a priori ou teórica de que certas variáveis não aparecem em deter minada equação Depende do pesquisador explicar claramente porque ele espera que certas variáveis apareçam em algumas equações e não em outras a condição de posto de identificação6 A condição de posto discutida anteriormente é necessária mas não suficiente para a identificação mesmo se for satisfeita pode acontecer de uma equação não ser identificada No Exemplo 192 a equação da oferta foi identificada pela condição de posto porque excluiu a variável renda It que apareceu na fun ção demanda Mas a identificação só ocorrerá se apenas Æ2 o coeficiente de It na função demanda não for zero isto é se a variável renda não só provavelmente mas de fato introduzir a função demanda Em um sentido amplo mesmo se a condição de posto K k m 1 é satisfeita por uma equa ção ela não pode ser identificada pois as variáveis predeterminadas excluídas desta equação mas presentes no modelo podem não ser todas independentes para que não possa haver a correspondên cia uma a uma entre os coeficientes estruturais os Ø e os coeficientes de forma reduzida o 5 Em outras palavras não somos capazes de estimar os parâmetros estruturais dos coeficientes de forma reduzida como demonstraremos em breve Precisamos de uma condição que seja necessá ria e suficiente para a identificação Isso é fornecido pela condição de posto de identificação que podemos estabelecer da seguinte forma A condição de posto de identificação Em um modelo que contenha M equações em M variáveis endógenas uma equação é identificada se e apenas se ao menos um determinante diferente de zero de ordem M 1 M 1 puder ser construído por meio dos coeficientes das variáveis tanto endógenas quan to predeterminadas excluídas da equação especificada mas incluídas em outras equações do modelo 6 O termo posto referese ao posto de uma matriz e é dado pela maior matriz de ordem quadrada contida na matriz apresentada cujo determinante é não zero Por outro lado o posto de uma matriz é o maior número de linhas ou colunas linearmente independentes daquela matriz Veja o Apêndice B Capítulo 19 O problema da identificação 695 Como uma ilustração da condição de posto de identificação considere o seguinte sistema de equa ções simultâneas no qual as variáveis Y são endógenas e as X predeterminadas7 1932 1933 1934 1935 Para facilitarmos a identificação vamos escrever o sistema anterior na Tabela 191 o qual é autoexpli cativo Primeiro aplicaremos a condição de posto de identificação como exibido na Tabela 192 Pela condição de posto cada equação é identificada Vamos checar novamente com a condição de posto Considere a primeira equação que exclui as variáveis Y4 X2 e X3 isso é representado pelos zeros na primeira linha da Tabela 191 Para essa equação ser identificada devemos obter ao menos um de terminante não zero de ordem 3 3 dos coeficientes das variáveis excluídas dessa equação mas in cluída em outras equações Para obter o determinante primeiro obtemos a matriz relevante dos coeficientes das variáveis Y4 X2 e X3 incluídas nas outras equações Neste caso há apenas uma matriz desse tipo chamada A definida assim 1936 Podese ver que o determinante desta matriz é zero 1937 Uma vez que o determinante é zero o posto da matriz 1936 estipulado por ΩA é menor do que 3 Então a Equação 1932 não satisfaz a condição de posto e portanto não é identificada 7 O sistema de equações simultâneas apresentado na Equação 1911 pode ser demonstrado da seguinte forma alternativa que pode ser conveniente para as manipulações da matriz TabEla 191 TabEla 192 Equação no No de variáveis predeterminadas excluídas K k No de variáveis endógenas incluídas menos uma m 1 identificada 1932 2 2 Exatamente 1933 1 1 Exatamente 1934 1 1 Exatamente 1935 2 2 Exatamente 696 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais Como observado a condição de posto é necessária e suficiente para a identificação Sendo as sim embora a condição de posto mostre que a Equação 1932 é identificada a condição de posto mostra que ela não é Aparentemente as colunas ou linhas da matriz A dadas na Equação 1936 não são linearmente independentes significando que há alguma relação entre as variá veis Y4 X2 e X3 Como resultado não temos informações suficientes para estimar os parâmetros da Equação 1932 as equações de forma reduzida para o modelo anterior mostrarão que não é possível obter os coeficientes estruturais da equação com base nos coeficientes na forma reduzida O leitor deve verificar que pela condição de posto as Equações 1933 e 1934 também não são identificadas mas a 1935 é Como demonstra a discussão anterior a condição de posto nos diz se a equação em consideração é identificada ou não enquanto a condição de posto nos diz se ela é exatamente identificada ou su peridentificada Para aplicarmos a condição de posto podemos proceder da seguinte forma 1 Escreva o sistema em uma forma tabular conforme apresentado na Tabela 191 2 Cancele os coeficientes da linha em que a equação em questão aparece 3 Cancele também as colunas correspondentes aos coeficientes no passo 2 que são diferentes de zero 4 As entradas deixadas na tabela oferecerão assim apenas os coeficientes das variáveis incluídas no sistema mas não na equação em consideração Dessas entradas forme todas as matrizes pos síveis como A de ordem M 1 e obtenha os determinantes correspondentes Se pudermos en contrar pelo menos um determinante diferente de zero a equação em questão será exata ou super identificada O posto da matriz por exemplo A neste caso é exatamente igual a M 1 Se todas determinantes possíveis M 1 M 1 são zero o posto da matriz A é menor que M 1 e a equação sob investigação não é identificada Nossa análise sobre as condições de posto de identificação leva aos seguintes princípios gerais de identificação de uma equação estrutural em um sistema de M equações simultâneas 1 Se K k m 1 e o posto da matriz A é M 1 a equação é superidentificada 2 Se K k D m 1 e o posto da matriz A é M 1 a equação é exatamente identificada 3 Se K k m 1 e o posto da matriz A é menor do que M 1 a equação é subidentificada 4 Se K k m 1 a equação estrutural não é identificada O posto da matriz A neste caso tende a ser menor do que M 1 Por quê De agora em diante quando falarmos sobre identificação queremos significar identificação exata ou superidentificação Não há razão para considerar não identificadas ou subidentificadas as equa ções porque não importa quão extensa é a base de dados os parâmetros estruturais não podem ser estimados Além disso a maioria dos sistemas de equações simultâneas em economia e finanças são mais superidentificados do que subidentificados e portanto não precisamos ficar muito preocupados com a subidentificação Contudo como será mostrado no Capítulo 20 os parâmetros das equações superidentificadas e exatamente identificadas podem ser estimados Qual condição deveríamos utilizar na prática ordem ou posto Para grandes modelos de equação simultânea aplicar a condição de posto é um risco formidável Então como Harvey observa Felizmente a condição de posto é normalmente suficiente para assegurar a identificabilidade e embo ra seja importante estar atento à condição de posto uma falha na verificação dela raramente resulta em desastre8 8 hArVEy AndrewThe econometric analysis of time series 2 ed Cambridge Mass The MiT Press 1990 p 328 Capítulo 19 O problema da identificação 697 194 Um teste de simultaneidade9 Se não há equações simultâneas ou problema de simultaneidade os estimadores MQO produ zem estimadores consistentes e eficientes Por outro lado se há simultaneidade os estimadores MQO não são sequer consistentes Na presença da simultaneidade como mostraremos no Capítulo 20 os métodos de mínimos quadrados em dois estágios MQ2E e variáveis instrumentais VI ofere cerão estimadores consistentes e eficientes Curiosamente se aplicarmos esses métodos alternativos quando não há de fato simultaneidade estes nos oferecerão estimadores consistentes mas não efi cientes isto é com menor variância Essa discussão sugere que devemos verificar o problema da simultaneidade antes de descartarmos os MQO em favor das alternativas Como mostramos o problema da simultaneidade surge porque alguns dos regressores são endó genos e costumam ser correlacionados com o termo de distúrbio ou erro Para que um teste de simulta neidade seja essencial ele precisa definir se um regressor endógeno está correlacionado com o termo de erro Se assim o for o problema da simultaneidade existirá no qual os casos alternativos aos MQO devem ser encontrados do contrário podemos utilizar os MQO Para descobrirmos qual é o caso em uma situação concreta usemos o teste de especificação de erro de Hausman Teste de especificação de Hausman Uma versão do teste de especificação de erro de Hausman usada para testar o problema da simultaneidade é explicada da seguinte maneira10 Para ordenar as ideias considere o modelo de duas equações 1941 1942 em que P D preço Q D quantidade I D renda R D riqueza u D termos de erro Presuma que I e R sejam exógenos certamente P e Q são endógenos Agora considere a função oferta 1942 Se não há o problema da simultaneidade isto é P e Q são mutuamente independentes Pt e u2t deveriam ser não correlacionados por quê Por outro lado se houver simultaneidade Pt e u2t serão correlacionados Para descobrir qual é o caso o teste de Hausman procede da seguinte maneira Primeiro das equações 1941 e 1942 obtemos as seguintes equações na forma reduzida 1943 1944 em que v e w são os termos de erro na forma reduzida Estimando a Equação 1943 por MQO obtemos 1945 Opcional 9 A seguinte discussão foi extraída de robert S rUBiNFElD Daniel l Econometric models and economic forecasts 3 ed Nova york McGrawhill 1991 p 303305 10 hAUSMAN J A Specification tests in econometrics Econometrica v 46 p 12511271 nov 1976 Veja também NAKAMUrA A NAKAMUrA M On the relationship among several specification error tests presen ted by Durbin wu and hausman Econometrica nov 1981 vol 49 p 15831588 698 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais Portanto 1946 em que POt são estimadas Pt e vOt são os resíduos estimados Agora considere a seguinte equação 1947 Observe os coeficientes de Pt e vt são os mesmos A diferença entre essa equação e a equação de oferta original é que ela inclui a variável adicional vOt o resíduo da regressão 1943 Agora se a hipótese nula é de que não há simultaneidade isto é Pt não é uma variável endógena a correlação entre vOt e u2t deve ser zero assintoticamente Então se procedermos com a regressão 1947 e descobrirmos que o coeficiente de vt na Equação 1947 é estatisticamente zero podemos concluir que não há problema de simultaneidade Essa conclusão será revertida se descobrirmos que esse coeficiente é estatisticamente significante A propósito observe que o teste de simultaneidade de Hausman é também conhecido como o teste de endogeneidade de Hausman neste exemplo quere mos descobrir se Pt é endógeno Se for teremos o problema da simultaneidade Essencialmente então o teste de Hausman envolve os seguinte passos Passo 1 Faça a regressão Pt contra It e Rt para obter vOt Passo 2 Faça a regressão de Qt contra POt e vOt e faça um teste t sobre o coeficiente de vOt Se for significante não rejeite a hipótese da simultaneidade caso contrário rejeitea11 Para uma estima ção eficiente contudo Pindyck e Rubinfeld sugerem a regressão de Qt contra Pt e vOt12 Há formas alternativas de aplicar o teste de Hausman que serão apresentadas na forma de um exercício 13 ExEmplo 195 Modelo de gasto público de Pindyck Rubinfeld13 Para estudar o comportamento dos gastos dos governos locais e estaduais dos Estados Unidos os autores desenvolveram o seguinte modelo de equações simultâneas 1948 1949 em que EXP D gastos públicos dos governos locais e estaduais AiD D transferências do governo federal iNC D renda dos Estados POP D população do Estado PS D população de crianças das escolas primárias e secundárias u e v D termos de erro Neste modelo iNC POP e PS são considerados variáveis exógenas Em virtude da possibilidade da simultaneidade entre EXP e AiD os autores primeiramente fazem a regressão de AiD contra iNC e PS isto é a regressão da forma reduzida Seja o ter mo de erro nessa regressão wi Por meio dessa regressão o resíduo calculado é wO i Os autores então fazem a regressão de EXP contra AiD iNC POP e wO i para obter os seguintes resultados 11 Se mais de um regressor endógeno estiver envolvido teremos de usar o teste F 12 PiNDyCK e rUBiNFElD op cit p 304 Nota o regressor é Pt e não POt 13 PiNDyCK e rUBiNFElD op cit p 176177 Notações levemente alteradas Continua Capítulo 19 O problema da identificação 699 ExEmplo 195 Continuação 1941014 Se o nível de significância estiver em 5 o coeficiente de wO i não será estatisticamente signi ficativo e portanto para esse nível não haverá problema de simultaneidade Contudo se o nível de significância estiver em 10 será estatisticamente significativo aumentan do a possibilidade de que o problema de simultaneidade esteja presente A estimação dos MQO da Equação 1948 é como se segue 19411 Perceba uma característica interessante dos resultados dados nas Equações 19410 e 19411 quando a simultaneidade é explicitamente levada em conta a variável AiD é me nos significante embora numericamente seja maior em grandeza 14 195 Testes de exogeneidade Observamos que é responsabilidade do pesquisador especificar quais variáveis são endógenas e quais são exógenas Isso dependerá do problema que está à mão e da informação a priori que o pes quisador tem Mas é possível desenvolver um teste estatístico de exogeneidade à maneira do teste de causalidade de Granger O teste de Hausman discutido na Seção 194 pode ser utilizado para responder a essa questão Suponha que tenhamos um modelo de três equações nas três variáveis endógenas Y1 Y2 e Y3 e que haja três variáveis endógenas X1 X2 e X3 Além disso suponha que a primeira equação do modelo seja 1951 Se Y2 e Y3 são realmente endógenas não podemos estimar a Equação 1951 por MQO por quê Mas como descobrir isso Podemos proceder do seguinte modo Obtemos as equações da forma reduzida para Y2 e Y3 Observe as equações de forma reduzida terão apenas variáveis prede terminadas no lado direito Com as equações da forma reduzida obtemos YO2i e YO3i os valores previs tos de Y2i e Y3i respectivamente Então no espírito do teste de Hausman podemos estimar a seguinte equação por MQO 1952 Utilizando o teste F testamos a hipótese que Se a hipótese for rejeitada Y2 e Y3 poderão ser consideradas endógenas do contrário poderão ser tratadas como exógenas Para um exemplo concreto veja o Exercício 1916 14 Como na nota de rodapé 12 os autores utilizam AiD em vez de como regressor Opcional 700 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais Resumo e conclusões 1 O problema da identificação precede o problema da estimação 2 O problema da identificação busca saber se podemos obter estimativas numéricas únicas dos coeficientes estruturais por meio dos coeficientes de forma reduzida estimados 3 Se isso puder ser feito uma equação em um sistema de equações simultâneas é identificado Do contrário aquela equação não é identificada ou é subidentificada 4 Uma equação identificada pode ser exatamente identificada ou superidentificada No caso ante rior valores únicos de coeficientes estruturais podem ser obtidos no último caso deve haver mais do que um valor para um ou mais parâmetros estruturais 5 O problema da identificação surge porque o mesmo conjunto de dados pode ser compatível com diferentes conjuntos de coeficientes estruturais isto é diferentes modelos Na regressão de preço contra a quantidade apenas é difícil dizer se alguém está estimando a função oferta ou a função demanda porque preço e quantidade entram em ambas as equações 6 Para avaliar a identificação de uma equação estrutural podese aplicar a técnica das equações de forma reduzida que expressa uma variável endógena apenas como uma função de variáveis predeterminadas 7 Entretanto esse procedimento demorado pode ser evitado utilizando a condição de posto ou a condição de posto de identificação Embora a condição de posto seja fácil de aplicar ela fornece apenas uma condição necessária para a identificação Por outro lado a condição de posto é tanto uma condição necessária quanto suficiente para a identificação Se a condição de posto é satisfeita a condição de posto também o é embora o inverso não seja verdadeiro Na prática a condição de posto é geralmente adequada para assegurar a identificabilidade 8 Na presença da simultaneidade os MQO em geral não são aplicáveis como é apresentado no Capítulo 18 Mas se quisermos utilizála é imperativo testar explicitamente a simultaneidade O teste de especificação de Hausman pode ser usado com esse propósito 9 Embora na prática decidir se uma variável é endógena ou exógena seja uma questão de julga mento podese utilizar o teste de especificação de Hausman para determinar se uma variável ou grupo de variáveis é endógena ou exógena 10 Embora sejam da mesma família os conceitos de causalidade e exogeneidade são diferentes e um não pode necessariamente implicar o outro Na prática é melhor manter esses conceitos separa dos veja a Seção 1714 ExErcícios 191 Mostre que as duas definições da condição de posto de identificação veja a Seção 193 são equivalentes 192 Deduza os coeficientes estruturais com base nos coeficientes de forma reduzida apresentados nas Equações 19225 e 19227 193 Obtenha a forma reduzida dos seguintes modelos e determine em qual caso as equações estru turais são não identificadas exatamente identificadas ou superidentificadas a Capítulo 18 Exemplo 182 b Capítulo 18 Exemplo 183 c Capítulo 18 Exemplo 186 194 Verifique a identificação dos modelos do Exercício 193 ao aplicar tanto a condição de posto quanto a condição de posto de identificação 195 No modelo 19222 do texto mostrouse que a equação da oferta foi superidentificada Quais restrições se houver alguma nos parâmetros estruturais tornarão essa equação exatamente identificada Justifique as restrições impostas por você Capítulo 19 O problema da identificação 701 196 Por meio do modelo são obtidas as seguintes equações na forma reduzida a As equações estruturais são identificadas b O que acontece com a identificação se sabemos a priori que 11 D 10 197 Retome o Exercício 196 As equações de forma reduzida são as seguintes a Obtenha os valores dos parâmetros estruturais b Como você testaria a hipótese nula de que 11 D 10 198 O modelo produz as seguintes equações de forma reduzida a Quais coeficientes estruturais se houver algum podem ser estimados com base nos coe ficientes de forma reduzida Demonstre seu ponto de vista b Como a resposta a a muda se sabemos a priori que 1 Ø12 D 0 e 2 Ø10 D 0 199 Determine se as equações estruturais do modelo dado no Exercício 188 são identificadas 1910 Retome ao Exercício 187 e descubra quais equações estruturais podem ser identificadas 1911 A Tabela 193 é um modelo com cinco equações com cinco variáveis endógenas Y e quatro variáveis exógenas X Determine a identificação de cada equação com a ajuda das condições de posto 1912 Considere o seguinte modelo keynesiano estendido da determinação de renda Capítulo 19 O problema da identificação 701 TabEla 193 702 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais em que C D gastos com consumo Y D renda I D investimento T D impostos G D gastos governamentais u D termos de distúrbio No modelo as variáveis endógenas são C I T e Y e as variáveis predeterminadas são G e Yt1 Ao aplicar a condição de posto verifique a identificação de cada uma das equações do siste ma e do sistema como um todo O que ocorreria se rt a taxa de juros supondo que seja exógena aparecesse no lado direito da função investimento 1913 Retome aos dados indicados na Tabela 181 do Capítulo 18 Utilizandoos estime as regres sões de forma reduzida 1912 e 1914 Você pode estimar Ø0 e Ø1 Mostre seus cálculos O modelo é identificado Por quê 1914 Suponha que seja proposta uma outra definição de condição de posto de identificação que afirme que o número de variáveis predeterminadas no sistema não possa ser menor que o número de coeficientes desconhecidos na equação a ser identificada Mostre que essa identi ficação é equivalente às duas outras definições da condição de posto apresentadas no texto 1915 Uma versão simplificada do modelo de mercado de melancias de Suit é a seguinte em que P D preço QN D quantidade demandada per capita YN D renda per capita Ft D custos de frete P W D preço em relação aos salários rurais C D preço do algodão T D preço de outras safras N D população P e Q são as variáveis endógenas a Obtenha a forma reduzida b Determine se são identificadas a função demanda a função oferta ou ambas Exercícios aplicados 1916 Considere o seguinte modelo de demanda e oferta de moeda em que M D moeda Y D renda R D taxa de juros P D preço u D termo de erro 702 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais SUiTS D B An econometric model of the watermelon market Journal of Farm Economics 1955 v 37 p 237251 Capítulo 19 O problema da identificação 703 Capítulo 19 O problema da identificação 703 TabEla 194 Estados Unidos Moeda PIB Taxa de Juros e Índice de Preços ao Consumidor 19702006 Fonte Economic Report of the President 2007 Tabelas B2 B60 B69 B73 Notas Presuma que R e P sejam exógenas e M e Y sejam endógenas A Tabela 194 fornece dados sobre M definição de M2 Y PIB R Letras do Tesouro de três meses e P Índice de Preços ao Consumidor nos Estados Unidos entre 1970 e 2006 a A função demanda é identificada b A função oferta é identificada c Obtenha as expressões para as equações de forma reduzida para M e Y d Aplique o teste de simultaneidade para função oferta e Como você descobriria se Y na função oferta de moeda é de fato endógena 704 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais 704 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais 1917 O teste de Hausman discutido no texto também pode ser conduzido da seguinte maneira Considere a Equação 1947 a Uma vez que Pt e vt possuem os mesmos coeficientes como você poderia testar se em determinada aplicação este é realmente o caso Quais as implicações disso b Uma vez que Pt não é correlacionada com u2t pelo esquema por quê uma forma de descobrir se Pt é exógena é verificar se vt é correlacionada com u2t Como você faria para testar isso Que teste utilizaria Dica substitua Pt por meio de 1946 pela Equação 1947 705 Métodos de equações simultâneas Após discutirmos a natureza dos modelos de equações simultâneas nos dois últimos capítulos neste retomaremos o problema da estimação dos parâmetros de tais modelos A princípio podemos observar que o problema da estimação é muito complexo porque há uma variedade de técnicas com variadas propriedades estatísticas Em virtude da natureza deste texto deveremos considerar apenas algumas dessas técnicas de estimação Nossa discussão será simples e frequentemente heurística e os pontos mais refinados serão deixados para as referências 201 Abordagens da estimação Se considerarmos modelos de M equações em M variáveis endógenas dadas na Equação 1911 podemos adotar duas abordagens para estimar as equações estruturais os métodos de equação úni ca também conhecidos como métodos de informação limitada e os métodos de sistema também conhecidos como métodos de informação completa Nos métodos de equação única em resumo estimamos cada equação no sistema das equações simultâneas individualmente levando em conta quaisquer restrições incluídas naquela equação como a exclusão de algumas variáveis sem ficarmos preocupados com as restrições nas outras equações do sistema1 daí o nome métodos de informação limitada Nos métodos de sistema por outro lado estimamos todas as equações no modelo simulta neamente levando em conta todas as restrições em tais equações pela omissão ou abstenção de algu mas variáveis lembrese de que para a identificação tais restrições são essenciais daí o nome métodos de informação completa Como exemplo considere o seguinte modelo de quatro equações 2011 em que os Y são as variáveis endógenas e os X as exógenas Se estamos interessados em estimar por exemplo a terceira equação os métodos de equação única considerarão apenas essa equação obser vando que as variáveis Y2 e Y3 são excluídas dela Nos sistemas de métodos por outro lado tentamos estimar todas as quatro equações simultaneamente levando em conta todas as restrições impostas às várias equações do sistema 1 Para o propósito da identificação contudo as informações fornecidas por outras equações terão de ser conside radas Mas como observado no Capítulo 19 a estimação é possível apenas no caso de equações exatamente ou super identificadas Neste capítulo consideraremos que o problema da identificação é solucionado por meio das técnicas do Capítulo 19 Capítulo 20 706 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais Para preservarmos o espírito dos modelos de equação simultânea deveremos idealmente utili zar o método dos sistemas como o método de máxima verossimilhança de informação completa full information maximum likelihood FIML2 Na prática esses métodos não são em geral utili zados por um conjunto de razões Primeiro a quantidade de cálculos é enorme Por exemplo o modelo comparativamente pequeno 20 equações de KleinGoldberger para a economia americana em 1955 possuía 151 coeficientes não nulos dos quais os autores estimavam apenas 51 coeficientes utilizando os dados de séries temporais O modelo de econometria do BrookingsSocial Science Research Council SSRC da economia americana publicado em 1965 possuía incialmente 150 equações3 Embora tais modelos elaborados possam fornecer detalhes mais precisos dos vários se tores da economia os cálculos são uma tarefa exaustante mesmo nestes dias de computadores alta mente velozes e sem mencionar o custo envolvido Em segundo lugar os sistemas de métodos como o FIML levam a soluções altamente não lineares nos parâmetros e são portanto frequente mente difíceis de determinar Terceiro se há um erro de especificação por exemplo uma forma funcional errada ou exclusão de variáveis relevantes em uma ou mais equações do sistema esse erro é transmitido para o resto do sistema Como resultado os métodos do sistema tornamse mais sensíveis para a especificação de erros Na prática os métodos de equação única são muito usados Como Klein observa Os métodos de equação única no contexto de um sistema simultâneo podem ser menos sensíveis ao erro de especificação no sentido de que essas partes do sistema que são corretamente especificadas podem não ser afetadas consideravelmente pelos erros de especificação em outra parte4 No resto do capítulo trataremos apenas os métodos de equação única Especificamente discuti remos os seguintes métodos de equação única 1 Mínimos quadrados ordinários MQO 2 Mínimos quadrados indiretos MQI 3 Mínimos quadrados em dois estágios MQ2E 202 Modelos recursivos e mínimos quadrados ordinários Vimos no Capítulo 18 que devido à interdependência entre o termo de distúrbio estocástico e as variávelis explanatórias endónegas o método MQO não é apropriado para a estima ção de uma equação em um sistema de equações simultâneas Se aplicados de maneira errada então como vimos na Seção 183 os estimadores não serão apenas viesados em pequenas amostras mas também inconsistentes isto é o viés não desaparece não importando qual seja o tamanho da amostra Há contudo uma situação em que os MQO podem ser aplicados apro priadamente mesmo no contexto das equações simultâneas Esse é o caso dos modelos recursi vos triangulares ou causais Para ver a natureza desses modelos considere o seguinte sistema de três equações 2021 2 Para uma discussão simples sobre esse método veja ChriST Carl F Econometric models and methods Nova york John wiley Sons 1966 p 395401 3 DUESENBErry James S FrOMM Gary KlEiN lawrence r KUh Edwin Eds A quarterly model of the United States economy Chicago rand McNally 1965 4 KlEiN lawrence r A textbook of econometrics 2 ed Englewood Cliffs NJ Prentice hall 1974 p 150 Capítulo 20 Métodos de equações simultâneas 707 em que como de costume Y e X são respectivamente as variáveis endógenas e exógenas Os distúr bios são tais que isto é os distúrbios de mesmo período em equações diferentes não são correlacionados tecnicamente essa é a hipótese de correlação contemporânea zero Agora considere a primeira equação de 2021 Como contém apenas as variáveis exógenas no lado direito e por hipótese elas não são correlacionadas com o termo de distúrbio u1t essa equação satisfaz a premissa crítica dos clássicos MQO isto é a não correlacão entre as variáveis explanatórias e os distúrbios estocásticos Portanto os MQO podem ser aplicados diretamente nessa equação Em seguida considere a segunda equação de 2021 que contém a variável endógena Y1 como uma variável explanatória juntamente com os X não estocásticos Agora os MQO podem ser também apli cados nessa equação desde que Y1t e u2t sejam não correlacionados Isso é verdade A resposta é sim porque u1 que afeta Y1 é hipoteticamente não correlacionado com u2 Para propósitos práticos Y1 é uma variável predeterminada no que se refere a Y2 Podese proceder com a estimação dos MQO dessa equação Levando esse argumento adiante podemos também aplicar os MQO à terceira equa ção em 2021 pois tanto Y1 quanto Y2 são correlacionadas com u3 No sistema recursivo os MQO podem ser aplicados a cada uma das equações separadamente Na verdade não temos um problema simultaneidade nessa situação Com base na estrutura de tal siste ma é claro que não há interdependência entre as variáveis endógenas Portanto Y1 afeta Y2 mas Y2 não afeta Y1 Da mesma forma Y1 e Y2 influenciam Y3 sem por seu turno serem influenciadas por Y3 Em outras palavras cada equação exibe uma dependência causal unilateral daí o nome modelos causais5 Esquematicamente temos a Figura 201 Como exemplo de um sistema recursivo podese postular o seguinte modelo de determinação de salário e preço 2022 5 O nome alternativo triangular originase do fato de que se formamos a matriz dos coeficientes das variáveis endógenas dadas na Equação 2021 obtemos a seguinte matriz triangular Observe que as entradas acima da diagonal principal são zeros por quê Figura 201 Modelo recursivo Y3 Y2 Y1 u1 u2 u3 X1 X2 708 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais em que P D taxa de variação de preço por unidade de produção W D taxa de variação de salários por funcionário R D taxa de variação de preço do capital M D taxa de variação de preços de importação L D taxa de variação de produtividade da mão de obra UN D taxa de desemprego 6 A equação de preço postula que a taxa de mudança de preço no período corrente é uma função das taxas de mudança nos preços do capital e da matériaprima da taxa de mudança na produtividade do trabalho e da taxa de mudança nos salários no período anterior A equação de salário mostra que a taxa de mudança nos salários no período corrente é determinada pela taxa de período corrente da mudança na taxa de preço e de desemprego É claro que a cadeia causal opera com base em e portanto os MQO podem ser aplicados para estimar os parâmetros de duas equações individual mente Embora os modelos recursivos tenham provado ser úteis a maioria dos modelos de equação si multânea não exibe tal relação unilateral de causa e efeito Os MQO em geral não são apropriados para estimar a equação única no contexto de um modelo de equações simultâneas7 Há pessoas que argumentam que embora os MQO em geral não possam ser aplicados aos mode los de equações simultâneas podese utilizálos apenas como um padrão ou norma de comparação Isto é podese estimar uma equação estrutural por MQO com as propriedades resultantes de viés inconsistência etc A mesma equação pode ser estimada por outros métodos especialmente projetados para lidar com o problema da simultaneidade e os resultados dos dois métodos comparados ao me nos qualitativamente Em muitas aplicações os resultados dos MQO aplicados inapropriadamente podem não diferir muito dos obtidos por meio de métodos mais sofisticados como veremos mais adiante Em princípio podese não ter muita objeção à produção de resultados baseados nos MQO contanto que as estimativas baseadas em métodos alternativos desenvolvidos para modelos de equa ções simultâneas sejam também oferecidas De fato essa abordagem poderia nos dar alguma ideia a respeito da ineficácia dos MQO em situações em que eles não são apropriadamente aplicados8 203 Estimação de uma equação exatamente identificada o método de mínimos quadrados indiretos MQI Para uma equação estrutural apenas identificada ou exatamente identificada o método para se obter as estimativas dos coeficientes estruturais com base nas estimativas de MQO dos coeficientes de forma reduzida é conhecido como método de mínimos quadrados indiretos MQI e as estima tivas então obtidas são conhecidas como estimativas de mínimos quadrados indiretos Os MQI envolvem os três passos seguintes Passo 1 Primeiro obtemos as equações na forma reduzida Como observado no Capítulo 19 essas equações são obtidas por meio de equações estruturais de forma que a variável 6 O símbolo ponto significa derivada no tempo Por exemplo Para a série de tempo discreta dPdt é por vezes aproximada de 1P1t em que o símbolo 1 é o primeiro operador de diferença primeiramente in troduzido no Capítulo 12 7 É importante ter em vista que estamos presumindo que os distúrbios nas equações são contemporaneamente não correlacionados Se este não for o caso poderemos ter de recorrer à técnica de estimação de regressões aparentemente não correlacionadas SUrE seemingly unrelated regressions de Zellner para estimar os parâme tros do sistema recursivo Veja ZEllNEr An efficient method of estimating seemingly unrelated regressions and tests for aggregation bias Journal of the American Statistical Association v 57 p 348368 1962 8 Também pode ser observado que em pequenas amostras os estimadores alternativos como os estimadores de MQO são igualmente viesados Mas o estimador de MQO possui a virtude de ter uma variância mínima entre os estimadores alternativos Mas isso é verdade apenas em pequenas amostras Capítulo 20 Métodos de equações simultâneas 709 dependente em cada equação seja a única variável endógena e uma função apenas das variáveis predeterminadas exógenas ou endógenas defasadas e dos termos de erro estocástico Passo 2 Aplicamos individualmente os MQO nas equações de forma reduzida Essa ope ração é possível na medida em que as variáveis explanatórias nessas equações forem prede terminadas e portanto não correlacionadas com os distúrbios estocásticos As estimativas obtidas são consistentes9 Passo 3 Obtemos as estimativas dos coeficientes estruturais originais com base nos coefi cientes da forma reduzida estimados obtidos no Passo 2 Como observado no Capítulo 19 se uma equação é exatamente identificada há uma correspondência de um para um entre os coeficientes de forma reduzida e os estruturais isto é podese derivar estimativas únicas do primeiro por meio do último Como o procedimento dos três passos indica o nome MQI vem do fato de que os coeficientes estruturais o objeto da investigação primária na maioria dos casos são obtidos indiretamente com base nas estimativas de MQO dos coeficientes de forma reduzida um exemplo Considere o modelo de oferta e demanda introduzido na Seção 192 que por conveniência é apresentado a seguir com uma leve mudança na notação 2031 2032 em que Q D quantidade P D preço X D renda ou gastos Suponha que X seja exógena Como observado a função de oferta é exatamente identificada en quanto a função de demanda não o é As equações de forma reduzida que correspondem às equações estruturais anteriores são 2033 2034 em que os 5 são coeficientes de forma reduzida e combinações não lineares dos coeficientes estru turais como mostrado nas Equações 19216 e 19218 e w e v são combinações lineares dos dis túrbios estruturais u1 e u2 Observe que cada equação de forma reduzida contém apenas uma variável endógena que é a va riável dependente e que é uma função apenas da variável exógena X renda e dos distúrbios estocás ticos Portanto os parâmetros das equações de forma reduzida anteriores podem ser estimados pelos MQO Essas estimativas são 2035 2036 2037 2038 9 Além de serem consistentes as estimativas podem ser melhores não viesadas eou assintomaticamente eficientes dependendo respectivamente se i os z D X são exógenos e não meramente predeterminados isto é não contém valores defasados de variáveis endógenas eou ii a distribuição dos distúrbios é normal Veja hOOD w C KOOPMANS Tjalling C Studies in econometric method Nova york John wiley Sons 1953 p 133 710 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais em que as letras minúsculas como de costume denotam desvios em relação às médias da amostra e Q e P são os valores médios da amostra de Q e P Como observado os 5O i são estimadores consis tentes e sob hipóteses apropriadas são também não viesados de variância mínima ou assintomatica mente eficiente veja a nota de rodapé 9 Posto que nosso objetivo principal é determinar os coeficientes estruturais veremos se podemos estimálos por meio dos coeficientes de forma reduzida Como se viu na Seção 192 a função oferta é exatamente identificada Sendo assim seus parâmetros podem ser estimados exclusivamente por meio dos coeficientes de forma reduzida como a seguir As estimativas desses parâmetros podem ser obtidas com base nas estimativas dos coeficientes de forma reduzida como 2039 20310 que são os estimadores de MQI Observe que os parâmetros da função demanda não podem ser esti mados contudo veja o Exercício 2013 Para oferecermos alguns resultados numéricos obtivemos os dados observados na Tabela 201 Primeiro estimamos as equações de forma reduzida regredindo separadamente preço e quantidade sobre a despesa real de consumo per capita Os resultados são os seguintes 20311 20312 Utilizando as Equações 2039 e 20310 obtemos estas estimativas de MQI 20313 20314 Portanto a regressão de MQI estimada é10 20315 Para comparação oferecemos os resultados da regressão MQO de Q sobre P aplicada inapropria damente 20316 10 Não apresentamos os erros padrão dos coeficientes estruturais estimados porque como observado anterior mente esses coeficientes são em geral funções não lineares dos coeficientes de forma reduzida e não há ne nhum método simples de estimar seus erros padrão com base nos erros padrão de coeficientes de forma reduzida Para amostras de tamanho grande contudo os erros padrão dos coeficientes estruturais podem ser obtidos de maneira aproximada Para mais detalhes veja KMENTA Jan Elements of econometrics Nova york Macmillan 1971 p 444 Capítulo 20 Métodos de equações simultâneas 711 Esses resultados mostram como os MQO podem distorcer o quadro real quando aplicados em situações inapropriadas propriedades dos estimadores de mQi Vimos que os estimadores dos coeficientes de forma reduzida são consistentes e sob hipóteses adequadas também são os melhores estimadores não viesados ou assintomaticamente eficientes veja a nota de rodapé 9 Essas propriedades são transferidas para os estimadores de MQI Podese demonstrar que os estimadores de MQI herdam todas as propriedades assintóticas dos estimado res de forma reduzida como a consistência e a eficiência assintótica Mas propriedades em amos tras menores como a não tendenciosidade em geral não permanecem verdadeiras Mostraremos no Apêndice 20A Seção 20A1 que os estimadores de MQI ØO0 e ØO1 da função oferta apresentados anteriormente são viesados mas o viés desaparece à medida que o tamanho da amostra aumenta indefinidamente isto é os estimadores são consistentes11 11 intuitivamene isso pode ser visto como se segue Agora mesmo que pode ser demonstrado que isto é a expectativa da razão de duas variáveis não é igual à razão das expectativas de duas variáveis Entretanto como demonstrado no Apêndice 20A1 plim pode ser demonstrado uma vez que 5O 3 e 5O 1 são estimadores consistentes TabEla 201 Produção de safra preços de safra e gastos de consumo pessoal per capita em dólares de 2007 Estados Unidos 19752004 Fonte Economic Report of the President 2007 Dados sobre Q Tabela B99 so bre P Tabela B101 e sobre X Tabela B31 712 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais 204 Estimação de uma equação superindentificada o método dos mínimos quadrados em dois estágios MQ2E Considere o seguinte modelo 2041 2042 em que Y1 D renda Y2 D estoque de moeda X1 D gastos com investimento X2 D gastos do governo em bens e serviços As variáveis X1 e X2 são exógenas A equação de renda um híbrido das abordagens da teoria da quantidade de Keynes para a deter minação da renda estabelece que a renda é determinada pela oferta de moeda pelos gastos em inves timento e pelos gastos governamentais A função oferta de moeda postula que o estoque de moeda é determinado pelo Banco Central Americano com base no nível de renda Obviamente temos um problema de equação simultânea que pode ser averiguado pelo teste de simultaneidade discutido no Capítulo 19 Aplicando a condição de ordem de identificação podemos ver que a equação de renda é subidenti ficada enquanto a equação de oferta de moeda é superidentificada Não há muito que possa ser feito a respeito da equação de renda a não ser modificar a especificação do modelo A função oferta de moeda superidentificada pode não ser estimada pelos MQI porque há duas estimativas de Ø21 o leitor deve verificar isso por meio dos coeficientes de forma reduzida Por uma questão prática podese aplicar os MQO à equação de oferta de moeda mas as estimati vas então obtidas serão inconsistentes em vista da correlação provável entre a variável explanatória estocástica Y1 e o termo de distúrbio estocástico u2 Suponha contudo que descubramos uma proxy para a variável explanatória estocástica Y1 de modo que embora semelhante a Y1 no sentido de que é altamente correlacionada com Y1 ela não é correlacionada com u2 Essa proxy é também conheci da como uma variável instrumental veja o Capítulo 17 Se foi possível encontrar tal proxy os MQO podem ser utilizados diretamente para estimar a função de oferta de moeda Mas como pode obter essa variável instrumental Uma resposta é fornecida pelos mínimos qua drados em dois estágios MQ2E método desenvolvido independentemente por Henri Theil12 e Robert Basmann13 Como o nome indica o método envolve duas aplicações sucessivas de MQO O proces so é o seguinte Estágio 1 Para livrarse da correlação provável entre Y1 e u2 regrida primeiro Y1 sobre todas as variáveis predeterminadas em todo o sistema não apenas sobre essa equação Nes te caso isso significa regredir Y1 sobre X1 e X2 como se segue 2043 em que uOt são os habituais resíduos de MQO Da Equação 2043 obtemos 2044 12 ThEil henri Repeated leastsquares applied to complete equation systems The hague The Central Planning Bureau The Netherlands 1953 Mimeografado 13 BASMANN robert l A generalized classical method of linear estimation of coefficients in a structural equation Econometrica 1957 v 25 p 7783 Capítulo 20 Métodos de equações simultâneas 713 em que YO1t é uma estimativa do valor médio de Y condicionado aos X fixados Observe que a Equação 2043 não é nada além de uma regressão de forma reduzida porque apenas as varáveis exógenas e predeterminadas aparecem no lado direito A Equação 2043 pode agora ser expressa como 2045 que mostra que o Y1 estocástico consiste em duas partes YO1t que é uma combinação linear de X não estocásticos e o componente aleatório uOt De acordo com a teoria dos MQO YO1t e uOt são não correlacionados Por quê Estágio 2 A equação de oferta de moeda superidentificada pode agora ser escrita como 2046 em que Comparando a Equação 2046 com a Equação 2042 vemos que são semelhantes na aparência a única diferença é que Y1 é substituída por YO1 Qual a vantagem da Equação 2046 Podese demonstrar que embora Y1 na equação original de oferta de moeda é cor relacionada ou provavelmente correlacionada com o termo de distúrbio u2 portanto faz com que os MQO sejam inapropriados YO1t na Equação 2046 é não correlacionada com ut assintoticamente isto é na amostra maior ou de forma mais precisa na medida em que o tamanho da amostra cresce indefinidamente Como resultado os MQO podem ser aplica dos à Equação 2046 que fornecerá estimativas dos parâmetros da função da oferta de moeda14 A conclusão de tudo isso é que em amostras pequenas o procedimento de MQ2E pode levar à estimação viesada Como o procedimento de dois estágios indica a ideia básica que fundamenta o MQ2E é purifi car a variável explanatória estocástica Y1 da influência do distúrbio estocástico u2 Esse objetivo é alcançado ao executar a regressão de forma reduzida de Y1 em todas as variáveis predeterminadas no sistema Estágio 1 obtendo as estimativas YO1t e substituindo Y1t na equação original pela estimada YO1t e então aplicando os MQO à equação então transformada Estágio 2 Os estimadores obtidos são consistentes isto é eles convergem aos seus valores reais à medida que o tamanho da amostra au menta indefinidamente Para ilustrarmos mais ainda os MQ2E vamos modificar o modelo de oferta de rendamoeda como se segue 2047 2048 em que além das variáveis já definidas X3 D renda no período de tempo anterior e X4 D oferta de moeda no período anterior Tanto X3 quanto X4 são predeterminadas 14 Mas observe que em amostras pequenas é provável que YO1t seja correlacionado com ui A razão é a seguinte com base na Equação 2044 vemos que YO1t é uma combinação linear ponderada dos X predeterminados sendo ΠO os pesos Agora mesmo que as variáveis predeterminadas sejam verdadeiramente não estocásticas os ΠO sendo estimadores são estocásticos Então YO1t também é estocástico Agora com base em nossa discussão das equações de forma reduzida e da estimação dos mínimos quadrados indiretos está claro que os coeficien tes reduzidos os 5O são correlacionados com u2 que é um componente de ut Como resultado esperase que YO1t seja correlacionado com ut Mas como observado essa correlação desaparece à medida que o tamanho da amostra tende ao infinito 714 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais Rapidamente podese verificar que tanto as Equações 2047 quanto 2047 são superidentifi cadas Para aplicar os MQ2E procedemos como se segue no Estágio 1 regredimos as variáveis en dógenas em todas as variáveis predeterminadas no sistema Então 2049 20410 No Estágio 2 substituímos Y1 e Y2 nas equações estruturais originais pelos seus valores estima dos com base nas duas regressões anteriores e operamos as regressões de MQO como se segue 20411 20412 As estimativas obtidas serão consistentes Obser ve as seguintes características dos MQ2E 1 Podese aplicálos a uma equação individual no sistema sem diretamente levar em conta qualis quer outras equaçãoões no sistema Para solucionar modelos econométricos que envolvem grande número de equações os MQ2E oferecem um método econômico Por isso o método tem sido altamente utilizado na prática 2 Diferentemente dos MQI que fornecem estimativas múltiplas dos parâmetros nas equações su peridentificadas os MQ2E fornecem apenas uma estimativa por parâmetro 3 É de fácil aplicação porque tudo o que se precisa saber é o número total das variáveis exógenas ou predeterminadas do sistema sem conhecer outras variáveis do sistema 4 Embora especialmente planejado para lidar com as equações superidentificadas o método pode também ser aplicado às equações exatamente identificadas Desse modo os MQI e MQ2E fornecerão estimativas idênticas Por quê 5 Se os valores de R2 nas regressões de forma reduzida isto é as regressões de Estágio 1 são muito altos por exemplo maiores que 08 as estimativas clássicas de MQO e as estimativas de MQ2E estarão muito próximas Mas esse resultado não deveria ser surpreendente porque se o valor de R2 no primeiro estágio for muito alto significa que os valores estimados das variáveis endógenas estarão muito próximos dos seus valores reais e portanto há menos probabilidade de esses va lores estarem correlacionados com os distúrbios estocásticos nas equações estruturais originais Por quê15 Se contudo os valores de R2 nas regressões de primeiro estágio são muito mais baixas as estimativas de MQ2E serão praticamente sem sentido porque deveremos substituir os Y originais nas regressões de segundo estágio pelos YO estimados por meio das regressões de primeiro estágio que representarão essencialmente os distúrbios nas regressões de primeiro está gio Em outras palavras neste caso os YO serão proxies muito precárias para os Y originais 6 Perceba que ao relatarmos a regressão MQI na Equação 20315 não declaramos os erros padrão dos coeficientes estimados pelas razões explicadas na nota de rodapé 10 Mas podemos fazer isso para as estimativas de MQ2E porque os coeficientes estruturais são diretamente esti mados com base nas regressões de segundo estágio MQO Há contudo uma precaução que deve ser tomada os erros padrão estimados nas regressões de segundo estágio precisam ser mo dificados porque como se pode ver pela Equação 2046 o termo de erro ut é de fato o termo de erro u2t mais Ø21uOt Portanto a variância de ut não é exatamente igual à variância do original u2t Entretanto a modificação requerida pode ser facilmente efetuada pela fórmula apresentada no Apêndice 20A Seção 20A2 15 No caso extremo de R2 1 na regressão de primeiro estágio a variável explanatória endógena na equação original superidentificada será praticamente não estocástica por quê Capítulo 20 Métodos de equações simultâneas 715 7 Ao utilizar os MQ2E tenha em mente as seguintes observações de Henri Theil A justificativa estatística do MQ2E considera que se trabalha com grandes amostras Quando não há variáveis endógenas defasadas os estimadores de coeficiente de MQ2E são consistentes se as variáveis exógenas são constantes em amostras repetidas e se os distúrbios que aparecem nas várias equações comportamentais e estruturais são independentemente ou identicamente distribuídos com médias zero e variâncias finitas Se essas duas condições forem satisfeitas a distribuição das amostras dos estimadores de coeficientes de MQ2E tornamse aproximadamente normais para amostras grandes Quando o sistema de equações contém variáveis endógenas defasadas a consistência e a normalida de da amostra grande dos estimadores de coeficientes de MQ2E requerem uma condição adicional que à medida que a amostra cresce o quadrado médio dos valores assumidos por uma variável endógena defasada converge em probabilidade para um limite positivo Se os distúrbios que aparecem nas diversas equações estruturais são não são independentemente dis tribuídos variáveis endógenas defasadas não são independentes da operação corrente do sistema da equação o que significa que essas variáveis não são realmente predeterminadas Se essas variáveis são no entanto tratadas como predeterminadas no procedimento MQ2E os estimadores resultantes não são consistentes16 205 MQ2E um exemplo numérico Para ilustrar o modelo MQ2E considere o modelo de oferta de moedarenda dado previamente nas Equações 2041 Como demonstrado a equação de oferta de moeda é superidentificada Para estimarmos os parâmetros dessa equação utilizamos o método de mínimos quadrados de dois está gios Os dados requeridos para a análise são dados na Tabela 202 ela também oferece alguns dados necessários para responder algumas das questões dos exercícios Regressão do Estágio 1 Primeiro regredimos a variável explanatória estocástica de renda Y1 representada pelo PIB sobre as variáveis predeterminadas de investimento privado X1 e de gastos governamentais X2 obtendo os seguintes resultados 2051 Regressão do Estágio 2 Estimamos agora a função de oferta de moeda 2042 substituindo a variável endógena Y1 pela Y1 estimada por meio da Equação 2051 YO1 Os resultados são os seguintes 2052 Como ressaltado os erros padrão estimados na Equação 2052 precisam ser corrigidos da forma como é sugerida no Apêndice 20A Seção 20A2 Efetuando essa correção a maioria dos pacotes econométricos pode fazêla hoje em dia obtemos os seguintes resultados 2053 16 ThEil henri Introduction to econometrics Englewood Cliffs NJ Prentice hall 1978 p 341342 716 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais Como observado no Apêndice 20A Seção 20A2 os erros padrão dados na Equação 2053 não diferem muito daqueles da Equação 2052 porque o R2 na regressão do Estágio 1 é muito alto Regressão por MQO Para comparação fornecemos a regressão do estoque de moeda sobre a renda como demons trado na Equação 2042 sem expurgar a Y1t estocástica da influência do termo de distúrbio estocástico 2054 TabEla 202 PIB M2 FEDEXP TB6 EUA 1970 2005 Fonte Economic Report of the President 2007 Tabelas B2 B69 B84 e B73 Produto Interno Bruto Notas Capítulo 20 Métodos de equações simultâneas 717 Comparando os resultados obtidos pelo uso inapropriado dos MQO com a regressão do Estágio 2 verificamos que ambas são praticamnete idênticas Isso significa que o procedimento de MQ2E é inútil De forma alguma Na situação atual não deve ser surpreendente que os dois resultados sejam praticamente idênticos pois como visto o valor R2 no primeiro estágio é muito alto o que torna o YO1t praticamente idêntico ao real Y1t Nesse caso os MQO e as regressões de segundo estágio serão mais ou menos semelhantes Mas não há garantia de que isso acontecerá em todas as aplicações Uma implicação é que em equações superidentificadas podese não aceitar o clássico procedimento de MQO sem verificar as regressãoões de segundo estágio Simultaneidade entre PIB e oferta de moeda Vamos descobrir se o PIB Y1 e a oferta de moeda Y2 são mutuamente dependentes Com esse propósito utilizamos o teste de Hausman de simultaneidade discutido no Capítulo 19 Primeiro fazemos a regressão do PIB sobre X1 gastos com investimento e X2 gastos do governo as variáveis exógenas no sistema isto é estimamos a regressão de forma reduzida Por meio dessa regressão obtemos o PIB estimado e os resíduos vOt como sugerido na Equação 1947 Então faze mos a regressão da oferta de moeda sobre o PIB estimado e vt para obter os seguintes resultados 2055 Uma vez que o valor t de vOt é estatísticamente significativo o valor p é 00263 não podemos rejeitar a hipótese da simultaneidade entre a oferta de moeda e o PIB o que não deveria ser surpresa Nota essa conclusão é válida apenas para amostras grandes tecnicamente é válida apenas à medida que o tamanho da amostra cresce indefinidamente Testando a hipótese Suponha que queiramos testar a hipótese de que a renda não tem efeito sobre a demanda de moeda Podemos testar essa hipótese com o teste t habitual por meio da regressão estimada 2052 Sim desde que a amostra seja grande e que os erros padrão sejam corrigidos como demonstrado na Equação 2053 podemos utilizar o teste t para testar o valor de um coeficiente individual e o teste F para testar juntamen te o valor de dois ou mais coeficientes utilizando a fórmula 84717 O que acontece se o termo de erro em uma equação estrutural estiver autocorrelacionado eou correlacionado com o termo de erro em outra equação estrutural no sistema Uma resposta completa para essa questão vai além do objetivo deste livro e é melhor deixar isso para as referências veja a referência da nota de rodapé 7 No entanto as técnicas de estimação como a técnica SURE de Zellner existem para lidar com essas complicações Para concluir a discussão de nosso exemplo numérico podese acrescentar que os vários passos envolvidos na aplicação dos MQ2E agora são rotineiramente tratados por pacotes de software como o STATA e o EViews Mostramos os detalhes dos MQ2E apenas por razões pedagógicas Veja o Exercício 2015 206 Exemplos ilustrativos Nesta seção consideraremos algumas aplicações dos métodos de equações simultâneas 17 Mas atenção a SQr restrita e a não restrita no numerador devem ser calculadas utilizando o Y previsto como no Estágio 2 dos MQ2E e a SQr no denominador é calculada utilizando os valores reais dos regressores em vez dos valores previstos Para uma discussão acessível desse assunto veja wAllACE T Dudley SilVEr J lew Econometrics an introduction reading Mass Addisonwesley 1988 sec 85 718 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais ExEmplo 201 Propaganda concentração e margens de preço Para estudar as interrelações entre a propaganda a concentração como mensurada pela razão de concentração e as margens de custopreço Allyn D Strickland e leonard w weiss formularam o seguinte modelo de três equações18 Função intensidade da propaganda 2061 Função concentração 2062 Função margem de custopreço 2063 em que Ad D gastos com propaganda S D valor de transporte C D razão de concentração de quatro empresas CD D demanda do consumidor MES D escala mínima eficiente M D margem de preçocusto Gr D taxa anual de crescimento da produção industrial Dur D variável binária para a indústria de bens duráveis K D estoque de capital GD D medida da dispersão geográfica da produção Pelas condições de ordem para a identificação a Equação é superidentificada enquanto as Equações 2061 e 2063 são exatamente identificadas Os dados para a análise originamse em sua maior parte do Censo das Empresas Manu fatureiras de 1963 que engloba 408 das 417 indústrias de quatro dígitos As três equações foram primeiro estimadas pelos MQO produzindo os resultados exibidos na Tabela 203 Para corrigir o viés das equações simultâneas os autores reestimaram o modelo utilizando os MQ2E Os resultados decorrentes estão na Tabela 204 Deixamos esses resultados para que o leitor compare os dois resultados TabEla 203 Estimativas de MQO de três equações razões t entre parênteses Equação Equação Equação 18 18 Veja Advertising Concentration and PriceCost Margins Journal of Political Economy v 84 n 5 p 1109121 1976 N de r T razão de concentração das quatro maiores empresas conhecida como r4 Continua Capítulo 20 Métodos de equações simultâneas 719 ExEmplo 201 Continuação TabEla 204 Estimativas de mínimos quadrados de dois estágios das três equações razões t entre parênteses Equação Equação Equação ExEmplo 202 Modelo I de Klein No Exemplo 186 discutimos rapidamente o modelo pioneiro de Klein inicialmente o modelo foi estimado para o período de 19201941 Os dados sublinhados são apresen tados na Tabela 205 as estimativas de MQO na forma reduzida e MQ2E são dadas na Tabela 206 Deixamos para o leitor a interpretação desses resultados TabEla 205 Dados originais do modelo I de Klein Fonte estes dados foram extraídos de MADDALA G S Econometrics Nova York McGrawHill 1977 p 238 Continua 720 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais ExEmplo 202 Continuação TabEla 206 Estimativas MQO na forma reduzida e MQ2E do modelo I de Klein Fonte MADDALA G S Econometrics Nova York McGrawHill 1977 p 242 19 ExEmplo 203 O modelo CAPM Capital Asset Pricing Model como um sistema recursivo Em uma aplicação especialmente incomum de modelagem de equação simultânea recur siva Cheng F lee e w P lloyd 19 estimaram o seguinte modelo para a indústria petrolífera em que R1 D taxa de retorno sobre título 1 D imperial Oil R2 D taxa de retorno sobre título 2 D Sun Oil R7 D taxa de retorno sobre título 7 D Standard of indiana Mt D taxa de retorno sobre o índice de mercado uit D termos de distúrbios i D 1 2 7 19 The capital asset pricing model expressed as a recursive system an empirical investigation Journal of Financial and Quantitative Analysis jun 1976 p 237249 Continua Capítulo 20 Métodos de equações simultâneas 721 ExEmplo 203 Continuação Antes de apresentarmos os resultados a questão óbvia é como escolhemos qual é o títu lo 1 qual é o título 2 e assim por diante lee e lloyd respondem a essa pergunta de forma puramente empírica Eles regridem a taxa de retorno do título i sobre as taxas de retorno dos seis títulos remanescentes e observam o resultado R2 Portanto haverá sete dessas regressões Eles ordenam os valores R2 estimados a partir do menor para o maior O título que tiver o menor R2 é designado título 1 e o que tem o maior R2 é designado título 7 A ideia por trás disso é intuitivamente simples Se o R2 da taxa de retorno da imperial Oil for o menor em relação aos outros seis títulos isso sugere que ele seja o menos afetado pelas variações nos retornos dos outros títulos Sendo assim a ordenação causal se houver opera a partir desse título para os outros e não há feedback a partir de outros títulos Embora se possa questionar tal abordagem puramente empírica para a ordenação causal vamos apresentar não obstante os seus resultados empíricos dados na Tabela 207 No Exercício 55 introduzimos a linha característica da moderna teoria do investimento que é simplesmente a regressão da taxa de retorno do título i sobre a taxa de retorno de mercado O coeficiente angular conhecido como coeficiente beta é uma medida da volati lidade do retorno do título O que os resultados da regressão leelloyd sugerem é que há relações intraindústrias significativas entre retornos de títulos sem considerar a influência do mercado comum representada pela carteira de mercado Portanto o retorno da Standard of indiana depende não apenas das taxas de retorno de mercado mas também das taxas de retorno da Shell Oil da Phillips Petroleum e da Union Oil Em outras palavras o movi mento na taxa de retorno da Standard of indiana pode ser mais bem explicado se além da taxa de retorno de mercado também considerarmos as taxas de retorno experimentadas pela Shell Oil Phillips Petroleum e Union Oil TabEla 207 Estimativas do sistema recursivo para a indústria do petróleo Fonte LEE Cheng F LLOYD W P op cit tabela 3b 722 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais ExEmplo 204 Forma revisada do modelo St Louis 20 O bastante conhecido e frequentemente controverso modelo St louis desenvolvido originalmente no fim da década de 1960 foi revisado de tempos em tempos Essa revisão é dada na Tabela 208 e os resultados empíricos baseados nesse modelo revisado estão na Tabela 209 Nota um ponto sobre uma variável significa o crescimento da taxa daquela variável O modelo consiste basicamente nas Equações 1 2 4 e 5 na Tabela 208 as outras equações representam as definições A Equação 1 foi estimada pelos MQO As Equações 1 2 e 4 foram estimadas utilizando o método das defasagens distribuí das de Almon com restrições ponto extremo sobre os coeficientes Quando relevante as equações foram corrigidas para correlação serial de primeira ordem Ω1 eou de se gunda ordem Ω2 Examinando os resultados observamos que é a taxa de crescimento da oferta de moeda que primeiro determina a taxa de crescimento nominal do PiB e não a taxa de crescimen to nos gastos com a alta taxa de emprego A soma dos coeficientes M é 106 sugerindo que 1 sustentado de aumento na oferta de moeda em média leva a cerca de 106 de aumento no PNB nominal Por outro lado a soma dos coeficientes E cerca de 005 sugere que uma mudança nos gastos governamentais com alta taxa de emprego tem menos im pacto sobre a taxa de crescimento do PNB nominal Deixamos para o leitor interpretar os resultados das outras regressões apresentadas na Tabela 209 TabEla 208 O modelo St Louis Fonte Federal Reserve Bank of St Louis Review p 14 maio 1982 a a 20 20 Federal reserve Bank of St louis Review maio 1982 p 14 Continua Capítulo 20 Métodos de equações simultâneas 723 ExEmplo 204 Continua TabEla 209 Estimação dentro da amostra 1960I até 1980IV valor absoluto da estatística t entre parênteses Fonte Federal Reserve Bank of St Louis Review p 14 maio 1982 ep ep ep ep Resumo e conclusões 1 Presumindo que uma equação em um modelo de equações simultâneas seja identificada exata mente ou superidentificada temos vários métodos para estimála 2 Esses métodos estão em duas amplas categorias métodos de equação única e métodos de sistemas 3 Por razões de economia erros de especificação etc os métodos de equação única são de longe os mais populares Uma característica exclusiva desses métodos é que podemos estimar uma equação única em um modelo multiequacional sem ficarmos muito preocupados com as outras equações do sistema Nota para propósitos de identificação contudo as outras equações no sistema contam 4 Os três métodos de equação única normalmente utilizados são MQO MQI e MQ2E 5 Embora os MQO sejam em geral inapropriados no contexto dos modelos de equações simultâ neas eles podem ser aplicados para os chamados modelos recursivos nos quais há uma relação de causa e efeito definitiva mas não unidirecional entre as variáveis endógenas 6 O método de MQI é apropriado para as equações apenas identificadas ou exatamente identifica das Nesse método os MQO são aplicados à equação na forma reduzida e é com base nos coefi cientes na forma reduzida que se estimam os coeficientes estruturais originais 7 O método de MQ2E é especialmente projetado para equações superidentificadas embora possa também ser aplicado às equações exatamente identificadas Desse modo os resultados de MQ2E e MQI são idênticos A ideia básica subjacente ao método MQ2E é substituir a variável explanatória endógena estocástica por uma combinação linear das variáveis predeterminadas no modelo e utilizar essa combinação como a variável explanatória em vez da variável endógena original O método MQ2E assemelhase portanto ao método variável instrumental de estimação no qual a combinação linear das variáveis predeterminadas serve como instrumento ou proxy para o regres sor endógeno 724 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais 8 Uma característica notável tanto dos MQI como dos MQ2E é que as estimativas obtidas são con sistentes isto é à medida que o tamanho da amostra aumenta indefinidamente as estimativas convergem para os valores reais da população As estimativas não podem satisfazer as proprie dades de amostras pequenas tais como a tendenciosidade e a variância mínima Entretanto os resultados obtidos por meio da aplicação desses métodos em amostras pequenas e as inferências extraídas por meio deles deveriam ser interpretados com o devido cuidado ExErcícios 201 Determine se as seguintes afirmações são verdadeiras ou falsas a O método de MQO não é aplicável para estimar uma equação estrutural em um modelo de equações simultâneas b No caso de uma equação não ser identificada o MQ2E não é aplicável c O problema da simultaneidade não aumenta em um modelo recursivo de equações simultâneas d Os problemas de simultaneidade e exogeneidade significam a mesma coisa e O MQ2E e outros métodos para estimar equações estruturais possuem propriedades esta tísticas desejáveis apenas para amostras grandes f Não há algo como um R2 para o modelo de equações simultâneas como um todo g O MQ2E e outros métodos para estimar as equações estruturais não são aplicáveis se os erros das equações são autocorrelacionados eou correlacionados entre as equações h Se uma equação é exatamente identificada MQI e MQ2E oferecem resultados idênticos 202 Por que é desnecessário aplicar o método de mínimos quadrados em dois estágios para as equações exatamente identificadas 203 Considere o seguinte modelo keynesiano modificado para a determinação de renda em que C D gastos com consumo I D gastos de investimento Y D renda G D gastos do governo Gt e Yt1 são supostamente predeterminadas a Obtenha as equações na forma reduzida e determine quais das equações anteriores são identificadas apenas identificadas ou superidentificadas b Qual método você utilizará para estimar os parâmetros da equação superidentificada e da equação exatamente identificada Justifique sua resposta 204 Considere os seguinte resultados Opcional Fonte Prices and earnings in 19511969 an econometric assessment Londres Department of Employment United Kingdom her Majestys Stationery Office 1971 p 30 Capítulo 20 Métodos de equações simultâneas 725 são variações percentuais em ganhos preços preços de importação e produtividade da mão de obra todas as mudanças de percentagem dizem respeito ao ano anterior respectivamente e Vt representa as vagas de emprego não preenchidas porcentagem do número total de empregados Uma vez que os resultados de MQO e MQ2E são praticamente idênticos o MQ2E não tem sentido Comente 205 Suponha que a produção seja caracterizada pela função de produção CobbDouglas em que Q D produção K D insumo de capital L D insumo de mão de obra A Æ e Ø D parâmetros i D iésima empresa Dado o preço do produto final P o preço do trabalho W e o preço do capital R e supondo a maximização do lucro obtemos o seguinte modelo empírico de produção Função produção 1 Produto marginal da função mão de obra 2 Produto marginal da função capital 3 em que u1 u2 e u3 são distúrbios estocásticos No modelo anterior há três equações nas variáveis endógenas Q L e K P R e W são exógenas a Quais problemas você encontra na estimação do modelo se Æ C Ø D 1 isto é quando há retornos constantes de escala b Mesmo se Æ C Ø 1 você pode estimar as equações Responda considerando a identifica bilidade do sistema c Se o sistema não é identificado o que pode ser feito para identificálo Nota as Equações 2 e 3 são obtidas por meio da diferenciação de Q em relação à mão de obra e ao capital respectivamente o que as torna iguais a WP e RP transformando as expres sões resultantes em logaritmos e adicionando o logaritmo dos termos de distúrbio 206 Considere o seguinte modelo de demanda e oferta de moeda em que M D dinheiro Y D renda R D taxa de juros P D preço Capítulo 20 Métodos de equações simultâneas 725 726 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais Suponha que R e P sejam predeterminadas a A função demanda é identificada b A função oferta é identificada c Qual método você usaria para estimar os parâmetros das equaçãoões identificadas Por quê d Suponha que modifiquemos a função oferta ao adicionarmos as variáveis explanatórias Yt1 e Mt1 O que acontece com o problema de identificação Você ainda utilizaria o método usado em c Explique sua resposta 207 Retome o Exercício 1810 Para o sistema de duas equações obtenha as equações na forma reduzida e estime parâmetros delas Estime a regressão dos mínimos quadrados indiretos de consumo sobre a renda e compare os resultados com a regressão por MQO Exercícios aplicados 208 Considere o seguinte modelo em que Mt oferta de moeda é exógena Rt é a taxa de juros e Yt é o PIB a Como você justificaria o modelo b As equações são identificadas c Utilizando os dados da Tabela 202 estime os parâmetros das equações identificadas Justifique os métodos usados por você 209 Imagine que mudemos o modelo no Exercício 208 como se segue a Descubra se o sistema é identificado b Utilizando os dados da Tabela 202 estime os parâmetros das equaçãoões identi ficadas 2010 Considere o seguinte modelo em que as variáveis são semelhantes às definidas no Exercício 208 Tratando I investimen to interno e M como exógena determine a identificação do sistema Utilizando os dados da Tabela 202 estime os parâmetros das equaçãoões identificadas 2011 Suponha que modifiquemos o modelo do Exercício 2010 como se segue Suponha que M seja determinada exogenamente a Descubra quais das equações são identificadas b Estime os parâmetros das equaçãoões identificadas utilizando os dados da Tabela 202 Justifique os seus métodos 2012 Verifique os erros padrão apresentados na Equação 2053 726 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais Capítulo 20 Métodos de equações simultâneas 727 2013 Retorne ao modelo de demanda e oferta fornecido nas Equações 2031 e 2032 Suponha que a função oferta seja alterada como se segue em que Pt1 é o preço que prevalece no período anterior a Se X gastos e Pt1 são predeterminados há um problema de simultaneidade b Se houver as funções demanda e oferta são identificadas Se forem obtenha as equações na forma reduzida e estimeas por meio dos dados da Tabela 201 c Com base nos coeficientes de forma reduzida você pode derivar os coeficientes estrutu rais Mostre os cálculos necessários 2014 Exercício em classe Considere o seguinte modelo macroeconômico simples para a econo mia norteamericana por exemplo para o período entre 19601999 Função consumo privado Função investimento privado bruto Uma função demanda por moeda Identidade da renda em que C D consumo privado real I D investimento privado bruto real G D gastos reais do governo Y D PIB real M D oferta de moeda M2 a preços correntes R D taxa de juros de longo prazo e P D índice de preços ao consumidor As variáveis endógenas são C I R e Y As variáveis predeterminadas são Ct1 It1 Mt1 Pt Rt1 e Gt mais o termo de inter cepto Os u são os termos de erro a Utilizando a condição de ordem de identificação determine qual das quatro equações são identificadas sejam elas exatamente identificadas ou superidentificadas b Qualis métodos você utiliza para estimar as equações identificadas c Obtenha dados adequados por meio das fontes governamentais ou privadas estime o modelo e comente seus resultados 2015 Neste exercício examinamos os dados de 534 trabalhadores obtidos com base na Current Population Survey CPS de 1985 Os dados podem ser encontrados na Tabela 2010 no site do livro As variáveis nesta tabela são definidas como se segue S D salários por hora ocup D ocupação setor D 1 para indústria 2 para construção civil 0 para outros sindicato D 1 se membro de sindicato 0 se não for educ D anos de escolari dade exper D experiência profissional em anos idade D idade em anos gênero D 1 para mulher estado civil D 1 se casado raça D 1 para outra 2 para hispânico 3 para branco re gião D 1 se vive no Sul Capítulo 20 Métodos de equações simultâneas 727 Adaptado de SEDDiGhi h r lAwlEr K A KATOS A V Econometrics a practical approach Nova york routledge 2000 p 204 Os dados podem ser encontrados na internet em httplibstatcmuedudatasetscps85wages 728 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais Considere o modelo simples de determinação de salário S 1 a Suponha que a educação como os salários seja endógena Como você descobriria se na Equação 1 a educação é de fato endógena Utilize os dados fornecidos na tabela em sua análise b O teste de Hausman sustenta sua análise em a Explique detalhadamente 2016 Exercício em classe Considere o seguinte modelo de demanda e oferta para os empréstimos bancários para o comércio em que Q D total de empréstimos comerciais bancários em bilhões de dólares R D taxa primária média RS D taxa de letras do Tesouro de três meses RD D taxa de títulos corporativos com clas sificação AAA IPI D Índice de Produção Industrial e TDB D total de depósitos bancários a Colete dados sobre essas variáveis no período entre 1980 e 2007 com base em várias fontes como o wwweconomagiccom o site do Federal Reserve Bank de St Louis ou outra fonte qualquer b As funções demanda e oferta são identificadas Liste quais variáveis são endógenas e quais são exógenas c Como você estimaria as funções demanda e oferta listadas a seguir Mostre os cálculos necessários d Por que tanto R quanto RS estão incluídas no modelo Qual o papel do IPI no modelo Apêndice 20A 20a1 Viés nos estimadores de mínimos quadrados indiretos Para demonstrarmos que os estimadores de MQI embora consistentes são viesados utilizamos o modelo de demanda e oferta dados nas Equações 2031 e 2032 Com base na Equação 20310 obtemos Agora e Então em substituição obtemos 1 728 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais Capítulo 20 Métodos de equações simultâneas 729 Utilizando as Equações 2033 e 2034 obtemos 2 3 em que w e v são os valores médios de wt e vt respectivamente Substituindo as Equações 2 e 3 pela Equa ção 1 obtemos 4 Uma vez que o operador de expectativa E é um operador linear não podemos tomar a expectativa da Equa ção 4 embora seja claro que em geral Por quê Mas na medida em que o tamanho da amostra tende ao infinito podemos obter 5 em que se utilizam as propriedades de plim a saber que Agora à medida que o tamanho da amostra aumenta indefinidamente o segundo termo tanto no denomina dor quanto no numerador da Equação 5 tende a zero por quê resultando em 6 o que mostra que embora viesado ØO1 é um estimador consistente de Ø1 20a2 Estimação de erros padrão dos estimadores de mQ2E O propósito deste apêndice é demonstrar que os erros padrão das estimativas obtidas por meio da re gressão de segundo estágio do procedimento de MQ2E utilizando a fórmula aplicável na estimação por MQO não são as estimativas adequadas dos verdadeiros erros padrão Para tanto utilizamos o modelo de oferta de rendamoeda fornecido nas Equações 2041 e 2042 Estimamos os parâmetros da função oferta de moeda superidentificada com base na regressão de segundo estágio como 2046 em que 7 Agora quando operamos a regressão 2046 o erro padrão de por exemplo ØO21 é obtido por meio da se guinte expressão 8 em que 9 Capítulo 20 Métodos de equações simultâneas 729 730 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais 730 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais Mas æ2 u não é a mesma coisa que æO 2 u2 em que o último é uma estimativa não tendenciosa da variância verda deira de u2 Essa diferença pode ser prontamente verificada por meio da Equação 7 Para obter o verdadeiro como definido previamente æO 2 u2 procedemos como se segue em que ØO20 e ØO21 são as estimativas por meio da regressão de segundo estágio Portanto 10 Perceba a diferença entre as Equações 9 e 10 na Equação 10 utilizamos o Y1 real em vez do Y1 estimado por meio da regressão de primeiro estágio Tendo estimada a Equação 10 o caminho mais fácil para corrigir os erros padrão dos coeficientes estimados na regressão de segundo estágio é multiplicar cada um deles por æOu2 æOu Observe que se Y1t e YO1t forem muito próximos isto é o R2 na regressão de primeiro estágio for muito alto o fator de correção æO u2 æO u será pró ximo de 1 caso em que os erros padrão estimados na regressão de segundo estágio podem ser tomados como estimativas verdadeiras Mas em outras situações deveríamos usar o fator de correção anterior 731 Econometria de séries temporais alguns conceitos básicos Observamos no Capítulo 1 que um dos tipos importantes de dados utilizados em análises em píricas são os de séries temporais Neste e no capítulo seguinte analisaremos com mais atenção esses dados não apenas devido à frequência com que são usados mas também porque apresentam vários desafios aos econometristas e aos praticantes de econometria Primeiro o trabalho empírico baseado nos dados de séries temporais supõe que a série temporal subjacente seja estacionária Embora tenhamos discutido o conceito de estacionariedade intuitiva mente no Capítulo 1 devemos discutilo mais amplamente neste capítulo Mais especificamente tentaremos descobrir o que a estacionariedade significa e por que devemos preocuparnos com ela Segundo no Capítulo 12 sobre autocorrelação discutimos várias causas da autocorrelação Algu mas vezes a autocorrelação ocorre porque a série temporal subjacente é não estacionária Terceiro ao fazer a regressão para uma variável de série temporal em relação a outras variávelis de série temporal frequentemente obtémse um R2 muito elevado superior a 09 muito embora não haja relação significativa entre as duas variáveis Algumas vezes não esperamos relação entre as duas variáveis ainda que a regressão de uma sobre a outra frequentemente mostre uma relação significativa Essa situação exemplifica o problema da regressão espúria ou sem sentido cuja natureza será ex plorada em breve Portanto é muito importante descobrir se uma relação entre as variáveis econômi cas é espúria ou sem sentido Veremos neste capítulo como as regressões espúrias podem aumentar se as séries temporais não forem estacionárias Quarto algumas séries temporais financeiras como os preços das ações exibem o que é co nhecido como fenômeno do passeio aleatório Isso significa que a melhor previsão do preço de uma ação por exemplo da IBM amanhã seja igual ao preço de hoje mais um choque puramente aleatório ou termo de erro Se esse for realmente o caso prognosticar os preços dos ativos seria um exercício inútil Quinto os modelos de regressão envolvendo os dados das séries temporais são com frequência utilizados para previsões Em virtude da discussão anterior devemos saber se a previsão é válida caso as séries temporais fundamentadas não sejam estacionárias Por fim os testes de causalidade lembremos os testes de causalidade Granger e Sims discutidos no Capítulo 17 pressupõem que as séries temporais envolvidas na análise sejam estacionárias Entre tanto os testes de estacionariedade deveriam preceder os testes de causalidade Comecemos com uma advertência O tópico da análise de séries temporais é tão vasto e envolven te e parte da matemática que fundamenta as várias técnicas de análise de séries temporais é tão complexa que o máximo que podemos alcançar em um texto introdutório como este é oferecer ao Capítulo 21 732 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais leitor um vislumbre sobre alguns dos conceitos fundamentais da análise de séries temporais Para os que querem aprofundarse no assunto fornecemos referências1 211 Um olhar sobre algumas séries temporais da economia dos Estados Unidos Para continuarmos o jogo e oferecermos ao leitor uma ideia sobre os conceitos um tanto eso téricos da análise de séries temporais a ser desenvolvida neste capítulo será útil considerarmos várias séries temporais da economia americana de interesse geral As séries temporais que consi deraremos são RPD D renda real pessoal disponível bilhões de dólares PIB D produto interno bruto bilhões de dólares DCP D despesas reais de consumo pessoal bilhões de dólares LC D lucros corporativos bilhões de dólares Dividendo D dividendos bilhões de dólares O período compreendido vai de 1947I a 2007IV totalizando 244 trimestres e todos os dados são sazonalmente ajustados à taxa anual Todos os dados foram coletados no FRED o site econômico do Federal Reserve Bank de St Louis PIB RPD e DCP estão em dólares constantes aqui em 2000 O LC e o Dividendo estão em dólares nominais Para economizar espaço os dados brutos estão postados no site do livro Mas para ter alguma ideia sobre esses dados nós os organizamos nas duas figuras que se seguem A Figura 211 apresenta os dados dos logaritmos de PIB RPD e DCP e a Figura 212 apresenta os dados dos logaritmos de outras duas séries temporais LC e Dividendos É prática comum representar o logaritmo de uma série tem poral para ter uma noção da taxa de crescimento da mesma Um gráfico dos dados é normalmente o primeiro passo na análise das séries temporais Nessas figuras a letra L indica um logaritmo natural A primeira impressão que temos das duas figuras é que todas essas séries temporais parecem apre sentar uma tendência ascendente embora tenham flutuações Suponha que queiramos especular so bre o formato dessas curvas além do período de amostragem por exemplo por todos os trimestres de 20082 Poderemos fazer isso se conhecermos o mecanismo estatístico ou o processo gerador de dados PGD responsável por essas curvas Mas o que é esse mecanismo Para respondermos a essa e a outras questões relacionadas precisamos estudar um novo vocabulário desenvolvido pelos analistas de séries temporais para o qual agora nos voltaremos 1 No nível introdutório essas referências podem ser úteis KOOP Gary Analysis of economic data Nova york John wiley Sons 2000 CrOMwEll Jeff B lAByS walter C TErrAZA Michel Univariate tests for time series mo dels Califórnia Ansbury Park Sage Publications 1994 CrOMwEll Jeff B hANNAN Michael h lAByS walter C TErrAZA Michel Multivariate tests for time series models Califórnia Ansbury Park Sage Publications 1994 SEDDiGhi h r lAwlEr K A e KATOS A V Econometrics a practical approach Nova york routledge 2000 No nível intermediário veja ENDErS walter Applied econometric time series Nova york John wiley Sons 1995 PATTErSON Kerry An introduction to applied econometrics a time series approach Nova york St Martins Press 2000 MillS T C The econometric modelling of financial time series 2 ed Nova york Cambridge Univer sity Press 1999 VErBEEK Marno A guide to modern econometrics Nova york John wiley Sons 2000 e ChA rEMZA wojciech w DEADMAN Derek F New directions in econometric practice general to specific modelling and vector autoregression 2 ed Nova york Edward Elgar Publisher 1997 No nível avançado veja hAMilTON J D Time series analysis Princeton NJ Princeton University Press 1994 e MADDAlA G S KiM inMoo Unit roots cointegration and structural change Cambridge University Press 1998 No nível aplicado veja rAO B Bhaskara Ed Cointegration for the applied economist Nova york St Martins Press 1994 e MUKhErJEE Chandan whiTE howard wUyTS Marc Econometrics and data analysis for developing countries Nova york routledge 1998 2 É claro que temos os dados reais para esse período agora e podemos comparálos com os dados previstos com base do período anterior Capítulo 21 Econometria de séries temporais alguns conceitos básicos 733 95 90 85 80 75 70 1 24 72 96 144 120 168 192 216 240 264 48 Bilhões em dólares do ano 2000 Período LRPD LPIB LDCP Figura 211 Logaritmos de PIB RPD e DCP reais Estados Unidos 19472007 trimestralmente em bilhões de dólares Nota na figura a letra L indica o logaritmo natural 212 Conceitoschave3 Qual é esse vocabulário Ele se constitui em conceitos como os seguintes 1 Processos estocásticos 2 Processos estacionários 3 Processos puramente aleatórios 4 Processos não estacionários 5 Variáveis integradas 6 Modelos de passeios aleatórios 7 Cointegração 8 Tendências determinísticas e estocásticas 9 Testes de raiz unitária A seguir discutiremos cada um desses conceitos Nossa discussão será na maioria das vezes heu rística Onde for possível e útil forneceremos exemplos apropriados 3 A discussão a seguir é baseada em MADDAlA et al op cit ChArEMZA et al op cit e AlEXANDEr Carol Market models a guide to financial data analysis Nova york John wiley Sons 2001 8 6 7 5 4 3 2 1 24 72 96 144 120 168 192 216 LDividendo LLC 240 264 48 Bilhões em dólares do ano 2000 Período Figura 212 Logaritmos de lucros corporativos LC e dividendos nos Estados Unidos 19472007 trimestralmente em bilhões de dólares Nota L indica logaritmo 734 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais 213 Processos estocásticos Um processo aleatório ou estocástico é uma coleção de variáveis aleatórias ordenadas no tempo4 Se deixarmos que Y denote uma variável aleatória e se ela for contínua nós a denotaremos como Yt mas se for discreta denotaremos como Yt Um exemplo da primeira variável é um eletrocardiograma e um exemplo de última são o PIB a RPD etc Uma vez que a maioria dos dados econômicos são co letados em pontos discretos no tempo para o nosso propósito utilizaremos a notação Yt em vez de Yt Se permitirmos que Y represente o PIB para os nossos dados temos Y1 Y2 Y3 Y242 Y243 Y244 em que o subscrito 1 denota a primeira observação isto é o PIB do primeiro trimestre de 1947 e o subs crito 244 denota a última observação isto é o PIB do quarto trimestre de 2007 Tenha em vista que cada um desses Y é uma variável aleatória Em que sentido podemos estimar o PIB como um processo estocástico Considere por exemplo o PIB real de 3759997 bilhões para 1970I Em teoria o número do PIB para o primeiro trimestre de 1970 poderia ter sido qualquer um dependendo do clima econômico e político que estivesse prevale cendo O número de 3759997 é uma realização particular de todas essas possibilidades5 Sendo as sim podemos dizer que o PIB é um processo estocástico e os valores reais que observamos para o período entre 1947I e 2007IV são realizações particulares desse processo ou seja uma amostra A distinção entre o processo estocástico e sua realização é parecida com a distinção entre a população e a amostra de dados em cortes transversais Do mesmo modo que utilizamos as amostras de dados para extrair inferências sobre a população utilizamos em séries temporais a realização para extrair inferên cias sobre o processo estocástico subjacente processos estocásticos estacionários Um tipo de processo estocástico que recebeu grande atenção e escrutínio por parte dos analistas de séries temporais é o assim chamado processo estocástico estacionário Em linhas gerais um processo estocástico será chamado de estacionário se sua média e variância forem constantes ao longo do tempo e o valor da covariância entre os dois períodos de tempo depender apenas da distân cia do intervalo ou da defasagem entre os dois períodos e não o tempo real ao qual a covariância é computada Na literatura sobre as séries temporais tal processo estocástico é conhecido como pro cesso estocástico fracamente estacionário ou covariânciaestacionário ou estacionário de se gunda ordem ou em sentido amplo Para o propósito deste capítulo e na maioria das situações práticas esse tipo de estacionariedade em geral é suficiente6 Para explicar a estacionariedade fraca considere o Yt como uma série temporal estocástica com essas propriedades 2131 2132 2133 em que k a covariância ou autovariância na defasagem k é a covariância entre os valores de Yt e YtCk isto é entre dois valores de Y separados por k Se k D 0 obtemos 0 que é simplesmente a 4 O termo estocástico vem da palavra grega stokhos que significa um alvo ou centro do alvo Se você já lançou dardos em um alvo com o objetivo de atingilo com que frequência acertou esse alvo Em cada cem dardos você pode ter a sorte de acertar o alvo apenas umas poucas vezes outras vezes os dardos se espalharão aleato riamente ao redor do alvo 5 Você pode pensar sobre o valor de US3759997 bilhões como a média de todos os possíveis valores do PiB para o primeiro trimestre de 1970 6 Uma série temporal é estritamente estacionária se todos os momentos de sua distribuição de probabilidade e não apenas os dois primeiros ou seja a média e a variância são invariantes ao longo do tempo Contudo se o processo estacionário for normal o processo estocástico fracamente estacionário será também estritamente es tacionário porque o processo estocástico normal é completamente especificado pelos seus dois momentos a média e a variância Capítulo 21 Econometria de séries temporais alguns conceitos básicos 735 variância de Y D æ2 se k D 1 1 é a covariância entre os dois valores adjacentes de Y o tipo de covariância que encontramos no Capítulo 12 lembrese do esquema autoregressivo de primeira ordem markoviano Suponha que mudemos a origem de Y de Yt para YtCm por exemplo do primeiro trimestre de 1947 ao primeiro trimestre de 1952 para os nossos dados do PIB Agora se Yt for estacionário a média a variância e autocovariâncias de YtCm deverão ser iguais àquelas de Yt Em resumo se uma série tem poral for estacionária a média variância e autocovariâncias em variadas defasagens permanece rão as mesmas não importa em que ponto a mensuremos isto é elas serão invariantes no tempo Tal série temporal tenderá a retornar para a sua média o que chamamos de reversão da média e flutua ções em torno dessa média mensurada por sua variância terão de modo geral uma amplitude cons tante7 Em outras palavras um processo estacionário não se desviará muito de seu valor médio em virtude da variância finita Como veremos em breve esse não é o caso do processo estocástico não estacionário Devemos observar que para o processo estacionário a velocidade da reversão à média depende das autocovariâncias isso será rápido se as autocovariâncias forem pequenas e lento quan do são grandes como demonstraremos em seguida Se uma série temporal não é estacionária no sentido há pouco definido ela é chamada de série tem poral não estacionária tenha em mente que estamos falando apenas sobre a estacionariedade fraca Em outras palavras uma série temporal não estacionária terá uma média que varia com o tempo ou uma variância que varia com o tempo ou ainda ambas Por que as séries temporais estacionárias são tão importantes Porque se uma série temporal é não estacionária podemos estudar seu comportamento apenas pelo período de tempo em consideração Cada conjunto de dados de série temporal portanto será específico a cada episódio Como consequên cia não é possível generalizálo para outros períodos Sendo assim para o propósito de previsão tal série temporal não estacionária pode ser de pouco valor prático Como sabemos que uma série temporal particular é estacionária Em particular as séries tempo rais apresentadas nas Figuras 211 e 212 são estacionárias Abordaremos esse importante tema nas Seções 218 e 219 quando consideraremos vários testes de estacionariedade Mas se dependermos do senso comum as séries temporais retratadas nas Figuras 211 e 212 parecerão ser não estacioná rias ao menos nos valores médios Porém falaremos sobre isso mais adiante Antes de prosseguirmos mencionaremos um tipo especial de processo estocástico ou série tempo ral ou seja um processo puramente aleatório ou de ruído branco Chamamos um processo estocás tico puramente aleatório se ele tem média zero variância constante æ2 e é serialmente não correlacionado8 Você pode lembrar que o termo de erro ut admitido no modelo clássico de re gressão linear normal que discutimos na Parte 1 deste livro foi considerado um processo de ruído branco que denotamos como ut ª IIDN0 æ2 isto é ut é distribuído independentemente e identica mente como uma distribuição normal com média zero e variância constante Tal processso é chamado de processo de ruído branco gaussiano processos estocásticos não estacionários Embora nosso interesse esteja voltado para a série temporal estacionária encontrase frequente mente a série temporal não estacionária o exemplo clássico é o modelo de passeio aleatório9 Em geral dizemos que os preços dos ativos como preços das ações ou taxas de câmbio seguem um pas seio aleatório isto é eles são não estacionários Distinguimos dois tipos de passeios aleatórios 1 7 isso foi apontado por CUThBErTSON Keith hAll Stephen G TAylOr Mark P Applied econometric techniques The University of Michigan Press 1995 p 130 8 Se é também independente tal processo é chamado de estritamente de ruído branco 9 O termo passeio aleatório é muitas vezes comparado com um caminhar de bêbado Deixando um bar o bêbado movese numa distância aleatória ut no tempo t e continuando a caminhar indefinidamente eventualmente se desviará cada vez mais do bar O mesmo é dito sobre os preços das ações O preço da ação de hoje é igual ao de ontem mais um choque aleatório 736 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais passeio aleatório sem deslocamento sem termo constante ou intercepto e 2 passeio aleatório com deslocamento ou seja um termo constante está presente Passeio aleatório sem deslocamento Suponha que ut seja um termo de erro de ruído branco sem média 0 e variância æ2 Dizse então que a série Yt é um passeio aleatório se 2134 No modelo de passeio aleatório como demonstra a Equação 2134 o valor de Y no tempo t é igual a seu valor no tempo t 1 mais um choque aleatório sendo assim tratase de um modelo AR1 na linguagem dos Capítulo 12 e 17 Podemos pensar na Equação 2134 como uma regressão de Y no tempo t sobre seu valor defasado em um período Aqueles que acreditam na hipótese de eficiência do mercado de capital argumentam que os preços das ações são essencialmente aleatórios e por conseguinte não há margem para especulação lucrativa no mercado de ações se fosse possível prever o preço de amanhã com base no preço de hoje todos seríamos milionários Agora com base na Equação 2134 podemos escrever Em geral se o processo iniciouse em algum tempo 0 com o valor de Y0 temos 2135 Portanto 2136 Igualmente pode ser demonstrado que 2137 Como a expressão anterior demonstra a média de Y é igual ao seu valor inicial ou de partida que é constante mas como t aumenta sua variância aumenta indefinidamente violando assim uma con dição de estacionariedade Em resumo o modelo de passeio aleatório sem deslocamento é um pro cesso estocástico não estacionário Na prática Y0 é frequentemente colocado em zero caso em que EYt D 0 Uma característica interessante do modelo de passeio aleatório é a persistência de choques alea tórios erros aleatórios que é claro por meio da Equação 2135 Yt é a soma do Y0 inicial mais a soma dos choques aleatórios Como resultado o impacto de um choque particular não se extingue Por exemplo se u2 D 2 em vez de u2 D 0 então todos os Yt a partir de Y2 em diante serão 2 unidades maiores e o efeito desse choque não desaparecerá É por isso que se diz que o passeio aleatório tem memória infinita Como Kerry Paterson observa o passeio aleatório lembrase para sempre do choque10 ele tem memória infinita A soma também é conhecida como tendência estocástica sobre a qual ainda nos deteremos um pouco Curiosamente se escrevermos a Equação 2134 como 2138 em que Δ é o primeiro operador de diferenças abordado no Capítulo 12 tornase fácil mostrar que enquanto Yt é não estacionária sua primeira diferença é estacionária Em outras palavras as primeiras diferenças de séries temporais de um passeio aleatório são estacionárias Mas retomaremos esse tema mais adiante 10 PATTErSON Kerry op cit cap 6 Capítulo 21 Econometria de séries temporais alguns conceitos básicos 737 Passeio aleatório com deslocamento Vamos modificar a Equação 2134 como se segue 2139 em que é conhecido como o parâmetro de deslocamento O termo deslocamento vem do fato de que se escrevemos a equação anterior como 21310 isso demonstra que Yt deslocase para cima ou para baixo dependendo de ser positivo ou negativo Note que o modelo 2139 é também um modelo AR1 Seguindo o procedimento discutido para o passeio aleatório sem deslocamento podese demons trar que para o modelo de passeio aleatório com deslocamento 2139 21311 21312 Como se pode ver para o modelo de passeio aleatório com deslocamento a média bem como a variância aumenta ao longo do tempo novamente violando as condições de estacionariedade fraca Em resumo o modelo de passeio aleatório com ou sem deslocamento é um processo estocástico não estacionário Para darmos uma ideia do passeio aleatório com e sem deslocamento conduzimos duas simula ções como se segue 21313 em que ut são termos de erro de ruído branco tais como ut ª N0 1 isto é cada ut segue o padrão normal de distribuição De um gerador de números aleatórios obtivemos 500 valores de u e geramos Yt como demonstrado na Equação 21313 Admitamos que Y0 D 0 Então a Equação 21313 é um modelo de passeio aleatório sem deslocamento Agora considere 21314 que é um modelo de passeio aleatório com deslocamento Admitimos ut e Y0 como na Equação 21313 e admitimos que D 2 Os gráficos dos modelos 21313 e 21314 estão respectivamente nas Figuras 213 e 214 O leitor pode comparar esses dois diagramas à luz de nossa discussão sobre o modelo de passeio alea tório com e sem deslocamento 5 5 0 10 15 20 25 50 150 200 300 350 250 400 450 500 100 Y Yt Yt1 ut Figura 213 Um passeio aleatório sem deslocamento 738 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais O modelo de passeio aleatório é um exemplo do que é conhecido na literatura específica como processo de raiz unitária Uma vez que esse termo já se tornou corrente na literatura de séries tem porais explicaremos a seguir o que é um processo de raiz unitária 214 Processo estocástico de raiz unitária Vamos escrever o modelo de passeio aleatório 2134 como 2141 Esse modelo é semelhante ao modelo autorregressivo de primeira ordem de Markov que dis cutimos no capítulo sobre autocorrelação Se ρ D 1 a Equação 2141 tornase um modelo de passeio aleatório sem deslocamento Se ρ é de fato 1 encontramos o que é conhecido como problema de raiz unitária isto é uma situação de não estacionariedade já sabemos que nesse caso a variância de Yt é não estacionária O nome raiz unitária devese ao fato de que ρ D 111 Portanto os termos não estacionariedade passeio aleatório raiz unitária e tendência estocásti ca podem ser tratados como sinônimos Se entretanto ρ 1 ou seja se o valor absoluto de ρ for menor do que um é possível demonstrar que a série temporal Yt é estacionária no sentido em que a definimos12 Na prática por conseguinte é importante descobrir se uma série temporal possui uma raiz unitária13 Na Seção 219 discutiremos vários testes de raiz unitária isto é vários testes de esta cionariedade Nessa equação também determinaremos se as séries temporais apresentadas nas Figuras 211 e 212 são estacionárias Talvez o leitor possa imaginar que elas não sejam mas de vemos verificar 11 Uma questão técnica se Ω D 1 podemos escrever a Equação 2141 como Yt Yt1 ut Agora utilizando o operador de defasagem L de modo que e assim por diante podemos escrever a Equação 2141 como 1 L Yt D ut O termo raiz unitária referese à raiz do polinômio no operador de defasagem Se estabelecermos que 1 L D 0 obteremos L D 1 daí o nome raiz unitária 12 Se na Equação 2141 considerarmos que o valor inicial de Y D Y0 é zero Ω 1 e ut é um ruído branco e distribuise normalmente com média zero variância unitária seguese que EYt D 0 e var Yt D 11 Ω2 Uma vez que ambos são constantes pela definição de estacionariedade fraca Yt é estacionária Por outro lado como vimos antes se Ω D 1 Yt é um passeio aleatório ou não estacionário 13 Uma série temporal pode conter mais do que uma raiz unitária Discutiremos essa situação mais à frente neste capítulo 1200 800 1000 600 400 200 0 50 150 200 300 350 250 400 450 500 100 Y Yt 2 Yt1 ut Y0 0 Figura 214 Um passeio aleatório com deslocamento Capítulo 21 Econometria de séries temporais alguns conceitos básicos 739 215 Processos estocásticos de tendência estacionária TE e diferença estacionária DE A distinção entre processos estocásticos ou séries temporais estacionários e não estacionários possui um aspecto essencial relacionado ao fato de a tendência a lenta evolução de longo prazo da série temporal em consideração observada nas séries temporais construídas nas Figuras 213 e 214 ou nas séries temporais da economia real das Figuras 211 e 212 ser determinística ou estocástica Em linhas gerais se a tendência em uma série temporal é uma função determinística de tempo como o tempo tempo ao quadrado etc ela é chamada de tendência determinística se não é previsível ela é chamada de tendência estocástica Para tornar a definição mais formal considere o seguinte mode lo de série temporal Yt 2151 em que ut é um termo de erro de ruído branco e t é o tempo mensurado cronologicamente Agora te mos as seguintes possibilidades Passeio aleatório puro se na Equação 2151 Ø1 D 0 Ø2 D 0 Ø3 D 1 obtemos 2152 que não é nada além de um modelo de passeio aleatório sem deslocamento e é então não estacionário Mas observe que se escrevemos a Equação 2152 como 2138 ele se torna estacionário como observamos anteriormente Portanto um modelo de passeio aleatório sem deslocamento é um processo estacionário em diferença PED Passeio aleatório com deslocamento se na Equação 2151 Ø1 0 Ø2 D 0 Ø3 D 1 Yt D Ø1 C Yt1 C ut 2153 que é um passeio aleatório com deslocamento e portanto não estacionário Se a escrevemos como 2153a isso significa que Yt exibirá uma tendência positiva Ø1 0 ou negativa Ø1 0 veja a Figura 214 Tal tendência é chamada tendência estocástica A equação 2153a é um processo PED porque a não estacionariedade de Yt pode ser eliminada ao tomar as primeiras diferenças da série temporal Lembre que ut na Equação 2153a é um termo de erro de ruído branco 5 Tempo Estocástica Determinística 0 5 10 15 20 Figura 215 Tendência determinística versus tendência estocástica Fonte CHAREMZA et al op cit p 91 740 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais Tendência determinística se na Equação 2151 2154 que é chamado de processo de tendência estacionária PTE Embora a média de Yt seja Ø1 C Ø2t não seja constante sua variância D æ2 é Uma vez que os valores de Ø1 e Ø2 são conhecidos a média pode ser perfeitamente prevista Então se subtrairmos de Yt a média de Yt a série resultante será esta cionária daí o nome tendência estacionária Esse procedimento de remover a tendência determinís tica é chamado remoção de tendência Passeio aleatório com deslocamento e tendência determinística se na Equação 2151 Ø1 0 Ø2 0 Ø3 D 1 obtemos 2155 em tal caso temos um passeio aleatório com deslocamento e uma tendência determinística o que pode ser visto se escrevemos essa equação como 2155a que significa que Yt é não estacionária Tendência determinística com componente autorregressivo AR1 estacionário se em uma Equação 2151 então obtemos 2156 que é estacionária em torno de uma tendência determinística Para verificar a diferença entre as tendências estocásticas e determinísticas considere a Figura 21514 A série chamada estocástica nessa figura é gerada por um modelo de passeio aleatório com deslocamento Yt D 05 C Yt1 C ut em que 500 valores de ut foram gerados de uma distribuição pa drão normal e o valor inicial de Y foi estabelecido como 1 A série chamada determinística é gerada da seguinte maneira Yt D 05t C ut em que ut foi gerado como o acima e t referese ao tempo medido cronologicamente Como se pode ver na Figura 215 no caso da tendência determinística os desvios a partir da linha de tendência que representa a média não estacionária são puramente aleatórios e terminam rapida mente eles não contribuem para o desenvolvimento a longo prazo da série temporal que é determi nada pelo componente tendencial 05t No caso da tendência estocástica por outro lado o componente aleatório ut afeta o curso de longo prazo da série Yt 216 Processos estocásticos integrados O modelo de passeio aleatório não passa de um caso específico de mais uma classe geral de pro cessos estocásticos conhecida como processos estocásticos Lembre que o modelo de passeio alea tório sem deslocamento é não estacionário mas sua primeira diferença como demonstrado na Equação 2138 é estacionária Portanto chamamos o modelo de passeio aleatório sem desloca mento integrado de ordem 1 denotado como I1 Da mesma forma se uma série temporal tem de ser duas vezes diferenciada ou seja chegar à primeira diferença das primeiras diferenças para tornála estacionária chamamos tal série temporal de integrada de ordem 215 Em geral se uma série temporal não estacionária precisa ser diferenciada d vezes para tornarse estacionária deno minamos essa série temporal integrada de ordem d Uma série temporal Yt integrada de ordem d denotase como Yd ª Id Se uma série temporal Yt é estacionária desde o início ou seja não 14 A seguinte discussão é baseada em ChArEMZA wojciech w et al op cit p 8991 15 Por exemplo se Yt é I2 então tornase estacionária Mas observe que Capítulo 21 Econometria de séries temporais alguns conceitos básicos 741 requer qualquer diferenciação dizemos que é integrada de ordem zero denotada por Yt ª I0 Utilizaremos os termos série temporal estacionária e série temporal integrada de ordem zero para significar a mesma coisa A maioria das séries temporais econômicas são em geral I1 isto é elas geralmente tornamse estacionárias apenas depois de verificarmos suas primeiras diferenças As séries temporais apresenta das nas Figuras 211 e 212 são I 1 ou de ordem mais elevada Vamos examinálas nas Seções 218 e 219 propriedades das séries integradas As seguintes propriedades das séries temporais integradas podem ser observadas vamos conside rar Xt Yt e Zt como três séries temporais então 1 Se Xt ª I 0 e Yt ª I 1 então Zt D Xt C Yt D I1 isto é uma combinação linear ou soma de série temporal estacionária e não estacionária é não estacionária 2 Se Xt ª I d então Zt D a C bXt D Id em que a e b são constantes Ou seja uma combina ção linear de uma série Id é também Id Assim se Xt ª I0 então Zt D a C bXt ª I0 3 Se Xt ª I d1 e Yt ª I d2 então Zt D aXt C bYt ª I d2 em que d1 d2 4 Se Xt ª I d e Yt ª I d então Zt D aXt C bYt ª I d d é geralmente igual a d mas em alguns casos d d veja o tópico sobre cointegração na Seção 2111 Como se pode ver devese prestar muita atenção na combinação de duas ou mais séries temporais que sejam integradas de ordem diferente Para entender por que isso é importante considere o modelo de regressão de duas variáveis do Capítulo 3 ou seja Sob as premissas clássicas dos MQO sabemos que 2161 em que as letras pequenas como de costume indicam desvio a partir dos valores médios Suponha que Yt seja I0 mas Xt seja I1 isto é a primeira é estacionária e a última não é Uma vez que Xt é não estacionária sua variância aumentará indefinidamente dominando portanto o termo numerador na Equação 2161 resultando que ØO2 convergirá para zero assintoticamente em amostras grandes e não terá nem mesmo uma distribuição assintótica16 217 O fenômeno da regressão espúria Para verificar porque as séries temporais estacionárias são tão importantes considere os próximos dois modelos de passeio aleatório 2171 2172 em que geramos 500 observações de ut a partir de ut ª N0 1 e 500 observações de vt em vt ª N0 1 e presumimos que os valores iniciais tanto de Y quanto de X eram zero Também presumimos que ut e vt são serialmente não correlacionados bem como mutuamente não correlacionados Como agora você já sabe ambas as séries temporais são não estacionárias isto é elas são I1 ou exibem tendências estocásticas 16 Esse ponto devese a MADDAlA et al op cit p 26 742 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais Suponha que façamos a regressão de Yt em relação a Xt Uma vez que Yt e Xt são processos não correlacionados I1 o R2 a partir da regressão de Y em X deveria tender a zero isto é não deveria haver qualquer relação entre as duas variáveis Mas espere até ver os resultados da regressão Como se pode ver o coeficiente de X tem alta significância estatística e embora o valor R2 seja baixo ele é de maneira estatística significativamente diferente de zero Com base nesses resultados podemos ser tentados a concluir que há uma relação estatística significativa entre Y e X apesar de que a priori não deveria haver nenhuma Isso é em resumo o fenômeno de regressão espúria ou sem sentido inicialmente descoberto por Yule17 Yule demonstrou que a correlação espúria poderia persistir em uma série temporal não estacionária mesmo se uma amostra fosse muito grande O fato de haver algo de errado na regressão anterior é sugerido pelo valor d extremamente baixo de Durbin Watson que sugere uma autocorrelação de primeira ordem muito forte De acordo com Granger e Newbold uma R2 d é uma boa regra de bolso para suspeitar que a regressão estimada seja espú ria como no exemplo citado Podese acrescentar que o R2 e a estatística t assim como a regressão espúria são enganosos e os t estatísticos não são distribuídos como distribuição t de Student e então não pode ser utilizado para testar hipóteses sobre os parâmetros Que os resultados da regressão apresentados acima sejam insignificantes isso pode ser facilmente verificado por meio da regressão das primeiras diferenças de Yt D 1Yt sobre as primeiras diferenças de Xt D 1Xt lembre que embora Yt e Xt sejam não estacionários suas primeiras diferenças são estacionárias Nessa regressão você descobrirá que R2 é praticamente zero como deveria ser e a d DurbinWatson é cerca de 2 No Exercício 2124 solicitaremos que você estime essa regressão e verifique a afirmação que acabamos de fazer Embora exagerado esse exemplo nos lembra que se deve ser extremamente cuidadoso ao condu zir a análise da regressão baseada em uma série temporal que exibe tendências estocásticas E deve mos ser extremamente cautelosos ao ler os resultados da regressão baseados nas variáveis I1 Como exemplo veja o Exercício 2126 De certo modo isso vale para as séries temporais sujeitas a tendên cias determinísticas um exemplo disso é dado no Exercício 2125 218 Testes de estacionariedade Neste ponto o leitor provavelmente já tem uma boa ideia acerca da natureza do processo estocás tico estacionário e de sua importância Na prática enfrentamos duas questões importantes 1 como descobrir se uma dada série temporal é estacionária 2 Se descobrimos que uma série temporal é não estacionária há uma forma de podermos tornála estacionária Adotaremos a primeira pergunta nesta seção e discutiremos a segunda pergunta na Seção 2110 Antes de prosseguirmos devemos ter em vista que estamos preocupados principalmente com a estacionariedade fraca ou covariânciaestacionariedade Embora haja vários testes de estacionarieda de analisaremos apenas aqueles que são destacadamente discutidos na literatura específica Nesta seção discutiremos dois testes 1 análise gráfica e 2 o teste de correlograma Em decorrência da importância atribuída ao teste de raiz unitária no passado recente ele será discutido na próxima seção Ilustraremos esses testes com exemplos apropriados 17 yUlE G U why do we sometimes get nonsense correlations between time series A study in sampling and the nature of time series Journal of the Royal Statistical Society v 89 p 164 1926 Para simulações abrangentes de Monte Carlo sobre regressões espúrias veja GrANGEr C w J NEwBOlD P Spurious regressions in econometrics Journal of Econometrics v 2 p 111120 1974 Capítulo 21 Econometria de séries temporais alguns conceitos básicos 743 1 análise gráfica Como observado anteriormente antes que se prossiga com os testes formais é sempre prudente organizar a série temporal sob estudo como fizemos nas Figuras 211 e 212 para os dados da série temporal da economia americana postada no site do livro Os gráficos dão uma pista inicial sobre a natureza provável da série temporal Tome por exemplo a série temporal do PIB demonstrada na Figura 211 Veremos que ao longo do período estudado o logaritmo do PIB tem aumentado isto é demonstra uma tendência ao aumento o que sugere talvez que a média do PIB foi modificada Isso talvez sugira que o log da série do PIB seja não estacionário Isso é também mais ou menos verdadei ro quanto à série temporal da economia americana apresentada na Figura 212 Essa intuição é o ponto de partida de mais testes formais de estacionariedade 2 Função de correlação Fac e correlograma Um teste simples de estacionariedade é baseado na assim chamada função de correlação FAC A FAC com defasagem k denotada por ρk é definida como 2181 em que a covariância com defasagem k e a variância são aquelas anteriormente definidas Observe que se k D 0 Ω0 D 1 por quê Desde que tanto a covariância como a variância são mensuradas nas mesmas unidades de medida Ωk é um número sem unidades ou puro Ele se situa entre 1 e C1 como qualquer correlação coefi ciente faz Se colocarmos Ωk contra k o gráfico que obteremos é conhecido como correlograma da população Uma vez que na prática apenas temos a realização amostra de um processo estocástico pode mos apenas computar a função de correlação amostral ΩOk Para isso precisamos primeiro calcular a covariância da amostra com defasagem k O k e a variância da amostra O 0 definidas como18 2182 2183 em que n é o tamanho da amostra e Y é a média da amostra Sendo assim a função de correlação amostral com defasagem k é 2184 que é simplesmente a razão da covariância da amostra com defasagem k e a variância da amostra O gráfico de ΩOk contra k é conhecido como correlograma amostral Como um correlograma amostral permite descobrir se uma série temporal particular é estacionária Para esse propósito permitanos primeiro apresentar os correlogramas amostrais do processo aleatório puramente de ruído branco e de um processo de passeio aleatório Voltemos ao modelo de passeio aleatório sem deslocamento 21313 Lá geramos uma amostra de 500 termos de erro os u da dis tribuição normal padrão O correlograma desses 500 termos de erro puramente aleatório estão na Figura 216 apresentamos esse correlograma com até 30 defasagens Comentaremos brevemente o processo de escolher a extensão da defasagem 18 A rigor deveremos dividir a covariância da amostra com defasagem k por n k e a variância amostral por n 1 em vez de por n por quê em que n é o tamanho da amostra 744 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais Por enquanto apenas observe a coluna incluída como AC que é a função de correlação amostral e o primeiro diagrama à esquerda classificado como Autocorrelação A linha vertical sólida nesse diagrama representa o eixo zero as observações à direita da linha são valores positivos e aquelas à esquerda da linha são valores negativos Como fica muito claro por meio desse diagrama para um processo de ruído puramente branco a autocorrelação gira em torno de zero em várias defasagens Essa é a imagem de um correlograma de uma série temporal estacionária Sendo assim se o corre lograma de uma série temporal econômica real assemelhase ao correlograma de uma série tempo ral de ruído branco podemos dizer que a série temporal é provavelmente estacionária Agora observe o correlograma de uma série de passeio aleatório como gerada por exemplo pela Equação 21313 A imagem é semelhante à da Figura 217 A característica que mais se destaca nesse correlograma é que os coeficientes de autocorrelação nas diversas defasagens são realmente muito altos chegando até mesmo a uma defasagem acima de 33 trimestres Na verdade se considerarmos defasagens acima de 60 trimestres os coeficientes de autocorrelação serão mui to altos o coeficiente é cerca de 07 na defasagem de 60 trimestres A Figura 217 apresenta o correlograma característico de uma série temporal não estacionária o coeficiente de autocorrela ção começa com um valor alto e diminui muito lentamente em direção a zero à medida que a de fasagem aumenta Figura 216 Correlograma de termo de erro u ou de ruído branco AC D autocorrelação PAC D autocorrelação parcial veja o Capítulo 22 Estat Q D estatística Q Prob D probabilidade Q Capítulo 21 Econometria de séries temporais alguns conceitos básicos 745 Agora vejamos um exemplo concreto Examinemos o correlograma da série temporal do LPIB esboçado com os dados da série temporal da economia norteamericana postados no site do livro veja a Seção 211 O correlograma com defasagens acima de 36 é demonstrado na Figura 218 O correlograma do LPIB com mais de 36 defasagens também mostra um padrão semelhan te ao modelo de correlograma de passeio aleatório da Figura 217 O coeficiente de autocorrela ção começa com um valor muito alto na defasagem 1 0977 e diminui muito lentamente Desse modo parece que a série temporal do LPIB é não estacionária Se você esboçar os correlogramas de outras séries temporais da economia norteamericana apresentadas nas Figuras 211 e 212 verá também um padrão similar o que leva à conclusão de que todas as séries temporais são não estacionárias elas podem ser não estacionárias na média na variância ou em ambas Duas questões práticas podem ser colocadas aqui Primeiro como escolhemos o tamanho da defasagem para computar a função de autocorrelação Segundo como decidir se um coeficiente de correlação em uma certa defasagem é estatisticamente significativo A resposta é apresentada a seguir Figura 217 Correlograma de uma série temporal de passeio aleatório Veja a Figura 216 para as definições Q 746 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais A escolha da extensão da defasagem Essa é basicamente uma questão empírica Uma regra de bolso é computar a função de correlação de um terço até um quarto da extensão da série temporal Uma vez que para os nossos dados econô micos temos 244 observações trimestrais por essa regra as defasagens de 61 a 81 trimestres são sufi cientes Para economizar espaço exibimos apenas 36 defasagens no gráfico da função de autocor relação na Figura 218 A melhor recomendação é começar com defasagens suficientemente grandes e então reduzilas por algum critério estatístico como o Akaike ou o critério de informação Schwarz discutidos no Capítulo 13 Por outro lado podemse utilizar os seguintes testes estatísticos significado estatístico dos coeficientes de correlação Considere por exemplo o correlograma da série temporal do LPIB dada na Figura 218 Como decidimos se o coeficiente de correlação de 0780 na defasagem 10 trimestres é estatisticamente Figura 218 Correlograma do LPIB norte americano entre 1947I e 2007IV Veja a Figura 216 para as definições Q Capítulo 21 Econometria de séries temporais alguns conceitos básicos 747 significativo A significância estatística de qualquer ΩOk pode ser julgada por seu erro padrão Bartlett demonstrou que se uma série temporal é puramente aleatória isto é ela exibe ruído branco veja a Figura 216 os coeficientes de correlação amostral ΩOk são aproximadamente19 2185 isto é em amostras grandes os coeficientes de correlação amostral são normalmente distribuídos com a média zero e a variância igual a 1 sobre o tamanho da amostra Uma vez que temos 244 observações a variância é 1244 º 00041 e o erro padrão é Seguindo as propriedades da dis tribuição padrão normal o intervalo de confiança de 95 para qualquer população Ωk é 2186 Em outras palavras 2187 Se o intervalo anterior inclui o valor zero não rejeitamos a hipótese de que o verdadeiro Ωk seja zero mas se esse intervalo não inclui 0 rejeitamos a hipótese de que o verdadeiro Ωk seja zero Aplicando isso ao valor estimado de ΩO10 D 0873 o leitor pode verificar que o intervalo de confiança de 95 para o verdadeiro Ω10 é 0873 ß 01254 ou 07476 0998420 Obviamente esse intervalo não inclui o valor de zero sugerindo que somos 95 confiantes de que o verdadeiro Ω10 é significante mente diferente de zero21 Como se pode verificar mesmo com a defasagem 20 Ω20 estimado é estatis ticamente significante no nível de 5 Em vez de testar a significância da estatística de qualquer coeficiente de correlação podemos testar a hipótese conjunta de que todos os Ωk até determinadas defasagens são simultaneamente iguais a zero Isso pode ser feito por meio da estatística Q desenvolvida por Box e Pierce definida como22 2188 em que n D tamanho da amostra e m D tamanho da defasagem A estatística Q é frequentemente uti lizada como um teste para verificar se uma série temporal é um ruído branco Em amostras grandes é aproximadamente distribuída como a distribuição quiquadrado com m graus de liberdade Em uma aplicação se o Q computado excede o valor crítico Q a partir da distribuição de quiquadrado no nível escolhido de significância podese rejeitar a hipótese nula de que todos os Ωk verdadeiros são zero no mínimo alguns deles devem ser não zero Uma variante da estatística Q de BoxPierce é a estatística LjungBox LB definida como23 2189 19 BArTlETT M S On the theoretical specification of sampling properties of autocorrelated time series Journal of the Royal Statistical Society Série B 1946 v 27 p 2741 20 O tamanho de nossa amostra de 244 observações é razoavelmente grande para usar a aproximação normal 21 Por outro lado se você dividir o valor estimado de qualquer Ωk pelo erro padrão de para um n suficien temente grande você obterá o valor padrão o Z cuja probabilidade pode ser facilmente obtida com base na tabela padrão normal Então para o Ω10 D 0780 estimado o valor de Z é 078001066 D 732 aprox Se o verdadeiro Ω10 fosse de fato zero a probabilidade de obter um valor Z igual a 732 ou maior seria muito peque na portanto rejeitase a hipótese de que o verdadeiro Ω10 seja zero 22 BOX G E P PiErCE D A Distribution of residual autocorrelations in autoregressive integrated moving average time series models Journal of the American Statistical Association 1970 v 65 p 115091526 23 lJUNG G M BOX G E P On a measure of lack of fit in time series models Biometrika 1978 v 66 p 6672 748 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais Embora nas amostras grandes tanto a estatística Q quanto a LB seguem a distribuição de qui quadrado com m graus de liberdade a estatística LB descobriu ter melhores mais poderosos no sentido estatístico propriedades de amostras pequenas do que a estatística Q24 Voltando ao exemplo LPIB dado na Figura 218 o valor da estatística Q até a defasagem 36 é cerca de 4096 A probabilidade de obter tal valor Q sob a hipótese nula de que a soma dos quadrados de 36 coeficientes de correlação estimados é zero é praticamente zero como mostra a última coluna daquelas figuras Portanto a conclusão é de que a série temporal LPIB é provavelmente não estacio nária ou seja reforça nosso palpite com base na Figura 211 de que a série LPIB pode ser não esta cionária No Exercício 2116 pedimos que você confirme que as outras quatro séries temporais da economia norteamericana também são não estacionárias 219 O teste da raiz unitária Um teste de estacionariedade ou não estacionariedade que se tornou amplamente popular nos últimos anos é o teste de raiz unitária Primeiro vamos explicálo ilustrálo e depois considerar algumas de suas limitações O ponto de partida é o processo de raiz unitária estocástico que discutimos na Seção 214 Co meçamos com 2141 em que ut é um termo de erro de ruído branco Sabemos que se Ω D 1 isto é no caso da raiz unitária a Equação 2141 tornase um modelo de passeio aleatório sem deslocamento que sabemos ser um processo estocástico não estacionário Sendo assim por que não fazer apenas a regressão de Yt sobre seu valor defasado de um período Yt1 e verificarmos se o Ω estimado é estatisticamente igual a 1 Se for isso então Yt será não estacionário Essa é a ideia geral que está por trás do teste de estacionariedade de raiz unitária Entretanto não podemos estimar a Equação 2141 pelos MQO e testar a hipótese de que Ω D 1 pelo teste habitual t porque esse teste é rigorosamente viesado no caso de uma raiz unitária Desse modo manipulamos a Equação 2141 como se segue subtraia Yt1 de ambos os lados da Equação 2141 para obter 2191 que pode também ser escrita como 2192 em que D Ω 1 e 1 como sempre é o primeiro operador da diferença Na prática por conseguinte em vez de estimarmos a Equação 2141 estimamos a Equação 2192 e testamos a hipótese nula de que D 0 sendo a hipótese alternativa 0 veja a nota de rodapé 25 Se D 0 então Ω D 1 isto é temos uma raiz unitária o que significa que a série temporal sob consideração é não estacionária Antes que prossigamos estimando a Equação 2192 podemos observar que se D 0 a Equação 2192 se tornará 2193 Uma vez que ut é um termo de erro de ruído branco ele é estacionário o que significa que as primeiras diferenças de uma série temporal de passeio aleatório são estacionárias um ponto que já estabelecemos 24 As estatísticas Q e lB podem não ser apropriadas em todos os casos Para uma posição crítica veja MADDAlA et al op cit p 19 Capítulo 21 Econometria de séries temporais alguns conceitos básicos 749 Agora vamos voltar à estimação da Equação 2192 Isso é bastante simples tudo o que temos a fazer é tomar as primeiras diferenças de Yt fazer a regressão dessas em Yt1 e ver se o coeficiente angular estimado D O é zero ou não Se é zero concluímos que Yt é não estacionária mas se é ne gativo concluímos que Yt é estacionária25 A única questão é qual teste utilizar para descobrir se o coeficiente estimado de Yt1 na Equação 2192 é zero ou não Você pode estar tentado a dizer por que não utilizar o costumeiro teste t Infelizmente sob a hipótese nula de que D 0 ou seja ρ D 1 o valor t do coeficiente estimado de Yt1 não segue a distribuição t mesmo em grandes amostras ou seja não possui uma distribuição assintótica normal Qual é a alternativa Dickey e Fuller demonstraram que sob a hipótese nula de que D 0 o valor estimado t do coeficiente de Yt1 na Equação 2192 segue a estatística ø tau26 Esses autores computaram os valores fundamentais da estatística ø segundo as simulações de Monte Carlo Uma amostra desses valores fundamentais é dada no Apêndice D Tabela D7 A tabela é limitada mas MacKinnon preparou tabelas mais extensas que são agora incorporadas em diversos pacotes econo métricos27 Na literatura específica a estatística ou teste de tau é conhecida como teste Dickey Fuller DF em homenagem aos seus descobridores Curiosamente se a hipótese de que D 0 for rejeitada a série temporal é estacionária poderemos utilizar o costumeiro teste t Student Tenha em vista que o teste DickeyFuller é unilateral porque a hipótese alternativa é que 0 ou Ω 1 O procedimento real para a implementação do teste DF envolve várias decisões Ao discutirmos a natureza do processo de raiz unitária nas Seções 214 e 215 observamos que um processo de passeio aleatório pode ou não ter deslocamento ou ele pode ter tanto tendências determinísticas quanto esto cásticas Para permitir as várias possibilidades o teste DF é estimado de três formas diferentes isto é sob três diferentes hipóteses nulas Yt é um passeio aleatório 2192 Yt é um passeio aleatório com deslocamento 2194 Yt é um passeio aleatório com deslocamento em torno de uma tendência determinística 2195 em que t é a variável de tendência ou temporal Em cada caso as hipóteses são Hipótese nula H0 D 0 há uma raiz unitária ou a série temporal é não estacionária ou ela pos sui uma tendência estocástica Hipótese alternativa H1 0 a série temporal é estacionária possivelmente em torno de uma tendência determinística28 Se a hipótese nula for rejeitada significa que 1 Yt é estacionária com média zero no caso da Equação 2192 ou 2 Yt é estacionária com média não zero no caso da Equação 2194 No caso da Equação 2195 podemos testar 0 nenhuma tendência estocástica e Æ 0 a existência de uma tendência determinística simultaneamente utilizando o teste F mas utilizando os valores fun damentais tabulados por Dickey e Fuller Notase que uma série temporal pode conter tanto a tendên cia estocástica quanto a determinística É extremamente importante observar que os valores fundamentais do teste tau para verificar a hipó tese de que D 0 são diferentes para cada uma das três especificações anteriores do teste DF o que pode 25 Uma vez que D Ω 1 para que se tenha a estacionariedade Ω deve ser menor do que um Para isso acontecer deve ser negativo 26 DiCKEy D A FUllEr w A Distribution of the estimators for autoregressive time series with a unit root Journal of the American Statistical Association v 74 p 427431 1979 Veja também FUllEr w A Introduction to statistical time series Nova york John wiley Sons 1976 27 MACKiNNON J G Critical values of cointegration tests in ENGlE r E GrANGEr C w J Eds Longrun economic relationships readings in cointegration Nova york Oxford University Press 1991 cap 13 28 rejeitamos qualquer possibilidade de que 0 porque nesse caso Ω 1 em que a série temporal será explosiva 750 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais ser visto claramente no Apêndice D Tabela D7 Além disso se por exemplo a especificação 2194 estiver correta mas fizermos a estimação da Equação 2192 estaremos cometendo um erro de especi ficação cujas consequências já conhecemos no Capítulo 13 O mesmo é verdadeiro se estimarmos a Equação 2194 em vez da verdadeira Equação 2195 De fato não há forma de saber com qual espe cificação começar Algumas tentativas e erros são inevitáveis não obstante a garimpagem de dados O procedimento de estimação real é o seguinte estime a Equação 2192 ou a Equação 2193 ou a Equação 2194 pelos MQO divida o coeficiente estimado de Yt1 em cada caso pelo seu erro padrão para computar a estatística tau ø e consulte as tabelas DickeyFuller ou qualquer pacote estatístico Se o valor absoluto computado da estatística tau ø exceder o valor crítico nas estatís ticas tau DickeyFuller e MacKinnon rejeitaremos a hipótese de que D 0 e nesse caso a série temporal será não estacionária Por outro lado se o valor absoluto calculado ø não exceder o valor crítico de tau não rejeitaremos a hipótese nula o que quer dizer que a série temporal será não estacio nária Assegurese de que sejam usados os valores apropriados de ø Na maioria das aplicações o valor de tau será negativo Portanto podemos dizer que se o valor crítico negativo de tau computado for menor do que mais negativo do que o valor crítico de tau rejeitaremos a hipótese nula a série tem poral será estacionária caso contrário não a rejeitaremos a série temporal será não estacionária Vamos voltar à série temporal do PIB americano Para essa série os resultados das três re gressões 2192 2194 e 2195 são como se segue a variável dependente em cada caso é ΔYt Δ LPIBt em que LPIB é o logaritmo do PIB real 2196 2197 2198 Nosso interesse principal em todas essas regressões está no valor t D ø do coeficiente LPIBt1 Se você observar a Tabela D7 do Apêndice D verá que os valores críticos de ø de 5 para uma amostra do tamanho 250 o número mais próximo à nossa amostra de 244 observações são 195 sem intercepto sem tendência 288 com intercepto mas sem tendência e 343 com intercepto e com tendência O EViews e outros pacotes estatísticos fornecem valores fundamentais para o ta manho da amostra utilizado na análise Antes de examinarmos os resultados devemos decidir qual dos três modelos podem ser apropria dos Devemos rejeitar o modelo 2196 porque o coeficiente de LPIBt1 que é igual a é positivo Mas uma vez que D Ω 1 um d positivo implicaria que Ω 1 Embora seja possível na teoria rejeitamos isso porque neste caso a série temporal LPIB seria explosiva29 Sendo assim restamnos os modelos 2197 e 2198 Em ambos os casos o coeficiente estimado d é negativo implicando que o Ω estimado é menor do que 1 Para esses dois modelos os valores estimados Ω são 09984 e 09731 respectivamente A única pergunta agora é se há valores estatisticamente significativos abai xo de 1 para que declaremos que a série temporal do PIB é estacionária Para o modelo 2197 o valor estimado ø é 15294 enquanto o valor crítico de 5 de ø confor me observamos acima é 288 Sendo que em termos absolutos o valor anterior é menor do que o último nossa conclusão é de que a série temporal LPIB não é estacionária30 29 Mais tecnicamene uma vez que a Equação 2192 é uma equação de diferenças de primeira ordem a cha mada condição de estabilidade requer que Ω 1 30 Em outras palavras o valor computado ø deveria ser mais negativo do que o valor fundamental ø que não é o caso aqui Portanto a conclusão permanece Uma vez que em geral esperase que seja negativo a estatística estimada ø terá um sinal negativo Então um grande valor negativo ø é geralmente uma indicação de estacionariedade Capítulo 21 Econometria de séries temporais alguns conceitos básicos 751 O caso é o mesmo para o modelo 2198 O valor computado de ø de 18102 em termos abso lutos é menor do que o valor crítico de 5 de 343 Portanto com base na análise gráfica no correlograma e no teste de DickeyFuller a conclusão é de que para os períodos trimestrais de 1947 e 2007 a série temporal do PIB norteamericano foi não estacionária ela continha uma raiz unitária ou possuía uma tendência estocástica o teste DickeyFuller aumentado DFa Ao conduzir o teste DF como nas Equações 2192 2194 e 2195 admitimos que o termo de erro ut era não correlacionado Mas para os casos em que os ut são correlacionados Dickey e Fuller desenvolveram outro teste conhecido como teste DickeyFuller aumentado DFA Este é realiza do por meio da extensão das três equações anteriores adicionando os valores defasados da variável dependente 1Yt De modo mais específico suponha que utilizemos a Equação 2195 O teste DFA consiste aqui em estimar a seguinte regressão 2199 em que t é um termo de erro de ruído branco puro e etc O número de termos de diferenças defasados a serem incluídos é frequentemente determinado empiricamente a ideia é incluir termos suficientes para que o termo de erro na Equação 2199 seja serialmente não correlacionado para que possamos obter uma estimativa não viesada de o coefi ciente defasado de Yt1 O EViews 6 possui uma opção que automaticamente seleciona a extensão da defasagem baseada em Akaike Schwarz e outros critérios de informação No DFA ainda testamos se D 0 e o teste ADF segue a mesma distribuição assintótica da estatística DF assim os mesmos valores fundamentais podem ser utilizados Para uma ideia sobre esse procedimento estimamos a Equação 2199 para a série do PIB Na medida em que temos os dados trimestrais decidimos utilizar quatro defasagens Os resultados da regressão DFA são os seguintes31 21910 O valor t D ø do coeficiente do LPIBt1 defasado D é 23443 o que em termos absolutos é muito menor do que o valor crítico de ø no nível de significância de 10 de 31378 novamente sugerindo que mesmo depois de cuidar de possíveis autocorrelações no termo de erro a série LPIB é não estacionária Nota o comando trend no EViews gera automaticamente a variável de tendência temporal determinística Isso poderia ser o resultado de escolhermos apenas quatro valores defasados de 1LPIB Utiliza mos o critério Schwarz usando 14 valores defasados de 1LPIB que dão o valor ø de 18102 Mesmo assim esse valor ø não era significativo no nível de 10 o valor fundamental tau neste nível era de 31376 Parece que o LPIB é não estacionário Testando a significância de mais de um coeficiente o teste F Suponha que estimemos o modelo 2195 e testemos a hipótese de que Ø1 D Ø2 D 0 isto é o modelo de passeio aleatório é sem deslocamento e tendência Para testar essa hipótese conjunta po demos utilizar o teste F restrito discutido no Capítulo 8 Isto é estimamos a Equação 2195 a re gressão irrestrita e estimamos a Equação 2195 novamente sem o intercepto e a tendência Então utilizamos o teste F restrito como demonstrado na Equação 869 exceto que não podemos usar a 31 Diferenças com defasagem de ordem mais alta foram consideradas mas apresentaramse como insignificantes 752 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais tabela convencional F para conseguir os valores fundamentais F Como fizeram com a estatística ø Dickey e Fuller desenvolveram os valores críticos de F para essa situação uma amostra disso é dada no Apêndice D Tabela D7 Um exemplo é apresentado no Exercício 2127 os testes de raiz unitária phillipsperron32 Um importante hipótese do teste DF é que os termos de erro ut são distribuídos de forma idenpen dente e idêntica O teste ADF ajusta o teste DF para tratar de possíveis correlações seriais nos termos de erro ao adicionar os termos de diferença defasados do regressando Phillips e Perron utilizam os métodos estatísticos não paramétricos para tratar da correlação serial nos termos de erro sem adicio nar os termos de diferença defasados Uma vez que a distribuição assintótica do teste PhillipsPerron é a mesma da estatística do teste ADF não trataremos deste assunto agora Testando as mudanças estruturais Os dados macroeconômicos introduzidos na Seção 211 veja o site do livro para os dados reais são para o período 19472007 um período de 61 anos Nesse período a economia norteamericana experi mentou muitos ciclos de negócios de durações variadas Os ciclos de negócios marcamse por períodos de recessão e de expansão É muito provável que um ciclo de negócios seja diferente de outro o que pode refletir as quebras estruturais ou mudanças estruturais na economia Por exemplo considere o primeiro embargo do petróleo em 1973 Ele quadruplicou os preços do petróleo Novamente os preços crescem substancialmente depois do segundo embargo do petróleo em 1979 Naturalmente esses choques afetarão o comportamento da economia Se formos regredir os gastos de consumo pessoal sobre a renda pessoal disponível o intercepto a inclinação ou ambos devem modificarse de um ciclo de negócios para outro lembrese do teste Chow de quebras estru turais Isso é o que significam as mudanças estruturais Perron por exemplo argumentou que os testes padrão da hipótese de raiz unitária podem não ser confiáveis na presença de mudanças estruturais33 Há várias formas de testar as mudanças estruturais e de explicálas a mais simples envolve o uso de variáveis dummy Mas uma discussão dos vários testes de quebras estruturais nos levarão além dos objetivos deste capítulo e é melhor deixar isso para as referências34 Entretanto veja o Exercício 2128 uma crítica aos testes de raiz unitária35 Já discutimos vários testes de raiz unitária e há muitos mais A questão é por que há tantos testes de raiz unitária A resposta está no tamanho e na potência desses testes Por tamanho de teste que remos dizer o nível de significância a probabilidade de cometer um erro Tipo I e por potência de um teste queremos indicar a probabilidade de rejeitar a hipótese nula quando ela é falsa A potência de um teste é calculada pela subtração da probabilidade de um erro Tipo II por ½ de 1 o erro Tipo II é a probabilidade de aceitar uma falsa hipótese nula A potência máxima é 1 A maioria dos testes de raiz unitária é baseada na hipótese nula de que a série temporal em consideração possui uma raiz unitária ela é não estacionária A hipótese alternativa é que a série temporal seja estacionária Tamanho do teste No Capítulo 13 fizemos a distinção entre os níveis nominais e verdadeiros de significância O teste DickeyFuller é sensível à maneira como ele é conduzido Lembre que discutimos três variedades 32 PhilliPS P C B PErrON P Testing for a unit root in time series regression Biometrika vl 75 p 335346 1988 O teste PhillipsPerron agora é incluído em vários pacotes de software 33 PErrON P The great crash the oil price shock and the unit root hypothesis Econometrica v 57 p 1361 1401 1989 34 Para uma discussão acessível veja STOCK James h Mark w wATSON James h Introduction to econometrics 2 ed Boston PearsonAddisonwesley 2007 p 565571 Para uma discussão mais aprofundada veja MADDAlA G S KiM inMoo Unit roots cointegration and structural change Nova york Cambridge University Press 1998 35 Para uma discussão detalhada veja MillS Terrence C op cit p 8788 Capítulo 21 Econometria de séries temporais alguns conceitos básicos 753 de teste DickeyFuller 1 um passeio aleatório puro 2 um passeio aleatório com deslocamento e 3 um passeio aleatório com deslocamento e tendência Se por exemplo o modelo verdadeiro for 1 mas o estimamos 2 e concluímos que por exemplo no nível de 5 a série temporal é estacio nária essa conclusão pode estar errada porque o nível verdadeiro de significância nesse caso é muito maior do que 536 O tamanho da distorção poderia também resultar da exclusão dos compo nentes das médias móveis do modelo sobre médias móveis veja o Capítulo 22 Potência do teste A maioria dos testes do tipo DickeyFuller tem baixa potência eles tendem a aceitar a hipótese nula da raiz unitária mais frequentemente do que seria seguro Esses testes podem encontrar uma raiz unitária mesmo quando não existe nenhuma Há várias razões para isso Primeiro a potência depen de da amplitude de tempo dos dados mais do que do mero tamanho da amostra Para um exemplo de amostra de tamanho n a potência é maior quando a amplitude é maior Portanto um teste ou testes de raiz unitária baseado em 30 observações em uma extensão de tempo de 30 anos pode ter mais potência do que um baseado em por exemplo 100 observações ao longo de uma extensão de tempo de 100 dias Segundo se Ω º 1 mas não exatamente 1 o teste de raiz unitária pode declarar que tal série temporal é não estacionária Terceiro esses tipos de testes admitem uma única raiz unitária eles admitem que a série temporal dada é I1 Mas se uma série temporal for integrada de ordem mais alta do que 1 por exemplo I2 haverá mais do que uma raiz unitária No último caso podese utili zar o teste DickeyPantula37 Quarto se há quebras estruturais na série temporal veja o capítulo sobre as variáveis dummy em virtude por exemplo dos embargos do petróleo da Opep os testes de raiz unitária podem não dar conta delas Ao aplicar os testes de raiz unitária devese portanto ter em mente suas limitações É claro ocorreram modificações nesses testes feitas por Perron e Ng Elliot Rothenberg e Stock Fuller e Leybounre38 Por causa disso Maddala e Kim defendem que os testes tradicionais DF ADDF e PP deveriam ser descartados Na medida em que os pacotes econométricos incorporam os novos testes isso pode muito bem acontecer Mas devemos acrescentar que ainda não há nenhum teste sistemati camente poderoso da hipótese de raiz unitária 2110 Transformando a série temporal não estacionária Agora que conhecemos os problemas associados à série temporal não estacionária a questão prática é o que fazer Para evitarmos o problema da regressão espúria que pode surgir da regressão de uma série temporal não estacionária em uma ou mais séries temporais não estacionárias temos de transformar as séries temporais não estacionárias para tornálas estacionárias O método de transfor mação depende de as séries temporais serem diferença estacionária DE ou a tendência estacionária TE Consideraremos cada um desses métodos na sequência processos de diferença estacionária Se uma série temporal tem uma raiz unitária as primeiras diferenças dessas séries temporais são estacionárias39 A solução aqui é tomar as primeiras diferenças das séries temporais Voltando para a nossa série temporal do LPIB dos Estados Unidos já vimos que ela possui uma raiz unitária Agora vamos ver o que acontece se considerarmos as primeiras diferenças da série LPIB 36 Para um experimento de Monte Carlo quanto a isso veja ChArEMZA et al op cit p 114 37 DiCKEy D A PANTUlA S Determining the order of differencing in autoregressive processes Journal of Business and Economic Statistics v 5 p 455461 1987 38 Uma discussão sobre esses testes pode ser encontrada em MADDAlA et al op cit cap 4 39 Se uma série temporal é I2 ela conterá duas raízes unitárias e neste caso teremos que diferenciar duas vezes Se ela for Id deverá ser diferenciada d vezes em que d é qualquer número inteiro 754 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais Seja 1LPIBt D LPIBt LPIBt1 Por conveniência seja Dt D 1LPIBt Agora considere a se guinte regressão 21101 O valor crítico do ø de DickeyFuller ao nível de significância de 1 é 34574 Uma vez que ø D t calculado de 110204 é mais negativo do que o valor crítico concluímos que a série das primeiras diferenças do LPIB é estacionária ela é I0 Isso é demonstrado na Figura 219 Se compararmos a Figura 219 com a Figura 211 veremos a diferença óbvia entre os dois PIBs processo estacionário em tendência Como vimos na Figura 215 o processo de tendência estacionária é estacionário em torno da linha de tendência Portanto a maneira mais simples de fazer tal série temporal estacionária é regredila no tempo e os resíduos dessa regressão então serão estacionários Em outras palavras realize a seguinte regressão 21102 em que Yt é a série temporal em estudo e t é variável tendencial medida cronologicamente Agora 21103 será estacionária uOt é conhecida como série temporal linearmente sem tendência É importante observar que a tendência pode ser não linear Por exemplo ela pode ser 21104 que é uma série tendencial quadrática Se for esse o caso os resíduos a partir da Equação 21104 serão agora séries temporais quadraticamente sem tendência Deve ser assinalado que se uma série temporal for estacionária nas diferenças mas a tratarmos como tendência estacionária isso será chamado de subdiferenciação Por outro lado se uma série temporal for de tendência estacionária mas a tratarmos como estacionária nas diferenças isso será chamado de superdiferenciação As consequências desses tipos de erros de especificação podem ser 005 003 004 002 001 0 001 002 003 48 24 1 96 120 168 144 192 240 216 264 72 DLPIB Período Série temporal da DLPIB Figura 219 Primeira diferenças do LPIB norte americano de 1947 a 2007 trimestralmente Capítulo 21 Econometria de séries temporais alguns conceitos básicos 755 sérias dependendo de como se lida com as propriedades da correlação serial dos termos de erro re sultantes40 Para ver o que acontece se confundirmos uma série com tendência estacionária com uma série diferença estacionária ou viceversa a Figura 2110 mostra as primeiras diferenças do LPIB e os resíduos do LPIB estimados por meio da regressão do processo de tendência estacionária 21102 A observação dessa figura diz que as primeiras diferenças do LPIB real são estacionárias como confirmado pela regressão 21101 mas os resíduos da linha de tendência RESI1 não o são Resumindo é muito importante aplicar o tipo certo de estacionarização para os dados se elas não são ainda estacionárias A maioria dos mercados financeiros gera preço taxa ou dados dos rendi mentos que são não estacionários devido à tendência estocástica mais do que à tendência determinís tica Raramente é apropriado a remoção de tendência dos dados ao ajustar a linha de tendência e tomar desvios Em vez disso os dados devem sofrer remoção de tendência por meio das primeiras diferen ças normalmente dos logaritmos das taxas e preços porque então os dados estacionários transfor mados corresponderão aos retornos do mercado41 2111 Cointegração regressão de uma série temporal com raiz unitária contra outra série temporal com raiz unitária Afirmamos que a regressão de uma série temporal não estacionária em outra série temporal não estacionária pode produzir uma regressão espúria Consideremos os dados da série temporal de des pesas de consumo pessoal reais e renda real disponível introduzidos na Seção 211 veja o site do li vro para obter dados reais Submetendo essas séries temporais individualmente para a análise da raiz unitária descobriremos que as duas são I1 elas contêm uma tendência estocástica É bem possível que as duas séries compartilhem a mesma tendência para que a regressão de uma ou de outra não seja necessariamente espúria Para sermos específicos utilizaremos os dados da série temporal da economia norteamericana veja a Seção 211 e o site do livro e efetuaremos a seguinte regressão de LDCP em LRPD 21111 40 Para uma discussão detalhada sobre isso veja MADDAlA et al op cit Seção 27 41 AlEXANDEr Carol op cit p 324 Figura 2110 As primeiras diferenças 1LPIB e desvios a partir da tendência RESI1 para o LPIB 19472007 trimestralmente 005 003 004 002 001 0 002 004 003 001 005 49 25 1 97 121 169 145 193 1LPIB 241 217 265 73 Período RESI1 756 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais em que L denota o logaritmo Ø2 é a elasticidade das despesas de consumo pessoal reais com respeito à renda real pessoal disponível Para propósitos ilustrativos ela será chamada de elasticidade de con sumo Vamos escrever isso assim 21112 Suponhamos que submetamos ut à análise da raiz unitária e descubramos que ela é estacionária ela é I0 Essa é uma situação interessante porque embora LDCPt e LRPDt sejam individualmente I1 isto é tenham tendências estocásticas sua combinação linear 21112 é I0 Supostamente a combinação linear elimina a tendência estocástica em duas séries Se considerarmos consumo e renda duas variáveis I1 as economias definidas como renda consumo poderiam ser I0 Como resul tado uma regressão do consumo em relação à renda como na Equação 21111 seria significativa não espúria Nesse caso dizemos que as duas variáveis são cointegradas Economicamente falan do as duas variáveis serão cointegradas se tiverem uma relação de longo prazo ou de equilíbrio entre elas A teoria econômica é frequentemente expressa em termos de equilíbrio como a teoria quantitativa da moeda de Fischer ou a teoria da paridade do poder de compra PPP apenas para citar algumas Em resumo desde que verifiquemos que os resíduos das regressões como 21111 são I0 ou estacionários a metodologia de regressão tradicional incluindo os testes t e F que consideramos exaustivamente é aplicável aos dados que envolvem a série temporal não estacionária A valiosa contribuição dos conceitos de raiz unitária cointegração etc serve para forçarnos a descobrir se os resíduos da regressão são estacionários Como Granger observa Um teste para a cointegração pode ser pensado como um préteste para evitar as situações de regressão espúria42 Na linguagem da teoria da cointegração uma regressão como a Equação 21111 é conhecida como regressão de cointegração e o parâmetro de inclinação Ø2 é conhecido como parâmetro de cointegração O conceito de cointegração pode ser estendido para o modelo de regressão con tendo os regressores k Nesse caso teremos parâmetros de cointegração k Teste de cointegração Vários métodos para testar a cointegração foram propostos na literatura especializada Considere mos aqui um método comparativamente simples chamado de teste de raiz unitária de DickeyFuller ou teste DickeyFuller aumentado sobre os resíduos estimados da regressão de cointegração43 Teste EngleGranger ou teste EngleGranger aumentado Já sabemos como aplicar os testes de raiz unitária de DickeyFuller ou DickeyFuller aumentado Tudo o que temos a fazer é estimar uma regressão como a Equação 21111 obter os resíduos e usar os testes DickeyFuller ou DickeyFuller aumentado44 Entretanto há uma precaução a tomar Uma vez que o ut estimado é baseado no parâmetro de cointegração estimado Ø2 os valores críticos de DickeyFuller ou DickeyFuller aumentado não são muito apropriados Engle e Granger calcularam esses valores que podem ser encontrados nas referências45 Então os testes DickeyFuller ou 42 GrANGEr C w J Developments in the study of cointegrated economic variables Oxford Bulletin of Economics and Statistics 1986 v 48 p 226 43 há essa diferença entre os testes para a raiz unitária e os testes para a cointegração Como David A Dickey Dennis w Jansen e Daniel i Thornton observam Os testes para as raízes unitárias são realizados em séries temporais univariadas isto é únicas Por sua vez a cointegração lida com a relação entre um grupo de variáveis em que incondicionalmente cada uma delas possui uma raiz unitária Veja os artigos dos autores citados A primer on cointegration with an application to money and income Economic Review p 59 marabr 1991 Federal reserve Bank of St louis Como o nome sugere esse artigo é uma excelente introdução ao teste de cointegração 44 Se o DCP e o rPD não são cointegrados qualquer combinação linear deles será não estacionária e o ut será também não estacionário 45 ENGlE r F GrANGEr C w Cointegration and error correction representation estimation and testing Econometrica 1987 v 55 p 251276 Capítulo 21 Econometria de séries temporais alguns conceitos básicos 757 DickeyFuller aumentado neste contexto são conhecidos como testes EngleGranger EG e EngleGranger aumentado Contudo vários pacotes de software apresentam agora esses valores críticos juntamente com outros resultados Vamos ilustrar esses testes Utilizando os dados introduzidos na Seção 211 e encontrados no site do livro primeiro regredimos os LDCPC contra os LRPDC e obtemos a seguinte regressão 21113 Uma vez que o LDCP e o LRPD são individualmente não estacionários há a possibilidade de que essa regressão seja espúria Mas quando realizamos um teste de raiz unitária sobre os resíduos obtidos da Equação 21113 obtemos os seguintes resultados 21114 Os valores críticos assintóticos de 5 e 10 de EngleGranger são cerca de 334 e 304 respectiva mente Portanto os resíduos da regressão não são estacionários no nível de 5 Seria difícil aceitar essa razão já que a teoria econômica sugere que deveria haver uma relação estável entre DCP e RPD Vamos reestimar a Equação 21113 incluindo a variável de tendência e então verificar se os resíduos dessa equação são estacionários Primeiro apresentamos os resultados e depois discutimos o que pode acontecer 21113a Para verificar se os resíduos dessa regressão são estacionários obtemos os seguintes resultados compare com a Equação 21114 21114a Nota uOt é o resíduo da Equação 2111 3a O teste DickeyFuller agora mostra que esses resíduos são estacionários Mesmo se utilizarmos o DickeyFuller aumentado com várias defasagens os resíduos ainda serão estacionários O que ocorre aqui Embora os resíduos da regressão 21114a sejam estacionários isto é sejam I0 eles são estacionários em torno de uma tendência temporal determinística a tendência aqui sendo linear Ou seja os resíduos são I0 mais a tendência linear Como anteriormente observado uma série temporal pode apresentar tanto tendência determinística quanto estocástica Antes de prosseguirmos deveria ser observado que nossos dados de série temporal cobrem um longo período de tempo 61 anos É bem possível que devido às mudanças estruturais na economia norte americana ao longo desse período nossos resultados e conclusões tendam a serem diferentes No Exer cício 2128 será solicitado que você verifique essa possibilidade cointegração e mecanismo de correção de erro mcE Acabamos de demonstrar que assumindo a existência de uma turbulência linear LDCP e LRPD parecem ser cointegrados isto é há uma relação de longo prazo ou de equilíbrio entre os dois É 758 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais claro a curto prazo pode haver desequilíbrio Portanto podemos tratar o termo de erro na seguinte equação como o erro de equilíbrio E podemos utilizar esse termo de erro para vincular o compor tamento de curto prazo do DCP para o valor de longo prazo 21115 O mecanismo de correção de erro MCE primeiramente utilizado por Sargan46 e posteriormente popularizado por Engle e Granger corrige o desequilíbrio Um teorema importante conhecido como teo rema de representação de Granger afirma que se duas variáveis Y e X são cointegradas a relação entre as duas pode ser expressa como um mecanismo de correção de erro Para verificar o que isso signi fica voltemos ao nosso exemplo DCPRPD Agora considere o seguinte modelo 21116 em que t é um termo de erro de ruído branco e ut1 é o valor defasado do termo de erro na Equação 21115 A equação do mecanismo de correção de erro 21115 afirma que 1 LDCP depende de 1 LRPD e também do termo de erro de equilíbrio47 Se o último é diferente de zero o modelo está fora de equilíbrio Suponha que 1 LRPD seja zero e ut1 seja positivo Isso significa que LDCPt1 é elevado demais para estar em equilíbrio isto é LDCPt1 está acima do seu valor de equilíbrio de Já que se espera que Æ2 seja negativo o termo Æ2ut1 é negativo e portanto LDCPt será negativo para recuperar o equilíbrio Se LDCPt estiver abaixo do seu valor de equilíbrio ele começará a cair no próximo período para corrigir o erro de equilíbrio daí o nome mecanismo de correção de erro Do mesmo modo se ut1 for negativo LDCP estiver abaixo do seu valor de equi líbrio Æ2ut1 será positivo o que tornará 1 LDCPt positivo levando LDCPt a aumentar no período t Assim o valor absoluto de Æ2 decide quão rapidamente o equilíbrio será recuperado Na prática estimamos ut1 por Tenha em mente que se espera que o coeficiente de correção de erro Æ2 seja negativo por quê Voltando ao nosso exemplo ilustrativo a contraparte empírica da Equação 21116 é 21117 Estatisticamente o termo MCE é significativo sugerindo que DCP ajustase a RPD com uma defasa gem apenas cerca de 12 da discrepância entre o DCP de longo prazo e o de curto prazo é corrigido dentro de um trimestre Por meio da regressão 21117 verificamos que a elasticidade do consumo de curto prazo é de cerca de 029 A elasticidade de longo prazo é de cerca de 058 que pode ser verificada pela Equação 21113a Antes de concluirmos esta seção a precaução externada por S G Hall mere ce ser lembrada Embora o conceito de cointegração seja claramente uma importante base teórica do modelo de correção de erro há ainda vários problemas que envolvem sua aplicação os valores críticos e o desempenho da amostra pequena de muitos desses testes são desconhecidos para um vasto conjunto de modelos a inspeção informada do correlograma pode ainda ser uma ferramenta importante48 46 SArGAN J D wages and prices in the United Kingdom a study in econometric methodology in wAlliS K F hENDry D F Eds Quantitative economics and econometric analysis Oxford UK Basil Blackwell 1984 47 A seguinte discussão é baseada em KOOP op cit p 159160 e PETErSON Kerry op cit seção 85 48 hAll S G An application of the Granger and Engle twostep estimation procedure to the United Kingdom aggregate wage data Oxford Bulletin of Economics and Statistics v 48 n 3 p 238 ago 1986 Veja também CAMPBEll John y PErrON Pierre Pitfalls and opportunities what macroeconomists should know about unit roots NBEr National Bureau of Economic research Macroeconomics Annual 1991 p 141219 Capítulo 21 Econometria de séries temporais alguns conceitos básicos 759 2112 Algumas aplicações econômicas Concluímos este capítulo analisando alguns exemplos concretos ExEmplo 211 M1 Oferta mensal de moeda l nos Estados Unidos de janeiro de 1959 a 1 de março de 2008 A Figura 2111 mostra a oferta de moeda M1 para os Estados Unidos de janeiro de 1959 a 1º de março de 2008 Com base em nosso conhecimento de estacionariedade parece que a série temporal de oferta de moeda M1 é não estacionária o que pode ser confirmado pela análise de raiz unitária Nota para economizar espaço não forneceremos os dados reais que podem ser obtidos com o Federal reserve Board ou o Federal reserve Bank de St louis 21121 Figura 2111 Oferta de moeda norteamericana ao longo de janeiro de 1959 a março 2008 1400 1200 1000 600 200 400 800 0 118 59 1 236 295 413 354 472 590 531 177 Oferta de moeda Número de observações Os valores críticos de ø de 15 e 10 são 39811 34210 e 31329 Uma vez que o valor t de 230 é menos negativo do que quaisquer desses valores fundamentais a conclu são é de que a série temporal M1 é não estacionária ela contém uma raiz unitária ou é I1 Mesmo quando vários valores defasados de 1Mt à la DickeyFuller aumentado foram intro duzidos a conclusão não se modifica Por outro lado as primeiras diferenças da oferta de moeda M1 mostraram ser estacionárias verifique isso ExEmplo 212 A taxa de juros dos EUAReino Unido janeiro de 1971 a abril de 2008 A Figura 2112 fornece o gráfico da taxa de juros a partir de janeiro de 1971 até abril de 2008 por um total de 286 observações Neste momento você deveria ser capaz de iden tificar essa série temporal como não estacionária levando a cabo os testes de raiz unitária obtemos as seguintes estatísticas ø 082 sem intercepto sem tendência 196 intercepto e 133 intercepto e tendência Cada uma dessas estatísticas em valores absolutos era inferior aos seus valores críticos de ø com base nas tabelas apropriadas DickeyFuller então confirmase a impressão do gráfico de que a série temporal da taxa de juros dos EUAreino Unido é não estacionária Continua 760 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais ExEmplo 212 Continuação Figura 2112 A taxa de juros dos EUAReino Unido janeiro de 1971 a abril de 2008 28 26 24 22 20 18 14 12 16 10 Jan 1971 Mês Ano Jan 1977 Jan 1983 Jan 1995 Jan 1989 Jan 2001 Jan 2007 Taxa de câmbio ExEmplo 213 Índice de preços ao consumidor norteamericano IPC janeiro de 1947 a março de 2008 A Figura 2113 mostra o iPC norteamericano a partir de janeiro de 1947 até março de 2008 em um total de 733 observações A série do iPC como a série do M1 considerada an teriormente mostra uma tendência de alta sustentada O exercício de raiz unitária deu os seguintes resultados 21122 Figura 2113 IPC norte americano janeiro de 1947 a março de 2008 200 100 50 150 0 1 73 146 292 365 219 438 511 584 657 730 IPC Números das observações O valor t D ø de iPCt1 é 177 O valor crítico a 10 é 31317 Posto que em termos absolutos o t computado seja menor do que o ø fundamental a conclusão é de que o iPC não é uma série temporal estacionária Podemos caracterizála como uma tendência estocás tica por quê Entretanto se tomarmos as primeiras diferenças da série iPC vamos desco brir que ela é estacionária Portanto o iPC é uma série temporal estacionária em diferenças Capítulo 21 Econometria de séries temporais alguns conceitos básicos 761 ExEmplo 214 As taxas de letras do Tesouro norteamericano de 3 e 6 meses são cointegradas A Figura 2114 apresenta as taxas de letras do Tesouro norteamericano de 3 e 6 meses maturidade constante a partir de janeiro de 1982 até março de 2008 por um total de 315 observações O gráfico mostra que as duas taxas são cointegradas isto é há uma relação de equilíbrio entre as duas Com base na teoria financeira esperaríamos que esse fosse o caso senão os arbitradores explorariam qualquer discrepância entre as taxas de curto e longo pra zo Antes de tudo verificaremos se as duas séries temporais são estacionárias Segundo o modelo de passeio aleatório puro sem intercepto nem tendência ambas as taxas eram estacionárias incluindo o intercepto a tendência e a diferença defasada os resultados sugeriam que as duas taxas deveriam ser de tendência estacionária o coeficiente da tendência em ambos os casos foi negativo e significativo ao redor do nível de 7 Dependendo de quais resultados aceitemos as duas taxas são tanto estacionárias como estacionárias com tendência Fazendo a regressão da taxa de letras do Tesouro de 6 meses contra a taxa de letras do Tesouro de 3 meses obtivemos a seguinte regressão 21123 Figura 2114 Taxas de letras do Tesouro de 3 e 6 meses maturidade constante 16 14 12 10 8 6 4 2 0 1982 1983 1985 1987 1989 1991 1993 1995 1997 1999 2001 2003 2007 2005 Taxa Ano 6 M 3 M Aplicando o teste de raiz unitária aos resíduos da regressão precedente descobrimos que os resíduos eram estacionários sugerindo que as taxas de letras do Tesouro de 3 e 6 meses eram cointegradas Com base nesse conhecimento obtivemos o seguinte modelo de corre ção de erro 21124 em que uOt1 é o valor defasado do termo de correção de erro a partir do período anterior Como esses resultados mostram 019 da discrepância nas duas taxas no mês anterior é eliminada nesse mês49 Além disso as mudanças de curto prazo na taxa de letras do Tesou ro de 3 meses são rapidamente refletidas na taxa de letras do Tesouro de 6 meses na me dida em que o coeficiente de inclinação entre as duas seja 08992 Não deveria ser uma surpresa encontrar isso em vista da eficiência dos mercados financeiros norteamericanos 49 49 Uma vez que ambas as taxas de letras do Tesouro estão em porcentagem isso sugeriria que se a taxa de letras do Tesouro de 6 meses fosse maior do que a taxa de letras do Tesouro de 3 meses mais do que o esperado a priori no último mês este mês ela seria reduzida a em 019 pontos percentuais para restituir a relação de longo prazo entre as duas taxas de juros Para a teoria sobre a relação entre as taxas de juros de curto e longo prazo veja qualquer livro sobre moeda e bancos e leia sobre a estrutura de termo das taxas de juros 762 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais Resumo e conclusões 1 A análise da regressão baseada nos dados da série temporal admite implicitamente que as séries temporais subjacentes são estacionárias Os clássicos testes t F etc baseiamse nessa premissa 2 Na prática a maioria das séries temporais econômicas é não estacionárias 3 Dizse que o processo estocástico é fracamente estacionário se sua média variância e autocova riâncias forem constantes ao longo do tempo ou seja eles são invariantes no tempo 4 Em um nível informal a estacionariedade fraca pode ser testada pelo correlograma de uma série temporal que é um gráfico de autocorrelação em várias defasagens Para a série temporal esta cionária o correlograma enfraquece rapidamente enquanto para a série temporal não estacionária ele enfraquece gradualmente Para uma série puramente aleatória as autocorrelações em todas as defasagens 1 e superiores são zero 5 Em um nível formal a estacionariedade pode ser verificada ao descobrirmos se a série temporal contém uma raiz unitária Os testes DickeyFuller e DickeyFuller aumentado podem ser uti lizados para esse propósito 6 Uma série temporal econômica pode ser estacionária com tendência ou estacionária em dife renças Uma série temporal estacionária com tendência tem uma tendência determinística en quanto uma série temporal estacionária em diferenças possui uma tendência variável ou estocástica A prática comum de incluir a variável temporal ou de tendência em um modelo de regressão para remover a tendência dos dados é justificável apenas para a série temporal estacionária com tendên cia Os testes DickeyFuller e DickeyFuller aumentado podem ser aplicados para determinar se uma série temporal é estacionária com tendência ou estacionária em diferenças 7 A regressão de uma variável de série temporal sobre uma ou mais variáveis de séries temporais pode proporcionar resultados sem sentido ou espúrios Esse fenômeno é conhecido como regressão espúria Uma forma de prevenirse contra ela é descobrir se as séries temporais são cointegradas 8 Cointegração significa que a despeito de serem individualmente não estacionárias uma combi nação linear de duas ou mais séries temporais pode ser estacionária Os testes EngleGranger e EngleGranger aumentado podem ser utilizados para descobrir se duas ou mais séries temporais são cointegradas 9 A cointegração de duas ou mais séries temporais sugere que há relação de longo prazo ou de equilíbrio entre elas 10 O mecanismo de correção de erro desenvolvido por Engle e Granger é um meio de reconci liar o comportamento de curto prazo de uma variável econômica com o seu comportamento de longo prazo 11 O campo da econometria de séries temporais está evoluindo Os resultados estabelecidos e os testes são em alguns casos experimentais e ainda resta muito trabalho Uma questão importante que precisa de uma resposta é por que algumas séries temporais econômicas são estacionárias e outras não estacionárias ExErcícios 211 O que quer dizer estacionariedade fraca 212 O que quer dizer série temporal integrada 213 Qual o significado de raiz unitária 214 Se uma série temporal é I3 quantas vezes você teria de diferenciála para tornála estacionária 215 O que são os testes DickeyFuller e DickeyFuller aumentado 216 O que são os testes EngleGranger e EngleGranger aumentado 217 Qual o significado de cointegração 218 Qual a diferença se há alguma entre os testes de raiz unitária e os de cointegração 219 O que é uma regressão espúria Capítulo 21 Econometria de séries temporais alguns conceitos básicos 763 2110 Qual a ligação entre cointegração e regressão espúria 2111 Qual a diferença entre tendência determinística e tendência estocástica 2112 O que significa processo estacionário com tendência e processo estacionário em diferenças 2113 O que é um modelo de passeio aleatório 2114 Para um processo estocástico de passeio aleatório a variância é infinita Você concorda Por quê 2115 O que é o mecanismo de correção de erro Qual sua relação com a cointegração Exercícios aplicados 2116 Utilizando os dados da série temporal da economia dos Estados Unidos apresentados no site do livro obtenha correlogramas amostrais de até 36 defasagens para a série temporal LDCP LRPD LLC lucros e LDividendos Qual padrão geral você verifica Intuitivamente qualis dessas séries temporalis parecem ser estacionárias 2117 Para cada série temporal do Exercício 2116 utilize o teste DickeyFuller para descobrir se essas séries contêm uma raiz unitária Se existir como você caracterizaria tais séries temporais 2118 Continue com o Exercício 2117 Como você decidiria se um teste DickeyFuller aumenta do é mais apropriado do que um teste DickeyFuller 2119 Considere as séries temporais dos dividendos e dos lucros nos dados da série temporal da economia norteamericana apresentados no site do livro Posto que os dividendos depen dem dos lucros considere o seguinte modelo simples a Você esperaria que essa regressão sofresse o fenômeno da regressão espúria Por quê b São cointegradas as séries temporais dos lucros e dos dividendos Como você testa isso explicitamente Se depois de testar descobrir que elas são cointegradas a sua resposta à pergunta a mudaria c Empregue o mecanismo de correção de erro para estudar o comportamento de curto e longo prazos dos dividendos em relação aos lucros d Se você examinar individualmente as séries de dividendos e de lucros elas exibem ten dências estocásticas ou determinísticas Quais testes utilizaria e Admita que dividendos e lucros são cointegrados Em vez de estimar a regressão dos dividendos contra os lucros estime a regressão dos lucros contra os dividendos Essa regressão é válida 2120 Considere as primeiras diferenças da série temporal fornecidas pelos dados da série tempo ral da economia norteamericana apresentado no site do livro e crie um gráfico com elas Obtenha também um correlograma de cada série temporal e de até 36 defasagens O que o impressiona quanto a esses correlogramas 2121 Em vez de estimar uma regressão dos dividendos contra os lucros na forma do nível supo nha que você estime uma regressão das primeiras diferenças dos dividendos contra as pri meiras diferenças dos lucros Você incluiria o intercepto nessa regressão Por quê Apresente seus cálculos 2122 Prossiga com o exercício anterior Como faria um teste para verificar se a regressão das primeiras diferenças é estacionária Neste exemplo o que você esperaria a priori e por quê Apresente todos os cálculos 2123 Com base nos dados sobre as novas construções do setor privado britânico X para o perío do de 1948 a 1984 Terence Mills obteve os seguintes resultados da regressão Capítulo 21 Econometria de séries temporais alguns conceitos básicos 763 Opcional MillS Terence C op cit p 127 Notação levemente alterada 764 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais Nota o valor crítico de ø no nível de 5 é 295 e o valor crítico ø no nível de 10 é 260 a Com base nesses resultados a série temporal de novas construções é estacionária ou não estacionária Por outro lado há uma raiz unitária nessa série temporal Como você sabe disso b Se você fosse utilizar o teste t habitual o valor t observado seria estatisticamente signi ficativo Com base nisso você concluiria que essa série temporal é estacionária c Agora considere os seguintes resultados da regressão em que 12 é o operador das segundas diferenças isto é a primeira diferença da primeira diferença O valor ø estimado é agora estatisticamente significativo O que você pode dizer sobre a estacionariedade da série temporal em questão Nota o propósito da regressão anterior é descobrir se há uma segunda raiz unitária na série temporal 2124 Gere duas séries de passeio aleatório como indicado nas Equações 2171 e 2172 e estime a regressão de uma contra a outra Repita o exercício mas utilize as suas primeiras diferenças e verifique que nessa regressão o valor R2 é cerca de zero e o d DurbinWatson é próximo de 2 2125 Para mostrar que duas variáveis cada qual com uma tendência determinística podem levar à regressão espúria Charemza et al obtiveram a seguinte regressão baseada em 30 obser vações a Que tipo de tendência Y exibe E X b Crie um gráfico das duas variáveis e um da linha de regressão Que conclusão geral você extrai desses gráficos 2126 Com base nos dados para o período de 1971I a 1988IV no Canadá os seguintes resultados da regressão foram obtidos 1 2 764 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais ChArEMZA et al op cit p 93 Capítulo 21 Econometria de séries temporais alguns conceitos básicos 765 3 em que M1 é a oferta de moeda PIB é o produto interno bruto ambos medidos em bilhões de dólares canadenses ln é o logaritmo natural e uOt representa os resíduos estimados da primeira regressão a Interprete as regressões 1 e 2 b Você suspeita que a regressão 1 seja espúria Por quê c A regressão 2 é espúria Como você sabe disso d Com base nos resultados da regressão 3 você modificaria sua conclusão de b Por quê e Agora considere a seguinte regressão O que essa regressão informa Ajuda a decidir se a regressão 1 é espúria ou não 2127 As seguintes regressões são baseadas nos dados do IPC dos Estados Unidos para o período 19602007 para um total de 48 observações anuais 1 SQR 2 SQR 3 SQR em que SQR D soma dos quadrados dos resíduos a Ao examinar as regressões anteriores o que você pode dizer acerca da estacionariedade da série temporal IPC b Como você escolheria entre os três modelos c A Equação 1 é a Equação 3 menos o intercepto e a tendência Qual você utilizaria para decidir se as restrições envolvidas no modelo 1 são válidas Dica utilize os testes DickeyFuller t e F Utilize os valores aproximados fornecidos no Apêndice D Tabela D7 2128 Como observado no texto pode haver várias quebras estruturais no conjunto de dados da série temporal da economia norteamericana introduzido na Seção 211 Variáveis dummy são um bom modo de incorporar essas variações nos dados Capítulo 21 Econometria de séries temporais alguns conceitos básicos 765 766 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais a Utilizando as variáveis dummy para designar três períodos diferentes relacionados aos em bargos ao petróleo em 1973 e 1979 regrida o logaritmo dos gastos com consumo pessoal no logaritmo da renda pessoal disponível Houve modificações nos resultados Qual sua decisão sobre a premissa da raiz unitária agora b Vários sites listam os ciclos econômicos oficiais que podem ter afetado os dados da série temporal da economia americana discutida na Seção 211 Veja por exemplo httpwww nberorgcyclescyclesmainhtml Utilizando a informação aqui crie variáveis dummy indi cando alguns dos ciclos e verifique os resultados da regressão de LDCP em LRPD Houve modificação 766 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais 767 Econometria de séries temporais previsão Observamos na Introdução que a previsão é uma parte importante da análise econométrica para algumas pessoas é provavelmente a mais importante Como prever as variáveis econômicas como o PIB a inflação as taxas de juros os preços das ações as taxas de desemprego e as outras inúmeras variáveis econômicas Neste capítulo discutiremos dois métodos de previsão que se torna ram muito populares 1 processo autorregressivo integrado de média móvel ARIMA popular mente conhecido como metodologia BoxJenkins1 e 2 vetores autorregressivos VAR Neste capítulo também discutiremos os problemas especiais envolvidos na previsão dos preços dos ativos financeiros como os preços das ações e as taxas de juros Os preços dos ativos são caracteriza dos pelo fenômeno conhecido como aglomeração de volatilidade isto é períodos nos quais eles exibem grandes oscilações para um período prolongado de tempo seguido por um período de tranqui lidade comparativa Devese observar o índice Dow Jones no passado recente Os assim chamados modelos heterocedasticidade condicional autorregressiva ARCH ou heterocedasticidade condi cional autorregressiva generalizada GARCH podem capturar tal aglomeração de volatilidade O tópico da previsão econômica é vasto e livros especializados foram escritos sobre o assunto Nosso objetivo neste capítulo é fornecer ao leitor apenas uma ideia sobre o tema O leitor interessado pode consultar as referências para estudos posteriores Felizmente os mais modernos pacotes econo métricos possuem introduções de fácil utilização para várias das técnicas discutidas neste capítulo A ligação entre este capítulo e o anterior são os métodos de previsão discutidos a seguir que admitem que as séries temporais subjacentes são estacionárias ou que podem tornarse estacionárias com as transformações apropriadas À medida que avançarmos veremos o uso de vários conceitos introduzidos no capítulo anterior 221 Abordagens sobre a previsão econômica Em linhas gerais há cinco abordagens para a previsão econômica baseadas nos dados de séries temporais 1 métodos de suavização exponencial 2 modelos de regressão uniequacionais 3 modelos de regressão de equação simultânea 4 processo autorregressivo integrado de média móvel ARIMA e 5 modelos de vetores autorregressivos VAR métodos de suavização exponencial2 Estes são essencialmente métodos para ajustar uma curva adequada aos dados históricos de uma série temporal dada Há um grande número desses métodos como o da suavização exponencial 1 BOX G P E JENKiNS G M Time series analysis forecasting and control ed rev holden Day São Francisco holden1978 2 Para uma exposição comparativamente simples desses métodos veja MAKriDAKiS Spyros whEElwriGhT Steven C hyNDMAN rob J Forecasting methods and applications 3 ed Nova york John wiley Sons 1998 Capítulo 22 768 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais simples método linear de Holt método HoltWinter e suas variações Embora ainda utilizados em muitas áreas da previsão dos negócios e da economia eles agora são suplantados por outros quatro métodos que mostraremos Não discutiremos os métodos de suavização exponencial neste capítulo visto que isso nos afastaria muito de nossos objetivos modelos de regressão uniequacional A parte principal deste livro dedicase aos modelos de regressão uniequacional Como exemplo considere a função demanda por automóveis Com base na teoria econômica postulamos que a de manda por automóveis é uma função dos preços dos automóveis dos gastos com publicidade da renda do consumidor das taxas de juros como medida do custo do empréstimo e outras variáveis relevantes por exemplo tamanho da família distância da viagem para o trabalho Por meio dos dados da série temporal estimamos um modelo importante para a demanda de automóveis linear loglinear ou não linear que pode ser utilizado para prever a demanda por automóveis no futuro É claro que como observado no Capítulo 5 os erros de previsão aumentam rapidamente se avançamos muito no futuro modelos de regressão de equações simultâneas3 Nos Capítulos 18 19 e 20 consideramos os modelos de equações simultâneas Em seu auge durante os anos 1960 e 1970 modelos elaborados da economia norteamericana baseados em equa ções simultâneas dominaram a previsão econômica Desde então o glamour de tais modelos declinou devido ao seu pobre desempenho especialmente desde que os choques nos preços do petróleo entre 1973 e 1979 causados pelos embargos ao petróleo pela Opep e também devido à chamada crítica de Lucas4 O ponto central dessa crítica como podemos relembrar é que os parâmetros estimados em um modelo econométrico são dependentes da política dominante no período em que o modelo foi estimado e se modificarão se houver uma mudança na política Em resumo os parâmetros estimados não são invariantes na presença de mudanças políticas Por exemplo em outubro de 1979 o FED Banco Central americano modificou dramaticamente sua política monetária Em vez de estabelecer metas para as taxas de juros anunciou que a partir de então monitoraria as taxas de crescimento da oferta de moeda Com tal mudança proferida um mo delo econométrico estimado em dados passados teria pouco valor de previsão no novo regime Nos dias atuais a ênfase do FED modificouse do controle da oferta de moeda para o controle da taxa de juros de curto prazo a federal funds rate modelos arima A publicação por Box e Jenkins de Time series analysis forecasting and control op cit condu ziu a uma nova geração de ferramentas de previsão Popularmente conhecida como metodologia BoxJenkins BJ mas tecnicamente como metodologia ARIMA a ênfase desses métodos não está na construção dos modelos uniequacionais ou de equações simultâneas mas na análise probabilística ou estocástica das propriedades da própria série temporal econômica sob a filosofia deixe os dados falarem por si mesmos Ao contrário dos modelos de regressão no qual Yt é explicado pelos regres sores k X1 X2 X3 Xk os modelos de séries temporais do tipo BJ permitem que Yt seja explicado pelos valores passados ou defasados do próprio Y e dos termos de erro estocástico Por essa razão os modelos ARIMA são por vezes chamados modelos ateoréticos porque não são derivados de nenhuma teoria econômica e as teorias econômicas são frequentemente a base dos modelos de equações simultâneas Observe que a nossa ênfase neste capítulo está nos modelos ARIMA univariados isto é os mo delos ARIMA pertencentes a uma série temporal simples mas a análise pode ser estendida aos modelos ARIMA multivariados 3 Para um tratamento didático do uso de modelos de equação simultânea na previsão veja PiNDyCK robert S rUBiNFElD Daniel l Econometric models economic forecasts 4 ed Nova york McGrawhiil 1998 parte iii 4 lUCAS robert E Econometric policy evaluation a critique in CArNEGiErOChESTEr CONFErENCE SEriES The Phillips curve Amsterdã Northholland 1976 p 1946 Este artigo entre outros valeu a lucas um Prêmio Nobel em economia Capítulo 22 Econometria de sériestemporais previsão 769 modelos Var A metodologia VAR lembra superficialmente a modelagem das equações simultâneas no sentido de que devemos considerar muitas variáveis endógenas em conjunto Contudo cada variável endó gena é explicada por seus valores defasados ou passados e pelos valores defasados de todas as outras variáveis endógenas no modelo normalmente não há variáveis exógenas no modelo No restante deste capítulo discutiremos as abordagens fundamentais de BoxJenkins e VAR sobre a previsão econômica Nossa discussão é elementar e heurística O leitor que desejar aprofundarse mais no assunto deve consultar as referências5 222 Modelagem de séries temporais de acordo com os métodos autorregressivo das médias móveis e ARIMA Para introduzir várias ideias algumas antigas e outras novas vamos trabalhar com os dados da série temporal do PIB dos Estados Unidos introduzido na Seção 211 veja o site do livro para os dados atuais Um desenho dessa série temporal já foi visto nas Figuras 211 LPIB não diferenciado e 219 LPIB com primeiras diferenças lembre que o LPIB na forma nivelada é não estacionário mas na forma de primeira diferença é estacionário Se uma série temporal é estacionária podemos modelála com uma variedade de formas um processo autorregressivo ar Vamos representar por Yt o LPIB no período t Se modelarmos Yt como 2221 em que é a média de Y e ut é um erro aleatório não correlacionado com média zero e variância constante æ2 tratase de um ruído branco então diremos que Yt segue um processo autorregressivo estocástico de primeira ordem ou AR1 já encontrado no Capítulo 12 Aqui o valor de Y no perío do t depende do seu valor no período anterior e de um termo aleatório os valores de Y são expressos como desvios com base em um valor médio Em outras palavras esse modelo informa que o valor previsto de Y no período t é simplesmente alguma proporção D Æ1 mais um choque aleatório ou perturbação no período t novamente os valores Y são expressos em torno dos seus valores médios Mas se considerarmos esse modelo 2222 então diremos que Yt segue um processo autorregressivo de segunda ordem ou AR2 O valor de Y no período t depende do seu valor nos dois períodos prévios os valores de Y sendo expressos em torno dos seus valores médios Em geral podese ter 2223 no caso Yt é um processo autorregressivo de ordem pésima ou ARp Perceba que em todos os modelos anteriores apenas os valores de Y atuais e anteriores estão en volvidos não há outros regressores Nesse sentido dizemos que os dados falam por si mesmos Eles são um tipo de modelo de forma reduzida que encontramos em nossa discussão sobre os modelos de equação simultânea 5 Veja PiNDyCK e rUBiNFElD op cit Parte 3 PANKrATZ Alan Forecasting with dynamic regression models Nova york John wiley Sons 1991 este é um livro prático e hArVEy Andrew The econometric analysis of time series 2 ed Cambridge Mass The MiT Press 1990 este é um livro muito avançado Uma discussão profunda mas acessível pode também ser encontrada em MillS Terence C Time series techniques for economists Nova york Cambridge University Press 1990 770 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais processo de média móvel ma O processo AR que acabamos de discutir não é apenas um mecanismo que pode ter gerado Y Suponha que modelemos Y como se segue 2224 em que π é uma constante e u como antes é um termo de erro estocástico de ruído branco Aqui Y no período t é igual a uma constante mais uma média móvel dos termos de erro atuais e passados Neste caso dizemos que Y segue um processo de média móvel de primeira ordem ou um MA1 Mas se Y segue a expressão 2225 então é um processo MA2 De forma mais geral 2226 é um processo MAq Resumindo um processo de média móvel é apenas uma combinação linear de termos de erro de ruído branco processo autorregressivo de médias móveis arma Claro é muito provável que Y possua características tanto de AR quanto de MA e seja portanto ARMA Então Yt segue um processo ARMA1 1 se pode ser escrito como 2227 porque há um termo autorregressivo e um termo de média móvel Na Equação 2227 µ representa um termo constante Em geral em um processo ARMA p q haverá termos autorregressivos p e termos de média móvel q processo autorregressivo integrado de médias móveis arima Os modelos de séries temporais que já discutimos são baseados na suposição de que as séries temporais envolvidas são fracamente estacionárias no sentido definido no Capítulo 21 Em resumo a média e a variância para uma série temporal fracamente estacionária são constantes e sua covariân cia é invariante no tempo Mas sabemos que muitas séries temporais econômicas são não estacioná rias isto é são integradas por exemplo as séries temporais econômicas introduzidas na Seção 211 do Capítulo 21 são integradas Contudo também vimos no Capítulo 21 que se uma série temporal for integrada de ordem 1 isto é ela é I1 suas primeiras diferenças são I0 isto é estacionárias Da mesma forma se uma série temporal é I2 sua segunda diferença é I0 Em geral se uma série temporal é Id depois de dife renciála d vezes obtemos uma série I0 Se tivermos de diferenciar uma série temporal d vezes para tornála estacionária e aplicarlhe o modelo ARMA p q diremos que a série temporal original é ARIMA p d q ou seja ela é uma série temporal autorregressiva integrada de médias móveis em que p denota os números dos ter mos autorregressivos d o número de vezes que a série deve ser diferenciada antes de tornarse esta cionária e q o número de termos de média móvel Uma série temporal ARIMA 2 1 2 deve ser diferenciada uma vez d D 1 antes de tornarse estacionária e a série temporal estacionária de pri meira diferença pode ser modelada como um processo ARMA 2 2 pois possui dois termos AR e dois MA Claro se d D 0 uma série é estacionária para ARMA p q Observe que um processo Capítulo 22 Econometria de sériestemporais previsão 771 ARIMA p 0 0 significa um processo AR p puramente estacionário um ARIMA 0 0 q significa um processo MA q puramente estacionário Dados os valores de p d e q é possível dizer qual pro cesso está sendo modelado Um ponto importante a ser observado é que ao utilizarmos a metodologia BoxJenkins deve mos ter tanto uma série temporal estacionária quanto uma série temporal que seja estacionária depois de uma ou mais diferenciações A razão para admitir a estacionariedade pode ser explicada como se segue O objetivo do método BoxJenkins é identificar e estimar um modelo estatístico que possa ser interpre tado como tendo sido gerado pelos dados amostrais Se esse modelo estimado for utilizado para a pre visão deveremos admitir que suas características são constantes ao longo do período e parti cularmente ao longo de períodos futuros A simples razão para requerer os dados estacionários é que qualquer mo delo que seja inferido com base nesses dados pode ser interpretado como estacionário ou estável e portanto fornecer uma base válida para a previsão6 223 A metodologia BoxJenkins BJ A principal pergunta é observando uma série temporal como a série do PIB americano na Figura 211 como podemos saber se ela segue um processo AR puro e se isso acontece qual o valor de p ou um processo MA puro e se isso acontece qual o valor de q um processo ARMA e se isso acontece quais os valores de p e q ou um processo ARIMA no caso de precisarmos conhecer os valores de p d e q A metodologia BJ é muito útil para se responder a questão anterior O método consiste em quatro etapas Etapa 1 Identificação Neste estágio descobrese os valores apropriados de p d e q Mostraremos rapidamente como o correlograma e o correlograma parcial auxiliam nessa tarefa Etapa 2 Estimação Depois de identificados os valores apropriados de p e q o próximo estágio é estimar os parâmetros dos termos autorregressivos e dos termos de média móvel incluídos no mode lo Às vezes esse cálculo pode ser feito por mínimos quadrados simples mas às vezes temos de lançar mão de métodos de estimação não linear nos parâmetros Como essa tarefa é agora rotinei ramente feita por vários pacotes estatísticos não devemos ficar preocupados quanto à matemática de estimação o estudante curioso pode consultar as referência sobre isso Etapa 3 Verificação do diagnóstico Após escolhermos um modelo ARIMA específico e tendo estimado seus parâmetros veremos a seguir se o modelo selecionado ajustase aos dados razoavel mente bem para que seja possível que outro modelo ARIMA possa também fazer o trabalho Esse é o motivo da modelagem ARIMABoxJenkins ser mais arte do que ciência uma habilidade conside rável é requerida para escolher o modelo ARIMA correto Um teste simples do modelo selecionado é verificar se os resíduos estimados com base nesse modelo são ruídos brancos se forem poderemos aceitar o ajuste específico do contrário deveremos recomeçar Portanto a metodologia BJ é um processo iterativo veja a Figura 221 Etapa 4 Previsão Uma das razões da popularidade da modelagem ARIMA é seu sucesso na previ são Em muitos casos as previsões obtidas por esse método são mais confiáveis do que as obtidas por meio da modelagem econométrica tradicional especialmente para as previsões de curto prazo Naturalmente cada caso deve ser verificado Com essa discussão geral vamos conferir as quatro etapas com mais detalhes Daqui em diante utilizaremos os dados do PIB introduzidos na Seção 211 veja o site do livro para os dados atualiza dos para ilustrar os vários pontos 6 POKOrNy Michael An introduction to econometrics Nova york Basil Blackwell 1987 p 343 772 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais 224 Identificação As principais ferramentas na identificação são a função de correlação amostral ACF a fun ção de correlação amostral parcial PACF e os correlogramas resultantes que são simplesmen te as representações de ACF e PACF contra a extensão da defasagem No capítulo anterior definimos a ACF Ωk populacional e a função de correlação amostral ACF ΩOk O conceito de autocorrelação parcial é análogo ao conceito de coeficiente de regressão parcial No modelo de regressão múltipla com k variáveis o késimo coeficiente de regressão Øk mede a taxa de variação no valor médio do regressando para uma alteração unitária no késimo regressor Xk mantendo a influência de todos os regressores constantes Da mesma forma a correlação amostral parcial Ωkk mede a correlação entre as observações série temporal que estão separadas por k períodos depois de verificar as correlações nas defasa gens intermediárias defasagens menores do que k Em outras palavras a autocorrelação parcial é a correlação entre Yt e Ytk depois de remover o efeito dos Y intermediários7 Na Seção 711 já intro duzimos o conceito de correlação parcial no contexto da regressão e apresentamos sua relação com as correlações simples Tais correlações parciais são agora costumeiramente computadas pela maio ria dos pacotes estatísticos Na Figura 222 mostramos o correlograma painel a e o correlograma parcial painel b da série do LPIB Ao observarmos essa figura dois fatos destacamse primeiro a ACF decresce muito lenta mente como mostra a Figura 218 até cerca de 22 defasagens as ACF são individual estatística e significativamente diferentes de zero por estarem todas fora dos intervalos de 95 de confiança Em segundo lugar depois da segunda defasagem a função parcial de autocorrelação cai dramaticamente e a maioria das funções parciais após a defasagem 2 são estatisticamente insignificantes com exce ção talvez da defasagem 13 Uma vez que a série temporal do LPIB norteamericano não é estacionária temos de tornála estacionária antes de aplicar a metodologia BoxJenkins Na Figura 219 traçamos as primeiras di ferenças do LPIB Ao contrário da Figura 211 não observamos nenhuma tendência nessa série talvez sugerindo que a série temporal em primeiras diferenças do LPIB seja estacionária8 Uma aplicação formal do teste de raiz unitária DickeyFuller mostra que isso é de fato o que acontece 7 Nos dados das séries temporais uma grande proporção da correlação entre Yt e Ytk pode ser decorrente das correlações com as defasagens intermediárias yt1 yt2 ytkC1 A correlação parcial Ωkk retira a influência dessas variáveis intermediárias 8 É difícil dizer se a variância dessa série é estacionária especialmente em torno de 19791980 O embargo do petróleo de 1979 e a mudança significativa da política monetária do FED de 1979 pode ter algo a ver com a nossa dificuldade 1 Identificação do modelo escolha provisória de p d q 2 Estimação dos parâmetros do modelo escolhido 3 Varificação do diagnóstico os resíduos estimados são ruídos brancos 4 Revisão Sim Ir para Etapa 4 Não Votar à Etapa 1 Figura 221 O método BoxJenkins Capítulo 22 Econometria de sériestemporais previsão 773 100 050 0 050 100 0 10 15 20 25 5 Autocorrelaçao do LPIB Defasagem Fórmulas de Bartlett para intervalos de confiança de 95 MAq 100 050 0 050 0 10 15 20 25 5 Autocorrelações parciais do LPIB Defasagem Intervalos de confiança de 95 ep 1sqrtn a b Figura 222 a correlograma e b correlograma parcial para o LPIB dos Estados Unidos 1947I a 2007IV Podemos também verificar isso por meio dos correlogramas estimados da ACF e da PACF fornecidos nos painéis a e b da Figura 223 Agora temos um padrão bem diferente da função de autocor relação e da função de autocorrelação parcial As funções de autocorrelação nas defasagens 1 2 e 5 parecem estatisticamente diferentes a partir de zero lembremos Capítulo 21 que os limites de confiança aproximados de 95 para Ωk são 01254 e C 01254 Nota como discutido no Capí tulo 21 esses limites de confiança são assintóticos e por isso podem ser considerados aproxima dos Mas em todas as outras defasagens eles não são estatisticamente diferentes de zero Para as correlações parciais apenas as defasagens 1 e 12 parecem ser estatisticamente diferentes de zero Agora como os correlogramas fornecidos na Figura 223 habilitamnos a encontrar o padrão ARMA da série temporal do LPIB Nota consideraremos apenas a série em primeiras diferenças do LPIB porque ela é estacionária Uma maneira de realizar isso é considerar a função de auto correlação a função de autocorrelação parcial e os correlogramas associados de um número sele cionado de processos de ARMA como AR1 AR2 MA1 MA2 ARMA1 1 ARIMA2 2 etc Uma vez que cada um desses processos estocásticos exibe padrões típicos da função de auto correlação e da função de autocorrelação parcial se a série temporal em estudo ajustase a um 774 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais Figura 223 a correlograma e b correlograma parcial para as primeiras diferenças de LPIB dos Estados Unidos 1947I a 2007IV 030 020 010 010 0 020 0 10 15 20 25 5 Autocorrelações do DLPIB Defasagem Fórmulas de Bartlett para intervalos de confiança de 95 MAq 030 020 010 010 0 020 0 10 15 20 25 5 Autocorrelações parciais do DLPIB Defasagem Intervalos de confiança de 95 ep 1sqrtn a b desses padrões podemos identificar a série temporal com aquele processo Naturalmente teremos de aplicar os testes de diagnósticos para descobrir se o modelo ARMA selecionado é razoavel mente preciso Estudar as propriedades dos diversos processos padrão ARIMA consumiria muito espaço O que planejamos fazer é oferecer diretrizes gerais veja a Tabela 221 as referências podem fornecer os detalhes dos vários processos estocásticos Perceba que as funções de autocorrelação e as funções de autocorrelação parcial dos processos ARp e MAq possuem padrões opostos no caso do ARp o AC decresce geometricamente ou exponencialmente mas a função de autocorrelação parcial é interrompida depois de certo número de defasagens enquanto o contrário acontece com um processo MAq Geometricamente esses padrões são exibidos na Figura 224 Capítulo 22 Econometria de sériestemporais previsão 775 Figura 224 ACF e PACF de processos estocásticos selecionados a AR2 Æ1 H 05 Æ2 H 03 b MA2 Ø1 H 05 Ø2 H 03 c ARMA 11 Æ1 H 05 Ø1 H 05 b kk 0 ρ k 0 ρ c k 0 ρ kk 0 ρ a kk 0 ρ k 0 ρ TabEla 221 Padrões teoréticos das ACF e das PACF g a Note Um aviso Uma vez que na prática não observamos as funções de autocorrelação e as funções de autocor relação parcial teóricas e dependemos de seus equivalentes amostrais as funções de autocorrelação e as funções de autocorrelação parcial estimadas não corresponderão exatamente aos seus equivalentes teóricos O que estamos procurando é uma semelhança entre as funções de autocorrelação e as fun ções de autocorrelação parcial teóricas e amostrais para que possam levar na direção certa a construção dos modelos ARIMA E é por isso que a modelagem ARIMA requer muita habilidade o que é claro vem com a prática Identificação ARIMA do PIB dos Estados Unidos Voltando ao correlograma e ao correlograma parcial do LPIB estacionário após a primeira diferença dos Estados Unidos entre 1947I e 2007IV fornecidos na Figura 223 o que podemos verificar Lembrando que as funções de autocorrelação e as funções de autocorrelação parcial são quantida des amostrais não temos bons padrões conforme sugerido na Tabela 221 As autocorrelações painel a decrescem para as primeiras duas defasagens e então com exceção da defasagem 5 o resto delas não é estatisticamente diferente de zero a área cinza exibida nas figuras apresenta os limites de confiança de aproximadamente 95 As autocorrelações parciais painel b com picos nas defasagens 1 e 12 parecem estatisticamente significativas mas o restante delas não o é se o coeficiente da correlação 776 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais Figura 225 a correlograma e b correlograma parcial ou resíduos do modelo MA2 para as primeiras diferenças do LPIB dos Estados Unidos 1947I a 2007IV 020 010 010 0 020 0 10 15 20 25 5 Autocorrelações de Resb Defasagem Fórmula de Bartlett para intervalos de confiança de 95 MAq 020 010 010 0 020 0 10 15 20 25 5 Autocorrelações de Resb Defasagem Intervalos de confiança de 95 ep 1sqrtn a b parcial fosse significativo apenas na defasagem 1 poderíamos têlo identificado como um modelo AR1 Vamos então admitir que o processo que gerou a série LPIB a primeira diferença seja um processo MA2 Tenha em mente que a menos que a função de autocorrelação e a função de auto correlação parcial não sejam bem definidas é difícil escolher um modelo sem tentativa e erro O leitor é encorajado a tentar outros modelos ARIMA na série LPIB com primeiras diferenças 225 Estimação do modelo ARIMA Consideremos que Y t denote as primeiras diferenças do LPIB dos Estados Unidos Então nosso modelo temporariamente identificado de AR é 2251 Capítulo 22 Econometria de sériestemporais previsão 777 Utilizando o MINITAB obtivemos as seguintes estimativas 2252 Deixamos esse modelo como um exercício para que o leitor estime outros modelos ARIMA para a primeira série diferenciada do LPIB 226 Verificação do diagnóstico Como sabemos que o modelo na Equação 2252 ajustase razoavelmente aos dados Um diagnóstico simples é obter resíduos com base na Equação 2252 e obter a função de autocorrela ção e a função de autocorrelação parcial desses resíduos até por exemplo a defasagem 25 A função de autocorrelação e a função de autocorrelação parcial estimadas são exibidas na Figura 225 Como essa figura mostra nenhuma das autocorrelações painel a e autocorrelações parciais painel b é significativa estatística e individualmente Tampouco a soma dos quadrados das 25 autocorrelações como demonstrado pelas estatísticas BoxPierre Q e LjungBox LB veja o Capítulo 21 é estatis ticamente significativa Em outras palavras os correlogramas tanto da autocorrelação quanto da au tocorrelação parcial dão a impressão de que os resíduos estimados por meio da Equação 2252 são puramente aleatórios Portanto não deve haver qualquer necessidade de procurar por outro modelo ARIMA 227 Previsão Lembremos que os dados do PIB referemse ao período entre 1947I a 2007IV Suponha com base no modelo 2252 que queiramos prever o LPIB para os primeiros quatro trimestres de 2008 Mas na Equação 2252 a variável dependente é a variação no LPIB ao longo do trimestre anterior Então se utilizamos a Equação 2252 o que podemos obter são as previsões das variações do LPIB entre o primeiro trimestre de 2008 e o quarto trimestre de 2007 o segundo trimestre de 2008 ao longo do primeiro trimestre de 2008 etc Para obtermos a previsão do nível do LPIB em vez de suas variações podemos desfazer a transformação das primeiras diferenças que utilizamos para obter as variações Mais tecnicamente integramos a série das primeiras diferenças Então para obtermos o valor da previsão do LPIB não do 1LPIB para 2008I reescrevemos o modelo 2251 como 2271 Ou seja 2272 Os valores de π Ø1 e Ø2 já são conhecidos por meio da regressão estimada 2252 Supomos que o valor de u2008I seja zero por quê Portanto podemos facilmente obter o valor previsto para Y2008I A estimativa numérica desse valor previsto é 9 9 Embora pacotes convencionais de computador façam esse cálculo habitualmente mostramos os cálculos deta lhados para ilustrar o mecanismo envolvido 778 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais Assim o valor de previsão do LPIB para o primeiro semestre de 2008 é cerca de 93741 que corresponde a cerca de 11779 bilhões em dólares de 2000 Por acaso o valor atual do PIB real para o primeiro semestre de 2008 foi de 1169309 bilhões o erro da previsão foi uma superestima tiva de 86 bilhões 228 Outros aspectos da metodologia BJ Nos parágrafos anteriores fornecemos apenas uma introdução superficial sobre a modelagem BJ Há vários aspectos dessa metodologia que não consideramos por falta de espaço por exemplo a sazonalidade Muitas séries temporais exibem comportamento sazonal Exemplos disso são as vendas de lojas de departamentos no período de festas o consumo sazonal de sorvete as viagens durante as férias etc Se por exemplo tivermos dados trimestrais sobre as vendas das lojas de departa mentos as vendas mostrarão picos no quarto trimestre Em tais situações podese remover a influência sazonal ao deduzir as diferenças das vendas no quarto trimestre e então decidir que tipo de modelo ARIMA ajustar Analisamos apenas uma única série temporal por vez mas nada impede que a metodologia BJ seja estendida ao estudo simultâneo de duas ou mais séries Uma incursão nesse tópico nos levaria muito longe o leitor interessado pode querer consultar as referências10 Na próxima seção entretanto discutiremos esse tópico no contexto daquilo que é conhecido como autorre gressão vetorial 229 Vetores autorregressivos VAR Nos Capítulos 18 a 20 consideramos os modelos de equações simultâneas ou estruturais Em tais modelos algumas variáveis são tratadas como endógenas e algumas como exógenas ou predetermi nadas exógenas mais endógenas defasadas Antes de estimarmos esses modelos devemos ter certe za de que as equações no sistema são identificadas exatamente ou superidentificadas Essa identificação é frequentemente alcançada ao admitirmos que algumas das variáveis predeterminadas estão presentes apenas em algumas equações Essa decisão é normalmente subjetiva e foi criticada severamente por Christopher Sims11 De acordo com Sims se há uma simultaneidade verdadeira entre um conjunto de variáveis todas elas devem ser tratadas em pé de igualdade não deveria haver qualquer distinção a priori entre as variáveis endógenas e exógenas É com esse espírito que Sims desenvolveu o seu modelo VAR As sementes desse modelo já haviam sido plantadas no teste de causalidade de Granger discutido no Capítulo 17 Nas Equações 17141 e 17142 que explicam o LPIB atual em termos de oferta de moeda defasada e LPIB defasado e oferta de moeda atual em termos de oferta de moeda defasa da e LPIB defasado respectivamente estamos tratando essencialmente de LPIB e de oferta de moeda como um par de variáveis endógenas Não há variáveis endógenas nesse sistema De forma semelhante no Exemplo 1713 examinamos a natureza da causalidade entre a moeda e a taxa de juros no Canadá Na equação da moeda apenas os valores defasados da moeda e da taxa de juros aparecem e na equação da taxa de juros apenas os valores defasados da taxa de juros e da moeda aparecem 10 Para um tratamento acessível desse assunto veja MillS Terence C op cit parte iii 11 SiMS C A Macroeconomics and reality Econometrica 1980 v 48 p 148 Capítulo 22 Econometria de sériestemporais previsão 779 Ambos os exemplos são ilustrações de modelos de vetores autorregressivos o termo autorre gressivo devese à aparência do valor defasado da variável dependente no lado direito e o termo vetor devese ao fato de que estamos lidando com um vetor de duas ou mais variáveis Estimação do Var Voltando ao exemplo da taxa de juros e da moeda canadenses vimos que ao introduzirmos seis defasagens de cada variável como regressores não podíamos rejeitar a hipótese de que havia causa lidade bilateral entre a moeda M1 e taxa de juros R taxa de juros corporativa de 90 dias Isto é M1 afeta R e R afeta M1 Esses tipos de situações são idealmente ajustadas para a aplicação de VAR Para explicar como um VAR é estimado prosseguiremos com o exemplo anterior Por ora admi timos que cada equação contém k valores de defasagem de M como mensurado por M1 e R Neste caso podese estimar cada uma das seguintes equações por MQO12 2291 2292 em que os u são os termos de erro estocástico chamados impulsos ou inovações ou choques na lin guagem do VAR Antes de estimarmos as Equações 2291 e 2292 devemos decidir sobre o comprimento máximo de defasagem k Essa é uma questão empírica temos ao todo 40 observações incluir vários termos defasados consumirá graus de liberdade sem mencionar a introdução da possibi lidade de multicolinearidade incluir muitas defasagens levará a erros de especificação Uma forma de decidir a questão é utilizar um critério como o Akaike ou o Schwarz e escolher qual modelo oferece os menores valores desses critérios É indiscutível que alguma tentativa e erro seja inevitável Para ilustrarmos a mecânica inicialmente usamos quatro defasagens k D 4 de cada variável e utilizando o EViews 6 obtivemos as estimativas dos parâmetros das duas equações anteriores forne cidas na Tabela 222 Observe que embora nossa amostra situese entre 1979I e 1988IV utilizamos a amostra para o período entre 1980I e 1987IV e guardamos as últimas quatro observações para verificar a exatidão da previsão do VAR ajustado Visto que as equações anteriores são regressões por MQO o resultado da regressão fornecido na Tabela 222 deve ser interpretado da maneira habitual Com várias defasagens das mesmas variáveis cada coeficiente estimado não será estatisticamente significativo possivelmente em virtude da mul ticolinearidade Porém coletivamente eles podem ser significativos com base no teste padrão F Examinemos os resultados apresentados na Tabela 222 Primeiro consideremos a regressão M1 Individualmente apenas M1 na defasagem 1 e R nas defasagens 1 e 2 são estatisticamente significa tivas Contudo o valor F é tão alto que não podemos rejeitar a hipótese de que coletivamente todos os termos defasados sejam estatisticamente significativos Voltando à regressão da taxa de juros ve mos que todos os quatro termos de moeda defasada são individualmente e estatisticamente significan tes a 10 ou melhor nível enquanto apenas a variável de taxa de juros defasada de 1 período é significativa Para propósitos comparativos apresentamos na Tabela 223 os resultados do VAR baseados ape nas em 2 defasagens de cada variável endógena Aqui veremos que na regressão da moeda a variá vel de moeda defasada de 1 período e ambos os termos defasados de taxa de juros são individualmente 12 Podese utilizar a técnica surE regressões aparentemente não correlacionadas para estimar as duas equações conjuntamente Contudo uma vez que cada regressão contém o mesmo número de variáveis endógenas de fasadas a estimação por MQO de cada equação produz separadamente estimativas idênticas e eficientes 780 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais TabEla 222 Estimativas dos vetores autorregressivos baseadas em 4 defasagens Determinante da matriz de covariância dos resíduos e estatisticamente significativos Na regressão da taxa de juros ambos os termos de moeda de fasada no nível de 5 aproximadamente e um termo de juro defasado são individualmente significativos Se tivéssemos de escolher entre o modelo da Tabela 222 e o da Tabela 233 qual deles escolhería mos Os valores de informação de Akaike e Schwarz para o modelo da Tabela 222 são respectiva mente 1532 e 1573 enquanto os valores correspondentes para a Tabela 223 são 1510 e 1533 Visto que quanto mais baixos os valores das estatísticas Akaike e Schwarz melhor o modelo parece que o modelo mais parcimonioso apresentado na Tabela 223 é preferível Também consideramos 6 defasagens de cada uma das variáveis endógenas e descobrimos que os valores das estatísticas Akaike e Schwarz foram 1537 e 1598 respectivamente Novamente a escolha parece ser o modelo com dois termos defasados de cada variável endógena isto é o modelo da Tabela 223 previsão com Var Suponha que escolhamos o modelo da Tabela 223 Podemos utilizálo para prever os valores de M1 e R Lembremos que nossos dados cobrem os períodos de 1979I a 1988IV mas não utilizamos os valores de 1988 ao estimarmos os modelos VAR Agora suponha que queiramos prever o valor de M1 para 1988IV isto é o primeiro trimestre de 1988 O valor da previsão para 1988I pode ser obti do como se segue Capítulo 22 Econometria de sériestemporais previsão 781 em que os valores do coeficiente são obtidos com base na Tabela 223 Agora usando os valores adequados de M1 e R com base na Tabela 175 o valor da previsão da moeda para o primeiro trimes tre de 1988 pode ser de 36996 milhões de dólares canadenses O valor real de M1 para 1988I era de 36480 que significa que nosso modelo fez uma previsão superestimada do valor real em cerca de 516 milhões de dólares que é cerca de 14 do M1 real para 1988I Naturalmente essas esti mativas serão modificadas dependendo de quantos valores defasados considerarmos no modelo VAR Deixamos como exercício que o leitor faça a previsão do valor de R para o primeiro trimestre de 1988 e a sua comparação desse valor com o seu valor real para aquele trimestre Var e casualidade Discutimos o tópico da causalidade no Capítulo 17 Lá consideramos os testes de causalidade Granger e Sims Há alguma conexão entre VAR e causalidade No Capítulo 17 Seção 1714 vimos que acima de 2 4 e 6 defasagens havia causalidade bilateral entre M1 e R mas na defasagem 8 não havia nenhuma causalidade entre as duas variáveis Os resultados são mistos Agora podemos recor dar o Capítulo 21 e o teorema da representação de Granger Uma das implicações desse teorema é que se duas variáveis por exemplo Xt e Yt são cointegradas e cada uma é individualmente I1 isto é integrada de ordem 1 cada uma é individualmente não estacionária Xt deve causar Yt por Granger ou Yt deve causar Xt por Granger Em nosso exemplo isso significa que se M1 e R forem individualmente I1 mas forem coin tegrados M1 deve causar R por Granger ou R deve causar M1 por Granger Isso significa que de vemos primeiro descobrir se duas variáveis são I1 individualmente e descobrir se elas são cointegradas Se esse não for o caso toda a questão da casualidade pode tornarse controversa No Exercício 2222 pedese ao leitor que descubra se as duas variáveis são não estacionárias mas TabEla 223 Estimativas dos vetores autorregressivos baseadas em 2 defasagens Determinante da matriz de covariância dos resíduos 782 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais Defasagem Defasagem Defasagem E E E TabEla 224 Resultados da estimação do sistema VAR de segunda ordem para o Texas 1974I a 1988I Fonte Economic Review Federal Reserve Bank of Dallas p 21 jan 1989 Capítulo 22 Econometria de sériestemporais previsão 783 cointegradas Se você fizer o exercício descobrirá que há uma fraca evidência de cointegração entre M1 e R sendo que este é o motivo pelo qual os testes de casualidade discutidos na Seção 1714 estão equivocados alguns problemas da modelagem Var Os defensores da VAR enfatizam as seguinte virtudes do método 1 o método é simples nin guém precisa preocuparse em determinar quais variáveis são endógenas e quais são exógenas todas as variáveis em VAR são endógenas13 2 a estimação é simples o método habitual dos MQO pode ser aplicado em cada equação separadamente 3 as previsões obtidas por esse método são em muitos casos melhores do que as obtidas com base em modelos mais complexos de equações simul tâneas14 Porém os críticos da modelagem VAR apontam os seguintes problemas 1 Diferentemente dos modelos de equações simultâneas um modelo VAR é ateórico porque utiliza menos informação prévia Lembrese de que nos modelos de equações simultâneas a exclusão ou inclusão de certas variáveis tem um papel fundamental na identificação do modelo 2 Devido à sua ênfase na previsão os modelos VAR são menos adaptados para a análise política 3 O maior desafio prático na modelagem VAR é escolher a extensão apropriada das defasa gens Suponha que tenhamos um modelo VAR de três variáveis e decidamos incluir oito defasagens de cada variável em cada equação Você terá 24 parâmetros defasados em cada equação mais o termo constante para um total de 25 parâmetros A menos que o tamanho da amostra seja grande estimar tantos parâmetros consumirá vários graus de liberdade com todos os problemas associados a isso15 4 De modo estrito em um modelo VAR de mvariáveis todas as variáveis m deveriam ser conjuntamente estacionárias Se esse não for o caso teremos de transformar os dados adequadamente por exemplo pela diferença de primeira ordem Como observa Harvey os resultados com base nos dados transformados podem não ser satisfatórios Mais adian te ele observa que A abordagem habitual adotada pelos aficionados pela VAR é portanto o trabalho em níveis mesmo se algumas dessas séries sejam não estacionárias Nesse caso é importante reconhecer o efeito das raízes unitárias sobre a distribuição dos estimadores16 E é ainda pior se o modelo contiver um mix das variáveis I0 e I1 ou seja um mix de variáveis estacionárias e não estacionárias neste caso transformar os dados não será fácil Contudo Cuthbertson argumenta que a análise da cointegração indica que um VAR ape nas não é especificado nas primeiras diferenças se houver alguns vetores cointegrantes pre sentes entre as séries I1 Em outras palavras um VAR somente nas primeiras diferenças omite variáveis estacionárias potencialmente importantes os vetores de correção de erro e vetores de cointegração e portanto as estimativas do parâmetro podem sofrer uma tendên cia de variáveis omitidas17 5 Posto que os coeficientes individuais nos modelos estimados VAR são frequentemente difí ceis de interpretar os adeptos dessa técnica em geral estimam a chamada função de respos ta a impulso ou impulse response function IRF A IRF delineia a resposta da variável 13 Às vezes variáveis puramente exógenas são incluídas para permitir fatores de tendências e sazonais 14 Veja por exemplo KiNAl T rATNEr J B regional forecasting models with vector autoregression the case of New york State Discussion Paper 155 Department of Economics State University of New york at Albany 1982 15 Se tivermos um modelo VAr de m equações com valores defasados p das variáveis m em todos teremos de estimar m pm2 parâmetros 16 hArVEy Andrew The econometric analysis of time series 2 ed Cambridge Mass The MiT Press 1990 p 83 17 CUThBErTSON Keith Quantitative financial economics stocks bonds and foreign exchange Nova york John wiley e Sons 2002 p436 784 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais dependente no sistema VAR aos choques nos termos de erro como u1 e u2 nas Equações 2291 e 2292 Suponha que u1 na equação M1 aumente por um valor de desvio padrão Tal choque ou variação modificará M1 no presente bem como nos períodos futuros Mas visto que M1 aparece na regressão R a variação em u1 terá também um impacto sobre R Da mesma forma uma variação de um desvio padrão em u2 da equação R terá um impacto sobre M1 A IRF delineia o impacto de tais choques por vários períodos no futuro Embora a utili dade da análise IRF seja questionada por pesquisadores ela é o ponto central da análise VAR18 Para uma comparação do desempenho do VAR com outras técnicas de previsão o leitor pode consultar as referências19 uma aplicação de Var um modelo Var da economia do Texas Para testar a sabedoria popular Para onde o petróleo for para lá vai a economia do Texas Thomas Fomby e Joseph Hirschberg desenvolveram um modelo VAR de três variáveis da economia texana para o período entre 1974I e 1988I20 As três variáveis consideradas foram 1 porcenta gem da variação do preço real do petróleo 2 porcentagem da variação do emprego não agrícola do Texas e 3 porcentagem da variação do emprego não agrícola no restante dos Estados Unidos Os autores introduziram o termo constante e os dois valores defasados de cada variável em cada equação Portanto o número de parâmetros estimados em cada equação foi sete Os resultados da estimação por meio dos MQO do modelo VAR são fornecidos na Tabela 224 Os testes F fornecidos na tabela servem para testar a hipótese de que coletivamente os vários coeficientes defasados são zero Por tanto o teste F para a variável x porcentagem da variação do preço real do petróleo demonstra que ambos os termos defasados de x são estatisticamente diferentes de zero a probabilidade de obter um valor F de 125536 sob a hipótese nula de que sejam ambos simultaneamente iguais a zero é muito baixa cerca de 000004 Por outro lado coletivamente os dois valores defasados y porcentagem da variação do emprego não agrícola do Texas não são significativamente diferentes de zero para expli car x o valor F é de apenas 136 Todas as outras estatísticas F devem ser interpretadas de forma se melhante Com base nesses e noutros resultados apresentados no seu artigo Fomby e Hirschenberg con cluem que a sabedoria popular sobre a economia do Texas não é muito precisa já que depois da ins tabilidade inicial resultante dos choques do petróleo da Opep a economia texana é agora menos dependente das flutuações do preço do petróleo 2210 Medindo a volatilidade na série temporal financeira os modelos ARCH e GARCH Como observamos na introdução deste capítulo a séries temporais financeiras bem como os preços das ações as taxas de câmbio as taxas de inflação etc frequentemente apresentam o fenôme no da aglomeração por volatilidade isto é períodos nos quais os preços apresentam grandes osci lações por um período de tempo extenso seguido por períodos nos quais há relativa calma Como Philip Franses observa 18 rUNKlE D E Vector autoregression and reality Journal of Business and Economic Statistics 1987 v 5 p 437 454 19 MCNEES S Forecasting accuracy of alternative techniques a Ccmparison of US macroeconomic forecasts Journal of Business and Economic Statistics v 4 p 515 1986 e MAhMOUD E Accuracy in forecasting a survey Journal of Forecasting 1984 v 3 p 139159 20 FOMBy Thomas B hirSChBErG Joseph G Texas in transition dependence on oil and the national economy Economic Review Federal reserve Bank of Dallas jan 1989 p 1128 Capítulo 22 Econometria de sériestemporais previsão 785 Uma vez que os dados da série temporal financeira refletem o resultado do comércio entre comprado res e vendedores em por exemplo mercados de ações muitas fontes de notícias e outros eventos eco nômicos exógenos podem ter um impacto no padrão da série temporal dos preços dos ativos Dado que as notícias podem levar a interpretações variadas e também dado que eventos econômicos específicos como uma crise do petróleo podem durar por algum tempo frequentemente observamos que grandes observações positivas ou grandes observações negativas em séries temporais financeiras tendem a apa recer em aglomerados21 O conhecimento da volatilidade é de suma importância em muitas áreas Por exemplo trabalho macroeconômico considerável foi feito para estudar a variabilidade da inflação ao longo do tempo Para alguns tomadores de decisão a inflação em si mesma pode não ser ruim porém sua variabili dade é ruim porque torna o planejamento financeiro difícil O mesmo é verdadeiro quanto aos importadores exportadores e comerciantes nos mercados de câmbio porque a variabilidade nas taxas de câmbio pode significar grandes perdas ou lucros Os investidores no mercado de ações estão obviamente interessados na volatilidade dos preços das ações pois a alta volatilidade poderia significar grandes perdas ou ganhos e portanto maior incerteza Em mercados voláteis é difícil para as empresas aumentar o capital nos mercados de capitais Como modelar uma série temporal financeira que pode experimentar tal volatilidade Por exem plo como modelar a série temporal dos preços das ações das taxas de câmbio da inflação etc Uma característica da maioria dessas séries temporais financeiras é que na sua forma em nível elas são passeios aleatórios isto é são não estacionárias Por outro lado na forma de primeira diferença são em geral estacionárias como vimos no caso da série do PIB no capítulo anterior a despeito de o PIB não ser estritamente uma série temporal financeira Sendo assim em vez de modelar os níveis da série temporal financeira por que não modelar as suas primeiras diferenças Essas primeiras diferenças frequentemente exibem grandes oscilações ou volatilidade sugerindo que a variância da série temporal financeira muda ao longo do tempo Como podemos modelar tal variância variável É aqui que o chamado modelo de heterocedas ticidade condicional autorregressiva ARCH originalmente desenvolvido por Engle vem a ca lhar22 Como o nome sugere a heterocedasticidade ou variância desigual pode ter uma estrutura autor regressiva na qual a heterocedasticidade observada ao longo de diferentes períodos pode ser auto correlacionada Para melhor entendermos vamos examinar um exemplo ExEmplo 221 Taxa de câmbio dos Estados UnidosReino Unido um exemplo A Figura 226 fornece os logs da taxa de câmbio mensal dos Estados Unidos e do reino Unido dólares por libra para o período entre 19712007 para um total de 444 observações mensais Como se pode ver nesta figura há consideráveis altos e baixos na taxa de câmbio ao longo do período da amostra Na Figura 227 traçamos as variações nos logs da taxa de câmbio perceba que as variações no log de uma variável denota mudanças relativas que se multiplicadas por 100 oferecem variações percentuais Como se pode observar as variações relativas nas taxas de câmbio norteamericanas e britânicas mostram grandes oscilações para alguns períodos e oscilações relativamente moderadas em outros períodos exemplificando com isso o fenômeno da aglomeração por volatilidade Continua 21 FrANSES Philip hans Time series models for business and economic forecasting Nova york Cambridge University Press 1998 p 155 22 ENGlE r Autoregressive conditional heteroscedasticity with estimates of the variance of United Kingdom inflation Econometrica v 50 n 1 p 9871007 1982 Veja também BErA A hiGGiNS M ArCh models properties estimation and testing Journal of Economic Surveys 1993 v 7 p 305366 786 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais ExEmplo 221 Continuação Figura 226 Log da taxa de câmbio dos Estados UnidosReino Unido 19712007 mensal Figura 227 Variação no log da taxa de câmbio dos Estados Unidos Reino Unido 12 10 08 06 04 02 0 1971 1973 1975 1977 1979 1981 1983 1985 1987 1989 1991 1993 1995 1997 1999 2001 2003 2005 2007 Log da taxa de câmbio Ano 015 010 005 0 005 010 015 1971 1973 1975 1977 1979 1981 1983 1985 1987 1989 1991 1993 1995 1997 1999 2001 2003 2005 2007 Variação no log da taxa de câmbio Ano Agora a questão prática é como medimos estatisticamente a volatilidade Vejamos nosso exemplo de taxa de câmbio Consideremos Yt D taxa de câmbio Estados Unidosreino Unido Y t D log de Yt dY t D Y t Y t1D variação relativa na taxa de câmbio d Y t D média de dY t Xt D dY t dY t Continua Capítulo 22 Econometria de sériestemporais previsão 787 ExEmplo 221 Continuação Então Xt é a variação relativa média ajustada na taxa de câmbio Agora podemos utilizar X t2 como uma medida de volatilidade Sendo uma quantidade quadrática seu valor será alto quando houver grandes variações nos preços dos ativos financeiros e seu valor valor será comparativamente pequeno quando houver variações modestas nos preços dos ativos financeiros23 Aceitando X t2 como uma medida de volatilidade como sabemos se ele varia ao longo do tempo Suponha que consideremos o seguinte modelo Ar1 ou AriMA 1 0 0 22101 Esse modelo postula que a volatilidade no período atual é relacionada com o seu valor no período anterior mais um termo de erro de ruído branco Se Ø1 é positivo ele sugere que se a volatilidade era alta no período anterior ele continuará a ser alta no período atual indicando aglomeração por volatilidade Se Ø1 for zero não haverá aglomeração por vola tilidade A estatística significativa do Ø2 estimado pode ser julgada pelo teste t habitual Não há nada que nos impeça de considerar um modelo de volatilidade Arp como 22102 Esse modelo sugere que a volatilidade no período atual está relacionada com a dos perío dos passados p de modo que o valor de p é uma questão empírica Esta pode ser resol vida por um ou mais critérios de seleção de modelo que discutimos no Capítulo 13 por exemplo a medida de informação Akaike Podemos testar a significância de qualquer coeficiente individual Ø pelo teste t e a significância coletiva de dois ou mais coeficientes pelo teste F habitual O modelo 22101 é um exemplo de modelo ARCH1 e a Equação 22102 é chamada de modelo ARCHp em que p representa o número de termos autorregressi vos no modelo Antes de continuarmos vamos ilustrar o modelo ArCh com os dados da taxa de câmbio dos Estados Unidosreino Unido Os resultados do modelo ArCh1 estão apre sentados a seguir 22103 em que X t2 é como definimos antes Uma vez que o coeficiente do termo defasado é altamente significativo o valor p é de aproximadamente 0000 parece que a aglomeração de volatilidade está presente na instância em discussão Tentamos os modelos ArCh de ordem mais elevada mas apenas o modelo Ar1 mostrouse significativo Como testaríamos o efeito ArCh em um modelo de regressão geral baseado em da dos da série temporal Para sermos mais específicos consideremos o modelo de regres são linear de variável k 22104 Continua 23 23 Você deve perguntar por que não utilizamos a variância de como uma medida de volatilidade O motivo é que queremos levar em conta a variação da volatilidade dos preços dos ativos ao longo do tempo Se utilizarmos a variância de Xt ela apenas será um valor único para determinado conjunto de dados 788 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais ExEmplo 221 Continuação e admitamos que dependendo da informação disponível no tempo t 1 o termo de distúrbio é distribuído como 22105 isto é ut é normalmente distribuído com média zero e 22106 isto é a variância de ut segue um processo ArCh1 A normalidade de ut não é novidade para nós O novo é que a variância de u no pe ríodo t é dependente do quadrado do distúrbio no tempo t 1 o que dá aparência de correlação serial24 É claro que a variância do erro pode depender não apenas de um termo defasado do termo de erro quadrático mas também de vários termos quadráticos defasados como se segue 22107 Se não houver nenhuma autocorrelação na variância de erro temos 22108 caso em que var ut D Æ0 e não temos o efeito ArCh Uma vez que não observamos diretamente æ 2 t Engle mostrou que executar a seguin te regressão pode facilmente testar a hipótese nula precedente 22109 em que uOt como de costume denota os resíduos MQO obtidos com base no modelo de regressão original 22104 Podese testar a hipótese nula H0 pelo teste F habitual ou como alternativa compu tando nR2 em que R2 é o coeficiente de determinação a partir da regressão auxiliar 22109 Podese demonstrar que 221010 isto é em amostras grandes nR2 segue a distribuição dos quiquadrados com graus de liberdade igual ao número de termos autorregressivos na regressão auxiliar Antes de passarmos à ilustração vamos nos assegurar de que você não confunda a autocorrelação do termo de erro como discutido no Capítulo 12 com o modelo ArCh No modelo ArCh é a variância condicional de ut que depende dos termos de erro quadráticos prévios dando assim a impressão de autocorrelação 24 24 Uma observação técnica lembrese de que para o nosso modelo linear clássico a variância de ut foi admitida como æ2 que neste contexto tornase variância incondicional Se Æ1 1 a condição de estabilidade podemos escrever Æ2 D Æ0 C Æ1æ2 ou seja æ2 Æ01 Æ1 isso demonstra que a variância incondicional de u não depen de de t porém depende do parâmetro ArCh Æ1 Capítulo 22 Econometria de sériestemporais previsão 789 ExEmplo 222 Variações nos preços na bolsa de valores de Nova York Como uma nova ilustração do efeito ArCh a Figura 228 apresenta uma variação percentual mensal do índice da Nyse New York Stock Exchange Bolsa de Valores de Nova york para o período entre 1966200225 É evidente por meio deste gráfico que as varia ções de preços percentuais no índice Nyse exibem considerável volatilidade Perceba principalmente a ampla oscilação ao redor da queda nos preços das ações em 1987 Para capturarmos a volatilidade no retorno de ações verificada na figura considere mos um modelo muito simples 221011 em que Yt D variação percentual no índice NySE e ut D termo de erro aleatório 015 010 005 0 005 010 015 1966 1971 1976 1981 1986 1991 1996 2001 Variação Ano Observe que além do intercepto não há outra variável explanatória no modelo Com base nos dados obtivemos a seguinte regressão por MQO 221012 O que esse intercepto denota Ele é simplesmente a taxa de retorno percentual média do índice Nyse ou o valor médio de Yt você pode verificar isso Ao longo do período da amostra o retorno mensal médio no índice Nyse foi de aproximadamente 000574 Agora obtemos os resíduos por meio da regressão anterior e estimamos o modelo ArCh1 o que nos fornece os seguintes resultados 221013 em que uOt é o resíduo estimado por meio da regressão 221012 Uma vez que o termo de distúrbio quadrático defasado é estatisticamente significativo valor p de aproximadamente 0000 parece que as variâncias de erro são correlaciona das há um efeito ArCh Experimentamos modelos ArCh de ordens mais altas mas apenas o ArCh1 foi estatisticamente significativo 25 25 Esse gráfico e os resultados da regressão apresentados no exemplo são baseados nos dados coletados por KOOP Gary Analysis of economic data Nova york John wiley e Sons 2000 dados do disco de dados A variação percentual mensal no índice de preços de ações pode ser considerada uma taxa de retorno sobre o índice Figura 228 Variação percentual mensal no índice de preços da Nyse 19662002 790 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais o que fazer se o arcH estiver presente Lembrese de que discutimos vários métodos de correção de heterocedasticidade que basi camente envolvia a aplicação dos MQO em dados transformados Lembrese de que os MQO aplicados a dados transformados são mínimos quadrados generalizados MQG Se o efeito ARCH for descoberto teremos de utilizar os MQG Não nos deteremos nos detalhes técnicos já que estão além do objetivo deste livro26 Felizmente os pacotes de software como o EViews SHAZAM MICROFIT e PCGIVE agora possuem rotinas simplificadas para estimar tais mo delos uma palavra sobre o d DurbinWatson e o efeito arcH Por diversas vezes temos lembrado o leitor de que uma estatística d significativa pode nem sempre indicar que há uma correlação significativa nos dados em questão Com frequência um valor d significativo é uma indicação dos erros de especificação do modelo que discutimos no Capítulo 13 Agora temos um erro de especificação adicional devido ao efeito ARCH Portanto em uma regressão da série temporal se um valor d significativo é obtido devemos testar o efeito ARCH antes de aceitar a estatística d em seu valor nominal Um exemplo é oferecido no Exercício 2223 uma nota sobre o modelo garcH Desde a sua descoberta em 1982 a modelagem ARCH transformouse em uma indústria em crescimento com todos os tipos de variações sobre o modelo original Uma das que se tornaram po pulares é o modelo de heterocedasticidade condicional autorregressiva generalizada GARCH originalmente proposto por Bollerslev27 O modelo GARCH mais simples é o modelo GARCH1 1 que pode ser escrito assim 221014 que informa que a variância condicional de u no período t depende não apenas do termo de erro quadrático no período de tempo anterior como em ARCH1 mas também de sua variância condi cional no período de tempo anterior Esse modelo pode ser generalizado para um modelo GARCHp q no qual há p termos defasados do termo de erro quadrático e q termos das variâncias condicionais defasadas Não prosseguiremos com os detalhes técnicos desses modelos por serem complexos mas sa lientamos apenas que um modelo GARCH1 1 é equivalente ao modelo ARCH2 e um modelo GARCHp q é equivalente a um modelo ARCHp C q28 Para nossos exemplos de taxa de câm bio dos Estados UnidosReino Unido e de retorno das ações da Nyse já estabelecemos que um modelo ARCH2 não era significativo sugerindo que talvez um modelo GARCH1 1 não seja adequado nesses casos 2211 Exemplos finais Concluímos este capítulo considerando uns poucos exemplos adicionais que ilustram alguns dos pontos abordados aqui 26 Consulte DAViDSON russell MACKiNNON James G Estimation and inference in econometrics Nova york Oxford University Press 1993 seção 164 e GrEENE william h Econometric analysis 4 ed Englewood Cliffs NJ Prentice hall 2000 seção 185 27 BOllErSlEV T Generalized autoregressive conditional heteroscedasticity Journal of Econometrics 1986 v 31 p 307326 28 Para mais detalhes veja DAViDSON e MACKiNNON op cit p 558560 Capítulo 22 Econometria de sériestemporais previsão 791 ExEmplo 223 A relação entre o Índice das Condições do Mercado de Trabalho HWI e a Taxa de Desemprego UN de janeiro de 1969 a janeiro de 2000 Para estudar a causalidade entre hwi e UN dois indicadores das condições do mercado de trabalho nos Estados Unidos Marc A Giammatteo levou em conta o seguinte modelo de regressão29 22111 22112 Para economizar espaço não apresentaremos os resultados da regressão real porém a principal conclusão que surge desse estudo é a causalidade bilateral entre os dois indicado res de mercado de trabalho e essa conclusão não se modificou quando da variação da ex tensão da defasagem Os dados hwi e UN são fornecidos no website do livro conforme a Tabela 225 29 ExEmplo 224 Modelagem ARIMA da taxa de câmbio iene dólar de janeiro de 1971 a abril de 2008 A taxa de câmbio ienedólar é fundamental Por meio dos logaritmos da taxa mensal descobriuse que em nível ela mostrava um padrão típico de uma série temporal não estacionária Contudo examinando as suas primeiras diferenças descobriuse que eram estacionárias o gráfico aqui apresentado é muito semelhante ao da Figura 228 A análise da raiz unitária confirmou que as primeiras diferenças dos logs de eram estacionárias Após examinarmos o correlograma do log das primeiras diferenças estima mos o seguinte modelo Ar1 22113 em que Yt D primeiras diferenças dos logs de e u D um termo de erro de ruído branco Para pouparmos espaço fornecemos os dados subjacentes à análise anterior no site do livro na Tabela 226 Utilizando esses dados o leitor é levado a tentar outros modelos e comparar seus desempenhos de previsão ExEmplo 225 Modelo ARCH da taxa de inflação norteamericana de janeiro de 1947 a março de 2008 Para verificarmos se o efeito ArCh está presente na taxa de inflação norteamericana como mensurada pelo iPC Índice de Preços ao Consumidor obtivemos os dados do iPC do período entre janeiro de 1947 a março de 2008 O gráfico dos logaritmos do iPC demonstrou que a série temporal era não estacionária Porém o gráfico das primeiras diferenças dos logs do iPC como mostra a Figura 229 demonstra considerável volatili dade muito embora as diferenças sejam estacionárias Seguindo o procedimento delineado nas regressões 221012 e 221013 primei ramente fizemos a regressão dos logs das primeiras diferenças do iPC sobre uma cons tante e obtivemos resíduos por meio dessa equação Elevando os resíduos ao quadrado obtivemos o seguinte modelo ArCh2 22114 Continua 29 GiAMMATTEO Marc A west Point Class of 2000 The relationship between the help wanted index and the unemployment rate Artigo de conclusão de curso não publicado Notações alteradas para adaptaremse às nossas 792 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais ExEmplo 225 Continuação Figura 229 Primeiras diferenças 007 005 006 004 002 0 003 001 001 002 003 1947 1952 1957 1962 1967 1972 1977 1982 1987 1992 1997 2002 2007 Primeiras diferenças Ano Como se pode ver há muita persistência na volatilidade na medida em que a volati lidade no mês corrente depende da volatilidade nos 2 meses anteriores Aconselhamos o leitor a obter os dados do iPC das fontes governamentais e tentar verificar se outro mo delo preferencialmente um modelo GArCh funciona melhor Resumo e conclusões 1 As abordagens BoxJenkins e VAR à previsão econômica são alternativas aos modelos de equação simultânea e única 2 Para prever os valores de uma série temporal a estratégia BoxJenkins básica é a seguinte a Primeiro examine a série para a estacionariedade Este passo pode ser feito ao calcular a função de correlação amostral ACF e a função de correlação parcial amostral PACF ou fazendo uma análise de raiz unitária Os correlogramas associados com ACF e PACF são frequentemente boas ferramentas de diagnóstico visual b Se a série temporal for não estacionária execute a diferenciação uma ou mais vezes até atingir a estacionariedade c As ACF e PACF da série temporal são então calculadas para descobrir se a série é puramen te autorregressiva ou puramente do tipo de média móvel ou uma mistura das duas Por meio das diretrizes gerais dadas na Tabela 221 podese determinar os valores de p e q no processo ARMA a ser ajustado Nesse estágio o modelo escolhido ARMAp q é experimental d O modelo experimental é então estimado e Os resíduos desse modelo experimental são examinados para descobrir se são de ruído bran co Se forem o modelo experimental será provavelmente uma boa aproximação ao processo estocástico subjacente Se não forem o processo será novamente iniciado Portanto o méto do BoxJenkins é iterativo f Agora o modelo selecionado pode ser utilizado para a previsão 3 A abordagem VAR para a previsão considera várias séries temporais isoladamente As caracterís ticas distintivas do VAR são as seguintes a É um sistema verdadeiramente simultâneo no qual todas as variáveis são consideradas endó genas b Na modelagem VAR o valor de uma variável é expresso como uma função linear dos valores do passado ou defasados daquela variável e todas as variáveis incluídas no modelo Capítulo 22 Econometria de sériestemporais previsão 793 c Se cada equação contém o mesmo número de variáveis defasadas no sistema ela pode ser estimada pelos MQO sem lançar mão de qualquer método de sistemas como os mínimos quadrados de dois estágios MQ2E ou regressões aparentemente não relacionadas SURE d A simplicidade da modelagem VAR pode ser sua desvantagem Em vista do número limitado de observações que geralmente estão disponíveis na maioria das análises econômicas a in trodução de várias defasagens pode consumir vários graus de liberdade30 e Se há várias defasagens em cada equação nem sempre é fácil interpretar cada coeficiente prin cipalmente se os sinais dos coeficientes alternamse Por isso examinase a função de resposta a impulso IRF na modelagem VAR para descobrir como a variável dependente responde ao choque administrado a uma ou mais equações no sistema f Há consideráveis debates e controvérsias acerca da superioridade dos vários métodos de previsão Os métodos de previsão uniequacional de equações simultâneas BoxJenkins e VAR contam com seus defensores bem como com seus detratores Tudo o que se pode dizer é que não há um único método que se ajuste a todas as situações Se esse fosse o caso não haveria necessidade de discutir as várias alternativas Uma coisa é certa as metodologias BoxJenkins e VAR tornaramse parte integrante da econometria 4 Consideramos também neste capítulo uma classe especial de modelos ARCH e GARCH que são especialmente úteis na análise das séries temporais financeiras como os preços das ações as taxas de inflação e as taxas de câmbio Uma característica distintiva desses modelos é que a variância de erro pode ser correlacionada ao longo do tempo devido ao fenômeno da aglomeração por volatilidade A esse respeito apontamos que em muitos casos um d de DurbinWaton signifi cativo pode de fato deverse ao efeito ARCH ou GARCH 5 Há variantes dos modelos ARCH e GARCH mas não os consideramos neste capítulo em função das limitações de espaço Alguns desses outros modelos são GARCHM GARCH na média TGARCH limiar do GARCH e EGARCH GARCH exponencial Uma discussão sobre esses modelos pode ser encontrada nas referências31 ExErcícios 221 Quais os principais métodos de previsão econômica 222 Quais as principais diferenças entre as abordagens de equações simultâneas e BoxJenkins para a previsão econômica 223 Estabeleça os principais passos envolvidos na aplicação da abordagem BoxJenkins para a previsão 224 O que ocorre se as técnicas BoxJenkins são aplicadas às séries temporais estacionárias 225 Quais as diferenças entre as abordagens BoxJenkins e VAR para a previsão econômica 226 Em que sentido o VAR é ateórico 227 Se o objeto primário é a previsão o VAR fará o trabalho Avalie criticamente essa afirmação 228 Posto que o número de defasagens a ser introduzido em um modelo VAR pode ser uma questão subjetiva como se pode decidir quantas defasagens introduzir em uma aplicação concreta 229 Comente esta afirmação BoxJenkins e VAR são exemplos primordiais de mensuração sem teoria 2210 Qual a conexão se houver alguma entre os testes de causalidade de Granger e a modelagem VAR 30 Seguidores da estatística bayesiana creem que esse problema pode ser minimizado Veja liTTErMAN r A statistical approach to economic forecasting Journal of Business and Economic Statistics 1986 v 4 p 14 31 Veja ENDErS walter Applied econometric time series 2 ed Nova york John wiley e Sons 2004 Para uma dis cussão de aplicação orientada veja ASTEriOU Dimitrios hAll Stephen Applied econometrics a modern approach ed ver Nova york PalgraveMacmillan 2007 cap 14 794 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais Exercícios aplicados 2211 Considere os dados de RPD renda real pessoal disponível introduzidos na Seção 211 veja o site do livro para os dados reais Suponha que você queira ajustar um modelo ARIMA apropriado a esses dados Delineie os passos envolvidos para que se realize essa tarefa 2212 Repita o Exercício 2211 para os dados DCP despesas de consumo pessoal reais introdu zidos na Seção 211 veja o site do livro para os dados reais 2213 Repita o Exercício 2211 para o LLC 2214 Repita o Exercício 2211 para o LDividendo 2215 Na Seção 139 apresentamos a você o critério de Informação Schwarz SIC para determi nar o comprimento da defasagem Como você utilizaria esse critério para determinar o comprimento de defasagem adequado em um modelo VAR 2216 Utilizando os dados de RPD e DCP introduzidos na Seção 211 veja o site do livro para os dados reais desenvolva um modelo VAR bivariado para o período 1970I a 2006IV Use esse modelo para prever os valores dessas variáveis para os quatro trimestres de 2007 e compare os valores da previsão com os valores reais fornecidos no conjunto de dados 2217 Repita o Exercício 2216 utilizando os dados sobre o LDividendo e o LLC 2218 Use qualquer pacote estatístico e estime a função de resposta a impulso para um período de até 8 defasagens para o modelo VAR que você desenvolveu no Exercício 2216 2219 Repita o Exercício 2218 para o modelo VAR que você desenvolveu no Exercício 2217 2220 Use os resultados da regressão VAR fornecidos na Tabela 224 Com base em vários testes F relatados nas três regressões fornecidas na tabela citada o que você pode dizer sobre a natureza da causalidade nas três variáveis 2221 Prosseguindo com o Exercício 2020 você pode adivinhar por que os autores escolheram expressar as três variáveis no modelo no formato de variações em vez de utilizarem os níveis dessas variáveis Dica estacionariedade 2222 Utilizando os dados canadenses fornecidos na Tabela 175 descubra se M1 e R são variáveis aleatórias estacionárias Se não são seriam elas cointegradas Apresente os cálculos neces sários 2223 Continue com os dados da Tabela 175 Agora considere o seguinte modelo simples de demanda de moeda no Canadá a Como você interpretaria os parâmetros deste modelo b Obtenha os resíduos por meio deste modelo e descubra se há algum efeito ARCH 2224 Use o modelo ARCH2 fornecido na Equação 22114 Utilizando os mesmos dados es timamos o seguinte modelo ARCH1 Como você escolheria entre os dois modelos Apresente os cálculos necessários32 2225 A Tabela 227 fornece os dados das taxas das Letras do Tesouro de três meses e de seis meses a partir de 1o de janeiro de 1982 a março de 2008 por um total de 315 observações mensais Os dados podem ser encontrados no site do livrotexto a Represente as duas séries temporais no mesmo diagrama O que você vê Opcional 794 Parte Quatro Modelos de equações simultâneas e econometria de séries temporais Capítulo 22 Econometria de sériestemporais previsão 795 b Faça uma análise formal da raiz unitária para descobrir se essas séries temporais são estacionárias c As duas séries temporais são cointegradas Como você sabe disso Apresente os cálcu los necessários d Qual o significado econômico de cointegração neste contexto Se as duas séries tempo rais não são cointegradas quais as implicações econômicas e Se você quiser estimar um modelo VAR por exemplo com quatro defasagens de cada variá vel teria de utilizar as primeiras diferenças das duas séries ou poderia fazer a análise em níveis das duas séries Justifique sua resposta 2226 Exercício em classe Escolha um índice de mercado de ações e obtenha dados diários do valor do índice escolhido por cinco anos para descobrir se o índice de ações é caracterizado pelos efeitos ARCH 2227 Exercício em classe Colete dados sobre a inflação e sobre as taxas de desemprego norte americanas para os períodos trimestrais em 19802007 desenvolva e estime o modelo VAR para as duas variáveis Para calcular a taxa de inflação utilize o IPC índice de preços ao consumidor e use a taxa de desemprego civil para calcular a taxa de desemprego Preste muita atenção à estacionariedade dessas variáveis Além disso descubra se uma variável Granger causa a outra variável Apresente todos os seus cálculos Capítulo 22 Econometria de sériestemporais previsão 795 796 Revisão de alguns conceitos estatísticos Este apêndice fornece uma introdução bem resumida de alguns dos conceitos estatísticos encon trados no texto A discusão não é rigorosa e nenhuma prova é fornecida porque um grande número de livros excelentes sobre estatística faz muito bem esse trabalho Algumas dessas obras estão lista das no final deste apêndice A1 Operadores somatório e de produto A letra maiúscula grega sigma é utilizada para indicar somatório Assim Algumas das propriedades importantes do operador somatório são 1 em que k é constante Assim 2 em que k é uma constante 3 em que a e b são constantes e aplicamse as propriedades 1 e 2 anteriores 4 O operador somatório também pode ser estendido às somas múltiplas Assim o operador duplo somatório é definido como Algumas das propriedades de são 1 a ordem na qual o duplo somatório é executada é permu tável 2 Apêndice A Apêndice A Revisão de alguns conceitos estatísticos 797 3 4 O operador produto é definido como Assim A2 Espaço amostral pontos amostrais e eventos O conjunto de todos os resultados possíveis de um experimento aleatório ou ao acaso é chamado população ou espaço amostral e cada membro desse espaço amostral é chamado de ponto amos tral No experimento de lançar duas moedas o espaço amostral consiste nesses possíveis quatro resul tados HH HT TH e TT em que HH significa cara no primeiro lançamento e coroa no segundo e assim por diante Cada uma das ocorrências anteriores constitui um ponto amostral Um evento é um subconjunto do espaço amostral Se denotarmos A a ocorrência de uma cara e de uma coroa então dos possíveis resultados anteriores apenas dois pertencem a A ou seja HT e TH Nesse caso A constitui um evento Da mesma maneira a ocorrência de duas caras em um lançamento de duas moedas é um evento Dizse que eventos são mutuamente exclusivos se a ocorrência de um eliminar a ocorrência do outro Se no exemplo anterior ocorre HH a ocorrência do evento HT ao mesmo tempo não é possível Dizse que eventos são coletivamente exaustivos se exaurem todas os possíveis resultados de um experimento No exemplo os eventos a duas caras b duas coroas e c uma coroa uma cara exaure todos os resultados daí eles serem even tos coletivamente exaustivos A3 Probabilidade e variáveis aleatórias probabilidade Seja A um evento em um espaço amostral Por PA a probabilidade do evento A entendemos a proporção de vezes que o evento A ocorrerá em repetidas tentativas de um experimento Como alter nativa em um total de n possíveis resultados igualmente prováveis de um experimento se m deles são favoráveis à ocorrência do evento A definimos a razão mn como a frequência relativa de A Para valores maiores de n essa frequência relativa fornecerá uma aproximação bastante boa da pro babilidade de A Propriedades da probabilidade PA é uma função de valor real1 e possui essas propriedades 1 para cada A 2 Se A B C constituem um conjunto exaustivo de eventos em que A C B C C significa A ou B ou C e assim por diante 1 Uma função cujo domínio e alcance são subconjuntos de números reais é comumente referida como função de valor real Para mais detalhes veja ChiANG Alpha C Fundamental methods of mathematical economics 3 ed Nova york McGrawhill 1984 cap 2 798 Apêndice A Revisão de alguns conceitos estatísticos 3 Se A B C são eventos mutuamente exclusivos ExEmplo 1 Considere o experimento de lançar um dado numerado de 1 a 6 O espaço amostral consiste nos resultados 1 2 3 4 5 e 6 Os seis eventos portanto exaurem totalmente o espaço amostral A probabilidade de qualquer um desses números aparecer é de 16 uma vez que há seis resultados igualmente prováveis e qualquer um deles possui uma chance igual de acontecer Na medida em que 1 2 3 4 5 e 6 formam um conjunto exaustivo de eventos P 1 C 2 C 3 C 4 C 5 C 6 D 1 em que 1 2 3 indica a probabilidade do número 1 ou do número 2 ou do número 3 etc E na medida em que 1 2 6 são eventos mutuamente exclusivos no sentido de que dois números não podem ocorrer simultaneamente P 1 C 2 C 3 C 4 C 5 C 6 D P 1 C P 2 C C P 6 D 1 Variáveis aleatórias Uma variável cujo valor é determinado pelo resultado de um experimento aleatório é chamada de variável aleatória As variáveis aleatórias são normalmente denotadas pelas letras maiúsculas X Y Z etc e os valores assumidos por elas são indicados pelas letras minúsculas x y z etc Uma variável aleatória pode ser tanto discreta como contínua Uma variável aleatória discreta pode assumir apenas um número finito ou infinito enumerável de valores2 Por exemplo ao lançar mos dois dados cada um com números de 1 a 6 se definirmos a variável aleatória X como a soma dos números mostrados nos dois dados X terá um desses valores 2 3 4 5 6 7 8 9 10 11 ou 12 Por tanto é uma variável aleatória discreta Uma variável aleatória contínua por outro lado é aquela que pode assumir qualquer valor em algum intervalo dos valores A altura de um indivíduo é uma variável contínua em uma amplitude de por exemplo 60 a 65 polegadas ele pode ter qualquer valor de pendendo da precisão da medição A4 Função de densidade de probabilidade FDP Função de densidade de probabilidade de uma variável aleatória discreta Seja X uma variável aleatória discreta que toma valores distintos x1 x2 xn Então a função é chamada função de densidade de probabilidade discreta FDP de X em que P X D xi significa a probabilidade de que a variável aleatória discreta X tome o valor de xi ExEmplo 2 Ao lançarem dois dados a variável aleatória X a soma dos números apresentados nos dois dados pode assumir um dos 11 valores exibidos A FDP dessa variável pode ser representada como se segue Veja também a Figura A1 Continua 2 Para uma discussão simples da noção de conjuntos infinitos enumeráveis veja AllEN r G D Basic mathematics londres Macmillan 1964 p 104 Apêndice A Revisão de alguns conceitos estatísticos 799 ExEmplo 2 Continuação Essas probabilidades podem ser facilmente verificadas Em todas há 36 resultados possíveis dos quais um é favorável ao número 2 dois são favoráveis ao número 3 uma vez que a soma 3 pode ocorrer tanto no caso de 1 no primeiro dado como com 2 no segundo dado ou com 2 no primeiro dado e 1 no segundo dado e assim por diante Figura a1 Função de densidade da variável aleatória discreta do Exemplo 2 36 6 36 5 36 4 36 3 36 2 36 1 2 3 4 5 6 7 8 9 10 11 12 f x Função de densidade de probabilidade de uma variável aleatória contínua Seja X uma variável aleatória contínua Então f x será a função de densidade de probabilidade de X se as seguintes condições forem satisfeitas em que f x dx é conhecido como o elemento da probabilidade a probabilidade associada a um pequeno intervalo de uma variável contínua e Pa x b indica a probabilidade de que X situese no intervalo entre a e b Geometricamente temos a Figura A2 Para uma variável aleatória contínua em contraste com uma variável aleatória discreta a probabi lidade de que X assuma um valor específico é zero3 a probabilidade de tal variável é mensurada apenas para uma dada amplitude ou intervalo tal como a b representado na Figura A2 ExEmplo 3 Considere a seguinte função de densidade Pode ser prontamente verificado que f x 0 para todos os x no intervalo de 0 a 3 e que Nota a integral é Se quisermos avaliar a função de densidade de probabilidade anterior entre por exemplo 0 e 1 obtemos ou seja a probabilidade de que x situase entre 0 e 1 é 127 3 800 Apêndice A Revisão de alguns conceitos estatísticos 0 a b Pa X b Funções de densidade de probabilidade conjunta Função de densidade de probabilidade conjunta discreta Sejam X e Y duas variáveis aleatórias discretas Então a função é conhecida como função de densidade de probabilidade conjunta discreta e fornece a probabili dade conjunta de que X tome o valor de x e Y tome o valor de y ExEmplo 4 A seguinte tabela oferece a função de densidade de probabilidade conjunta das variáveis discretas X e Y Essa tabela mostra que a probabilidade de que X tome o valor de 2 enquanto Y simul taneamente assume o valor de 3 é de 027 e que a probabilidade de que X toma o valor de 3 enquanto Y toma o valor de 6 é de 035 e assim por diante Função de densidade de probabilidade marginal Em relação a f x y f x e f y são chamadas de funções de densidade individual ou margi nal as funções de densidade de probabilidade Essas funções de densidade de probabilidade mar ginais são derivadas como se segue em que por exemplo significa a soma de todos os valores de Y e a soma de todos os valores de X Figura a2 Função de densidade de uma variável aleatória contínua Apêndice A Revisão de alguns conceitos estatísticos 801 ExEmplo 5 Considere os dados fornecidos no Exemplo 4 A função de densidade de probabilidade marginal é obtida como se segue De forma semelhante a função de densidade de probabilidade marginal de Y é obtida como Como esse exemplo demonstra para obter uma função de densidade de probabilidade mar ginal de X adicionamos os números da coluna e para obter a função de densidade de pro babilidade marginal de Y adicionamos os números das linhas Perceba que que cobre todos os valores de X é 1 assim como que cobre todos os valores de Y por quê Função de densidade de probabilidade condicional Como observado no Capítulo 2 na análise de regressão frequentemente estamos interessados no estudo do comportamento de uma variável condicional com relação aos valores de outras variávelis Isso pode ser feito considerando a função de densidade de probabilidade condicional A função é conhecida como função de densidade de probabilidade condicional de X ela apresenta a proba bilidade de que X assuma o valor de x posto que Y assumiu o valor de y De forma semelhante que apresenta a FDP condicional de Y As funções de densidade de probabilidade condicionais podem ser obtidas como se segue Como as expressões anteriores demonstram a função de densidade de probabilidade condicional de uma variável pode ser expressa como a razão da função de densidade de probabilidade conjunta à função de densidade de probabilidade marginal de outra variável condicionante 802 Apêndice A Revisão de alguns conceitos estatísticos ExEmplo 6 Continuando com os Exemplos 4 e 5 calculemos as seguintes probabilidades condi cionais Perceba que a probabilidade incondicional f X D 2 é 027 mas se Y assumiu o valor de 3 a probabilidade de que X tome o valor de 2 é de 053 Novamente note que a probabilidade incondicional de que X tome o valor de 2 é de 026 o que é diferente de 020 que é o seu valor se Y assume o valor de 6 independência estatística As duas variáveis aleatórias X e Y são estatisticamente independentes se e somente se ou seja se a função de densidade de probabilidade conjunta puder ser expressa como o produto das funções de densidade de probabilidade marginais ExEmplo 7 Uma bolsa contém três bolas numeradas 1 2 e 3 Duas bolas são retiradas aleatoriamente com reposição dessa bolsa a primeira bola retirada é recolocada antes que a segunda seja retirada Seja X o número da primeira bola retirada e Y o número da segunda bola retirada A seguinte tabela apresenta a FDP conjunta de X e Y Agora obtido pela soma da primeira coluna e obtido pela soma da primeira linha Uma vez que f X Y D f X f Y neste exemplo podemos dizer que as duas variáveis são estatisticamente independentes Pode ser facilmen te verificado que para qualquer outra combinação de valores X e Y dados nessa tabela a função de densidade de probabilidade conjunta pode ser representada como o produto das funções de densidade de probabilidade individuais Podese demonstrar que as variáveis X e Y do Exemplo 4 não são estatisticamente inde pendentes na medida em que o produto das duas funções de densidade de probabilidade marginal não é igual à função de densidade de probabilidade conjunta Nota f X Y D f X f Y deve ser verdadeiro para todas as combinações de X e Y para que as duas variáveis sejam estatisticamente independentes Apêndice A Revisão de alguns conceitos estatísticos 803 Função de densidade de probabilidade conjunta contínua A função de densidade de probabilidade f x y de duas variáveis contínuas X e Y é tal que4 ExEmplo 8 Considere a seguinte função de densidade de probabilidade É óbvio que f x y 0 Além do mais4 A função de densidade de probabilidade marginal de X e Y pode ser obtida como ExEmplo 9 As duas funções de densidade de probabilidade marginais da função de densidade de proba bilidade conjunta dadas no Exemplo 8 são as seguintes Continua 4 A expressão significa que a expressão entre parênteses deve ser avaliada com o limite superior de 1 e o limite inferior de 0 o último valor é subtraído pelo primeiro para obter o valor da integral No exemplo anterior os limites são perfazendo o valor da integral igual a 1 804 Apêndice A Revisão de alguns conceitos estatísticos ExEmplo 9 Continuação Para verificarmos se as duas variáveis do Exemplo 8 são estatisticamente independentes pre cisamos descobrir se Uma vez que podemos dizer que as duas variáveis não são estatisticamente independentes A5 As características das distribuições de probabilidade Uma distribuição de probabilidade pode com frequência ser resumida em termos de algumas poucas características conhecidas como momentos da distribuição Dois dos momentos mais ampla mente utilizados são a média ou valor esperado e a variância Valor esperado O valor esperado de uma variável aleatória discreta X denotado por EX é definido como em que significa a soma que inclui todos os valores de X e f x é a função de densidade de probabili dade discreta de X ExEmplo 10 Considere a distribuição da probabilidade da soma de dois números no lançamento dos dois dados apresentados no Exemplo 2 Veja a Figura A1 Multiplicando os vários valores X lá apresentados por suas probabilidades e fazendo a soma geral de todas as observações obtemos que é o valor médio da soma dos números observados no lançamento dos dois dados ExEmplo 11 Estime EX e EY para os dados apresentados no Exemplo 4 Vimos que Portanto Continua Apêndice A Revisão de alguns conceitos estatísticos 805 ExEmplo 11 Continuação De forma semelhante O valor esperado de uma variável aleatória contínua é definido como A única diferença entre esse caso e o valor esperado de uma variável aleatória discreta é que substituímos o símbolo do somatório pelo símbolo da integral ExEmplo 12 Vamos descobrir o valor esperado da função de densidade de probabilidade contínua apresentada no Exemplo 3 propriedades dos valores esperados 1 O valor esperado de uma constante é a própria constante Se b é uma constante Eb H b 2 Se a e b são constantes Isso pode ser generalizado Se X1 X2 XN são N variáveis aleatórias e a1 a2 aN e b são constantes então 3 Se X e Y são variáveis aleatórias independentes então Ou seja a expectativa do produto XY é o produto das expectativas individuais de X e Y Entretanto observe que mesmo se X e Y forem independentes 806 Apêndice A Revisão de alguns conceitos estatísticos 4 Se X é uma variável aleatória com função de densidade de probabilidade f x e se g x é qualquer função de X então Assim se gX X 2 ExEmplo 13 Considere a seguinte função de densidade de probabilidade FDP Então e Variância Seja X uma variável aleatória e seja EX D π A distribuição ou dispersão dos valores de X em torno do valor esperado pode ser mensurada pela variância definida como A raiz quadrada positiva de æ 2 X æX é definida como desvio padrão de X A variância ou desvio padrão indica quão próximos ou distantes os valores individuais de X estão distribuídos em torno de seu valor médio A variância definida previamente é calculada como se segue Para conveniência de cálculo a fórmula da variância apresentada pode ser expressa como Apêndice A Revisão de alguns conceitos estatísticos 807 Aplicando essa fórmula podemos verificar que a variância da variável aleatória apresentada no Exemplo 13 é ExEmplo 14 Vamos descobrir a variância da variável aleatória apresentada no Exemplo 3 Agora Uma vez que veja o Exemplo 12 finalmente temos propriedades da variância 1 como observado anteriormente 2 A variância de uma constante é zero 3 Se a e b são constantes então 4 Se X e Y são variáveis aleatórias independentes então Isso pode ser generalizado para mais do que duas variáveis independentes 5 Se X e Y são variáveis aleatórias independentes e a e b são constantes covariância Seja X e Y duas variáveis aleatórias com médias πx e πy respectivamente Então a covariância entre as duas variáveis é definida como É prontamente verificado que a variância de uma variável é a covariância daquela variável com ela mesma 808 Apêndice A Revisão de alguns conceitos estatísticos A covariância é calculada como se segue se X e Y são variáveis aleatórias discretas e se X e Y são variáveis aleatórias contínuas propriedades da covariância 1 Se X e Y são independentes a sua covariância é zero pois 2 em que a b c e d são constantes ExEmplo 15 Vamos descobrir a covariância entre as variáveis aleatórias discretas X e Y cuja função de densidade de probabilidade conjunta é como demonstrado no Exemplo 4 Com base no Exem plo 11 já sabemos que πx D E X D 103 e que πy D E Y D 447 Portanto coeficiente de correlação O coeficiente de correlação população Ω rho é definido como Apêndice A Revisão de alguns conceitos estatísticos 809 Assim definido Ω é uma medida de associação linear entre duas variáveis e situase entre 1 e C 1 1 indicando associação negativa perfeita e indicando associação positiva perfeita Por meio da fórmula anterior podese verificar que ExEmplo 16 Vamos estimar o coeficiente da correlação para os dados do Exemplo 4 Com base nas funções de densidade de probabilidade apresentadas no Exemplo 11 podese facilmente demonstrar que æx D 205 e æy D 150 Já mostramos que cov X Y D 224 Portanto apli cando a fórmula anterior estimamos que Ω é 224 205150 D 073 Variâncias de variáveis correlacionadas Sejam X e Y as duas variáveis aleatórias Então Entretanto se X e Y forem independentes a cov X Y é zero neste caso a var X C Y e a var X Y são ambas iguais a var X C var Y como anteriormente observado Os resultados anteriores podem ser generalizados como se segue então a variância da combinação linear é em que Ωi j é o coeficiente de correlação entre Xi e Xj e æi e æj são os desvios padrão de Xi e Xj Assim em que æ1 æ2 e æ3 são respectivamente os desvios padrão de X1 X2 e X3 e Ω12 é o coeficiente de cor relação entre X1 e X2 Ω13 que entre X1 e X3 e Ω23 que entre X2 e X3 Expectativa condicional e variância condicional Seja fx y a FDP conjunta das variáveis aleatórias X e Y A expectativa condicional de X dado Y D y é definida como 810 Apêndice A Revisão de alguns conceitos estatísticos em que EX D Y D y representa a expectativa condicional de X dado Y D y em que f x Y D y é a FDP condicional de X A expectativa condicional de Y EY X D x é definida de forma semelhante Expectativa condicional Observe que E X Y é uma variável aleatória porque ela é uma função da variável condicionan te Y Contudo EX Y D y em que y é um valor específico de Y é uma constante Variância condicional A variância condicional de X dado Y D y é definida como ExEmplo 17 Calcule E Y X D 2 e a var Y X D 2 para os dados do Exemplo 4 Nota f Y D 3 X D 2 D f Y D 3 X D 2 f X D 2 D 016026 e f Y D 6 X D 2 D f Y D 6 X D 2 f X D 2 010026 então propriedades da expectativa condicional e da variância condicional 1 Se f X for uma função de X então E f X X D f X isto é a função de X comportase como uma constante no cálculo de sua expectativa condicional sobre X Assim EX 3 X D EX 3 se X for conhecido X 3 também será 2 Se f X e gX são funções de X então Por exemplo em que c é uma constante 3 Se X e Y forem independentes EY X D EY Ou seja se X e Y são variáveis aleatórias independentes a expectativa condicional de Y dado X é a mesma que a expectativa incon dicional de Y Apêndice A Revisão de alguns conceitos estatísticos 811 4 Lei das expectativas iteradas É interessante notar a seguinte relação entre a expectativa incondicional de uma variável aleatória Y EY e sua expectativa condicional baseada em outra variável aleatória X EY X Essa relação é conhecida como lei das expectativas iteradas que neste contexto estabelece que a expectativa marginal ou incondicional de Y é igual à expectativa de sua expectativa condicional na qual o símbolo EX denota que a expectativa está cobrindo os valores de X Simplificando essa lei estabelece que se primeiramente obtemos EY X como uma fun ção de X e tomamos seu valor esperado para a distribuição de valores X terminamos obten do EY a expectativa incondicional de Y O leitor pode verificar isso utilizando os dados fornecidos no Exemplo 4 Uma implicação da lei de expectativas iteradas é que se a média condicional de Y dado X EY X for zero a média incondicional de Y também será zero Isso acontece porque neste caso 5 Se X e Y são independentes var Y X D var Y 6 var Y D Evar Y X C var E Y X isto é a variância incondional de Y é igual à expectativa da variância condicional de Y mais a variância da expectativa condicional de Y momentos de ordem superior das distribuições de probabilidade Embora a média a variância e a covariância sejam as medidasresumo mais frequentemente uti lizadas nas FDP univariadas e multivariadas por vezes precisamos considerar os momentos de ordem superior das FDP como os momentos de terceira e de quarta ordem Os momentos de terceira e quar ta ordem de uma FDP univariada f x em torno de seu valor médio π são definidos como Em geral o momento de ordem r em torno da média é definido como M O terceiro e quarto momentos de uma distribuição são normalmente utilizados no estudo da for ma de uma probabilidade em particular da sua assimetria S falta de simetria e curtose K ele vação ou achatamento como apresentado na Figura A3 Uma medida de assimetria é definida como Uma medida comumente utilizada de curtose é dada por quarto momento em torno da média 812 Apêndice A Revisão de alguns conceitos estatísticos 05 04 03 02 01 00 05 04 03 02 01 00 4 3 2 1 0 1 2 3 4 3 2 1 0 1 2 3 4 4 Assimétrico à direita Simétrico Assimétrico à esquerda Mesocúrtica Leptocúrtica Platicúrtica a b As FDP com valor de K menores de 3 são chamadas platicúrticas gordas ou de caudas curtas e aquelas com valores maiores de 3 são chamadas leptocúrticas magras ou de caudas longas Veja a Figura A3 Uma FDP com um valor curtose de 3 é conhecida como mesocúrtica e desta a distribui ção normal é o principal exemplo Veja a discussão da distribuição normal na Seção A6 Mostraremos de forma sucinta como as medidas de assimetria e curtose podem ser combinadas para determinar se uma variável aleatória segue uma distribuição normal Lembremos que o procedi mento de teste da hipótese como nos testes t e F é baseado na hipótese ao menos para as amostras pequenas e finitas de que a distribuição subjacente da variável ou estatística da amostra é normal É portanto muito importante descobrir nas aplicações concretas se essa hipótese é cumprida A6 Algumas distribuições de probabilidade teóricas importantes No livro é feito amplo uso das seguintes distribuições de probabilidade Distribuição normal A mais conhecida de todas as distribuições de probabilidade teóricas é a distribuição normal cuja figura em forma de sino é familiar a qualquer um com conhecimento estatístico mínimo Uma variável aleatória contínua X é considerada normalmente distribuída se a sua FDP tem a seguinte forma Figura a3 a Assimetria b Curtose Apêndice A Revisão de alguns conceitos estatísticos 813 em que π e æ2 conhecidas como parâmetros da distribuição são respectivamente a média e a variân cia da distribuição As propriedades dessa distribuição são as seguintes 1 Ela é simétrica em torno do seu valor médio 2 Aproximadamente 68 da área sob a curva normal situase entre os valores de π æ cerca de 95 da área situase entre π 2æ e cerca de 997 situase entre π 3æ como mostra a Figura A4 3 A distribuição normal depende de dois parâmetros π e æ2 como estes são especificados podese encontrar a probabilidade de que X se situará dentro de um certo intervalo ao utilizar a FDP da distribuição normal Mas essa tarefa pode ser facilitada consideravelmente ao consultarmos Tabela D1 do Apêndice D Para utilizarmos a tabela convertemos a conheci da variável X de distribuição normal com a média π e æ2 em uma variável normal padro nizada Z pela seguinte transformação Uma importante propriedade de qualquer variável padronizada é que o seu valor médio é zero e sua variância é a unidade Assim Z possui média zero e variância 1 Substituin do z na função FDP dada anteriormente obtemos que é a FDP da variável normal padronizada As probabilidades apresentadas no Apêndice D Tabela D1 são baseadas na variável normal padronizada Por convenção denotamos uma variável distribuída de forma normal como em que significa distribuído como N indica distribuição normal e as quantidades entre parênteses são os dois parâmetros da distribuição normal ou seja a média e a variância Seguindo essa convenção significa que X é uma variável de distribuição normal com média zero e variância 1 Em outras palavras ela é a variável normal padronizada Z 3 2 æ π æ 2 3 68 aproximadamente 95 aproximadamente 997 aproximadamente æ æ æ æ Figura a4 Áreas sob a curva normal 814 Apêndice A Revisão de alguns conceitos estatísticos ExEmplo 18 Suponha que X ª N8 4 Qual a probabilidade de que X assumirá um valor entre X1 D 4 e X2 D 12 Para calcularmos a probabilidade requerida estimamos os valores de Z como Agora com base na Tabela D1 observamos que Pr0 Z 2 D 04772 Então por simetria temos Pr2 Z 0 D 04772 Por conseguinte a probabilidade requerida é 04772 C 04772 D 09544 Veja a Figura A4 ExEmplo 19 Qual a probabilidade de no exemplo anterior X exceder 12 A probabilidade de que X exceda 12 é a mesma de que Z exceda 2 com base na Tabela D1 é óbvio que essa proba bilidade é 05 04772 ou 00228 4 Sejam e suponha que elas sejam independentes Con sidere agora a combinação linear em que a e b são constantes Então pode ser demonstrado que Esse resultado que afirma que uma combinação linear de variáveis de distribuição normal é distribuída normalmente pode ser facilmente generalizado para uma combinação linear de mais de duas variáveis de distribuição normal 5 Teorema central do limite Considere que X1 X2 Xn denotem n variáveis aleatórias independentes todas elas possuem a mesma FDP com média D π e variância D æ2 a média amostral À medida que n aumenta indefinidamente ien 1 n 1 Isto é X aproximase da distribuição normal com média µ e variância æ2 n Repare que esse resultado é verdadeiro não importando a forma da FDP Como resultado temos Ou seja Z é uma variável normal padronizada 6 O terceiro e quarto momento da distribuição normal em torno do valor médio são como se segue Nota todos os momentos de ordem ímpar em torno do valor médio de uma variável normal mente distribuída são zero Apêndice A Revisão de alguns conceitos estatísticos 815 7 Como resultado e seguindo as medidas de assimetria e curtose discutidas anteriormente para uma FDP normal a simetria é D 0 e a curtose é D 3 uma distribuição normal é simé trica e mesocúrtica Portanto um teste simples de normalidade é descobrir se os valores calculados de assimetria e curtose afastamse das normas de 0 e 3 Esta é de fato a lógica subjacente ao teste de normalidade JarqueBera JB discutido no livro 5121 em que S representa a assimetria e K a curtose Sob a hipótese nula da normalidade JB é distribuído como uma estatística quiquadrado com 2 graus de liberdade 8 A média e a variância de uma variável aleatória com distribuição normal são independentes no sentido de que uma não é função da outra 9 Se X e Y são de distribuição conjunta normal elas são independentes se e apenas se a cova riância entre elas cov X Y é zero Veja o Exercício 41 a distribuição 2 quiquadrado Sejam Z1 Z2 Zk variáveis normais padronizadas independentes variáveis normais com média zero e variância 1 Então a quantidade possui a distribuição 2 com k graus de de liberdade gl em que o termo gl significa o número de quantidades independentes na soma anterior Uma variável com distribuição quiquadrado é represen tada por 2 k em que o subscrito k indica o gl Geometricamente a distribuição quiquadrada aparece na Figura A5 As propriedades da distribuição 2 são as seguintes 1 Como demonstra a Figura A5 a distribuição 2 é uma distribuição assimétrica o grau de as simetria dependendo do gl Para um gl relativamente pequeno a distribuição é altamente assimétrica para a direita mas à medida que o gl aumenta a distribuição tornase progres sivamente simétrica Na verdade para o gl superior a 100 a variável pode ser tratada como uma variável normal padronizada em que k é o gl 2 f 2 0 Densidade k 2 k 5 k 10 Figura a5 Função da densidade da variável 2 816 Apêndice A Revisão de alguns conceitos estatísticos 2 A média de distribuição quiquadrado é k e sua variância é 2k em que k é o gl 3 Se Z1 e Z2 são duas variáveis quiquadrados independentes com gl k1 e k2 então a soma Z1 C Z2 é também uma variável quiquadrado com gl D k1 C k2 ExEmplo 20 Qual a probabilidade de obter um 2 com valor de 40 ou maior dado o gl de 20 Como mostra a Tabela D4 a probabilidade de obter um 2 com valor de 399968 ou maior 20 gl é de 0005 Portanto a probabilidade de obter um 2 com valor de 40 ou maior é menor do que 0005 uma probabilidade bem pequena Distribuição t de student Se Z1 é uma variável normal padrão Z1 N0 1 e outra variável Z2 segue a distribuição qui quadrada com k graus de liberdade e é distribuída independentemente de Z1 a variável definida como segue a distribuição t de Student com k graus de liberdade Uma variável com distribuição t é frequentemente designada como tk em que o subscrito k denota os graus de liberdade Geometri camente a distribuição t é apresentada na Figura A6 As propriedades da distribuição t de Student são as seguintes 1 Como a Figura A6 demonstra a distribuição t assim como a distribuição normal é simétri ca porém ela é mais achatada do que a distribuição normal Contudo à medida que aumen tam os graus de liberdade a distribuição t aproximase da distribuição normal 2 A média da distribuição t é zero e sua variância é k k 2 A distribuição t está tabulada na Tabela D2 ExEmplo 21 Dado que os graus de liberdade são iguais a 13 qual a probabilidade de obter um valor t a de cerca de 3 ou maior b de aproximadamente 3 ou menor e c com valor t ou cerca de 3 ou maior em que t significa o valor absoluto de t não levando em conta o sinal C ou Com base na Tabela D2 as respostas são a cerca de 0005 b cerca de 0005 devido à simetria da distribuição e c cerca de 001 D 20005 0 t k 120 normal k 20 k 5 Figura a6 Distribuição de t de Student para graus de liberdade selecionados Apêndice A Revisão de alguns conceitos estatísticos 817 F f F 0 Densidade F5050 F102 F22 a distribuição F Se Z1 e Z2 são variáveis que possuem uma distribuição quiquadrado independente com graus de liberdade k1 e k2 respectivamente a variável segue a distribuição F de Fisher com graus de liberdade k1 e k2 Uma variável com distribuição F é representada por Fk1k2 em que os subscritos indicam os graus de liberdade associados à duas variáveis Z k1 sendo denominado grau de liberdade do numerador e k2 grau de liberdade do denominador Geometricamente a distribuição F é demonstrada na Figura A7 A distribuição F conta com as seguintes propriedades 1 Como a distribuição quiquadrado a distribuição F tem viés para a direita Porém podese demonstrar que à medida que k1 e k2 tornamse maiores a distribuição F aproximase da distribuição normal 2 O valor médio de uma variável com distribuição F é k2 k2 2 que é definido por k2 2 e sua variância é que é definida por k2 4 3 O quadrado de uma variável aleatória com distribuição t com k graus de liberdade possui uma distribuição F com 1 e k graus de liberdade Simbolicamente ExEmplo 22 Dado k1 D 10 e k2 D 8 qual a probabilidade de obter um valor F a de 34 ou maior e b de 58 ou maior Como demonstra a Tabela D3 essas probabilidades são a aproximada mente 005 e b aproximadamente 001 4 Se o grau de liberdade do denominador k2 é muito elevado a seguinte relação ocorre entre as distribuições F e quiquadrado Figura a7 Distribuição F para vários graus de liberdade 818 Apêndice A Revisão de alguns conceitos estatísticos Para um grau de liberdade do denominador bastante alto o grau de liberdade do numerador multiplicado pelo valor F é aproximadamente o mesmo de um valor quiquadrado com grau de liberdade do numerador ExEmplo 23 Sejam k1 D 20 e k2 D 120 O valor F crítico de 5 para esses graus de liberdade é 148 Por conseguinte o F de k1 D 20148 D 296 Com base na distribuição quiquadrado para 20 graus de liberdade o valor quiquadrado crítico de 5 é cerca de 3141 Por sinal perceba que como para um grau de liberdade do denominador mais elevado a distri buição t a distribuição quiquadrado e a distribuição F aproximamse da distribuição normal essas três distribuições são conhecidas como as distribuições relacionadas à distribuição normal Distribuição binomial de bernoulli Considerase que uma variável aleatória X segue a distribuição de Bernoulli denominada assim em homenagem ao matemático suíço se a sua função de densidade ou massa de probabilidade FDP é em que p 0 p 1 é a probabilidade de que algum evento seja um sucesso como a probabilidade de obter cara no lançamento de uma moeda Para tal variável ou seja q D 1 p a probabilidade de um fracasso Distribuição binomial A distribuição binomial é a generalização da distribuição de Bernoulli Denotemos por n o número de tentativas independentes cada uma delas resulta em um sucesso com probabilidade p e um fra casso com uma probabilidade q D 1 p Se X representa o número do sucesso em n tentativas então dizse que X segue a distribuição binomial cuja FDP é em que x representa o número do sucesso em n tentativas e em que n lido como n fatorial significa n n 1 n 2 1 A binomial é uma distribuição de dois parâmetros n e p Para essa distribuição Por exemplo se lançarmos uma moeda 100 vezes e quisermos descobrir a probabilidade de obter 60 caras colocamos na fórmula acima p D 05 n D 100 e x D 60 Existem rotinas de cálculos para avaliação de tais probabilidades Podemos verifcar como a distribuição binomial é uma generalização da distribuição de Bernoulli Apêndice A Revisão de alguns conceitos estatísticos 819 a distribuição de poisson Considerase que uma variável aleatória X tem uma distribuição de Poisson se a sua FDP é A distribuição de Poisson depende de um parâmetro único Uma característica distintiva da distribuição de Poisson é que a sua variância é igual a seu valor esperado que é Isto é O modelo de Poisson como vimos no capítulo sobre os modelos de regressão não linear é utili zado para modelar fenômenos raros ou infrequentes como o número de chamadas telefônicas rece bidas em um intervalo de 5 minutos ou o número de multas por excesso de velocidade recebidas em um intervalo de uma hora ou ainda os números de patentes recebidas por uma empresa em um ano A7 Inferência estatística estimação Na Seção A6 consideramos várias distribuições de probabilidade teóricas Muito frequentemente sabemos ou estamos propensos a admitir que uma variável aleatória X segue uma distribuição de pro babilidade particular mas não sabemos os valores dos parâmetros da distribuição Por exemplo se X segue a distribuição normal podemos querer saber o valor de seus dois parâmetros a média e a variância Para estimarmos as incógnitas o procedimento habitual é supor que temos uma amostra aleatória de tamanho n com base na distribuição da probabilidade conhecida e utilizar os dados da amostra para estimar os parâmetros desconhecidos5 Isso é chamado de problema da estimação Nes ta seção examinaremos mais de perto esse problema Ele pode ser dividido em duas categorias esti mação pontual e estimação intervalar Estimação pontual Para melhor entendermos seja X uma variável aleatória com FDP de f x µ em que µ é o parâ metro da distribuição para simplificar a discussão supomos que há apenas um parâmetro desconhe cido nossa discussão pode ser facilmente generalizada Suponha que conhecemos a forma funcional conhecemos a FDP teórica tal como a distribuição t mas não conhecemos o valor de µ Portanto sorteamos uma amostra aleatória de tamanho n a partir dessa FDP conhecida e desen volvemos uma função dos valores da amostra de modo que forneçanos uma estimativa do verdadeiro µ µO é conhecido como uma estatística ou um estimador e um valor numérico particular tomado pelo estimador é conhecido como estimativa Perceba que µO pode ser tratada como uma variável aleatória poque é uma função dos dados amostrais µO nos forne ce uma regra ou fórmula que nos conta como estimamos o verdadeiro µ Assim se admitimos que em que X é a média da amostra então X é um estimador do verdadeiro valor da média por exemplo π Se em um caso específico X D 50 isso fornece uma estimativa de π O estimador µO obtido pre viamente é conhecido como estimador pontual por fornecer apenas uma estimativa única pontual de µ 5 Sejam X1 X2 Xn n variáveis aleatórias com FDP conjunta f x1 x2 xn Se podemos escrever em que f x é a FDP comum de cada X então dizse que x1 x2 xn constituem uma amostra aleatória de tamanho n com base em uma população com FDP f xn 820 Apêndice A Revisão de alguns conceitos estatísticos Estimação intervalar Em vez de obtermos apenas uma estimativa única de µ suponha que obtenhamos duas estimativas de µ ao construirmos dois estimadores µO1x1 x2 xn e µO2 x1 x2 xn e com alguma confiança probabilidade que o intervalo entre µO1 e µO2 inclui o verdadeiro µ Na estimação intervalar em contraste com a estimação pontual fornecemos uma amplitude de valores possíveis dentro dos quais o verdadeiro µ pode estar O conceito principal por trás da estimação intervalar é a noção de amostra ou probabilidade de distribuição de um estimador Por exemplo podese demonstrar que se uma variável X possui distribuição normal a média da amostra X também possui distribuição normal com média D µ a média verdadeira e variância D æ2 n em que n é o tamanho da amostra Em outras palavras a distribuição amostral ou probabilidade do estimador Como resultado se construirmos o intervalo e dissermos que a probabilidade é de aproximadamente 095 ou 95 intervalos como esse incluirão o verdadeiro µ estamos de fato construindo um estimador de intervalo para µ Perceba que o inter valo fornecido anteriormente é aleatório uma vez que é baseado em X que variará de amostra para amostra De forma mais geral na estimação intervalar construímos dois estimadores µO1 e µO2 ambos fun ções dos valores amostrais de X de maneira que ou seja podemos afirmar que é de 1 Æ a probabilidade de que o intervalo de µO1 a µO2 contenha o verdadeiro µ Este é conhecido como intervalo de confiança de tamanho 1 Æ para µ 1 Æ sendo conhecido como coeficiente de confiança Se Æ 005 então 1 Æ 095 significando que se construímos um intervalo de confiança com um coeficiente de confiança de 095 então nas constru ções repetidas resultantes de amostras repetidas deveremos estar certos em 95 de 100 casos se afir marmos que o intervalo contém o verdadeiro µ Quando o coeficiente de confiança é 095 frequentemente dizemos que temos um intervalo de confiança de 95 Em geral se o coeficiente de confiança é de 1 Æ dizemos que temos um intervalo de confiança de 1001 Æ Perceba que Æ é conhecido como o nível de significância ou a probabilidade de cometer um erro de Tipo I Esse tópico é discutido na Seção A8 ExEmplo 24 Suponha que a distribuição da altura dos homens de uma população possua distribuição normal com média D µ polegadas e æ D 25 polegadas Uma amostra de 100 homens tirada de forma aleatória dessa população tem uma média de altura de 67 polegadas Estabeleça um intervalo de confiança de 95 para a média de altura D µ da população como um todo Como foi notado X ª N µ æ2 n que nesse caso tornase X ª N µ 252 100 Pela Tabela D1 podese verificar que cobre 95 da área sob a curva normal Portanto o intervalo anterior fornece um intervalo de confiança de 95 para µ inserindo os valores fornecidos de X æ e n obtemos o intervalo de confiança de 95 como Continua Apêndice A Revisão de alguns conceitos estatísticos 821 ExEmplo 24 Continuação Em mensurações repetidas como essa os intervalos assim estabelecidos incluirão o verdadei ro µ com 95 de confiança Um comentário técnico pode ser feito aqui Embora possamos dizer que a probabilidade de que o intervalo aleatório inclui µ seja de 95 não podemos dizer que seja de 95 a probabilidade de que o intervalo particular 6651 6749 inclua µ Como esse intervalo é fixado a probabilidade de que ele incluirá µ é 0 ou 1 O que podemos afirmar é que se construirmos 100 desses intervalos 95 dos 100 intervalos incluirão µ não podemos garantir que um intervalo em particular incluirá necessarimante µ métodos de estimação De maneira geral há três métodos de estimação de parâmetros 1 mínimos quadrados MQ 2 máxima verossimilhança MV e 3 método dos momentos MM e sua extensão o método dos mo mentos generalizado MMG Temos dedicado tempo considerável para ilustrar o método dos mínimos quadrados No Capítulo 4 introduzimos o método da máxima verossimilhança no contexto da regres são mas esse método possui uma aplicação muito mais ampla A ideiachave por trás do método da verossimilhança é a função de verossimilhança Para ilustrar suponha que a variável aleatória X possui FDP f X µ que depende de um parâmetro único µ Conhe cemos a FDP por exemplo de Bernoulli ou binomial mas não conhecemos o valor do parâmetro Suponha que obtenhamos uma amostra aleatória de nX valores A FDP conjunta desses n valores é Por ela ser uma amostra aleatória podemos escrever a FDP conjunta anterior como um produto das FDPs individuais A FDP conjunta possui uma interpretação dual Se µ é conhecido interpretamos como uma FDP conjunta de se observar os dados de valores amostrais Por outro lado podemos tratála como uma função de µ para valores de x1 x2 xn Na segunda interpretação chamamos a FDP conjunta de função de verossimilhança e escrevemos como Observe a inversão do papel de µ na função de densidade de probabilidade conjunta e na função de verossimilhança O estimador de máxima verossimilhança de µ é aquele valor de µ que maximiza a função de veros similhança da amostra L Por uma conveniência matemática em geral tomamos o logaritmo da verossimilhança chamado função log de verossimilhança log L Seguindo as regras de cálculo da maximização diferenciamos a função log de verossimilhança com respeito à incógnita e iguala mos a derivada resultante a zero O valor resultante do estimador é chamado estimador de máxima verossimilhança Podese aplicar a condição de maximização de segunda ordem para assegurar que o valor que obtivemos é de fato o valor máximo No caso de haver mais de um parâmetro desconhecido diferenciamos a função log de verossimi lhança com respeito a cada incógnita igualamos as expressões resultantes a zero e solucionamos si multaneamente para obter os valores dos parâmetros desconhecidos Já demonstramos isso com relação ao modelo de regressão múltipla veja o Capítulo 4 Apêndice 4A1 ExEmplo 25 Suponha que a variável aleatória X siga a distribuição de Poisson com o valor médio de Suponha que x1 x2 xn sejam variáveis aleatórias de Poisson independentes cada uma com média Suponha que queiramos descobrir o estimador de máxima verossimilhança de A função de verossimilhança aqui é Continua 822 Apêndice A Revisão de alguns conceitos estatísticos ExEmplo 25 Continuação Essa é uma expressão razoavelmente difícil de manejar mas se tomarmos o seu log ela se torna em que log c D 5 xi Diferenciando a expressão anterior com respeito a obtemos igualando essa última expressão a zero obtemos que é o estimador de máxima verossimilhança da incógnita Método dos momentos Apresentamos uma noção do método dos momentos no Exercício 34 no chamado princípio da analogia no qual os momentos da amostra tentam duplicar as propriedades de suas contrapartes na população O método dos momentos generalizado MMG que é uma generalização do MM agora está tornandose mais popular porém não em um nível introdutório Desse modo por ora não trata remos dele As propriedades estatísticas desejáveis agrupamse em duas categorias propriedades das amos tras pequenas ou amostras finitas e propriedades das amostras grandes ou assintóticas Por trás desses conjuntos de propriedades está a noção de que um estimador possui uma distribuição em amostra ou de probabilidade propriedades de pequenas amostras Sem viés Um estimador µO é chamado de estimado não tendencioso não viesado e de µ se o valor esperado de µO for igual ao verdadeiro µ isto é ou Se essa igualdade não se sustenta o estimador é conhecido como viesado e o viés é calculado como É claro se EµO D µ isto é µO é um estimador não viesado o viés é zero Geometricamente a situação é representada na Figura A8 Observe que a não tendenciosidade é uma propriedade das amostras repetidas não de qualquer amostra mantendo o tamanho da amostra fixo ex traímos várias amostras obtendo cada vez uma estimativa do parâmetro desconhecido Esperase que o valor médio dessas estimativas seja igual ao valor verdadeiro se o estimador não possuir viés Variância mínima Dizse que µO é um estimador de mínima variância de µ se a variância de µO1 for menor ou pelo menos igual à variância de µO2 que é qualquer outro estimador de µ Geometricamente temos Apéndice A Revisdo de alguns conceitos estatisticos 823 FIGURA A8 vis Estimadores viesados e nao viesados fA f Az SY 7 EA E 0 a Figura A9 que mostra os trés estimadores de 6 ou seja 6 42 e 63 e suas distribuigdes de proba bilidade Como demonstrado a variancia de é menor que as de 6 e 63 Entéo admitindo apenas os trés estimadores possiveis neste caso 3 6 um estimador de variancia minima Porém perceba que 03 é um estimador tendencioso por qué Melhor estimador nao viesado ou estimador eficiente Se 0 e 6 sao dois estimadores nao viesados de 6 a variancia de 6 6 menor ou no maximo igual a variancia de 6 6 um estimador nfo viesado de variancia minima ou melhor nao viesado ou eficiente Na Figura A9 dos dois estimadores nao viesados 0 e 6 8 o melhor nao viesado ou eficiente Linearidade Um estimador a conhecido como um estimador linear de 6 se ele é uma fungao linear das observacées da amostra A média da amostra definida como 1 1 X 0X X X2 Xp n n é um estimador linear porque é uma fungao linear dos valores de X Melhor estimador linear nao viesado ou estimador eficiente Se 4 6 linear é nao viesado e possui uma variancia minima no grupo de todos os estimadores lineares no viesados de 6 ele 6 chamado de melhor estimador linear nao viesado ou para resu mir BLUE Estimador com erro quadrado médio minimo MSE O MSE de um estimador 6 é definido como MSE E6 6 FIGURA A9 fA Distribuicdo de trés I estimadores de 0 fA e EA 824 Apêndice A Revisão de alguns conceitos estatísticos Isso contrasta com a variância de µO que se define como A diferença entre as duas é que a var µO mensura a dispersão da distribuição de µO em torno da sua média ou valor esperado enquanto o MSEµO mensura a dispersão em torno do valor verdadeiro do parâmetro A relação entre as duas é como se segue é viés Naturalmente se o viés é zero MSE µO D var µO6O critério MSE mínimo consiste em escolher um estimador cujo MSE seja o menor em um conjunto de estimadores concorrentes Observe que mesmo se tal estimador for encontrado há um tradeoff envolvido para obter uma variância míni ma podemos ter de aceitar algum viés Geometricamente a situação é apresentada na Figura A10 Nesta figura µO2 é levemente viesado mas sua variância é menor do que a do estimador não viesado µO1 Na prática contudo o critério MSE mínimo é utilizado quando o critério do melhor não viesado é incapaz de produzir estimadores com variâncias menores propriedades de grandes amostras Em geral acontece de um estimador não satisfazer uma ou mais das propriedades estatísticas desejáveis em amostras pequenas Contudo à medida que o tamanho da amostra cresce indefinida mente o estimador possui várias propriedades estatísticas desejáveis Essas propriedades são conhe cidas como propriedades de amostras grandes ou assintóticas Estimadores de µ f 2 E 2 f 1 µ µ E 1 µ µ Densidade de probabilidade µ Ausência assintótica de viés Um estimador µO é considerado um estimador assintoticamente não viesado de µ se 6 O último termo pode ser escrito como Observe também que posto que o valor esperado de uma constante é simplesmente a própria constante Figura a10 Apêndice A Revisão de alguns conceitos estatísticos 825 em que µOn significa que o estimador é baseado no tamanho da amostra de n lim significa limite e n 1 indica que n cresce indefinidamente Em outras palavras µO é um estimador assintoticamente não viesado de µ se o seu valor esperado ou média aproximase do valor verdadeiro à medida que o ta manho da amostra tornase cada vez maior Como exemplo considere a seguinte mensuração da variância amostral de uma variável aleatória X Podese demonstrar que em que æ2 é a verdadeira variância É óbvio que em uma amostra pequena S 2 é viesado mas à me dida que n cresce indefinidamente ES 2 aproximase do verdadeiro æ2 portanto é assintoticamente não viesado Consistência Dizse que µO é um estimador consistente se ele se aproxima do valor verdadeiro µ à medida que o tamanho da amostra tornase cada vez maior A Figura A11 ilustra a propriedade Na figura temos a distribuição de µO baseada no tamanho das amostras de 25 50 80 e 100 Como mostra a figura µO ba seado em n D 25 é viesado posto que sua distribuição amostral não é centrada no verdadeiro µ Po rém à medida que n cresce a distribuição de µO não apenas tende a ser mais proximamente fechada em µ µO tornase menos viesado mas sua variância também tornase menor Se no limite quando n cresce indefinidamente a distribuição de µO convergir para um único ponto µ isto é se a distribuição de µO tiver dispersão ou variância zero dizemos que µO é um estimador consistente de µ f n100 Densidade de probabilidade µ f n 80 µ f n 50 µ f n 25 µ µ µ Dizse mais formalmente que µO é um estimador consistente de µ se a probabilidade de que o valor absoluto da diferença entre µO e µ seja menor do que uma quantidade positiva arbitrariamente pequena aproximase de 1 quando n tende ao infinito Simbolicamente Figura a11 A distribuição de µ à medida que a amostra cresce 826 Apêndice A Revisão de alguns conceitos estatísticos em que P significa probabilidade Isso é frequentemente expresso como em que plim indica o limite em probabilidade Perceba que as propriedades de não tendenciosidade de consistência são conceitualmente muito dife rentes A propriedade de não tendenciosidade pode compreender qualquer tamanho de amostra enquanto a consistência é estritamente uma propriedade das amostras grandes Um condição suficiente para a consistência é que tanto o viés quanto a variância tendam a zero à medida que o tamanho da amostra cresce indefinidamente7 Por outro lado uma condição suficiente para a consistência é que o quadrado médio mínimo MSEµO tende a zero à medida que n cresce in definidamente Para MSEµO veja a discussão anteriormente apresentada ExEmplo 26 Seja X1 X2 Xn uma amostra aleatória com base em uma distribuição com média π e variância æ 2 Demonstre que a média XS da amostra é um estimador consistente de π Por meio de estatísticas elementares sabese que Uma vez que E XS D µ independentemente do tamanho da amostra ele é não viesado Além disso à medida que n cresce indefinidamente a var XS tende a zero Por isso XS é um estimador consistente de π As seguintes regras sobre a probabilidade são dignas de nota 1 Invariância propriedade de Slutsky Se µO for um estimador consistente de µ e se hµO for qualquer função de µO então O que isso significa é que se µO for um estimador consistente de µ 1µO será também um esti mador consistente de 1µ e que log µO será também um estimador consistente de log µ Perceba que essa propriedade não é válida para o operador de expectativa E isto é se µO for um estimador não viesado de µ isto é EµO D θ não será verdade que 1µO é um estimador não viesado de 1µ isto é E1µO 1EµO D 1µ 2 Se b é uma constante Ou seja o limite em probabilidade de uma constante é a mesma constante 3 Se µO1 e µO2 forem estimadores consistentes As duas últimas propriedades em geral não são válidas para o operador de expectativa E Assim EµO1µO2 EµO1EµO2 De maneira semelhante EµO1 µO2 EµO1 EµO2 Se entre tanto µO1 e µO2 forem distribuídos independentemente EµO1 µO2 D EµO1 EµO2 como observa do anteriormente 7 Mais tecnicamente limn E µOn D µ e limn var µOn D 0 Apêndice A Revisão de alguns conceitos estatísticos 827 Eficiência assintótica Seja µO um estimador de µ A variância da distribuição assintótica de µO é chamada de variância assintótica de µO Se µO for consistente e a sua variância assintótica for menor do que a variância assin tótica de todos os estimadores consistentes de µ µO é chamado de assintoticamente eficiente Normalidade assintótica Um estimador µO é considerado ter distribuição assintoticamente normal se sua distribuição amos tral tende a aproximarse da distribuição normal à medida que o tamanho da amostra n cresce indefi nidamente Por exemplo a teoria estatística demonstra que se X1 X2 Xn são variáveis independentes com distribuição normal e possuem a mesma média π e a mesma variância æ2 a média da amostra X também possui distribuição normal com média π e variância æ2n em amostras pe quenas e também em amostras grandes Contudo se os Xi forem independentes com média π e variância æ2 mas não necessariamente pertencerem à distribuição normal a média da amostra X possuirá distribuição assintoticamente normal com média π e variância æ2n ou seja à medida que o tamanho da amostra n cresce indefinidamente a média da amostra tende a ser normalmente distribuída com média π e variância æ2n Na verdade esse é o teorema central do limite previa mente discutido A8 Inferência estatística testando as hipóteses A estimação e o teste da hipótese constituem os ramos gêmeos da inferência estatística clássica Ao examinarmos o problema da estimação examinaremos brevemente o problema do teste estatísti co de hipóteses O problema do teste de hipótese pode ser estabelecido da seguinte forma admita que tenhamos uma variável aleatória X com uma FDP conhecida f x µ em que µ é o parâmetro da distribuição Ao obtermos uma amostra aleatória de tamanho n obtemos o estimador pontual µO Uma vez que o ver dadeiro µ é raramente conhecido levantamos a questão o estimador µO é compatível com algum valor hipotético de µ por exemplo µ µ em que µ é um valor numérico específico de µ Em outras palavras poderia a nossa amostra ser proveniente da FDP f x µ D µ Na linguagem de teste da hipótese µ D µ é chamado hipótese nula ou sustentada e é geralmente denotada por H0 A hipótese nula é testada contra uma hipótese alternativa denotada por H1 que por exem plo pode estabelecer que µ µ Nota em alguns livros H0 e H1 são designados por H1 e H2 respectivamente A hipótese nula e a hipótese alternativa podem ser simples ou compostas Uma hipótese é deno minada simples se especifica os valores dos parâmetros de distribuição do contrário é chamada de hipótese composta Assim se X ª Nπ æ2 e afirmamos que é uma hipótese simples enquanto é uma hipótese composta porque aqui o valor de æ não é especificado Para testarmos a hipótese nula por exemplo para testar sua validade utilizamos a informação da amostra para obter o que é conhecido como estatística de teste Muito frequentemente essa estatís tica de teste tornase o estimador pontual do parâmetro desconhecido Então tentamos descobrir a distribuição da amostra ou da probabilidade da estatística de teste e utilizamos a abordagem do in tervalo de confiança ou o teste de significância para testar a hipótese nula O mecanismo é ilustrado a seguir 828 Apêndice A Revisão de alguns conceitos estatísticos Para melhor entendermos vamos voltar ao Exemplo 24 que diz respeito à altura X dos homens em uma população Dizemos que Xi Nµ æ 2 D Nπ 252 X D 67 n D 100 Vamos admitir que A questão é poderia a amostra com X D 67 a estatística de teste ter sido extraída da população com o valor médio de 69 Intuitivamente não podemos rejeitar a hipótese nula se X é suficientemen te próximo de π ou então podemos rejeitála em favor da hipótese alternativa Como decidimos que X é suficientemente próximo de π Podemos adotar duas abordagens 1 intervalo de confiança e 2 teste de significância ambas levando a conclusões idênticas em qualquer aplicação específica a abordagem do intervalo de confiança Posto que Xi Nµ æ2 sabemos que a estatística de teste X é distribuída como Uma vez que conhecemos a distribuição de probabilidade de X por que não estabelecer por exemplo um intervalo de confiança de 1001 Æ para π baseado em X e verificar se esse intervalo de confiança inclui π D π Se incluir não poderemos rejeitar a hipótese nula se não incluir pode remos rejeitar a hipótese nula Assim se Æ D 005 teremos um intervalo de confiança de 95 e se este intervalo de confiança incluir π não poderemos rejeitar a hipótese nula 95 dentre 100 inter valos assim estabelecidos deverão provavelmente incluir π O procedimento é como se segue uma vez que X ª Nπ æ2n seguese que ou seja uma variável normal padrão Por meio da tabela de distribuição normal sabemos que Isto é que rearranjada resulta em Isso é um intervalo de confiança para π Uma vez que esse intervalo foi estabelecido o teste da hipótese nula é simples Tudo o que temos de fazer é verificar se π D π está nesse intervalo Se es tiver não poderemos rejeitar a hipótese nula se não estiver poderemos rejeitála Apêndice A Revisão de alguns conceitos estatísticos 829 Região crítica Região crítica 69 situase nesta região π Região de aceitação 95 25 10 25 X 196 10 X 196 6749 6651 Voltando ao Exemplo 24 já estabelecemos um intervalo de confiança de 95 para π que é Obviamente esse intervalo não inclui π D 69 Por conseguinte podemos rejeitar a hipótese nula de que o verdadeiro π é 69 com um coeficiente de confiança de 95 Geometricamente a situação é como apresentada na Figura A12 Na linguagem do teste de hipóteses o intervalo de confiança que estabelecemos é chamado de região de aceitação e as áreas fora das regiãoões ésão chamadas regiãoões críticas ou regiãoões de rejeição da hipótese nula Os limites inferior e superior da região de aceitação que a separam das regiões de rejeição são chamados valores críticos Nessa linguagem do teste de hipó teses se o valor hipotético recair na região de aceitação não se poderá rejeitar a hipótese nula caso contrário podese rejeitála É importante observar que ao decidir rejeitar ou não a H0 pode vir a ocorrer dois tipos de erros 1 podemos rejeitar H0 quando ela for de fato verdadeira este é o chamado erro tipo I no exemplo anterior X D 67 poderia ser proveniente da população com um valor médio de 69 ou 2 podemos não rejeitar H0 quando ela for de fato falsa este é chamado de erro tipo II Portanto um teste de hipótese não estabelece o valor do verdadeiro π Ele apenas fornece meios de decidir se podemos agir como se π D π Erros do tipo I e do tipo II Esquematicamente temos Idealmente gostaríamos de minimizar tanto os erros do tipo I quanto os do tipo II Infelizmente para qualquer tamanho de amostra não é possível minimizar ambos os erros simultaneamente A abordagem clássica a esse problema incorporada ao trabalho de Neyman e Pearson é supor que um erro do tipo I seja provavelmente mais sério na prática do que um erro do tipo II Deveríamos man ter a probabilidade de cometer um erro do tipo I em um nível bem baixo como 001 ou 005 e então tentar minimizar a probabilidade de cometer um erro do tipo II quanto for possível Na literatura a probabilidade de um erro do tipo I é designada como Æ e é chamada de nível de significância e a probabilidade de um erro do tipo II é designada como Ø A probabilidade de não cometer um erro do tipo II é chamada de potência do teste Em outras palavras a potência de um teste é a sua capacidade de rejeitar uma falsa hipótese nula A abordagem clássica ao teste de hipó tese é fixar Æ em níveis como 001 ou 1 ou 005 5 e tentar maximizar a potência do teste ou seja minimizar Ø Figura a12 Intervalo de confiança de 95 para π 830 Apêndice A Revisão de alguns conceitos estatísticos É importante que o leitor compreenda o conceito da potência de um teste que é mais bem explicado com um exemplo8 Seja ou seja X tem distribuição normal com média π e variância 100 Suponha que Æ D 005 Suponha que tenhamos uma amostra de 25 observações que forneça um valor médio da amostra de X Além disso suponha que consideremos a hipótese H0 π D 50 Posto que X é normalmente distribuído sabemos que a média da amostra é também normalmente distribuí da como Daí estabelecida a hipótese nula de que π D 50 o intervalo de con fiança de 95 para ou seja 4608 a 5392 Portanto a região crítica consiste em todos os valores de X menores que 4608 ou maiores que 5392 Rejeitaremos a hipótese nula de que a média verdadeira é 50 se o valor da média da amostra estiver abaixo de 4608 ou maior que 5392 Porém qual a probabilidade de que X esteja situado nas regiãoões críticas anteriores se o verdadeiro μ possui um valor diferente de 50 Suponha que haja três hipóteses alternativas π D 48 π D 52 e π D 56 Se alguma dessas alternativas for verdadeira ela será a média real da distribuição de X O desvio padrão não é modificado para as três alternativas uma vez que æ2 ainda se pressupõe como 100 As áreas sombreadas na Figura A13 demonstram as possibilidades de que X recairá sobre a região crítica se cada uma das hipóteses alternativas for verdadeira Como se pode verificar essas possibili dades são 017 para π D 48 005 para π D 50 017 para π D 52 e 085 para π D 56 Como se pode verificar nessa figura sempre que o verdadeiro valor de μ difere substancialmente da hipótese em consideração que aqui é π D 50 a probabilidade de rejeitar a hipótese é alta porém quando o ver dadeiro valor não é muito diferente do valor dado para a hipótese nula a probabilidade de rejeição é menor Intuitivamente isso deveria fazer sentido se as hipóteses nula e alternativa fossem muito proxi mamente agrupadas 62 60 58 56 52 50 48 44 π 48 62 60 58 56 52 50 48 44 π 50 H 62 60 58 56 52 50 48 44 π 52 62 60 58 56 54 52 50 48 46 44 π 56 54 46 54 46 54 46 Isso pode ser visto mais adiante quando consideramos a Figura A14 chamada gráfico da função potência a curva demonstra que há a chamada curva de potência 8 A próxima discussão e os gráficos são baseados em walker helen M lev Joseph Statistical inference Nova york holt rinehart e winston 1953 p 161162 Figura a13 Distribuição de X quando N D 25 æ D 10 e π D 48 50 52 ou 56 Na H π D 50 a região crítica com Æ D 005 é X 461 e X 539 A área sombreada indica a probabilidade de que X recaia sobre a região crítica Essa probabilidade é Apêndice A Revisão de alguns conceitos estatísticos 831 O leitor perceberá que o coeficiente de confiança 1 Æ discutido anteriormente é apenas 1 me nos a probabilidade de que se cometa um erro do tipo I Assim um coeficiente de confiança de 95 significa que estamos preparados para aceitar no máximo uma probabilidade de 5 de cometer um erro do tipo I não queremos rejeitar a hipótese verdadeira mais do que 5 vezes em 100 O valor p ou nível exato de significância Em vez de fazer uma préseleção de α em níveis arbitrários como 1 5 ou 10 podese obter o valor p probabilidade ou nível exato de significância de uma estatística de teste O valor p é de finido como o menor nível de significância a que uma hipótese nula pode ser rejeitada Suponhamos que em uma aplicação envolvendo 20 graus de liberdade obtenhamos um valor t de 3552 Agora o valor p ou probabilidade exata de obter um valor t de 3552 ou superior a isso pode ser verificado na Tabela D2 como 0001 unicaudal ou 0002 bicaudal Podemos afirmar que o valor t observado de 3552 é estatisticamente significativo no nível 0001 ou 0002 dependendo de utilizarmos um teste unicaudal ou bicaudal Agora vários pacotes estatísticos rotineiramente apresentam o valor p das estatísticas de teste estimadas Portanto aconselhase ao leitor a observar o valor p sempre que possível Tamanho da amostra e testes de hipótese Em dados de pesquisa envolvendo centenas de observações a hipótese nula parece ser rejeitada com mais frequência do que em amostras pequenas Vale a pena citar aqui Angus Deaton À medida que o tamanho da amostra cresce e desde que utilizemos um procedimento de estimação consistente nossas estimativas estarão próximas da verdade e menos dispersas ao redor dessa verdade para que as discrepâncias que não são detectáveis com o tamanho da amostra pequena levemnos à re jeição em amostras grandes Amostras de tamanhos grandes assemelhamse ao grande poder resolutivo de um telescópio características que não são visíveis a uma certa distância tornamse mais e mais defini damente delineadas à medida que acontece a magnificação9 Seguindo Leamer e Schwarz Deaton sugere ajustar os valores críticos padrão dos testes F e 2 como se segue rejeitar a hipótese nula quando o valor F calculado exceder o logaritmo do tamanho da amostra ou seja ln e quando a estatística 2 calculada para a restrição q exceder qln em que l é o logaritmo natural e n é o tamanho da amostra Esses valores críticos são conhecidos como valo res críticos LeamerSchwarz Utilizando o exemplo de Deaton se n D 100 a hipótese nula seria rejeitada apenas se o valor F calculado fosse maior do que 46 porém se n D 10000 a hipótese nula seria rejeitada quando o valor F calculado excedesse 92 9 Deaton Angus The analysis of household surveys a microeconometric approach to development policy Baltimore The Johns hopkins University Press 2000 p 130 Figura a14 Função da potência do teste de hipótese π D 50 quando N D 25 æ D 10 e Æ D 005 40 42 44 46 48 H Probabilidade de rejeitar H Escala de 52 54 56 58 60 10 09 08 07 06 05 04 03 02 π 01 832 Apêndice A Revisão de alguns conceitos estatísticos a abordagem do teste de significância Lembrese de que Em qualquer aplicação dada X e n são conhecidos ou podem ser estimados contudo os verda deiros π e æ não são conhecidos Porém se æ for especificado e considerarmos fazendo uso da H0 que π D π um valor numérico específico então Zi poderá ser diretamente calculado e poderemos facilmente observar a tabela de distribuição normal para encontrar a probabilidade de obter o valor Z calculado Se essa probabilidade for pequena por exemplo menor do que 5 ou 1 poderemos rejeitar a hipótese nula se a hipótese fosse verdadeira as chances de obter o valor particular de Z deveriam ser muito altas Essa é a ideia geral por atrás da abordagem do teste de significância para o teste de hipótese A ideia central em questão é a estatística de teste aqui a estatística Z e sua distri buição de probabilidade sob o valor presumido de π D π Apropriadamente neste caso o teste é conhecido como teste Z uma vez que utilizamos o valor Z normal padronizado Voltando ao nosso exemplo se π D π D 69 a estatística Z tornase Se observarmos a Tabela D1 de distribuição normal podemos verificar que a probabilidade de obter tal valor de Z é extremamente pequena Nota a probabilidade de um valor Z exceder 3 ou 3 é de aproximadamente 0001 A probabilidade de Z exceder 8 é ainda menor Podemos rejeitar a hi pótese nula de que π D 69 dado esse valor a nossa chance de obter um X de 67 é extremamente pequena Portanto duvidamos que a nossa amostra venha da população com um valor médio de 69 Por meio do diagrama a situação é apresentada na Figura A15 196 25 Z 8 está nesta região 25 Z 196 0 Na linguagem do teste de significância quando dizemos que uma estatística de teste é signifi cativa em geral queremos dizer que podemos rejeitar a hipótese nula Considerase que a estatís tica de teste é significativa se a probabilidade de obtêla for igual ou menor do que Æ a probabilidade de cometer um erro do tipo I Assim se Æ D 005 sabemos que a probabilidade de obter um valor Z de 196 ou 196 é de 5 ou de 25 em cada cauda da distribuição normal pa drão Em nosso exemplo ilustrativo Z era 8 Daí a probabilidade de obter tal valor de Z ser muito menor do que 25 bem abaixo de nossa probabilidade préespecificada de cometer um erro do tipo I É por isso que o valor calculado de Z D 8 é estatisticamente significativo rejeitamos a hipótese nula de que o verdadeiro π seja 69 É claro chegamos à mesma conclusão utilizando a abordagem do intervalo de confiança para o teste de hipótese Figura a15 A distribuição da estatística Z Apêndice A Revisão de alguns conceitos estatísticos 833 Agora vamos resumir os passos envolvidos no teste da hipótese estatística Passo 1 Formule a hipótese nula H0 e a hipótese alternativa H1 por exemplo H0 π D 69 e H1 π D 69 Passo 2 Selecione a estatística de teste por exemplo X Passo 3 Determine a distribuição de probabilidade da estatística de teste por exemplo X ª N µ æ2 n Passo 4 Escolha o nível de significância Æ a probabilidade de cometer um erro do tipo I Passo 5 Utilizando a distribuição de probabilidade da estatística de teste estabeleça um valor de confiança 1001 Æ Se o valor do parâmetro submetido à hipótese nula por exemplo π D π D 69 estiver na região de confiança a região de aceitação não rejeite a hipótese nula Porém se ele estiver fora desse intervalo ou seja dentro da região de rejei ção podese rejeitar a hipótese nula Tenha em mente que ao não rejeitar ou rejeitar uma hipótese nula correse o risco de estar errado em uma porcentagem de Æ Referências Para mais detalhes do material tratado neste apêndice o leitor pode consultar as seguintes re ferências HOEL Paul G Introduction to mathematical statistics 4 ed Nova York John Wiley Sons 1974 Este livro fornece uma introdução bem simples a vários aspectos da estatística matemática FREUND John E e WALPOLE Ronald E Mathematical statistics 3 ed Englewood Cliffs NJ Prentice Hall 1980 Outro livro introdutório em estatística matemática MOOD Alexander M GRAYBILL Franklin A BOE Duane C Introduction to the theory of statistics 3 ed Nova York McGrawHill 1974 Esta é uma introdução abrangente da teoria estatística porém é de certa forma mais difícil do que os dois livros anteriores NEWBOLD Paul Statistics for business and economics Englewood Cliffs NJ Prentice Hall 1984 Uma introdução não matemática abrangente à estatística com vários problemas solucionados 834 Rudimentos de álgebra matricial Este apêndice fornece o essencial sobre álgebra matricial para a compreensão do Apêndice C e de parte do conteúdo do Capítulo 18 A discussão não é rigorosa e não são dadas quaisquer demonstra ções Para demonstrações e mais detalhes o leitor pode consultar as referências B1 Definições matriz Uma matriz é um conjunto retangular de números ou elementos distribuídos em linhas e colunas Mais precisamente uma matriz de ordem ou dimensão M por N escrita como M N é um conjun to de M N elementos distribuídos em M linhas e N colunas Sendo assim com as letras maiúsculas em negrito indicando matrizes uma matriz A M N pode ser expressa como em que ai j é o elemento que aparece na iésima linha e na jésima coluna de A e ai j corresponde a uma expressão abreviada da matriz A cujo elemento essencial é ai j A ordem ou dimensão de uma matriz o número de linhas e colunas é frequentemente escrita embaixo da matriz para facilitar a referência Escalar O escalar é um único número real Em outros termos um escalar é uma matriz 1 1 Vetor coluna Uma matriz constituída de M linhas e apenas uma coluna é chamada vetor coluna Empregando letras minúsculas em negrito para denotar vetores um exemplo de vetor coluna pode ser Apêndice B Apêndice B Rudimentos de álgebra matricial 835 Vetor linha Uma matriz que consiste em uma única linha e N colunas é denominada vetor linha Transposição A transposição de uma matriz A M N indicada por A0 que se lê como A linha ou A transposta é uma matriz N M obtida por meio da troca das linhas pelas colunas de A ou seja a iésima linha de A tornase a iésima coluna de A0 Por exemplo Na medida em que um vetor é um tipo especial de matriz a transposição de um vetor linha é a transposição de um vetor coluna e a transposição de um vetor coluna é um vetor linha Portanto Seguiremos a convenção de indicar os vetores linha com linha submatriz Dada a matriz A M N se todas as colunas e linhas de A forem eliminadas com exceção das r linhas e s colunas a matriz resultante da ordem r s será denominada submatriz de A Sendo assim se e se eliminarmos a terceira linha e a terceira coluna de A obteremos que corresponde a uma submatriz de A cuja ordem é 2 2 B2 Tipos de matrizes matriz quadrada Uma matriz que possui o mesmo número de linhas e colunas é denominada matriz quadrada 836 Apêndice B Rudimentos de álgebra matricial matriz diagonal Uma matriz quadrada que possua pelo menos um elemento diferente de zero na diagonal principal do canto superior esquerdo ao canto inferior direito e possua zeros nas demais posições será chama da de matriz diagonal matriz escalar Uma matriz diagonal cujos elementos diagonais são todos iguais é designada matriz escalar Um exemplo é a matriz de variânciacovariância de um termo de erro populacional do modelo clássico de regressão linear dado na Equação C23 ou seja matriz identidade ou unidade Uma matriz diagonal cujos elementos diagonais são todos 1 é chamada matriz identidade ou unidade e é denotada por I Esse é um tipo especial de matriz escalar matriz simétrica Uma matriz quadrada cujos elementos acima da diagonal principal são imagens espelhadas dos elementos que estão abaixo da diagonal principal é chamada de matriz simétrica Em outros termos uma matriz simétrica corresponde àquela cuja transposição é igual a si mesma ou seja A D A0 Ou então o elemento aij de A é igual ao elemento aji de A0 Um exemplo é a matriz de variânciacova riância dado na Equação C22 Outro é a matriz de correlação apresentada em C51 matriz nula Uma matriz cujos elementos são todos zero é chamada matriz nula e é denotada por 0 Vetor nulo Uma linha ou coluna cujos elementos são todos zero é designada vetor nulo e também é denota da por 0 Apêndice B Rudimentos de álgebra matricial 837 matrizes iguais Duas matrizes A e B denominamse iguais se são da mesma ordem e seus elementos correspon dentes são iguais isto é aij D bij para todos os i e j Por exemplo as matrizes são iguais ou seja A D B B3 Operações com matrizes soma de matrizes Sendo A D ai j e B D bi j Se A e B forem da mesma ordem definiremos a soma das matrizes como A C B D C em que C é da mesma ordem de A e B e são obtidas por meio de ci j D ai j C bi j para todos os i e j C é obtida pela adição dos elementos correspondentes de A e B Se essa adição pode ser efetuada po demos afirmar que A e B são conformes para adição Por exemplo se e C D A C B então subtração de matrizes A subtração de matrizes segue o mesmo princípio da adição exceto pelo fato de que C D A B ou seja subtraímos os elementos de B dos elementos correspondentes de A para obtermos C desde que A e B sejam da mesma ordem multiplicação escalar Para multiplicar uma matriz A por um escalar um número real multiplicamos cada elemento da matriz por Por exemplo se D 2 e então 838 Apêndice B Rudimentos de álgebra matricial multiplicação de matrizes Consideremos A como M N e B como N P O produto AB nesta ordem é definido como uma nova matriz C de ordem M P de modo que Isto é o elemento na iésima linha e na jésima coluna de C é obtido por meio da multiplicação dos elementos da iésima linha de A pelos elementos correspondentes da jésima coluna de B e por meio da adição de todos os termos tal procedimento é conhecido como regra da multiplicação linha por coluna Para obtermos c11 que corresponde ao elemento na primeira linha e a primeira coluna de C multiplicamos os elementos da primeira linha de A pelos elementos correspondentes na primeira coluna de B e somamos todos os termos De modo semelhante para obtermos c12 multiplicamos os elementos que estão na primeira linha de A pelos elementos correspondentes que estão na segunda coluna de B e somamos todos os termos e assim em diante Observe que para que a multiplicação exista as matrizes A e B devem conformarse em relação à multiplicação o número de colunas em A deve ser igual ao número de linhas em B Se por exemplo Mas se o produto de AB não é definido na medida em que A e B não são conformes à multiplicação propriedades da multiplicação de matrizes 1 A multiplicação de matrizes não é necessariamente comutativa em geral AB BA Portan to a ordem em que as matrizes são multiplicadas é muito importante AB significa que A é pósmultiplicada por B ou B é prémultiplicada por A 2 Ainda que AB e BA existam as matrizes resultantes podem não ser de mesma ordem As sim se A é M N e B é N M AB é M M enquanto BA é N N e por conseguinte de ordens diferentes 3 Ainda que A e B sejam matrizes quadradas de modo que AB e BA sejam ambas definidas as matrizes resultantes não serão necessariamente iguais Por exemplo se então e AB BA Um exemplo de AB D BA ocorre quando tanto A quanto B são matrizes identi dade Apêndice B Rudimentos de álgebra matricial 839 4 Um vetor linha pósmultiplicado por um vetor coluna é um escalar Desse modo considere mos os resíduos dos mínimos quadrados ordinários uO1 uO2 uOn Se u0 for um vetor coluna e u0 for um vetor linha teremos 5 Um vetor coluna pósmultiplicado por um vetor linha é uma matriz Como exemplo consi dere os termos de erro de população no modelo clássico de regressão linear ou seja u1 u2 un Se u for um vetor coluna e u0 um vetor linha obteremos que é uma matriz de ordem n n Observe que a matriz anterior é simétrica 6 Uma matriz pósmultiplicada por um vetor coluna é um vetor coluna 7 Um vetor linha pósmultiplicado por uma matriz é um vetor linha 8 A multiplicação de matrizes é associativa ABC D ABC em que A é M N B é N P e C é P K 9 A multiplicação de matrizes é distributiva em relação à adição AB C C D AB C AC e B C C A D BA C CA Transposição de matrizes Já definimos o processo de transposição de matrizes como o intercâmbio de linhas e colunas de uma matriz ou um vetor Vamos expor agora algumas das propriedades da transposição 1 A transposição de uma matriz transposta é a própria matriz original Assim A0 0 D A 2 Se A e B são conformes para a adição então C D A C B e C0 D A C B0 D A0 C B0 A transposição da soma de duas matrizes é a soma de suas transposições 3 Se AB é definida AB0 D B0 A0 A transposição do produto de duas matrizes é o produto de suas transposições na ordem inversa Isso pode ser generalizado ABCD0 D D0 C0 B0 A0 4 A transposição de uma matriz identidade I corresponde à própria matriz identidade I0 D I 5 A transposição de um escalar é o próprio escalar Assim se é um escalar 0 D 6 A transposição de A0 é A0 em que é um escalar Observe A0 D A00 D A0 D A0 840 Apêndice B Rudimentos de álgebra matricial 7 Se A é uma matriz quadrada de modo que A D A0 então A é uma matriz simétrica Veja a definição de matriz simétrica na Seção B2 inversão de matrizes A inversa de uma matriz quadrada A denotada por A1 lida como A inversa se existir é uma única matriz quadrada de modo que em que I é uma matriz identidade cuja ordem é a mesma de A Por exemplo Veremos como A1 é calculado depois de estudarmos o tópico dos determinantes Enquanto isso observe as seguintes propriedades da matriz inversa 1 AB1 D B1A1 ou seja a inversa do produto de duas matrizes é o produto de suas inversas na ordem inversa 2 A1 D A01 ou seja a transposição de A inversa é a inversa de A transposta B4 Determinantes Para cada matriz quadrada A corresponde um número escalar conhecido como o determinantes da matriz que é denotado por det A ou pelo símbolo A em que significa o determinante de Observe que a matriz por si não possui qualquer valor numérico mas o determinante de uma matriz é um número O A neste exemplo é chamado de determinante de ordem 3 por ser associado a uma matriz de ordem 3 3 avaliação de um determinante O processo de encontrar o valor de um determinante é conhecido como avaliação expansão ou redução do determinante Isso é feito ao manipular as entradas da matriz de uma forma bem defini da Avaliação de um determinante 2 2 Se seu determinante é avaliado como se segue que é obtido pela multiplicação cruzada dos elementos na diagonal principal e subtraindo desse produ to a multiplicação cruzada dos elementos na outra diagonal da matriz A como indicado pelas setas Apêndice B Rudimentos de álgebra matricial 841 Avaliação de um determinante 3 3 Se então Um exame cuidadoso da avaliação do determinante 3 3 demonstra que 1 Cada termo na expansão do determinante contém um e apenas um elemento de cada linha e de cada coluna 2 O número de elementos em cada termo é o mesmo do número de linhas ou colunas na matriz Portanto um determinante 2 2 possui dois elementos em cada termo de sua expan são um determinante 3 3 possui três elementos em cada termo de sua expansão e assim por diante 3 Os termos na expansão alternamse em sinal de C para 4 Um determinante 2 2 possui dois termos em sua expansão e um determinante 3 3 possui seis termos A regra geral é o determinante de ordem N N possui N D NN 1N 2 º 3 2 1 termos em sua expansão em que N lêse fatorial de N Seguindo essa regra um determinante de ordem 5 5 possuirá 5 4 3 2 1 D 120 termos em sua expansão1 propriedades dos determinantes 1 Uma matriz cujo valor do deteminante é zero é chamada de matriz singular enquanto uma matriz com um determinante não zero é chamada de matriz não singular O inverso de uma matriz como anteriormente definido não existe para uma matriz singular 2 Se todos os elementos de toda linha de A forem zero seu determinante será zero Assim 3 A0 D A isto é os determinantes de A e da transposta A são os mesmos 4 Intercambiando quaisquer das duas linhas ou das duas colunas de uma matriz A modificase o sinal de A ExEmplo 1 SE em que b é obtido intercambiando das linhas de a então 5 Se cada elemento de uma linha ou de uma coluna de A for multiplicado por um escalar então A é multiplicado por 1 Para avaliar o determinante de uma matriz N N A veja as referências 842 Apêndice B Rudimentos de álgebra matricial ExEmplo 2 SE e multiplicarmos a primeira linha de a por 5 para obter podemos verificar que A D 36 e B D 180 que é 5 A 6 Se duas linhas ou colunas de uma matriz forem idênticas seu determinante será zero 7 Se uma linha ou uma coluna de uma matriz for múltipla de outra linha ou coluna daquela matriz seu determinante será zero Assim se em que a primeira linha de A é duas vezes a segunda linha A D 0 De maneira geral se qualquer linha coluna de uma matriz for uma combinação linear de outras linhas colunas seu determinante será zero 8 AB D AB o determinante do produto de duas matrizes é o produto dos seus determinan tes individuais posto de uma matriz O posto de uma matriz é a ordem da maior submatriz quadrada cujo determinante não é zero ExEmplo 3 Podese verificar que A D 0 Em outras palavras A é uma matriz singular Embora sua ordem seja 3 3 seu posto é menor do que 3 Na verdade ele é 2 porque podemos encontrar uma submatriz 2 2 cujo determinante não é zero Por exemplo se excluímos a primeira linha e a primeira coluna de A obtemos cujo determinante é 6 que é não zero Portanto o posto de A é 2 Como anteriormente observado o inverso de uma matriz singular não existe Para uma matriz A de origem N x N seu posto tem de ser N para que a sua inversa exista se seu posto for menor do que N A será singular menor Se a iésima linha e a jésima coluna de uma matriz A de origem N N são excluídas o determi nante da submatriz resultante é chamado de o menor do elemento aij o elemento na interseção da iésima linha e a jésima coluna e é denotado por Mi j Apêndice B Rudimentos de álgebra matricial 843 ExEmplo 4 O menor de a11 é De forma semelhante o menor de a21 é Os menores de outros elementos de a podem ser encontrados de maneira parecida cofator O cofator do elemento aij de uma matriz A de origem N N denotado por cij é definido como Em outras palavras um cofator é um menor sinalizado com sinal positivo se i C j for par e ne gativo se i C j for ímpar Assim o cofator do elemento a11 da matriz A 3 x 3 anteriormente dada é a22a33 a23a32 enquanto o cofator do elemento a21 é a12a33 a13a32 uma vez que a soma dos subscritos 2 e 1 é 3 que é um número ímpar Matriz de cofator Substituindo os elementos ai j de uma matriz A pelos seus cofatores obtemos uma matriz conhe cida como matriz de cofator de A denotada por cof A Matriz adjunta A matriz adjunta escrita como adj A é a transposta da matriz de cofator adj A D cof A0 B5 Encontrando a inversa de uma matriz quadrada Se A é quadrada e não singular A 0 a sua inversa A1 pode ser encontrada da seguinte forma Os passos envolvidos no cálculo são os seguintes 1 Descubra o determinante de A Se não for zero execute o passo 2 2 Substitua cada elemento ai j de A por seu cofator para obter a matriz de cofator 3 Transponha a matriz de cofator para obter a matriz adjunta 4 Divida cada elemento da matriz adjunta por A 844 Apêndice B Rudimentos de álgebra matricial ExEmplo 5 Descubra a inverzsa da matriz passo 1 Primeiro descobrimos o determinante da matriz Aplicando as regras de expansão de um determinante 3 3 dado previamente obtemos a D 24 passo 2 Agora obtemos a matriz de cofator por exemplo C passo 3 Transpondo a matriz de cofator anterior obtemos a seguinte matriz adjunta passo 4 Agora dividimos os elementos de adj a pelo valor do determinante obtido 24 para obter Podemos facilmente verificar que que é uma matriz identidade O leitor deve verificar que para o exemplo ilustrativo dado no Apêndice C veja a Seção C10 a inversa da matriz x0x é semelhante à demonstrada na Equação C105 B6 Diferenciação matricial Para seguirmos o material no Apêndice CA Seção CA2 precisamos considerar algumas regras da diferenciação matricial Apêndice B Rudimentos de álgebra matricial 845 rEgra 1 Se a D a1 a2 an é um vetor linha de números e é um vetor coluna das variáveis x1 x2 xn então rEgra 2 Considere a matriz xax tal que Então que é um vetor coluna de n elementos ou que é um vetor linha de n elementos Referências CHIANG Alpha C Fundamental methods of mathematical economics 3 ed Nova York McGrawHill 1984 caps 4 e 5 A obra apresenta uma discussão avançada sobre álgebra linear HADLEY G Linear algebra Reading Mass AddisonWesley 1961 A obra apresenta uma discussão avançada 846 A abordagem matricial para o modelo de regressão linear Este apêndice apresenta o modelo clássico de regressão linear envolvendo k variáveis Y e X2 X3 Xk da notação de álgebra matricial Conceitualmente o modelo de k variáveis é uma exten são lógica dos modelos de duas e três variáveis considerados neste livro Portanto o apêndice apre senta poucos conceitos novos com exceção da notação em matrizes1 Uma grande vantagem da álgebra matricial sobre a álgebra escalar álgebra elementar que lida com escalas ou números reais é que ela fornece um método compacto para tratar dos modelos de regressão envolvendo qualquer número de variáveis uma vez que o modelo de k variáveis é formu lado e solucionado na notação em matrizes a solução aplicase a uma duas três ou a qualquer núme ro de variáveis C1 O modelo de regressão linear com k variáveis Se generalizarmos os modelos de regressão linear de duas e três variáveis o modelo da função de regressão populacional FRP de k variáveis envolvendo a variável dependente Y e k 1 variáveis explanatórias X2 X3 Xk poderá ser escrito como c11 em que Ø1 D intercepto Ø2 até Øk D coeficientes angulares parciais u D observação de iésima perturbação estocástica e n é o tamanho da população O modelo FRP C11 deve ser interpre tado da maneira habitual ele nos fornece a média ou o valor esperado de Y condicionado aos va lores fixos em amostras repetidas de X2 X3 Xk isto é EY X2i X3i Xki A Equação C11 é uma expressão abreviada para o seguinte conjunto de n equações simultâneas c12 1 leitores não familiarizados com a álgebra matricial devem rever o Apêndice B antes de seguirem adiante O Apêndice B fornece o essencial da álgebra matricial necessário para acompanhar este apêndice Apêndice C Apêndice C A abordagem matricial para o modelo de regressão linear 847 Escrevamos o sistema de equações C12 de um modo alternativo porém esclarecedor2 c13 em que y D vetor coluna n 1 de observações da variável dependente Y X D matriz n k dando n observações das k 1 variáveis de X2 a Xk a primeira coluna toda de 1 representando o termo de intercepto essa matriz é também conhecida como matriz dos dados b D vetor coluna k 1 de parâmetros desconhecidos β1 β2 βk u D vetor coluna n 1 de n termos de erro ui Ao utilizar as regras da multiplicação e da soma de matrizes o leitor deve verificar que os siste mas C12 e C13 são equivalentes O sistema C13 é conhecido como representação matricial de modelo geral de regressão linear com k variáveis Ele pode ser escrito de modo mais compacto como c14 em que não há confusão acerca das dimensões ou ordens da matriz X e dos vetores y b e u a Equação C14 pode ser escrita como c15 Para ilustrar a representação matricial considere o modelo de duas variáveis renda e consumo tratado no Capítulo 3 em que Y é a despesa com consumo e X é a renda Utilizando os dados fornecidos na Tabela 32 podemos escrever a formulação matricial como c16 Como nos casos de duas e três variáveis nosso objetivo é estimar os parâmetros da regressão múltipla C11 e extrair inferências sobre elas com base nos dados que temos em mãos Na notação matricial isso equivale a estimar b e extrair inferências sobre esse b Para o propósito da estimação 2 Seguindo a notação introduzida no Apêndice B representamos os vetores por letras minúsculas em negrito e as matrizes por letras maiúsculas em negrito 848 Apêndice C A abordagem matricial para o modelo de regressão linear podemos utilizar o método dos mínimos quadrados ordinários MQO ou o método da máxima ve rossimilhança MV Mas como observado anteriormente esses dois métodos resultam em estimati vas idênticas para os coeficientes de regressão3 Portanto deveremos limitar nossa atenção ao método dos MQO C2 Hipóteses do modelo de regressão linear clássico em notação matricial As hipóteses subjacentes ao modelo clássico de regressão linear estão na Tabela C1 elas são apresentadas tanto na notação escalar como na notação matricial A hipótese 1 dada na Equação C21 indica que o valor esperado do vetor de distúrbio u isto é de cada um de seus ele mentos é zero Mais explicitamente Eu 0 significa c21 A hipótese 2 Equação C22 é uma maneira compacta de expressar as duas hipóteses apresen tadas nas Equações 325 e 322 pela notação escalar Para verificarmos isso podemos escrever Notação escalar 1 E ui D 0 para cada i 321 2 Euiuj D 0 i j 325 D æ2 i D j 322 3 X2 X3 Xk são não estocásticas ou fixas 4 Não há relação linear exata entre as variáveis X não há 719 multicolinearidade 5 Para o teste de hipótese ui ª N0 æ2 424 Notação matricial 1 Eu D 0 em que u e 0 são n 1 vetores coluna sendo 0 um vetor nulo 2 Euu D æ2I em que I é uma matriz identidade n n 3 A matriz X n k é não estocástica consiste em um conjunto de números fixos 4 O posto de X é pX D k em que k é o número de colunas em X e k é menor do que o número de observações n 5 O vetor u possui uma distribuição normal multivariada ou seja u ª N0 æ2I em que u0 é a transposta do vetor coluna u ou um vetor linha Por meio da multiplicação obtemos 3 A prova disso no caso de k variáveis pode ser encontrada na nota de rodapé do Capítulo 4 TabEla c1 Hipótese do modelo clássico de regressão linear Apêndice C A abordagem matricial para o modelo de regressão linear 849 Aplicando o operador de expectativas E para cada elemento da matriz anterior obtemos c22 Devido às premissas de homocedasticidade e de nenhuma correlação serial a matriz C22 re duzse a c23 em que I é uma matriz identidade n n A matriz C22 e sua representação na Equação C23 é denominada matriz de variância e covariância dos distúrbios de ui os elementos na diagonal principal dessa matriz do canto superior esquerdo ao canto inferior direito fornecem as variâncias e os elementos fora da diagonal principal fornecem as covariâncias4 Observe que a matriz de variância e covariância é simétrica os elemen tos acima e abaixo da diagonal principal são reflexos uns dos outros A hipótese 3 na Tabela C1 estabelece que a matriz X n k é não estocástica consiste em núme ros fixos Como anteriormente observado nossa análise de regressão é condicional aos valores fixos das variáveis X A hipótese 4 estabelece que a matriz X possui posto pleno em colunas igual a k o número de colunas na matriz Isso significa que as colunas da matriz X são linearmente independentes não há relação linear exata entre as variáveis X Em outras palavras não há multicolinearidade Na notação escalar isso equivale a dizer que não existe um conjunto de números 1 2 k que não sejam todos zero de modo que conforme a Equação 718 c24 em que X1i D 1 para todo i considerando a coluna de 1 na matriz X Em notação matricial a Equação C24 pode ser representado como c25 em que l0 é um vetor linha 1 k e x é um vetor coluna k 1 Se uma relação linear exata tal como a Equação C24 existe dizse que as variáveis são colinea res Se por outro lado a Equação C24 é verdadeira apenas se 1 2 3 0 dizse que as variáveis X são linearmente independentes Uma razão intuitiva para a hipótese da não multicolinea ridade foi apresentada no Capítulo 7 e desenvolvida também no Capítulo 10 4 Por definição a variância de ui DE ui Eui 2 e a covariância entre ui e uj D E ui Eui uj Euj Porém devido à hipótese Eui D 0 para cada i temos a matriz de variância e covariância C23 850 Apêndice C A abordagem matricial para o modelo de regressão linear C3 Estimativa por mínimos quadrados ordinários MQO Para obtermos uma estimativa MQO de b vamos primeiro escrever a função de regressão amos tral de k variáveis c31 que pode ser escrita de forma mais compacta em notação matricial como c32 e em forma de matriz como c33 em que bO é um vetor coluna de k elementos dos estimadores MQO dos coeficientes de regressão e uO é um vetor coluna n 1 de n resíduos Como nos modelos de duas e três variáveis no caso de k variáveis os estimadores de MQO são obtidos ao minimizar c34 em que PuOi 2 é a soma dos quadrados dos resíduos SQR Na notação matricial isso corresponde a minimizar uO 0 uO na medida em que c35 Agora a partir da Equação C32 obtemos c36 Portanto c37 em que é feito uso das propriedades de transposição de uma matriz ou seja X bO 0 D bO 0X 0 e pelo fato de bO 0X 0y ser um escalar um número real é igual à sua transposta y 0X bO A Equação C37 é a representação matricial de C34 Na notação escalar o método dos MQO consiste em estimar seja o menor possível Isso é realizado ao diferenciarmos C34 parcialmente com relação à ØO1 ØO2 ØOk e ao igualarmos a zero as expressões resultantes Esse processo gera k equações simultâneas com k incógnitas as equações normais da teoria dos mínimos quadrados Conforme apresentado no Apêndice CA Seção CA1 essas equações são da seguinte maneira Apêndice C A abordagem matricial para o modelo de regressão linear 851 c385 Na forma matricial a Equação C38 pode ser representada como c39 ou de modo mais compacto como c310 Observe estas características da matriz X0 X 1 ela oferece as somas brutas e os produtos cru zados das variáveis X e uma delas é o termo de intercepto que assume o valor 1 para cada observa ção Os elementos da diagonal principal fornecem as somas brutas dos quadrados e os elementos que estão fora da diagonal principal oferecem as somas brutas dos produtos cruzados por brutas nos re ferimos às variáveis que estão nas unidades de medida originiais 2 ela é simétrica visto que o produto cruzado entre X2i e X3i é o mesmo que entre X3i e X2i 3 ela é da ordem k k ou seja possui k linhas e k colunas Na Equação C310 as quantidades conhecidas são X0 X e X0y o produto cruzado entre as variáveis X e y e a incógnita é bO Agora utilizando a álgebra matricial se a inversa de X0X existe por exemplo X0 X1 ao multiplicarmos ambos os lados da Equação C310 por essa inversa obtemos Entretanto X0 X1X0 X D I uma matriz identidade de ordem k k temos ou c311 5 Essas equações podem ser lembradas facilmente Comece com a equação Yi D ØO1 C ØO2X2i C ØO3X3i C C ØOkXki Ao somarmos essa equação sobre os n valores obtemos a primeira equação de C38 ao multiplicarmos os dois lados por X2 e ao somarmos sobre n obtemos a segunda equação ao multiplicarmos por X3 os dois lados e ao somarmos sobre n obtemos a terceira equação e assim por diante Observe que a primeira equação de C38 oferece imediatamente cf 746 852 Apêndice C A abordagem matricial para o modelo de regressão linear A Equação C311 é um resultado fundamental da teoria dos MQO na notação matricial Ela mostra como o vetor bO pode ser estimado com base nos dados fornecidos Embora a Equação C311 tenha sido obtida por meio da Equação C39 ela pode ser obtida diretamente pela Equa ção C37 por meio da diferenciação do uO0uO com relação a bO A demonstração é dada no Apêndice CA Seção CA2 uma ilustração Para ilustrarmos os métodos matriciais desenvolvidos até aqui vamos trabalhar com um exemplo que relaciona as variáveis consumo e renda utilizandonos dos dados da Equação C16 Para o caso de duas variáveis temos e Utilizando os dados da Equação C16 obtemos e Ao empregarmos as regras da inversão de matrizes apresentada no Apêndice B Seção B3 po demos ver que a inversa da matriz anterior X0 X é Portanto Utilizando um computador obtivemos ØO1 D 244545 e ØO2 D 05091 A diferença entre as duas estimativas devese a erros de arredondamento Observe que ao trabalharmos com uma calculadora é fundamental ao obtermos resultados com diversos dígitos significativos minimizar os erros de ar redondamento Apêndice C A abordagem matricial para o modelo de regressão linear 853 matriz de variâncias e covariâncias de b Os métodos matriciais nos permitem desenvolver fórmulas não apenas para a variância de ØOi qualquer elemento dado de bO mas também para a covariância entre qualquer um dos dois elementos de bO por exemplo ØOi e ØOj Precisamos dessas variâncias e covariâncias para o propósito de realizar mos inferências estatísticas Por definição a matriz de variânciacovariância de bO é compare à Equação C22 que pode ser escrita explicitamente como c312 No Apêndice CA Seção CA3 mostraremos que a matriz de variânciacovariância anterior pode ser obtida por meio da seguinte fórmula c313 em que æO 2 corresponde à variância homocedástica de ui e X0 X1 é a inversa da matriz que aparece na Equação C311 a qual dá bO que corresponde ao estimador de MQO Nos modelos de regressão linear de duas e três variáveis um estimador não viesado de æ 2 foi dado por respectivamente No caso de k variáveis a fórmu la correspondente é c314 em que há agora n k graus de liberdade Por quê Embora em princípio uO0uO possa ser calculado com base nos resíduos estimados na prática ele pode ser obtido diretamente como mostramos a seguir Lembrando que no caso de duas variáveis podemos escrever 336 e no caso de três variáveis 7419 Estendendo esse princípio é possível ver que para o modelo de k variáveis c315 Em notação matricial 854 Apêndice C A abordagem matricial para o modelo de regressão linear c316 c317 em que o termo é conhecido como a correção para a média6 Portanto c318 Uma vez que tenhamos obtido uO0uO æO 2 pode ser facilmente calculado pela Equação C314 a qual por sua vez permite estimar a matriz de variânciacovariância C313 Para nosso exemplo ilustrativo Portanto à æO 2 D 3372738 D 421591 que é aproximadamente o valor obtido no Capítulo 3 propriedades do vetor de mQo b Nos casos de duas ou três variáveis sabemos que os estimadores de MQO são lineares e não viesados e na classe de todos os estimadores lineares não viesados eles têm variância mínima a propriedade de GaussMarkov Em resumo os estimadores de MQO são os melhores estimadores lineares não viesados BLUE ou seja melhores estimadores lineares não viesados Essa propriedade estendese ao vetor bO ou seja bO é linear cada um dos seus elementos é uma função linear de Y a variável dependente EbO D bO ou seja o valor esperado de cada elemento de bO é igual ao elemento correspondente do verdadeiro b e na classe de todos os estimadores não viesados de b o estimador de MQO bO possui uma variância mínima A prova disso é apresentada no Apêndice CA Seção CA4 Conforme dissemos na Introdução o caso de k variáveis é na maioria dos casos uma extensão dire ta dos casos de duas e três variáveis C4 O coeficiente de determinação R2 em notação matricial O coeficiente de determinação de R2 foi definido como No caso de duas variáveis 356 e no caso de três variáveis 755 Generalizando obtemos no caso de k variáveis c41 6 Sendo assim sem o termo de correção yy dará apenas a soma bruta dos quadrados e não a soma dos quadrados dos desvios Apêndice C A abordagem matricial para o modelo de regressão linear 855 Utilizando as Equações C316 e C317 a Equação C41 pode ser escrita como c42 a qual dá a representação matricial de R2 Para o nosso exemplo ilustrativo e Ao inserirmos esses valores na Equação C42 vemos que R2 D 09224 que é quase o mesmo que obtivemos antes exceto em relação aos erros de arredondamento C5 A matriz de correlações Nos capítulos anteriores encontramos coeficientes de correlação de ordem zero ou simples r12 r13 r23 e coeficientes de correlação parcial ou de primeira ordem r123 r132 r231 e suas interrela ções No caso de k variáveis temos ao todo kk 12 coeficientes de correlação de ordem zero Por quê Essas kk 12 correlações podem ser colocadas em uma matriz designada matriz de cor relações como se segue c51 em que o subscrito 1 como anteriormente denota a variável dependente Y r12 significa coeficiente de correlação entre Y e X2 e assim por diante e utilizase do fato de que o coeficiente de correlação de uma variável que diz respeito a ela mesma é sempre 1 r11 r22 rkk 1 Com base na matriz de correlação R podese obter coeficientes de correlação de primeira ordem veja o Capítulo 7 e de ordem maior como r1234 k Veja o Exercício C4 Muitos programas de computador usualmente calculam a matriz R Utilizamos a matriz de correlações no Capítulo 10 C6 Teste de hipóteses sobre coeficientes de regressão individual em notação matricial Por motivos apresentados nos capítulos anteriores se o nosso objetivo é a inferência bem como a estimação devemos pressupor que os termos de erro ui seguem alguma distribuição de probabili dade Além disso por razões oferecidas anteriormente na análise de regressão pressupomos que em geral cada ui segue uma distribuição normal com média zero e variância æ 2 constante Em nota ção matricial temos 856 Apêndice C A abordagem matricial para o modelo de regressão linear c61 em que u e 0 são vetores coluna n 1 e I é uma matriz identidade n n sendo 0 o vetor nulo Dada a hipótese de normalidade sabemos que em modelos de regressão linear de duas e três variáveis 1 os estimadores de MQO ØOi e os estimadores de máxima verossimilhança Ø i são idênti cos mas o estimador de máxima verossimilhança æ 2 é viesado embora esse viés possa ser removido utilizando o estimador não viesado de MQO æO 2 e 2 os estimadores de MQO ØOi são também nor malmente distribuídos Generalizando no caso de k variáveis podemos mostrar que c62 ou seja cada elemento bO está normalmente distribuído com média igual ao elemento correspondente do verdadeiro b e a variância é dada por σ2 multiplicado pelo elemento diagonal apropriado da matriz inversa X0 X1 Visto que na prática æ 2 é desconhecido ele é estimado por æO 2 Portanto pela troca usual para a distribuição t seguese que cada elemento bO acompanha a distribuição t com n k gl Sim bolicamente ep c63 com n k gl em que ØOi é qualquer elemento de bO A distribuição t pode por conseguinte ser utilizada para testar hipóteses sobre o verdadeiro Øi bem como para estabelecer intervalos de confiança sobre isso A real mecânica já foi ilutrada nos Capítulos 5 e 8 Para um exemplo mais completo veja a Seção C10 C7 Teste da significância geral da regressão análise de variância em notação matricial No capítulo 8 desenvolvemos a técnica ANOVA 1 para testar a significância global da regressão estimada ou seja para testar a hipótese nula de que os verdadeiros coeficientes angulares parciais são simultaneamente iguais a zero e 2 para estimar a contribuição incremental de uma variável ex planatória A técnica ANOVA pode ser facilmente estendida ao caso de k variáveis Lembrese de que a técnica ANOVA consiste em decompor a soma total dos quadrados STQ em dois componentes a SQE e a SQR As expressões matriciais para essas três somas de quadrados já foram forneci das nas Equações C316 C317 e C318 Os graus de liberdade associados a essas somas de quadrados são n 1 k 1 e n k respectivamente Por quê Segundo a Tabela 81 do Ca pítulo 8 podemos elaborar a Tabela C2 gl TabEla c2 Formulação matricial da tabela ANOVA para o modelo de regressão linear com k variáveis Apêndice C A abordagem matricial para o modelo de regressão linear 857 Admitindo que os termos de erro ui estejam normalmente distribuídos e que a hipótese nula seja de acordo com o Capítulo 8 podemos mostrar que c71 segue a distribuição F com k 1 e n k graus de liberdade No Capítulo 8 vimos que sob as hipóteses declaradas anteriormente há uma estreita relação entre F e R2 ou seja 8411 Sendo assim a Tabela C2 de ANOVA pode ser expressa como a Tabela C3 Uma vantagem da Tabela C3 sobre a C2 é que toda a análise pode ser feita em termos de R2 não é necessário conside rar o termo y0 y nY 2 pois ele é excluído no quociente F gl C8 Teste de restrições lineares teste F geral por meio da notação matricial Na Seção 86 apresentamos o teste F geral para testar a validade das restrições lineares impostas a um ou mais parâmetros do modelo de regressão linear com k variáveis O teste apropriado foi for necido em 869 ou seu equivalente a Equação 8610 A contrapartida da matriz de 869 pode ser facilmente calculada Sejam uO R D vetor dos resíduos da regressão por mínimos quadrados restrita uO UR D vetor dos resíduos da regressão por mínimos quadrados irrestrita Então soma dos quadrados dos resíduos para a regressão restrita soma dos quadrados dos resíduos para a regressão irrestrita m D número de restrições lineares k D número de parâmetros incluindo o intercepto na regressão sem restrições n D número de observações A contrapartida da matriz da Equação 869 é por conseguinte c81 que segue a distribuição F com m n k graus de liberdade Como de costume se o valor F calcu lado da Equação C81 exceder o valor crítico de F podemos rejeitar a regressão restrita caso con trário não a rejeitamos TabEla c3 Tabela ANOVA com k variáveis em forma matricial em termos de R2 858 Apêndice C A abordagem matricial para o modelo de regressão linear C9 Previsão com o uso da regressão múltipla formulação matricial Na Seção 88 discutimos utilizando a notação escalar de que modo a regressão múltipla estimada pode ser empregada para prever 1 a média e 2 os valores individuais de Y dados os valores dos regressores X Nesta seção mostramos como expressar essas previsões na forma de matriz Apresen tamos também as fórmulas para estimar as variâncias e os erros padrão dos valores previstos no Capítulo 8 observamos que essas fórmulas são mais bem utilizadas na notação matricial e que para expressões escalares ou algébricas dessas fórmulas tornamse mais complicadas previsão da média Seja c91 o vetor de valores das variáveis X para as quais desejamos prever YO0 a previsão da média de Y Agora a regressão múltipla estimada na forma escalar é c92 que em notação matricial pode ser escrita de modo compacto como c93 em que e A Equação C92 ou C93 é certamente a previsão da média de Yi que corresponde a um dado x 0 i Se x 0 i é tal como na Equação C91 a Equação C93 tornase c94 em que é claro os valores de x0 estão especificados Observe que a Equação C94 e dá uma previsão não viesada de EYOi x 0 0 desde que Por quê Variância da previsão da média A fórmula para estimar a variância de YO0 x 0 0 é a seguinte7 c95 em que æ 2 é a variância de ui x 0 0 são os valores dados das variáveis X para as quais desejamos realizar a previsão e X0 X corresponde à matriz dada na Equação C39 Na prática substituímos æ 2 por seu estimador não viesado æ 2 7 Sobre a derivação veja JOhNSTON J Econometrics methods 3 ed Nova york McGrawhill 1984 p 195196 Apêndice C A abordagem matricial para o modelo de regressão linear 859 Ilustraremos a previsão da média e sua variância na próxima seção previsão individual Conforme indicamos nos Capítulos 5 e 8 a previsão individual de Y D Y0 é igualmente dada pela Equação C93 ou mais especificamente pela Equação C94 A diferença entre as previsões da média e a individual encontrase em suas variâncias Variância da previsão individual A fórmula para a variância de uma previsão individual é como segue8 c96 em que var Y0 x0 representa EY0 YO0 X2 Na prática substituímos æ 2 por seu estimador não viesado æO 2 Ilustraremos essa fórmula na próxima seção C10 Resumo da abordagem matricial um exemplo ilustrativo Considere os dados apresentados na Tabela C4 Esses correspondem a despesas pessoais de con sumo DCPC de renda pessoal disponível per capita RPDPC e tempo ou uma variável de tendên cia Incluindo uma variável de tendência no modelo estamos tentando descobrir a relação entre DCPC e a RPDPC descartada da variável de tendência a qual pode representar uma gama de outros fatores como a tecnologia as mudanças nos gostos etc Com propósitos empíricos o modelo de regressão é então c101 em que Y D despesas de consumo per capita X2 D renda disponível per capita X3 D tempo Os dados necessários para realizarmos a regressão C101 estão na Tabela C4 Em notação matricial nosso problema pode ser mostrado como a seguir c102 8 ibid 860 Apêndice C A abordagem matricial para o modelo de regressão linear Com base nos dados anteriores obtemos as seguintes quantidades c103 c104 Utilizando as regras de inversão de matrizes apresentada no Apêndice B é possível ver que c105 Sendo assim c106 A soma dos quadrados dos resíduos pode ser agora calculada como c107 TabEla c4 Despesas pessoais de consumo per capita DCPC e renda pessoal disponível per capita RPDPC nos Estados Unidos 19561970 em dólares de 1958 Fonte Economic Report of the President janeiro de 1972 Tabela B16 Apêndice C A abordagem matricial para o modelo de regressão linear 861 de onde obtemos c108 A matriz de variância e covariância para bO pode então ser mostrada como c109 Os elementos na diagonal dessa matriz fornecem as variâncias de ØO1 ØO2 e ØO3 respectivamente e suas raízes quadradas fornecem os erros padrão correspondentes Com base nos dados anteriores podemos verificar que c1010 c1011 Portanto c1012 Aplicando a Equação 784 podese ver que o coeficiente de determinação ajustado é c1013 Reunindo nossos resultados até aqui temos c1014 A interpretação da Equação C1014 é esta se tanto X2 e X3 estão fixados com valor zero o valor médio das despesas de consumo pessoal per capita está estimado em torno de 300 Como de costu me essa interpretação mecânica do intercepto deve ser vista com precaução O coeficiente de regres são parcial de 074198 significa que se forem mantidas constantes todas as outras variáveis um aumento de renda per capita de por exemplo um dólar será acompanhado por um aumento na média dos gastos com consumo pessoal per capita de aproximadamente 74 centavos Em resumo estimase que a propensão marginal de consumo seja de aproximadamente 074 ou 74 De modo semelhante ao mantermos constantes todas as outras variáveis a média do gasto com consumo pessoal per capi ta aumentou na taxa de aproximadamente 8 por ano durante o período do estudo ou seja entre 1956 e 1970 O valor R2 de 09976 mostra que as duas variáveis explanatórias são responsáveis por mais de 99 da variação dos gastos de consumo per capita nos Estados Unidos durante o período entre 1956 e 1970 Embora R 2 diminua levemente ele continua ainda bastante alto 862 Apêndice C A abordagem matricial para o modelo de regressão linear Em relação à significância estatística dos coeficientes estimados observamos a partir da Equação C1014 que cada um deles é significante em termos estatísticos e individuais por exemplo no nível 5 as razões entre os coeficientes estimados e seus erros padrão ou seja razões t são 383421 1561077 e 269598 respectivamente Utilizando um teste t bicaudal no nível de significância de 5 vemos que o valor t crítico para 12 graus de liberdade é 2179 Cada um dos valores t calculados ex cede esse valor crítico Sendo assim individualmente podemos rejeitar a hipótese nula de que o verdadeiro valor populacional do coeficiente relevante é zero Conforme observamos anteriormente não podemos aplicar o teste t usual para testar simultanea mente a hipótese de que Ø2 D Ø3 D 0 porque o procedimento do teste t pressupõe que extraímos uma amostra cada vez que o teste é aplicado Se a mesma amostra é utilizada para testar simultaneamente hipóteses sobre Ø2 e Ø3 provavelmente os estimadores ØO2 e ØO3 estão correlacionados violando assim a hipótese subjacente ao procedimento do teste t9 De fato ao observarmos a matriz de variância e covariância de bO da Equação C109 vemos que os estimadores ØO2 e ØO3 apresentam uma correlação negativa a covariância entre os dois é 013705 Sendo assim não podemos utilizar o teste t para testar a hipótese nula de que Ø2 D Ø3 D 0 Lembrese porém de que uma hipótese nula como Ø2 D Ø3 D 0 simultaneamente pode ser tes tada por meio da técnica de análise de variância e o teste F concomitante apresentados no Capítulo 8 Para o nosso problema a análise de variâncias corresponde àquela da Tabela C5 Sob as hipóteses usuais obtemos c1015 que é distribuída conforme a distribuição F com 2 e 12 graus de liberdade O valor calculado de F é obviamente altamente significativo podemos rejeitar a hipótese nula de que Ø2 D Ø3 D 0 ou seja de que os gastos com consumo pessoal per capita não estejam linearmente relacionados com a renda disponível per capita e a tendência Na Seção C9 discutimos os mecanismos da previsão tanto da previsão média quanto da individual Imagine que em 1971 o número da renda pessoal disponível RPD tenha sido de 2610 e que dese jemos prever o consumo pessoal per capita DCPC correspondente a esse número Então a previsão média bem como a individual do DCPC de 1971 é a mesma e é dada como c1016 em que fazemos uso da Equação C93 9 Veja a Seção 84 para mais detalhes gl TabEla c5 A Tabela ANOVA para os dados da Tabela C4 Apêndice C A abordagem matricial para o modelo de regressão linear 863 As variâncias de YO1971 e Y1971 como sabemos pela Seção C9 são diferentes e são as seguintes c1017 em que X0 X1 éstá apresentado na Equação C105 Substituindo essa equação na Equação C1017 o leitor verificará que c1018 e portanto ep Deixamos ao leitor a tarefa de verificar por meio da Equação C96 que c1019 e Na Seção C5 apresentamos a matriz de correlações R De acordo com nossos dados a matriz de correlação é a seguinte c1020 Observe que na Equação C1020 delimitamos a matriz de correlações com as variáveis do modelo para que possamos identificar prontamente quais variáveis estão envolvidas no cálculo do coeficiente de correlação Sendo assim o coeficiente 09980 na primeira linha da matriz C1020 informa que esse é o coeficiente de correlação entre Y e X2 ou seja r12 Das correlações de ordem zero apresen tadas na matriz de correlações C1020 podese facilmente derivar os coeficientes de correlação de primeira ordem Veja o Exercício C7 C11 Mínimos quadrados generalizados MQG Em diversas ocasiões mencionamos que os MQO são um caso especial de MQG Para observar esse dado retome a Equação C22 Para considerar as variâncias heterocedásticas os elementos na diagonal principal da Equação C22 e as autocorrelações nos termos de erro os elementos que estão fora da diagonal principal da Equação C22 suponha que c111 em que V é uma matriz conhecida de n n Sendo assim se nosso modelo é 864 Apêndice C A abordagem matricial para o modelo de regressão linear em que Eu D 0 e varcov u D æ 2V No caso de æ 2 ser desconhecido o que normalmente ocorre V então representa a pressuposta estrutura de variâncias e covariâncias entre os os termos de erro aleatórios ut Sob as condições determinadas dos termos de erro da variânciacovariância é possível de monstrar que mqg c112 bmqg é conhecido como o estimador de mínimos quadrados generalizados MQG de b Podese também mostrar que mqg c113 É possível mostrar que bmqg é o melhor estimador não viesado linear de b Se considerarmos que a variância de cada termo de erro é a própria constante æ 2 e os termos de erro não estão mutuamente correlacionados então a matriz V reduzse à matriz identidade conforme apresentado na Equação C23 Se os termos de erro não estão mutuamente correlacionados mas possuem variâncias diferentes heterocedásticas a matriz V será diagonal com variâncias desiguais com a diagonal principal É claro que se houver heterocedasticidade bem como autocorrelação a matriz V terá entradas na diagonal principal e fora da diagonal O verdadeiro problema na prática é que não conhecemos æ 2 e nem as verdadeiras variâncias e covariâncias a estrutura da matriz V Como solução podemos utilizar o método dos mínimos quadrados generalizados estimados ou factíveis MQGE Nesse caso estimamos primeiro nosso modelo por MQO desconsiderando os problemas de heterocedasticidade eou correlação Obtemos os resíduos com base nesse modelo e formamos a matriz de variânciacovariância estima da do termo de erro substituindo as entradas na expressão anterior à Equação C22 pelo u estimado ou seja uO é possível mostrar que os estimadores de MQGE são estimadores consistentes de MQG Simbolicamente mqge c114 mqge c115 em que OV é uma estimativa de V C12 Resumo e conclusões O principal propósito deste apêndice foi introduzir a abordagem matricial ao modelo clássico de regressão linear Embora muito poucos conceitos novos de análise de regressão tenham sido introdu zidos a notação matricial oferece um método compacto de lidarmos com os modelos de regressão linear que envolvam qualquer número de variáveis Para concluir o apêndice observe que se as variáveis Y e X são medidas na forma de desvios ou seja como desvios de suas médias amostrais há poucas mudanças nas fórmulas apresentadas ante riormente Essas mudanças estão indicadas na Tabela C610 Conforme mostra essa tabela na forma de desvio a correção para a média de nY 2 excluise da soma total dos quadrados STQ e da soma dos quadrados explicados SQE Por quê Essa perda resulta em uma mudança na fórmula para R2 Por outro lado a maioria das fórmulas desenvolvidas nas unidades originais de mensuração permanece válida para a forma de desvios 10 hoje em dia com computadores de alta velocidade talvez a forma de desvio não seja necessária mas ela simpli fica fórmulas e portanto os cálculos se estivermos trabalhando com uma calculadora e com números elevados Apêndice C A abordagem matricial para o modelo de regressão linear 865 ExErcícios C1 Para o exemplo ilustrativo discutido na Seção C10 X0 X e X0 y utilizando os dados na forma de desvio são como segue a Estime Ø2 e Ø3 b Como você estimaria Ø1 c Obtenha a variância de ØO2 e ØO3 e suas covariâncias d Calcule R2 e R 2 e Comparando seus resultados com os da Seção C10 quais na sua opinião são as vantagens da forma de desvios C2 Retome o Exercício 2223 Utilizando os dados nele apresentados prepare a matriz apropriada X0 X e o vetor X0 y e estime o vetor de parâmetro b bem como sua matriz de variância e co variância Obtenha também R2 De que modo você testaria a hipótese de que as elasticidades de M1 em relação ao PIB e à taxa de interesse R são numericamente iguais C3 Testando a igualdade de dois coeficientes de regressão Suponha que lhe seja apresentado o seguinte modelo de regressão e que você queira testar a hipótese de que β2 D β3 Se considerarmos que ui está normalmente distribuído é possível mostrar que segue a distribuição t com n 3 graus de liberdade veja a Seção 85 Em geral para os casos de k variáveis os graus de liberdade são n k Portanto o teste t anterior pode ser empregado para testar a hipótese nula de que Ø2 D Ø3 Observe que embora os símbolos das matrizes e dos vetores sejam os mesmos em ambos os casos na forma de desvios que os elementos das matrizes e dos vetores são considerados estes constituem desvios em vez de dados brutos Observe também que bO na forma de desvio é da ordem k 1 e que varcov bO é da ordem k 1k 1 TabEla c6 Modelo de regressão com k variáveis em unidades originais e na forma de desvio 866 Apêndice C A abordagem matricial para o modelo de regressão linear Aplique o teste t anterior para testar a hipótese de que os valores verdadeiros de Ø2 e Ø3 na re gressão C1014 são idênticos Dica utilize a matriz de variâncias e covariâncias de b dada da Equação C109 C4 Expressando correlações de ordem superior em termos de correlações de ordem inferior Coe ficientes de correlação de ordem p podem ser expressos em termos de coeficientes de correla ção de ordem p 1 por meio da seguinte fórmula de redução Assim conforme se verifica no Capítulo 7 Se você tiver a seguinte matriz de correlação Calcule o seguinte C5 Expressando coeficientes de regressão de ordem superior em termos de coeficientes de regres são de ordem inferior Um coeficiente de regressão de ordem p pode ser expresso em termos de um coeficiente de regressão de ordem p 1 por meio da seguinte fórmula de redução Assim em que Ø123 é o coeficiente angular na regressão de y sobre X2 mantendose X3 constante De modo semelhante Ø1234 é o coeficiente angular na regressão de Y sobre X2 mantendose X3 e X4 constantes e assim por diante Empregando a fórmula anterior encontre expressões para os seguintes coeficientes de regres são em termos de coeficientes de regressão de ordem inferior ØO123456 ØO12345 e ØO1234 C6 Estabeleça a seguinte identidade C7 Para a matriz de correlação R da Equação C1020 encontre todos os coeficientes de corre lação parcial de primeira ordem 866 Apêndice C A abordagem matricial para o modelo de regressão linear Apêndice C A abordagem matricial para o modelo de regressão linear 867 C8 Ao estudar a variação na taxa de criminalidade em algumas grandes cidades dos Estados Uni dos Ogburn obteve os seguintes dados em que Y D taxa de criminalidade número reportado de delitos conhecidos por mil habitantes X2 D porcentagem de habitantes do gênero masculino X3 D porcentagem de estrangeiros do gênero masculino no total de habitantes X4 D número de crianças com menos de 5 anos de idade por mil mulheres casadas com idade entre 15 e 44 anos X5 D membros de igrejas número de membros de igrejas com 13 anos de idade ou mais como percentual da população total com 13 anos de idade ou mais S1 a S5 são os desvios pa drão da amostra das variáveis Y até X5 e R é matriz de correlações a Considerando Y a variável dependente calcule a regressão de Y sobre as quatro variáveis X e interprete a regressão estimada b Calcule r1 23 r1 43 5 e r1 53 4 c Calcule R2 e teste a hipótese de que todos os coeficientes angulares parciais são simultanea mente iguais a zero C9 A tabela a seguir fornece dados sobre a produção e o custo total de produção de uma mercado ria a curto prazo Veja o Exemplo 74 Custo total Para testar se os dados anteriores indicam uma curva de custo médio na forma de U e uma curva de custo marginal semelhante à que encontramos normalmente a curto prazo é possível utilizar o seguinte modelo em que Y D custo total e X D produção As variáveis explanatórias adicionais X i 2 e X i 3 derivam de X a Expresse os dados na forma de desvio e calcule X0 X X0 y e X0 X1 b Estime Ø2 Ø3 e Ø4 c Estime a matriz de variância e covariância de bO Apêndice C A abordagem matricial para o modelo de regressão linear 867 OGBUrN w F Factors in the variation of crime among cities Journal of American Statistical Association 1935 v 30 p 12 868 Apêndice C A abordagem matricial para o modelo de regressão linear d Estime Ø1 Interprete ØO1 no contexto do problema e Calcule R2 e R 2 f A priori quais os sinais de Ø2 Ø3 e Ø4 Por quê g Com base na função de custo total dada anteriormente calcule as expressões para as fun ções de custo médio e marginal h Adapte as funções de custo médio e marginal aos dados e comente a adaptação realizada i Se Ø3 D Ø4 D 0 qual a natureza da função de custo marginal Como você testaria a hipótese de que Ø3 D Ø4 D 0 j Como você poderia derivar as funções de custo variável total e de custo variável médio dos dados fornecidos C10 Com o objetivo de estudar a participação da mão de obra das famílias pobres na zona urbana famílias com renda abaixo de 3943 em 1969 os dados da Tabela C7 foram obtidos do Censo Populacional de 1970 a Utilizando o modelo de regressão estime os coe ficientes da regressão e interprete seus resultados b A priori quais os sinais esperados dos coeficientes da regressão do modelo anterior e por quê c Como você testaria a hipótese de que a taxa global de desemprego não tem nenhum efeito sobre a participação da mão de obra pobre na zona urbana nos distritos censitários forneci dos pela tabela apresentada d Algumas variáveis do modelo anterior deveriam ser desconsideradas Por quê e Quais outras variáveis você consideraria para incluir no modelo Distrito Nº na mão de obra renda média familiar X2 Tamanho médio da família X3 Taxa de desemprego X4 137 643 1998 295 44 139 454 1114 340 34 141 266 1942 372 11 142 875 1998 443 31 143 713 2026 382 77 145 824 1853 390 50 147 263 1666 332 62 149 616 1434 380 54 151 529 1513 349 122 153 647 2008 385 48 155 649 1704 469 29 157 705 1525 389 48 159 872 1842 353 39 161 812 1735 496 72 163 679 1639 368 36 Y D chefes de família com menos de 65 anos de idade X2 D dólares X4 D percentual da mão de obra civil desempregada C11 Em uma aplicação da função de produção de CobbDouglas foram obtidos os seguintes resul tados TabEla c7 Participação da mão de obra pobre da zona urbana distritos censitários Nova York 1970 Fonte Census Tracts Nova York Bureau of the Census US Department of Com merce 1970 868 Apêndice C A abordagem matricial para o modelo de regressão linear Apêndice C A abordagem matricial para o modelo de regressão linear 869 em que Y D produção X2 D insumo da mão de obra e X3 D insumo de capital e os números entre parênteses são os erros padrão estimados a Conforme observamos no Capítulo 7 os coeficientes dos insumos da mão de obra e do capital na equação anterior fornecem as elasticidades da produção com relação à mão de obra e o capital Teste a hipótese de que essas elasticidades são individualmente iguais à unidade b Teste a hipótese de que as elasticidades da mão de obra e do capital são iguais admitindo i que a covariância entre os coeficientes estimados da mão de obra e do capital seja zero e ii que a covariância seja 00972 c Como você testaria a significância global da equação de regressão precedente C12 Expresse a função de verossimilhança para o modelo de regressão com k variáveis na notação matricial e mostre que b o vetor dos estimadores de máxima verossimilhança é idêntico a bO o vetor dos estimadores de MQO do modelo de regressão com k variáveis C13 Regressão por meio de variáveis padronizadas Considere as seguintes funções de regressão amostral FRA 1 2 em que em que os s denotam os desvios padrão Conforme observamos no Capítulo 6 Seção 63 as variáveis assinaladas são conhecidas como variáveis padronizadas Estas possuem média zero e desvio padrão unitário D 1 Expressando todas as variáveis na forma de desvios mostre o seguinte para o modelo 2 Apêndice C A abordagem matricial para o modelo de regressão linear 869 Opcional 870 Apêndice C A abordagem matricial para o modelo de regressão linear Estabeleça também a relação entre os b e os ØO Observe que nas relações anteriores n denota o tamanho da amostra r12 r13 e r23 denotam as correlações entre Y e X2 entre Y e X3 e entre X2 e X3 respectivamente C14 Verifique as Equações C1018 e C1019 C15 Mínimos quadrados restritos Suponha que 1 que desejamos estimar submetendo as igualdades a uma série de restrições ou limitações 2 em que R é uma matriz conhecida de ordem qxk q k e r é um vetor conhecido de q ele mentos Para ilustrar suponha que nosso modelo seja e suponha que desejemos estimar esse modelo submetido a estas restrições 5 Podemos utilizar algumas das técnicas discutidas no Capítulo 8 para incorporar essas restri ções por exemplo Ø2 D Ø3 e Ø4 D 1 Ø5 removendo assim Ø2 e Ø4 do modelo e testar a validade dessas restrições empregando o teste F discutido Mas uma maneira mais direta de estimar a Equação 3 incorporando as restrições 4 diretamente no procedimento de estima ção consiste em primeiro expressar as restrições na forma da Equação 2 que neste caso tornase 5 Com b denotando o estimador de mínimos quadrados restritos ou estimador dos mínimos quadrados sem restrições é possível mostrar que b pode ser estimado por meio da seguinte fórmula 6 em que bO é o estimador usual sem restrições estimado por meio da fórmula usual X0 X1 X0 y a Qual o vetor Ø na Equação 3 b Dado o vetor Ø verifique se a matriz R e o vetor r da Equação 5 realmente incorporam as restrições da Equação 4 c Especifique o R e r para os seguintes casos 870 Apêndice C A abordagem matricial para o modelo de regressão linear Opcional Veja Johnston J op cit p 205 Apêndice C A abordagem matricial para o modelo de regressão linear 871 i Ø2 D Ø3 D Ø4 D 2 ii Ø2 D Ø3 e Ø4 D Ø5 iii Ø2 3β3 D 5Ø4 iv Ø2 C 3Ø3 D 0 d Quando ocorrerá o caso bO D bO Apêndice CA ca1 Derivação de k equações normais ou simultâneas Ao diferenciarmos parcialmente em relação a ØO1 ØO2 ØOk obtemos Ao mantermos as derivadas parciais anteriores iguais a zero e ao reordenarmos os termos obtemos as k equa ções normais apresentadas na Equação C38 ca2 Derivação matricial de equações normais A partir da Equação C37 obtemos Usando as regras de diferenciação de matrizes apresentadas no Apêndice B Seção B6 obtemos Mantendo a equação anterior igual a zero obtemos em que bO D X0 X1 X0 y sob a condição de que a matriz inversa exista ca3 matriz de variâncias e covariâncias de Ob A partir da Equação C311 obtemos Apêndice C A abordagem matricial para o modelo de regressão linear 871 872 Apêndice C A abordagem matricial para o modelo de regressão linear Ao substituirmos y D Xb C u na expressão anterior temos 1 Portanto 2 Por definição 3 em que no último passo aproveitase o fato de que AB0 D B0A0 Observando que os X são não estocásticos tendo em perspectiva a Equação 3 obtemos que é o resultado fornecido na Equação C313 Observe que ao derivarmos o resultado anterior utilizamonos da hipótese de que Euu0 D æ2I ca4 propriedade de melhor estimador linear não viesado mElNT dos estimadores de mínimos quadrados ordinários mQo Por meio da Equação C311 temos Na medida em que X0 X1 X0 é uma matriz de números fixos bO é uma função linear de Y Sendo assim constitui um estimador linear por definição Lembrese de que a função de regressão populacional FRP é 2 Substituindoa na Equação 1 obtemos 3 4 na medida em que X0 X1 X0 X D I Adotando a expectativa da Equação 4 obtemos 5 872 Apêndice C A abordagem matricial para o modelo de regressão linear Apêndice C A abordagem matricial para o modelo de regressão linear 873 na medida em que Eb D b por quê e Eu D 0 por hipótese o que mostra que bO é um estimador não vie sado de b Sendo bO qualquer outro estimador linear de b o que pode ser escrito como 6 em que C é a matriz de constantes Ao substituirmos o y da Equação 2 na Equação 6 temos 7 Agora para que bO seja um estimador não viesado de b precisamos ter 8 Ao utilizarmos a Equação 8 a Equação 7 pode ser escrita do seguinte modo 9 Por definição a matriz de variâncias e covariâncias de bO é 10 Ao empregarmos as propriedades da inversão e da transposição de matrizes e após simplificações algébri cas obtemos 11 o que mostra que a matriz de variâncias e covariâncias do estimador linear não viesado bO é igual à matriz de variâncias e cova riâncias do estimador dos mínimos quadrados ordinários bO mais σ2 multiplicado por CC o qual é uma matriz positiva semidefinida Sendo assim as variâncias de determinado elemento de bO devem necessariamente ser iguais ou maiores do que o elemento correspondente bO que mostra que bO corresponde a um melhor estimador linear não viesado MELNT Certamente se C é uma matriz nula isto é C D 0 então bO D bO o que constitui uma outra forma de dizer que quando encontramos um melhor estimador linear não viesado ele deve ser o estimador de mínimos quadrados bO Apêndice C A abordagem matricial para o modelo de regressão linear 873 Veja as referências no Apêndice B 874 Tabelas estatísticas Tabela D1 Áreas sob a distribuição normal padronizada Tabela D2 Pontos percentuais da distribuição t Tabela D3 Pontos percentuais superiores da distribuição F Tabela D4 Pontos percentuais superiores da distribuição χ2 Tabela D5A Estatística d de DurbinWatson pontos de significância de dL e dU em níveis de significância de 005 Tabela D5B Estatística d de DurbinWatson pontos de significância de dL e dU em níveis de significância de 001 Tabela D6A e D6B Valores críticos de runs no teste dos funcionamentos Tabela D7 Valores críticos de t D ø de DickeyFuller a 1 e 5 e valores de F para testes de raiz unitária Apêndice D Apêndice D Tabelas estatísticas 875 Exemplo Pr0 Z 196 D 04750 PrZ 196 05 04750 0025 Z 000 001 002 003 004 005 006 007 008 009 00 00000 00040 00080 00120 00160 00199 00239 00279 00319 00359 01 00398 00438 00478 00517 00557 00596 00636 00675 00714 00753 02 00793 00832 00871 00910 00948 00987 01026 01064 01103 01141 03 01179 01217 01255 01293 01331 01368 01406 01443 01480 01517 04 01554 01591 01628 01664 01700 01736 01772 01808 01844 01879 05 01915 01950 01985 02019 02054 02088 02123 02157 02190 02224 06 02257 02291 02324 02357 02389 02422 02454 02486 02517 02549 07 02580 02611 02642 02673 02704 02734 02764 02794 02823 02852 08 02881 02910 02939 02967 02995 03023 03051 03078 03106 03133 09 03159 03186 03212 03238 03264 03289 03315 03340 03365 03389 10 03413 03438 03461 03485 03508 03531 03554 03577 03599 03621 11 03643 03665 03686 03708 03729 03749 03770 03790 03810 03830 12 03849 03869 03888 03907 03925 03944 03962 03980 03997 04015 13 04032 04049 04066 04082 04099 04115 04131 04147 04162 04177 14 04192 04207 04222 04236 04251 04265 04279 04292 04306 04319 15 04332 04345 04357 04370 04382 04394 04406 04418 04429 04441 16 04452 04463 04474 04484 04495 04505 04515 04525 04535 04545 17 04454 04564 04573 04582 04591 04599 04608 04616 04625 04633 18 04641 04649 04656 04664 04671 04678 04686 04693 04699 04706 19 04713 04719 04726 04732 04738 04744 04750 04756 04761 04767 20 04772 04778 04783 04788 04793 04798 04803 04808 04812 04817 21 04821 04826 04830 04834 04838 04842 04846 04850 04854 04857 22 04861 04864 04868 04871 04875 04878 04881 04884 04887 04890 23 04893 04896 04898 04901 04904 04906 04909 04911 04913 04916 24 04918 04920 04922 04925 04927 04929 04931 04932 04934 04936 25 04938 04940 04941 04943 04945 04946 04948 04949 04951 04952 26 04953 04955 04956 04957 04959 04960 04961 04962 04963 04964 27 04965 04966 04967 04968 04969 04970 04971 04972 04973 04974 28 04974 04975 04976 04977 04977 04978 04979 04979 04980 04981 29 04981 04982 04982 04983 04984 04984 04985 04985 04986 04986 30 04987 04987 04987 04988 04988 04989 04989 04989 04990 04990 Nota esta tabela dá a área na cauda direita da distribuição Z 0 Mas visto que a distribuição normal é simétrica ao redor de Z D 0 a área na cauda esquerda é igual à área na cauda direita correspondente Por exemplo P196 Z 0 D 04750 Portanto P196 Z 196 204750 095 TabEla D1 Áreas sob a distribuição normal padronizada 0 196 04750 Z 876 Apêndice D Tabelas estatísticas Exemplo Prt 2086 D 0025 Prt 1725 D 005 para gl D 20 Prt 1725 D 010 pr gl 025 050 010 020 005 010 0025 005 001 002 0005 0010 0001 0002 1 1000 3078 6314 12706 31821 63657 31831 2 0816 1886 2920 4303 6965 9925 22327 3 0765 1638 2353 3182 4541 5841 10214 4 0741 1533 2132 2776 3747 4604 7173 5 0727 1476 2015 2571 3365 4032 5893 6 0718 1440 1943 2447 3143 3707 5208 7 0711 1415 1895 2365 2998 3499 4785 8 0706 1397 1860 2306 2896 3355 4501 9 0703 1383 1833 2262 2821 3250 4297 10 0700 1372 1812 2228 2764 3169 4144 11 0697 1363 1796 2201 2718 3106 4025 12 0695 1356 1782 2179 2681 3055 3930 13 0694 1350 1771 2160 2650 3012 3852 14 0692 1345 1761 2145 2624 2977 3787 15 0691 1341 1753 2131 2602 2947 3733 16 0690 1337 1746 2120 2583 2921 3686 17 0689 1333 1740 2110 2567 2898 3646 18 0688 1330 1734 2101 2552 2878 3610 19 0688 1328 1729 2093 2539 2861 3579 20 0687 1325 1725 2086 2528 2845 3552 21 0686 1323 1721 2080 2518 2831 3527 22 0686 1321 1717 2074 2508 2819 3505 23 0685 1319 1714 2069 2500 2807 3485 24 0685 1318 1711 2064 2492 2797 3467 25 0684 1316 1708 2060 2485 2787 3450 26 0684 1315 1706 2056 2479 2779 3435 27 0684 1314 1703 2052 2473 2771 3421 28 0683 1313 1701 2048 2467 2763 3408 29 0683 1311 1699 2045 2462 2756 3396 30 0683 1310 1697 2042 2457 2750 3385 40 0681 1303 1684 2021 2423 2704 3307 60 0679 1296 1671 2000 2390 2660 3232 120 0677 1289 1658 1980 2358 2617 3160 0674 1282 1645 1960 2326 2576 3090 Fonte PEARSON E S HARTLEY H O Eds Biometríka tables for statisticians 3 ed Nova York Cambridge University Press 1966 v 1 tabela 12 Reprodução autorizada pelos editores e curadores da Biometríka Nota a menor probabilidade mostrada no título de cada coluna é a área em uma cauda a probabilidade maior é a área em ambas as caudas TabEla D2 Pontos percentuais da distribuição t 0 1725 005 t Apêndice D Tabelas estatísticas 877 Exemplo PrF 159 D 025 PrF 242 D 010 para gl N1 D 10 PrF 314 D 005 e N2 D 9 PrF 526 D 001 gl para denomi nador N2 gl para numerador N1 Pr 1 2 3 4 5 6 7 8 9 10 11 12 1 025 583 750 820 858 882 898 910 919 926 932 936 941 010 399 495 536 558 572 582 589 594 599 602 605 607 005 161 200 216 225 230 234 237 239 241 242 243 244 025 257 300 315 323 328 331 334 335 337 338 339 339 2 010 853 900 916 924 929 933 935 937 938 939 940 941 005 185 190 192 192 193 193 194 194 194 194 194 194 001 985 990 992 992 993 993 994 994 994 994 994 994 025 202 228 236 239 241 242 243 244 244 244 245 245 3 010 554 546 539 534 531 528 527 525 524 523 522 522 005 101 955 928 912 901 894 889 885 881 879 876 874 001 341 308 295 287 282 279 277 275 273 272 271 271 025 181 200 205 206 207 208 208 208 208 208 208 208 4 010 454 432 419 411 405 401 398 395 394 392 391 390 005 771 694 659 639 626 616 609 604 600 596 594 591 001 212 180 167 160 155 152 150 148 147 145 144 144 025 169 185 188 189 189 189 189 189 189 189 189 189 5 010 406 378 362 352 345 340 337 334 332 330 328 327 005 661 579 541 519 505 495 488 482 477 474 471 468 001 163 133 121 114 110 107 105 103 102 101 996 989 025 162 176 178 179 179 178 178 178 177 177 177 177 6 010 378 346 329 318 311 305 301 298 296 294 292 290 005 599 514 476 453 439 428 421 415 410 406 403 400 001 137 109 978 915 875 847 826 810 798 787 779 772 025 157 170 172 172 171 171 170 170 169 169 169 168 7 010 359 326 307 296 288 283 278 275 272 270 268 267 005 559 474 435 412 397 387 379 373 368 364 360 357 001 122 955 845 785 746 719 699 684 672 662 654 647 025 154 166 167 166 166 165 164 164 163 163 163 162 8 010 346 311 292 281 273 267 262 259 256 254 252 250 005 532 446 407 384 369 358 350 344 339 335 331 328 001 113 865 759 701 663 637 618 603 591 581 573 567 025 151 162 163 163 162 161 160 160 159 159 158 158 9 010 336 301 281 269 261 255 251 247 244 242 240 238 005 512 426 386 363 348 337 329 323 318 314 310 307 001 106 802 699 642 606 580 561 547 535 526 518 511 Fonte PEARSON E S HARTLEY H O Eds Biometríka tables for statisticians 3 ed Nova York Cambridge University Press 1966 v 1 tabela 12 Reprodução autorizada pelos editores e curadores da Biometríka TabEla D3 Pontos porcentuais superiores da distribuição F Área de 5 Área de 1 314 526 F 0 Continua 878 Apêndice D Tabelas estatísticas gl para numerador N1 gl para denomi nador N2 15 20 24 30 40 50 60 100 120 200 500 pr 949 958 963 967 971 974 976 978 980 982 984 985 25 1 612 617 620 623 625 627 628 630 631 632 633 633 010 246 248 249 250 251 252 252 253 253 254 254 254 005 341 343 343 344 345 345 346 347 347 348 348 348 025 2 942 944 945 946 947 947 947 948 948 949 949 949 010 194 194 195 195 195 195 195 195 195 195 195 195 005 994 994 995 995 995 995 995 995 995 995 995 995 001 246 246 246 247 247 247 247 247 247 247 247 247 025 3 520 518 518 517 516 515 515 514 514 514 514 513 010 870 866 864 862 859 858 857 855 855 854 853 853 005 269 267 266 265 264 264 263 262 262 262 261 261 001 208 208 208 208 208 208 208 208 208 208 208 208 025 4 387 384 383 382 380 380 379 378 378 377 376 376 010 586 580 577 575 572 570 569 566 566 565 564 563 005 142 140 139 138 137 137 137 136 136 135 135 135 001 189 188 188 188 188 188 187 187 187 187 187 187 025 5 324 321 319 317 316 315 314 313 312 312 311 310 010 462 456 453 450 446 444 443 441 440 439 437 436 005 972 955 947 938 929 924 920 913 911 908 904 902 001 176 176 175 175 175 175 174 174 174 174 174 174 025 6 287 284 282 280 278 277 276 275 274 273 273 272 010 394 387 384 381 377 375 374 371 370 369 368 367 005 756 740 731 723 714 709 706 699 697 693 690 688 001 168 167 167 166 166 166 165 165 165 165 165 165 025 7 263 259 258 256 254 252 251 250 249 248 248 247 010 351 344 341 338 334 332 330 327 327 325 324 323 005 631 616 607 599 591 586 582 575 574 570 567 565 001 162 161 160 160 159 159 159 158 158 158 158 158 025 8 246 242 240 238 236 235 234 232 232 231 230 229 010 322 315 312 308 304 202 301 297 297 295 294 293 005 552 536 528 520 512 507 503 496 495 491 488 486 001 157 156 156 155 155 154 154 153 153 153 153 153 025 9 234 230 228 225 223 222 221 219 218 217 217 216 010 301 294 290 286 283 280 279 276 275 273 272 271 005 496 481 473 465 457 452 448 442 440 436 433 431 001 Continua TabEla D3 Continuação Apêndice D Tabelas estatísticas 879 TabEla D3 Continuação gl para denomi nador N2 gl para numerador N1 Pr 1 2 3 4 5 6 7 8 9 10 11 12 10 025 149 160 160 159 159 158 157 156 156 155 155 154 010 329 292 273 261 252 246 241 238 235 232 230 228 005 496 410 371 348 333 322 314 307 302 298 294 291 001 100 756 655 599 564 539 520 506 494 485 477 471 025 147 158 158 157 156 155 154 153 153 152 152 151 11 010 323 286 266 254 245 239 234 230 227 225 223 221 005 484 398 359 336 320 309 301 295 290 285 282 279 001 965 721 622 567 532 507 489 474 463 454 446 440 025 146 156 156 155 154 153 152 151 151 150 150 149 12 010 318 281 261 248 239 233 228 224 221 219 217 215 005 475 389 349 326 311 300 291 285 280 275 272 269 001 933 693 595 541 506 482 464 450 439 430 422 416 025 145 155 155 153 152 151 150 149 149 148 147 147 13 010 314 276 256 243 235 228 223 220 216 214 212 210 005 467 381 341 318 303 292 283 277 271 267 263 260 001 907 670 574 521 486 462 444 430 419 410 402 396 025 144 153 153 152 151 150 149 148 147 146 146 145 14 010 310 273 252 239 231 224 219 215 212 210 208 205 005 460 374 334 311 296 285 276 270 265 260 257 253 001 886 651 556 504 469 446 428 414 403 394 386 380 025 143 152 152 151 149 148 147 146 146 145 144 144 15 010 307 270 249 236 227 221 216 212 209 206 204 202 005 454 368 329 306 290 279 271 264 259 254 251 248 001 868 636 542 489 456 432 414 400 389 380 373 367 025 142 151 151 150 148 147 146 145 144 144 144 143 16 010 305 267 246 233 224 218 213 209 206 203 201 199 005 449 363 324 301 285 274 266 259 254 249 246 242 001 853 623 529 477 444 420 403 389 378 369 362 355 025 142 151 150 149 147 146 145 144 143 143 142 141 17 010 303 264 244 231 222 215 210 206 203 200 198 196 005 445 359 320 296 281 270 261 255 249 245 241 238 001 840 611 518 467 434 410 393 379 368 359 352 346 025 141 150 149 148 146 145 144 143 142 142 141 140 18 010 301 262 242 229 220 213 208 204 200 198 196 193 005 441 355 316 293 277 266 258 251 246 241 237 234 001 829 601 509 458 425 401 384 371 360 351 343 337 025 141 149 149 147 146 144 143 142 141 141 140 140 19 010 299 261 240 227 218 211 206 202 198 196 194 191 005 438 352 313 290 274 263 254 248 242 238 234 231 001 818 593 501 450 417 394 377 363 352 343 336 330 025 140 149 148 146 145 144 143 142 141 140 139 139 20 010 297 259 238 225 216 209 204 200 196 194 192 189 005 435 349 310 287 271 260 251 245 239 235 231 228 001 810 585 494 443 410 387 370 356 346 337 329 323 Continua 880 Apêndice D Tabelas estatísticas gl para numerador N1 gl para denomi nador N2 15 20 24 30 40 50 60 100 120 200 500 pr 153 152 152 151 151 150 150 149 149 149 148 148 025 10 224 220 218 216 213 212 211 209 208 207 206 206 010 285 277 274 270 266 264 262 259 258 256 255 254 005 456 441 433 425 417 412 408 401 400 396 393 391 001 150 149 149 148 147 147 147 146 146 146 145 145 025 11 217 212 210 208 205 204 203 200 200 199 198 197 010 272 265 261 257 253 251 249 246 245 243 242 240 005 425 410 402 394 386 381 378 371 369 366 362 360 001 148 147 146 145 145 144 144 143 143 143 142 142 025 12 210 206 204 201 199 197 196 194 193 192 191 190 010 262 254 251 247 243 240 238 235 234 232 231 230 005 401 386 378 370 362 357 354 347 345 341 338 336 001 146 145 144 143 142 142 142 141 141 140 140 140 025 13 205 201 198 196 193 192 190 188 188 186 185 185 010 253 246 242 238 234 231 230 226 225 223 222 221 005 382 366 359 351 343 338 334 327 325 322 319 317 001 144 143 142 141 141 140 140 139 139 139 138 138 025 14 201 196 194 191 189 187 186 183 183 182 180 180 010 246 239 235 231 227 224 222 219 218 216 214 213 005 366 351 343 335 327 322 318 311 309 306 303 300 001 143 141 141 140 139 139 138 138 137 137 136 136 025 15 197 192 190 187 185 183 182 179 179 177 176 176 010 240 233 229 225 220 218 216 212 211 210 208 207 005 352 337 329 321 313 308 305 298 296 292 289 287 001 141 140 139 138 137 137 136 136 135 135 134 134 025 16 194 189 187 184 181 179 178 176 175 174 173 172 010 235 228 224 219 215 212 211 207 206 204 202 201 005 341 326 318 310 302 297 293 286 284 281 278 275 001 140 139 138 137 136 135 135 134 134 134 133 133 025 17 191 186 184 181 178 176 175 173 172 171 169 169 010 231 223 219 215 210 208 206 202 201 199 197 196 005 331 316 308 300 292 287 283 276 275 271 268 265 001 139 138 137 136 135 134 134 133 133 132 132 132 025 18 189 184 181 178 175 174 172 170 169 168 167 166 010 227 219 215 211 206 204 202 198 197 195 193 192 005 323 308 300 292 284 278 275 268 266 262 259 257 001 138 137 136 135 134 133 133 132 132 131 131 130 025 19 186 181 179 176 173 171 170 167 167 165 164 163 010 223 216 211 207 203 200 198 194 193 191 189 188 005 315 300 292 284 276 271 267 260 258 255 251 249 001 137 136 135 134 133 133 132 131 131 130 130 129 025 20 184 179 177 174 171 169 168 165 164 163 162 161 010 220 212 208 204 199 197 195 191 190 188 186 184 005 309 294 286 278 269 264 261 254 252 248 244 242 001 Continua TabEla D3 Continuação Apêndice D Tabelas estatísticas 881 TabEla D3 Continuação gl para denomi nador N2 gl para numerador N1 Pr 1 2 3 4 5 6 7 8 9 10 11 12 22 025 140 148 147 145 144 142 141 140 139 139 138 137 010 295 256 235 222 213 206 201 197 193 190 188 186 005 430 344 305 282 266 255 246 240 234 230 226 223 001 795 572 482 431 399 376 359 345 335 326 318 312 24 025 139 147 146 144 143 141 140 139 138 138 137 136 010 293 254 233 219 210 204 198 194 191 188 185 183 005 426 340 301 278 262 251 242 236 230 225 221 218 001 782 561 472 422 390 367 350 336 326 317 309 303 025 138 146 145 144 142 141 139 138 137 137 136 135 26 010 291 252 231 217 208 201 196 192 188 186 184 181 005 423 337 298 274 259 247 239 232 227 222 218 215 001 772 553 464 414 382 359 342 329 318 309 302 296 025 138 146 145 143 141 140 139 138 137 136 135 134 28 010 289 250 229 216 206 200 194 190 187 184 181 179 005 420 334 295 271 256 245 236 229 224 219 215 212 001 764 545 457 407 375 353 336 323 312 303 296 290 025 138 145 144 142 141 139 138 137 136 135 135 134 30 010 288 249 228 214 205 198 193 188 185 182 179 177 005 417 332 292 269 253 242 233 227 221 216 213 209 001 756 539 451 402 370 347 330 317 307 298 291 284 025 136 144 142 140 139 137 136 135 134 133 132 131 40 010 284 244 223 209 200 193 187 183 179 176 173 171 005 408 323 284 261 245 234 225 218 212 208 204 200 001 731 518 431 383 351 329 312 299 289 280 273 266 025 135 142 141 138 137 135 133 132 131 130 129 129 60 010 279 239 218 204 195 187 182 177 174 171 168 166 005 400 315 276 253 237 225 217 210 204 199 195 192 001 708 498 413 365 334 312 295 282 272 263 256 250 025 134 140 139 137 135 133 131 130 129 128 127 126 120 010 275 235 213 199 190 182 177 172 168 165 162 160 005 392 307 268 245 229 217 209 202 196 191 187 183 001 685 479 395 348 317 296 279 266 256 247 240 234 025 133 139 138 136 134 132 131 129 128 127 126 125 200 010 273 233 211 197 188 180 175 170 166 163 160 157 005 389 304 265 242 226 214 206 198 193 188 184 180 001 676 471 388 341 311 289 273 260 250 241 234 227 025 132 139 137 135 133 131 129 128 127 125 124 124 010 271 230 208 194 185 177 172 167 163 160 157 155 005 384 300 260 237 221 210 201 194 188 183 179 175 001 663 461 378 332 302 280 264 251 241 232 225 218 Continua 882 Apêndice D Tabelas estatísticas gl para numerador N1 gl para denomi nador N2 15 20 24 30 40 50 60 100 120 200 500 pr 136 134 133 132 131 131 130 130 130 129 129 128 025 22 181 176 173 170 167 165 164 161 160 159 158 157 010 215 207 203 198 194 191 189 185 184 182 180 178 005 298 283 275 267 258 253 250 242 240 236 233 231 001 135 133 132 131 130 129 129 128 128 127 127 126 025 24 178 173 170 167 164 162 161 158 157 156 154 153 010 211 203 198 194 189 186 184 180 179 177 175 173 005 289 274 266 258 249 244 240 233 231 227 224 221 001 134 132 131 130 129 128 128 126 126 126 125 125 025 26 176 171 168 165 161 159 158 155 154 153 151 150 010 207 199 195 190 185 182 180 176 175 173 171 169 005 281 266 258 250 242 236 233 225 223 219 216 213 001 133 131 130 129 128 127 127 126 125 125 124 124 025 28 174 169 166 163 159 157 156 153 152 150 149 148 010 204 196 191 187 182 179 177 173 171 169 167 165 005 275 260 252 244 235 230 226 219 217 213 209 206 001 132 130 129 128 127 126 126 125 124 124 123 123 025 30 172 167 164 161 157 155 154 151 150 148 147 146 010 201 193 189 184 179 176 174 170 168 166 164 162 005 270 255 247 239 230 225 221 213 211 207 203 201 001 130 128 126 125 124 123 122 121 121 120 119 119 025 40 166 161 157 154 151 148 147 143 142 141 139 138 010 192 184 179 174 169 166 164 159 158 155 153 151 005 252 237 229 220 211 206 202 194 192 187 183 180 001 127 125 124 122 121 120 119 117 117 116 115 115 025 60 160 154 151 148 144 141 140 136 135 133 131 129 010 184 175 170 165 159 156 153 148 147 144 141 139 005 235 220 212 203 194 188 184 175 173 168 163 160 001 124 122 121 119 118 117 116 114 113 112 111 110 025 120 155 148 145 141 137 134 132 127 126 124 121 119 010 175 166 161 155 150 146 143 137 135 132 128 125 005 219 203 195 186 176 170 166 156 153 148 142 138 001 123 121 120 118 116 114 112 111 110 109 108 106 025 200 152 146 142 138 134 131 128 124 122 120 117 114 010 172 162 157 152 146 141 139 132 129 126 122 119 005 213 197 189 179 169 163 158 148 144 139 133 128 001 122 119 118 116 114 113 112 109 108 107 104 100 025 149 142 138 134 130 126 124 118 117 113 108 100 010 167 157 152 146 139 135 132 124 122 117 111 100 005 204 188 179 170 159 152 147 136 132 125 115 100 001 TabEla D3 Continuação Apêndice D Tabelas estatísticas 883 Exemplo Pr2 1085 D 095 Prc2 2383 D 025 para gl 20 Pr2 3141 D 005 pr graus de liberdade 0995 0990 0975 0950 0900 1 392704 1010 157088 109 982069 109 393214 108 00157908 2 00100251 00201007 00506356 0102587 0210720 3 00717212 0114832 0215795 0351846 0584375 4 0206990 0 297110 0484419 0710721 1063623 5 0411740 0554300 0831211 1145476 161031 6 0675727 0872085 1237347 163539 220413 7 0989265 1239043 168987 216735 283311 8 1344419 1646482 217973 273264 348954 9 1734926 2087912 270039 332511 416816 10 215585 255821 324697 394030 486518 11 260321 305347 381575 457481 557779 12 307382 357056 440379 522603 630380 13 356503 410691 500874 589186 704150 14 407468 466043 562872 657063 778953 15 460094 522935 626214 726094 854675 16 514224 581221 690766 796164 931223 17 569724 640776 756418 867176 100852 18 626481 701491 823075 939046 108649 19 684398 763273 890655 101170 116509 20 743386 826040 959083 108508 124426 21 803366 889720 1028293 115913 132396 22 864272 954249 109823 123380 140415 23 926042 1019567 116885 130905 148479 24 988623 108564 124011 138484 156587 25 105197 115240 131197 146114 164734 26 111603 121981 138439 153791 172919 27 118076 128786 145733 161513 181138 28 124613 135648 153079 169279 189392 29 131211 142565 160471 177083 197677 30 137867 149535 167908 184926 205992 40 207065 221643 244331 265093 290505 50 279907 297067 323574 347642 376886 60 355346 374848 404817 431879 464589 70 432752 454418 487576 517393 553290 80 511720 535400 571532 603915 642778 90 591963 617541 656466 691260 732912 100 673276 700648 742219 779295 823581 Para gl maior que 100 a expressão D Z 22 2k1 segue a distribuição normal padronizada em que k representa os graus de liberdade TabEla D4 Pontos percentuais superiores da distribuição 2 Área de 5 Área de 25 3141 1085 0 2383 Área de 95 2 Continua 884 Apêndice D Tabelas estatísticas 0750 0500 0250 0100 0050 0025 0010 0005 01015308 0454937 132330 270554 384146 502389 663490 787944 0575364 138629 277259 460517 599147 737776 921034 105966 1212534 236597 410835 625139 781473 934840 113449 128381 192255 335670 538527 777944 948773 111433 132767 148602 267460 435146 662568 923635 110705 128325 150863 167496 345460 534812 784080 106446 125916 144494 168119 185476 425485 634581 903715 120170 140671 160128 184753 202777 507064 734412 102188 133616 155073 175346 200902 219550 589883 834283 113887 146837 169190 190228 216660 235893 673720 934182 125489 159871 183070 204831 232093 251882 758412 103410 137007 172750 196751 219200 247250 267569 843842 113403 148454 185494 210261 233367 262170 282995 929906 123398 159839 198119 223621 247356 276883 298194 101653 133393 171170 210642 236848 261190 291413 313193 110365 143389 182451 223072 249958 274884 305779 328013 119122 153385 193688 235418 262962 288454 319999 342672 127919 163381 204887 247690 275871 301910 334087 357185 136753 173379 216049 259894 288693 315264 348053 371564 145620 183376 227178 272036 301435 328523 361908 385822 154518 193374 238277 284120 314104 341696 375662 399968 163444 203372 249348 296151 326705 354789 389321 414010 172396 213370 260393 308133 339244 367807 402894 427956 181373 223369 271413 320069 351725 380757 416384 441813 190372 233367 282412 331963 364151 393641 429798 455585 199393 243366 293389 343816 376525 406465 443141 469278 208434 253364 304345 355631 388852 419232 456417 482899 217494 263363 315284 367412 401133 431944 469630 496449 226572 273363 326205 379159 413372 444607 482782 509933 235666 283362 337109 390875 425569 457222 495879 523356 244776 293360 347998 402560 437729 469792 508922 536720 336603 393354 456160 518050 557585 593417 636907 667659 429421 493349 563336 631671 675048 714202 761539 794900 522938 593347 669814 743970 790819 832976 883794 919517 616983 693344 775766 855271 905312 950231 100425 104215 711445 793343 881303 965782 101879 106629 112329 116321 806247 893342 986499 107565 113145 118136 124116 128299 901332 993341 109141 118498 124342 129561 135807 140169 Fonte resumida de PEARSON E S HARTLEY H O Eds Biometríka tables for statisticians 3 ed Nova York Cambridge University Press 1966 v 1 tabela 12 Reprodução autorizada pelos editores e curadores da Biometríka TabEla D4 Continuação Apêndice D Tabelas estatísticas 885 TabEla D5a Estatística d de DurbinWatson pontos de significância de dL e dU em níveis de significância de 005 k 0 D 1 k 0 D 2 k 0 D 3 k0 D 4 k 0 D 5 k 0 D 6 k D 7 k 0 D 8 k 0 D 9 k0 D 10 n dL dU dL dU dL dU dL dU dL dU dL dU dL dU dL dU dL dU dL dU 6 0610 1400 7 0700 1356 0467 1896 8 0763 1332 0559 1777 0368 2287 9 0824 1320 0629 1699 0455 2128 0296 2588 10 0879 1320 0697 1641 0525 2016 0376 2414 0243 2822 11 0927 1324 0658 1604 0595 1928 0444 2283 0316 2645 0203 3005 12 0971 1331 0812 1579 0658 1864 0512 2177 0379 2506 0268 2832 0171 3149 13 1010 1340 0861 1562 0715 1816 0574 2094 0445 2390 0328 2692 0230 2985 0147 3266 14 1045 1350 0905 1551 0767 1779 0632 2030 0505 2296 0389 2572 0286 2848 0200 3111 0127 3360 15 1077 1361 0946 1543 0814 1750 0685 1977 0562 2220 0447 2472 0343 2727 0251 2979 0175 3216 0111 3438 16 1106 1371 0982 1539 0857 1728 0734 1935 0615 2157 0502 2388 0398 2624 0304 2860 0222 3090 0155 3304 17 1133 1381 1015 1536 0897 1710 0779 1900 0664 2104 0554 2318 0451 2537 0356 2757 0272 2975 0198 3184 18 1158 1391 1046 1535 0933 1696 0820 1872 0710 2060 0603 2257 0502 2461 0407 2667 0321 2873 0244 3073 19 1180 1401 1074 1536 0967 1685 0859 1848 0752 2023 0649 2206 0549 2396 0456 2589 0369 2783 0290 2974 20 1201 1411 1100 1537 0998 1676 0894 1828 0792 1991 0692 2162 0595 2339 0502 2521 0416 2704 0336 2885 21 1221 1420 1125 1538 1026 1669 0927 1812 0829 1964 0732 2124 0637 2290 0547 2460 0461 2633 0380 2806 22 1239 1429 1147 1541 1053 1664 0958 1797 0863 1940 0769 2090 0677 2246 0588 2407 0504 2571 0424 2734 23 1257 1437 1168 1543 1078 1660 0986 1785 0895 1920 0804 2061 0715 2208 0628 2360 0545 2514 0465 2670 24 1273 1446 1188 1546 1101 1656 1013 1775 0925 1902 0837 2035 0751 2174 0666 2318 0584 2464 0506 2613 25 1288 1454 1206 1550 1123 1654 1038 1767 0953 1886 0868 2012 0784 2144 0702 2280 0621 2419 0544 2560 26 1302 1461 1224 1553 1143 1652 1062 1759 0979 1873 0897 1992 0816 2117 0735 2246 0657 2379 0581 2513 27 1316 1469 1240 1556 1162 1651 1084 1753 1004 1861 0925 1974 0845 2093 0767 2216 0691 2342 0616 2470 28 1328 1476 1255 1560 1181 1650 1104 1747 1028 1850 0951 1958 0874 2071 0798 2188 0723 2309 0650 2431 29 1341 1483 1270 1563 1198 1650 1124 1743 1050 1841 0975 1944 0900 2052 0826 2164 0753 2278 0682 2396 30 1352 1489 1284 1567 1214 1650 1143 1739 1071 1833 0998 1931 0926 2034 0854 2141 0782 2251 0712 2363 31 1363 1496 1297 1570 1229 1650 1160 1735 1090 1825 1020 1920 0950 2018 0879 2120 0810 2226 0741 2333 32 1373 1502 1309 1574 1244 1650 1177 1732 1109 1819 1041 1909 0972 2004 0904 2102 0836 2203 0769 2306 33 1383 1508 1321 1577 1258 1651 1193 1730 1127 1813 1061 1900 0994 1991 0927 2085 0861 2181 0795 2281 34 1393 1514 1333 1580 1271 1652 1208 1728 1144 1808 1080 1891 1015 1979 0950 2069 0885 2162 0821 2257 35 1402 1519 1343 1584 1283 1653 1222 1726 1160 1803 1097 1884 1034 1967 0971 2054 0908 2144 0845 2236 36 1411 1525 1354 1587 1295 1654 1236 1724 1175 1799 1114 1877 1053 1957 0991 2041 0930 2127 0868 2216 37 1419 1530 1364 1590 1307 1655 1249 1723 1190 1795 1131 1870 1071 1948 1011 2029 0951 2112 0891 2198 38 1427 1535 1373 1594 1318 1656 1261 1722 1204 1792 1146 1864 1088 1939 1029 2017 0970 2098 0912 2180 39 1435 1540 1382 1597 1328 1658 1273 1722 1218 1789 1161 1859 1104 1932 1047 2007 0990 2085 0932 2164 40 1442 1544 1391 1600 1338 1659 1285 1721 1230 1786 1175 1854 1120 1924 1064 1997 1008 2072 0952 2149 45 1475 1566 1430 1615 1383 1666 1336 1720 1287 1776 1238 1835 1189 1895 1139 1958 1089 2022 1038 2088 50 1503 1585 1462 1628 1421 1674 1378 1721 1335 1771 1291 1822 1246 1875 1201 1930 1156 1986 1110 2044 55 1528 1601 1490 1641 1452 1681 1414 1724 1374 1768 1334 1814 1294 1861 1253 1909 1212 1959 1170 2010 60 1549 1616 1514 1652 1480 1689 1444 1727 1408 1767 1372 1808 1335 1850 1298 1894 1260 1939 1222 1984 65 1567 1629 1536 1662 1503 1696 1471 1731 1438 1767 1404 1805 1370 1843 1336 1882 1301 1923 1266 1964 70 1583 1641 1554 1672 1525 1703 1494 1735 1464 1768 1433 1802 1401 1837 1369 1873 1337 1910 1305 1948 75 1598 1652 1571 1680 1543 1709 1515 1739 1487 1770 1458 1801 1428 1834 1399 1867 1369 1901 1339 1935 80 1611 1662 1586 1688 1560 1715 1534 1743 1507 1772 1480 1801 1453 1831 1425 1861 1397 1893 1369 1925 85 1624 1671 1600 1696 1575 1721 1550 1747 1525 1774 1500 1801 1474 1829 1448 1857 1422 1886 1396 1916 90 1635 1679 1612 1703 1589 1726 1566 1751 1542 1776 1518 1801 1494 1827 1469 1854 1445 1881 1420 1909 95 1645 1687 1623 1709 1602 1732 1579 1755 1557 1778 1535 1802 1512 1827 1489 1852 1465 1877 1442 1903 100 1654 1694 1634 1715 1613 1736 1592 1758 1571 1780 1550 1803 1528 1826 1506 1850 1484 1874 1462 1898 150 1720 1746 1706 1760 1693 1774 1679 1788 1665 1802 1651 1817 1637 1832 1622 1847 1608 1862 1594 1877 200 1758 1778 1748 1789 1738 1799 1728 1810 1718 1820 1707 1831 1697 1841 1686 1852 1675 1863 1665 1874 Continua 886 Apêndice D Tabelas estatísticas k 0 D 11 k 0 D 12 k 0 D 13 k 0 D 14 k 0 D 15 k 0 D 16 k D 17 k 0 D 18 k 0 D 19 k 0 D 20 n dL dU dL dU dL dU dL dU dL dU dL dU dL dU dL dU dL dU dL dU 16 0098 3503 17 0138 3378 0087 3557 18 0177 3265 0123 3441 0078 3603 19 0220 3159 0160 3335 0111 3496 0070 3642 20 0263 3063 0200 3234 0145 3395 0100 3542 0063 3676 21 0307 2976 0240 3141 0182 3300 0132 3448 0091 3583 0058 3705 22 0349 2897 0281 3057 0220 3211 0166 3358 0120 3495 0083 3619 0052 3731 23 0391 2826 0322 2979 0259 3128 0202 3272 0153 3409 0110 3535 0076 3650 0048 3753 24 0431 2761 0362 2908 0297 3053 0239 3193 0186 3327 0141 3454 0101 3572 0070 3678 0044 3773 25 0470 2702 0400 2844 0335 2983 0275 3119 0221 3251 0172 3376 0130 3494 0094 3604 0065 3702 0041 3790 26 0508 2649 0438 2784 0373 2919 0312 3051 0256 3179 0205 3303 0160 3420 0120 3531 0087 3632 0060 3724 27 0544 2600 0475 2730 0409 2859 0348 2987 0291 3112 0238 3233 0191 3349 0149 3460 0112 3563 0081 3658 28 0578 2555 0510 2680 0445 2805 0383 2928 0325 3050 0271 3168 0222 3283 0178 3392 0138 3495 0104 3592 29 0612 2515 0544 2634 0479 2755 0418 2874 0359 2992 0305 3107 0254 3219 0208 3327 0166 3431 0129 3528 30 0643 2477 0577 2592 0512 2708 0451 2823 0392 2937 0337 3050 0286 3160 0238 3266 0195 3368 0156 3465 31 0674 2443 0608 2553 0545 2665 0484 2776 0425 2887 0370 2996 0317 3103 0269 3208 0224 3309 0183 3406 32 0703 2411 0638 2517 0576 2625 0515 2733 0457 2840 0401 2946 0349 3050 0299 3153 0253 3252 0211 3348 33 0731 2382 0668 2484 0606 2588 0546 2692 0488 2796 0432 2899 0379 3000 0329 3100 0283 3198 0239 3293 34 0758 2355 0695 2454 0634 2554 0575 2654 0518 2754 0462 2854 0409 2954 0359 3051 0312 3147 0267 3240 35 0783 2330 0722 2425 0662 2521 0604 2619 0547 2716 0492 2813 0439 2910 0388 3005 0340 3099 0295 3190 36 0808 2306 0748 2398 0689 2492 0631 2586 0575 2680 0520 2774 0467 2868 0417 2961 0369 3053 0323 3142 37 0831 2285 0772 2374 0714 2464 0657 2555 0602 2646 0548 2738 0495 2829 0445 2920 0397 3009 0351 3097 38 0854 2265 0796 2351 0739 2438 0683 2526 0628 2614 0575 2703 0522 2792 0472 2880 0424 2968 0378 3054 39 0875 2246 0819 2329 0763 2413 0707 2499 0653 2585 0600 2671 0549 2757 0499 2843 0451 2929 0404 3013 40 0896 2228 0840 2309 0785 2391 0731 2473 0678 2557 0626 2641 0575 2724 0525 2808 0477 2892 0430 2974 45 0988 2156 0938 2225 0887 2296 0838 2367 0788 2439 0740 2512 0692 2586 0644 2659 0598 2733 0553 2807 50 1064 2103 1019 2163 0973 2225 0927 2287 0882 2350 0836 2414 0792 2479 0747 2544 0703 2610 0660 2675 55 1129 2062 1087 2116 1045 2170 1003 2225 0961 2281 0919 2338 0877 2396 0836 2454 0795 2512 0754 2571 60 1184 2031 1145 2079 1106 2127 1068 2177 1029 2227 0990 2278 0951 2330 0913 2382 0874 2434 0836 2487 65 1231 2006 1195 2049 1160 2093 1124 2138 1088 2183 1052 2229 1016 2276 0980 2323 0944 2371 0908 2419 70 1272 1986 1239 2026 1206 2066 1172 2106 1139 2148 1105 2189 1072 2232 1038 2275 1005 2318 0971 2362 75 1308 1970 1277 2006 1247 2043 1215 2080 1184 2118 1153 2156 1121 2195 1090 2235 1058 2275 1027 2315 80 1340 1957 1311 1991 1283 2024 1253 2059 1224 2093 1195 2129 1165 2165 1136 2201 1106 2238 1076 2275 85 1369 1946 1342 1977 1315 2009 1287 2040 1260 2073 1232 2105 1205 2139 1177 2172 1149 2206 1121 2241 90 1395 1937 1369 1966 1344 1995 1318 2025 1292 2055 1266 2085 1240 2116 1213 2148 1187 2179 1160 2211 95 1418 1929 1394 1956 1370 1984 1345 2012 1321 2040 1296 2068 1271 2097 1247 2126 1222 2156 1197 2186 100 1439 1923 1416 1948 1393 1974 1371 2000 1347 2026 1324 2053 1301 2080 1277 2108 1253 2135 1229 2164 150 1579 1892 1564 1908 1550 1924 1535 1940 1519 1956 1504 1972 1489 1989 1474 2006 1458 2023 1443 2040 200 1654 1885 1643 1896 1632 1908 1621 1919 1610 1931 1599 1943 1588 1955 1576 1967 1565 1979 1554 1991 Nota n D número de observações k D número de variáveis explanatórias excluindo o termo constante Fonte Esta tabela é uma extensão da tabela original de DurbinWatson reproduzida de SAVIN N E WHITE K J The DurbinWatson test for serial correlation with extreme small samples or many regressors Econometrica v 45 p 19891996 nov 1977 Ela foi corrigida por FAREBROTHER R W Econometrica v 48 p 1554 set 1980 Reprodução autorizada pela Econometric Society ExEmplo 1 Se n D 40 e k D 4 dL D 1285 e dU D 1721 Se um valor calculado de d é menor que 1285 há evidência de correlação serial positiva de primeira ordem se é maior que 1721 não há nenhuma evidência de correlação serial positiva de primeira ordem mas se d está entre o limite inferior e o limite superior a evidência é inconclusiva em relação à presença ou ausência de correlação serial positiva de primeira ordem TabEla D5a Estatística d de DurbinWatson pontos de significância de dL e dU em níveis de significância de 005 Continuação Apêndice D Tabelas estatísticas 887 TabEla D5b Estatística d de DurbinWatson pontos de significância de dL e dU em níveis de significância de 001 k 0 D 1 k 0 D 2 k0 D 3 k0 D 4 k0 D 5 k0 D 6 k D 7 k0 D 8 k0 D 9 k0 D 10 n dL dU dL dU dL dU dL dU dL dU dL dU dL dU dL dU dL dU dL dU 6 0390 1142 7 0435 1036 0294 1676 8 0497 1003 0345 1489 0229 2102 9 0554 0998 0408 1389 0279 1875 0183 2433 10 0604 1001 0466 1333 0340 1733 0230 2193 0150 2690 11 0653 1010 0519 1297 0396 1640 0286 2030 0193 2453 0124 2892 12 0697 1023 0569 1274 0449 1575 0339 1913 0244 2280 0164 2665 0105 3053 13 0738 1038 0616 1261 0499 1526 0391 1826 0294 2150 0211 2490 0140 2838 0090 3182 14 0776 1054 0660 1254 0547 1490 0441 1757 0343 2049 0257 2354 0183 2667 0122 2981 0078 3287 15 0811 1070 0700 1252 0591 1464 0488 1704 0391 1967 0303 2244 0226 2530 0161 2817 0107 3101 0068 3374 16 0844 1086 0737 1252 0633 1446 0532 1663 0437 1900 0349 2153 0269 2416 0200 2681 0142 2944 0094 3201 17 0874 1102 0772 1255 0672 1432 0574 1630 0480 1847 0393 2078 0313 2319 0241 2566 0179 2811 0127 3053 18 0902 1118 0805 1259 0708 1422 0613 1604 0522 1803 0435 2015 0355 2238 0282 2467 0216 2697 0160 2925 19 0928 1132 0835 1265 0742 1415 0650 1584 0561 1767 0476 1963 0396 2169 0322 2381 0255 2597 0196 2813 20 0952 1147 0863 1271 0773 1411 0685 1567 0598 1737 0515 1918 0436 2110 0362 2308 0294 2510 0232 2714 21 0975 1161 0890 1277 0803 1408 0718 1554 0633 1712 0552 1881 0474 2059 0400 2244 0331 2434 0268 2625 22 0997 1174 0914 1284 0831 1407 0748 1543 0667 1691 0587 1849 0510 2015 0437 2188 0368 2367 0304 2548 23 1018 1187 0938 1291 0858 1407 0777 1534 0698 1673 0620 1821 0545 1977 0473 2140 0404 2308 0340 2479 24 1037 1199 0960 1298 0882 1407 0805 1528 0728 1658 0652 1797 0578 1944 0507 2097 0439 2255 0375 2417 25 1055 1211 0981 1305 0906 1409 0831 1523 0756 1645 0682 1776 0610 1915 0540 2059 0473 2209 0409 2362 26 1072 1222 1001 1312 0928 1411 0855 1518 0783 1635 0711 1759 0640 1889 0572 2026 0505 2168 0441 2313 27 1089 1233 1019 1319 0949 1413 0878 1515 0808 1626 0738 1743 0669 1867 0602 1997 0536 2131 0473 2269 28 1104 1244 1037 1325 0969 1415 0900 1513 0832 1618 0764 1729 0696 1847 0630 1970 0566 2098 0504 2229 29 1119 1254 1054 1332 0988 1418 0921 1512 0855 1611 0788 1718 0723 1830 0658 1947 0595 2068 0533 2193 30 1133 1263 1070 1339 1006 1421 0941 1511 0877 1606 0812 1707 0748 1814 0684 1925 0622 2041 0562 2160 31 1147 1273 1085 1345 1023 1425 0960 1510 0897 1601 0834 1698 0772 1800 0710 1906 0649 2017 0589 2131 32 1160 1282 1100 1352 1040 1428 0979 1510 0917 1597 0856 1690 0794 1788 0734 1889 0674 1995 0615 2104 33 1172 1291 1114 1358 1055 1432 0996 1510 0936 1594 0876 1683 0816 1776 0757 1874 0698 1975 0641 2080 34 1184 1299 1128 1364 1070 1435 1012 1511 0954 1591 0896 1677 0837 1766 0779 1860 0722 1957 0665 2057 35 1195 1307 1140 1370 1085 1439 1028 1512 0971 1589 0914 1671 0857 1757 0800 1847 0744 1940 0689 2037 36 1206 1315 1153 1376 1098 1442 1043 1513 0988 1588 0932 1666 0877 1749 0821 1836 0766 1925 0711 2018 37 1217 1323 1165 1382 1112 1446 1058 1514 1004 1586 0950 1662 0895 1742 0841 1825 0787 1911 0733 2001 38 1227 1330 1176 1388 1124 1449 1072 1515 1019 1585 0966 1658 0913 1735 0860 1816 0807 1899 0754 1985 39 1237 1337 1187 1393 1137 1453 1085 1517 1034 1584 0982 1655 0930 1729 0878 1807 0826 1887 0774 1970 40 1246 1344 1198 1398 1148 1457 1098 1518 1048 1584 0997 1652 0946 1724 0895 1799 0844 1876 0749 1956 45 1288 1376 1245 1423 1201 1474 1156 1528 1111 1584 1065 1643 1019 1704 0974 1768 0927 1834 0881 1902 50 1324 1403 1285 1446 1245 1491 1205 1538 1164 1587 1123 1639 1081 1692 1039 1748 0997 1805 0955 1864 55 1356 1427 1320 1466 1284 1506 1247 1548 1209 1592 1172 1638 1134 1685 1095 1734 1057 1785 1018 1837 60 1383 1449 1350 1484 1317 1520 1283 1558 1249 1598 1214 1639 1179 1682 1144 1726 1108 1771 1072 1817 65 1407 1468 1377 1500 1346 1534 1315 1568 1283 1604 1251 1642 1218 1680 1186 1720 1153 1761 1120 1802 70 1429 1485 1400 1515 1372 1546 1343 1578 1313 1611 1283 1645 1253 1680 1223 1716 1192 1754 1162 1792 75 1448 1501 1422 1529 1395 1557 1368 1587 1340 1617 1313 1649 1284 1682 1256 1714 1227 1748 1199 1783 80 1466 1515 1441 1541 1416 1568 1390 1595 1364 1624 1338 1653 1312 1683 1285 1714 1259 1745 1232 1777 85 1482 1528 1458 1553 1435 1578 1411 1603 1386 1630 1362 1657 1337 1685 1312 1714 1287 1743 1262 1773 90 1496 1540 1474 1563 1452 1587 1429 1611 1406 1636 1383 1661 1360 1687 1336 1714 1312 1741 1288 1769 95 1510 1552 1489 1573 1468 1596 1446 1618 1425 1642 1403 1666 1381 1690 1358 1715 1336 1741 1313 1767 100 1522 1562 1503 1583 1482 1604 1462 1625 1441 1647 1421 1670 1400 1693 1378 1717 1357 1741 1335 1765 150 1611 1637 1598 1651 1584 1665 1571 1679 1557 1693 1543 1708 1530 1722 1515 1737 1501 1752 1486 1767 200 1664 1684 1653 1693 1643 1704 1633 1715 1623 1725 1613 1735 1603 1746 1592 1757 1582 1768 1571 1779 Continua 888 Apêndice D Tabelas estatísticas k 0 D 11 k 0 D 12 k0 D 13 k0 D 14 k0 D 15 k0 D 16 k D 17 k0 D 18 k0 D 19 k0 D 20 n dL dU dL dU dL dU dL dU dL dU dL dU dL dU dL dU dL dU dL dU 16 0060 3446 17 0084 3286 0053 3506 18 0113 3146 0075 3358 0047 3357 19 0145 3023 0102 3227 0067 3420 0043 3601 20 0178 2914 0131 3109 0092 3297 0061 3474 0038 3639 21 0212 2817 0162 3004 0119 3185 0084 3358 0055 3521 0035 3671 22 0246 2729 0194 2909 0148 3084 0109 3252 0077 3412 0050 3562 0032 3700 23 0281 2651 0227 2822 0178 2991 0136 3155 0100 3311 0070 3459 0046 3597 0029 3725 24 0315 2580 0260 2744 0209 2906 0165 3065 0125 3218 0092 3363 0065 3501 0043 3629 0027 3747 25 0348 2517 0292 2674 0240 2829 0194 2982 0152 3131 0116 3274 0085 3410 0060 3538 0039 3657 0025 3766 26 0381 2460 0324 2610 0272 2758 0224 2906 0180 3050 0141 3191 0107 3325 0079 3452 0055 3572 0036 3682 27 0413 2409 0356 2552 0303 2694 0253 2836 0208 2976 0167 3113 0131 3245 0100 3371 0073 3490 0051 3602 28 0444 2363 0387 2499 0333 2635 0283 2772 0237 2907 0194 3040 0156 3169 0122 3294 0093 3412 0068 3524 29 0474 2321 0417 2451 0363 2582 0313 2713 0266 2843 0222 2972 0182 3098 0146 3220 0114 3338 0087 3450 30 0503 2283 0447 2407 0393 2533 0342 2659 0294 2785 0249 2909 0208 3032 0171 3152 0137 3267 0107 3379 31 0531 2248 0475 2367 0422 2487 0371 2609 0322 2730 0277 2851 0234 2970 0196 3087 0160 3201 0128 3311 32 0558 2216 0503 2330 0450 2446 0399 2563 0350 2680 0304 2797 0261 2912 0221 3026 0184 3137 0151 3246 33 0585 2187 0530 2296 0477 2408 0426 2520 0377 2633 0331 2746 0287 2858 0246 2969 0209 3078 0174 3184 34 0610 2160 0556 2266 0503 2373 0452 2481 0404 2590 0357 2699 0313 2808 0272 2915 0233 3022 0197 3126 35 0634 2136 0581 2237 0529 2340 0478 2444 0430 2550 0383 2655 0339 2761 0297 2865 0257 2969 0221 3071 36 0658 2113 0605 2210 0554 2310 0504 2410 0455 2512 0409 2614 0364 2717 0322 2818 0282 2919 0244 3019 37 0680 2092 0628 2186 0578 2282 0528 2379 0480 2477 0434 2576 0389 2675 0347 2774 0306 2872 0268 2969 38 0702 2073 0651 2164 0601 2256 0552 2350 0504 2445 0458 2540 0414 2637 0371 2733 0330 2828 0291 2923 39 0723 2055 0673 2143 0623 2232 0575 2323 0528 2414 0482 2507 0438 2600 0395 2694 0354 2787 0315 2879 40 0744 2039 0694 2123 0645 2210 0597 2297 0551 2386 0505 2476 0461 2566 0418 2657 0377 2748 0338 2838 45 0835 1972 0790 2044 0744 2118 0700 2193 0655 2269 0612 2346 0570 2424 0528 2503 0488 2582 0448 2661 50 0913 1925 0871 1987 0829 2051 0787 2116 0746 2182 0705 2250 0665 2318 0625 2387 0586 2456 0548 2526 55 0979 1891 0940 1945 0902 2002 0863 2059 0825 2117 0786 2176 0748 2237 0711 2298 0674 2359 0637 2421 60 1037 1865 1001 1914 0965 1964 0929 2015 0893 2067 0857 2120 0822 2173 0786 2227 0751 2283 0716 2338 65 1087 1845 1053 1889 1020 1934 0986 1980 0953 2027 0919 2075 0886 2123 0852 2172 0819 2221 0786 2272 70 1131 1831 1099 1870 1068 1911 1037 1953 1005 1995 0974 2038 0943 2082 0911 2127 0880 2172 0849 2217 75 1170 1819 1141 1856 1111 1893 1082 1931 1052 1970 1023 2009 0993 2049 0964 2090 0934 2131 0905 2172 80 1205 1810 1177 1844 1150 1878 1122 1913 1094 1949 1066 1984 1039 2022 1011 2059 0983 2097 0955 2135 85 1236 1803 1210 1834 1184 1866 1158 1898 1132 1931 1106 1965 1080 1999 1053 2033 1027 2068 1000 2104 90 1264 1798 1240 1827 1215 1856 1191 1886 1166 1917 1141 1948 1116 1979 1091 2012 1066 2044 1041 2077 95 1290 1793 1267 1821 1244 1848 1221 1876 1197 1905 1174 1934 1150 1963 1126 1993 1102 2023 1079 2054 100 1314 1790 1292 1816 1270 1841 1248 1868 1225 1895 1203 1922 1181 1949 1158 1977 1136 2006 1113 2034 150 1473 1783 1458 1799 1444 1814 1429 1830 1414 1847 1400 1863 1385 1880 1370 1897 1355 1913 1340 1931 200 1561 1791 1550 1801 1539 1813 1528 1824 1518 1836 1507 1847 1495 1860 1484 1871 1474 1883 1462 1896 Nota n número de observações k número de variáveis explanatórias excluindo o termo constante Fonte SAVIN e WHITE op cit reprodução autorizada pela Econometric Society TabEla D5b Continuação Apêndice D Tabelas estatísticas 889 TabEla D6a Valores críticos de funcionamento no teste dos funcionamentos N2 N1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 2 2 2 2 2 2 2 2 2 2 3 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 4 2 2 2 3 3 3 3 3 3 3 3 4 4 4 4 4 5 2 2 3 3 3 3 3 4 4 4 4 4 4 4 5 5 5 6 2 2 3 3 3 3 4 4 4 4 5 5 5 5 5 5 6 6 7 2 2 3 3 3 4 4 5 5 5 5 5 6 6 6 6 6 6 8 2 3 3 3 4 4 5 5 5 6 6 6 6 6 7 7 7 7 9 2 3 3 4 4 5 5 5 6 6 6 7 7 7 7 8 8 8 10 2 3 3 4 5 5 5 6 6 7 7 7 7 8 8 8 8 9 11 2 3 4 4 5 5 6 6 7 7 7 8 8 8 9 9 9 9 12 2 2 3 4 4 5 6 6 7 7 7 8 8 8 9 9 9 10 10 13 2 2 3 4 5 5 6 6 7 7 8 8 9 9 9 10 10 10 10 14 2 2 3 4 5 5 6 7 7 8 8 9 9 9 10 10 10 11 11 15 2 3 3 4 5 6 6 7 7 8 8 9 9 10 10 11 11 11 12 16 2 3 4 4 5 6 6 7 8 8 9 9 10 10 11 11 11 12 12 17 2 3 4 4 5 6 7 7 8 9 9 10 10 11 11 11 12 12 13 18 2 3 4 5 5 6 7 8 8 9 9 10 10 11 11 12 12 13 13 19 2 3 4 5 6 6 7 8 8 9 10 10 11 11 12 12 13 13 13 20 2 3 4 5 6 6 7 8 9 9 10 10 11 12 12 13 13 13 14 Nota as Tabelas D6A e D6B fornecem os valores críticos de n runs para vários valores de N1 símbolo e N2 símbolo Para o teste de runs de uma amostra qualquer valor de n que seja igual ou menor que o apresentado na Tabela D6A ou igual ou maior que o da Tabela D6B é significativo no nível de 005 Fonte SIEGEL Sidney Nonparametríc statistics for the behavioral sciences Nova York McGrawHill Book Company 1956 tabela F p 252253 As tabelas foram adaptadas por Siegel da fonte original SWED Frieda S EISENHART C Tables for testing randomness of grouping in a sequence of alternatives Annals of Mathematical Statistics v 14 1943 Usada com permissão da McGrawHill Book Company e do Annals of Mathematical Statistics TabEla D6b Valores críticos de funcionamento no teste dos funcionamentos N2 N1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 2 3 4 9 9 5 9 10 10 11 11 6 9 10 11 12 12 13 13 13 13 7 11 12 13 13 14 14 14 14 15 15 15 8 11 12 13 14 14 15 15 16 16 16 16 17 17 17 17 17 9 13 14 14 15 16 16 16 17 17 18 18 18 18 18 18 10 13 14 15 16 16 17 17 18 18 18 19 19 19 20 20 11 13 14 15 16 17 17 18 19 19 19 20 20 20 21 21 12 13 14 16 16 17 18 19 19 20 20 21 21 21 22 22 13 15 16 17 18 19 19 20 20 21 21 22 22 23 23 14 15 16 17 18 19 20 20 21 22 22 23 23 23 24 15 15 16 18 18 19 20 21 22 22 23 23 24 24 25 16 17 18 19 20 21 21 22 23 23 24 25 25 25 17 17 18 19 20 21 22 23 23 24 25 25 26 26 18 17 18 19 20 21 22 23 24 25 25 26 26 27 19 17 18 20 21 22 23 23 24 25 26 26 27 27 20 17 18 20 21 22 23 24 25 25 26 27 27 28 890 Apêndice D Tabelas estatísticas ExEmplo 2 Em uma sequência de 30 observações consistindo em 20 sinais C D N1 e 10 sinais D N2 os valores críticos dos funcionamentos no nível de significância de 005 são 9 e 20 como mostram as Tabelas D6A e D6B respectivamente Portanto se em uma aplicação for constatado que o número dos funcionamentos é igual ou menor que 9 ou igual ou maior que 20 podemos rejeitar no nível de significância de 005 a hipótese de que a sequência obser vada é aleatória TabEla D7 Valores críticos de t D ø de DickeyFuller a 1 e 5 e valores de F para testes de raiz unitária Tamanho da amostra tnc tc tct F F 1 5 1 5 1 5 1 5 1 5 25 266 195 375 300 438 360 1061 724 821 568 50 262 195 358 293 415 350 931 673 702 513 100 260 195 351 289 404 345 873 649 650 488 250 258 195 346 288 399 343 843 634 622 475 500 258 195 344 287 398 342 834 630 615 471 258 195 343 286 396 341 827 625 609 468 Os índices nc c e ct denotam respectivamente que não há constante que há uma constante e que há uma constante e um termo de tendência na Equação 2195 Os valores críticos de F são para as hipóteses conjuntas de que os termos constante e δ em 2195 são simultaneamente iguais a zero Os valores críticos de F são para a hipótese conjunta de que os termos constante de tendência e δ em 2195 são simultaneamente iguais a zero Fonte adaptado de FULLER W A Introduction to statistícal time series Nova York John Wiley Sons 1976 p 373 para o teste τ e DICKEY D A FULLER W A Likelihood ratio statistics for autoregressive time series with a unit root Econometrica v 49 p 1063 1981 891 Telas de resultado do EViews MINITAB Excel e STATA Neste apêndice mostramos as telas do EViews MINITAB Excel e do STATA que são alguns dos pacotes estatísticos de regressão e rotinas estatísticas afins mais amplamente utilizados Para ilustrar mos o resultado destes pacotes usamos os dados da Tabela E1 apresentada no site deste livro A ta bela fornece dados sobre a taxa de participação da força de trabalho civil CLFPR a taxa de desemprego civil CUNR e os salárioshora médios em dólares de 1982 AHE82 na economia norteamericana no período 19802002 Embora sob muitos aspectos os resultados da regressão básica sejam semelhantes em todos esses pacotes há diferenças em como eles os representam Alguns pacotes apresentam os resultados com vários dígitos enquanto outros exibem aproximações com quatro dígitos Há pacotes que apresentam as tabelas de análises de variância ANOVA diretamente enquanto em outros elas precisam ser de rivadas Existem também diferenças em alguns dos resumos estatísticos apresentados pelos diversos pacotes Está além do escopo deste apêndice enumerar todas as diferenças entre os pacotes Você pode consultar o site do livro para informações adicionais sobre todos os pacotes E1 EViews Usando a versão 6 do EViews fizemos a regressão da força de trabalho civil contra a taxa de de semprego civil e salárioshora médios e obtivemos os resultados mostrados na Figura E1 Este é o formato padrão em que os resultados do EViews são apresentados A primeira parte da figura fornece os coeficientes de regressão seus erros padrão estimados os valores t sob a hipóte se nula de que os valores populacionais correspondentes a esses coeficientes são iguais a zero e os valores p desses t seguidos do R2 e do R2 ajustado O outro resultado resumido na primeira parte diz respeito ao erro padrão da regressão a soma dos quadrados do resíduo SQR e ao valor F para testar a hipótese de que os valores verdadeiros de todos os coeficientes angulares são si multaneamente iguais a zero O critério de informação de Akaike e o critério de Schwartz são frequentemente usados para escolher entre modelos concorrentes Quanto menor o valor desses critérios melhor é o modelo O método de máxima verossimilhança MV é uma alternativa ao método de mínimos quadrados siglas em inglês utilizadas na tabela Apêndice E 892 Apêndice E Telas de resultado do EViews MINITAB Excel e STATA Resíduo Atual Gráfico de resíduo 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 638000 639000 640000 640000 644000 648000 653000 656000 659000 665000 665000 662000 664000 663000 666000 666000 668000 671000 671000 671000 672000 569000 666000 652097 650004 636047 635173 649131 651566 652347 658842 664103 666148 665819 658745 654608 658917 664147 667644 668425 670097 669974 670443 671364 664589 655770 2140974 2110044 039535 048268 2051311 2035664 006526 2028416 2051027 2011476 2008186 032546 093923 040834 018530 2016441 2004251 009032 010263 005569 006355 044105 102304 Dependente Variável CLFPR Método mínimo quadrados Variável Coeficiente Estatística t Probabilidade C CUNR AHE82 8090133 20671348 21404244 Erro padrão 4756195 0082720 0608615 1700967 28115928 22307278 Rsquared Adjusted Rsquared SE of regression Sum squared resid Verossimilhança logarítmica Estatística DurbinWatson 0772765 0750042 0584308 6828312 21866979 0787625 Mean dependent var SD dependent var Akaike info criterion Critério Schwarz Estatística F Probabilidade estatística F 6589565 1168713 1884330 2032438 3400731 0000000 Amostra 19802002 Observações incluídas 23 00000 00000 00319 Obs Ajuste 210 205 00 05 10 215 7 6 5 4 3 2 1 0 Séries Amostras residuais 19802002 Observações 23 Média Mediana Máximo Mínimo Desvio padrão Assimetria Curtose 2139e14 0063552 1023040 21409735 0557116 20593013 3752631 JarqueBera Probabilidade 1890898 0388505 Figura E1 Tela do EViews para a regressão da participação da força de trabalho civil Apêndice E Telas de resultado do EViews MINITAB Excel e STATA 893 Assim como em MQO encontramos aqueles estimadores que minimizam o erro da soma dos quadrados em MV tentamos encontrar aqueles estimadores que maximizam a possibilidade de observar a amostra estudada Sob a hipótese de normalidade do termo de erro MQO e MV for necem estimativas idênticas dos coeficientes de regressão A estatística DurbinWatson é usada para verificar se existe correlação serial de primeira ordem nos termos de erro A segunda parte da tela do EViews apresenta os valores real e ajustado da variável dependente e a diferença entre as duas que representa os resíduos Ao lado dos valores há uma representação gráfi ca dos resíduos em que uma linha vertical denota zero Os pontos situados à direita da linha vertical são resíduos positivos e aqueles à esquerda são resíduos negativos A terceira parte da tela apresenta o histograma dos resíduos com o resumo da estatística Apresen ta a estatística JarqueBera JB para testar a normalidade dos termos de erro assim como a probabi lidade de obterem as estatísticas especificadas Quanto maior for a probabilidade de obter a estatística JB observada maior é a evidencia a favor da hipótese nula de que os termos de erro são normalmen te distribuídos Note que o EViews não fornece diretamente a tabela de análise de variância ANOVA mas esta pode ser facilmente construída por meio dos dados da soma dos quadrados dos resíduos a soma total dos quadrados que deverá ser derivada do desvio padrão da variável dependente e os graus de liber dade associados O valor F resultante deste exercício deve ser igual ao valor F apresentado na pri meira parte da tabela E2 MINITAB Usando a versão 15 do MINITAB e os mesmos dados obtivemos os resultados de regressão apresentados na Figura E2 O MINITAB apresenta primeiro a regressão múltipla estimada se guida de uma lista de variáveis previsoras explanatórias os coeficientes de regressão estima dos e seus erros padrão os valores T D t e os valores p Nesta tela S representa o erro padrão da estimativa e os valores de R2 e do R2 ajustado são apresentados na forma percentual A isso se segue a tabela ANOVA habitual Uma característica típica da tabela ANOVA é que ela reparte a soma dos quadrados da regressão entre os previsores Assim do total da soma dos quadrados da regressão 23226 a parte de CUNR é 21404 e a de AHE82 é 1822 sugerindo que a taxa de de semprego civil tem relativamente mais impacto sobre a taxa de participação da força de trabalho civil do que os salárioshora médios Uma característica única do resultado da regressão MINITAB é que ele apresenta observa ções incomuns observações que de certa forma são diferentes do resto das observações na amostra Há uma dica sobre tal fato no gráfico de resíduos apresentado no EViews pois ele mostra que as observações 1 e 23 estão consideravelmente afastadas da linha que representa o valor zero mostrado lá O MINITAB também produz um gráfico de resíduos semelhante ao do EViews Aqui St Resid representa os resíduos padronizados os resíduos divididos por S o erro padrão da estimativa Assim como o EViews o MINITAB também apresenta a estatística DurbinWatson e o histogra ma de resíduos O histograma é uma representação visual Se a forma assemelhase à distribuição normal possivelmente os resíduos têm distribuição normal O gráfico de probabilidade de distribui ção normal serve ao mesmo propósito Se os resíduos estimados situamse aproximadamente numa linha reta podemos dizer que estão normalmente distribuídos A estatística AndersonDarling AD um adjunto do gráfico de probabilidade de distribuição normal testa a hipótese de que a variável sob consideração aqui os resíduos tem distribuição normal Se o valor p da estatística AD calculada for razoavelmente alto por exemplo acima de 010 podemos concluir que a variável tem distribuição normal Em nosso exemplo o valor da estatística AD é 0481 com um valor p de cerca de 021 ou 21 Portanto podemos deduzir que os resíduos obtidos do modelo de regressão são normalmente distribuídos 894 Apêndice E Telas de resultado do EViews MINITAB Excel e STATA 210 205 00 Residual 05 10 215 9 6 7 8 5 Frequencia Histogram of the Residuals response is CLFPR 4 3 2 1 0 Mean StDev N AD pValue 24479511 05569 23 0481 0210 210 205 00 RESI1 05 10 215 99 80 90 95 70 60 50 Percente Probability Plot of RESI1 Normal 40 30 20 10 5 1 Predictor Constant CUNR AHE82 Regression Analysis CLFPR versus CUNR AHE82 The regression equation is CLFPR 5 810 2 0672 CUNR 2 141 AHE82 Source Regression Residual Error Total Source CUNR AHE82 S 5 0584117 RSq 5 773 RSqadj 5 750 Analysis of Variance T 1697 2812 2231 MS SE Fit 0155 0307 Obs 1 23 CUNR 710 580 Coef 80951 2067163 214104 DF 2 20 22 DF CLFPR 63800 66600 SE Coef 4770 008270 06103 SS Seq SS 21404 1822 Fit 65209 65575 R denotes an observation with a large standardized residual DurbinWatson statistic 5 0787065 Unusual Observations P 0000 P 0000 0000 0032 St Resid 2250R 206R F 3404 Residual 21409 1025 11613 0341 1 1 23226 6824 30050 E3 Excel Usando o Microsoft Excel obtivemos a tela da Tabela E2 O Excel apresenta primeiro o resumo da estatística tal como R2 múltiplo R que é a raiz quadrada positiva de R R2 ajustado e os erros padrão da estimativa em seguida apresenta a tabela ANOVA Depois apresenta os coefi cientes estimados seus erros padrão os valores t dos coeficientes estimados e seus valores p Também mostra os valores efetivo e estimado da variável dependente e o gráfico de resíduos assim como o gráfico de probabilidade de distribuição normal Figura E2 Tela do MINITAB para a taxa de participação da mão de obra civil Apêndice E Telas de resultado do EViews MINITAB Excel e STATA 895 Uma característica única do Excel é que ele apresenta o intervalo de confiança de 95 ou qual quer porcentagem especificada para os verdadeiros valores dos coeficientes estimados Assim o valor estimado do coeficiente de CUNR é 0671631 e o intervalo de confiança do valor verdadeiro é de 084415 a 0499112 Essa informação é muito valiosa para o teste de hipóteses E4 STATA Usando o STATA obtivemos os resultados de regressão da Tabela E3 O STATA apresenta primei ro a tabela de análise de variância com o resumo estatístico tal como R2 R2 ajustado e REQM Raiz do Erro Quadrático Médio que é apenas o erro padrão da regressão Em seguida fornece os valores dos coeficientes estimados seus erros padrão seus valores t seus valores p da estatística t e o intervalo de confiança de 95 para cada um dos coeficientes da regressão que é semelhante à saída do Excel E5 Comentários finais Em nosso exemplo apresentamos apenas os resultados básicos desses pacotes Mas é importante observar que pacotes como o EViews e o STATA são muito abrangentes e contêm muitas das técnicas econométricas discutidas neste livro Uma vez que você saiba acessar esses pacotes executar sub rotina é uma questão de prática Se você quiser aprofundarse na econometria adquira um ou mais destes pacotes Summary Output Regression Statistics Multiple R 0879155 R Square 0772914 Adjusted R 0750205 Standard E 0584117 Observation 23 ANOVA df SS MS F Significance F Regression 2 2322572 1161286 3403611 365E07 Residual 20 6823846 0341192 Total 22 3004957 Coefficient Standard Err t Stat pvalue Lower 95 Upper 95 Intercept 8095122 4770337 1696971 242E13 7100047 9090196 CUNR 0671631 0082705 8120845 924E08 084415 0499112 AHE82 1410432 0610348 2310867 0031626 2683594 013727 TabEla E2 Tela do Excel para a taxa de participação da mão de obra civil 896 Apêndice E Telas de resultado do EViews MINITAB Excel e STATA Referências wwweviewscom wwwstatacom wwwminitabcom Microsoft Excel CARTER Hill R GRIFFITHS William E JUDGE George G Using Excel for undergraduate econometrics Nova York John Wiley Sons 2001 clfpr Coef Std Err t p t 95 Conf Interval cunr 6716305 0827045 812 0000 8441491 4991119 ahe82 1410433 6103473 231 0032 2683595 1372707 cons 8095122 4770334 1697 0000 7100048 9090197 StatisticsData Analysis Project Data of Table E1 80 Copyright 19842003 StatisticsData Analysis Stata Corporation 4905 Lakeway Drive College Station Texas 77845 USA 800STATAPC httpwwwstatacom 9796964600 statastatacom 9796964601 fax gress clfpr cunr ahe82 Source SS df MS Model 232256929 2 116128465 Residual 682384072 20 341192036 Total 300495337 22 136588789 Number of obs D 23 F2 20 D 3404 Prob F D 00000 Rsquared D 07729 Adj Rsquared D 07502 Root MSE D 58412 TabEla E3 Tela do STATA para a taxa de participação da mão de obra civil 897 Dados econômicos na Internet 1 Economic Statistics Briefing Room uma excelente fonte de dados sobre produção renda emprego desemprego ganhos atividades de produção e empresariais preços e moeda mercados de crédito e valores mobiliários e estatísticas internacionais httpwwwwhitehousegovfsbresbrhtml Federal Reserve System Beige Book fornece um resumo da conjuntura econômica atual pelo Federal Reserve District Há 12 Federal Reserve Districts httpwwwfederalreservegovFOMCBEIGEBOOK Homepage do National Bureau of Economic Research NBER este renomado instituto privado de pesquisas econômicas reúne dados extensivos sobre preços de ativos mão de obra produtivi dade oferta de moeda indicadores de ciclos de negócios etc O NBER tem muitos links para outros sites httpwww nberorg Panel Study fornece dados sobre pesquisa longitudinal de amostras representativas de indivíduos e famílias dos Estados Unidos Esses dados são coletados anualmente desde 1968 httpwww psidolineisrumichedu Resources for Economists on the Internet fonte abrangente de informações e dados sobre muitas ativi dades econômicas com links para grande número de sites Fonte bastante valiosa para economistas acadêmicos e não acadêmicos httprfeorg American Stock Exchange informações sobre aproximadamente 700 empresas registradas no segundo maior mercado de ações httpwwwamexcom Bureau of Economic Analysis BEA Homepage esta agência do Departamento de Comércio dos Estados Unidos que publica a Survey of Current Business é uma excelente fonte de dados sobre todos os tipos de atividades econômicas httpwwwbeagov CIA Publications esta fonte inclui o World Fact Book anual e o Handbook of International Statistics httpwwwciagovlibrarypublications Adaptado de COlE Don Ed Annual editions microeconomics 9899 Connecticut DushkinMcGrawhill 1998 É preciso notar que essa lista não é de modo algum opcional As fontes relacionadas aqui são atualizadas continuamente Apêndice F 898 Apêndice F Dados econômicos na internet Energy Information Administration DOE informações e dados econômicos sobre cada catego ria de combustível httpwwweiadoegov FRED Database a filial do Federal Reserve Bank em St Louis publica dados históricos econô micos e dados sociais que incluem taxas de juro indicadores monetários e de negócios taxas de câmbio etc httpresearchstlouisfedorgfred2 International Trade Administration oferece muitos links para estatísticas comerciais progra mas de âmbito nacional etc httptradegovindexasp STATUSA Databases o National Trade Data Bank oferece a fonte mais abrangente de dados do comércio internacional e informações sobre promoção de exportações Há também dados extensivos sobre condições demográficas políticas e socioeconômicas de diversos países httpwwwstatusagov Statistical Resources on the WebEconomics excelente fonte de dados estatísticos coletados de vários organismos federais indicadores econômicos Federal Reserve Board dados sobre preços ao consumidor e links para outras fontes httpwwwlibumichedugovdocsstatshtml Bureau of Labor Statistics homepage de dados relacionados a vários aspectos de emprego de semprego e ganhos além de links para outros sites de estatística httpwwwstatsblsgov Homepage do US Census Bureau fonte primária de dados sociais demográficos e econômicos sobre renda emprego distribuição de renda e pobreza httpwwwcensusgov General Social Survey dados de entrevistas pessoais do levantamento anual de domicílios dos Esta dos Unidos que começou em 1972 Mais de 35 mil entrevistados responderam a cerca de 2500 perguntas diferentes abrangendo uma variedade de dados httpwwwnorcorgGSSwebsite Institute for Research on Poverty dados coletados por um centro de pesquisa universitária não parti dário e sem fins lucrativos sobre uma variedade de questões relacionadas à pobreza e à desigualdade social httpwwwirpwiscedu Social Security Administration site oficial da Social Security Administration Previdência Social com uma variedade de dados httpwwwssagov 899 Referências bibliográficas Introdutória FRANK JR C R Statistics and econometrics Nova York Holt Rinehart and Winston 1971 GOLDBERGER Arthur S Introductory econometrics Harvard University Press 1998 GUJARATI Damodar N Essentials of econometrics 3 ed Nova York McGrawHill 2006 HALCOUSSIS Dennis Understanding econometrics Thomson 2005 CARTER Hill GRIFFITHS William JUDGE George Undergraduate econometrics Nova York JohnWiley Sons 2001 HU TehWei Econometrics an introductory analysis Baltimore University Park Press 1973 KATZ David A Econometric theory and applications Englewood Cliffs N J Prentice Hall 1982 KLEIN Lawrence R An introduction to econometrics Englewood Cliffs N J Prentice Hall 1962 KOOP Gary Analysis of economic data Nova York John Wiley Sons 2000 SCHMIDT Stephen J Econometrics Nova York McGrawHill 2005 WALTERS A A An introduction to econometrics Londres Macmillan 1968 Intermediária AIGNER D J Basic econometrics Englewood Cliffs NJ Prentice Hall 1971 DHRYMES Phoebus J Introductory econometrics Nova York SpringerVerlag 1978 DIELMAN Terry E Applied regression analysis for business and economics Boston PWSKent 1991 DOUGHERTY Christopher Introduction to econometrics 3 ed Oxford Oxford University Press 2007 DRAPER N R SMITH H Applied regression analysis 3 ed Nova York John Wiley Sons 1998 DUTTA M Econometric methods Cincinnati SouthWestern Publishing Company 1975 GOLDBERGER A S Topics in regression Analysis Nova York Macmillan 1968 GRIFFITHS William E CARTER Hill R Judge George G Learning and practicing econometrics Nova York John Wiley Sons 1993 HARRIS Richard SOLLIS Robert Applied time series modelling and forecasting Inglaterra John Wiley Sons 2003 HEIJ Christiaan DEBOER Paul HANS FRANSES Philip KLOEK Teun VAN DJIK Herman K Econometric methods with applications in business and economics Nova York Oxford University Press 2004 HUANG D S Regression and econometric methods Nova York John Wiley Sons 1970 900 Econometria Básica JUDGE George GR CARTER Hill GRIFFITHS William ELüTKEPOHL Helmut LEE TsoungChao Introduction to the theory and practice of econometrics Nova York John Wiley Sons 1982 KELEJIAN H A OATES W E Introduction to econometrics principles and applications 2 ed NovaYork Harper Row 1981 KOUTSOYIANNIS A Theory of econometrics Nova York Harper Row 1973 MADDALA G S Introduction to econometrics 3 ed Nova York John Wiley Sons 2001 STEWART B Mark WALLIS Kenneth F Introductory econometrics 2 ed Nova York John Wiley Sons 1981 A Halsted Press Book MURPHY James L Introductory econometrics Homewood IL Richard D Irwin 1973 NACHANE Dilip M Econometrics theoretical foundations and empirical perspectives Nova Delhi Oxford University Press 2006 NETTER J WASSERMAN W Applied linear statistical models Homewood IL Richard D Ir win 1974 PINDYCK R S RUBINFELD D L Econometric models and econometric Forecasts 4 ed Nova York McGrawHill 1990 SPRENT Peter Models in regression and related topics Londres Methuen 1969 TINTNER Gerhard Econometrics Nova York John Wiley Sons science ed 1965 VALAVANIS Stefan Econometrics an introduction to maximumlikelihood methods Nova YorK McGrawHill 1959 VERBEEK Marno A guide to modem econometrics John Wiley Sons Nova York 2000 WONNACOTT R J WONNACOTT T H Econometrics 2 ed Nova York John Wiley Sons 1979 WOOLDRIDGE Jeffrey M Introductory econometrics SouthWestern College Publishing 2000 Avançada CAMERON A Colin PRAVIN K Trivedi Microeconomics methods and applications Nova York Cambridge University Press 2005 CHOW Gregory C Econometric methods Nova York McGrawHill 1983 CHRIST C F Econometric models and methods Nova York John Wiley Sons 1966 DAVIDSON James Econometric theory Oxford Reino Unido Blackwell Publishers 2000 DHRYMES P J Econometrics statistical foundations and applications Nova York Harper Row 1970 FOMBY Thomas B CARTER R Hill JOHNSON Stanley R Advanced econometric methods Nova York SpringerVerlag 1984 GOLDBERGER A S Econometric theory Nova York John Wiley Sons 1964 GOLDBERGER A S A course in econometrics Cambridge Mass Harvard University Press 1991 GREENE William H Econometric analysis 4 ed Englewood Cliffs NJ Prentice Hall 2000 HARVEY A C The econometric analysis of time series 2 ed Cambridge Mass MIT Press 1990 HAYASHI Fumio Econometrics Princeton N J Princeton University Press 2000 JOHNSTON J Econometric methods 3 ed Nova York McGrawHill 1984 JUDGE George G CARTER R Hill GRIFFITHS William ELüTKEPOHL Helmut LEE TsoungChao Theory and practice of econometrics Nova York John Wiley Sons 1980 KLEIN Lawrence R A textbook of econometrics 2 ed Englewood Cliffs NJ Prentice Hall 1974 referências bibliográficas 901 KMENTA Jan Elements of econometrics 2 ed Nova York Macmillan 1986 MADANSKY A Foundations of econometrics Amsterdã NorthHolland 1976 MADDALA G S Econometrics Nova York McGrawHill 1977 MALINVAUD E Statistical methods of econometrics 2 ed Amsterdã NorthHolland 1976 MILLS Terence C PATTERSON Kerry Palgrave handbook of econometrics vol 1 econometric theory Nova York Palgrave Macmillan 2006 MITTELHAMMER Ron C JUDGE George G MILLER Douglas J Econometric foundations Nova York Cambridge University Press 2000 Theil Henry Principies of Econometrics John Wiley Sons Nova York 1971 Especializada BELSLEY David A KUH Edwin WELSH Roy E Regression diagnostics identifying influential data and sources of collinearity Nova York John Wiley Sons 1980 DHRYMES P J Distributed lags problems of estimation and formulation São Francisco Holden Day 1971 Diebold Francis X Elements of Forecasting 2 ed SouthWestern Publishing 2001 GOLDFELD S M QUANDT R ENonlinear methods of econometrics Amsterdã NorthHol land 1972 GOURIEROUX Christian Econometrics of qualitative dependent variables Nova York Cambridge University Press 2000 GRAYBILL F A An introduction to linear statistical models Nova York McGrawHill 1961 vol l HAMILTON James D Time series analysis Princeton NJ Princeton University Press 1994 MADDALA G S INMOO Kim Unit roots cointegration and structural change Nova York Cambridge University Press 1998 MILLS T C Time series techniques for economists Nova York Cambridge University Press 1990 RAO C R Linear statistical inference and its applications 2 ed Nova York John Wiley Sons 1975 ZELLNER A An introduction to bayesian inference in econometrics Nova York John Wiley Sons 1971 Aplicada BERNDT Ernst R The practice of econometrics classic and contemporary AddisonWesley 1991 BRIDGE J I Applied econometrics Amsterdã NorthHolland 1971 WOJCIECH W Charemza DEADMAN Derek F New directions in econometric practice general to specific modelling cointegration and vector autoregression 2 ed Nova York Edward El gar Publisher 1997 CRAMER J S Empirical econometrics Amsterdã NorthHolland 1969 DESAI Meghnad Applied econometrics Nova York McGrawHill 1976 KENNEDY Peter A guide to econometrics 4 ed Cambridge Mass MIT Press 1998 LESER C E V Econometric techniques and problems 2 ed Londres Hafner 1974 MILLS T C The econometric modelling of financial time series Nova York Cambridge University Press 1993 CHANDAN Mukherjee WHITE Howardn WUYTS Marc Econometrics and data analy sis for developing countries Nova York Routledge 1998 902 Econometria Básica PATTERSON Kerry An introduction to applied econometrics a time series approach Nova York St Martins Press 2000 POTLURI Rao LEROY MILLER Roger Applied econometrics Belmont Califórnia Wa dsworth 1971 Nota Para ver uma lista dos artigos importantes referentes aos tópicos discutidos no livro consulte a extensa bi bliografia no final dos capítu los de FOMBy et al citado anteriormente 903 Índice de nomes A Achen Christopher H 221n 334 Afifi T 498 Aigner Dennis J 168n 259n Aldrich John H 538n 543 553n Alexander Carol 733n 755n Ali M M 387n Allen R G D 798 Allison Paul D 604n Almon Shirley 640n Alt F F 620 Amemiya T 543n 569 Anderson R L 154n Asteriou Dimitrios 793n Atkinson A C 496n B Baltagi Badi H 276n 491n 588n 612 Bancroft T A 154n Bandyopadhyay Subhayu 613 Bartels Robert 380 Bartlett M S 747n Basmann Robert 712 Bassett G 392n Batten D B 674n Beckenback E F 648n Becker Gary S 57 Becker William 583 Belsley D A 347n Bera A K 150n 272n 328n 450n 785n Berenblutt I I 445n Berndt Ernst R 69 193n 276n 363n Bernoulli Daniel 818 Blanchard Olivier J 186n 349n 652n Blaug Mark 90n 514n Blumstein A 364n Blundell Richard 196n Bodkin Ronald 527n Bok Derek 580n Bollersley T 790n Bowen William G 580 Box G E P 203 747 767n Bradley R A 353n Brechling F P R 656 Breen Richard 571n Breusch T S 389n 438 439 601n Brownlee K A 144n 251n Brunner K 678 Buckland William R 399n 416n Buse A 271n C Cagan Phillip 411n 626 Cameron A Colin 497 602n Cameron S 218n Campbell John Y 770n Cappelleri Joseph 548 Carlson Keith M 487n 617n Caskey John P 583 Chamberlain G 588n 661n Charemza Wojciech W 232n 494n 649n 732n 733n 739n 753n 764n Chatterjee Samprit 155n 321n 353n 362n Cheng Hsiao 524n Chiang Alpha C 227n 797n Chow Gregory C 268n 266 635 Christ Carl F 281n 706n Clinton William J 57 Cochrane D 455n Cohen J 367n Cohen Malcolm S 546 547n Colander David 236 Cole Don 897n Cook Philip 608 Cox D R 203n 554n Craig Allen T 121n 132n 163n Cramer Harald 120n Cramer J S 579 Cromwell Jeff B 732n Cuthbertson Keith 466n 652n 735n 783 D Darnell Adrian C 25 271n 390n 498 Davidson James 60n 85 85n 438n 473n Davidson Russell 81n 272n 362n 379n 443n 518n 523n 527n Deadman Derek F 35 232n 494 649n 732n Deaton Angus 831n Demarsi Alfred 553n Dey John H 36 Dhrymes Phoebus J 379n Dickey David A 749 750 756n Diebold Francis X 301n 495n DiNardo John 497n 603n Doran H E 631n Dornbusch Rudiger 629n 677n Dougherty Christopher 362n 515n Draper Norman R 353n 432n 493n 496 514n 527n 533n Duesenberry James S 706n Duncan Alan 592n 596n Durbin J 435n 436 456n 464n 633n E Eisenhart C 435 889n Elgar Edward 232n 494n Elias Victor J 263n 534n Elliot Graham 753 Enders Walter 732 793n Engel Ernst 182 Engle R F 480 479n 785n 790n Evans J Lynne 25 Evans M A 392n Os números de página seguido de n indicam o material encontrado em notas 904 Econometria básica F Fair Ray 321n 538n 572n Fama Eugene 463 Farebrother R W 435n 886n Farley John U 679 Farrar D E 346 Feldstein Martin 195n 509 Fennet D J 582n Fischer Stanley 629n 671n Fisher Irving 655n Fisher R A 135 Fisher Robert J 236n Fogler H Russell 154n Fomby Thomas B 251n 254n 306n 437n 483n 487n 784 Fox John 289n 403 495n 496n 529n Franses Philip Hans 785n Frees Edward W 588n Freund John E 833 Friedman Milton 31 31n 33 33n 66n 467n 481n 511 626 630n Frisch Ragnar 330n Fromm Gary 706n Fuller W A 749n 750 752 754 Futing Liao Tim 756n G Gallant Ronald 527n Gallaway L E 680n Galton Francis 39 40n Ganapathy Sundaram 154 Garson David 552n Gauss Carl Friedrich 78 84n 93n Geary R C 353n 433n Giaccotto C 387n Giammatteo Marc A 791n Gilbert Christopher 35 Gill Len 480n Glauber R R 346n Glejser H 384n 385 396 Godfrey L G 389n 438 439 Goldberger Arthur S 25 69n 85n 143 178n 218 218n 294n 329 335 340n 349 358 360n 527n 542n Goldfeld Stephen M 310n 383 384 386 426n Granger Clive W J 33 221n 647n 648 749 756n 762 Graybill Franklin A 161n 825 Greenberg D H 364n Greene William H 270272 395n 416n 420n 508n 571n 588n 589 602 632n 682n 790n Griffin J M 612n Griffiths William E 143n 196n 221n 347n 387n 549n 580n 896 Griliches Zvi 277n 363n 449 588n 617n 655n 656n Grunfeld Y 47 Guise J W B 631n Gujarati Damodar 315n 453n 483n Gunst R F 332n H Haavelmo T 25 Hadi Ali S 155n 321n 362n Hafer R W 650n Hall Robert 33 Hall Stephen G 466n 597n 652n 735n 793n Halvorsen Robert 308n Hamilton J D 732n Hannan Michael H 732n Hanushek Eric A 406n Harberger Arnold C 277n 653n 656n Harrington Diana R 166n Harris Richard 392n Harrison M J 392n Hart B I 454 Hart P E 663n Hartley H O 876n 877n 884n Harvey Andrew 383n 486 696 769n 783 Hausman J A 603 697 Hayashi Fumio 439n Heckman James J 572 Heij Christiaan 120n 168 Hendry David F 26 35 373 652n 758n Heston Alan 651n Higgins M 785n Hildreth G 455 Hill R Carter 143 196n 221n 251n 306n 347n 387n 437n 483n 896 Hirschberg Joseph G 784 Hoel Paul G 833 Hoffman Antoni 128n Hogg Robert V 121n 132n 163n Hongyi Li 606n Horioka Charles 195n Horsman Nancy G 676n 677n Hosmer David W Jr 589 Hotchkiss Julie L 288n Houthakker H S 381n 387 Hsiao C 588n Hyndman Rob J 767n I Inder B 634n InMoo Kim 732n 752n Intriligator Michael D 45 524 588n J Jackson John E 406n Jansen Dennis W 756 Jarque C M150n 272n 328n 450n Jenkins G M 767n Jochems D B 360n Johnson Stanley R 251n 306n 437n 487n Johnston J 163n 195n 354n 424n 454n 470n Joutz Frederick 607n Judge George G 196n 221n 347n 535n 354n 387n 603n 399n K Katos A V 602n 663n 727n 732n Kaufman Bruce E 228n Kendall Maurice G 43 120n 385n 399n Kennedy Peter 95n 232n 275n 335n 361n 466n 475 483n Keynes John Maynard 27n 31 Kim Moshe 589 Kinal T 783n King M L 392n Kiviet J F 634n Klein Lawrence R 347n 673n 674n 706n Kleinbaum David G 348n Kmenta Jan 139n 141n 326n 345n 414n 598n Koenker R 390n Koop Gary 647n 732 789n Koopmans Tjalling C 25n 709n Korosi Gabor 436n Kosters M 363n Koyck L M 620n 625 626 Kramer J S 521n Índice de nomes 905 Krugman Paul R 618n Kuh Edwin 347n 350n 706n Kumar Krishna 357 Kupper Lawrence L 348n Kutner Michael H 132n 204n 529n 574n 585n L Labys Walter C 732n Lang Kevin 140n 143 Langer Sidney 317 Lawler K A 662n 663n 727n 732n Leamer Edward E 513n 648 Lee A 39n Lee Cheng F 720 Lee Peter M 36 Lee T C 588n Lehman E L 135n Lemeshow Stanley 577n Lerman Robert L 546 546n Leuthold Jane 314n Lev Joseph 830n Levitt Harold J 679n Levy Haim 154n 164n 282 Lewis Stephen R 391n LewisBeck Michael S 538n Leybounre S J 753 Lind Douglas A 549n Litterman R 793n Liviatan N 632n Ljung G M 747n Lloyd W P 720 Long J Scott 559n Longley J 354 Lott William F 392n Lovell Michael C 474n 627n Lu J Y 454n Lucas Robert 627 652n 768n Lucchino Albert 235n Lütkepohl Helmut 347n 387n M MacKinnon James G 81n 272 362n 379 404 443n 488 508n 510 749n Maddala G S 407n 444 420n 449n459 483n 513n 538n 576 578 606 695 Maeshiro Asatoshi 631n Makridakis Spyros 763n Malinvaud E 25n 86n 106 352n 381n 431n 541n Mallows C P 493 Mankiw N Gregory 403n Marchal William G 549n Mason R L 332n Mason Robert D 549n Matyas Laszlo 436n 634n Mazzeo M 558559 McAleer Michael 93n 372n 380n McCabe Brendan P 346 392n McCloskey D N 143n McFadden D 559n McNees Stephen K 627 784n Meltz N M 319n Meltzer A H 648n 678 Menges G 680 Miller Douglas J 438n Miller R J 317 Miller R W 33n Mills G 663n Mills Terence C 36 763n 769n 778n Mincer J 498n Mittlelhammer Ron C 438n 441n Montgomery Douglas C 306n 332 582 583 Mood Alexander M 161n 833 Mooney Christopher Z 508n Morgan Mary S 35 Morgenstern O 50n Morrison Donald F 66n 582 Mukherjee Chandan 182n 320n 322n 494n 516n 639n Muller Keith E 348n Murphy Michael P 608n Murray Michael P 570n Muth J 627 N Nachtsheim Christopher J 203n 529n 574n Nagar A 446 454 Nagin D 367n Nakamura A 697n Nakamura M 697n Nelson Forrest 538n 543 550n 574n Nerlove Marc 281 282 456 618n 627 628n Neter John 132n 204n 529n 574n 585n Newbold P 221n 742 Newbold Paul 833 Newey W K 448n Newman J R 66n Newport Christopher 238n Neyman J 135 Ng S 753 Nielsen A C 219n Nitecki Matthew H 128n Nordhaus William 136 O Obstfeld Maurice 618n Ogburn W F 867n OHagan John 357 Orcutt G H 455n Oudet Bruno A 678n P Pagan A R 389n 601n Palmquist Raymond 308n Pankratz Alan 769n Pantula S 753n Paris Quirino 483n Park R E 383n Pastides H 585n Patterson Kerry 36 475 475n 901 902 Pearson E S 876n 877n 884n Pearson Karl 39 399 Peck Elizabeth A 306n 332n 582 Pendakur Krishna 192n Perron Pierre 752 735 758n Peterson Andrew 583 Peterson Kerry 514n 758n Phillips A W 186n Phillips P C B 752n Pierce D A 747 Pindyck Robert S 527n 768n 769n Pogue Thomas F 548n Pokorny Michael 771 Pool William 474 Porier Dale J 36 Powers Daniel A 538n Prais S J 381n Price Bertram 155n 321n 353n 362n Q Quandt Richard E 310n 383n 384n 426n R Ragan James F Jr 236n Ramsey J B 478 Rao B Bhaskara 635n 732n Rao C R 246n Rao P 449n 906 Econometria básica Ratner J B 783n Ray Subhash C 392n Rea Samuel A Jr 546n 547n Reagan Ronald W 268 271 Reardon Daniel J 281n Rencher Alvin C 496n Richard J F 467n Ross Sheldon M 120n Rothenberg Thomas J 753 Rubinfeld Daniel L 527n 697n 796n Rudd Paul A 499 499n Runkle D E 784n S Salvatore Dominick 405n Samuelson P A 25n Sandberg Scott E 219n Santoni G J 638n Sargan J Denis 633 663 658n Sargent Thomas 627 Sarnat Marshall 154n Savin N E 886n Savino Raymond 234n Sayrs Lois W 450n Schaefer Cathy 318 Schmidt Stephen J 682n Seber F A F 408n Seddighi H R 662n 663n 727n 732n Seigel Sidney 889n Sen Ashish 496n Shaw G K 626n 627n 655n Sheffrin Steven M 627n Silver J Lew 397n 717n Sims C A 660n 778n Smith Gary R 460n Smith Harry 353n 432n 493n 496n 514n Smith P E 680 Soldofsky Robert M 548n Somers Albert T 48n Spanos Aris 26 51n Spector L 558559 Srivastava Muni 319n 496n Srivastava S S 353n Stewart Jon 480n Stewart Mark B 350n Stigler Stephen M 128n Stock James H 86n 508n 650n 652n Stone Courtenay C 638n Stone J R N 25n Stone R 361n Strickland Allyn D 718 Stuart A 120n Suits D B 702n Summers Robert 651n Swamy P A V B 309n Swed Frieda S 435 889n Székely István P 634n Szroeter J 392n T Tatom John A 280 Taylor Mark P 466n 652n 735n Terraza Michel 732n Theil Henri 25n 93n 162n 264n 462 513n 554n 715n Thornton Daniel I 647n 756n Tiegen R 678 Tinbergen J 620n Tintner Gerhard 25n 416 Tobin James 350 570 Trivedi Pravin K 497n 602n Trost Robert P 606n TsoungChao Lee 347n U Ullah Aman 49n V Valavanis Stefan 371n Verbeek Marno 732n Vining G Geoffrey 306n Vinod H D 49n 353n von Neumann J 454n W Waldman Donald 583 Walker Helen M 830n Wall Howard J 613 Wallace T Dudley 395n 474n Wallis Kenneth F 350n 459n Walpole Ronald E 833 Walsh Joe 232n Wasserman William 132n 240n 529n 574n 585n Watson G S 435n Watson Mark W 86n 508n 752n Webb G I 445n Webster J T 332n Weil David N 194n Weisberg Stanford 432n Weiss Leonard W 718 Welsch R E 347n West K 448n Wetherill G Barrie 325n Wheelwright Steven C 767n Whitaker J K 663n White Howard 75n 182n 395n 639n 886n White Kenneth J 483n 676n 677 Wichers C Robert 346 357 Wiener N 648n Wooldridge Jeffrey M 277n 414n 440n 450n 602n Wu DeMin 697n Wuyts Marc 75n 182n 320n 321n 732n Wyatt Justin B 676n 677n Y Yu Xie 538n Yule G Udny 385n 742 Z Zaman Asad 475 Zarembka P 563n Zeller Arnold 36 Zellner Arnold 595n 648n 708n Zestos George K 238n Ziliak S T 143n Zucker Albert 352n 907 Índice soma 796 somatório duplo 796 Π operador de produto 797 τ tau estatístico 749751 A A2 estatístico 150 Abordagem Bayesiana 34 Abordagem de baixo para cima 474 Abordagem discernente para teste de hipóteses não aninhadas 486491 Abordagem discriminatória para teste de hipóteses não aninhadas 486 Abordagem matricial ao modelo de regressão linear 846865 ANOVA em notação matricial 856857 coeficiente de determinação em notação matricial 854855 estimação de MQO 850854 exemplo de 859863 matriz de correlação 855 modelo regressão linear com k variáveis 848849 premissas de MCRL em notação matricial 848849 previsão usando regressão múltiplaformulação de matriz 858859 teste F geral de usando notação matricial 857 mínimos quadrados generalizados 863864 teste de hipótese sobre coeficientes de regressão individual em notação matricial 855856 Aglomeração de volatilidade 767 Agregada 29 Agronomia 42 Alavancagem 495 496 Aleatoriedade 65 Aleatório termo 44 Álgebra matricial 834835 definições 834835 determinantes 840841 diferenciação matriz 844845 inverso da matriz quadrada cálculo 843844 operações 837840 tipos de matrizes 835836 Amostra 27 50 820 824 Amostra aleatória 819 Amostra censurada 571 Amostra truncada 571n Amostragem repetida 105 Análise da história de evento 587 Análise de correlação 43 Análise de corte 587 Análise de covariância ANCOVA modelos 294295 Análise de dados tempo até o evento 577 Análise de fator 353 Análise de regressão 3958 apresentação dos resultados 148 avaliação de resultados 149152 dados para 4552 e análise de variância 144145 e causação 43 e correlação 4344 escalas de medição de variáveis 51 exemplos 3942 para estimação 29 problema de previsão 145148 relações estatísticas vs determinísticas 42 terminologianotação usada 44 Análise de regressão clássica 43n Análise de regressão com duas variáveis 44 5989 especificação estocástica de FRP 6465 exemplos 6971 função de regressão amostral 6669 função de regressão populacional 6263 linearidade 6263 termo de erro estocástico 6566 Análise de regressão múltipla 44 Análise de regressão simples veja Análise de regressão de duas variáveis Análise de sobrevivência 577 Análise de variância ANOVA modelos com duas variáveis qualitativas 293 e análise de regressão 144145 em notação matricial 856857 para teste de significância geral 251253 variáveis dummy em 289 Análise gráfica 743 Análise sazonal 300305 Apreciação 54 ARMA processo de autorregressão e média móvel 769 Armadilha de variáveis dummy 292 593 As fontes de dados 4849 Assimetria 150 152 372 473 811 812 Assíntota 184 Assintótica não tendenciosa 825 Assintoticamente eficiente 827 Ausência de normalidade dos termos de erro 541 Autocorrelação 415453 com heterocedasticidade 450 definida 416 detecção de 431441 método gráfico 431433 teste d de DurbinWatson 435439 Números de página seguidos de n indicam material encontrado em notas 908 Econometria básica teste de BreuschGodfrey 439441 teste de runs 433435 detectando em modelos de autorregressão 633634 e heterocedasticidade 449 e método NeweyWest 448 e seleção do método 448 e variáveis dummy 309 estimação MQOL na presença de 421424 425429 estimador BLUE na presença de 424 exemplo conclusivo 450451 exemplo salários e produtividade 429430 medidas corretivas 441 método MQG de correção para 442448 modelos ARCHGARCH 450 natureza da 416421 premissa de ausência 8889 provas 465 pura 442 variáveis dummy e 449 Autocorrelação espacial 415 Autocorrelação pura 441 Autorregressão 419 Autorregressão de primeira ordem AR1 422 769 Autorregressivo de pézima ordem ARp 770 Autorregressivo de segunda ordem AR2 770 Avaliação de determinante 840 B Banco de dados FRED 732 898 Banco de dados STATUSA 898 Banda de confiança 147 BEA Bureau of Economic Análise 897 BLUE veja Melhor estimador linear não tendencioso Bolsa de Valores Dos Estados Unidos 897 Bootstrapping 508 BUE veja Melhores estimadores não tendenciosos Bureau of economic analysis BEA 897 Bureau of labor statistics 898 C Cartão de débito 549 562563 Caso de regressor aleatório 508 Caso ignorável 498 Categoria clássica 34 Categoria comparação 292 Categoria controle 292 Categoria de padrão de comparação 292 Categoria de referência 292 Categoria omitida 292 Categoriabase 292 Causação regressão vs 43 Causalidade bilateral 648 Causalidade preditiva 648 Causalidade e exogeneidade 651652 e modelo VAR 781782 em economia 647648 CDF veja Função de distribuição cumulativa Centroalvo estocástico 42n Choques 779 CIS veja Critério de informação de Schwarz Citação em tempo real 45 CLFPR veja Taxa de participação da força de trabalho civil CLT veja Teorema do limite central CochranOrcutt CO método iterativo 446 455456 Coeficiente angular diferencial 297 Coeficiente beta 176 512 Coeficiente de ajuste 628 Coeficiente de autocorrelação de defasagem l 422 Coeficiente de autocorrelação de primeira ordem 422 Coeficiente de autocovariância 422 Coeficiente de confiança 129 820 Coeficiente de correlação R 98 Coeficiente de correlação amostral 98 Coeficiente de correlação de rankings de Spearman 107 Coeficiente de correlação múltipla 214 Coeficiente de determinação R2 95 9798 ajustado 861 comparando dois 218221 distribuição entre regressores 221 e teste F 254255 em notação matricial 854 múltipla 213214 na regressão múltipla 217222 problema de estimação do modelo de regressão de duas variáveis 9599 teste da significância geral em termos de 255256 Coeficiente de determinação ajustado 217222 861 Coeficiente de determinação múltiplo 213214 Coeficiente de determinação parcial 229 Coeficiente de expectativa 626 Coeficiente de intercepto 62 Coeficiente dummies de inclinação diferencial 594 Coeficientes de correlação 43 746747 de distribuição de probabilidade 811812 de ordem zero 228 Coeficientes de correlação de primeira ordem 229 Coeficientes de correlação Parcial 228230 Coeficientes de correlação simples 228229 Coeficientes de forma reduzida 684685 Coeficientes de intercepto diferencial 292 297 303 Coeficientes de regressão 62 259261 Coeficientes de regressão individuais 248250 Coeficientes estruturais 684 Coeficientes parciais de regressão 205 207 Cofator 843 Colinearidade 206 330n 353 veja Multicolinearidade Colinearidade perfeita 292 Compatibilidade 133 Componente determinístico 64 Componente não sistemático 64 Componente sistemático 64 Computadores 35 Computadores pessoais 102103 Condição de estabilidade 750 Condição de ordem de identificação 694697 Condição de posto de identificação 693694 Confidencialidade 50 Índice 909 Confirmado pelos dados 467 Consistência 116 121 467 825826 Consistência dados 647 Constância parâmetro 467 Constancia de parâmetro 467 Consumo agregado 639640 Consumo de cerveja 608 Consumo permanente 66 Contagem R2 560 Contribuição incremental de explanatória 256259 Contribuição marginal da variável explanatória 256258 Correção de erro padrão de MQO 448 Correlação ões auto veja Autocorrelação parcial 346 pares de regressores 345 premissa de não serial 8889 regressão vs 43 Correlação contemporânea zero 707 Correlação espúria 399 Correlação negativa 88 Correlação serial 427 Correlação zero 98 Correlações parciais 346 Correlações pares de regressores 345 Correlograma 743746 Correlograma amostral 743 Correlograma de população 743 Covariância 114 807808 Covariância amostral 743 Covariância estacionário 734735 Covariáveis 294 CPS Current Populacion Survey 499 Crescimento da população 530531 Criação de moeda 616 Critério Cp de Mallows 486 493 Critério de informação de Akaike CIA 218 486 492 Critério de informação de Schwarz CIS 486 492 Critério de mínimos quadrados 79 Critério de previsão de Amemiya 218 Critério R2 491 Critérios de seleção de modelo 467 491494 critério Cp de Mallows 493 critério de informação de Akaike 492 critério de informação de Schwarz 492493 critério R2 491 previsão quiquadrado 494 R2ajustado 492 Crítica de Lucas 768 CUNR taxa de desemprego civil 891 Current população survey CPS 499 Curtose 150151 811812 Curva de expectativa aumentada de Phillips 184 Curva de Phillips 41 198 Curva de Phillips aceleracionista 187 Curva de Phillips modificada 186 Curva de poder 830 Curva de regressão populacional 61 Curva J da economia internacional 618 Curvas de Indiferença 51 D Dados grubbing 474 Dados snooping 474 Dados mensalmente 45 Dados agrupados 553555 564567 Dados anuais 57 Dados combinados 46 Dados contáveis 539 Dados de corte transversal 4546 350 Dados de evento raro 539 Dados de Longley 354357 Dados de nível individual 553 558563 567 585586 Dados de séries temporais 731761 767793 abordagens para 767769 aplicações econômicas 759761 cointegração 755758 conceitoschave 733 definição 4445 e dados de corte transversal 350 e dados de cortes transversais 587 economia dos Estados Unidos 732733 estacionariedade testes de 742748 exemplos de 790792 fenômeno de regressão espúria com 741742 medição de volatilidade em 784790 metodologia BoxJenkins 771778 modelagem 769771 processos estocásticos 734741 teste da raiz unitária 748753 transformando a série temporal não estacionárias em 753755 vetores autorregressivo VAR 778783 Dados deceniais 45 Dados diários 45 Dados discrepantes 372 494496 Dados experimentais 26 Dados faltantes 497498 Dados longitudinais veja Painel de dados Dados muito agregados 50 Dados não agrupados 558563 567568 585586 Dados observacionais experimental vs 26 premissa sobre 89 Dados para análise econômica 4550 combinados 46 de corte transversal 4546 fontes de 48 na internet 897898 painellongitudinalmicropainel 4749 precisão de 50 séries temporais 45 tipos de 45 Dados quinquenais 45 Dados replicados 553555 Dados sobre investimento 4749 Dados trimestrais 45 Dados consistência de 467 indisponibilidade de 65 manipulação de 419 observações vs experimentais 26 obtenção 2829 DCP veja Despesa de consumo pessoal Declaração de teoria ou hipótese 27 Defasagem distribuída polinomial PDL 640647 Defasagemns e autocorrelação 419 em economia 614618 extensão 746 razões para 618619 910 Econometria básica Den desvio equivalente normal 656 Denominador graus de liberdade162 Dentro do grupo DG estimador 595598 Departamento de Comércio dos EUA 47 48 Depreciação 54 Derivada no tempo 708n Desasonalização 300 Desigualdade de CauchySchwarz 106 Despesa de consumo pessoal DCP 29 30 Despesas com publicidade 57 Desvio normal equivalente den 565 Desviopadrão 806 Detentor de conta corrente 584 Determinante menor 842 Determinantes 840483 Dez mandamentos da econometria aplicada Peter Kennedy 509 Diagrama de dispersão 39 Diagrama de Venn 85 Diferenciação matriz 844 Diferenciação de matriz 844845 Dimensão 834 Distribuição amostral 91n 94 507 Distribuição binomial 540 818819 Distribuição binomial de Bernoulli 818 Distribuição de Poisson 819 Distribuição de probabilidade 122 coeficiente de correlação 808809 covariância 807808 de termos de erro 118119 distribuição binomial 818 distribuição binomial de Bernoulli 818 distribuição de Poisson 819 distribuição F 817818 distribuição normal 812819 distribuição normal relativa a 161162 distribuição quiquadrado 815816 distribuição t de Student 816 do estimador 820 expectativa condicional e variância condicional 810 momentos de ordem superior 811812 valor esperado 804805 variância 806807 Distribuição de probabilidade de Bernoulli 540 Distribuição de probabilidade teórica distribuição binomial 818 distribuição binomial de Bernoulli 818 distribuição de Poisson 819 distribuição F 818819 distribuição normal 812815 distribuição quiquadrado 815816 distribuição t de Student 816 Distribuição exponencial 127 Distribuição F 817818 877878 Distribuição lognormal 191 Distribuição normal 161162 812815 Distribuição normal assintótica 508 Distribuição normal e independente DNI 119 Distribuição normal padronizada 875 Distribuição quiquadrado 815816 883884 Distribuição T 876 Distribuição t de Student 816 Distúrbio estocástico 6466 Dividendos 732733 E Econometria aplicada 34 Econometria das séries temporais 45 352 Econometria teórica 34 35 Econometria como verificação empírica da teoria econômica 2 definições 25 metodologia da 2634 aplicações de modelo 32 coleta de dados 2829 especificação de modelo matemático 27 especificação do modelo econométrico 2829 estimação de modelo 29 exposição da teoria ou hipótese 27 previsão 31 teste de hipótese 31 papel do computador em 35 prérequisitos estatísticos 35 prérequisitos matemáticos 35 recursos de leitura sobre 3536 tipos de 34 Economia causalidade em 647652 Economia do trabalho 4041 Economia matemática 26 Economia mexicana 529 534 Economia monetária 41 Economic Statistics Briefing Room 897 Economistas positivos 31 Efeito ARCH veja Efeito heterocedasticidade autorregressiva condicional Efeito do tempo 594 Efeito escala 46 Efeito heterocedasticidade autorregressiva condicional ARCH na medida de volatilidade 789 teste d de DurbinWatson 790 Efeito heterogeneidade 591 Efeito multiplicativo 469 Efeito não observado 591 Efeitos fixos unidirecionais 594 Eficiência de testes de raiz unitária 752 do teste 141 387 829 do teste estatístico 441n EGARCH GARCH exponencial 793 Eigenvalues 347348 Elasticidade da demanda 41 Elasticidade de preço 40 Elemento de probabilidade 799 Energy information administration 898 Equação de primeira diferença 444 Equação de quasediferença 443 Equação superidentificada 712715 Equações comportamentais 684 Equações de forma reduzida 684685 Equações de salário 611 Equações estruturais 684 Equações K normais 871 Equações normais 80 525 871 Equações simultâneas 871 Equilíbrio do mercado de bens 671 Equilíbrio do mercado monetário 672 Erro de especificação 168 Erro de previsão 31 Erro de ruído branco 422 744 Erro de soma dos quadrados 526n Índice 911 Erro Tipo I 129n 134n 141 829 Erro Tipo II 141 829 Erropadrão s da estimativa 91 da regressão 92 de estimadores de mínimos quadrados 93 de estimadores MQO 210211 de estimativas de mínimos quadrados 91 em estimadores MQ2E 729 modelo de regressão linear padrão veja Modelo clássico de regressão linear Distribuição normal padrão 121 Erros de especificação de modelo 466 consequências de 469473 testes de 473481 detecção de variáveis desnecessárias 473474 estatística d de DurbinWatson 476478 exame de resíduos 476 nível de significância nominal vs verdadeiro 474475 omissão de variáveis 475481 teste de multiplicador de Lagrange para soma de variáveis 480481 teste RESET de Ramsey 478480 tipos de 467469 Erros de especificação de modelo 869 Erros de medição 50 481484 Erros de medida 51 481484 Erros não normais 507508 Errospadrão consistentes com heterocedasticidade de White 395 414 501 Errospadrão consistentes com heterocedasticidade e autocorrelação HAC 448 Errospadrão corrigidos de dados em painel 602 Errospadrão HAC veja Heterocedasticidade e errospadrão consistentes com autocorrelação Errospadrão robustos 395 411 414 Escala 172175 Escala de intervalo 51 Escala de razão 51 Escala nominal 51 Escala ordinal 51 Escalar 834 Escalas de medida 51 Espaço de amostra 743 Esquema autorregressivo de primeira ordem de Markov 422 ESS veja Soma de quadrados explicada Estacionária 45 Estacionariedade testes de 742748 análise gráfica 743 função autocorrelação correlograma 743746 significância estatística dos coeficientes de autocorrelação 746748 Estacionário de segunda ordem 734 Estatística termo 67 819 Estatística d de DurbinWatson 435 476478 e efeito GARCH 790 p estimado em 446 tabela de 885888 Estatística da razão de verossimilhança RV 560 Estatística G 445 Estatística H 464 633 Estatística h de Durbin 464 Estatística LB LjungBox 747 Estatística LjungBox LB 747 Estatística Q 747 Estatística Q de BoxPierce 747 Estatística quiquadrado 815 Estatística RV razão de verossimilhança 560 Estatisticamente significativos 135 Estimação 67 819 Estimação 819827 do modelo ARIMA 776 do modelo econométrico 29 estimação de intervalo 820 estimação pontual 819 método da máxima verossimilhança 122127 métodos 821822 métodos de equação simultânea 705706 errospadrão de estimadores de 2SLS 729 exemplos 717723 mínimos quadrados de dois estágios 712715 mínimos quadrados indiretos 708711 modelos recursivos e MQO 706708 viés nos estimadores de mínimos quadrados indiretos 728 na teoria clássica da inferência estatística 118 no modelo VAR 778784 problema de 819 propriedades de amostras grandes 824827 propriedades de amostras pequenas 824827 Estimação de intervalo 128130 820 definição 128129 intervalo de confiança para coeficientes β1 e β2 de regressão 130132 intervalo de confiança para σ2 132133 Estimação de MQO 850854 e autocorrelação 421424 e heterocedasticidade 370371 375376 374376 379380 ilustração 852 matriz de variânciacovariância de β 853854 propriedades do vetor β dos MQO 854 Estimação pontual 129 Estimador de efeito fixo WG 595598 Estimador de erro médio quadrático MSE 823824 Estimador DG veja Estimador dentro do grupo Estimador EMQ veja Estimador de erro médio quadrático Estimador não usado de variância mínima 120 823 Estimadores de mínimos quadrados 82 consistência de 116 de σ2 114115 linearidadenão tendenciosidade 112113 ordinários veja Mínimos quadrados ordinários para regressão passando pela origem 198199 propriedades de 9395 912 Econometria básica variância mínima de 115116 variânciaserrospadrão de 113 Estimadores 67 602 819 Estimadores de efeito fixo 593 602 Estimadores de efeitos aleatória 602 Estimadores de intervalo 82 128130 Estimadores de matriz de covariância consistentes com heterocedasticidade 395n Estimadores de MQO 209214 derivação 241242 inconsistência 673676 682 multicolinearidade e variância 336338 propriedades 120121 propriedades dos 211212 sensibilidade dos 339340 variâncias e erros padrão 210211 Estimadores eficientes 93 736 823 Estimadores MQP 377 Estimadores MV 212 821 Estimadores pontuais 129 Estimativas de mínimos quadrados derivação 112 dois estágios veja Mínimos quadrados de dois estágios precisãoerrospadrão de 9193 Estocástico termo 43n 44 Estritamente de ruído branco 741n Estudo CohenReaLerman 546547 Estudo de painel 879 Estudo de Painel da Dinâmica da Renda PSID 587 Estudo de toxicidade 582 Estudos de corte transversal 415 Eventos 797 Eventos exaustivos 797 Eventos mutuamente exclusivos 797 EViews 781893 Excel 894895 Exemplo de 859863 Exemplo de intensidade de publicidade 718719 Exemplo de variação nos preços Bolsa de valores de Nova York 789790 Exemplos de letras do Tesouro americano 761 Exogeneidade 652593 Expansão de determinante 840 Expansão da série de Taylor 527528 535 Expansão dos salários no setor industrial 72 Expectativa condicional da distribuição de probabilidade 809811 Expectativas iteradas lei 811 Experimentos Monte Carlo 35 104105 676677 Exportações e dotação de capital humano 73 Exposição da teoria ou hipótese 27 Extrapolação 419 F FAC veja Função de autocorrelação Falta de resposta 150 Fator de inflação da variância FIV 337 347 Fatores de escala 172 FDP veja Função de densidade de probabilidade Federal reserve bank de St Louis 732 898 Federal reserve system beige book 897 Fenômeno da regressão espúria 741742 Fenômeno da teia de aranha 419 Fenômeno de passeio aleatório 731 Finalidade controle modelo usado para 32 FIV veja Fator inflatório de variância FLV veja Função logverossimilhança Forma aditiva 298 Forma de diferença 420 443 Forma de nível 420 Forma de primeira diferença 351 Forma funcional errada 468 testes para incorreta 475481 Forma interativa 297 Forma multiplicativa 297 Formato de desvio 83 Fórmula de redução 866 Fórmulas de crescimento taxa de crescimento 202203 FRA veja Função de regressão amostral Fracamente estacionário 734 Frequência relativa 554 797 FRI função resposta a impulso 783 FRP veja Função de regressão populacional FRP estocástica 71 FRP linear 62 Função consumo 27 28 615 Função de consumo Keynesiana 7 2729 31 Função de consumo real 503507 Função de correlação FAC 743746 Função de densidade de probabilidade FDP 798804 de variável aleatória contínua 799 de variável aleatória discrete 798799 FDP condicional 801 FDP marginal 800 FDPs conjuntas 800 independência estatística 802804 Função de densidade de probabilidade condicional 801 Função de densidade de probabilidade conjunta 800 Função de densidade de probabilidade conjunta contínua 798 Função de densidade de probabilidade conjunta contínua 803804 Função de densidade de probabilidade discreta 798799 Função de densidade de probabilidade individual 800 Função de densidade de probabilidade marginal 800 Função de densidade de probabilidade normal bivariada 126 Função de distribuição acumulada FDA 550 563564 Função de distribuição logística 523 551 Função de esperança condicional FEC 62 Função de produção CD veja Função de produção CobbDouglas Função de produção CobbDouglas CD 34 524 da economia mexicana 529 EViews resultado do 244245 exemplo de 223224 propriedades da 222223 Função de produção transcendental FPT 279 Função de regressão amostral FRA 6669 Índice 913 Função de regressão populacional FRP 62 Função de valor real 797n Função de verossimilhança LF 124 586 821 Função estimável 334n 644 Função gráfica de poder 830 Função linear 62n Função logverossimilhança FLV 585 821 Função oferta de moeda 712 Função quadrática 225 Função regressão linear população 62 função resposta a impulso IRF 783 Funções de densidade de probabilidade conjunta 800 Funções exponenciais 201 Funções Spline 306 FV veja Função de verossimilhança G GARCH exponencial EGARCH 793 General social survey 898 German socioeconomic panel GESOEP 588 Gl graus de liberdade 91 Gráfico de dispersão 348349 Gráfico de probabilidade normal GNP 150 Graus de liberdade gl 91 Graus de liberdade numerador 162 Gravidade lei da 43 H Handbook of International Statistics 897 Hat 29n Heterocedasticidade 370375 definição 86 detecção de 380393 método gráfico 381382 métodos formais 383 métodos informais 381382 natureza do problema 381 seleção do teste 393 teste de BreuschPagan Godfrey 389390 teste de correlação de Spearman 385 teste de Glejser 384385 teste de GoldfeldQuandt 386388 teste de Park 383 teste geral de White 391393 teste KoenfeerBasset 392393 e autocorrelação 450 e variáveis dummy 308309 errospadrão de White corrigidos 414 estimação MQ na presença de 375376 374376 379380 exemplos de 399403 medidas corretivas 393399 MPQ 395 premissas sobre padrão de heterocedasticidade 395 variânciaserrospadrão de White consistentes com heterocedasticidade 395 método MQG de correção 376378 natureza 370375 padrões de 395399 reação exagerada 403404 Heterogeneidade 591 Hipótese alternativa 133 140 827 Hipótese bilateral 134135 Hipótese composta 133n 827 Hipótese da renda permanente 33 Hipótese de aceitação 139 Hipótese de expectativas racionais ER 627 Hipótese de mercado de capital eficiente 736 Hipótese de renda permanente de Friedman 166 Hipótese de renda permanente por ciclo de vida 33 Hipótese ER expectativas racionais 627 Hipótese mantida 133 474 Hipótese nula 133 139140 248 827 Hipótese nula zero 140 Hipótese simples 133 827 Histograma de resíduos 149150 Homocedasticidade premissa 4 87 370 I i subscrito 45 Identificação exata 688691 Identificação justa veja Identificação exata Identificação condição de posto de identificação 692693 694696 na metodologia de BJ 771772 regras para 692696 Impulsos 779 Imputar valores 497 Inclusão de variáveis irrelevantes 468 472473 517518 Independência estatística 802804 Índice condicional 347 Índice de preços ao consumidor IPC 45 46 52 Índice de utilidade 563 Inércia 417 Inferência estatística 31 Informação a priori 349350 Inovações 779 Instituições 619 Institute for research on poverty 898 Instituto Gallup 46 898 Integrado de ordem 2 740 Integrado de ordem d 740 Integrado de ordem l 740 Interação dummy 299300 Interação entre regressores 469 Intercepto 23 Intercorrelação medida de 330 Internal revenue service IRS 50 International trade administration 898 Internet 48 Interpolação 419 Intervalo aleatório 128 Intervalo de confiança conjunta 132 Intervalos de confiança 147 820 definição 128 e multicolinearidade 338 para β1 e β2 simultaneamente 132 para β2 130132 para σ2 132133 Inversão de matriz 840 IPC veja Índice de preços ao consumidor IRS Internal Receita Federal 50 J Jogo de maximização do coeficiente de determinação ajustado 221222 914 Econometria básica L LC veja Lucros corporativos Lei da gravidade 43 Lei da gravidade de Newton 43 Lei da regressão universal 39 Lei das expectativas iteradas 811 Lei de Ohm 42 Leptokurtic 812 Limiar GARCH TGARCH 793 Limite de confiança inferior 129 Limite de probabilidade plim 675 Limite superior de confiança 129 Limites de confiança 129 Linear no parâmetro premissa l 84 Linearidade 6263 de BLUE 93 dos estimadores de mínimos quadrados 112113 nas variáveis 62 nos parâmetros 63 Linha característica 154 166 721 Linha de regressão 40 Linha de regressão amostral 67 Linha de regressão populacional LRP 61 LMT Linha do mercado de títulos mobiliários 166 Logaritmos 200202 Logaritmos comuns 200 Logaritmos naturais 200 201 Lucros corporativos PC 732733 M Manipulação de dados 419 MAP veja Modelo de ajustamento parcial Matriz inversão 840 Matriz adjunta 843 Matriz de cofatores 843 Matriz de correlação 355 855 Matriz de dados 847 Matriz de identidade 836 Matriz de variânciacovariância 849 853854 871782 Matriz de variânciacovariância simétrica 849 Matriz diagonal 836 Matriz escalar 836 Matriz não singular 841 Matriz nula 836 Matriz quadrada 835 843 Matriz quadrada inversa 843844 Matriz simétrica 836 Matriz singular 841 Matriz unitária 836 Matrizes adjunta 843 cofator 843 definição 834 diagonal 836 escalar 836 identidadeunidade 836 igual 837 nula 836 posto de 842 quadrada 835 simétrica 836 vetor nulo 836 Matrizes iguais 837 Máxima verossimilhança MV 243 553 exemplo de 126 método de 122123 no modelo de regressão de duas variáveis 124126 MCE veja Mecanismo de correção de erro Modelos econométricos aplicações de 33 de consumo 28 de Klein 673 estimação de 29 exemplo de 28 seleção de 3334 MCRL veja Modelo clássico de regressão linear MCRLN veja Modelo clássico de regressão linear normal MEA veja Modelo de efeitos aleatórios Mecanismo de correção de erro ECM 758 Média do tempo ponderada por defasagem 623 Média móvel MM 439 440 770 Média móvel de ordem Q MMq 770 Média móvel de segunda ordem MM2 770 Média móvel primeira ordem MM1 770 Medição de volatilidade ARCH estiver presente 790 DurbinWatson d e efeito ARCH 790 em séries temporais financeiras 784785 exemplo da taxa de câmbio Estados UnidosReino Unido 785788 modelo GARCH 790 variações nos preços na bolsa de valores de Nova York 789 Medida de elasticidade 177179 Medida de estoque de moeda 157 Medida de taxa de crescimento 179180 MEF veja Modelo de efeitos fixos Melhor estimador linear não tendencioso 9394 424 823 872873 Melhores estimadores lineares 122 246n 823 Menor 842 Mesocúrtica 812 Método da descida mais íngreme 527 Método de busca direto 527 Método de duas etapas de Durbin 456 Método de informações completas 705 Método de linearização 535536 Método de linearização iterativa 527 Método de Marquard 528n Método de máxima verossimilhança de informações completas MVIC 706 Método de momentos MMO 106 822 Método de momentos generalizado GMM 822 Método de primeira diferença 443444 598 Método de variáveis dummy 301 303n 307308 Método de variáveis instrumentais IV 632633 Método HoltWinters 768 Método iterativo CO veja Método iterativo CochranOrcutt Método iterativo de GaussNewton 528 Método iterativo de NewtonRaphson 528 Método IV veja Método de variáveis instrumentais Método linear de Holt 768 Método livre de derivada 527 Método MQG factível MQSGF 447 448 Método MVIC máxima verossimilhança de informações completas706 Índice 915 Método NeweyWest 448 Método tentativa e erro 525527 Metodologia BJ veja Metodologia BoxJenkins Metodologia BoxJenkins BJ 767768 estimação do modelo ARIMA 776 etapas 771 identificação 772776 previsão 777778 sazonalidade 778 verificação de diagnóstico 777 Metodologia econometria tradicional 26 Métodos de equações simultâneas 705730 abordagens da estimação 705706 erros padrão dos estimadores MQ2E 729 exemplos 718719 mínimos quadrados de dois estágios 712715 mínimos quadrados indiretos 708711 modelos recursivos e MQO 706708 viés em estimadores de mínimos quadrados indiretos 728 Métodos de informação limitada 705 Métodos de suavização exponencial 767 Métodos estatísticos não paramétricos 752 Métodos iterativos 446447 Micronumerosidade 335 340 Micronumerosidade exata 335 Micropainel de dados veja Dados em painel Mínimos quadrados de dois estágios MQ2E 712715 729 Mínimos quadrados generalizados MQG 376378 441448 867868 Mínimos quadrados generalizados estimados MQEG 447 864 Mínimos quadrados indiretos MQI 685 708711 728 Mínimos quadrados não lineares MQNL 524 Mínimos quadrados ordinários MQO 48106 veja também Estimação de MQO Estimadores de MQO e experimentos de Monte Carlo 104105 e modelos recursivos 706708 exemplos 102104 método de 7983 MQG vs 378 precisãoerrospadrão 9193 premissas 8491 propriedade MELNT 872873 Qualidade do ajustamento 9599 teorema de GaussMarkov 7173 Mínimos quadrados ponderados MQP 378 393 412413 Mínimos quadrados recursivos MQRE 496 Mínimos quadrados restritos MQR 262264 480 870871 MINITAB 893894 MM veja Médias móveis MMG Método de momentos generalizado 822 MMO veja Método de momentos MNRL veja Modelo neoclássico de regressão linear Modelagem de dados contáveis 573576 Modelagem econométrica 466510 critério de seleção de modelo 467 491496 critério Cp de Mallows 493 critério de informação de Akaike 492 critério de informação de Schwarz 492493 critério R2 491 previsão quiquadrado 494 R2 ajustado 492 uma advertência sobre os critérios 494 dados ausentes em 497498 diretrizes para 509 discrepantesalavancagem influência em 494498 e propriedade de não tendenciosidade 481 erro de distribuição não normal em 507508 erros de especificação consequências de 469473 testes de 473481 tipos de 467469 erros de medida 481482 exemplo 483484 na variável dependente Y 481 na variável explanatória X 482 especificação de termo de erro estocástico 485 exemplos de 498507 mínimos quadrados recursivos em 496 modelos aninhado vs não aninhado 485486 teste de erros de especificação 473 teste de falhas de previsão de Chow 497 testes de hipóteses não aninhadas 486491 abordagem de discernimento 486 abordagem de discriminação 486487 teste F não aninhado 486487 teste J de DavidsonMacKinnon 488489 variáveis explanatórias estocásticas em 508 Modelo termo 27 Modelo abrangente 466 Modelo ARCH veja Modelo de heterocedasticidade autorregressiva condicional Modelo ARIMA veja Modelos de média móvel autorregressivos integrados Modelo clássico de regressão linear MRLC definição 37 e experimentos Monte Carlo 104105 exemplos de 99104 precisãoerrospadrão 9193 premissas 8491 106 325328 problemas de aplicação 328 qualidade do ajustamento 9599 teorema de GaussMarkov 9395 Modelo de acelerador de investimento 618 Modelo de acelerador de macroeconômico 682 Modelo de acelerador flexível 628 Modelo de ajustamento parcial MAP 627629 916 Econometria básica Modelo de ajuste de estoque 628 Modelo de coeficientes constantes veja Modelo de regressão MQO Combinados Modelo de componentes de erro veja Modelo de efeitos aleatório Modelo de correlação serial 655 Modelo de crescimento logístico 530 Modelo de defasagem distribuída de Almon 640647 Modelo de defasagem distribuída finita 619 Modelo de defasagem distribuída V invertido 658 Modelo de defasagem infinito 619 Modelo de efeito fixo MEF 592 602603 Modelo de efeito fixo bidirecional 594 Modelo de efeitos aleatórios REM 598602 Modelo de elasticidade constante 178 Modelo de equação única 27 Modelo de equações múltiplas 27 Modelo de expectativas adaptativas 625627 629 Modelo de formação de preços de ativos CAPM 165166 512513 720721 Modelo de gastos públicos de PindyckRubinfeld 698699 Modelo de heterocedasticidade autorregressiva condicional ARCH 449450 767 da taxa de inflação dos norteamericana 791792 na medida de volatilidade 784 787788 Modelo de heterocedasticidade autorregressiva condicional generalizada GARCH 450 767 790 Modelo de mercado da teoria da carteira 166 167 Modelo de multiplicador de Lagrange LM 672 Modelo de passeio aleatório MPA 735736 Modelo de probabilidade linear MPL 540545 alternativas ao 549550 aplicações de 545549 ausência de normalidade dos termos de erro 541 definição 540 efeito da variação unitária no valor do regressor 567568 exemplo 543545 impossibilidade de satisfazer 0 e 1 542 qualidade do ajustamento 542543 variâncias heterocedásticas dos termos de erro 541542 Modelo de regressão aparentemente não relacionado 595 779 Modelo de regressão BoxCox 203 Modelo de regressão com duas variáveis 165204 e erro estocástico 190192 e escalaunidades de medição 172175 em variáveis padronizadas 175177 estimação de intervalo 128130 intervalos de confiança 130132 prérequisitos estatísticos 128 exemplo hipotético 3437 medição de crescimento 179182 medição de elasticidade 177179 modelos funcionais de 176 modelo loglinear 177179 modelos recíprocos 183189 modelos semilog 179183 problema de estimação 78117 coeficiente de determinação r2 9599 exemplos 102103 experimentos Monte Carlo 104105 método mínimos quadrados ordinários 7883 modelo de regressão linear clássico 8491 precisãoerrospadrão 9193 teorema de GaussMarkov 9395 regressão que passa pela origem 165171 teste de hipótese 133143 abordagem intervalo de confiança 134135 abordagem teste de significância 135139 aceitaçãorejeição de hipótese 139 escolha do nível de significância 141 formação de hipótesenula alternativa 140141 hipótese zero nula regra 2t 140 nível exato de significância 142 significância estatística vs prática 142143 Modelo de regressão de Poisson 573576 Modelo de regressão de três variáveis coeficiente de correlação múltipla 214 coeficiente de determinação múltiplo 213214 coeficientes de regressão parcial 207209 estimação coeficientes parciais de regressão 209212 exemplo 214215 função de produção de CobbDouglas 222224 interpretação da equação de regressão 207 notaçãopremissas 205207 R2 ajustado 217222 variáveis padronizadas regressão com 215216 viés de especificação 216217 Modelo de regressão exponencial 177 Modelo de regressão linear com duas variáveis 37 Modelo de regressão linear de variável K 846848 Modelo de regressão linear gaussiano veja Modelo clássico de regressão linear Modelo de regressor estocástico 85 326327 Modelo de tendência linear 181 Modelo de variável dummy de mínimos quadrados LSDV 592595 Modelo de vetores autorregressivos VAR 648 650 767 769 aplicação na economia do Texas 784 causalidade 781783 dados de séries temporais 778 Índice 917 estimação 779780 previsão 780781 problemas 783784 Modelo demanda e oferta 668669 Modelo duplolog 177 Modelo GARCH veja Modelo de heterocedasticidade autorregressiva condicional generalizada Modelo GARCHM GARCH na média 793 Modelo Glogit veja Modelo logit agrupado Modelo Gprobit veja Modelo probit agrupado Modelo I de Klein 673 719720 Modelo IS multiplicador de Lagrange 671 Modelo IS da macroeconomia 671672 Modelo Keynesiano de determinação de renda 669670 Modelo Koyck 621625 combinação de expectativas adaptativas e modelos de ajustamento parcial 629630 defasagem média mediana 623 e modelo de ajustamento parcial 627629 e modelo de expectativas adaptativas 625627 uso de exemplo 623625 627 modelo linlog 179 182183 Modelo log hipérbole 189 Modelo logarítmico recíproco 189 Modelo logit 550555 agrupado 555558 dados não agrupados 558563 efeito da variação unitária no valor do regressor 567568 estimação de 552555 estimação ML 552555 multinomial 576577 ordinal 576 probit vs 567 Modelo logit agrupado glogit 555558 Modelo loglin 179183 Modelo loglinear 272273 Modelo loglog 177178 Modelo matemático de consumo 27 Modelo MQVD veja Modelo de mínimos quadrados de variável dummy Modelo MQVD de efeito fixo 592595 Modelo neoclássico de regressão linear MNRL 87 Modelo normal de regressão linear clássico MNRLC 118123 definição 37 distribuição de probabilidade dos termos de erro 118119 método da máxima verossimilhança 122 premissa da normalidade 119120 Modelo Probit 563568 com dados agrupados 564567 com dados desagrupados 567 efeito de variação unitária sobre o valor do regressor em 567 estimação ML 585586 logit vs 568570 multinomial 576 ordinal 576 Modelo probit agrupado gprobit 564567 Modelo regressão múltipla 37 Modelo St Louis revisado 722723 Modelo SURE veja Modelo de regressão aparentemente não relacionada Modelo Tobit 570573 Modelo triangular de defasagem distribuída aritmético 655 Modelos de regressão 176 BoxCox 203 e erro estocástico 190191 medição de crescimento 179182 medição de elasticidade 177179 modelo loglinear 177179 modelos recíprocos 183189 modelos semilog 179182 Modelos de regressão linear 63 estimação de 524525 exemplo de 28 loglinear vs 272273 não linear vs 523524 Modelos ANCOVA veja Análise de modelos de covariância Modelos aninhados 485 Modelos ANOVA veja Análise de modelos de variância Modelos AR veja Modelos autorregressivos Modelos causais veja Modelos recursivos Modelos de aprendizagem de erro 371 Modelos de autorregressão AR 435 489 614 769770 detectando a autocorrelação em 633634 estimação de 630631 exemplos de 635640 método de variáveis instrumentais 632633 Modelos de dados em painel 587 algumas solicitações 602603 estimador de efeito fixo dentro do grupo 595598 estimadores propriedades de 605 exemplos 589590 modelo de efeitos aleatórios 598602 modelo de regressão MQO combinados 590592 modelo LSDV de efeito fixo 592595 vantagens 588 variáveis dummy 296 Modelos de defasagem distribuída 487 489 614 620625 640647 Modelos de desequilíbrio 309 Modelos de despesas de Engel 182 Modelos de duração 577578 Modelos de equações simultâneas 667682 exemplos 668673 natureza 667668 Modelos de média móvel autorregressivos integrados ARIMA 767771 da taxa de câmbio yendólar 791 estimação de 776 Modelos de regressão com mudança SRM 306n 309 Modelos de regressão de equação única 49 768 Modelos de regressão de equações simultâneas 768 Modelos de regressão intrinsecamente não lineares 524525 Modelos de regressão não linear MRNL 6263 523532 estimação 525 exemplos 528532 linear vs 523524 método da busca direta 527 918 Econometria básica método da tentativa e erro 525527 método de linearização iterativo 527528 otimização direta 527 Modelos de regressão variável dependente limitada 571 Modelos de resposta qualitativa 550598 modelo de probabilidade linear 540545 modelo de regressão Poisson 573576 modelo logit 550552 585586 modelo probit 563568 modelo tobit 570573 modelos de duração 577 modelos multinomiais 576 modelos ordinais 576 natureza 538539 variação unitária no valor do regressor 567 Modelos de variável dependente dicotômica 309 Modelos dinâmicos de regressão 420 614 Modelos multinomiais 576 Modelos não aninhados 485486 Modelos Normit veja Modelo Probit não são estatisticamente significativos 135 Modelos ordinais 576 Modelos recíprocos 183189 Modelos recursivos 706708 Modelos semilog 179183 Modelos teóricos A 783 Modelos triangulares 706 707 713n Momento 106 Momentos altos de distribuição de probabilidade 811812 MPL veja Modelo de probabilidade linear MPR veja Modelo de passeio aleatório MPS propensão marginal a poupar 238 MQ2E veja Mínimos quadrados de dois estágios MQG veja Mínimos quadrados generalizados MQGE mínimos quadrados generalizados estimados 864 MQGF veja Método MQG factíveis MQI veja Mínimos quadrados indiretos MQNL mínimos quadrados não linear 525 MQO veja Mínimos quadrados ordinários MQP veja Mínimos quadrados ponderados MQRE mínimos quadrados recursivos 496 MQRL veja Mínimos quadrados restritos Estimação robusta 328n Mudanças estruturais teste de 266271 752753 Multicolinearidade 329358 alta mais imperfeita 334 consequências práticas 336340 intervalos de confiança 339 micronumerosidade 340 razões t 338339 sensibilidade a pequenas alterações nos dados 339340 variância do estimador de MQO 210211 consequências teóricas 334335 definição 330 detecção 345349 efeitos da 353 exemplo 341345 exemplo de dados de Longley 354 fatores 332 medidas corretivas 349353 não fazer nada 349 procedimentos de regra prática 349353 natureza da 330332 perfeita 332334 premissa de ausência 206 Multicolinearidade perfeita 332334 Multiplicação matriz 838840 Multiplicação de matriz 838 Multiplicação escalar 837 Multiplicador da renda M 32 Multiplicador de curto prazo 615 Multiplicador de defasagem distribuída 616 Multiplicador de longo prazo 616 Multiplicadores de impacto 615 685 MV veja Máxima verossimilhança N N número de observações 44 Não estacionários 735 753755 Não fazer nada 349 Não há autocorrelação entre termos de erro premissa 5 8889 Não viesado 517518 822 827 de estimadores mínimos quadrados 112113 de MELNT 93 premissa 205 372 National Bureau of Economic Research NBER 897 National trade data bank 898 Navalha de Occam 66 NBER National Bureau of Economic Research 897 NID distribuição normal e independente 119 Nível crítico 563 Nível de significância 128 820 829 escolha 141 exato 142 na presença de garimpagem de dados 474475 Nível de significância nominal 473474 Nível de significância verdadeiro 474475 Nível exato de significância valor p 142 831 Nível limiar 563 NLRM modelo neoclássico de regressão linear 85 Nó conhecido como antemão 306 Normalidade premissa 10 246247 para termos de erro 118 propriedades dos estimadores de MQO sob 120122 razões para usar 119120 Normalidade assintótica 827 Normit 565 NPP veja Gráfico de probabilidade normal Number crunching 474 O Omissão de uma variável relevante 468472 Omissão de variáveis 475481 Operações matriciais 837840 inversão 840 multiplicação 838 multiplicação escalar 837 Índice 919 soma 837 subtração 837 transposição 839840 Operador de defasagem 738n Operador de primeira diferença 420 Operador de produto O 797 Operador de somatória 796 Operador de somatório duplo SZ 796 Ordem 834 Otimização direta 527 P Padrão de hamburger 159 Painel balanceado 48 589 Painel curto 589 Painel de dados 4748 Painel desbalanceado 48 589 Painel longo 598 Parâmetro de deslocamento 737 Parâmetros 27 Parâmetros de cointegração 756 Parâmetros de sujeira 592 Parcimônia 66 Paridade do poder de compra PPC 158 Participação da força de trabalho PFT 74 538 546547 868 Passeio aleatório puro 739 PDL veja Defasagem distribuída polinomial PED veja Processos estacionários de diferença Pesquisas de opinião do Instituto Gallup 46 PFT veja Participação da força de trabalho PGD Processo gerador de dados 732 PIB veja produto interno bruto Platicúrticas 812 Plim limite de probabilidade 675 Plotagem sequêncial do tempo 432 PMC veja Propensão marginal a consumir PNB produto nacional bruto 26 Polinômios ortogonais 353 Ponto de influência 495 Pontos amostrais 797 População 59 809 Porcentagens logaritmos e 202 Pósmultiplicado 838 Posto de uma matriz 842843 PPP paridade do poder de compra 158 PR regressão populacional 62 Precedência 648 Precisão 9193 Precisão dos dados 50 Preços do ouro110 Premissas de MCRL 8491 206 325328 ausência de viés de especificação premissa 9 206 235 desrespeito 106 distribuição normal premissa 10 325 327 em notação matricial 848849 especificado corretamente premissa 9 466 homocedasticidade premissa 4 8788 independentes do termo de erro premissa 2 8485 linear nos parâmetros premissa 1 84 não há autocorrelação entre os termos de erro premissa 5 8889 não há de colinearidade premissa 8 206 observações e parâmetros premissa 6 89 valor de média zero hipótese 3 86 327 valores fixos premissa 2 8485 326327 variabilidade dos valores de x premissa 7 89 Prémultiplicado 838 Préteste 747 Previsão com regressão múltipla 271 formulação de matriz 858859 individual 147148 164 média 146147 variância de 858 Previsão da taxa de graduação 581582 Previsão de classificação de um título 548 Previsão econômica 767769 Previsão fora da amostra 491 Previsão individual 147148 164 858 Previsão média 146147 163164 858589 Previsão quiquadrado 494 Previsão ARIMA 468 econômica 767769 na metodologia de BJ 778 regressão de equações simultâneas 768 suavização exponencial 767 VAR 769 780781 Principio abrangente 488 Princípio da analogia 106 822 Princípio KISS 509 PRL veja Linha de regressão populacional Probabilidade 797798 Probabilidade de cometer erro do Tipo I 129n 141 Problema de estimação 819 Problema de heterogeneidade 46 Problema de identificação 665 683696 definição 686 identificação exata 688691 notaçõesdefinições usadas em 683686 subidentificação 686688 superidentificação 691692 Problema de raiz unitária 738 Processo de autorregressivo e médias móveis ARMA 770 Processo de Poisson 539 Processo de ruído branco 735 Processo de ruído branco gaussiano 735 Processo de tendência estacionária PTE 739 Processo de tendência estacionária 754755 Processo gerador de dados PGD 732 Processo iterativo 526 Processo puramente aleatório 735 Processos de tendência estacionária estocástica TE 739740 Processos estacionários de diferença PED 739 753 Processos estocásticos 734738 estacionários 734735 integrados 740741 não estacionários 735736 raiz unitária 748 tendência estacionáriadiferença estacionária 739740 Processos estocásticos de diferença estacionária DE 739740 920 Econometria básica Processos estocásticos de raiz unitária 738 Processos estocásticos DS veja Processos estocásticos de diferença estacionária Processos estocásticos estacionários 734735 Processos estocásticos integrados 740741 Processos estocásticos não estacionários 735738 Processos integrados 740741 Processos TE estocástica veja Processos de tendência estacionária estocástica Produção CES veja Elasticidade constante de substituição Produção elasticidade de substituição constante CES 34 524 Produtividade 109 604606 Produto interno bruto PIB 2931 111 732733 Produto nacional bruto PNB 26 Propensão marginal a consumir PMC 27 29 40 102 Propensão marginal a poupar PMP 268 Propósitos de política modelo usado para 32 Propriedade associativa 839 Propriedade comutativa 838 Propriedade de invariância 826 Propriedade de Slutsky 826 Propriedade finita 95 Propriedade reprodutiva 161 Propriedades assintóticas 95 116 824 Propriedades das amostras grandes 116 824827 Propriedades de amostras pequenas 822824 Propriedades estatísticas 81 91 Propriedades numéricas dos estimadores 81 Psicologia 618 PSID Estudo de Painel da Dinâmica da Renda 587 PTE Processo de tendência estacionária 739 Publicações da CIA 897 Q Qualidade dos dados 50 Qualidade do ajustamento 9599 542543 Quaseequação de diferença generalizada 443 Quebras estruturais 752 Quedas geriátricas 574576 R R2 ajustado 492 r2 bruto 168 Razão de chances 551 Razão inversa de Mills 572 Razão Von Neumann 454 Razões T 338339 345 Realização de possibilidades 734 Recursos da World Wide Web 897898 Recursos estatísticos na Web Economia 898 Recursos para economistas na Internet 897 Redução de determinante 841 Região de aceitação 136 Região de aceitação 829 Região de rejeição 136 Regiões críticas 136 829 Regra de multiplicação linha por coluna 838 Regra prática 2t 140 Regra prática de Klien 347 Regressando 44 Regressando nominal 538 Regressão software 35 Regressão bivariada veja Análise regressão de duas variáveis Regressão combinada 269 Regressão de cointegração 756 Regressão de corte transversal 282 Regressão de séries temporais 282 Regressão dissimilar 296 Regressão espúria 731 741742 747748 Regressão histórica 146 Regressão linear sementada 305307 Regressão múltipla coeficientes de correlação parcial 228229 estimação de máxima verossimilhança 243 modelos de regressão polinomial 225228 modelos linear vs loglinear 272273 premissa de normalidade 246247 previsão com 271 problema de estimação 205230 problema de inferência 246274 teste da estabilidade estrutural parâmetro 266271 teste da razão de verossimilhança 286287 teste da significância geral 250259 ANOVA 251 contribuição incremental da variável explanatória 256259 em termos de R2 255256 relação entre R2 e F 254255 teste F 251253 teste de hipótese sobre coeficientes de regressão individual 248250 com testes LRWLM 271272 formas de 247248 teste de igualdade de coeficientes de duas regressões 259261 teste de restrições de igualdade linear 261 abordagem teste F 262266 abordagem teste t 261 coeficiente de correlação múltiplo 214 coeficiente de determinação múltiplo 213214 coeficientes parciais de regressão 207209 estimação dos coeficientes de regressão parcial 209212 exemplo 214215 função de produção de CobbDouglas 222224 interpretação da equação de regressão 207 modelo de três variáveis R2 adjusted 218222 notaçãopremissas 205207 variáveis padronizadas regressão de 215216 viés de especificação 216217 Regressão polinomial 225228 Regressão populacional PR 62 Regressão por etapas para frente 354 Regressão por etapas para trás 300 Regressão Ridge 353 Regressão sem sentido 731 Regressão universal lei da 39 Regressão usando variáveis padronizadas 869 Índice 921 Regressão em variáveis padronizadas 175176 origem histórica do termo 39 passando pela origem 165171 Regressão para mediocridade 51 Regressões auxiliares 346 Regressões coincidentes 296 297 Regressões concorrentes 296297 Regressões paralelas 296 Regressões semilogarítmicas 307308 323 Regressor 44 Regressores estritamente exógenos 467 Regressores fixos 85 326327 508 Regressores fracamente exógenos 467 Rejeição de hipótese 139 Relação determinística 28 42 Relação exata 28 Relação linear exata 849 Relações estatísticas 42 Remoção de tendência 740 Renda pessoal disponível RPD 732733 Resíduos 68 446 476 Resíduos padronizados 432 Resíduos padronizados 432n Resíduos recursivos 496 Restrições endpoint 646 Reversão média 735 RPD veja Renda pessoal disponível S Sazonalidade 778 Semanais 45 Semielasticidade 180 Sentido amplo processo estocástico 734 Séries temporais 300 Séries temporais cointegradas 755758 Séries temporais da economia americana 732 Séries temporais de passeio aleatório 745 Séries temporais determinísticas 739 Séries temporais estacionárias 731 Séries temporais estocásticas 739 Séries temporais integradas 741 Séries temporais LPIB 744745 Séries temporais sem tendência 754 Significância estatística de coeficientes de autocorrelação 746748 prática vs 142143 Significância prática estatística vs 143 Slope drifter veja Coeficiente angular diferencial Sobreespecificação de modelo 472473 Social security administration 898 Soma de matrizes 837 Soma de matrizes 837 Soma dos quadrados dos resíduos SQR 91 96 Soma dos quadrados dos resíduos irrestrita SQSIR 269 Soma dos quadrados dos resíduos restrita SQRR 269 Soma dos quadrados explicada SQE 96 Soma dos quadrados total SQT 96 SQR veja Soma dos quadrados dos resíduos SQRNR veja Soma dos quadrados dos resíduos não restrita SQRR veja Soma dos quadrados dos resíduos restrita SQT Soma dos quadrados total 96 SRM veja Modelos de regressão switching STATA 895896 Suavização exponencial 767 Subdiferenciação 754 Subespecificação 469472 Subestimou 32 Subidentificação 686688 Submatriz 835 Subtração matriz 837 Subtração de matriz 837 Superdiferenciação 754 Superidentificação 691692 T T número total de observações 45 t subscrito 4445 Tabela ANOVA 144145 Tabelas estatísticas 875890 áreas sob distribuição normal padronizada 875 estatística d de DurbinWatson 885886 pontos percentuais da distribuição t 876 pontos percentuais superiores da distribuição de χ2 883884 pontos percentuais superiores da distribuição t 877892 valores críticos de 1 e 5 do t de DickeyFuller e valores críticos de runs em testes run 889890 valores F para testes de raiz unitária 890 Tamanho da amostral 797 Tamanho do teste estatístico 129n dos testes de raiz unitária 752 Taxa de assessoria em fundos mútuos 528529 Taxa de crescimento instantânea vs composta 181 Taxa de crescimento composta 181 Taxa de crescimento instantânea 181 Taxa de crescimento percentual 178n Taxa de desemprego civil CUNR 891 Taxa de inflação dos norte americanos 791792 Taxa de participação da força de trabalho civil CLFPR 891 892 894896 Taxa de risco Hazard 572 Taxas de juros e Federal Reserve 638 e investimentosvendas 660 e moeda 650 e moeda PIBIPC 703 Técnica de componentes principais 353 Técnica de estimação SURE de Zellner 708n Técnica diferencial de intercepto dummy 593 Tela de resultado 891896 EViews 891893 Excel 894895 MINITAB 893894 STATA 895 Tendência veja também Não tendencioso autosseleção 498 em estimadores de mínimos quadrados indiretos 728 equaçãosimultânea 673677 erro de medida 468 922 Econometria básica especificação veja Tendência de especificação especificação de modelo 466 especificação de variável excluída 418 préteste 221 Tendência crescente 181 Tendência decrescente 181 Tendência determinística 739 Tendência determinística com componente estacionário AR 1 740 Tendência estacionária 739 Tendência estocástica 736 739 Tendências 45 Teorema de FrischWaugh 305 Teorema de GaussMarkov 9395 Teorema de Kruskal 380n 425 Teorema de representação de Granger 758 Teorema de Taylor 535536 Teorema de Weierstras 641 Teorema do limite central CLT 119 507 814 Teoria clássica da inferência estatística 118 Teoria das amostras grandes 508 Teoria de análise de custo 166167 Teoria econômica 26 Termo de erro 28 8485 Termo de erro da equação 481 Termo de erro estocástico 64 90191 485 Termo de interação 275 546 Termo idiossincrático 599 Termos de erro ausência de normalidade 541 distribuição de probabilidade 118119 Premissa de não autocorrelação entre 8889 variâncias heterocedásticas 541542 Termos futuros 661 Teste ADF veja Teste de DickeyFuller aumentado Teste BG veja Teste BreuschGodfrey Teste Chow 268271 296298 309 496497 Teste d de DurbinWatson 435439 Teste d modificado 438 Teste da razão de verossimilhança LR 271272 286287 Teste de BerenbluttWebb 445 Teste de BreuschGodfrey BG 438441 Teste de BreuschPagan BP 601 Teste de BreuschPaganGodfrey BPG 389390 393 Teste de causalidade de Granger 648652 Teste de causalidade de Sims 647n Teste de causalidade de WienerGranger 648n Teste de cointegração 756757 Teste de correlação por ordem de Spearman 385390 Teste de DickeyFuller DF 749751 753 890 Teste de DickeyFuller aumentado DFA 749751 Teste de DickeyPantula 753 Teste de EngleGranger EG 757758 Teste de EngleGranger aumentado EGA 756757 Teste de Geary veja Teste runs Teste de geral significância ANOVA 251253 contribuição incremental da variável explanatória 256259 em termos de R2 255256 individual vs conjunta 253 na regressão múltipla 251259 relação R2 e F 254255 teste F 253254 Teste de Glejser 354 399 400 Teste de GoldfeldQuandt 386388 393 Teste de Hausman 599 677 697698 Teste de heterocedasticidade geral de White 391 400 402 Teste de hipótese 133134 827833 abordagem intervalo de confiança para 134 abordagem teste de significância 135139 832833 aceitar ou rejeitar hipóteses 139 escolher abordagem 143 escolher nível de significância 142 formação de hipótese nula alternativa 142141 hipótese nula zero e regra prática 2t 139140 na regressão múltipla 247248 271 na teoria clássica da inferência estatística 118 nível exato significância 142 significância estatística vs prática 142143 sobre coeficientes de regressão individuais em notação matricial 855856 Teste de hipótese bicaudal 134135 Teste de hipótese de intervalo de confiança 134135 143 827831 Teste de hipótese unicaudal 135 Teste de igualdade de coeficientes de duas regressões 259261 Teste de multiplicador de Lagrange LM 271272 480481 veja também Teste BreuschGodfrey Teste de normalidade de AndersonDarling 150 Teste de Park 383384 399400 Teste de raiz unitária de Phillips Perron PP 752 Teste de resíduos recursivos 271 Teste de restrições de igualdade linear 261266 abordagem teste F 262266 abordagem teste i 262 Teste de Sargan 663 Teste de significância 135138 838839 ANOVA em notação matricial 856857 geral veja Teste de significância geral intervalo de confiança vs 143 teste 135138 teste χ2 138139 Teste de significância bicaudal 137 Teste de significância unicaudal 137138 Teste de simultaneidade 697699 Teste de Wald 271272 309n Teste DF veja Teste de DickeyFuller Teste EG veja Teste EngleGranger Teste EGA veja Teste EngleGranger aumentado Teste estatístico 135 827 Teste F abrangente 486487 Teste F geral 264266 857 Teste F não aninhado 486487 Teste F adição de nova variável 259 Índice 923 adição de um grupo de variáveis 259 com notação matricial 857 de restrições de igualdade linear 261266 teste de significância geral 251253 testes de raiz unitária de dados de series temporais 751 Teste h de Durbin 633634 Teste J 488490 Teste J de DavidsonMacKinnon 488491 Teste JarqueBera JB 150 151 815 Teste KB veja Teste KoenkerBasset Teste KoenkerBasset KB 392393 Teste LM veja Teste de multiplicador de Lagrange Teste M de Durbin 441 Teste MWD 272278 Teste quiquadrado 138139 Teste quiquadrado de significância 139 Teste RESET de Ramsey 479481 Teste RV veja Teste de razão de verossimilhança Teste T 135138 261 Teste t de Student 749 Teste unilateral 135 Teste Z 832 Testes de causalidade 731 Testes de exogeneidade 699 Testes de hipótese não aninhada 486491 abordagem discernente 486488 abordagem discriminatória 486 teste F não aninhado 486488 teste J de DavidsonMacKinnon 488489 Testes de hipótese não aninhado 488491 abordagem discernente 486487 abordagem discriminatória 486 teste F não aninhado 486487 teste J de DavidsonMacKinnon 488491 Testes de normalidade 149151 gráfico de probabilidade normal 150 histograma de resíduos 149150 teste de JarqueBera 150151 Testes de raiz unitária PP PhillipsPerron 752 Testes de raiz unitária crítica 752753 teste de DickeyFuller aumentado 751 teste F 751752 valores críticos de 1 e 5 do t de DickeyFuller e valores F 890 dados de séries temporais 748749 PhillipsPerron 752 testando as mudanças estruturais 752 Testes dos erros de especificação 473475 Testes não paramétricos 433n Texas economia aplicação 784790 TGARCH limiar GARCH 793 Tipo contável 573 Tolerância 347 Transformação BoxCox 531 Transformação de dados 420 Transformação de Koyck 622 Transformação de raiz quadrada 396 Transformação de variáveis 351352 Transformação populacional 531 Transformação PraisWinsten 443 Transposição matriz 834 835 Transposição de matriz 839840 U Unidades de medição 175 Universidade de Michigan 46 V Vago da teoria 65 Validade de instrumentos 663 Validade de instrumento 663 Valor esperado 59n 60 61 804806 Valor esperado condicional 60 Valor esperado incondicional 60 Valor estimado 29n Valor médio 59n Valor médio de ui zero premissa 3 86 Valor p 831 Valores críticos 129 136 829 Valores críticos de LeamerSchwarz 831 Valores críticos de t e F para testes DickeyFuller de raiz unitária 890 Valores críticos de χ2 133 Valores defasados 419 Valores fixos premissa 2 84 326327 Valores t críticos 137 Valores t críticos de runs em tabela de teste runs 889890 VAR modelo veja Modelo de autorregressão vetorial Variabilidade dos valores de X premissa 7 89 Variação variância vs 95n Variação absoluta 178n Variação de uma unidade em mais de um regressor 215216 567 Variação percentual 178n Variação relativa proporcional 178n Variância condicional da distribuição de probabilidade 809811 Variância constante de u premissa 4 87 Variância de amostra Variância mínima 115116 822823 Variância de densidade de probabilidade 806 de estimadores de mínimos quadrados 113 de estimadores de MQO 210211 de previsão individual 164 859 de previsão média 163164 858 variação vs 95n Variâncias heterocedásticas 541542 Variáveis aleatória contínua 798 Variáveis aleatórias 798 Variáveis aleatórias discreta 799 Variáveis cointegradas 756 Variáveis de controle 33 294 Variáveis dummy alternativa teste de Chow 296298 como variáveis dependentes 309 definição 298 diretrizes para uso 292293 e autocorrelação 309 449 e heterocedasticidade 308309 efeitos de interação usando 299300 924 Econometria básica em modelo de regressão com dados em painel 307 em modelos ANCOVA 294295 em modelos ANOVA 293294 em regressão linear segmentada 305307 exemplo de 310314 natureza das 288289 para análise sazonal 300305 regressões semilogarítmicas 307308 323 tópicos de estudo 309310 Variáveis endógenas 651 667 Variáveis endógenas defasadas 684 Variáveis estritamente exógenas 590 598 Variáveis exógenas 667n Variáveis explanatórias estocásticas 508 Variáveis explanatórias ortogonais 361 Variáveis falsas 595 Variáveis instrumentais 483 Variáveis irrelevantes e propriedade de não tendenciosidade 517518 inclusão 468 472473 testes 418 Variáveis nuisance 595 Variáveis padronizadas 175176 200 215 Variáveis predeterminadas 684 Variáveis proxy 483 510 Variáveis escalas de medição 51 exclusão 351 ortogonal 361 padronizadas 200202 transformação 351352 Variável estocástica aleatória 28 42 Variável binária 538 Variável de previsão 31 Variável de resposta binária 539 Variável dependente 27 39 44 309 Variável dependente policôtoma 309 Variável dicotômica 538 Variável explanatória 27 37 43n 44 256258 Variável independente 27 Variável invariante no tempo 591 Variável latente 563 599 Variável meta 33 Variável não observável 599 Variável normal padronizada 813 Variável policôtoma 539 Variável previsora 31 Variável relevante omissão de 468469 Variável tricotômicas 539 Variável variante no tempo 592 Verificação de diagnóstico 777 Vetor coluna 834 Vetor de MQO 584 Vetor nulo 836 Viés de autosseleção 498 Viés de equações simultâneas 673676 Viés de especificação 86 e multicolinearidade 353 forma funcional incorreta 419 na regressão múltipla 216217 variável excluída 418 Viés de especificação de modelo 466 Viés de préteste 221n Viés erros de medição 468 Visão Ballentine 95 Volatilidade 784785 W World fact book 897 X X variável explanatória 44 independência da 84 variabilidade dos valores 89 Y Y variável dependente 44