·
Ciências Econômicas ·
Econometria
Envie sua pergunta para a IA e receba a resposta na hora
Recomendado para você
23
P1 - Econometria 1 2022-1
Econometria
UFF
51
Apostila Econometria 2020
Econometria
UFF
2
Exercícios Laboratório 5 - Econometria 2022-2
Econometria
UFF
3
Lista 2 - Econometria 1 2022-1
Econometria
UFF
2
Teste - Regressão - Econometria - 2023-1
Econometria
UFF
5
Lista 4 - Econometria 1 2022-1
Econometria
UFF
4
Questões Listas Anteriores - Econometria 2022 2
Econometria
UFF
7
Exercícios - Econometria - 2023-2
Econometria
UFF
3
Lista 3 - Econometria 1 2022-1
Econometria
UFF
4
Propriedades dos Estimadores de Mínimos Quadrados 2022-1
Econometria
UFF
Texto de pré-visualização
Inferencia no Modelo Normal de Regressao Linear Multipla Diogo Braga 22 de Abril de 2021 Fatos Gerais: Yt = Bit BoXi2+...+ BeXie t+ € e, ~ N(0,07) Utilizando a abordagem matricial, temos: Y=XB+e e~ N(0,071) Hipdteses basicas do modelo normal de regressao linear multipla: e Nao autocorrelagao serial: E(¢;,€;) =O Vij e Homocedasticidade: Var(e) = 0? Vt e Varidveis independentes nao estocasticas e Cov(e, Xx.) =OVt,k e Auséncia de Multicolinearidade: Nao ha relacao linear exata entre as varidveis independentes A partir dessas hipdéteses, obtivemos: ° 8; ~ N(Gj,0°(X7X)"1) e 8 é0 melhor estimador linear nao tendencioso e o2 é estimador viesado de o?. Construfmos $2 = ere em que k é60 numero de {’s no modelo e n é 0 nimero de observacoes. Além disso, sabemos, naturalmente, que SQR = e’e = )-e?. 1 Faculdade de Economia - UFF Prof: Diogo Braga 0 L =k TY? —~kéont d de liberdade d 3 X74 Em que n é o nimero de graus de liberdade da distribuicao chi-quadrado. e No modelo miltiplo, faz mais sentido o uso de R2 = R? — &—(1 —R?), Para testar o modelo de regressao multipla, basta utilizarmos suas hipdteses basicas, além dos resultados de inferéncia que obtivemos subsequentemente. 1. Teste Simples para {; Nesse tipo de abordagem testamos isoladamente cada um dos 6;, j = 1,...,k. Ho : Bj =0 A, : Bj tx 0 Naturalmente a hipdtese alternativa depende da conveniéncia do mo- delo, podendo ser também de desigualdade. -> Regra de decisao B;-B; “Sy ~ th—k Em testes bilaterais, basta dividir o nivel de significancia @ por 2. Temos um intervalo de confianga para 3; de Bj — tn—p,238g, < Bj < Bj + tn—b1—9}84, para cada j € {1,...,k}. 2. Testes sobre a significancia de um subconjunto de varidveis explicativas Agora queremos testar a significancia de um subconjunto de (’s, da seguinte forma: Ao: Bp41 = Bpt2 =... = Be =0 Hy, : Nem todos os (’s sao iguais a zero Essa hipdtese pode ser descrita de outra forma: Ho : Modelo Restrito : y = 61 + GoXi2 +... + BpXtp + & Hy, : Modelo Irrestrito : y = 8; + yey By Xu +e -> Regra de decisao 2 Faculdade de Economia - UFF Prof: Diogo Braga — (SQRur—-SQRur)/k-p P= SORa [nk ~ F'R—p.n—k} Rejeitamos Ho quando F' > fx_pn—k,a- Ou seja, quando a retirada de informacao aumenta substancialmente a soma dos quadrados dos residuos, tenho evidéncias para rejeitar a hipdtese nula associada ao Modelo Restrito. Como observacao, vale a pena deixar claro que SQRyr ~ Xi» e SQRur ~ x2 E possivel provar que se X; ~ x}, e XQ ~ X75 X,+X2 ~ x2,4;,- Assim, o numerador referente a F tem distribuicao 2 _ 2 X{(n—p)—(n—k)} ~ Xk—p" 3. Teste sobre a significancia de todas as varidveis explicativas Nesse caso temos um teste com a seguinte forma: Ho : 82 = 63 =... = By =0 Hy, : Nem todos os (’s sao iguais a zero Esse teste 6 um caso particular do teste anterior. O Modelo Restrito, da forma como descrevemos anteriormente, passa a ter apenas {; como explicacao para as variagoes de y,. Em outras palavras Ao: yr = Pit & Fy: yy = Bi + oy BX + -> Regra de decisao Fe (SQRur —SQRyutr)/k—-1 _ (SQT — SQRm1)/k-1 SQRur/n—k SQRur/n—k — SQE/k—-1 F ~ SQRuz/n—k {kh Ln—k} Uma vez mais, rejeitamos Ho se F > frp_—1.n—k,a}, para um dado nivel de significancia. Note que SQRyr ~ xX2_1, levando o numerador de F a ter distribuicao Xf(n—1)—(n—k)} = xp: Logo, F ~ Fyp_ 1 n—K}- Além disso, note que SQRyr = SQT. A demonstracao é direta. 3 Faculdade de Economia - UFF Prof: Diogo Braga SQRur = tet ef = ie (ye — Ht) = wt (Ye _ 61) ; B=9 2 SQRur=Dpa(y — 9) = SQT 4. Testes como funcdo de R? Podemos dispor as regras de decisio dos testes como funcdo de R?. Note que podemos escrever SQR, restrito ou irrestrito, da seguinte forma: R?=1- 38% ». SQT x R? = SQT-SQR «. SQR = SQT x (1 — R?) Assim SQRur — SQRmtr _ SQT x (1— Rie) — SQT x (1- Ri e7) _ SQRur SQT x (1— Ri;;) 7 _ (= Rizr) — = Ris) _ 1— Rie, _ Ris — Rive 1- Ri, 2 _ p2 _ Isso sugere que Cu Malle ~ Py pn—k}; CaSO estejamos no con- texto (2). Outra maneira de pensarmos os testes de hipdtese se dé através do numero de restrigdes impostas ao modelo geral. Seja m o numero de restricgdes ao modelo y% = 61 + yoy ByXuy + &. -> Regra de decisao — (SQRmr—-SQRuz)/m PF a SOR /nok ~ Fonn—k} No teste Ho: Bo4+1 = Ppt2 =... = Pe =0 Hy : Nem todos os (’s sao iguais a zero existem k — p restricdes. Nesse caso, m = k — p. 4 Faculdade de Economia - UFF Prof: Diogo Braga 5. Testes para o acréscimo de varidveis explicativas Basicamente o que queremos testar é se a inclusao de algumas varidveis, de forma conjunta, é significativa estatisticamente para explicar y. Po- demos escrever as hipdteses da seguinte forma: Alo: Bea = Prog =... = 2, =0 Hy, : Nem todos os (’s sao iguais a zero Ou, equivalentemente, k Ho: y= Bi + yo BiXu + & l Ay: yt = Bi t+ Vyao BiXti + € em que! > k. A tinica diferenca em relacéo aos demais testes é que o modelo-base é a equagao com | ~’s. O modelo restrito passa a ser a ~ k equagao yy = Bi + ojo BiXtui + &- -> Regra de decisao — (SQRur—SQRmu7r)/l-k B= SQRur/n—l ~ Fi-k.n-0} Neste caso, | — k é 0 ntimero de restrigdes (numero de 3s na hipdtese nula). Visto por outra forma, SQRyr ~ x74 e SQRyr ~ x2) Assim, SQRur — SQRur ~ Xin—k)—(n—1) os SQRur— SQRmi ~ Xj_x 6. Testes para diversas restrigdes Assuma o seguinte contexto Ao: 62 = Bs 63+ 84=1 Tomando a regra de deciséo que leva em conta o numero de restricoes, basta fazer _ (SQRumr—-SQRmuz1)/2 P= SQRutr/n—k ~ Fo.n—ky 5 Faculdade de Economia - UFF Prof: Diogo Braga uma vez que dispomos de 2 restricoes. Vocé pode olhar para o problema sob outra perspectiva. Tome a equacao original e as restricdes impostas na hipdtese nula. A equacao que ira testar tera o seguinte formato k Ye = Bi + BoXi2 + 63X13 + BaXt4 + Ss" BiXvi + € i=5 k = 81 + B3Xv2 + B3Xig + (1 — B3)Xt4 + YS BXu + e1 i=5 k = Xia + Bi + B3{Xt2 + X13 — Xtat + Ss" BiXu + & i=5 k yt — Xta = Bi + B3V + S- Bi Xi + & i=5 k y, = Bi + B3V + S- Bi Xi + €& i=5 ”Perdemos” duas fontes de informagéo no modelo y; acima. Isso im- plica que SQRyrR ~ Xo pee e, portanto, o numerador de F' tera distribuicdo \3. Isso explica o porqué da distribuicgéo F (2,n—k} 7. Unica restricgao Quando dispusermos de uma tinica restricao na hipdtese nula, podemos utilizar o teste t. O contexto pode ser o seguinte Ho : Bi = B; A: 8: F B; -> Regra de decisao (Gi By) (Be Ps) ~ tk {8;—-Bj} Sob Ho, terfamos entao 6 Faculdade de Economia - UFF Prof: Diogo Braga Say © tok {8;—Bj} Por se tratar de um teste bilateral, vocé nao rejeitard a hipdotese nula quando —tya} < ae < ty9}. Esse teste é equivalente ao teste Bi -B; F com a seguinte regra de decisao. — (SQRur—-SQRmuy)/1 B= SORui/n=k ~ Fa n—ry A diferenca, obviamente, é que o teste F serd unicaudal. Vocé rejeita Ho quando F' > fi nko}: Formas Funcionais dos Modelos de Regressao e O modelo log-linear Y= BX? me Se tormarmos o logaritmo, temos log Yj = log 61 + Bg log Xj + uj Esse é provavelmente a forma funcional mais util quando queremos medir com facilidade a elasticidade. Veja que, neste caso, G2 mede a +x +x dY\ (X taxa de variacéo em Y dada uma variagéo em X, (Sy) (+). e O modelo log-lin ¥; =Yo(1+r)! Se tomarmos o log, temos log Y; = log 61 + Bot + ue 7 Faculdade de Economia - UFF Prof: Diogo Braga acrescentando ao formato o termo de erro. Esse tipo de forma funcional é importante quando queremos avaliar a taxa de crescimento de certas vardveis econdmicas, como populacao, PIB, oferta de moeda, taxa de desemprego, produtividade, etc. Uma questao a observar é que o parametro estimado nos da a taxa de crescimento “instantanea” (em um certo ponto no tempo) e nao a taxa composta (para um determinado periodo de tempo). Para fazer a conta, basta fazer [antilog (32) - 1]. e Modelos de tendéncia linear Existe a possilidade de escrevermos um modelo parecido com o do item anterior. Veja que Yj; = log 61 + Bot + ut leva em consideracao uma varidvel dependente sem o logaritmo. A interpretacao dos modelos é naturalmente diferente. O modelo com log relativo ao tempo ¢ avalia a variacaéo percentual sobre Y, enquanto o modelo de tendéncia linear mostra a variagéo absoluta em Y (por exemplo, em milh6es de dolares). e O modelo lin-log Y;, = 81 + By log Xj + ui e Modelos Reciprocos Y, = (i+ 6 , + —_ _ u; t 1 2 X; a O exemplo mais tipico para aplicacgaéo de modelos recfprocos é a curva de Phillips, um tema bastante conhecido de macroeconomia. Y¥; = 61 + Bot + ue 8 Faculdade de Economia - UFF Prof: Diogo Braga Modelo Equacao Coef. Angular Elasticidade . _ x Linear Y = Pi + GoX Bo B2 (+) Log-linear log Y = 6; + 6g log X Bo (*) B2 Log-lin log Y = By + Box BoY BoX Lin-log Y = Bi + Balog X Bo (+) Bo (¥) Reciprocos Y = 61 + Bo (x) — Be (xz) —B2 (xy) Log Rec log ¥Y = 6y + 62 (+) Bo (+) By (+) Tabela 1: Formas Funcionais Variaveis Qualitativas Num modelo econométrico, as varidveis qualitativas - mais comumente chamadas de dummy - podem ser muito Uteis para explicar, ao menos em parte, as oscilagdes da varidvel dependente. Temos basicamente dois tipos de varidveis as quais atribuimos o nome de “dummy” e Varidveis que assumem apenas dois valores, geralmente 0 e 1; e e Varidveis que ainda estao restritas a um nimero v de categorias e assumem valores inteiros, geralmente v = 1,2,.... O que faremos é transformar essas varidveis categéricas em varidveis bindarias. Ex: E muito comum lidarmos com dados de escolaridade. Isso porque a escolaridade parece ser uma varidvel estatisticamente significativa para ex- plicar, por exemplo, as oscilagoes dos saldrios dos individuos. Geralmente subdividimos a escolaridade segundo o grau alcangado (isso também seria obtido com anos de estudo). Poderifamos, por exemplo, atribuir 1 para quem tem ensino fundamental completo, 2 ensino médio completo, 3 para ensino superior completo e 4 para qualquer outro grau completo acima do ensino superior (podemos chamar de pés-graduacao completa). A tabela de dados vird com esses niimeros (1, 2,3 e 4) na coluna referente a escolari- dade. A seguir, vocé transformara cada uma dessas categorias numa dummy propria. Veja a equacao abaixo Yj = Bi + B2X5 + 832; + Ba Ej + 6; 9 Faculdade de Economia - UFF Prof: Diogo Braga em que yj se refere ao sala´ario dos indiv´ıduos, Xj ´e uma dummy para gˆenero (0 para homem, 1 para mulher), Zj ´e uma dummy para cor (algo como 0 para branco e 1 para n˜ao-brancos) e Ej ´e uma vari´avel categ´orica relativa `a escolaridade. Ej pode assumir os valores 1, 2, 3, 4 a depender da escolaridade do indiv´ıduo j = 1, . . . , n. O que vamos fazer a seguir ´e dar uma roupagem diferente, mais ´util, para a vari´avel Ej. Vamos criar trˆes novas vari´aveis, que aqui chamaremos de E1j, E2j e E3j. E1j ´e igual a 1 se o indiv´ıduo tem apenas o ensino fundamental completo, 0 caso contr´ario. A mesma l´ogica se aplica `as demais vari´aveis. A equa¸c˜ao de regress˜ao passa ent˜ao a ser yj = β1 + β2Xj + β3Zj + β4E1j + β5E2j + β6E3j + ϵj Vocˆe pode estar se perguntando...E onde est´a a dummy referente `a ca- tegoria 4 (p´os-gradua¸c˜ao completa)? Aqui entra a primeira li¸c˜ao sempre que trabalhamos com vari´aveis categ´oricas. Ao pensar nas categorias, o pesquisador tem duas alternativas: (i) ou ele inclui sempre uma categoria a menos como vari´avel explicativa; ou (ii) ele deixa de incluir o intercepto. O problema ao incluir todas as categorias e o intercepto ´e que criamos um problema de perfeita colinearidade. Perceba que E1 + E2 + E3 + E4 = 1 pois as vari´aveis de escolaridade v˜ao assumir o valor 1 sempre que as demais forem 0. Ent˜ao, poder´ıamos escrever E4 = 1 − E1 − E2 − E3. Ou seja, como uma das vari´aveis necessariamente ´e fun¸c˜ao das demais, devo escolher, dentre as quatro, uma delas para ficar de fora e servir como “referˆencia”. A interpreta¸c˜ao ficaria completa com a inclus˜ao do intercepto. Vejamos o sal´ario do Zezinho, que ´e um homem branco com ensino m´edio completo. ˆβ1 ´e o sal´ario de referˆencia de um homem branco com p´os- gradua¸c˜ao completa (a ´unica dummy relacionada `a escolaridade que n˜ao entrou na equa¸c˜ao original). Por ser homem e branco, desconsidero os coe- ficientes associados a X e Z. O ´unico coeficiente relacionado `a escolaridade ser´a β5, uma vez que E2 = 1. O sal´ario de Zezinho ent˜ao seria descrito por ˆβ1 + ˆβ5. Uma observa¸c˜ao importante: Tudo o mais constante, ´e de se pensar que ˆβ5 < 0, pois geralmente quem tem ensino de p´os-gradua¸c˜ao completo tem um sal´ario maior do que algu´em com ensino superior completo. Da´ı, ˆβ1 + ˆβ5 < ˆβ1, ou seja, o componente E2 associado `a escolaridade “tira” uma parte do sal´ario pois assumimos como referˆencia a escolaridade p´os- gradua¸c˜ao completa. 10 Faculdade de Economia - UFF Prof: Diogo Braga Colinearidade Perfeita Uma nota importante sobre a colinearidade perfeita. A forma mais comum de trabalhar com o as- sunto se d´a atrav´es da matriz de vari´aveis explicativas X. Ela aparece quando usamos a nota¸c˜ao matricial para o modelo de regress˜ao linear. Y = Xβ + ϵ em que ϵ ∼ N(0, σ2I). Tomando o exemplo anterior, a matriz X poderia ser escrita 1 x12 z13 1 0 0 1 x22 z23 1 0 0 ... ... ... ... ... ... 1 xr2 zr3 0 1 0 1 xr+12 zr+13 0 1 0 . . . . . . . . . . . . . . . . . . . . . . . . . . 1 xp2 zp3 0 0 1 1 xp+12 zp+13 0 0 1 . . . . . . . . . . . . . . . . . . . . . . . . . . 1 xl2 zl3 0 0 0 . . . . . . . . . . . . . . . . . . . . . . . . . . 1 xn−12 zn−13 0 0 0 1 xn2 zn3 0 0 0 em que a primeira coluna representa o coeficiente associado ao intercepto, a segunda coluna se re- fere ao gˆenero, a terceira disp˜oe a cor e a quarta, quinta e sexta colunas se referem `a escolaridade (a quarta seria E1, a quinta E2 e a sexta E3) e, naturalmente, r < p < l < n, todos n´umeros in- teiros maiores do que 1. Perceba que a partir de l todas as vari´aveis associadas `a escolaridade s˜ao iguais a zero. Isso significa que, nesses ´ındices, E4 = 1, papel “assumido’ pelo intercepto. Essa ´e uma das maneiras corretas de dispormos as vari´aveis categ´oricas na matrix de vari´aveis ex- plicativas. 11 Faculdade de Economia - UFF Prof: Diogo Braga Colinearidade Perfeita Agora, vejamos o seguinte: e se resolvˆessemos colocar a quarta categoria E4 na matriz acima? Ter´ıamos algo como 1 x12 z13 1 0 0 0 1 x22 z23 1 0 0 0 ... ... ... ... ... ... 1 xr2 zr3 0 1 0 0 1 xr+12 zr+13 0 1 0 0 . . . . . . . . . . . . . . . . . . . . . . . . . . 1 xp2 zp3 0 0 1 0 1 xp+12 zp+13 0 0 1 0 . . . . . . . . . . . . . . . . . . . . . . . . . . 1 xl2 zl3 0 0 0 1 . . . . . . . . . . . . . . . . . . . . . . . . . . 1 xn−12 zn−13 0 0 0 1 1 xn2 zn3 0 0 0 1 Percebam que foi acrescentada uma coluna `a matrix X. Al´em disso, notem que a primeira coluna ´e exatamente igual `a soma das colunas 4, 5, 6 e 7, referentes `a vari´avel escolaridade. Dito de ma- neira um pouco mais formal, podemos dizer que a primeira coluna ´e uma combina¸c˜ao linear das ´ultimas 4 colunas. Esse fato traz uma consequˆencia indesejada: XTX, a multiplica¸c˜ao da trans- posta de X por X, deixa de ser uma matriz invert´ıvel. Isso implica que n˜ao conseguimos calcular o estimador de m´ınimos quadrados (veja que ˆβ = (XTX)−1XTy ). Em outras palavras: acrescentar ao intercepto todas as categorias de uma vari´avel implicaria na impossibilidade de obter estima- dor de m´ınimos quadrados. Esse erro ´e comumente conhecido na literatura como armadilha das vari´aveis dummy. Vari´aveis qualitativas junto com quantitativas No exemplo trabalhado acima, dispusemos mais de uma vari´avel qualitativa simultaneamente. Agora, no entanto, temos no modelo, al´em das vari´aveis qualitativas j´a inclu´ıdas, uma vari´avel quantitativa. Seja Hj o tempo de experiˆencia do indiv´ıduo j = 1, . . . , n, medida em 12 Faculdade de Economia - UFF Prof: Diogo Braga anos. O modelo ser´a ent˜ao yj = β1 + β2Xj + β3Zj + β4E1j + β5E2j + β6E3j + +β7Hj + ϵj A an´alise do modelo continua tomando como base o homem branco com p´os-gradua¸c˜ao completa. Em outras palavras, a interpreta¸c˜ao das vari´aveis qualitativas em nada muda com a inclus˜ao de Hj. A diferen¸ca ´e que avaliaremos o sal´ario do indiv´ıduo j tamb´em com o tempo de trabalho. Um ano a mais de trabalho recompensar´a o indiv´ıduo j em β7 unidades monet´arias (perceba que a impress˜ao inicial ´e que β7 > 0, seguindo o senso comum que a experiˆencia acumulada garante um incremento salarial aos indiv´ıduos). Voltando ao caso do Zezinho, que ´e um homem branco com en- sino m´edio completo. Digamos que ele tenha 8 anos de experiˆencia no mercado de trabalho. O sal´ario do Zezinho ser´a encontrado com β1 + β5 + 8 × β7 (lembre-se que concordamos que β5 < 0). Compara¸c˜ao de Modelos (ou Estabilidade de Parˆametros) Uma importante aplica¸c˜ao das vari´aveis qualitativas ´e a possibili- dade de avaliarmos a estabilidade dos parˆametros do modelo. Isso pode se dar ao longo do tempo (numa an´alise de s´erie temporal) ou dentro de uma mesma base transversal (cross section). ´E poss´ıvel, por exem- plo, que algum tipo de lei, um choque advindo de uma crise (petr´oleo na d´ecada de 1970) ou uma pandemia altere a rela¸c˜ao das vari´aveis do modelo. Vejamos o exemplo Ex: Admita que desejamos analisar a rela¸c˜ao entre poupan¸c˜ao pes- soal e renda dispon´ıvel pessoal nos EUA no per´ıodo de 1970-95. Acre- ditamos, no entanto, que essa rela¸c˜ao n˜ao ´e constante ao longo dos 26 anos. Dito de outra forma, a impress˜ao obtida com os dados ´e que talvez precisemos dividir a amostra em 2 per´ıodos, pois a rela¸c˜ao en- tre as vari´aveis parece ter mudado a partir de determinado per´ıodo. Assim, divideremos os dados para os per´ıodos de 1970-81 e 1982-95. Poder´ıamos proceder da seguinte maneira: • 1970-81 a regress˜ao ser´a: Yt = λ1 + λ2Xt + u1t, n1 = 12. 13 Faculdade de Economia - UFF Prof: Diogo Braga • 1982-95 a regress˜ao ser´a: Yt = γ1 + γ2Xt + u2t, n2 = 14. • 1970-95 a regress˜ao ser´a: Yt = α1 + α2Xt + ut, n = n1 + n2 = 26. A terceira regress˜ao assume que n˜ao h´a mudan¸ca nos parˆametros do modelo (ou seja, que n˜ao precisar´ıamos subdividir nossa amostra em 2 subamostras). Em termos dos parˆametros, ter´ıamos algo como α1 = λ1 = γ1 e α2 = λ2 = γ2. As duas primeiras regress˜oes, no entanto, assumem que tanto intercepto como coeficiente angular s˜ao distintos entre os per´ıodos. O teste para avaliar a estabilidade dos parˆametros ´e chamado de Teste de Chow. Apesar da mecˆanica do teste n˜ao ser dif´ıcil, o objetivo aqui nesta se¸c˜ao n˜ao ´e apresent´a-los a ele (Cap 8, Gujarati). A ideia ´e mostrar que podemos adaptar o uso de dummies para fazer exatamente a mesma coisa que pretende o teste. Na verdade, o uso de dummies nos permite ir al´em do que prop˜oe o teste de Chow. Torna-se poss´ıvel avaliar, por exemplo, se a estabilidade dos parˆametros ´e v´alida apenas para o intercepto, para o coeficiente angular ou para ambos simultaneamente, resultado que n˜ao pode ser obtido atrav´es do teste. Seja Dt uma vari´avel dummy que assume valor igual a 1 se as observa¸c˜oes da amostra se referem ao per´ıodo de 1982-95 e 0, caso contr´ario (1970-81). A equa¸c˜ao de regress˜ao ´e a seguinte Yt = α1 + α2Dt + β1Xt + β2(DtXt) + ut em que Yt ´e a poupan¸ca pessoal e Xt ´e a renda dispon´ıvel pessoal. Nesta equa¸c˜ao com a dummy Dt, veja que E (Yt|Dt = 0, Xt) = α1 + β1Xt E (Yt|Dt = 1, Xt) = (α1 + α2) + (β1 + β2) Xt Podemos avaliar, com a estat´ıstica do teste t, a estabilidade do intercepto e do coeficiente angular entre os per´ıodos. Se aceitarmos H0 : α2 = 0, o intercepto ser´a o mesmo. Por outro lado, se aceitarmos H0 : β2 = 0, o coeficiente angular ficar´a est´avel entre os 2 per´ıodos analisados. 14 Faculdade de Economia - UFF Prof: Diogo Braga Intera¸c˜ao entre Vari´aveis Qualitativas Digamos que o tratado inicialmente neste cap´ıtulo seja repaginado e troque o grau de escolaridade, representado pela vari´avel Ej, por anos de estudo, que aqui estar´a notado atrav´es vari´avel Wj. O novo modelo ent˜ao ser´a yj = β1 + β2Xj + β3Zj + β4Wj + ϵj Uma das coisas que se assume nesse modelo ´e o efeito diferencial da vari´avel Xj ´e constante para as duas categorias de cor e o efeito diferencial da vari´avel Zj ´e constante para os dois gˆeneros. Ou seja, o efeito de ser homem (ou mulher) para o sal´ario de um homem (mulher) branco ´e igual ao efeito para um homem (mulher) n˜ao branco. O problema ´e que essa caracteriza¸c˜ao n˜ao se aplica nesse caso. Passa- se a considerar a intera¸c˜ao ou efeito multiplicativo das vari´aveis Xj e Zj. ´E presum´ıvel, por exemplo, que mulheres brancas ganhem mais do que mulheres n˜ao brancas e que esse efeito n˜ao seja meramente aditivo (estamos atestando que h´a uma esp´ecie de “combina¸c˜ao de for¸cas”, um incremento no efeito). Isso ser´a caracterizado com o novo parˆametro β5, por meio da multiplica¸c˜ao das vari´aveis Xj e Zj. yj = β1 + β2Xj + β3Zj + β4Wj + β5 (Xj ∗ Zj) + ϵj em que Xj ∗ Zj = 1 se ´e uma mulher n˜ao branca, ou seja, β5 repre- senta o efeito sobre o sal´ario de ser uma mulher n˜ao branca. A nova vari´avel multiplicativa cria um efeito incremental sobre a vari´avel de- pendente. Se o efeito adicional for positivo, entendemos que h´a uma “compensa¸c˜ao” salarial por ser mulher n˜ao branca. Em contrapartida, se o coeficiente for negativo, h´a um efeito “punitivo”, que acentua a diferen¸ca salarial de mulheres n˜ao brancas com os demais grupos. 15 Faculdade de Economia - UFF Prof: Diogo Braga Uso das Vari´aveis Qualitativas para representar Sazonali- dade Sazonalidade ´e um fenˆomeno muito comum em s´eries temporais econˆomicas. Nos casos t´ıpicos de sazonalidade h´a uma esp´ecie de “lei” que varia¸c˜oes regulares dos dados dentro de janelas espec´ıficas de tempo. Esses intervalos no tempo podem ser meses, trimestres, se- manas, etc. Uma das “leis” mais conhecidas s˜ao as esta¸c˜oes do ano. Elas s˜ao capazes de determinar, por exemplo, se certos meses ser˜ao chu- vosos ou mais frios. Para facilitar a modelagem e eventualmente nos concetrarmos em outros fatores das s´eries temporais, como tendˆencia, padr˜oes c´ıclicos e padr˜oes irregulares (aleat´orios), recomenda-se iden- tificar e remover a sazonalidade. As vari´aveis qualitativas s˜ao bastante ´uteis para esse fim. Ex: Observe abaixo um modelo de regress˜ao linear que relaciona as ven- das de equipamentos de esqui e um ´ındice que reflete o interesse do consumidor em adquirir esses bens nos EUA, entre 1964 e 1973. Os dados s˜ao trimestrais. St = β1 + β2PDIt + ϵt Esse ´e um caso t´ıpico em que a sazonalidade n˜ao pode ser negli- genciada. Espera-se que o mercado de esqui esteja aquecido (com o perd˜ao do trocadilho) nos meses mais frios do hemisf´erio norte. Com dados trimestrais, n˜ao temos os meses separados adequadamente por esta¸c˜oes, ent˜ao n˜ao ´e poss´ıvel dizer com precis˜ao se os meses mais inte- ressantes para o com´ercio de equipamentos de esqui est˜ao no primeiro ou no quarto trimestre. Por isso, vamos consolidar a vari´avel que re- presentar´a a sazonalidade com 2 trimestres. Seja Zt a vari´avel dummy que ´e igual a 1 se as observa¸c˜oes est˜ao nos dois trimestres mais frios (inverno) e 0, se as observa¸c˜oes correspondem aos trimestres mais quentes (ver˜ao). Assim, teremos St = β1 + β2PDIt + β3Zt + ϵt Veja que assumimos nesse modelo que o impacto do interesse do consumidor nas vendas ´e o mesmo para os dois intervalos de tempo 16 Faculdade de Economia - UFF Prof: Diogo Braga (isso n˜ao necessariamente acontecer´a, n˜ao seria estranho se a reta de regress˜ao no per´ıodo mais frio fosse mais inclinada do que no per´ıodo mais quente. Esse efeito seria introduzido pela intera¸c˜ao entre Zt e PDIt, dado por Zt∗PDIt). S´o exisitira´a diferen¸ca no “n´ıvel” de vendas, n˜ao no efeito marginal. Ex: Agora considere o mercado de geladeiras. Parece razo´avel pensar que em meses mais quentes h´a um consumo maior de geladeiras, tal- vez motivada pelo uso mais frequente (pode-se pensar at´e em picos de energia, que acabam danificando esse tipo de equipamento). Seja Yt a venda de geladeiras e Djt, j = 1, . . . , 4, a vari´avel categ´orica que representa cada trimestre. Sabemos que como a vari´avel Djt tem 4 categorias (uma para cada trimestre) ou removemos uma delas (man- tendo o intercepto) para n˜ao incorrermos na armadilha das dummies ou retiramos o intercepto. Neste caso, faremos usando a segunda abor- dagem. Nosso modelo ser´a ent˜ao Yt = α1D1t + α2D2t + α3D3t + α4D4t + ϵt Se as vari´aveis (ou um subconjunto delas) Djt forem estatistica- mente significativas, teremos a confirma¸c˜ao do efeito sazonal sobre a venda de geladeiras (Yt). Regress˜ao Segmentada (Piecewise) Numa regress˜ao segmentada, a regress˜ao ´e separada em determi- nado ponto, tal que os coeficientes (intercepto e coeficiente angular, numa regress˜ao simples) estimados s˜ao diferentes antes e depois deste ponto. ´E como se a partir de um certo n´ıvel as vari´aveis em quest˜ao passam a se relacionar de uma forma diferente (`as vezes sutilmente, `as vezes brutalmente). Digamos, por exemplo, que uma companhia re- munere sua equipe de vendas conforme o valor bruto da opera¸c˜ao. Se o funcion´ario atingir um certo n´ıvel de venda, a estrutura de comiss˜ao muda, pagando a ele um pouco mais. Seja X∗ o n´ıvel a ser atingido por cada funcion´ario e Dj uma vari´avel dummy que ´e igual a 1 se X > X∗ e 0, se X < X∗. Teremos a seguinte equa¸c˜ao de regress˜ao 17 Faculdade de Economia - UFF Prof: Diogo Braga Yj = α1 + α2Xj + α3 (Xj − X∗) Dj + ϵj em que Yj ´e a comiss˜ao por vendas e Xj s˜ao as vendas em si. A ideia ´e que se o empregado j vender acima de X∗, ele ganha uma comiss˜ao adicional de β3, que se soma a β2. Veja que isso altera a confi- gura¸c˜ao da reta de regress˜ao a partir de X∗, n˜ao apenas pelo coeficiente angular diferente, mas tamb´em pelo intercepto. Evidentemente, se a hip´otese H0 : β3 = 0 n˜ao for rejeitada, temos evidˆencia estat´ıstica para descartar a possibilidade de regress˜ao segmentada. Autocorrela¸c˜ao dos termos de erro Uma das hip´oteses do teorema de Gauss-Markov era a inexistˆencia de autocorrela¸c˜ao, ou seja, E (ϵiϵj) = 0, para todo i ̸= j. Naturalmente, usando a hip´otese de que os termos de erro tˆem m´edia zero, podemos associar a hip´otese de inexistˆencia de autocorrela¸c˜ao `a covariˆancia Cov (ϵi, ϵj) = E (ϵiϵj) − E(ϵi)E(ϵj) = E (ϵiϵj) = 0 Essa hip´otese garante que qualquer efeito n˜ao antecipado (termo de erro) sobre a vari´avel dependente ´e restrito `aquela observa¸c˜ao (que pode ser temporal). Para modelos de cortes transversais, essa hip´otese parece fazer sentido. Tome como exemplo um modelo de renda dispon´ıvel e consumo das fam´ılias. Faz sentido que um evento aleat´orio que aumente o consumo de uma fam´ılia (por exemplo, uma visita de amigos) n˜ao interfira no padr˜ao de consumo das demais. Agora, tome um exemplo de um modelo em s´eries temporais. Di- gamos que vocˆe queira entender a rela¸c˜ao entre o pre¸co e o consumo de um determinado bem, por exemplo o frango. Um dos principais custos da produ¸c˜ao de frango ´e o milho. Imagine que uma seca se abate sobre um grande produtor de milho. ´E natural, em fun¸c˜ao da escassez, que o pre¸co do milho aumente e, por consequˆencia, o pre¸co do frango. Esse evento n˜ao antecipado, portanto, causar´a um efeito n˜ao negligenci´avel sobre a demanda de frango. A quest˜ao ´e: ser´a que o 18 Faculdade de Economia - UFF Prof: Diogo Braga impacto do evento sobre a demanda de frango ficar´a circunscrito ape- nas ao per´ıodo corrente? Parece que essa hip´otese ´e muito inveross´ımil para modelos temporais. Provavelmente o impacto sobre a demanda de frango vai durar alguns trimestres, at´e que uma nova safra, livre de anormalidades, possa ser produzida. Um exemplo pr´atico do que se discutiu no par´agrafo anterior ´e a peste su´ına africana, que causou uma crise sanit´aria sem precedentes sobre alguns dos principais produtores de su´ınos do mundo, particu- larmente na China. O padr˜ao alimentar chinˆes (o maior consumidor de su´ınos do mundo, de longe) se alicer¸ca na carne su´ına. Com pre¸co muito alto, ´e natural que se passe a observar substitutos diretos, como bovinos e frango. Fato ´e que a demanda por bovinos aumentou substan- cialmente, provocando at´e “apag˜ao” na produ¸c˜ao. Esse efeito da peste su´ına pode ser exergado como restrito ao per´ıodo corrente? Obvia- mente, n˜ao. Apesar de ser um evento n˜ao antecip´avel (e que, portanto, faz parte do termo de erro), os efeitos sobre a demanda de bovinos vai muito al´em de um ´unico per´ıodo. Dito tudo isso, quando os termos de erro s˜ao autocorrelacionados, temos que Cov (ϵi, ϵj) = E (ϵiϵj) − E(ϵi)E(ϵj) = E (ϵiϵj) ̸= 0 Como estamos falando aqui quase que exclusivamente de modelos temporais, podemos adaptar a nota¸c˜ao para visualiza¸c˜ao mais simples do tempo Cov (ϵt, ϵt−1) = ρσ2 Para entender o mecanismo de gera¸c˜ao da autocorrela¸c˜ao, devemos recorrer primeiramente `as equa¸c˜oes mais simples entre ϵt e ϵt−1 e depois desenvolvˆe-las recursivamente ϵt = ρϵt−1 + ut em que ut ∼ N (0, σ2 u), E (utus) = 0, para todo t ̸= s e E (utϵt−1) = 0, para todo t. 19 Faculdade de Economia - UFF Prof: Diogo Braga Uma equacao como essa é conhecida como um modelo autorregres- sivo de primeira ordem ou AR(1). Podemos desenvolver recursiva- mente essa equacao, tal como €¢ = Per—-1 + Ut = p (per—2 + Ut-1) + Ut = = per2 + pur-1 + Ut = = p” (per_3 + Ur_2) + pue_1 + UH = = p'€0 + pu + p’ us +... pur + put—1 + Ut Admitimos que €)9 ~ N (0. tin). Note que como & é uma com- binacao linear de €o, U1, U2,..., Ue, também tera distribuicao normal. Além disso, veja que E(a)=E (p'eo + pt uy + pus +... pr ur-2 + puri + ur) = = p'E(e) +p ' E(u) +p 7B (us) +... + p?E(ur2) + pE(u-1) + E(ut) = = 0 e Var (e&) = Var (p'eo + ph tur + po ug +... + p?ur_2 + pura + ur) = = p"Var(e9) +p? *'Var(uz) + p? * ?Var(uz) +... +p? ?Var(um_2) + p?Var(m_1) + Var(uz) = 2 =p | +p Noi + pt 2a, b.. bp ro, + poy +04 = a ok ok ok = pt a 402 [e° i-1 4 2 P24 gp 4 PHI] _ 2 2t _ 2 | % a a fed re I 2t —_ 2t l-p l—p o? 1p 20 Faculdade de Economia - UFF Prof: Diogo Braga Veja que Var(e;,) sera constante. Dai, temos €, = per-1 + Ut = = pPretst+ p> ‘esti +P” Ur—sp2 +... + pura t+ ur Multiplicando os dois lados por ¢,_, e tomando o valor esperado, temos E (eé-s) = PE (G@_.) + 0° 1 E (-s€t-s41) +e.e Ht pE (€,_sUt-1) + EB (€:_5Uz) = = p'Var (Gs) = peo” 2 Observe que demos a notacao a? = oe Podemos perceber que Cov (&, €-1) = po”, ou seja Cov (€, €-1) Cov (€¢, €-1) a o? J/Var(e)\/Var(e_1) Uma hipotese que é crucial para tudo que esta aqui funcionar ade- quadamente é a estacionariedade (Se p < 1 dizemos que uma série é estaciondria). De maneira mais simples, dizemos que uma série é es- taciondria quando preserva suas principais estatisticas nao importa o periodo temporal analisado (uma série com tendéncia e/ou sazonali- dade nao é estacionaria, pois suas caracteristicas mudam nas devidas estacdes, por exemplo). 21
Envie sua pergunta para a IA e receba a resposta na hora
Recomendado para você
23
P1 - Econometria 1 2022-1
Econometria
UFF
51
Apostila Econometria 2020
Econometria
UFF
2
Exercícios Laboratório 5 - Econometria 2022-2
Econometria
UFF
3
Lista 2 - Econometria 1 2022-1
Econometria
UFF
2
Teste - Regressão - Econometria - 2023-1
Econometria
UFF
5
Lista 4 - Econometria 1 2022-1
Econometria
UFF
4
Questões Listas Anteriores - Econometria 2022 2
Econometria
UFF
7
Exercícios - Econometria - 2023-2
Econometria
UFF
3
Lista 3 - Econometria 1 2022-1
Econometria
UFF
4
Propriedades dos Estimadores de Mínimos Quadrados 2022-1
Econometria
UFF
Texto de pré-visualização
Inferencia no Modelo Normal de Regressao Linear Multipla Diogo Braga 22 de Abril de 2021 Fatos Gerais: Yt = Bit BoXi2+...+ BeXie t+ € e, ~ N(0,07) Utilizando a abordagem matricial, temos: Y=XB+e e~ N(0,071) Hipdteses basicas do modelo normal de regressao linear multipla: e Nao autocorrelagao serial: E(¢;,€;) =O Vij e Homocedasticidade: Var(e) = 0? Vt e Varidveis independentes nao estocasticas e Cov(e, Xx.) =OVt,k e Auséncia de Multicolinearidade: Nao ha relacao linear exata entre as varidveis independentes A partir dessas hipdéteses, obtivemos: ° 8; ~ N(Gj,0°(X7X)"1) e 8 é0 melhor estimador linear nao tendencioso e o2 é estimador viesado de o?. Construfmos $2 = ere em que k é60 numero de {’s no modelo e n é 0 nimero de observacoes. Além disso, sabemos, naturalmente, que SQR = e’e = )-e?. 1 Faculdade de Economia - UFF Prof: Diogo Braga 0 L =k TY? —~kéont d de liberdade d 3 X74 Em que n é o nimero de graus de liberdade da distribuicao chi-quadrado. e No modelo miltiplo, faz mais sentido o uso de R2 = R? — &—(1 —R?), Para testar o modelo de regressao multipla, basta utilizarmos suas hipdteses basicas, além dos resultados de inferéncia que obtivemos subsequentemente. 1. Teste Simples para {; Nesse tipo de abordagem testamos isoladamente cada um dos 6;, j = 1,...,k. Ho : Bj =0 A, : Bj tx 0 Naturalmente a hipdtese alternativa depende da conveniéncia do mo- delo, podendo ser também de desigualdade. -> Regra de decisao B;-B; “Sy ~ th—k Em testes bilaterais, basta dividir o nivel de significancia @ por 2. Temos um intervalo de confianga para 3; de Bj — tn—p,238g, < Bj < Bj + tn—b1—9}84, para cada j € {1,...,k}. 2. Testes sobre a significancia de um subconjunto de varidveis explicativas Agora queremos testar a significancia de um subconjunto de (’s, da seguinte forma: Ao: Bp41 = Bpt2 =... = Be =0 Hy, : Nem todos os (’s sao iguais a zero Essa hipdtese pode ser descrita de outra forma: Ho : Modelo Restrito : y = 61 + GoXi2 +... + BpXtp + & Hy, : Modelo Irrestrito : y = 8; + yey By Xu +e -> Regra de decisao 2 Faculdade de Economia - UFF Prof: Diogo Braga — (SQRur—-SQRur)/k-p P= SORa [nk ~ F'R—p.n—k} Rejeitamos Ho quando F' > fx_pn—k,a- Ou seja, quando a retirada de informacao aumenta substancialmente a soma dos quadrados dos residuos, tenho evidéncias para rejeitar a hipdtese nula associada ao Modelo Restrito. Como observacao, vale a pena deixar claro que SQRyr ~ Xi» e SQRur ~ x2 E possivel provar que se X; ~ x}, e XQ ~ X75 X,+X2 ~ x2,4;,- Assim, o numerador referente a F tem distribuicao 2 _ 2 X{(n—p)—(n—k)} ~ Xk—p" 3. Teste sobre a significancia de todas as varidveis explicativas Nesse caso temos um teste com a seguinte forma: Ho : 82 = 63 =... = By =0 Hy, : Nem todos os (’s sao iguais a zero Esse teste 6 um caso particular do teste anterior. O Modelo Restrito, da forma como descrevemos anteriormente, passa a ter apenas {; como explicacao para as variagoes de y,. Em outras palavras Ao: yr = Pit & Fy: yy = Bi + oy BX + -> Regra de decisao Fe (SQRur —SQRyutr)/k—-1 _ (SQT — SQRm1)/k-1 SQRur/n—k SQRur/n—k — SQE/k—-1 F ~ SQRuz/n—k {kh Ln—k} Uma vez mais, rejeitamos Ho se F > frp_—1.n—k,a}, para um dado nivel de significancia. Note que SQRyr ~ xX2_1, levando o numerador de F a ter distribuicao Xf(n—1)—(n—k)} = xp: Logo, F ~ Fyp_ 1 n—K}- Além disso, note que SQRyr = SQT. A demonstracao é direta. 3 Faculdade de Economia - UFF Prof: Diogo Braga SQRur = tet ef = ie (ye — Ht) = wt (Ye _ 61) ; B=9 2 SQRur=Dpa(y — 9) = SQT 4. Testes como funcdo de R? Podemos dispor as regras de decisio dos testes como funcdo de R?. Note que podemos escrever SQR, restrito ou irrestrito, da seguinte forma: R?=1- 38% ». SQT x R? = SQT-SQR «. SQR = SQT x (1 — R?) Assim SQRur — SQRmtr _ SQT x (1— Rie) — SQT x (1- Ri e7) _ SQRur SQT x (1— Ri;;) 7 _ (= Rizr) — = Ris) _ 1— Rie, _ Ris — Rive 1- Ri, 2 _ p2 _ Isso sugere que Cu Malle ~ Py pn—k}; CaSO estejamos no con- texto (2). Outra maneira de pensarmos os testes de hipdtese se dé através do numero de restrigdes impostas ao modelo geral. Seja m o numero de restricgdes ao modelo y% = 61 + yoy ByXuy + &. -> Regra de decisao — (SQRmr—-SQRuz)/m PF a SOR /nok ~ Fonn—k} No teste Ho: Bo4+1 = Ppt2 =... = Pe =0 Hy : Nem todos os (’s sao iguais a zero existem k — p restricdes. Nesse caso, m = k — p. 4 Faculdade de Economia - UFF Prof: Diogo Braga 5. Testes para o acréscimo de varidveis explicativas Basicamente o que queremos testar é se a inclusao de algumas varidveis, de forma conjunta, é significativa estatisticamente para explicar y. Po- demos escrever as hipdteses da seguinte forma: Alo: Bea = Prog =... = 2, =0 Hy, : Nem todos os (’s sao iguais a zero Ou, equivalentemente, k Ho: y= Bi + yo BiXu + & l Ay: yt = Bi t+ Vyao BiXti + € em que! > k. A tinica diferenca em relacéo aos demais testes é que o modelo-base é a equagao com | ~’s. O modelo restrito passa a ser a ~ k equagao yy = Bi + ojo BiXtui + &- -> Regra de decisao — (SQRur—SQRmu7r)/l-k B= SQRur/n—l ~ Fi-k.n-0} Neste caso, | — k é 0 ntimero de restrigdes (numero de 3s na hipdtese nula). Visto por outra forma, SQRyr ~ x74 e SQRyr ~ x2) Assim, SQRur — SQRur ~ Xin—k)—(n—1) os SQRur— SQRmi ~ Xj_x 6. Testes para diversas restrigdes Assuma o seguinte contexto Ao: 62 = Bs 63+ 84=1 Tomando a regra de deciséo que leva em conta o numero de restricoes, basta fazer _ (SQRumr—-SQRmuz1)/2 P= SQRutr/n—k ~ Fo.n—ky 5 Faculdade de Economia - UFF Prof: Diogo Braga uma vez que dispomos de 2 restricoes. Vocé pode olhar para o problema sob outra perspectiva. Tome a equacao original e as restricdes impostas na hipdtese nula. A equacao que ira testar tera o seguinte formato k Ye = Bi + BoXi2 + 63X13 + BaXt4 + Ss" BiXvi + € i=5 k = 81 + B3Xv2 + B3Xig + (1 — B3)Xt4 + YS BXu + e1 i=5 k = Xia + Bi + B3{Xt2 + X13 — Xtat + Ss" BiXu + & i=5 k yt — Xta = Bi + B3V + S- Bi Xi + & i=5 k y, = Bi + B3V + S- Bi Xi + €& i=5 ”Perdemos” duas fontes de informagéo no modelo y; acima. Isso im- plica que SQRyrR ~ Xo pee e, portanto, o numerador de F' tera distribuicdo \3. Isso explica o porqué da distribuicgéo F (2,n—k} 7. Unica restricgao Quando dispusermos de uma tinica restricao na hipdtese nula, podemos utilizar o teste t. O contexto pode ser o seguinte Ho : Bi = B; A: 8: F B; -> Regra de decisao (Gi By) (Be Ps) ~ tk {8;—-Bj} Sob Ho, terfamos entao 6 Faculdade de Economia - UFF Prof: Diogo Braga Say © tok {8;—Bj} Por se tratar de um teste bilateral, vocé nao rejeitard a hipdotese nula quando —tya} < ae < ty9}. Esse teste é equivalente ao teste Bi -B; F com a seguinte regra de decisao. — (SQRur—-SQRmuy)/1 B= SORui/n=k ~ Fa n—ry A diferenca, obviamente, é que o teste F serd unicaudal. Vocé rejeita Ho quando F' > fi nko}: Formas Funcionais dos Modelos de Regressao e O modelo log-linear Y= BX? me Se tormarmos o logaritmo, temos log Yj = log 61 + Bg log Xj + uj Esse é provavelmente a forma funcional mais util quando queremos medir com facilidade a elasticidade. Veja que, neste caso, G2 mede a +x +x dY\ (X taxa de variacéo em Y dada uma variagéo em X, (Sy) (+). e O modelo log-lin ¥; =Yo(1+r)! Se tomarmos o log, temos log Y; = log 61 + Bot + ue 7 Faculdade de Economia - UFF Prof: Diogo Braga acrescentando ao formato o termo de erro. Esse tipo de forma funcional é importante quando queremos avaliar a taxa de crescimento de certas vardveis econdmicas, como populacao, PIB, oferta de moeda, taxa de desemprego, produtividade, etc. Uma questao a observar é que o parametro estimado nos da a taxa de crescimento “instantanea” (em um certo ponto no tempo) e nao a taxa composta (para um determinado periodo de tempo). Para fazer a conta, basta fazer [antilog (32) - 1]. e Modelos de tendéncia linear Existe a possilidade de escrevermos um modelo parecido com o do item anterior. Veja que Yj; = log 61 + Bot + ut leva em consideracao uma varidvel dependente sem o logaritmo. A interpretacao dos modelos é naturalmente diferente. O modelo com log relativo ao tempo ¢ avalia a variacaéo percentual sobre Y, enquanto o modelo de tendéncia linear mostra a variagéo absoluta em Y (por exemplo, em milh6es de dolares). e O modelo lin-log Y;, = 81 + By log Xj + ui e Modelos Reciprocos Y, = (i+ 6 , + —_ _ u; t 1 2 X; a O exemplo mais tipico para aplicacgaéo de modelos recfprocos é a curva de Phillips, um tema bastante conhecido de macroeconomia. Y¥; = 61 + Bot + ue 8 Faculdade de Economia - UFF Prof: Diogo Braga Modelo Equacao Coef. Angular Elasticidade . _ x Linear Y = Pi + GoX Bo B2 (+) Log-linear log Y = 6; + 6g log X Bo (*) B2 Log-lin log Y = By + Box BoY BoX Lin-log Y = Bi + Balog X Bo (+) Bo (¥) Reciprocos Y = 61 + Bo (x) — Be (xz) —B2 (xy) Log Rec log ¥Y = 6y + 62 (+) Bo (+) By (+) Tabela 1: Formas Funcionais Variaveis Qualitativas Num modelo econométrico, as varidveis qualitativas - mais comumente chamadas de dummy - podem ser muito Uteis para explicar, ao menos em parte, as oscilagdes da varidvel dependente. Temos basicamente dois tipos de varidveis as quais atribuimos o nome de “dummy” e Varidveis que assumem apenas dois valores, geralmente 0 e 1; e e Varidveis que ainda estao restritas a um nimero v de categorias e assumem valores inteiros, geralmente v = 1,2,.... O que faremos é transformar essas varidveis categéricas em varidveis bindarias. Ex: E muito comum lidarmos com dados de escolaridade. Isso porque a escolaridade parece ser uma varidvel estatisticamente significativa para ex- plicar, por exemplo, as oscilagoes dos saldrios dos individuos. Geralmente subdividimos a escolaridade segundo o grau alcangado (isso também seria obtido com anos de estudo). Poderifamos, por exemplo, atribuir 1 para quem tem ensino fundamental completo, 2 ensino médio completo, 3 para ensino superior completo e 4 para qualquer outro grau completo acima do ensino superior (podemos chamar de pés-graduacao completa). A tabela de dados vird com esses niimeros (1, 2,3 e 4) na coluna referente a escolari- dade. A seguir, vocé transformara cada uma dessas categorias numa dummy propria. Veja a equacao abaixo Yj = Bi + B2X5 + 832; + Ba Ej + 6; 9 Faculdade de Economia - UFF Prof: Diogo Braga em que yj se refere ao sala´ario dos indiv´ıduos, Xj ´e uma dummy para gˆenero (0 para homem, 1 para mulher), Zj ´e uma dummy para cor (algo como 0 para branco e 1 para n˜ao-brancos) e Ej ´e uma vari´avel categ´orica relativa `a escolaridade. Ej pode assumir os valores 1, 2, 3, 4 a depender da escolaridade do indiv´ıduo j = 1, . . . , n. O que vamos fazer a seguir ´e dar uma roupagem diferente, mais ´util, para a vari´avel Ej. Vamos criar trˆes novas vari´aveis, que aqui chamaremos de E1j, E2j e E3j. E1j ´e igual a 1 se o indiv´ıduo tem apenas o ensino fundamental completo, 0 caso contr´ario. A mesma l´ogica se aplica `as demais vari´aveis. A equa¸c˜ao de regress˜ao passa ent˜ao a ser yj = β1 + β2Xj + β3Zj + β4E1j + β5E2j + β6E3j + ϵj Vocˆe pode estar se perguntando...E onde est´a a dummy referente `a ca- tegoria 4 (p´os-gradua¸c˜ao completa)? Aqui entra a primeira li¸c˜ao sempre que trabalhamos com vari´aveis categ´oricas. Ao pensar nas categorias, o pesquisador tem duas alternativas: (i) ou ele inclui sempre uma categoria a menos como vari´avel explicativa; ou (ii) ele deixa de incluir o intercepto. O problema ao incluir todas as categorias e o intercepto ´e que criamos um problema de perfeita colinearidade. Perceba que E1 + E2 + E3 + E4 = 1 pois as vari´aveis de escolaridade v˜ao assumir o valor 1 sempre que as demais forem 0. Ent˜ao, poder´ıamos escrever E4 = 1 − E1 − E2 − E3. Ou seja, como uma das vari´aveis necessariamente ´e fun¸c˜ao das demais, devo escolher, dentre as quatro, uma delas para ficar de fora e servir como “referˆencia”. A interpreta¸c˜ao ficaria completa com a inclus˜ao do intercepto. Vejamos o sal´ario do Zezinho, que ´e um homem branco com ensino m´edio completo. ˆβ1 ´e o sal´ario de referˆencia de um homem branco com p´os- gradua¸c˜ao completa (a ´unica dummy relacionada `a escolaridade que n˜ao entrou na equa¸c˜ao original). Por ser homem e branco, desconsidero os coe- ficientes associados a X e Z. O ´unico coeficiente relacionado `a escolaridade ser´a β5, uma vez que E2 = 1. O sal´ario de Zezinho ent˜ao seria descrito por ˆβ1 + ˆβ5. Uma observa¸c˜ao importante: Tudo o mais constante, ´e de se pensar que ˆβ5 < 0, pois geralmente quem tem ensino de p´os-gradua¸c˜ao completo tem um sal´ario maior do que algu´em com ensino superior completo. Da´ı, ˆβ1 + ˆβ5 < ˆβ1, ou seja, o componente E2 associado `a escolaridade “tira” uma parte do sal´ario pois assumimos como referˆencia a escolaridade p´os- gradua¸c˜ao completa. 10 Faculdade de Economia - UFF Prof: Diogo Braga Colinearidade Perfeita Uma nota importante sobre a colinearidade perfeita. A forma mais comum de trabalhar com o as- sunto se d´a atrav´es da matriz de vari´aveis explicativas X. Ela aparece quando usamos a nota¸c˜ao matricial para o modelo de regress˜ao linear. Y = Xβ + ϵ em que ϵ ∼ N(0, σ2I). Tomando o exemplo anterior, a matriz X poderia ser escrita 1 x12 z13 1 0 0 1 x22 z23 1 0 0 ... ... ... ... ... ... 1 xr2 zr3 0 1 0 1 xr+12 zr+13 0 1 0 . . . . . . . . . . . . . . . . . . . . . . . . . . 1 xp2 zp3 0 0 1 1 xp+12 zp+13 0 0 1 . . . . . . . . . . . . . . . . . . . . . . . . . . 1 xl2 zl3 0 0 0 . . . . . . . . . . . . . . . . . . . . . . . . . . 1 xn−12 zn−13 0 0 0 1 xn2 zn3 0 0 0 em que a primeira coluna representa o coeficiente associado ao intercepto, a segunda coluna se re- fere ao gˆenero, a terceira disp˜oe a cor e a quarta, quinta e sexta colunas se referem `a escolaridade (a quarta seria E1, a quinta E2 e a sexta E3) e, naturalmente, r < p < l < n, todos n´umeros in- teiros maiores do que 1. Perceba que a partir de l todas as vari´aveis associadas `a escolaridade s˜ao iguais a zero. Isso significa que, nesses ´ındices, E4 = 1, papel “assumido’ pelo intercepto. Essa ´e uma das maneiras corretas de dispormos as vari´aveis categ´oricas na matrix de vari´aveis ex- plicativas. 11 Faculdade de Economia - UFF Prof: Diogo Braga Colinearidade Perfeita Agora, vejamos o seguinte: e se resolvˆessemos colocar a quarta categoria E4 na matriz acima? Ter´ıamos algo como 1 x12 z13 1 0 0 0 1 x22 z23 1 0 0 0 ... ... ... ... ... ... 1 xr2 zr3 0 1 0 0 1 xr+12 zr+13 0 1 0 0 . . . . . . . . . . . . . . . . . . . . . . . . . . 1 xp2 zp3 0 0 1 0 1 xp+12 zp+13 0 0 1 0 . . . . . . . . . . . . . . . . . . . . . . . . . . 1 xl2 zl3 0 0 0 1 . . . . . . . . . . . . . . . . . . . . . . . . . . 1 xn−12 zn−13 0 0 0 1 1 xn2 zn3 0 0 0 1 Percebam que foi acrescentada uma coluna `a matrix X. Al´em disso, notem que a primeira coluna ´e exatamente igual `a soma das colunas 4, 5, 6 e 7, referentes `a vari´avel escolaridade. Dito de ma- neira um pouco mais formal, podemos dizer que a primeira coluna ´e uma combina¸c˜ao linear das ´ultimas 4 colunas. Esse fato traz uma consequˆencia indesejada: XTX, a multiplica¸c˜ao da trans- posta de X por X, deixa de ser uma matriz invert´ıvel. Isso implica que n˜ao conseguimos calcular o estimador de m´ınimos quadrados (veja que ˆβ = (XTX)−1XTy ). Em outras palavras: acrescentar ao intercepto todas as categorias de uma vari´avel implicaria na impossibilidade de obter estima- dor de m´ınimos quadrados. Esse erro ´e comumente conhecido na literatura como armadilha das vari´aveis dummy. Vari´aveis qualitativas junto com quantitativas No exemplo trabalhado acima, dispusemos mais de uma vari´avel qualitativa simultaneamente. Agora, no entanto, temos no modelo, al´em das vari´aveis qualitativas j´a inclu´ıdas, uma vari´avel quantitativa. Seja Hj o tempo de experiˆencia do indiv´ıduo j = 1, . . . , n, medida em 12 Faculdade de Economia - UFF Prof: Diogo Braga anos. O modelo ser´a ent˜ao yj = β1 + β2Xj + β3Zj + β4E1j + β5E2j + β6E3j + +β7Hj + ϵj A an´alise do modelo continua tomando como base o homem branco com p´os-gradua¸c˜ao completa. Em outras palavras, a interpreta¸c˜ao das vari´aveis qualitativas em nada muda com a inclus˜ao de Hj. A diferen¸ca ´e que avaliaremos o sal´ario do indiv´ıduo j tamb´em com o tempo de trabalho. Um ano a mais de trabalho recompensar´a o indiv´ıduo j em β7 unidades monet´arias (perceba que a impress˜ao inicial ´e que β7 > 0, seguindo o senso comum que a experiˆencia acumulada garante um incremento salarial aos indiv´ıduos). Voltando ao caso do Zezinho, que ´e um homem branco com en- sino m´edio completo. Digamos que ele tenha 8 anos de experiˆencia no mercado de trabalho. O sal´ario do Zezinho ser´a encontrado com β1 + β5 + 8 × β7 (lembre-se que concordamos que β5 < 0). Compara¸c˜ao de Modelos (ou Estabilidade de Parˆametros) Uma importante aplica¸c˜ao das vari´aveis qualitativas ´e a possibili- dade de avaliarmos a estabilidade dos parˆametros do modelo. Isso pode se dar ao longo do tempo (numa an´alise de s´erie temporal) ou dentro de uma mesma base transversal (cross section). ´E poss´ıvel, por exem- plo, que algum tipo de lei, um choque advindo de uma crise (petr´oleo na d´ecada de 1970) ou uma pandemia altere a rela¸c˜ao das vari´aveis do modelo. Vejamos o exemplo Ex: Admita que desejamos analisar a rela¸c˜ao entre poupan¸c˜ao pes- soal e renda dispon´ıvel pessoal nos EUA no per´ıodo de 1970-95. Acre- ditamos, no entanto, que essa rela¸c˜ao n˜ao ´e constante ao longo dos 26 anos. Dito de outra forma, a impress˜ao obtida com os dados ´e que talvez precisemos dividir a amostra em 2 per´ıodos, pois a rela¸c˜ao en- tre as vari´aveis parece ter mudado a partir de determinado per´ıodo. Assim, divideremos os dados para os per´ıodos de 1970-81 e 1982-95. Poder´ıamos proceder da seguinte maneira: • 1970-81 a regress˜ao ser´a: Yt = λ1 + λ2Xt + u1t, n1 = 12. 13 Faculdade de Economia - UFF Prof: Diogo Braga • 1982-95 a regress˜ao ser´a: Yt = γ1 + γ2Xt + u2t, n2 = 14. • 1970-95 a regress˜ao ser´a: Yt = α1 + α2Xt + ut, n = n1 + n2 = 26. A terceira regress˜ao assume que n˜ao h´a mudan¸ca nos parˆametros do modelo (ou seja, que n˜ao precisar´ıamos subdividir nossa amostra em 2 subamostras). Em termos dos parˆametros, ter´ıamos algo como α1 = λ1 = γ1 e α2 = λ2 = γ2. As duas primeiras regress˜oes, no entanto, assumem que tanto intercepto como coeficiente angular s˜ao distintos entre os per´ıodos. O teste para avaliar a estabilidade dos parˆametros ´e chamado de Teste de Chow. Apesar da mecˆanica do teste n˜ao ser dif´ıcil, o objetivo aqui nesta se¸c˜ao n˜ao ´e apresent´a-los a ele (Cap 8, Gujarati). A ideia ´e mostrar que podemos adaptar o uso de dummies para fazer exatamente a mesma coisa que pretende o teste. Na verdade, o uso de dummies nos permite ir al´em do que prop˜oe o teste de Chow. Torna-se poss´ıvel avaliar, por exemplo, se a estabilidade dos parˆametros ´e v´alida apenas para o intercepto, para o coeficiente angular ou para ambos simultaneamente, resultado que n˜ao pode ser obtido atrav´es do teste. Seja Dt uma vari´avel dummy que assume valor igual a 1 se as observa¸c˜oes da amostra se referem ao per´ıodo de 1982-95 e 0, caso contr´ario (1970-81). A equa¸c˜ao de regress˜ao ´e a seguinte Yt = α1 + α2Dt + β1Xt + β2(DtXt) + ut em que Yt ´e a poupan¸ca pessoal e Xt ´e a renda dispon´ıvel pessoal. Nesta equa¸c˜ao com a dummy Dt, veja que E (Yt|Dt = 0, Xt) = α1 + β1Xt E (Yt|Dt = 1, Xt) = (α1 + α2) + (β1 + β2) Xt Podemos avaliar, com a estat´ıstica do teste t, a estabilidade do intercepto e do coeficiente angular entre os per´ıodos. Se aceitarmos H0 : α2 = 0, o intercepto ser´a o mesmo. Por outro lado, se aceitarmos H0 : β2 = 0, o coeficiente angular ficar´a est´avel entre os 2 per´ıodos analisados. 14 Faculdade de Economia - UFF Prof: Diogo Braga Intera¸c˜ao entre Vari´aveis Qualitativas Digamos que o tratado inicialmente neste cap´ıtulo seja repaginado e troque o grau de escolaridade, representado pela vari´avel Ej, por anos de estudo, que aqui estar´a notado atrav´es vari´avel Wj. O novo modelo ent˜ao ser´a yj = β1 + β2Xj + β3Zj + β4Wj + ϵj Uma das coisas que se assume nesse modelo ´e o efeito diferencial da vari´avel Xj ´e constante para as duas categorias de cor e o efeito diferencial da vari´avel Zj ´e constante para os dois gˆeneros. Ou seja, o efeito de ser homem (ou mulher) para o sal´ario de um homem (mulher) branco ´e igual ao efeito para um homem (mulher) n˜ao branco. O problema ´e que essa caracteriza¸c˜ao n˜ao se aplica nesse caso. Passa- se a considerar a intera¸c˜ao ou efeito multiplicativo das vari´aveis Xj e Zj. ´E presum´ıvel, por exemplo, que mulheres brancas ganhem mais do que mulheres n˜ao brancas e que esse efeito n˜ao seja meramente aditivo (estamos atestando que h´a uma esp´ecie de “combina¸c˜ao de for¸cas”, um incremento no efeito). Isso ser´a caracterizado com o novo parˆametro β5, por meio da multiplica¸c˜ao das vari´aveis Xj e Zj. yj = β1 + β2Xj + β3Zj + β4Wj + β5 (Xj ∗ Zj) + ϵj em que Xj ∗ Zj = 1 se ´e uma mulher n˜ao branca, ou seja, β5 repre- senta o efeito sobre o sal´ario de ser uma mulher n˜ao branca. A nova vari´avel multiplicativa cria um efeito incremental sobre a vari´avel de- pendente. Se o efeito adicional for positivo, entendemos que h´a uma “compensa¸c˜ao” salarial por ser mulher n˜ao branca. Em contrapartida, se o coeficiente for negativo, h´a um efeito “punitivo”, que acentua a diferen¸ca salarial de mulheres n˜ao brancas com os demais grupos. 15 Faculdade de Economia - UFF Prof: Diogo Braga Uso das Vari´aveis Qualitativas para representar Sazonali- dade Sazonalidade ´e um fenˆomeno muito comum em s´eries temporais econˆomicas. Nos casos t´ıpicos de sazonalidade h´a uma esp´ecie de “lei” que varia¸c˜oes regulares dos dados dentro de janelas espec´ıficas de tempo. Esses intervalos no tempo podem ser meses, trimestres, se- manas, etc. Uma das “leis” mais conhecidas s˜ao as esta¸c˜oes do ano. Elas s˜ao capazes de determinar, por exemplo, se certos meses ser˜ao chu- vosos ou mais frios. Para facilitar a modelagem e eventualmente nos concetrarmos em outros fatores das s´eries temporais, como tendˆencia, padr˜oes c´ıclicos e padr˜oes irregulares (aleat´orios), recomenda-se iden- tificar e remover a sazonalidade. As vari´aveis qualitativas s˜ao bastante ´uteis para esse fim. Ex: Observe abaixo um modelo de regress˜ao linear que relaciona as ven- das de equipamentos de esqui e um ´ındice que reflete o interesse do consumidor em adquirir esses bens nos EUA, entre 1964 e 1973. Os dados s˜ao trimestrais. St = β1 + β2PDIt + ϵt Esse ´e um caso t´ıpico em que a sazonalidade n˜ao pode ser negli- genciada. Espera-se que o mercado de esqui esteja aquecido (com o perd˜ao do trocadilho) nos meses mais frios do hemisf´erio norte. Com dados trimestrais, n˜ao temos os meses separados adequadamente por esta¸c˜oes, ent˜ao n˜ao ´e poss´ıvel dizer com precis˜ao se os meses mais inte- ressantes para o com´ercio de equipamentos de esqui est˜ao no primeiro ou no quarto trimestre. Por isso, vamos consolidar a vari´avel que re- presentar´a a sazonalidade com 2 trimestres. Seja Zt a vari´avel dummy que ´e igual a 1 se as observa¸c˜oes est˜ao nos dois trimestres mais frios (inverno) e 0, se as observa¸c˜oes correspondem aos trimestres mais quentes (ver˜ao). Assim, teremos St = β1 + β2PDIt + β3Zt + ϵt Veja que assumimos nesse modelo que o impacto do interesse do consumidor nas vendas ´e o mesmo para os dois intervalos de tempo 16 Faculdade de Economia - UFF Prof: Diogo Braga (isso n˜ao necessariamente acontecer´a, n˜ao seria estranho se a reta de regress˜ao no per´ıodo mais frio fosse mais inclinada do que no per´ıodo mais quente. Esse efeito seria introduzido pela intera¸c˜ao entre Zt e PDIt, dado por Zt∗PDIt). S´o exisitira´a diferen¸ca no “n´ıvel” de vendas, n˜ao no efeito marginal. Ex: Agora considere o mercado de geladeiras. Parece razo´avel pensar que em meses mais quentes h´a um consumo maior de geladeiras, tal- vez motivada pelo uso mais frequente (pode-se pensar at´e em picos de energia, que acabam danificando esse tipo de equipamento). Seja Yt a venda de geladeiras e Djt, j = 1, . . . , 4, a vari´avel categ´orica que representa cada trimestre. Sabemos que como a vari´avel Djt tem 4 categorias (uma para cada trimestre) ou removemos uma delas (man- tendo o intercepto) para n˜ao incorrermos na armadilha das dummies ou retiramos o intercepto. Neste caso, faremos usando a segunda abor- dagem. Nosso modelo ser´a ent˜ao Yt = α1D1t + α2D2t + α3D3t + α4D4t + ϵt Se as vari´aveis (ou um subconjunto delas) Djt forem estatistica- mente significativas, teremos a confirma¸c˜ao do efeito sazonal sobre a venda de geladeiras (Yt). Regress˜ao Segmentada (Piecewise) Numa regress˜ao segmentada, a regress˜ao ´e separada em determi- nado ponto, tal que os coeficientes (intercepto e coeficiente angular, numa regress˜ao simples) estimados s˜ao diferentes antes e depois deste ponto. ´E como se a partir de um certo n´ıvel as vari´aveis em quest˜ao passam a se relacionar de uma forma diferente (`as vezes sutilmente, `as vezes brutalmente). Digamos, por exemplo, que uma companhia re- munere sua equipe de vendas conforme o valor bruto da opera¸c˜ao. Se o funcion´ario atingir um certo n´ıvel de venda, a estrutura de comiss˜ao muda, pagando a ele um pouco mais. Seja X∗ o n´ıvel a ser atingido por cada funcion´ario e Dj uma vari´avel dummy que ´e igual a 1 se X > X∗ e 0, se X < X∗. Teremos a seguinte equa¸c˜ao de regress˜ao 17 Faculdade de Economia - UFF Prof: Diogo Braga Yj = α1 + α2Xj + α3 (Xj − X∗) Dj + ϵj em que Yj ´e a comiss˜ao por vendas e Xj s˜ao as vendas em si. A ideia ´e que se o empregado j vender acima de X∗, ele ganha uma comiss˜ao adicional de β3, que se soma a β2. Veja que isso altera a confi- gura¸c˜ao da reta de regress˜ao a partir de X∗, n˜ao apenas pelo coeficiente angular diferente, mas tamb´em pelo intercepto. Evidentemente, se a hip´otese H0 : β3 = 0 n˜ao for rejeitada, temos evidˆencia estat´ıstica para descartar a possibilidade de regress˜ao segmentada. Autocorrela¸c˜ao dos termos de erro Uma das hip´oteses do teorema de Gauss-Markov era a inexistˆencia de autocorrela¸c˜ao, ou seja, E (ϵiϵj) = 0, para todo i ̸= j. Naturalmente, usando a hip´otese de que os termos de erro tˆem m´edia zero, podemos associar a hip´otese de inexistˆencia de autocorrela¸c˜ao `a covariˆancia Cov (ϵi, ϵj) = E (ϵiϵj) − E(ϵi)E(ϵj) = E (ϵiϵj) = 0 Essa hip´otese garante que qualquer efeito n˜ao antecipado (termo de erro) sobre a vari´avel dependente ´e restrito `aquela observa¸c˜ao (que pode ser temporal). Para modelos de cortes transversais, essa hip´otese parece fazer sentido. Tome como exemplo um modelo de renda dispon´ıvel e consumo das fam´ılias. Faz sentido que um evento aleat´orio que aumente o consumo de uma fam´ılia (por exemplo, uma visita de amigos) n˜ao interfira no padr˜ao de consumo das demais. Agora, tome um exemplo de um modelo em s´eries temporais. Di- gamos que vocˆe queira entender a rela¸c˜ao entre o pre¸co e o consumo de um determinado bem, por exemplo o frango. Um dos principais custos da produ¸c˜ao de frango ´e o milho. Imagine que uma seca se abate sobre um grande produtor de milho. ´E natural, em fun¸c˜ao da escassez, que o pre¸co do milho aumente e, por consequˆencia, o pre¸co do frango. Esse evento n˜ao antecipado, portanto, causar´a um efeito n˜ao negligenci´avel sobre a demanda de frango. A quest˜ao ´e: ser´a que o 18 Faculdade de Economia - UFF Prof: Diogo Braga impacto do evento sobre a demanda de frango ficar´a circunscrito ape- nas ao per´ıodo corrente? Parece que essa hip´otese ´e muito inveross´ımil para modelos temporais. Provavelmente o impacto sobre a demanda de frango vai durar alguns trimestres, at´e que uma nova safra, livre de anormalidades, possa ser produzida. Um exemplo pr´atico do que se discutiu no par´agrafo anterior ´e a peste su´ına africana, que causou uma crise sanit´aria sem precedentes sobre alguns dos principais produtores de su´ınos do mundo, particu- larmente na China. O padr˜ao alimentar chinˆes (o maior consumidor de su´ınos do mundo, de longe) se alicer¸ca na carne su´ına. Com pre¸co muito alto, ´e natural que se passe a observar substitutos diretos, como bovinos e frango. Fato ´e que a demanda por bovinos aumentou substan- cialmente, provocando at´e “apag˜ao” na produ¸c˜ao. Esse efeito da peste su´ına pode ser exergado como restrito ao per´ıodo corrente? Obvia- mente, n˜ao. Apesar de ser um evento n˜ao antecip´avel (e que, portanto, faz parte do termo de erro), os efeitos sobre a demanda de bovinos vai muito al´em de um ´unico per´ıodo. Dito tudo isso, quando os termos de erro s˜ao autocorrelacionados, temos que Cov (ϵi, ϵj) = E (ϵiϵj) − E(ϵi)E(ϵj) = E (ϵiϵj) ̸= 0 Como estamos falando aqui quase que exclusivamente de modelos temporais, podemos adaptar a nota¸c˜ao para visualiza¸c˜ao mais simples do tempo Cov (ϵt, ϵt−1) = ρσ2 Para entender o mecanismo de gera¸c˜ao da autocorrela¸c˜ao, devemos recorrer primeiramente `as equa¸c˜oes mais simples entre ϵt e ϵt−1 e depois desenvolvˆe-las recursivamente ϵt = ρϵt−1 + ut em que ut ∼ N (0, σ2 u), E (utus) = 0, para todo t ̸= s e E (utϵt−1) = 0, para todo t. 19 Faculdade de Economia - UFF Prof: Diogo Braga Uma equacao como essa é conhecida como um modelo autorregres- sivo de primeira ordem ou AR(1). Podemos desenvolver recursiva- mente essa equacao, tal como €¢ = Per—-1 + Ut = p (per—2 + Ut-1) + Ut = = per2 + pur-1 + Ut = = p” (per_3 + Ur_2) + pue_1 + UH = = p'€0 + pu + p’ us +... pur + put—1 + Ut Admitimos que €)9 ~ N (0. tin). Note que como & é uma com- binacao linear de €o, U1, U2,..., Ue, também tera distribuicao normal. Além disso, veja que E(a)=E (p'eo + pt uy + pus +... pr ur-2 + puri + ur) = = p'E(e) +p ' E(u) +p 7B (us) +... + p?E(ur2) + pE(u-1) + E(ut) = = 0 e Var (e&) = Var (p'eo + ph tur + po ug +... + p?ur_2 + pura + ur) = = p"Var(e9) +p? *'Var(uz) + p? * ?Var(uz) +... +p? ?Var(um_2) + p?Var(m_1) + Var(uz) = 2 =p | +p Noi + pt 2a, b.. bp ro, + poy +04 = a ok ok ok = pt a 402 [e° i-1 4 2 P24 gp 4 PHI] _ 2 2t _ 2 | % a a fed re I 2t —_ 2t l-p l—p o? 1p 20 Faculdade de Economia - UFF Prof: Diogo Braga Veja que Var(e;,) sera constante. Dai, temos €, = per-1 + Ut = = pPretst+ p> ‘esti +P” Ur—sp2 +... + pura t+ ur Multiplicando os dois lados por ¢,_, e tomando o valor esperado, temos E (eé-s) = PE (G@_.) + 0° 1 E (-s€t-s41) +e.e Ht pE (€,_sUt-1) + EB (€:_5Uz) = = p'Var (Gs) = peo” 2 Observe que demos a notacao a? = oe Podemos perceber que Cov (&, €-1) = po”, ou seja Cov (€, €-1) Cov (€¢, €-1) a o? J/Var(e)\/Var(e_1) Uma hipotese que é crucial para tudo que esta aqui funcionar ade- quadamente é a estacionariedade (Se p < 1 dizemos que uma série é estaciondria). De maneira mais simples, dizemos que uma série é es- taciondria quando preserva suas principais estatisticas nao importa o periodo temporal analisado (uma série com tendéncia e/ou sazonali- dade nao é estacionaria, pois suas caracteristicas mudam nas devidas estacdes, por exemplo). 21