·

Ciências Econômicas ·

Econometria

Send your question to AI and receive an answer instantly

Ask Question

Preview text

Inferencia no Modelo Normal de Regressao Linear Multipla Diogo Braga 22 de Abril de 2021 Fatos Gerais: Yt = Bit BoXi2+...+ BeXie t+ € e, ~ N(0,07) Utilizando a abordagem matricial, temos: Y=XB+e e~ N(0,071) Hipdteses basicas do modelo normal de regressao linear multipla: e Nao autocorrelagao serial: E(¢;,€;) =O Vij e Homocedasticidade: Var(e) = 0? Vt e Varidveis independentes nao estocasticas e Cov(e, Xx.) =OVt,k e Auséncia de Multicolinearidade: Nao ha relacao linear exata entre as varidveis independentes A partir dessas hipdéteses, obtivemos: ° 8; ~ N(Gj,0°(X7X)"1) e 8 é0 melhor estimador linear nao tendencioso e o2 é estimador viesado de o?. Construfmos $2 = ere em que k é60 numero de {’s no modelo e n é 0 nimero de observacoes. Além disso, sabemos, naturalmente, que SQR = e’e = )-e?. 1 Faculdade de Economia - UFF Prof: Diogo Braga 0 L =k TY? —~kéont d de liberdade d 3 X74 Em que n é o nimero de graus de liberdade da distribuicao chi-quadrado. e No modelo miltiplo, faz mais sentido o uso de R2 = R? — &—(1 —R?), Para testar o modelo de regressao multipla, basta utilizarmos suas hipdteses basicas, além dos resultados de inferéncia que obtivemos subsequentemente. 1. Teste Simples para {; Nesse tipo de abordagem testamos isoladamente cada um dos 6;, j = 1,...,k. Ho : Bj =0 A, : Bj tx 0 Naturalmente a hipdtese alternativa depende da conveniéncia do mo- delo, podendo ser também de desigualdade. -> Regra de decisao B;-B; “Sy ~ th—k Em testes bilaterais, basta dividir o nivel de significancia @ por 2. Temos um intervalo de confianga para 3; de Bj — tn—p,238g, < Bj < Bj + tn—b1—9}84, para cada j € {1,...,k}. 2. Testes sobre a significancia de um subconjunto de varidveis explicativas Agora queremos testar a significancia de um subconjunto de (’s, da seguinte forma: Ao: Bp41 = Bpt2 =... = Be =0 Hy, : Nem todos os (’s sao iguais a zero Essa hipdtese pode ser descrita de outra forma: Ho : Modelo Restrito : y = 61 + GoXi2 +... + BpXtp + & Hy, : Modelo Irrestrito : y = 8; + yey By Xu +e -> Regra de decisao 2 Faculdade de Economia - UFF Prof: Diogo Braga — (SQRur—-SQRur)/k-p P= SORa [nk ~ F'R—p.n—k} Rejeitamos Ho quando F' > fx_pn—k,a- Ou seja, quando a retirada de informacao aumenta substancialmente a soma dos quadrados dos residuos, tenho evidéncias para rejeitar a hipdtese nula associada ao Modelo Restrito. Como observacao, vale a pena deixar claro que SQRyr ~ Xi» e SQRur ~ x2 E possivel provar que se X; ~ x}, e XQ ~ X75 X,+X2 ~ x2,4;,- Assim, o numerador referente a F tem distribuicao 2 _ 2 X{(n—p)—(n—k)} ~ Xk—p" 3. Teste sobre a significancia de todas as varidveis explicativas Nesse caso temos um teste com a seguinte forma: Ho : 82 = 63 =... = By =0 Hy, : Nem todos os (’s sao iguais a zero Esse teste 6 um caso particular do teste anterior. O Modelo Restrito, da forma como descrevemos anteriormente, passa a ter apenas {; como explicacao para as variagoes de y,. Em outras palavras Ao: yr = Pit & Fy: yy = Bi + oy BX + -> Regra de decisao Fe (SQRur —SQRyutr)/k—-1 _ (SQT — SQRm1)/k-1 SQRur/n—k SQRur/n—k — SQE/k—-1 F ~ SQRuz/n—k {kh Ln—k} Uma vez mais, rejeitamos Ho se F > frp_—1.n—k,a}, para um dado nivel de significancia. Note que SQRyr ~ xX2_1, levando o numerador de F a ter distribuicao Xf(n—1)—(n—k)} = xp: Logo, F ~ Fyp_ 1 n—K}- Além disso, note que SQRyr = SQT. A demonstracao é direta. 3 Faculdade de Economia - UFF Prof: Diogo Braga SQRur = tet ef = ie (ye — Ht) = wt (Ye _ 61) ; B=9 2 SQRur=Dpa(y — 9) = SQT 4. Testes como funcdo de R? Podemos dispor as regras de decisio dos testes como funcdo de R?. Note que podemos escrever SQR, restrito ou irrestrito, da seguinte forma: R?=1- 38% ». SQT x R? = SQT-SQR «. SQR = SQT x (1 — R?) Assim SQRur — SQRmtr _ SQT x (1— Rie) — SQT x (1- Ri e7) _ SQRur SQT x (1— Ri;;) 7 _ (= Rizr) — = Ris) _ 1— Rie, _ Ris — Rive 1- Ri, 2 _ p2 _ Isso sugere que Cu Malle ~ Py pn—k}; CaSO estejamos no con- texto (2). Outra maneira de pensarmos os testes de hipdtese se dé através do numero de restrigdes impostas ao modelo geral. Seja m o numero de restricgdes ao modelo y% = 61 + yoy ByXuy + &. -> Regra de decisao — (SQRmr—-SQRuz)/m PF a SOR /nok ~ Fonn—k} No teste Ho: Bo4+1 = Ppt2 =... = Pe =0 Hy : Nem todos os (’s sao iguais a zero existem k — p restricdes. Nesse caso, m = k — p. 4 Faculdade de Economia - UFF Prof: Diogo Braga 5. Testes para o acréscimo de varidveis explicativas Basicamente o que queremos testar é se a inclusao de algumas varidveis, de forma conjunta, é significativa estatisticamente para explicar y. Po- demos escrever as hipdteses da seguinte forma: Alo: Bea = Prog =... = 2, =0 Hy, : Nem todos os (’s sao iguais a zero Ou, equivalentemente, k Ho: y= Bi + yo BiXu + & l Ay: yt = Bi t+ Vyao BiXti + € em que! > k. A tinica diferenca em relacéo aos demais testes é que o modelo-base é a equagao com | ~’s. O modelo restrito passa a ser a ~ k equagao yy = Bi + ojo BiXtui + &- -> Regra de decisao — (SQRur—SQRmu7r)/l-k B= SQRur/n—l ~ Fi-k.n-0} Neste caso, | — k é 0 ntimero de restrigdes (numero de 3s na hipdtese nula). Visto por outra forma, SQRyr ~ x74 e SQRyr ~ x2) Assim, SQRur — SQRur ~ Xin—k)—(n—1) os SQRur— SQRmi ~ Xj_x 6. Testes para diversas restrigdes Assuma o seguinte contexto Ao: 62 = Bs 63+ 84=1 Tomando a regra de deciséo que leva em conta o numero de restricoes, basta fazer _ (SQRumr—-SQRmuz1)/2 P= SQRutr/n—k ~ Fo.n—ky 5 Faculdade de Economia - UFF Prof: Diogo Braga uma vez que dispomos de 2 restricoes. Vocé pode olhar para o problema sob outra perspectiva. Tome a equacao original e as restricdes impostas na hipdtese nula. A equacao que ira testar tera o seguinte formato k Ye = Bi + BoXi2 + 63X13 + BaXt4 + Ss" BiXvi + € i=5 k = 81 + B3Xv2 + B3Xig + (1 — B3)Xt4 + YS BXu + e1 i=5 k = Xia + Bi + B3{Xt2 + X13 — Xtat + Ss" BiXu + & i=5 k yt — Xta = Bi + B3V + S- Bi Xi + & i=5 k y, = Bi + B3V + S- Bi Xi + €& i=5 ”Perdemos” duas fontes de informagéo no modelo y; acima. Isso im- plica que SQRyrR ~ Xo pee e, portanto, o numerador de F' tera distribuicdo \3. Isso explica o porqué da distribuicgéo F (2,n—k} 7. Unica restricgao Quando dispusermos de uma tinica restricao na hipdtese nula, podemos utilizar o teste t. O contexto pode ser o seguinte Ho : Bi = B; A: 8: F B; -> Regra de decisao (Gi By) (Be Ps) ~ tk {8;—-Bj} Sob Ho, terfamos entao 6 Faculdade de Economia - UFF Prof: Diogo Braga Say © tok {8;—Bj} Por se tratar de um teste bilateral, vocé nao rejeitard a hipdotese nula quando —tya} < ae < ty9}. Esse teste é equivalente ao teste Bi -B; F com a seguinte regra de decisao. — (SQRur—-SQRmuy)/1 B= SORui/n=k ~ Fa n—ry A diferenca, obviamente, é que o teste F serd unicaudal. Vocé rejeita Ho quando F' > fi nko}: Formas Funcionais dos Modelos de Regressao e O modelo log-linear Y= BX? me Se tormarmos o logaritmo, temos log Yj = log 61 + Bg log Xj + uj Esse é provavelmente a forma funcional mais util quando queremos medir com facilidade a elasticidade. Veja que, neste caso, G2 mede a +x +x dY\ (X taxa de variacéo em Y dada uma variagéo em X, (Sy) (+). e O modelo log-lin ¥; =Yo(1+r)! Se tomarmos o log, temos log Y; = log 61 + Bot + ue 7 Faculdade de Economia - UFF Prof: Diogo Braga acrescentando ao formato o termo de erro. Esse tipo de forma funcional é importante quando queremos avaliar a taxa de crescimento de certas vardveis econdmicas, como populacao, PIB, oferta de moeda, taxa de desemprego, produtividade, etc. Uma questao a observar é que o parametro estimado nos da a taxa de crescimento “instantanea” (em um certo ponto no tempo) e nao a taxa composta (para um determinado periodo de tempo). Para fazer a conta, basta fazer [antilog (32) - 1]. e Modelos de tendéncia linear Existe a possilidade de escrevermos um modelo parecido com o do item anterior. Veja que Yj; = log 61 + Bot + ut leva em consideracao uma varidvel dependente sem o logaritmo. A interpretacao dos modelos é naturalmente diferente. O modelo com log relativo ao tempo ¢ avalia a variacaéo percentual sobre Y, enquanto o modelo de tendéncia linear mostra a variagéo absoluta em Y (por exemplo, em milh6es de dolares). e O modelo lin-log Y;, = 81 + By log Xj + ui e Modelos Reciprocos Y, = (i+ 6 , + —_ _ u; t 1 2 X; a O exemplo mais tipico para aplicacgaéo de modelos recfprocos é a curva de Phillips, um tema bastante conhecido de macroeconomia. Y¥; = 61 + Bot + ue 8 Faculdade de Economia - UFF Prof: Diogo Braga Modelo Equacao Coef. Angular Elasticidade . _ x Linear Y = Pi + GoX Bo B2 (+) Log-linear log Y = 6; + 6g log X Bo (*) B2 Log-lin log Y = By + Box BoY BoX Lin-log Y = Bi + Balog X Bo (+) Bo (¥) Reciprocos Y = 61 + Bo (x) — Be (xz) —B2 (xy) Log Rec log ¥Y = 6y + 62 (+) Bo (+) By (+) Tabela 1: Formas Funcionais Variaveis Qualitativas Num modelo econométrico, as varidveis qualitativas - mais comumente chamadas de dummy - podem ser muito Uteis para explicar, ao menos em parte, as oscilagdes da varidvel dependente. Temos basicamente dois tipos de varidveis as quais atribuimos o nome de “dummy” e Varidveis que assumem apenas dois valores, geralmente 0 e 1; e e Varidveis que ainda estao restritas a um nimero v de categorias e assumem valores inteiros, geralmente v = 1,2,.... O que faremos é transformar essas varidveis categéricas em varidveis bindarias. Ex: E muito comum lidarmos com dados de escolaridade. Isso porque a escolaridade parece ser uma varidvel estatisticamente significativa para ex- plicar, por exemplo, as oscilagoes dos saldrios dos individuos. Geralmente subdividimos a escolaridade segundo o grau alcangado (isso também seria obtido com anos de estudo). Poderifamos, por exemplo, atribuir 1 para quem tem ensino fundamental completo, 2 ensino médio completo, 3 para ensino superior completo e 4 para qualquer outro grau completo acima do ensino superior (podemos chamar de pés-graduacao completa). A tabela de dados vird com esses niimeros (1, 2,3 e 4) na coluna referente a escolari- dade. A seguir, vocé transformara cada uma dessas categorias numa dummy propria. Veja a equacao abaixo Yj = Bi + B2X5 + 832; + Ba Ej + 6; 9 Faculdade de Economia - UFF Prof: Diogo Braga em que yj se refere ao sala´ario dos indiv´ıduos, Xj ´e uma dummy para gˆenero (0 para homem, 1 para mulher), Zj ´e uma dummy para cor (algo como 0 para branco e 1 para n˜ao-brancos) e Ej ´e uma vari´avel categ´orica relativa `a escolaridade. Ej pode assumir os valores 1, 2, 3, 4 a depender da escolaridade do indiv´ıduo j = 1, . . . , n. O que vamos fazer a seguir ´e dar uma roupagem diferente, mais ´util, para a vari´avel Ej. Vamos criar trˆes novas vari´aveis, que aqui chamaremos de E1j, E2j e E3j. E1j ´e igual a 1 se o indiv´ıduo tem apenas o ensino fundamental completo, 0 caso contr´ario. A mesma l´ogica se aplica `as demais vari´aveis. A equa¸c˜ao de regress˜ao passa ent˜ao a ser yj = β1 + β2Xj + β3Zj + β4E1j + β5E2j + β6E3j + ϵj Vocˆe pode estar se perguntando...E onde est´a a dummy referente `a ca- tegoria 4 (p´os-gradua¸c˜ao completa)? Aqui entra a primeira li¸c˜ao sempre que trabalhamos com vari´aveis categ´oricas. Ao pensar nas categorias, o pesquisador tem duas alternativas: (i) ou ele inclui sempre uma categoria a menos como vari´avel explicativa; ou (ii) ele deixa de incluir o intercepto. O problema ao incluir todas as categorias e o intercepto ´e que criamos um problema de perfeita colinearidade. Perceba que E1 + E2 + E3 + E4 = 1 pois as vari´aveis de escolaridade v˜ao assumir o valor 1 sempre que as demais forem 0. Ent˜ao, poder´ıamos escrever E4 = 1 − E1 − E2 − E3. Ou seja, como uma das vari´aveis necessariamente ´e fun¸c˜ao das demais, devo escolher, dentre as quatro, uma delas para ficar de fora e servir como “referˆencia”. A interpreta¸c˜ao ficaria completa com a inclus˜ao do intercepto. Vejamos o sal´ario do Zezinho, que ´e um homem branco com ensino m´edio completo. ˆβ1 ´e o sal´ario de referˆencia de um homem branco com p´os- gradua¸c˜ao completa (a ´unica dummy relacionada `a escolaridade que n˜ao entrou na equa¸c˜ao original). Por ser homem e branco, desconsidero os coe- ficientes associados a X e Z. O ´unico coeficiente relacionado `a escolaridade ser´a β5, uma vez que E2 = 1. O sal´ario de Zezinho ent˜ao seria descrito por ˆβ1 + ˆβ5. Uma observa¸c˜ao importante: Tudo o mais constante, ´e de se pensar que ˆβ5 < 0, pois geralmente quem tem ensino de p´os-gradua¸c˜ao completo tem um sal´ario maior do que algu´em com ensino superior completo. Da´ı, ˆβ1 + ˆβ5 < ˆβ1, ou seja, o componente E2 associado `a escolaridade “tira” uma parte do sal´ario pois assumimos como referˆencia a escolaridade p´os- gradua¸c˜ao completa. 10 Faculdade de Economia - UFF Prof: Diogo Braga Colinearidade Perfeita Uma nota importante sobre a colinearidade perfeita. A forma mais comum de trabalhar com o as- sunto se d´a atrav´es da matriz de vari´aveis explicativas X. Ela aparece quando usamos a nota¸c˜ao matricial para o modelo de regress˜ao linear. Y = Xβ + ϵ em que ϵ ∼ N(0, σ2I). Tomando o exemplo anterior, a matriz X poderia ser escrita   1 x12 z13 1 0 0 1 x22 z23 1 0 0 ... ... ... ... ... ... 1 xr2 zr3 0 1 0 1 xr+12 zr+13 0 1 0 . . . . . . . . . . . . . . . . . . . . . . . . . . 1 xp2 zp3 0 0 1 1 xp+12 zp+13 0 0 1 . . . . . . . . . . . . . . . . . . . . . . . . . . 1 xl2 zl3 0 0 0 . . . . . . . . . . . . . . . . . . . . . . . . . . 1 xn−12 zn−13 0 0 0 1 xn2 zn3 0 0 0   em que a primeira coluna representa o coeficiente associado ao intercepto, a segunda coluna se re- fere ao gˆenero, a terceira disp˜oe a cor e a quarta, quinta e sexta colunas se referem `a escolaridade (a quarta seria E1, a quinta E2 e a sexta E3) e, naturalmente, r < p < l < n, todos n´umeros in- teiros maiores do que 1. Perceba que a partir de l todas as vari´aveis associadas `a escolaridade s˜ao iguais a zero. Isso significa que, nesses ´ındices, E4 = 1, papel “assumido’ pelo intercepto. Essa ´e uma das maneiras corretas de dispormos as vari´aveis categ´oricas na matrix de vari´aveis ex- plicativas. 11 Faculdade de Economia - UFF Prof: Diogo Braga Colinearidade Perfeita Agora, vejamos o seguinte: e se resolvˆessemos colocar a quarta categoria E4 na matriz acima? Ter´ıamos algo como   1 x12 z13 1 0 0 0 1 x22 z23 1 0 0 0 ... ... ... ... ... ... 1 xr2 zr3 0 1 0 0 1 xr+12 zr+13 0 1 0 0 . . . . . . . . . . . . . . . . . . . . . . . . . . 1 xp2 zp3 0 0 1 0 1 xp+12 zp+13 0 0 1 0 . . . . . . . . . . . . . . . . . . . . . . . . . . 1 xl2 zl3 0 0 0 1 . . . . . . . . . . . . . . . . . . . . . . . . . . 1 xn−12 zn−13 0 0 0 1 1 xn2 zn3 0 0 0 1   Percebam que foi acrescentada uma coluna `a matrix X. Al´em disso, notem que a primeira coluna ´e exatamente igual `a soma das colunas 4, 5, 6 e 7, referentes `a vari´avel escolaridade. Dito de ma- neira um pouco mais formal, podemos dizer que a primeira coluna ´e uma combina¸c˜ao linear das ´ultimas 4 colunas. Esse fato traz uma consequˆencia indesejada: XTX, a multiplica¸c˜ao da trans- posta de X por X, deixa de ser uma matriz invert´ıvel. Isso implica que n˜ao conseguimos calcular o estimador de m´ınimos quadrados (veja que ˆβ = (XTX)−1XTy ). Em outras palavras: acrescentar ao intercepto todas as categorias de uma vari´avel implicaria na impossibilidade de obter estima- dor de m´ınimos quadrados. Esse erro ´e comumente conhecido na literatura como armadilha das vari´aveis dummy. Vari´aveis qualitativas junto com quantitativas No exemplo trabalhado acima, dispusemos mais de uma vari´avel qualitativa simultaneamente. Agora, no entanto, temos no modelo, al´em das vari´aveis qualitativas j´a inclu´ıdas, uma vari´avel quantitativa. Seja Hj o tempo de experiˆencia do indiv´ıduo j = 1, . . . , n, medida em 12 Faculdade de Economia - UFF Prof: Diogo Braga anos. O modelo ser´a ent˜ao yj = β1 + β2Xj + β3Zj + β4E1j + β5E2j + β6E3j + +β7Hj + ϵj A an´alise do modelo continua tomando como base o homem branco com p´os-gradua¸c˜ao completa. Em outras palavras, a interpreta¸c˜ao das vari´aveis qualitativas em nada muda com a inclus˜ao de Hj. A diferen¸ca ´e que avaliaremos o sal´ario do indiv´ıduo j tamb´em com o tempo de trabalho. Um ano a mais de trabalho recompensar´a o indiv´ıduo j em β7 unidades monet´arias (perceba que a impress˜ao inicial ´e que β7 > 0, seguindo o senso comum que a experiˆencia acumulada garante um incremento salarial aos indiv´ıduos). Voltando ao caso do Zezinho, que ´e um homem branco com en- sino m´edio completo. Digamos que ele tenha 8 anos de experiˆencia no mercado de trabalho. O sal´ario do Zezinho ser´a encontrado com β1 + β5 + 8 × β7 (lembre-se que concordamos que β5 < 0). Compara¸c˜ao de Modelos (ou Estabilidade de Parˆametros) Uma importante aplica¸c˜ao das vari´aveis qualitativas ´e a possibili- dade de avaliarmos a estabilidade dos parˆametros do modelo. Isso pode se dar ao longo do tempo (numa an´alise de s´erie temporal) ou dentro de uma mesma base transversal (cross section). ´E poss´ıvel, por exem- plo, que algum tipo de lei, um choque advindo de uma crise (petr´oleo na d´ecada de 1970) ou uma pandemia altere a rela¸c˜ao das vari´aveis do modelo. Vejamos o exemplo Ex: Admita que desejamos analisar a rela¸c˜ao entre poupan¸c˜ao pes- soal e renda dispon´ıvel pessoal nos EUA no per´ıodo de 1970-95. Acre- ditamos, no entanto, que essa rela¸c˜ao n˜ao ´e constante ao longo dos 26 anos. Dito de outra forma, a impress˜ao obtida com os dados ´e que talvez precisemos dividir a amostra em 2 per´ıodos, pois a rela¸c˜ao en- tre as vari´aveis parece ter mudado a partir de determinado per´ıodo. Assim, divideremos os dados para os per´ıodos de 1970-81 e 1982-95. Poder´ıamos proceder da seguinte maneira: • 1970-81 a regress˜ao ser´a: Yt = λ1 + λ2Xt + u1t, n1 = 12. 13 Faculdade de Economia - UFF Prof: Diogo Braga • 1982-95 a regress˜ao ser´a: Yt = γ1 + γ2Xt + u2t, n2 = 14. • 1970-95 a regress˜ao ser´a: Yt = α1 + α2Xt + ut, n = n1 + n2 = 26. A terceira regress˜ao assume que n˜ao h´a mudan¸ca nos parˆametros do modelo (ou seja, que n˜ao precisar´ıamos subdividir nossa amostra em 2 subamostras). Em termos dos parˆametros, ter´ıamos algo como α1 = λ1 = γ1 e α2 = λ2 = γ2. As duas primeiras regress˜oes, no entanto, assumem que tanto intercepto como coeficiente angular s˜ao distintos entre os per´ıodos. O teste para avaliar a estabilidade dos parˆametros ´e chamado de Teste de Chow. Apesar da mecˆanica do teste n˜ao ser dif´ıcil, o objetivo aqui nesta se¸c˜ao n˜ao ´e apresent´a-los a ele (Cap 8, Gujarati). A ideia ´e mostrar que podemos adaptar o uso de dummies para fazer exatamente a mesma coisa que pretende o teste. Na verdade, o uso de dummies nos permite ir al´em do que prop˜oe o teste de Chow. Torna-se poss´ıvel avaliar, por exemplo, se a estabilidade dos parˆametros ´e v´alida apenas para o intercepto, para o coeficiente angular ou para ambos simultaneamente, resultado que n˜ao pode ser obtido atrav´es do teste. Seja Dt uma vari´avel dummy que assume valor igual a 1 se as observa¸c˜oes da amostra se referem ao per´ıodo de 1982-95 e 0, caso contr´ario (1970-81). A equa¸c˜ao de regress˜ao ´e a seguinte Yt = α1 + α2Dt + β1Xt + β2(DtXt) + ut em que Yt ´e a poupan¸ca pessoal e Xt ´e a renda dispon´ıvel pessoal. Nesta equa¸c˜ao com a dummy Dt, veja que E (Yt|Dt = 0, Xt) = α1 + β1Xt E (Yt|Dt = 1, Xt) = (α1 + α2) + (β1 + β2) Xt Podemos avaliar, com a estat´ıstica do teste t, a estabilidade do intercepto e do coeficiente angular entre os per´ıodos. Se aceitarmos H0 : α2 = 0, o intercepto ser´a o mesmo. Por outro lado, se aceitarmos H0 : β2 = 0, o coeficiente angular ficar´a est´avel entre os 2 per´ıodos analisados. 14 Faculdade de Economia - UFF Prof: Diogo Braga Intera¸c˜ao entre Vari´aveis Qualitativas Digamos que o tratado inicialmente neste cap´ıtulo seja repaginado e troque o grau de escolaridade, representado pela vari´avel Ej, por anos de estudo, que aqui estar´a notado atrav´es vari´avel Wj. O novo modelo ent˜ao ser´a yj = β1 + β2Xj + β3Zj + β4Wj + ϵj Uma das coisas que se assume nesse modelo ´e o efeito diferencial da vari´avel Xj ´e constante para as duas categorias de cor e o efeito diferencial da vari´avel Zj ´e constante para os dois gˆeneros. Ou seja, o efeito de ser homem (ou mulher) para o sal´ario de um homem (mulher) branco ´e igual ao efeito para um homem (mulher) n˜ao branco. O problema ´e que essa caracteriza¸c˜ao n˜ao se aplica nesse caso. Passa- se a considerar a intera¸c˜ao ou efeito multiplicativo das vari´aveis Xj e Zj. ´E presum´ıvel, por exemplo, que mulheres brancas ganhem mais do que mulheres n˜ao brancas e que esse efeito n˜ao seja meramente aditivo (estamos atestando que h´a uma esp´ecie de “combina¸c˜ao de for¸cas”, um incremento no efeito). Isso ser´a caracterizado com o novo parˆametro β5, por meio da multiplica¸c˜ao das vari´aveis Xj e Zj. yj = β1 + β2Xj + β3Zj + β4Wj + β5 (Xj ∗ Zj) + ϵj em que Xj ∗ Zj = 1 se ´e uma mulher n˜ao branca, ou seja, β5 repre- senta o efeito sobre o sal´ario de ser uma mulher n˜ao branca. A nova vari´avel multiplicativa cria um efeito incremental sobre a vari´avel de- pendente. Se o efeito adicional for positivo, entendemos que h´a uma “compensa¸c˜ao” salarial por ser mulher n˜ao branca. Em contrapartida, se o coeficiente for negativo, h´a um efeito “punitivo”, que acentua a diferen¸ca salarial de mulheres n˜ao brancas com os demais grupos. 15 Faculdade de Economia - UFF Prof: Diogo Braga Uso das Vari´aveis Qualitativas para representar Sazonali- dade Sazonalidade ´e um fenˆomeno muito comum em s´eries temporais econˆomicas. Nos casos t´ıpicos de sazonalidade h´a uma esp´ecie de “lei” que varia¸c˜oes regulares dos dados dentro de janelas espec´ıficas de tempo. Esses intervalos no tempo podem ser meses, trimestres, se- manas, etc. Uma das “leis” mais conhecidas s˜ao as esta¸c˜oes do ano. Elas s˜ao capazes de determinar, por exemplo, se certos meses ser˜ao chu- vosos ou mais frios. Para facilitar a modelagem e eventualmente nos concetrarmos em outros fatores das s´eries temporais, como tendˆencia, padr˜oes c´ıclicos e padr˜oes irregulares (aleat´orios), recomenda-se iden- tificar e remover a sazonalidade. As vari´aveis qualitativas s˜ao bastante ´uteis para esse fim. Ex: Observe abaixo um modelo de regress˜ao linear que relaciona as ven- das de equipamentos de esqui e um ´ındice que reflete o interesse do consumidor em adquirir esses bens nos EUA, entre 1964 e 1973. Os dados s˜ao trimestrais. St = β1 + β2PDIt + ϵt Esse ´e um caso t´ıpico em que a sazonalidade n˜ao pode ser negli- genciada. Espera-se que o mercado de esqui esteja aquecido (com o perd˜ao do trocadilho) nos meses mais frios do hemisf´erio norte. Com dados trimestrais, n˜ao temos os meses separados adequadamente por esta¸c˜oes, ent˜ao n˜ao ´e poss´ıvel dizer com precis˜ao se os meses mais inte- ressantes para o com´ercio de equipamentos de esqui est˜ao no primeiro ou no quarto trimestre. Por isso, vamos consolidar a vari´avel que re- presentar´a a sazonalidade com 2 trimestres. Seja Zt a vari´avel dummy que ´e igual a 1 se as observa¸c˜oes est˜ao nos dois trimestres mais frios (inverno) e 0, se as observa¸c˜oes correspondem aos trimestres mais quentes (ver˜ao). Assim, teremos St = β1 + β2PDIt + β3Zt + ϵt Veja que assumimos nesse modelo que o impacto do interesse do consumidor nas vendas ´e o mesmo para os dois intervalos de tempo 16 Faculdade de Economia - UFF Prof: Diogo Braga (isso n˜ao necessariamente acontecer´a, n˜ao seria estranho se a reta de regress˜ao no per´ıodo mais frio fosse mais inclinada do que no per´ıodo mais quente. Esse efeito seria introduzido pela intera¸c˜ao entre Zt e PDIt, dado por Zt∗PDIt). S´o exisitira´a diferen¸ca no “n´ıvel” de vendas, n˜ao no efeito marginal. Ex: Agora considere o mercado de geladeiras. Parece razo´avel pensar que em meses mais quentes h´a um consumo maior de geladeiras, tal- vez motivada pelo uso mais frequente (pode-se pensar at´e em picos de energia, que acabam danificando esse tipo de equipamento). Seja Yt a venda de geladeiras e Djt, j = 1, . . . , 4, a vari´avel categ´orica que representa cada trimestre. Sabemos que como a vari´avel Djt tem 4 categorias (uma para cada trimestre) ou removemos uma delas (man- tendo o intercepto) para n˜ao incorrermos na armadilha das dummies ou retiramos o intercepto. Neste caso, faremos usando a segunda abor- dagem. Nosso modelo ser´a ent˜ao Yt = α1D1t + α2D2t + α3D3t + α4D4t + ϵt Se as vari´aveis (ou um subconjunto delas) Djt forem estatistica- mente significativas, teremos a confirma¸c˜ao do efeito sazonal sobre a venda de geladeiras (Yt). Regress˜ao Segmentada (Piecewise) Numa regress˜ao segmentada, a regress˜ao ´e separada em determi- nado ponto, tal que os coeficientes (intercepto e coeficiente angular, numa regress˜ao simples) estimados s˜ao diferentes antes e depois deste ponto. ´E como se a partir de um certo n´ıvel as vari´aveis em quest˜ao passam a se relacionar de uma forma diferente (`as vezes sutilmente, `as vezes brutalmente). Digamos, por exemplo, que uma companhia re- munere sua equipe de vendas conforme o valor bruto da opera¸c˜ao. Se o funcion´ario atingir um certo n´ıvel de venda, a estrutura de comiss˜ao muda, pagando a ele um pouco mais. Seja X∗ o n´ıvel a ser atingido por cada funcion´ario e Dj uma vari´avel dummy que ´e igual a 1 se X > X∗ e 0, se X < X∗. Teremos a seguinte equa¸c˜ao de regress˜ao 17 Faculdade de Economia - UFF Prof: Diogo Braga Yj = α1 + α2Xj + α3 (Xj − X∗) Dj + ϵj em que Yj ´e a comiss˜ao por vendas e Xj s˜ao as vendas em si. A ideia ´e que se o empregado j vender acima de X∗, ele ganha uma comiss˜ao adicional de β3, que se soma a β2. Veja que isso altera a confi- gura¸c˜ao da reta de regress˜ao a partir de X∗, n˜ao apenas pelo coeficiente angular diferente, mas tamb´em pelo intercepto. Evidentemente, se a hip´otese H0 : β3 = 0 n˜ao for rejeitada, temos evidˆencia estat´ıstica para descartar a possibilidade de regress˜ao segmentada. Autocorrela¸c˜ao dos termos de erro Uma das hip´oteses do teorema de Gauss-Markov era a inexistˆencia de autocorrela¸c˜ao, ou seja, E (ϵiϵj) = 0, para todo i ̸= j. Naturalmente, usando a hip´otese de que os termos de erro tˆem m´edia zero, podemos associar a hip´otese de inexistˆencia de autocorrela¸c˜ao `a covariˆancia Cov (ϵi, ϵj) = E (ϵiϵj) − E(ϵi)E(ϵj) = E (ϵiϵj) = 0 Essa hip´otese garante que qualquer efeito n˜ao antecipado (termo de erro) sobre a vari´avel dependente ´e restrito `aquela observa¸c˜ao (que pode ser temporal). Para modelos de cortes transversais, essa hip´otese parece fazer sentido. Tome como exemplo um modelo de renda dispon´ıvel e consumo das fam´ılias. Faz sentido que um evento aleat´orio que aumente o consumo de uma fam´ılia (por exemplo, uma visita de amigos) n˜ao interfira no padr˜ao de consumo das demais. Agora, tome um exemplo de um modelo em s´eries temporais. Di- gamos que vocˆe queira entender a rela¸c˜ao entre o pre¸co e o consumo de um determinado bem, por exemplo o frango. Um dos principais custos da produ¸c˜ao de frango ´e o milho. Imagine que uma seca se abate sobre um grande produtor de milho. ´E natural, em fun¸c˜ao da escassez, que o pre¸co do milho aumente e, por consequˆencia, o pre¸co do frango. Esse evento n˜ao antecipado, portanto, causar´a um efeito n˜ao negligenci´avel sobre a demanda de frango. A quest˜ao ´e: ser´a que o 18 Faculdade de Economia - UFF Prof: Diogo Braga impacto do evento sobre a demanda de frango ficar´a circunscrito ape- nas ao per´ıodo corrente? Parece que essa hip´otese ´e muito inveross´ımil para modelos temporais. Provavelmente o impacto sobre a demanda de frango vai durar alguns trimestres, at´e que uma nova safra, livre de anormalidades, possa ser produzida. Um exemplo pr´atico do que se discutiu no par´agrafo anterior ´e a peste su´ına africana, que causou uma crise sanit´aria sem precedentes sobre alguns dos principais produtores de su´ınos do mundo, particu- larmente na China. O padr˜ao alimentar chinˆes (o maior consumidor de su´ınos do mundo, de longe) se alicer¸ca na carne su´ına. Com pre¸co muito alto, ´e natural que se passe a observar substitutos diretos, como bovinos e frango. Fato ´e que a demanda por bovinos aumentou substan- cialmente, provocando at´e “apag˜ao” na produ¸c˜ao. Esse efeito da peste su´ına pode ser exergado como restrito ao per´ıodo corrente? Obvia- mente, n˜ao. Apesar de ser um evento n˜ao antecip´avel (e que, portanto, faz parte do termo de erro), os efeitos sobre a demanda de bovinos vai muito al´em de um ´unico per´ıodo. Dito tudo isso, quando os termos de erro s˜ao autocorrelacionados, temos que Cov (ϵi, ϵj) = E (ϵiϵj) − E(ϵi)E(ϵj) = E (ϵiϵj) ̸= 0 Como estamos falando aqui quase que exclusivamente de modelos temporais, podemos adaptar a nota¸c˜ao para visualiza¸c˜ao mais simples do tempo Cov (ϵt, ϵt−1) = ρσ2 Para entender o mecanismo de gera¸c˜ao da autocorrela¸c˜ao, devemos recorrer primeiramente `as equa¸c˜oes mais simples entre ϵt e ϵt−1 e depois desenvolvˆe-las recursivamente ϵt = ρϵt−1 + ut em que ut ∼ N (0, σ2 u), E (utus) = 0, para todo t ̸= s e E (utϵt−1) = 0, para todo t. 19 Faculdade de Economia - UFF Prof: Diogo Braga Uma equacao como essa é conhecida como um modelo autorregres- sivo de primeira ordem ou AR(1). Podemos desenvolver recursiva- mente essa equacao, tal como €¢ = Per—-1 + Ut = p (per—2 + Ut-1) + Ut = = per2 + pur-1 + Ut = = p” (per_3 + Ur_2) + pue_1 + UH = = p'€0 + pu + p’ us +... pur + put—1 + Ut Admitimos que €)9 ~ N (0. tin). Note que como & é uma com- binacao linear de €o, U1, U2,..., Ue, também tera distribuicao normal. Além disso, veja que E(a)=E (p'eo + pt uy + pus +... pr ur-2 + puri + ur) = = p'E(e) +p ' E(u) +p 7B (us) +... + p?E(ur2) + pE(u-1) + E(ut) = = 0 e Var (e&) = Var (p'eo + ph tur + po ug +... + p?ur_2 + pura + ur) = = p"Var(e9) +p? *'Var(uz) + p? * ?Var(uz) +... +p? ?Var(um_2) + p?Var(m_1) + Var(uz) = 2 =p | +p Noi + pt 2a, b.. bp ro, + poy +04 = a ok ok ok = pt a 402 [e° i-1 4 2 P24 gp 4 PHI] _ 2 2t _ 2 | % a a fed re I 2t —_ 2t l-p l—p o? 1p 20 Faculdade de Economia - UFF Prof: Diogo Braga Veja que Var(e;,) sera constante. Dai, temos €, = per-1 + Ut = = pPretst+ p> ‘esti +P” Ur—sp2 +... + pura t+ ur Multiplicando os dois lados por ¢,_, e tomando o valor esperado, temos E (eé-s) = PE (G@_.) + 0° 1 E (-s€t-s41) +e.e Ht pE (€,_sUt-1) + EB (€:_5Uz) = = p'Var (Gs) = peo” 2 Observe que demos a notacao a? = oe Podemos perceber que Cov (&, €-1) = po”, ou seja Cov (€, €-1) Cov (€¢, €-1) a o? J/Var(e)\/Var(e_1) Uma hipotese que é crucial para tudo que esta aqui funcionar ade- quadamente é a estacionariedade (Se p < 1 dizemos que uma série é estaciondria). De maneira mais simples, dizemos que uma série é es- taciondria quando preserva suas principais estatisticas nao importa o periodo temporal analisado (uma série com tendéncia e/ou sazonali- dade nao é estacionaria, pois suas caracteristicas mudam nas devidas estacdes, por exemplo). 21