·

Ciências Econômicas ·

Econometria

Envie sua pergunta para a IA e receba a resposta na hora

Fazer Pergunta

Texto de pré-visualização

Universidade Federal Fluminense Faculdade de Economia Diogo Braga Aulas de Econometria Econometria I Primeiro Semestre/2020 Comecamos em 16 de Setembro de 2020 Aula 1 (16/09/20) Podemos comegar o curso falando das distribuigdes que mais usaremos em Econometria. Eis que sao: 1. Normal - N(,07), na sua notacdo mais tradicional. Também usaremos bastante a distri- buicdo normal-padrao, em que ps = 0 e a? = 1, gerando, portanto, N(0, 1). 2. Chi-quadrado - y2, em que n representa o ntimero de graus de liberdade. 3. t-student - tn, em que n representa o nimero de graus de liberdade. 4. F-Snedecor - Frm, em que n e m representam os graus de liberdade (sao 2 mesmo!). Um ponto interessante a discutirmos, que demanda um certo conhecimento de probabilidade, é a origem das distribuigdes. Chamaremos a ” Normal’ de distribuicao “natural”. Todas as demais estao direta ou indiretamente associadas a Normal. Vejamos. © Xn Admita que X1,...,X, sao varidveis aleatérias independentes com distribuicgéo normal-padrao (ou seja, N(0,1)). Chame Y; = X?. Podemos dizer que Yi; ~ x7. A demonstracao desse resultado seguird nas notas de aula. Podemos demonstrar também que se Y; = X?, paracadai =1,...,n, Y =Yi+...4Y¥n = DY; é dito ter distribuicéo 72. Ou seja, a soma de variaveis aleatérias x? gera uma outra varidvel aleatéria y? com a soma do nimero de graus de liberdade. Observe que uma propriedade importante da distribuicdo x? é o fato de nao ser determinada para valores menores ou iguais a zero (exceto quando o ntimero de graus de liberdade é igual a 1, caso em que admite valores iguais a zero). ety Faculdade de Economia Econometria I Aulas de Econometria Admita que X ~ N(0,1) e que Y ~ x2 e que X e Y sao independentes. Diremos que a varidvel aleatéria T’, que é escrita como xX T = — yx n tem distribuigdo t, (ou seja, t com n graus de liberdade). Esse resultado também pode ser demonstrado, mas é ligeiramente mais completo que o primeiro (e, por isso, deixaremos de fora). Uma das caracteristicas marcantes da distribuicdo t é o formato semelhante de sua densidade a densidade da Normal. Isso também tem uma implicacao importante: at é uma distribuicao simétrica em torno de zero, assim como a Normal. A distribuigao ¢ é muito utilizada em modelos lineares (nossas famosas regressGes). e Fam Admita que X ~ y2 e que Y ~ x2, (e que também sao independentes!). A varidvel aleatéria F,, que é calculada como X/n pailn Y/m tem distribuicao F;,m (F-Snedecor, com n e m graus de liberdade). Vocé também pode chamar a distribuigao F' de distribuigao de Fisher. Note que a distribuicdéo F “nasce” de um quociente de varidveis aleatérias y?. Como estamos falando de um tipo de varidvel aleatéria com valores nao negativos, a varidvel aleatéria com distribuigao F' também somente assumira valores nao negativos. Outro aspecto interessante é que, em um caso bastante especifico, podemos aproximar a F’ da distribuicao t. Vejamos. Se X; ~ N(0,1), entao, X? ~ y?. Nés vimos que a distribuicao t advém de um quociente de uma varidvel aleatéria com distribuigao normal-padrao (NV (0, 1)) e a raiz quadrada de uma variaavel aleatéria qui-quadrado dividido pelo seu numero de graus . . : xX de liberdade. Admita, pois, que Z = Vxain’ em que X2 ~ x2. Sabemos que Z ~ tn. Mas qual sera a distribuicao de Z?? 2 2 2 Zz xX Xj X7/1 FE = = = ~~ FI, \/ X2/n Xo/n Xo/n " Queremos, com isso, dizer que ha uma relacao direta entre as distribuicdes t e F’. Ou seja, Z ~ tne Zw F.». No contexto de Econometria, essa relagao é importante quando observamos a Faculdade de Economia Econometria I Aulas de Econometria estatistica F’ de um modelo simples de regressao linear (uma unica varidvel explicativa). Ela serA rigorosamente igual ao qudrado da Estatistica t da varidvel explicativa. Lembragas importantes e Valor Esperado e Propriedades. Vamos deixar as formalidades de lado. Trataremos de varidveis aleatérias quaisquer (discretas ou continuas) e usaremos, para todos os efeitos, constantes a,b € R. 1. E(X+Y)=EX+ EY. 2. E(aX) =aEX. 3. E(aX + bY) =aEX + bEY (basta usar os dois primeiros itens). 4. E(a+X)=a+EX. 5. Se X <Y, entao EX < EY. 6. Se X e Y sao independentes, entéo E(XY) = EX EY. Caso nao sejam, NAO é possivel “distribuir” a esperanca. e Variadncia e Propriedades. Definimos a variancia como Var(X) = E[X — Ex]? Podemos mostrar que Var(X) = E(X?) — E?(X). Alguém se habilita? Rapidamente... Var(X) = E[X — EX]? = E[X? - 2X EX + E(X)] = = E(X*) -2EX x EX 4+ E?(X)= = E(X?) — E?(X) Propriedades 1. Var(aX) = a?Var(X) 2. Var(X +—Y) = Var(X)+Var(Y)+—2Covu(X, Y). Se X e Y forem varidveis aleatérias independentes, entao Var(X + —Y) = Var(X) + Var(Y). 3. Var(a+ X) = Var(X), ou seja, a constante “some”. e Covariancia e Propriedades Definimos a covariancia como Cov(X, Y) = E\(x — EX)(Y — EY)| Faculdade de Economia Econometria I Aulas de Econometria Note que podemos escrever a covariancia como Cov(X,Y) = EXY — EXEY. Rapidamente... Cov(X,Y) = E[(X — EX)(Y — EY)] = = E[XY —- XEY -YEX + EXEY]| = = EXY —EYEX —EYEX+EXEY = = EXY —EXEY Propriedades 1. Cov(ax, Y) = aCov(x,Y). 2. Cov(a, X) = 0. 3. Cov(a+ X,Y) = Covu(x,Y). 4. Cov(X + Y, Z) = Cov(X, Z) + Cov(Y, Z). 5. Cov(aX, bY) = abCov(X,Y). e Coeficiente de correlacao Definimos o coeficiente de correlacao como Covu(X,Y) A(X, Y) =| ———— /Var(X)\/Var(Y) Note que p € [—1, 1]. Além disso, observe que se X e Y forem varidveis aleatérias independen- tes, p(X, Y) = 0 (Por qué?). Usaremos o coeficiente de correlagéo nos modelos de regressao, particularmente ao tratarmos da bondade de ajuste (o famoso R?). Aula 2 (17/09/20) Admita que temos X1,..., Xn sao i.i.d. e que podemos obter informacgées adicionais através de T(X1,...,Xn), em que T(.) é uma fungéo cujo dominio inclui o espaco amostral do vetor aleatério (X1,...,Xn). O contradominio de T(.) pode ser real ou R". T(.) 6, portanto, ele préprio uma varidvel aleatéria (ou vetor aleatério) por ser fungéo de v.a. Como Xj,..., Xn sao i.i.d, a distri- buigao de T(.) é relativamente simples de ser obtida (seria, neste caso, o produto das marginais...). Definigao: Sejam X,,...,X,n uma amostra aleatéria de tamanho n de uma populacao e seja T(X1,...,Xn) funcio em R ou R*, com k > 1, cujo dominio inclua o espaco amostral de Xj,..., Xn. Entao, o vetor aleatério ou a varidvel aleatéria T(X1,...,X,) € chamado de estatistica. A distri- buigdo de probabilidade de T(.) é chamada de distribuigaéo amostral de T(.). Faculdade de Economia Econometria I Aulas de Econometria Observe que T'(.) nao pode ser funcgao de um parametro. Definicgao: A MEDIA AMOSTRAL é a média aritmética dos valores em uma amostra aleatéria. — Xj +...+ Xn 1 ——————— Xx, Definigao: A VARIANCIA AMOSTRAL € a estatistica definida por ge = S0(Xi — XP n—-1 ‘ obs: Veja que 0 DESVIO-PADRAO AMOSTRAL é S, a raiz quadrada de 9°. obs2: Essa |é a verséo naéo-viesada da variancia amostral. Existe a verséo “anterior” a esta, que chamamos de 6”) = 4+ $>(X; — X)?. Faremos essa conta ja ja. Teorema: Sejam X,,...,X,y uma amostra aleatéria de uma populacéo com média p e variancia o” < oo. Entao 1. E(X ) = LU. 2. Var (Xx ) = o 3. B(S2) = 02. Prova: (a) B(X) =B(- X;) = ip X; n n 1 =—xnkE (X;) = pL n (b) Var(X) = Var =" x, = 1 Var S— Xi) = a =Vva n 7] = ne a wy] 1 o = 72 x nVar(X;) = TD (c) Faculdade de Economia Econometria I Aulas de Econometria 1 _ 2) _ — 2) _ E(S?) -2( De X) = 1 oo = ae( Da —2X,;X + x*)) = l 2 v v2\ _ = #( Ex —2XS°X;+5°X = 1 _ _ _ = tpe( DAP Bin en x) = 1 _ — = e(D¥ — 2nX? nx?) = n-1 : - 1 |g S > X? | — E(nX?)| = n-1 ‘ __+ E| X? | — E(nX?)| = =o | BX?) - B(rX*)) = = 1 _(nB(X?) — nE(X?)) = n-1 : 1 2 = —— (n(o? +p) — n= +1) = = o2 Teorema: Sejam Xj,..., Xn uma amostra aleatéria de uma distribuicdo N(p, 07) e sejam X e S?, respectivamente, a média e a variancia amostral. Entao 1. X e S? s&o varidveis aleatérias independentes. 2. X~ N(p,2). —1)S?2 3. ays ~ x74. A demonstracao do teorema serd omitida, mas os resultados serao muito uteis em Econometria. Aula 3 - 21/09 Estimagao A ideia por tras da estimacao é relativamente simples. Precisamos retirar uma amostra de uma populacao descrita por uma fdp f(z|@). O conhecimento de 6, que evidentemente pode ser um Faculdade de Economia Econometria I Aulas de Econometria vetor (lembre-se da Normal - 6 = (1,07)), enseja o conhecimento de toda a populacdo. Entao é natura buscar um método para encontrar um bom chute educado para o que vem a ser 6 ou mesmo 7(@), uma funcao de 6. O chute educado vem a ser o que conhecemos por estimador. Definigao: Um estimador é qualquer fungéo W(Xj,...,X;,) de uma amostra, ou seja, qualquer estatistica é um estimador. obs: O estimador é uma fungaéo da amostra (e, portanto, funcao de X1,..., Xn, por exemplo). obs2: Uma estimativa é a realizagéo de um estimador (e, portanto, funcéo de 21,...,2%n, por exemplo). Método de Momentos Seja X1,...,X, uma amostra aleatéria de uma populacaéo com fdp ou fungao de distribuicgdo f(x|01,..-,@n). Os EMM sao encontrados ao igualarmos os primeiros k momentos amostrais aos correspondentes k momentos populacionais, resolvendo, portanto, um sistema de equacoées. Defina os momentos amostrais por m;, em que i=1,...,k. 1 1 2 2= 7 DX: 1 1D m, = = SX! n u Enquanto os momentos populacionais sao tradicionalmente conhecidos por fy = EX [ig = EX? y3 = BX® lp = EX* O mais natural é que ;, em que j € 1,...,k, seja fungao de 6),..., 0%. A notagao para isso seria algo como pj (91,..-, 9%). Ex: X1,...,Xp iid N(0,07). R: Veja que estamos lidando com dois parametros. Por essa razao, precisamos de dois momentos para conseguir alcangar os EMM. e Precisamos fazer m1 = 41 € M2 = 2. Vamos encontrar primeiro p11 e€ [2. e py = EX =0e pig = EX* =VarX + E?X =074+ 6. Agora precisamos resolver o sistema Faculdade de Economia Econometria I Aulas de Econometria 1S0X; =0 1 2 21 92 Percebam que 6= 4 >> X;. Precisamos encontrar a2, que ja nao sera tao trabalhoso. Vejamos. 1 1 ° 2_ 2 i Lyte (29a) 1 1 ° ~2 2 = X;-—[- Xj roa (Es) 1 1 ° m2 2 ; tye 3(ra) 1 1 2 a2 _ 2 os . ° -i [ox (ex) 1 1 2 a2 oo . # = TE (HTL) Uma coisa muito intessante de ser notada é que essa “cara” de 6? é bem parecida com a “cara” da variancia populacional, com as devidas atualizacoes para termos amostrais. Ex: X4,...,Xn ~ Exp(A). Ae” , x > 0 f(a) = - 0, caso contrario Veja que, neste caso, t= + em, = 1S Xi. Entao o EMM de X seria \ = nx Como vocés podem ver, os problemas de EMM podem variar bastante em termos da complexidade. No entanto, para fixarmos um limite de complexidade, vamos lidar com até 2 parametros, apesar de existirem problemas com mais do que 2 parametros. Para conhecimento geral, EMM sao bastante uteis em Econometria, particularmente em problemas complexos, uma vez que representam uma forma ligeiramente simples de obtermos boas estimativas. obs: Lembre que, se lidamos com uma varidvel aleatéria continua unidimensional, calculamos o valor esperado da seguinte forma +00 EX = / xf (x)dx —oo No caso particular da distribuigéo exponencial, teriamos CO EX = | tre dx 0 Faculdade de Economia Econometria I Aulas de Econometria Método da Maxima Verossimilhanga Definigao: Seja f(z|@) a fdp conjunta (ou distribuicgaéo, no caso discreto) da amostra X = (X1,..., Xn). Entao, dado que X = x, a fungao de @ definida por L(6|x) = f(x|@) é chamada de FUNGAO DE VEROSSIMILHANGA. Se compararmos a funcao de verossimilhanga em 2 pontos, 6) e 02, e encontrarmos que Po, (Xx = x) = L(0,|x) > L(0|x) = Po, (Xx = x) entao a amostra que de fato observamos é mais provavél de ter acontecido se 9 = 6, do que se 6 = 62 (ou seja, 0; 6 um valor mais “plausivel” para o verdadeiro valor de 0 do que 43. O método da maxima verossimilhanca é, de longe, a técnica ais popular para derivar estimadores. Se X1,..., Xp sao i.i.d de uma populacéo com fdp f(x|@1,..., 6%), a funcao de verossimilhanga é definida por n L(0,x) = L(1,...,O¢|21,-.-,0n) =|] f (wil... Ox) i=1 Definigao: Para cada ponto amostral x, seja 0(x) um valor paramétrico no qual L(6|x) atinge seu maximo como funcao de 9, com x mantido fixado. Um EMV do parametro 0 baseado em uma amostra X 6 6(X. Veja que, pela definicéo de funcao de verossimilhanca, faz todo sentido escolhermos o EMV como estimador, pois é 0 ponto paramétrico para o qual a amostra observavel é mais provavel. Se a fungao de verossimilhangca é diferencidvel, podemos resolver 0 ; a0, 109) = 0,2 = 1,...,k Condicao suficiente? Nao!. Apenas necessaria...Precisamos da condicgéo de segunda ordem 6? —, L(O|x) <0 <a L(Olx) Muitas vezes, trabalhar diretamente com L(6|x) nao é trivial. Uma forma mais simples pode ser resolvida com a introducao da funcao log. Isso é possivel pois a funcao log é estritamente crescente em (0,-+00), o que implica que os pontos extremos de L(@,x) e log(L(6|x) coincidem. Faculdade de Economia Econometria I Aulas de Econometria Ex: Sejam Xj,..., Xp iid Bernoulli(p). Entaéo a fungao de verossimilhanga é n L(p|x) = [[ (1 —p)™ i=1 = pEm(1 pyr" Tomando o log L, temos I(p|x) = log L(p|x) = log(p=**(1 — p)""=*) = (Soa) logp + (n — Yi) log(1 — p) Fazendo Sl, temos O 1 1 212 (Sm)b4 (n- Ln) Dp So ai pt n Sox ( TS =0 1 1 (La) 5=("- La) ~ L = p=) Xi =X Passo a passo do EMV 1. Encontre a funcao de verossimilhanga n L(6\x) = [[ fale) i=1 2. Faga 1(6|x) = log L(6|x) I(8|x) = log (T] s(wil9)) = S Plog f (2/9) 3. 8 pode ser um vetor ou pode ser simples. Derive “1(0x) =0 4. Encontre 6 Aula 4 - 23/09 Ex: Admita que X1,...,Xn ~ N(,07). Para calcular o estimador de maxima Faculdade de Economia Econometria I Aulas de Econometria verossimilhancga, preciso da funcao de densidade da normal. 1 lx — py? f(x) = ——.exp -;(—*) Tae al Gd} Passo a passo para obtermos o EMV. e Obter a fungao de verossimilhanga. n Lp, a” |x1, 22, tee In) = I] f (xi) i=l n 1 Lyx; — [2 “Heer 34 I] 2Qro2 { 2 a } 1 yet 1 aj — py? = (ea) Te SN 2 (Ly -+(25#) = |———] e V2r0? e Obter a fungao de log verossimilhanga. U(u,07|a1,-..,2n) = log L(.) 2 i ( 1 )" ra -3( 254) = log | (————) e V2ro2 2 Lye) fxn (2%) = log (5) + log | e ° ( V2ro2 1 “lay — py? =n (is) + SHES 2Qro2 » 2 a “lai py? =nx | log1—log (V2n0?} + S° -;(“—*) <I 2 o “ lyay— py? =nx | —log (v2r0?) + Ss" -;(=*) ima? ° Faculdade de Economia Econometria I Aulas de Econometria e Derivar /(.) em relacao a pz e igualar a zero. 2 a(n x - log (var) + -3(#5#) lg.) = S$ 7) Dy n 1 f/f %i-p 2 Ol Vina -3( a ) a 1/ vi-p 2 a 1 ( tn=p 2 _ ~~ O2\oa 4 4 ~~ 2\ ao = Oy a Op 1 _ 1 1 _ 1 =2x -;(——) x |——| +...42x -;(=—) x | - = 2 oO o 2 o o v1 — pb tn — 1 = (er - 1H) +... + (en - 1] 1 n n = —[Souin-nx al =0 .. So ai — np =0 O=l i=1 n np = S > Xx, i=1 = a din Xi = x e Derivar /(.) em relagao a o? e igualar a zero. Faculdade de Economia Econometria I Aulas de Econometria 2 a(n x - log (va) + -3(#5#) I’ 2 _— — (o°) o2 2 of - Bx c (en) +0 -3("5*) = ig 2 of - 3 x tog2n + ono + 1 -3(25*) = DG 2 of - ax [log 2r| — § | log 0? | + -3(#5#) = OG 2 of - 4 [logo?] +024 —3(25#) = nt, oe nil “1 2 1\2 =~ 392 + Lg (m—¥) CNC) — nl lsl1ly2e 2 =—398 + 5(g2) L(w—H) = i=1 nl 1/122 2 Jo = alg) DL (%-#) i=l n 2 no? = Ss" (2: — 1) i=l ~~ [2 \2 P= => (0-2) i=1 g2=1ye (x:-x) n i=1 v Ex: Sejam Xj,..., Xn ~ Poi(A) Faculdade de Economia Econometria I Aulas de Econometria e Obter a fungao de verossimilhanga. n tie L(\|x) = I] <r Nm Li o—nr — II x! e Obter I(A|X). I(A|x) = log L(A|x) Nu Li o—nr 8 Tat — (Soa) log A — nd — log JJ ai! e Derivar em relacao a 4. Ol(A|x) 1 y= (Seai)y on =0 obs: Sobre manipulacao de produtorios, propriedades de logaritmo e regra da cadeia. | [eri = en X axg X av3ZX... X Lyn = a” x [2 i=1 i=1 log(a x b) = loga + logb log(a”) =n x loga log(>) = loga — logb loge” =x x loge=a O(a — a)? O(x — Me" 2x (wa) x ME —9) < 99 —a) a(t) aG-8) 1 Ox Ox ob Faculdade de Economia Econometria I Aulas de Econometria Aula 5 - 24/09 Método de Minimos Quadrados A ideia por tras do método de minimos quadrados é bem semelhante aos métodos que ja estudamos. Tem como objetivo encontrar os parametros de um modelo que melhor se ajustam a determinado conjunto de dados. Dispomos de pares (2, y;), em que x; de alguma forma “explica” y;. A associacao entre x; e y; se dé geralmente por uma funcgao paramétrica f(x,@) e o que queremos é encontrar 2 uma estimativa para 0 que minimize )> (u: = f(ail0)) , ou seja 2 Ming S° (u: — f(xi,8)) Podemos escrever y; — f(2;,9) = €;, de tal forma que y; = f(x;,@) + ¢;. A solugao do problema de otimizacao Ou é chamado de estimador de minimos quadrados de @. Podemos naturalmente ampliar o escopo da funcao f de tal forma a comportar mais do que uma unica varidvel e mais do que um unico parametro. Ex: Admita que f(x,0) = 0x/ Encontre o EMQ de 6. Gj = Yi — Ox; = yi — xi)? Dai, temos 2 Ming S° (v: _ 6. e Primeira coisa que fazemos num problema de otimizacao irrestrito é seguir o mantra “derivar e igualar a zero”. E é exatamente isso que faremos. 0 2 30 S° (v: - 6. = S © 2(y; — 621)(—a) = -2S°(yini — O27) = -2[ Dues - Doe = =2| SO yin ~ 0) 23 | =0 Faculdade de Economia Econometria I Aulas de Econometria Yun -0T eB =0 do yiti =) [23 Encontraremos = DV XiVi = 7 Método de Avaliagao de Estimadores Uma dificuldade que pode surgir é escolher entre varios estimadores distintos. Em alguns casos os métodos de estimacao que estudamos podem chegar a diferentes estimadores e a pergunta que fica é “qual critério seguir para uma escolha adequada”? e Erro Quadratico Médio Definigao: O EQM de um estimador W(.) de um parametro @ é a fungao de @ definida por Eg(W — 6)? Uma das maiores vantagens do EQM para avaliar estimadores é a interpretacao. Vejamos E9(W — 0)? = Ey(W — EW + EW — 0)? — Ey l(w — EW)? +2(W — EW)(EW — 6) + (EW — 6)*| = Ey(W — EW)? + 2(EW — 0)(EW — EW) + E(EW — 6)? = VargW + (EW — 6)? Veremos que EW — @ sera chamado de Viés de W. e Viés Definicgao: O Viés de um estimador W é a diferenca entre o valor esperado de W e @, ou seja Vi(W) = EW -0 - O EQM, em sua composicaéo, tem duas medidas Faculdade de Economia Econometria I Aulas de Econometria Vare(W) — Precisao (variabilidade do estimador) [Vi(W)]? > Acuracia (diferencga d média do estimador e do real valor do parametro) a CT Se Vi(W) = 0, EQMy = VareWw. a Ex: Sejam X1,...,Xp iid N(u,07). Encontramos os EMV de pe o? fl=X ~~ | - = — S0(Xi — XP O Viés de X pode ser facilmente calculado. Basta tomarmos Vi(fi) = Ei—p= EX —p 1 =2(, x) -a 1 =— SS E(X) - ps n Logo, f é um estimador nao-viesado de yw. Vejamos para a variancia. Eo? = B(- d(% - X)*) n 1 _ = —B( 30%? ~ nX*) OK 1 _ == ( S> E(X?) — nbX?) n _i 2 2 o 2 ) == (S00? +1) - (= +2?) 2 o =o? 4 2-2 (P n 2 —1 ~@ 2 - (“ ) 2 n n Logo, como Eo? = (2 )o?, dizemos que o2 6 um estimador viesado de o2. No entanto, existe uma alternativa para a. Veja que Faculdade de Economia Econometria I Aulas de Econometria e(225) = 2H De F) n—-1/) n—-1 ‘ n — ee n—-1 ° — Nn n—-1 ») —n-1 ( n ° = o2 Chamaremos no = 1, (xX; — X)? de S$”, ou seja S? = 1 S\(X;, — X)? é um estimador nao-viesado de o? e serd bastante usado em Econometria. Quanto ao EQM. Vamos calcular 0 EQM (ji) e EQM(S?). EQM (ji) = E(miu — 1)? = Varji = VarX _o on EQM(S?) = E(S? — o?)? — 1)§2 2 4 —1)S? = VarS? = Var(@ape x ——) Po — 2 var( Ms ) o? n—1 (n — 1)? o? 4 4 o 20 = ——__ x A%n—1) = —— (nip * 2" DT *** Bisse resultado advém do fato de (n=Ys* ~ x2, e Vary2_, =2(n—1). Uma coisa super interessante desse resultado é que o EQM(o?) < EQM(S?). Ou seja, $?, apesar de nao ser viesado, vai “compensar” tendo maior variancia do que a2. Isso é desejavel? Nao necessariamente... Aula 6 - 28/09 e Consisténcia Definigao: Uma sequéncia {T;,} de estimadores de um parametro @ é consistente se, Ve > 0 Faculdade de Economia Econometria I Aulas de Econometria P(|Tn —6| > 6) 0 e Eficiéncia Definicao: Se T e T* sao dois estimadores nao-viesados de um mesmo parametro, e ainda VarT < VarT* entao, T’ é dito ser mais eficiente do que 7”. Ex: Digamos que dois estimadores nao-viesados ji; e fig foram propostos para estimar jp, a média desconhecida de uma populacao. /i1 e jig sao independentes e sabemos que Var(/i1) = Vor (2) | Considere os seguintes estimadores 7, — fat hte 2 Aa . Ty = [a + be 5 T3 = fy R: Viés: fly + fe Lon 1 ET; = B(a*) = 5 Eli + fa) = 5(e +H) =H Afi, + po 1 a a 1 ET) = B(*) — =A (Aft + fiz) = = (4 + 1) =p ET3 = Ej = Eficiéncia: 1 n m 1 n n 1 a n A VarT,; = Vola + fiz) = qVaria + Var juz) = q Varia + 3V ar ji) = Vari 1 1 1 19 n VarT, = 55 ar (in + fiz) = 5g (16Varity + Varjiz) = 5g (16Varfr + 3Var{i1) = pV arin VarT3 = Varfi, Vejam que todos os estimadores sao nao-viesados, mas eles tém variancia distinta. Na verdade, o estimador 7 tem a menor variancia, portanto é 0 mais eficiente. Logo, T2 seria o melhor estimador nesta classe de estimadores nao-viesados. Intervalo de Confianga Tome o estimador 6 derivado de uma populacao com f.d.p f(z|0). Admita que 6 tenha todas as propriedades 6timas de um estimador. Apesar disso, 6 nao substitui 6 (Por qué?). A pergunta que fica é: 0 quao preciso é 6 em relacao a 6? Faculdade de Economia Econometria I Aulas de Econometria A resposta esta ligada a dispersao da distribuicao amostral do estimador. Podemos construir, conhe- cendo a distribuicao amostral do estimador, intervalos de confianca para o parametro populacional 0. Sejam Xj,...,Xp ii.d com distribuicaéo N(p, 07). J& vimos que o EMV de p 6X, ou seja 2 = a X~N(u,~) n Como fazemos para padronizar X? Basta tirar a média e e dividir pelo seu desvio-padrao xX — xX — n Xa he _ (X=p)Vr N(0, 1) a? Oo Von A partir dessa informacaéo, podemos construir um IC com, por exemplo, 95% para ju. X —p)J/n P(- 1,96 < (X=Hve - 1, 96) = 95% o Isso significa, na pratica, que 95% de todas as amostras retiradas dessas populacdo teraio X tal que - 1d - dl xX — 1,96o < Ll <X+ 1, 96c Jn Jn Se T for um estimador de @ e se a distribuigao amostral de T for conhecida, sempre sera possivel encontrar dois valores t; e tg tais que P(ti <0 < tp) =%¥ em que 7 € (0,1) é chamado de coeficiente de confianga. Geralmente, t; e t2 so fungao de ¥. Aula 7 - 30/09 Voltando ao modelo normal N(,07)...Se o? nao for conhecido, precisaremos estimar o7, uma vez que a distribuicaéo padronizada de X teria um elemento desconhecido. Mas, para isso, temos 0 S?, estimador nao-viesasdo de o?. “Plugando”o S$? onde tinhamos oa”, temos X- ATF S2 Vin obs: Usando as informacgdes que nds revisamos (aprendemos), por que a distribuicao de Ve é tn—1? Exercicio. . Podemos, a partir dessa informagao, criar um intervalo de confianga para ps nesta nova configuracao. Faculdade de Economia Econometria I Aulas de Econometria (X — p)V/n P( ~ tn-1a/2 S ~~ S tn—1.a/2) =l-a Fazendo algumas contas, vemos que 0 IC de 95% de confianga para pu é - ty x S - ty x S$ XY tohe/2 << X4 ek Jn Jn Note que a = 5% na maioria dos casos, 0 que nos faria procurar na tabela da distribuicdo t 0 valor correspondente a n — 1 graus de liberdade e 2,5% (veja que estamos lidando com a/2). Teste de Hipdéteses A ideia aqui é que, dada uma afirmacao sobre uma populacao - geralmente um parametro desta - queremos saber se a amostra obtida contraria ou nao tal afirmacao. Ex: Uma industria usa, como um dos componentes das maquinas que produz, um parafuso impor- tado, que deve satisfazer algumas exigéncias. Parafusos sao fabricados por diferentes paises e cada pais possui uma especificacao técnica. Pais A: Resisténcia média = 145 kg. Desvio-padrao = 12 kg. Pais B: Resistencia média = 155 kg. Desvio padrao = 20 kg. Haverd um leiléo de parafusos a precos convidativos. A partir de uma amostra de 25 parafusos do lote, foi detectado que a resisténcia média era de 148 kg. Devemos, num teste, adotar uma regra de deciséo que nos permita escolher entre as hipdteses sugeridas. Neste caso, foi decidido que escolhemos Pais A se X < 150 Pais B se X > 150 Veja que nao sabemos quem é exatamente jz, temos apenas uma amostra X1,..., Xn e, com base nela (e sabendo que X é um bom estimador de jz), vamos determinar se escolhemos o pais A ou B. Para isso, precisamos de uma regra de decisao, que segue, em linhas gerais, as caracteristicas de cada pais. Metodologia e Termos hipdteses testaveis Geralmente recorremos a uma hipotese “natural” ou de referéncia. Chamaremos essa hipdtese de Ho. Importante também é, a partir de Ho, definirmos o que seria aceitavel (crivel) para contradizer Hp. Universidade Federal Fluminense Faculdade de Economia Econometria I Aulas de Econometria • Testamos sobre parˆametros Pode ser, por exemplo, a m´edia populacional ou mesmo a variˆancia populacional. POdemos tamb´em testar sobre 2 m´edias populacionais ou 2 variˆancias popu- lacionais (inferˆencia sobre mais de uma popula¸c˜ao). • Ter uma regra de decis˜ao. Ex: Queremos testar sobre µ. Temos uma amostra de tamanho n. Vamos definir H0 : µ = µ0 HA : µ = µA Nesse tipo de formula¸c˜ao, µ s´o poder´a ser µ0 ou µA, ou seja, trata-se de um problema bem restrito (isso pode querer dizer, dentre outras coisas, que vocˆe conhece muito o problema). Se sabemos pouco a respeito de µ, podemos lan¸car m˜ao de um mais menos espec´ıfico H0 : µ = µ0 HA : µ ̸= µ0 Entre essas duas alternativas, existe o teste H0 : µ = µ0 HA : µ > µ0 ou (µ < µ0) Testar se assemelha, em certo sentido, a julgar a culpabilidade de algu´em num tribunal. H0 ´e v´alida at´e que alguma evidˆencia sugira o contr´ario. Ambas as hip´oteses, no entanto, est˜ao sujeitas a erros (como os julgamentos, naturalmente). Assim, temos • P(ET I) Podemos definir a P(ETI) como sendo a probabilidade de rejeitarmos H0 quando H0 ´e verdadeira. Na terminologia de Econometria, chamamos a P(ETI) de n´ıvel de significˆancia (´e uma esp´ecie de tolerˆancia para esse tipo de erro). • P(ET II) J´a a P(ETII) ´e definida como sendo a probabilidade de n˜ao rejeitarmos H0 quando H0 ´e falsa. Existe uma rela¸c˜ao bastante direta e objetiva entre os erros do tipo I e do tipo II (´e inversa, ou seja, se aumento o erro do tipo I, reduzo o erro do tipo II e vv). Al´em disso, podemos tamb´em definir o poder do teste, que ´e igual a 1 − P(ETII). Para testar precisamos de uma regra de decis˜ao, como sugerimos acima. Aqui, o que acontece em Faculdade de Economia Econometria I Aulas de Econometria geral é “espelharmos” os parametros populacionais aos amostrais. Se estamos testando sobre 1, 0 mais natural é que a melhor medida para avaliar a validade da hipdtese seja X. Duas observacoes 1. Geralmente temos 2 tipos de testes segundo o critério “conhecer ou nao o?: e Testes em que o? é conhecido. e Testes em que a? nao é conhecido. 2. Admitiremos que a amostra advém de uma populacéo com distribuicaéo normal. 3. Temos também 8 tipos de testes segundo a hipdtese alternativa eo Ay: p=twsz. e Ha: >< po. e Ha: wo. Para todos os efeitos, fg 6 o valor assumido por pu na hipdtese nula. Essas possibilidades para H,4 tornam a alocacao do nivel de significancia diferente para cada um dos casos. Os dois primeiros tipos sao testes unilaterais e o terceiro tipo é um teste bilateral. Regra de decisao quando o? é conhecido Se X é uma boa medida para testarmos hipdteses sobre 4, podemos entdo usar sua distribuicao amostral para encontrarmos uma regra de decisao. Ja vimos que X ~ N(p, a), Entao xX z= (——*)vn ~ N(0,1) o sera a regra de deciséo quando o? for conhecido. Pela légica dos testes, X deve se situar numa regiao proxima a ji9 se Ho for verdadeira (considerando a hipotese nula Ho : « = Wo). Nesse sentido, valores muito diferentes de jug, caso Hp seja verdadeira, devem acontecer raramente. Por raramente, em geral, costumamos chamar de 5%. Se temos uma hipdtese alternativa de “diferenca”, Teremos, portanto e Regiao de Aceitacao ZE [ZL, z H| Se o nivel de significancia é de 5%, zz = —1,96 e zy = 1, 96, afinal de contas estamos lidando com um teste bilateral e com uma normal-padrao. e Regiao de Rejeicao Faculdade de Economia Econometria I Aulas de Econometria (z < zt)U(z> 2H) Ex: Digamos que o QI da populagao segue uma distribuigao normal com média 100 e desvio-padrao 16. Serd que os canhotos tém QI semelhante ao da populacaéo em geral? Admita que temos em mos uma amostra de 400 pessoas canhotas e que X = 99. Ay : w = 100 Ha: 100 Admita também que a = 5%. Qual sera a regiao criftica? Vejamos. xX - 99 — 100 z= (—*)vn = (—— ) v0 = 1,25 o 16 Como a regiao critica é igual a (z < —1,96) U(z > 1,96), nao rejeitamos Hy (ou seja, estamos fora da regiao critica ou ainda dentro da regiao de aceitagao). P-valor E definido como a probabilidade que denota o limiar entre aceitacao ou rejeicao da hipotese nula. Ex: Admita que calculamos z = 1,47 num teste unicaudal (ou seja, alocamos todo o nivel de significancia, por exemplo, do lado direito). Ao olharmos na tabela da normal-padrao, z = 1,47 equivale a um p-valor de aproximadamente 7,07%. Se o nivel de significancia é igual a 5%, temos evidéncia para rejeitar Hg. Ou seja, a estatistica de teste se encontra na regiao de rejeicao. Regra de decisao quando o? nao é conhecido O que muda essencialmente é nossa regra de decisao, que passa a ser xX — T= (—*)ve ~ tn-1 S De uma forma geral, o teste t se assemelha bastante com o teste em que a variancia populacional é conhecida pois tanto a t como a normal-padrao sao simétricas em torno de zero. No entanto, na t temos um ligeiro aumento no grau de dificuldade, pois temos que considerar também o grau de liberdade para definirmos as regides do teste. Ex: Admita que temos uma amostra em que X = 31,5, S = 3eela tem tamanho igual a 25. Defina ainda o seguinte teste NA AAA MINA IAAI AN RMA ER BK KR AMA ERR EN ERAN Faculdade de Economia Econometria I Aulas de Econometria Ao: p= 30M, : p > 30 Neste caso, temos T= (“*) vn = (2) 35 =2.5~\th-1 S 3 Veja que, para a = 5% e g.l = 24, a regiao de aceitacao sera (—oo, 1,71]. Como T ¢ (—ov, 1, 71], rejeitamos Hp em detrimento da hipdtese alternativa. Pergunta: Qual é 0 p-valor para T’”? Econometria - O problema da estimacao Em certo sentido, podemos dizer que a Econometria é aplicacao de inferéncia estatistica & andlise de fen6menos econdmicos, que na maioria das vezes tem sustentacaéo numa teoria robusta. Natu- ralmente, poderfamos descrever a Econometria como um exercicio empirico (quantitativo) de uma certa teoria econdmica. Para isso, precisamos determinar as hipdteses que o modelo em questaéo seguiré (que pode vir da propria teoria), construir uma especificagéo (quais varidveis entrarao), acessarmos os dados, estimarmos e testarmos hipdteses a respeito desse modelo e, finalmente, usa- lo para uma certa politica. Apesar de montarmos bons modelos (possiveis associagdes), em economia costumamos lidar com intmeros fatores que podem tornar a andlise pouco precisa. Isso acontece pois nao somos capazes de definir com exatidao todos os elementos que interferem no comportamento de determinada varidvel (na maoria das vezes porque nao sao, de fato, mensurados). Por essas e outras é que, em Econometria, tratamos exclusivamente de relacoes estocasticas, ou seja, Mensuramos as imprecisoes, inexatidoes, imperfeiccdes através de um termo de erro. Tendo isto em vista, podemos descrever o modelo de regressao linear como Y, = 61 + Xi + & em que Y; é chamada de varidvel dependente, X; é a varidvel explicativa e €; 6 0 termo de erro (ou perturbacao). Além das varidveis em si e o termo de erro, temos os parametros do modelo, através dos quais mensuraremos a relacaéo entre Y; e X;. Esses parametros refletem o que conhecemos por estado da natureza e, portanto, sao desconhecidos. Um dos objetivos do modelo de regressao é justamente estimar e testar esses parametros. Poderiamos dizer que entram no termo de erro €; todos os fatores que interferem no comportamento de Y;, mas que por algum motivo nao estao representados no modelo. Para tornar a andalise Faculdade de Economia Econometria I Aulas de Econometria factivel, precisamos de alguma forma criar mecanismos através dos quais tornamos o modelo bem comportado, apesar da existéncia de um fator de perturbacao estocdstico. Chamaremos esses mecanismos de pressupostos basicos, quais sejam 1. Lidamos com um modelo linear. Linear significa linear nos pardmetros. 2. Normalidade: Diremos que ¢; ~ N(.,.). 3. E(e:) = OVi. 4. O modelo é considerado homocedAastico, ou seja, a variancia do termo de erro Var(e;) é constante e igual a o?Vi. Como E(e;) = 0, podemos escrever Var(e;) = E(€?) = 0°. 5. Auséncia de autocorrelagdo dos termos de erro: E(eje;) = OVi F j. 6. Diremos, por ora, que X; nao é estocastico. 7. O termo de erro €; € a varidvel explicativa X; nao sao correlacionadas, ou seja: Covu(e;, X;) = 0. Existem outras hipdteses sobre as quais falaremos mais adiante. Esse pode ser considerado o conjunto de hipdteses basicas mais relevantes no contexto de modelos lineares. Alguns resultados j4 podem ser trabalhados na posse das hipdteses basicas. e Veja que se E(e;) = OVi, E(Y;) = E(B + BoXi + €&) = Bi + BoXi + E(G) = Bi + PoXi Além disso, Var(Y;) = Var(6, + B2X; + 6) = Var(e;) = 0? Outra coisa é que se e; 6 normalmente distribuido, podemos dizer que toda funcao linear de € também sera linear. Concluimos, portanto, que Y; ~ N(.,.). Como E(Y;) = 61 + boX; e Var(Y;) = 0, entao Yi ~ N(61 + 82Xj,07) Estimagao de Minimos Quadrados Queremos estimar 3 e 32 num modelo de regressao linear Y; = 61+(2X;+u;, em que u; ~ N(0, a). Vamos utilizar o método de minimos quadrados para estimar 6; e 62. O método consiste em minimizar a soma dos quadrados dos resfduos (é bom frisar que o termo “resfduos” indica apenas Faculdade de Economia Econometria I Aulas de Econometria que estamos lidando com um chute educado a respeito de 1 e 62). A conta que precisamos fazer sera, portanto n n . Min | ti = Min (¥,-Y;) i=1 i=1 n ~ ~ 2 Ming, 3, 9) (¥i~ i ~ Bei) i=1 Esse problema pode ser definido como otimizacao irrestrita. A receita é derivar a funcao objetivo em relagao aos parametros do modelo (que aqui sao Bre Bo) e igualar o resultado a zero. e Primeiro, vamos derivar a funcéo objetivo (que aqui eu chamarei de L(.)) em relacao a /y. aS2"_, (Y; — 6 — BoX ° ~ x OL(. ha (Yi - br — BX) L'(81, 62|(Yi, Xi)) = GEL) OP, OP, ~ ~ 2 ~ ~ 2 a(% — By 5. J (Yn — By BeXn) SS OO + eee + Tae Op, OP1 =2.x (Yi — G1 — 62X1) x (-—1)+...+2x (Yn — B1 — B2Xn) x (-1) =0 Dai, temos L'(.) = 2(—1) x (vi — By — BX) +e... t (Yn _ By _ BeXn)| n . n . = 2(-1) x yoy — ny — YX; | i=1 i=1 n . . n =2(-1) x [Ovi - ni -& YO x] =0 i=1 i=1 Faculdade de Economia Econometria I Aulas de Econometria SOY; — nb — Bo S > X; = 0 i=l i=1 nb, = S oY; — 625° X; i=1 i=1 . 1 n . 2 pi = 7 yoy — & > x,| i=1 i=1 by =Y — BoX e Agora, vamos derivar a funcio objetivo (que aqui eu chamarei de L(.)) em relacao a Jo. 1 (Bu Bald, Xy) = DEE) = Ea (Hm) d vd a ABo ABo - . 2 ~ 2 a(vi — Pi — 8X1) a(¥n — Pi — Xn) = sd Ht... HE. a OB OB =2~x (Yi — Bi — B2X1) x (—X1) +...+2x (Yn — Bi — B2Xn) x (—Xn) = 2(—1) x (vi — By — ByX1)(X1) +...+ (Yr - Bi - BeXn)(Xn)| = 2(-1) x [VX — Xi — BeXP) +... + (YaXn — BiXn — BoX?)| = 2(-1) x ouix - SAX - > BX? | i=1 i=1 i=l = 0 Entao, temos 2(—1) x OMX — So Xi — yo 3x? | =0 i=1 i=1 i=1 So YiXi — SAX — S- B2X? = 0 i=1 i=1 i=l So ¥iXi — Bi Y> Xi = Bo So X? i=1 i=1 i=1 jy = ie Vii - Br i Xi ° wh X? NA? S4h VU EVENS EAN EK FN ELLIO Faculdade de Economia Econometria I Aulas de Econometria Equacgoes Normais (caminho para chegarmos aos estimadores de minimos quadrados) 1. Retira do primeiro trecho n n np = y Yi — Bo y Xj i=l i=l n n y Y; = n61 + Be y Xj i=l i=l 2. Retira do segundo trecho n n n 3 A y2 y YiXi — y Bi Xi — y BoX; =0 i=1 i=1 i=l n n n A R 2 y YiX;i = Pi y Xi + Bo S xX; i=l i=l i=1 3. Para resolver, usaremos um sistema n Qa A n ini Yi = M81 + Bo ay Xi n yy n : a n 2 Viet Yj Xi — By Viet Xj + Bo Dizi X; 4. O préximo passo é resolver o sistema de equagodes. O resultado sera 3 = (Xi — X) (Vi — Y) 2 ee —— (Xi — X)? Isso fica como exercicio para vocés. Melhor Estimador Linear Nao Tendencioso Uma das caracterizagoes mais importantes do estimador de minimos quadrados no modelo normal cldssico é que ele é6 dito o Melhor Estimador Linear Nao Tendencioso. A primeira coisa que devemos fazer é entender o que significa “Melhor Estimador Linear Nao Tendencioso” no linguajar de estatistica e depois derivaremos um estimador com tais propriedades no contexto de um modelo linear e veremos que ele equivale ao estimador de minimos quadrados. e O termo “linear” é usado pois 82 6 uma combinagao linear das observacoes. e Nao-viesado é ainda mais simples; Como sabemos, dizemos que um estimador (62 é nao viesado se E( 2) = Bo. Faculdade de Economia Econometria I Aulas de Econometria e Ao que seria atribuido o termo “melhor”? Podemos dizer que um estimador é “melhor do que outro estimador se estao dentro da mesma classe de estimadores (e, portanto, neste caso sio lineares e ndo-viesados) e, primordialmente, que Var($2) < Var( betas), em que beta5 é um estimador qualquer linear nao-viesado de 2. Levando isso em consideracao, uma “cara” possivel para o MELNT seria em que a;, para i = 1,...,n sao constantes a serem determinadas. Usando o nao-viés, temos E(62) = S- aiE(¥i) = So ai (81 + 62X;) = Bi So ay + Bo S > aiX; Ora, se E (82) = Bo, entao >> a; =0 e )>a;X; = 1. Guardamos entao os seguintes resultados (1) (2) Finalmente, precisamos encontrar a varidncia de 3). Esta sera ~ 2 Var(82) = Var(d— aiY;) = E> aiY; — E( Ss" aiYi)) = 2 = 6(Ya(vi- 20%) = 2 = B( >> (ai(¥%i - £(%)))? +20 ai (% - B(%))a;(¥j — B(%))) t<J Para faciliar um pouco a apresentacao, veja que Y; — E(Y;) =«; Vi, logo Faculdade de Economia Econometria I Aulas de Econometria x 2 Var(82) = E(> (aiei) +2 Ss" aiajeie;) = t<J = Ss" a; E(e;) +2 Ss" aia; E (e:e€;) = t<J = Ss" a? (o*) +0= =! Det Logo, Var(62) = 07 )\a?. Para esse estimador By ser o melhor estimador nesta classe de estimado- res lineares naéo-viesados ele precisa ter a menor variadncia. Na posse dos resultados das 2 condicdes e na funcao objetivo dada pela variancia de 82, podemos montar nosso modelo de otimizacao Ming, 0 S° a? 5. Dane S° a; Xj; =1 A primeira coisa que faremos é criar o Lagrangeano, L(.), com o auxiflio dos multiplicadores de Lagrange (um para cada restricao), A; e Ag. Depois derivaremos a fungao L(.) com relagao a cada aj, com i=1,...,n e aos multiplicadores A; e Ag e igualaremos as equacoes resultantes a zero. L(a4,. ++5An,--- »A1, A2) = oS aj _ d( Soa) _ | (So aiX:) _ 1] (3) Derivaremos 3 com relacao a cada aj,i=1,...,n e A1 € Ao. OA) = 29a, — 1 — 2X1 = 0 OA) = 20? a2 — dy — Xo = 0 FA) = 207 dn _ Aq _ AoXn = 0 _ > ay = 0 — (aiXi) +1 =0 Podemos reescrever as n primeiras equacoes acima da seguinte forma: Faculdade de Economia Econometria I Aulas de Econometria _ + (y No X ) a= 5521 + AQAA 1 a2 = 553 1 + A2X2) = (Ar + A2Xn) an = 22 1+ A2An Fazendo a soma, teremos ! Xr r X; (4) So ai = 562 1n+ Ag Ss" i Além disso, podemos multiplicar as n equacoes de aj,...,@, por X;, um X; para cada linha e depois somarmos, tal que 1 2 a, X1 = 557 AiX1 + d2X7) 0 1 agXo = 552 AiX2 + \2.X3) 0 1 2 anXn = 552 AiXn + d2X7) 0 l 2 Sax ahla(De) +a(Da) 0 Vamos usar as equacoes 4 e 5, junto com as equacoes especificas para A; e Ag para encontrarmos 1 = 555 (Ain + do > Xi) =0 1 2 ~3g8|M (EX) + (Ex?) = 1 —20? > Xj A= et n(EX?) - (EX) 2no? Ag = (Ex) -(Ex) Dai, teremos para cada a; Faculdade de Economia Econometria I Aulas de Econometria — ( » Xi) + nXj ay = TONNE (6) n(x?) - (EX) para cadai=1,...,n Como escrevemos 32 = >> aiY;, podemos escrevé-lo como _ ~(¥i) + nx, B= Ss" eo i n(x) -(E4) s -¥i( Xi) + nXiY; = —_—_— TT n(x?) - (Ei) -(¥) (xx) +n( So Xi¥i) =, 2 n(x) - (24) Fazendo algumas contas, chegamos 4 mesma versao que encontramos acima para o estimador de minimos quadrados, ou seja . X;-— X)(Y¥; -Y Bo _— »( a ) t 5 ) (7) (Xi — X) Em resumo, o estimador de minimos quadrados é o melhor estimador linear nao tendecioso. J& a variancia de By pode ser escrita como Var(B2) = 0? Ss" a? Para encontrarmos )>a? vamos usar raciocinio semelhante ao usado para encontrar os a;. Na equacao de cada a;, multiplique ambos os lados por a; e depois some. Teremos o seguinte aj ( » Xi) + na, X; 2 ag = tTNDOeT SND n(x) (=a) Sag = SEAMEN) +l Sak) wo 2 n(E4?) - (EX) Acontece que as restrigdes do problema de otimizacao eram, respectivamente, >> a; = 0e >) a;X; = Faculdade de Economia Econometria I Aulas de Econometria 1. Dai, temos que a equacao acima fica 2 n Se=-— "se n(x?) - (EX) A variancia, agora de Bo, é escrita tal que “ 9 n o Var(62) = 0° ———__——.y = = (8) n(x?)-(SK) UX) Observe que a Var(62) depende de um sujeito que na maioria das vezes é desconhecido ( 0? ). Isso pode provocar mudangas na forma de lidar com o problema de inferéncia (distribuicaéo dos estimadores, testes e IC). Outra observacao importante é que nada falamos a respeito de 8,;. No entanto, poderiamos seguir os mMesmos passos que seguimos para obter o melhor estimador linear nao tendecioso (doravante BLUE) de 5. Nao farei a conta aqui, mas deixarei os dois resultados By =Y — BX (9) 5 1 xX? Var =o? |-+——__——. 10 a= + sama ) A distribuigao dos estimadores de {; e 6 A primeira coisa que devemos notar é que tanto 81 como Bo s&o fungao de Y;, 1 = 1,...,n e que cada um dos Y; tem distribuicéo normal com média E(Y;) = 61 + 82Xie variancia Var(Y;) = 07. Portanto, tanto 8, como 2 so normalmente distribufdos. Como ambos sao os melhores estimadores lineares nao tendeciosos, podemos escrever a distribuigao dos estimadores usando as equacoes 7, 8, 9e10 5 1 x? ~N o” |— + .——__. ir~w (So? + =e x) 2 » a Ba ~ N | Bo, =D > (Xi — X) Por serem nao tendeciosos, a esperanca de Bie Bo sao, respectivamente, 8; e B2. Além disso, aproveitamos os resultados das variadncias obtidos nas equacdes 8 e 10. Ambas as distribuicdes serao muito uteis quando quisermos obter IC e TH para os parametros da equacao de regressao. Deixarei abaixo, em caixas destacadas, as demonstracoes de E ) e Var(62) partindo do resultado Faculdade de Economia do estimador 2 Bancnmnga dle _ Sed (x; - X)(¥i-Y)) _ ep 2 (X: — X) (1 + BeXi + — Bh — eX -a)) _ SEE (Xi; — X) (6o(Xi — X) + (ws - a) _ SKE (G(X: — X)? + (Xi — X)(us -))) — Se pl( Lae -¥)') + (Se — X)(uj -») - SK eels - X)*) +2(2% - Xu -0)) - AK ph ae - X)?) + 2 2((%- Hu -a)| - SK Le [2 2B (Xi — X)? + 7%: — X)B((us -))] - Smid (x: - X)"] = Br Faculdade de Economia Econometria I Aulas de Econometria AVEWuE-neL@r- mele cp yn = Vor B= 1) y> (X; — X)? _ (Sao) var( > (xi -X)(%i-¥)) = (<a var(- (X; oa X) (31 + BoX; + uj; —- 21 - BoX =) = (<a | Var (3 (82(Xi - X)? + (Xi - X)(ui — w)) J _ (= = =) Var( > B2(X: — X)? + 0% — X)(u — a) 1 ° _ _ (<a) Var (Sox — X) (uj — i)) 1 ° _ — (<< var( SOx _ X)ui) Mostre que E( Yo(Xi - X)ui) é zero. 1 ° = 2 = (Scecap) Ba) - (<a) E x (xi - X)u;) +297 (Xi — X)ui(X;— Xa) Preciso mostrar que B(2 i<j (X; — X)ui(X; — X)u;) =0 1 ° =\2 9 = (Seecap) Dele-20e Faculdade de Economia Econometria I Aulas de Econometria AVEWuE-neL@r- mele cp 1 2 = {=a S> (Xi — X) E(u;) (5 (Xi — X) 2 1 =\2 9 -(— ,) Dw-x% (= (X; — X) 9 2 o 5) 2 -(—") S@-» (5 (X; — X) —_ —/e!!)hlUu]D » (Xi - X) Estimagao das Variancias de By e Bo Conforme destacado acima, as variancias de By e Bo dependem de um parametro desconhecido, o?. E possivel construir ICs e THs a partir de pivots que séo funcio de a? Sim, é claro! Mas ambos terao como base a distribuigao normal, como ja vimos em nossa revisao de inicio de curso. Como, na realidade, a? é de fato desconhecido, precisamos de um estimador que funcione com um bom chute educado para o seu verdadeiro valor. Usaremos 0 método da maxima verossimilhanga para encontrar 02. O contexto é 0 mesmo de outrora: nosso modelo é Y; = (1 + 8.X; + uj, com u;s~ N(0, o”) e i= 1,...,n. Todas as hipdteses iniciais sao validas. Dai, teremos n L(o”|us,..-, tn) = [| f (us) i=l Ul 1 lu? V2r0? p 207 1 \" Lu Ui = | — exp| — ~=—+ 1 \" Lu Uj 1 \" 1 2 = | —— ] exp| - ~> Us Depois disso, fazemos a funcao de log verossimilhanca Faculdade de Economia Econometria I Aulas de Econometria 1 \" 1 I(o7|uy,...,Un) = logL = log (ts) col ~ 552 >) n 1 1 5 = log (ts) | + log bon( — 952 >) 1 1 5 1 = n|log(1) — log(v2m0?)| — 552 S° ur 1 1 =n —log(2o*)2| — 52 Sou; n 1 =-5 [ log(2707)] ~ 552 So uj n 1 =-5 [ log(27) + log(a”)} — 552 So uj n n 1 =-5 [ log(2m)] — 5 [ log(o”)| ~ 552 Sou Agora, devemos tomar a primeira derivada de I(.) em relacao A a? e igualar a zero. Ol(.) ni 1 9 002 9 o2 + 2(02)? i nil 1 2 Dot ae 1 zz 1 2-5 fie Pal ri 1 4 a 2 = —S° (Yi = bh — B2X;) n 1 = —SQR n em que SQR se refere 4 soma dos quadrados dos residuos. O problema é que o2 é viesado (demonstro isso abaixo). Depois de algumas contas, encontraremos Ss? = +, SQR, que é o estimador nao viesado da varidncia do termo de erro o?. Para provarmos que F(a?) é viesado, vamos comecar escrevendo Faculdade de Economia Econometria I Aulas de Econometria o = (HAs — ByXi)" = Sy (G1 + BoXi + uj — Bi - BoXj)" = - > (8 — 61) — (Bz — Bo) Xi + ui} = ->- |-(¥ - BX -¥ + BX +1) — (82 ~ Ba) Xi + ui] = ->- (82 — B2)X — & — (Bo — B2)Xi + ui} = =) [Hb (Ki - ¥) + (w-o)] = => [lui — @) — 2062 — Ba)(Xi — X) us — a) + (Be — )*(% - XP] = = [Sus = a)? — 208 — Ba) D2 — Bus — a) + (Be — Ba)? DK - XY] = = (us = a)? ~ 2 (8, - Be) 2% - RN eu — @) + 2 — YP UH - 8? Observe que )>(X; — X)(uj — @) = (62 — 62) 33(X; — X)?, derivado da equacao 7 By = (Xi - X)M%i-Y) EG — XP — YG — X)[B2(Xi — X) + (us — @)] 7 (Xi — X)? _ BoM - X)P? + VOG — X) (ui — @) 7 D(X — X)? _ Ba X(Xi =X)" (Ki ~X)(ui =v) D(X — X)? D(X — X)? _ 9 , DIK ~ X)(ui — @) = Bg + — (x — xy (% - 2) do(%i — XP = SUX — X) (ui - a) Dai, temos o = ~So(ui — a)? - “(B — Bz)? wes —X)?+ “(b2 — B2)? wes — Xx) = = (ui - a)? ~ 2 - YP SK - 8) Faculdade de Economia Econometria I Aulas de Econometria Ge Tomando a esperanca de ambos os lados da equacao, temos B (a8) = 7 (So Btu a) — 7B (hh) Dim x) n ‘ n ‘ 1 1 o _ =— B(u; - a)?) - -—"7 X,-— xX) 7 (Bu 0") — ae LO - 8) n—-1 oa? n n n—2 n Fica como exercicio mostrar que E(u; — u)? = [2] o?. Portanto, o2 é viesado. Podemos corrigir o viés usando [2]. Multiplique 0? por ="; e depois tome o valor esperado. Teriamos assim p (2,38) =" (a) -* [22] 02 n—2 — n-2 — n-2 n = o2 Logo, S? = ng? = ot > (Y; — By — ByX;)" = i Sui? = +, SQR é o estimador nao viesado de o?. Agora fica muito mais facil. Podemos “plugar” 0 estimador nado viesado de a? onde antes tinhamos o? na formula das variadncias. Teremos assim —_—> 1 Xx? Var es ns 11 — $2 Var = —_—__ = G, 12 Somos capazes agora de construir intervalos de confiancga para @; e G2 com mais robustez, nos apoiando em estimacgdes das suas respectivas varidncias (lembre que poderfamos montar ICs a partir da distribuicdéo normal se admitissemos o? conhecido). Intervalos de Confianga para (£; e {2 Vamos apelidar as variadncias de By e Bo de oF e oF respectivamente. Assim, as distribuicdes de Faculdade de Economia Econometria I Aulas de Econometria Bi e Bo se resumiriam a By~N (1,02, ) (13) Bo~ N (2,02, ) (14) Podemos, no mesmo sentido, padronizar ambas as distribuicoes, de tal forma que P= Pr N(0, 1) (15) on Pr Bo Bo N(0, 1) (16) O05 Bo Note que o denominador de ambas as varidveis aleatérias dependem de um fator desconhecido o?. Trabalhamos nesse problema na secao anterior. Vamos substituir as respectivas variancias por S By eS Bo" A questao é que a distribuicao de a nao serAé mais N (0,1). Precisamos descobrir que distribuicao é essa. ° 2 Adaptando o resultado de um teorema visto em uma das secoes de reviséo, temos que ons ~ x25. Se, por exemplo, dividirmos ambos numerador e denominador por )>(X; — X)?, temos _ _ 2 (n=2)97/ (Hi = XP _ (MANE o2/S7(X; — X)? 0 ne 2 Observe que essa distribuicgaéo se encaixa bem aos nossos propésitos. O mais natural na situacao em que desconhecemos o;, é substitui-lo por ee como jé mencionado. Teriamos Ba — Bo (2 — Be) /o9, SB, S,/ 6B, (G2 = Bs) /9,3, 2 722 V 932/73, (4 — 2) /04, 7 2, 2/0 1 [53 (n 2)/o5,(n 2) (2 - 2) /O4, = Ey 2 (np 2 _ Cure NSStVVLVtAs4AMesYy £ Vwi Mt 42 £41141 1L1U L10WU Faculdade de Economia Econometria I Aulas de Econometria Logo, podemos dizer sem medo de errar que Po—Ba ~ tn—2, 0 que facilitard bastante a nossa vida Ba para encontrar os ICs. Note que essa mesma ideia se aplica a 3,. Nao vamos fazer essa conta, mas podemos também considerar que Ff ~ ty—9. . . 61 . . Em posse dos pivots, eis que os ICs para 3; e 62, podem ser escritos, respectivamente, como Bi — By P ter < 9. < tam =l-a Bi B2 — Bo P ter < 9. < tam =l-a B2 Fazendo algumas poucas contas, temos que o IC de nivel de confianga 1 — @ sera Bi — tn2,0/254, <A < At tn—2,0/2%, B2 — tn—2,0/25 3, S P2 < Ba + tr—2,0/254, Teste de Hipdétese sobre os parametros Os testes de hipéteses mais basicos associados ao modelo de regressao linear sao aqueles que pro- curam saber se existe ou nao relacao estatisticamente significativa entre a varidvel dependente e as varidveis explicativas (no contexto do modelo simples, poderiamos dizer a varidvel explicativa, pois s6 hé uma). Podemos também testar a significancia conjunta dessas varidveis explicativas (que nao é o mesmo que testar sobre os parametros individualmente), bem como testar sobre a existéncia ou nao de intercepto. Vamos criar agora o teste de hipdtese para 32. Abaixo, listo as ferramentas necessarias para construir um TH. 1. Precisamos de uma hipdtese. Ao : Bo =0 Ay : 82 #0 Universidade Federal Fluminense Faculdade de Economia Econometria I Aulas de Econometria ´e a hip´otese inicial. Podemos aumentar a complexidade do nosso conjunto de hip´oteses se tenho, por exemplo, o apoio de uma teoria. Imagine que queria saber se a demanda de certo bem ´e ou n˜ao inel´astica `a varia¸c˜ao de pre¸cos. Digamos, para facilitar, que este seja um bem normal. Es- peramos, portanto, que o sinal de ˆβ2 seja negativo. Nosso teste teria, na hip´otese nula, a “regi˜ao de elasticidade”, ou seja, de β2 ≤ −1 e a hip´otese alternativa englobaria a “regi˜ao de inelasticidade”, que seria β2 > −1. O apoio da teoria ´e muitas vezes fundamental na hora de montarmos hip´oteses. 2. Preciso de um conjunto de dados. No modelo de regress˜ao, o que vocˆe ter´a ´e uma amostra dos pares ordenados (Y1, X1), . . . , (Yn, Xn), dentro do contexto em que Yi = β1 + β2Xi + ui, com ui ∼ N(0, σ2), para i = 1, . . . , n. 3. Preciso de uma Estat´ıstica de Teste (ou Regra de Decis˜ao ou Pivot). No contexto, por exemplo, em que σ2 n˜ao ´e conhecido, ˆβ2−β2 S ˆβ2 ∼ tn−2 ser´a a nossa estat´ıstica de teste (o mesmo pode ser estendido a testes sobre β1). 4. Preciso determinar uma regi˜ao de aceita¸c˜ao (ou uma regi˜ao cr´ıtica, a ideia ´e a mesma). Para isso, vamos usar o n´ıvel de significˆancia, o qual apelidaremos de α. α, na maioria dos casos, pode ser 1%, 5% ou 10%. Exemplo Admita que colhemos dados sobre o preo e a quantidade de laranjas vendidas num supermercado, ao longo de doze dias consecutivos. Consideremos o modelo de regress˜ao linear que queira estimar a elasticidade-pre¸co da demanda por laranjas. Nesse sentido, nosso modelo tem a quantidade de laranjas vendidas como vari´avel dependente e o preo da laranja como vari´avel explicativa. Gos- tar´ıamos, com os dados em m˜aos, checar se existe, de fato, rela¸c˜ao entre o pre¸co da laranja e a quantidade consumida. Admita que o n´ıvel de signicˆancia para o problema ´e α = 5%. 1. Monte o teste de hip´otese pedido no problema. Nosso teste H0 : β2 = 0 H1 : β2 ̸= 0 2. Qual ser´a a regra de decis˜ao que devo usar para testar a hip´otese descrita na letra (a). Regra de decis˜ao. Como o β2 = 0, −t0.025,10 ≤ ˆβ2 Sˆβ2 ≤ t0.025,10 Faculdade de Economia Econometria I Aulas de Econometria Essa regiao definida acima é a regiao de aceitacao, ou seja, se so € [—to.025,10, to.o25,10], entao 2 eu sou inclinado a nao rejeitar a hipdtese nula definida na letra (a). Logo, usando o nivel de significancia igual a 5%, concluimos que to.025,10 = 2,228. A regiao de aceitacao sera, portanto, [—2, 228, 2, 228]. 3. Monte o intervalo de confianca para 32 com as informacoes que vocé dispde do problema. By € [8 — 85, x 2,228, By + 85, x 2, 228]. 4. Sabendo que Bo = —1,578 e S5, = 0,176, encontre o IC para 62 e diga se vocé aceita ou rejeita a Hp dada em (1). O Coeficiente de Determinacdo R? - Uma medida de Bondade de Ajuste A ideia por tras da avaliacéo do coeficiente de determinacio R? é saber o quao razodvel a reta de regresséo se ajusta ao conjunto de dados (basta observar um grafico de dispersao e a reta de regressdo ajustada aos dados). Dito de outra forma, podemos dizer que as variagoes de Y se devem parcialmente a X e parcialmente aos termos de erro u. O R? nos d4 uma medida do quanto das variagoes de Y estao relacionadas as variagodes de X, ou seja, se devem 4 varidvel explicativa (ou varidveis explicativas nos modelos mutltiplos). Partimos do modelo de regressao estimado, ao qual daremos a notacao Y; = By + BX, +0; = Yj; +0j. Faremos o desenvolvimento de R?. Para isso, subtrairemos de ambos os lados Y. Y¥,-Y=Y,-Y+4@; Agora, tomaremos o quadrado de ambos os lados da equacao acima (i- YP =(%i-Y +t)? Tomaremos a soma de ambos os lados, relativas a i wv =F ba? =>2 | -VP +20 - Pa) + | -S y+ Lew yay + De O termo > 2(¥; — Y)(a;) = 0, pois Faculdade de Economia Econometria I Aulas de Econometria Y= 2(¥; — Y)(s) = 250% — ¥) (aa) =2 S (hi + BoX; — Y)(as) =2 Sov — BX + BX; Y)(t) =2 S° (82(X; — X)(a)) = 26. So (Xitii — Xai) — 285 S Xiti — > Xa,| = (1) +) Primeiro, faremos a conta de (2) (2) =X Soa =X[S OM - 1 - X,)| = X[SCY; — So 81 — S > 2X3] =X[SCY; —nx (61) — So BoXi =X[SCY¥i-n x (Y — 6X) — S5 boXi] = 1 ~ (1 - = X[SCY; —nx (dx -4(2 3%) — S > 2X5] =X[SUY;i— SOV + SX: — S72 Xi)] =0 Finalmente, vamos a (1). Lembremos das equagées normais (1) = S> Xiti = So XY — Bi — B2X;) = SO (Xi — Xib1 — 2X?) = So XY - S> Xibi - N° BoX? = SUX: — fi DXi — be YX? =0 usando a segunda equacaéo das equacoes NORMAIS que desenvolvemos Logo, >> 2(Y; — Y)(a&j) = 0, concluindo a apresentacaio. Tomando o que resta, temos Faculdade de Economia Econometria I Aulas de Econometria Doi-vr= D-H De SQT = SQE+4+SQR O R? é definido como SQE SQR pe = 2@E _ | _ SQh 2g y SQT SQT em que SQE é dito ser asoma dos quadrados explicados, enquanto SQT éasoma de quadrados totais e SQR, como ja vimos, é a soma dos quadrados dos residuos. Abaixo segue uma demonstracio da relacéo entre o R? e o coeficiente de correlaciéo amostral. Importante notar que apesar de quantitativamente muito proximas, essas varidveis representam coisas relativamente distintas. Do ponto de vista da regresséo, o R? tem muito mais valor, pelos motivos jA explicados. O coeficiente de correlagao amostral mede apenas de que forma as varidveis do problemas estao relacionadas. Trata-se, obviamente, de uma informacao importante, mas menos do que o R?. Faculdade de Economia Econometria I Aulas de Econometria Relacao entre o R? e o coeficiente de correlacéo amostral 2_ SQE n= SQT _ LM -¥Y _ oe “Mu -YP? Vy _ (bi + 6X1 - Y)? OM -Y) _ Y(Y - BoX + BoX; — Y)? 7 (% - Y)? —» (Bo(X; — X))’ — Mw -¥)? _ © BOG - X)’ — MY)? = B? Lu (Xi _ x)" “\ M4 -¥) . 2 _(X(G- XM-H)) (DK -X) D(X — Xx)? ~(%- YY)? _ (Si -)M-¥))? (KG - XP OY - ¥)?P Concluimos que R? = ae Vamos tomar a raiz quadrada de R?. pa, | (oi = XVM -¥)) V(X)? OM - YP _ Yaw - HM -¥) V(X — X)? OK - Y)? _ ai - OM -7¥) VOX — XP VN -— ¥)? _ TOVe Faculdade de Eeonomin Econometria I Aulas de Econometria Relacao entre o R? e o coeficiente de correlacéo amostral (1) = )0(%) - X)(¥%; -Y) => [xi - Xv - Ki + XY) => [av- CON - HCO + CLE LYN) =" ban - Eo )% - HE) + (EH) (= Oy] =- [nx x - (THK - XM) + (SIE =} (Ceca -E [Cay] -D Oy] +D [og Dy)) -}(Caxam- (LLM) -L eyo +x (OGL) =} (Dexa (CM EH -Loynoy+(LaDy)] -2(Saxxn-(Eay D009) (2) = Sox -— XP = D(X? - 2X:X +X”) =S0 x7 -2S° [XX] + 0 [x7] =S0 xX? -2X N° Xi + n[X?| =)-x?- 2(— S> x) S> Xi +n[(= 3%) ] -Ext-2, (ox) +b) -r¥t-2(x) +1) “ot (Lay =sD%- (Ey) Faculdade de Economia Econometria I Aulas de Econometria Relacao entre o R? e o coeficiente de correlacéo amostral (3)=S°M%-YY 1 2 =, (now - (dv) ) » 1(caxxai- (Ea) E00) (2) /3) 3 3 VOI” Vaezat- (Ex) (OE%— (EH) 1 Sonx xm -(Ex)(E¥)] - 1 2 ? 2 ? ny (nEx?- (EX) Jy (mL -(E¥)) _ n> Xi — (Xi) (LN) 2 2 y =x? - (EL) )y/ (PE (LH) ) Andalise de Variancia Antes de entrarmos propriamente no que chamamos de Andlise de Variancia, vamos relembrar alguns detalhes sobre as distribuigdes N(0, 1), x2, te € Frm. Admita inicialmente que X; ~ N(0,1) e X_ ~ x2 e que X1 e X2 sao independentes. Uma das coisas que podemos rapidamente inferir é que X? ~ x?. Além disso, vimos que uma v.a com distribuicdo t advém de um quociente de uma varidvel aleatéria com distribuigéo normal-padrao (NV(0,1)) e a raiz quadrada de uma variadvel aleatéria qui-quadrado dividido pelo seu numero de graus de liberdade. Admita que T = ~~, a/X2/n em que Xj ~ y2. Sabemos que T ~ tn. Mas qual sera a distribuicao de T?? 2 2 Xi XP _ X7/1 T = —__ => ss rw Fin / X2/n X2/n — Xo/n O objetivo aqui é dizer que ha uma relacao direta entre as distribuicdes t e F'. No contexto de Econometria, essa relacao é importante quando observamos a estatistica Ff’ de um modelo simples de regressao linear (uma tnica varidvel explicativa). Ela sera rigorosamente igual ao quadrado da Estatistica t da varidvel explicativa. Faculdade de Economia Econometria I Aulas de Econometria Vimos também que R? = oor =1- cor No desenvolvimento da relacéo entre R? e o coeficiente de correlacgéo amostral R, vimos que uma forma possvel de escrevermos SQE é 5 s\2 4 5\2 qb = 2 88(%: — X)° = BY (xX) Mostraremos rapidamente que, se 32 = 0, garantido, por exemplo, por uma hipotese nula, 5GE ~ x7. Veja que a distribuicao de Bo é 2 » a Bo~ N (1 = ) YG - X)? Se padronizarmos 2, teremos 3 (& — Be) (v YG — X) a2 _ oO V (xi-x)? Logo, podemos dizer que, se 2 = 0, Z? = oGE ~ x2. Veja agora que a distribuicao de BGR nos jé conhecemos. Vimos que (n — 2)S ° => a; 2 sae gh Xn Logo, “SF ~ y?._». Voltemos agora para a ideia geral da Andlise de Variancia. Uma outra forma de escrevermos os testes ¢ que desenvolvemos nas secoes anteriores, em que Ao : B82 =0e Ha: Bo 40, € Ay: Y= Pi + ui Ha: Yi, = Pi + B2Xi + ui Ou seja, considerando que {2 = 0, nossa equacao de regressao se reduz a versao disposta em Ho. Nesse caso, admtindo que Ho é valida, veja que SQT = SQR (Y = By =Y). Visto isso, considere a estatistica de teste que usamos acima Faculdade de Economia Econometria I Aulas de Econometria Bo — Bo (4 — 2) /o, a 7 pe ce Bo 2 _ 2 _ y (3, (n= 2)/02, ) [(n = 2) (% - &) (VM —*P) /o 7 / —2)S? X,—-X)? (f te OE ) /(n _ 2) (& - &) (VEOH —*) /o = Sf RS ~2 Vez /(n—2) Veja que, se usarmos o quadrado dessa Estatistica de teste, teremos algo como a 2 _ by —fy\? (=) (UK - XP) /o? 9. = SR ~ Fy n—2 B2 =z /(n _ 2) Sob a nula, de que 62 = 0, podemos reescrever a Estatistica de teste acima como SQE/1 9 F=—— ~ Fin &t SQR/n—2 0 0b"? on? Uma das informac6es que obtemos no output de um modelo é 0 S, que vem a ser a raiz quadrada do denominador da estatistica F' trazida acima, ou seja, \/SQR/n — 2. Podemos agora escrever a Tabela ANOVA (referente 4 andlise de variancia), que contém informacgées importantes para apreciacao do pesquisador. Variacao SQ gl SQM SQE Y(Yi-Y)?=B8Y(Xi-X)? 1 BBX — X)? >) Sa? SQT (¥i -Y)? n—-1 Tabela 1: Tabela ANOVA