·

Cursos Gerais ·

Econometria

Send your question to AI and receive an answer instantly

Ask Question

Preview text

EAE1223 Econometria III Aula 5 Metodologia de BoxJenkins Luis A F Alvarez 19 de setembro de 2024 A metodologia A metodologia de BoxJenkins consiste numa série de etapas para estimar um modelo univariado de previsão Ideia é estimar um modelo simples embora flexível aos dados Tratase da metodologia básica de previsão em séries de tempo Diversas metodologias modernas incorporam o espírito de BoxJenkins Benchmark para avaliar outros modelos de previsão 2 67 Etapas da metodologia A metodologia consiste de quatro etapas 1 Identificação nessa etapa avaliamos os dados e identificamos quais modelos são candidatos plausíveis para reproduzir os dados 2 Estimação nessa etapa estimamos os modelos candidatos 3 Diagnóstico nessa etapa avaliamos quais dos modelos se saíram melhor de acordo com alguns critérios 4 Previsão por fim realizamos a previsão de acordo com nosso modelo Nesta aula discutiremos cada uma dessas etapas Começaremos revisando a classe de modelos estudadas na metodologia de BoxJenkins 3 67 Modelos considerados MAQ Dizemos que uma série de tempo Yt segue um MAq se Yt α ϵt j1 até q θj ϵtj onde ϵt é um ruído branco Série hoje depende diretamente da realização atual e das últimas q realizações de um ruído branco Todo processo de média móvel é fracamente estacionário De fato EYt α VYt 1 j1 até q θj² σϵ² covYt Yts θs js1 até q θj θjsσϵ² se s q e 0 do contrário Correlação morre após q períodos Um processo MAq é dito invertível se pode ser escrito como Yt ω j1 até ψj Ytj ϵt MAq pode ser representado como AR ARP estacionário Dizemos que uma série de tempo Yt segue um ARp estacionário se ela se escreve como Yt α j1 até p βj Ytj ϵt onde ϵt é um ruído branco e os coeficientes βj são tais que o processo resultante é fracamente estacionário Série hoje depende diretamente das realizações passadas nos últimos p períodos mais um ruído branco Mas persistência não é tão grande de modo que a série é estacionária não há raiz unitária Recordese que um ARp é estacionário se e somente se ele se escreve como um MA Yt κ ϵt j1 até τj ϵtj ARMApq ESTACIONÁRIO Dizemos que uma série de tempo Yt segue um ARMApq estacionário se Yt α i1 to p βi Yti ϵt j1 to q θj ϵtj onde ϵt é um ruído branco e os βi são tais que o processo resultante é estacionário Combinação dos dois modelos anteriores Metodologia de BoxJenkins visará a estimar modelos na classe ARMApq E SE OS DADOS FOREM NÃO ESTACIONÁRIOS Até agora discutimos a modelagem supondo as séries estacionárias Como fazer a previsão em casos não estacionários Se as séries apresentarem uma tendência estocástica trabalhamos com os dados em primeira diferença ΔYt Conduzidas as etapas da metodologia BoxJenkins com os dados diferenciados e encontradas projeções para ΔYt fora da amostra recompomos as projeções em nível usando o fato de que Yt1 Yt ΔYt1 Isto é se temos T observações projetamos ŶT1 YT ΔŶT1 ŶT2 YT ΔŶT1 ΔŶT2 e assim por diante MODELOS ARIMApdq Em outras palavras no caso de raiz unitária a metodologia irá estimar um modelo ARIMAp1q da forma ΔYt α i1 to p βi ΔYti ϵt j1 to q θj ϵtj De modo geral se a série é Id a modelagem considerará modelos ARIMApdq ΦL1 Ld Yt α ΨL ϵt para polinômios ΦL e ΨL de grau p e q respectivamente PREVISÃO COM TENDÊNCIA DETERMINÍSTICA Se séries apresentam tendência determinística conduzimos a metodologia com dados detrended Calculadas as projeções detrended recompomos projeções em nível usando a tendência estimada Por exemplo se estimamos uma tendência linear Yt ã bt ξt e ajustamos um modelo ARMA para ξt a projeção para fora da amostra é ŶTh ã b T h ξTh onde ξTh é a projeção do ARMA para T h veremos como calculála na etapa de previsão Estimação de ARMA para dado detrended é equivalente a estimar um modelo ARMApq com tendência determinística ΦL Yt α γt ΨL εt FILOSOFIA DA METODOLOGIA DE BOXJENKINS A restrição a modelos ARMApq pode ser entendida a partir do teorema de decomposição de Wold Segundo esse teorema qualquer processo fracamente estacionário pode ser representado pela soma de um MA acrescido de uma função determinística dos Y no passados Yt εt l0 ψl εtl κt onde κt é função aproximadamente linear de Yt1 Yt2 Ideia de BoxJenkins é aproximar essa representação por um ARMApq com p e q pequenos Ideia é que aproximação parcimoniosa por ser menos ruidosa tende a funcionar melhor que modelos muito complexos Identificação Identificação de um ARMApq A etapa de identificação da metodologia BoxJenkins consiste em encontrar quais modelos da classe ARMApq melhor caracterizam a série de interesse A identificação consiste em analisar a função de autocorrelação FAC e a função de autocorrelação parcial FACP da série estacionária 13 67 Função de autocorrelação serial FAC A função de autocorrelação FAC de uma série Ytt estacionária é o mapa que associa a cada número k 0 a autocorrelação de ordem k ie γk corYt Ytk Note que essa função está bem definida para processos estacionários visto que corYt Ytk não depende de t corYt Ytk covYt Ytk sdYt sdYtk covYt Ytk VYt 14 67 Função de autocorrelação serial parcial FACP A função de autocorrelação parcial FACP de uma série Ytt estacionária é o mapa que associa a cada número k 0 a correlação θk entre Yt e Ytk controlando por Yt1 Yt2 Ytk1 A autocorrelação parcial de ordem k θk é dada pelo coeficente τk associado a Ytk no modelo preditivo linear Yt τ0 τ1Yt1 τ2Yt2 τkYtk νt Eνt 0 EνtYtj 0 j 1 k 1 Note que função está bem definida para processos estacionários visto que coeficientes do melhor preditor linear em 1 não dependem de t 15 67 FAC E FACP ESTIMADAS Na prática não observamos a FAC nem a FACP de um processo mas podemos estimálas usando as realizações da série de interesse Estimamos a FAC calculando as autocorrelações nos dados γk Σt1TkYtȳYtkȳ Σt1TYtȳ² onde ȳ T¹ Σt1T Yt Estimamos a FACP ajustando o modelo 1 aos dados Inferência sobre FAC e FACP populacionais Como observamos apenas algumas realizações do processo gostaríamos de testar hipóteses sobre a FAC e FACP populacionais Sob algumas condições mais estringentes o intervalo 2 T 2 T é uma região de aceitação aproximadamente válida para o teste da nula γk 0 θk 0 na FACP contra a alternativa bilateral ao nível de significância de 5 com base na estatística ˆγk ˆθk São esses intervalos que são apresentados no R quando computamos a FAC e FACP Para autocorrelações parciais estimadas que excedem esses limites rejeitamos a hipótese nula de não autocorrelação parcial a essa ordem 17 67 FAC e FACP amostrais de Desemprego 0 10 20 30 40 02 00 02 04 06 08 10 Lag ACF Series asnumericdiffdesempregobrasil 0 10 20 30 40 04 02 00 02 04 06 Lag Partial ACF Series asnumericdiffdesempregobrasil 18 67 FAC E FACP DE UM ARp ESTACIONÁRIO Como vimos em aula anterior a FAC de um AR1 estacionário é dada por γk corYt Ytk β1k β1 1 isto é a FAC apresenta decaimento geométrico em direção a zero De modo geral a FAC de um ARp estacionário apresenta decaimento em direção a zero visto que um ARp estacionário pode ser escrito como um MA ie Yt μ εt Σj1 ωjεtj E a FACP de um ARp estacionário Pela definição da FACP de ordem k como o coeficiente de Ytk na regressão populacional de Yt em Yt1 Yt2 Ytk esperamos que a FACP seja truncada em p visto que o processo só depende diretamente das p primeiras defasagens INFERÊNCIA CONJUNTA SOBRE A FAC Para testar a nula conjunta de que γ1 γ2 γs 0 onde s é pequeno relativamente a T podemos usar a estatística de LjungBox Q TT2 Σr1s γr² Tr Com T grande sob a nula Q segue uma quiquadrado com s graus de liberdade Valores altos da estatística são evidência contra a nula ie evidência de que ao menos uma autocorrelação entre as testadas é diferente de zero Exemplo FAC e FACP estimadas de um AR2 T10000 0 10 20 30 40 00 02 04 06 08 10 Lag ACF Series ar2 0 10 20 30 40 00 01 02 03 04 05 06 Lag Partial ACF Series ar2 21 67 FAC e FACP de um MAq invertível Como vimos em aula anterior a FAC de um MAq é truncada em q visto que a correlação morre após q períodos E a FACP Se o processo MA for invertível vimos que ele pode ser escrito como um AR Dessa representação fica claro que a FACP de um MAq apresenta decaimento em direção a zero 22 67 Exemplo FAC e FACP estimadas de um MA3 T10000 0 10 20 30 40 00 02 04 06 08 10 Lag ACF Series ma3 0 10 20 30 40 02 01 00 01 02 03 04 Lag Partial ACF Series ma3 23 67 FAC e FACP de um ARMApq estacionário e invertível Generalizando a discussão anterior um ARMApq estacionário cuja parte MA é invertível pode ser representado tanto como um AR como um MA Nesse caso tanto a FAC como a FACP apresentam decaimento Nesses casos costumase considerar a ordem máxima qmax em que a FAC tornase pouco significativa e a ordem pmax em que a FACP tornase pouco signifcativa e considerar todos os ARMApq 0 p pmax e 0 q qmax como candidatos 24 67 Exemplo FAC e FACP estimadas de um ARMA23 T10000 0 10 20 30 40 00 02 04 06 08 10 Lag ACF Series arma23 0 10 20 30 40 02 00 02 04 06 08 Lag Partial ACF Series arma23 25 67 Resumo Modelo FAC FACP ARp estacionário decai truncada em p MAq invertível truncada em q decai ARMApq estacionário decai decai e invertível esp após q esp após p 26 67 Estimação Estimação condicional vs incondicional Para a estimação de modelos ARMApq há duas abordagens de estimação Na abordagem condicional não utilizamos a informação acerca da distribuição das primeiras observações na estimação Na abordagem incondicional fazemos hipóteses adicionais sobre a distribuição do ruído branco que nos permitem incorporar a distribuição das primeiras observações na análise Computacionalmente a abordagem condicional é mais simples embora menos eficiente que a segunda Embora a abordagem incondicional aparente requerer mais hipóteses visto que especificamos a distribuição do ruído branco a estimação é robusta a violações dessa hipótese quando o número de observações é grande pseudo máxima verossimilhança 28 67 Estimação condicional do ARp Podemos estimar os parâmetros de um ARp através de mínimos quadrados ordinários α β₁ βₚ argminab₁bₚ 1Tp tp1T Yt a b₁Yt1 bₚYtp² Note que não tentamos prever as p primeiras observações para as quais não temos todas as defasagens Estimadores α β₁ βₚ coincidem com o estimador de máxima verossimilhança que usa a distribuição de Yp1 Yp2 YT condicional a Y₁ Y₂ Yₚ tomando o ruído branco como ϵitiid N0 σ² Estimação condicional do MA1 Para a estimação de um modelo MA1 com base numa série Ytt1T precisamos de um chute inicial para o ruído branco no período t 0 Chamemos esse chute de ε₀ padrão é tomar ε₀ 0 Dado o chute inicial e dado um valor candicato c para o parâmetro θ₁ e um valor candidato a para o intercepto α podemos imputar o ruído branco em t 1 ε₁ac Y₁ a cε₀ Procedendo recursivamente obtemos para todo t 2 εtac Yt a cεt1ac MA1 pode ser estimado como α θ₁ argminac 1T t1T Yt a cεt1ac² Estimação condicional do MA1 Note que a c a cẽt1a c varia não linearmente com a c Estimação se dá através de algoritmos para mínimos quadrados não lineares não há expressão fechada para o mínimo Observe também que a primeira observação não contribui à estimação de c visto que Yt a cẽ02 Yt a2 Se o MA1 é invertível então com T grande efeito do chute inicial sobre a função objetivo desaparece Contribuição do chute inicial ao erro de previsão em t é da ordem ct que desaparece quando c 1 Estimação condicional do ARMApq Estendendo a discussão anterior a estimação condicional de um ARMApq é dada pela minimização de tp1T Yt a b1 Yt1 bp Ytp c1 ẽt1a b c cq ẽtqa b c2 onde ẽta b c são definidos recursivamente para cada valor candidato dos parâmetros a b c e chutes iniciais dos erros ẽpq1 ẽpq2 ẽp 0 Perdemos p observações pois não observamos os valores de Y anteriores a t 1 Além disso para as observações de p 1 a p q não temos informação completa para inferir todos os θj Estimação incondicional do ARMApq Na estimação condicional perdemos informação nas p q primeiras observações Se fizermos uma hipótese distributiva sobre os ruídos brancos somos capazes de caracterizar a distribuição das pq primeiras observações Por exemplo se ϵt iid N0 σ2 e Yt seguir um AR1 estacionário então Y1 Nα1 α σ21 ρ2 A estimação incondicional de um ARMApq se dá pela máxima verossimilhança que usa a distribuição conjunta de Y1 YT sob a hipótese auxiliar de que ϵt iid N0 σ2 Método padrão na função arima do R Se ruído branco de fato é Gaussiano estimador é eficiente dentre todos os estimadores de um ARMApq Gaussiano estimador é o de menor variância Mesmo que o ruído branco não seja Gaussiano estimador ainda é consistente para os parâmetros de um ARMApq 33 67 Diagnóstico Diagnóstico Estimados os modelos candidatos procedemos à etapa de diagnóstico A ideia é avaliar os modelos conforme algumas métricas 1 Critérios de informação 2 Parcimônia 3 Não autocorrelação dos erros 4 Estabilidade e invertibilidade das partes AR e MA 5 Convergência numérica dos estimadores 6 Normalidade dos erros 35 67 Critérios de informação A princípio gostaríamos de uma métrica que indicasse quanto da variabilidade do processo é explicada pelo modelo Quantidade não observada precisa ser estimada Intuitivamente um estimador dessa quantidade poderia ser dado pela soma dos quadrados dos resíduos SSR do modelo estimado O problema dessa métrica é que modelos mais complexos necessariamente apresentam SSR menor Maior flexibilidade leva a melhor ajuste dentro da amostra Isso não significa que o modelo necessariamente explique bem a variação verdadeira do processo em particular fora da amostra Se fôssemos escolher o modelo pelo menor SSR sempre escolheríamos o modelo mais complexo incorrendo num problema conhecido como sobreajuste overfitting Modelo funcionará em geral muito mal fora da amostra pois estimadores dos parâmetros apresentam alta variância 36 67 Critérios de informação cont A ideia de um critério de informação é penalizar a SSR pelo número de parâmetros estimados A penalização pode ser vista como uma forma de corrigir o viés do SSR em estimar a capacidade preditiva de um modelo Os critérios de informação mais utilizados são o AIC e o BIC Para um ARMApq com intercepto eles são dados por AIC TlnSSR 2p q 1 BIC TlnSSR lnTp q 1 Quanto menor o critério de informação melhor Para T 7 BIC escolhe modelos com menos parâmetros Se a estimação do modelo é condicional importante ajustar amostra para que mesmo número de observações sejam usadas no cálculo dos critérios em todos os modelos comparados isso já vale por construção na estimação incondicional 37 67 Parcimônia Os critérios de informação induzem parcimônia no modelo escolhido ajudando a evitar o problema de sobreajuste Ainda sob essa lógica é costumeiro verificar quais coeficientes são estatisticamente significantes na especificação se houver muitos coeficientes insignificantes talvez valha trabalhar com um modelo mais simples 38 67 NÃO AUTOCORRELAÇÃO DOS ERROS Os modelos ARMA discutidos supõem que os erros são ruído branco Dessa forma esperaríamos que os resíduos de nosso modelo fossem aproximadamente não autocorrelacionados Se houver correlação nos resíduos ainda há informação nos dados que a parte sistemática do modelo não está capturando Teste da hipótese nula de que as autocorrelações dos erros de ordens 1 até s são zero contra a alternativa de que ao menos uma é diferente de zero podem ser conduzidos usando a estatística de LjungBox Q TT 2 s j1 γj²Tj onde γj é autocorrelação de ordem j estimada com base nos resíduos Sob a nula distribuição de Q é aproximadamente uma χ² com s p q graus de liberdade Quanto maior Q maior a evidência contra a nula Assim região crítica do teste é da forma Q c onde c é o quantil apropriado da distribuição χ² Estabilidade e invertibilidade Recordese que a análise de identificação dos modelos ARMApq pressupõe que os processos sejam estacionários e invertíveis Assim é costumeiro verificar se os coeficientes estimados de fato nos levam a processos estacionários e invertíveis Se isso não ocorrer devemos suspeitar de nossas estimativas Podemos checar a estacionariedade e invertibilidade do ARMApq resolvendo respectivamente as equações de grau p e q dos polinômios estimados e avaliando se as raízes se encontram todas fora do cícrulo 40 67 Convergência numérica Os estimadores mais usados de modelos ARMA são não lineares e não possuem solução fechada Por esse motivo pacotes estatísticos usam algoritmos de otimização para estimar o modelo É importante checar se os algoritmos de otimização de fato convergiram para um mínimo Se esse não é o caso devemos descartar as estimativas 41 67 Normalidade dos erros Recordese que se os ruídos brancos forem Gaussianos o estimador de máxima verossimilhança do ARMApq é eficiente Ainda assim mesmo que os ruídos brancos não sejam Gaussianos o estimador é consistente Nesse sentido é costumeiro testar a hipótese de normalidade dos erros de um modelo ARMA Isso é feito verificando a assimetria e curtose dos resíduos do modelo e quanto elas distam do esperado em uma distribuição normal Sob a nula de normalidade a estatística de teste de JarqueBera possui distribuição χ2 com dois graus de liberdade Valores grandes da estatística são evidência contra a nula 42 67 Previsão PREVISÃO UM PASSO À FRENTE Estimado um ARMApq com base num conjunto de dados Yt T t1 como podemos calcular uma previsão para YT1 Recordese que se o processo é descrito por um ARMApq então YT1 α p j1 βj YT1j ϵT1 q j1 θj ϵT1j Estimação de um ARMA nos dá estimativas para os parâmetros além de estimativas dos ruídos brancos na janela de estimação isto é êj j T Único componente desconhecido é ϵT1 Mas como se trata de um ruído branco um processo sem memória o melhor a se fazer é êT1 EϵT1 0 Assim a previsão um passo à frente com base num ARMApq é dada por ŶT1 α p j1 βj YT1j q j1 θj êT1j PREVISÃO DOIS PASSOS À FRENTE Também podemos estar interessados em prever o que ocorrerá dois passos adiante ie YT2 Neste caso temos que YT2 α j1p βj YT2j εT2 j1q θj εT2j Com base na informação até T desconhecemos εT1 εT2 e YT1 Vamos fazer εT2 εT1 0 Vamos usar nossa previsão de ŶT1 para imputar YT1 Assim a previsão dois passo à frente com base num ARMApq é dada por ŶT2 α β1 ŶT1 j2p βj YT1j j2q θj εT1j Previsão h passos à frente Procedendo recursivamente podemos definir para qualquer h N a projeção h passos à frente ˆYTh em que usamos ˆϵTj 0 para j 0 e as predições ˆYTj h 1 j 1 na imputação dos termos desconhecidos Observe que para h maxp q a projeção não usa os dados observados diretamente somente através de projeções de horizontes anteriores De fato quando h as projeções de um ARMApq estacionário convergem para a média incondicional estimada do processo ie lim h ˆYTh ˆα 1 ˆβ1 ˆβ2 ˆβp Equivalentemente as projeções de um ARIMAp1q convergem para projeções em que a variação é constante lim h ˆYTh ˆα 1 ˆβ1 ˆβ2 ˆβp 46 67 Intervalo de predição Um intervalo de predição para YTh com confiança γ é um par de funções dos dados L U com a propriedade PL YTh U γ Intervalo de predição contém a realização de YTh em ao menos 100γ dos casos sobre todas as realizações possíveis da incerteza econômica É possível construir um intervalo de predição com base nas predições de um ARMApq Gaussiano Intervalo de predição leva em conta incerteza Gaussiana acerca dos ruídos brancos ϵTj j 0 À medida que h cresce comprimento do intervalo de confiança cresce visto que incerteza tornase cada vez maior 47 67 Projeções endividamento público Forecasts from ARIMA012 2005 2010 2015 2020 30 40 50 60 48 67 Comparação de modelos Corrida de cavalos A medida MSEm h é livre da influência de sobreajuste visto que o modelo foi estimado sem recorrer aos dados em V Podemos comparar os modelos em termos de qual tem o menor MSEm h para cada horizonte h N A esse procedimento damos o nome de corrida de cavalos horseracing O resultado dessa comparação é a escolha de um modelo ótimo para cada horizonte Se temos capacidade computacional podemos fazer as previsões fora da amostra com janela expansível o que aproxima melhor um cenário em tempo real online Ideia é após identificar e diagnosticar os modelos em E fazer as previsões para t h com o modelo reestimado até t para todo t T0 T0 1 51 67 USANDO PROJEÇÕES PARA COMPARAR MODELOS Se temos uma série longa podemos realizar um procedimento para validar e comparar modelos sem incorrer em sobreajuste Ideia é repartir a amostra em dois subconjuntos de períodos ℰ 12 T0 e 𝒱 T01 T02 T No conjunto ℰ realizamos todas as etapas para identificar estimar e diagnosticar modelos Definidos um conjunto 𝓜 de modelos estimados com os dados em ℰ podemos calcular para cada horizonte h ℕ previsões h passos à frente para os períodos em 𝒱 Isto é para cada modelo m 𝓜 estimado com os dados de ℰ e t h 𝒱 definimos como Ŷthtm a previsão que se faz com o modelo estimado m para o período t h com as informações até t Nesse caso podemos definir o erro quadrático médio da previsão fora da amostra no horizonte h como MSEm h 1 T T0 h 1 tT0Th Yth Ŷthtm2 TESTE DE DIEBOLDMARIANO A comparação MSEm h para diferentes modelos está sujeita a contingências do período de validação V Modelo pode ser bom para a janela V mas ideia é que modelo seja bom em prever o futuro Sob estacionariedade do erro de previsão Diebold e Mariano introduziram um teste da hipótese nula H0 EYth Ŷthtm2 EYth Ŷthtm2 para modelos m m M e horizonte h N Teste é implementado através da estatística t t 1 T T0 h 1 tT0Th Yth Ŷthtm2 Yth Ŷthtm2 σ onde σ é um erro padrão HAC Implementação computacional construir série êt Yth Ŷthtm2 Yth Ŷthtm2 t T0 T h Rodar regressão de êt num intercepto e conduzir o teste t no intercepto usando vcovHAC Teste de DieboldMariano cont Validade dos erros padrão HAC requer janela de validação grande Por outro lado hipótese estacionariedade do erro de previsão requer T0 também grande e bem maior que janela de validação Diebold 2015 Metodologia de DieboldMariano pode ser estendida para analisar os determinantes da qualidade preditiva em uma classe de modelos Ideia é considerar modelos lineares Yth ˆYthtm2 γhm umt m M t T0 T h onde hm h1m h2m hJm são J características do modelo m eg indicador da presença de um componente MA Usando erros padrão HAC em painel é possível testar quais características de um modelo ensejam melhor qualidade preditiva Teste t da nula γj 0 contra alternativa γj 0 onde γj é o coeficiente associado hjm 53 67 Modelagem Sazonal Sazonalidade e previsão Até aqui não discorremos sobre o efeito da sazonalidade de uma série nas previsões Nesse caso há duas estratégias a se seguir 1 Se o objetivo é prever a série livre de seu componente sazonal podemos realizar a metodologia de BoxJenkins na série dessazonalizada 2 Por outro lado se o objetivo é prever a série original devemos incorporar a sazonalidade na análise A maneira mais simples de incorporar a sazonalidade em nossa análise seria incluindo dummies de período entre os componentes determinísticos do processo Argumento Xreg na função arima do R No entanto essa abordagem supõe sazonalidade não estocástica efeito das variações sazonais é sempre o mesmo Box e Jenkins desenvolveram uma metodologia para previsão com sazonalidade estocástica 55 67 ARIMAP D Qh Uma série de tempo com sazonalidade de frequência h segue um ARIMAP D Qh se pode ser descrita como 1γ1Lhγ2L2h γPLPh1LhDYt 1π1Lhπ2L2h πQLQhϵt onde ϵt é ruído branco ARIMA sazonal é modelo em que defasagens ocorrem a cada h períodos Identificação da ordem P e Q é feita observandose a FAC e FACP nas ordens h 2h 3h Modelo permite também a presença de raízes unitárias sazonais Diremos que uma série de tempo tem uma raiz unitária sazonal se sua FAC nas ordens h 2h 3h decai muito lentamentenão decai Nesse caso identificação de P e Q deve ser feita observandose a FAC e FACP do processo em primeira diferença sazonal hYt Yt Yth 56 67 FAC e FACP de um AR112 0 10 20 30 40 00 02 04 06 08 10 Lag ACF Series sar1 0 10 20 30 40 00 01 02 03 04 05 Lag Partial ACF Series sar1 57 67 FAC e FACP de um MA112 0 10 20 30 40 00 02 04 06 08 10 Lag ACF Series sma1 0 10 20 30 40 01 01 03 Lag Partial ACF Series sma1 58 67 FAC de processo com raiz unitária sazonal h 12 0 20 40 60 80 02 02 06 10 Lag ACF Series srw 59 67 Identificação da ordem PDQ no ARIMAP D Qh Série apresenta raiz unitária sazonal D 1 se FAC decai muito lentamentenão decai nas ordens h 2h Na série livre de raiz unitária sazonal Yt se D 0 ou hYt se D 1 Modelo FAC em h 2h 3h FACP em h 2h 3h ARPh estacionário decai truncada em P MAQh invertível truncada em Q decai ARMAP Qh estacionário decai decai e invertível esp após Q esp após P 60 67 Modelos SARIMA Dizemos que uma série de tempo segue um processo ARIMAp d q P D Qh se ΦPLhΦpL1 LhD1 LdYt ΘQLhΘqLϵt para polinômios de graus p Φp q Θq P ΦP QΘQ e ruído branco ϵt Classe de modelos combina os ARIMA tradicionais com a modelagem sazonal donde vem o nome SARIMA Identificação das partes não sazonal e sazonal é feita separadamente conforme vimos em cada modelo correspondente 61 67 Desemprego modelagem sazonal Forecasts from ARIMA11020012 2012 2014 2016 2018 2020 2022 6 8 10 12 14 62 67 Análise de intervenção Análise de intervenção Há na Estatística uma série de extensões à modelagem ARIMA para realizar o que se convencionou chamar análise de intervenção Ideia é utilizar os modelos que vimos para se avaliar os efeitos dinâmicos de uma política No entanto essas abordagens não incorporam a linguagem da inferência causal seja através da definição de efeitos contrafactuais modelos estruturais econométricos seja através do modelo de resultados potenciais de Rubin cuja origem se dá na Estatística Isso dificulta a interpretação das hipóteses de identificação necessárias ao uso dos métodos Vamos estudar uma metodologia recente de inferência causal usando os modelos ARIMA em que as hipóteses são explicitadas em termos de resultados potenciais Menchetti Cipollini e Mealli 2022 Complemento útil para a análise dos efeitos agregados de políticas quando não há unidades de controle não expostas disponíveis ou a teoria econômica não nos fornece informação adicional acerca dos determinantes fundamentais do processo veremos isso mais à frente 64 67 Ambiente Considere um processo estocástico YttT de interesse Suponha que há uma política de interesse que é implementada a partir de um período T Tratamos T como variável aleatória na medida em que T é incerto sobre realizações repetidas da incerteza econômica T se a política não é adotada em uma realização possível Definimos resultados potenciais Yt1 e Yt0 que expressam o que ocorre com o processo sob a presença ou não da política Efeito causal da política em t é dado por αt Yt1 Yt0 Problema fundamental da inferência causal nunca observamos Yt0 e Yt1 simultaneamente visto que Yt Yt0 se t T Yt1 se t T Identificação de efeitos causais na abordagem CArima Para utilizar a abordagem ARIMA em inferência causal requereremos duas hipóteses Hipótese 1 Modelo ARIMA para Yt0 O resultado potencial não tratado segue um modelo SARIMA onde ϵt são as inovações ruídos brancos Hipótese 2 sobre a regra de decisão do tratamento ϵt é independente de T para todo t T Hipótese 2 essencialmente requer que decisão do tratamento dependa somente dos Yt0 anteriores à decisão de tratamento ie de Yt0 t T ou de outros fatores independentes de Yt0tT Hipótese exclui a possibilidade de que decisão dependa de características Xt capazes de prever a inovação ϵt no futuro Se planejador usa modelagem BoxJenkins para decidir tratamento hipótese é satisfeita 66 67 Estimação e inferência Sob as duas hipóteses anteriores é possível estimar os efeitos causais da política da seguinte maneira Aplicar a metodologia de BoxJenkins para estimar um modelo SARIMA com dados até T 1 Usando o modelo estimado e os dados até T 1 calcular para h 0 as previsões fora da amostra h passos à frente ˆYT 1hT 1 Estimar o efeito do tratamento no hésimo período após o início do tratamento como ˆαT 1h YT 1h ˆYT 1hT 1 Sob as hipóteses 1 e 2 e se a janela prétratamento é grande estimador ˆαT 1h é aproximadamente não viciado para EαT 1h Se computarmos intervalos de predição para Y com dados até T 1 LT 1hT 1 UT 1hT 1 então YT 1h UT 1hT 1 YT 1h LT 1hT 1 é intervalo de predição válido para αT 1h 67 67 Referências Diebold Francis X 2015 Comparing Predictive Accuracy Twenty Years Later A Personal Perspective on the Use and Abuse of DieboldMariano Tests Em Journal of Business Economic Statistics 331 pp 11 doi 101080073500152014983236 eprint httpsdoiorg101080073500152014983236 url httpsdoiorg101080073500152014983236 Menchetti Fiammetta Fabrizio Cipollini e Fabrizia Mealli set de 2022 Combining counterfactual outcomes and ARIMA models for policy evaluation Em The Econometrics Journal 261 pp 124 issn 13684221 doi 101093ectjutac024 eprint httpsacademicoupcomectjarticle pdf261148597685utac024pdf url httpsdoiorg101093ectjutac024 1 1