·

Ciências Econômicas ·

Econometria

Send your question to AI and receive an answer instantly

Ask Question

Recommended for you

Preview text

Manual prático de séries de tempo para o Software Gretl Método BoxJenkins Professor Alexsandro Roberto Nascimento Ordonez O presente Manual tem como pretensão auxiliar os alunos da disciplina de Econometria I no entendimento de séries temporais e particularmente no uso da metodologia BoxJenkins no software Gretl A metodologia BoxJenkins é uma das principais ferramentas utilizadas na previsão de séries temporais Não é a única ferramenta de análise disponível porém é a mais prática e de melhor assimilação podendo servir de degrau para métodos mais complexos Objetivo principal Com a metodologia de BoxJenkins o intuito principal é tornar o termo de erro da regressão série temporal um ruído branco Ou seja adicionase tudo aquilo que influencia a série temporal no modelo de modo que os termos de erro não tenham nenhum impacto na nossa regressão Exemplo Nossa regressão pode ser formada por um termo autoregressivo defasado em 1 tempo 𝑌𝑡 𝛽0 𝛽1𝑌𝑡1 𝜀𝑡 Note essa série de tempo é formada pelo seu valor passado em um tempo ou seja Tempo Y 𝑌𝑡1 1 100 99 2 101 100 3 102 101 4 103 102 A suposição inicial é que o termo de erro 𝜀𝑡 não influencie em nossa previsão Nós queremos que ele tenha as seguintes características E𝜀𝑡 0 Média zero dos termos de erro E𝜀𝑡 2 𝜎2 Variância constante dos termos de erro Cov𝜀𝑡 𝜀𝑡1 0 Associação temporal nula entre os termos de erro Porém como observaremos tais características Ou melhor como detectaremos a influência de outros fatores em nossas séries de tempos estimadas R usaremos o correlograma O correlograma tem o seguinte formato Figura 1 Correlograma de saída do Gretl para a série de PIB Mensal O uso do correlograma nos auxilia no entendimento acerca de quais impactos estão presentes em dada série temporal Na parte de baixo da figura 1 está a correlação parcial FACPFunção de Autocorrelação Parcial ou seja a influência de cada termo defasado em nossa série temporal Como se vê acima a influência do termo anterior em 1 período se faz presente Logo podemos presumir que esta série nos dê a seguinte equação 𝑌𝑡 𝛽0 𝛽1𝑌𝑡1 𝜀𝑡 Repare que o lado superior da figura 1 nos mostra a função de autocorrelação FAC Função de Autocorrelação Esta parte nos dá a influência dos termos de erro 1 05 0 05 1 0 5 10 15 20 25 defasagem FAC para PIBRmilhoes 196T05 1 05 0 05 1 0 5 10 15 20 25 defasagem FACP para PIBRmilhoes 196T05 defasados em nossa série de tempo Para o caso acima não teríamos por que usar o termo de erro defasado MAMédia Móvel pois este tipo de correlograma já é padronizado Ou seja ele é um AR Autoregressivo de primeira ordem e tem decaimento exponencial no termo MA Média Móvel Roteiro para Modelagem de uma série Simples AR Autoregressiva Antes de adentrarmos na modelagem vamos nos atentar primeiro a nomenclatura de alguns termos usados em séries de tempo 1 AR Autoregressivo Pode ser AR 1 AR 2 AR 3 Exemplos AR 3 𝑌𝑡 𝛽0 𝛽1𝑌𝑡1 𝛽2𝑌𝑡2𝛽3𝑌𝑡3 𝜀𝑡 2 MA Média Móvel Pode ser MA 1 MA 2 MA 3 Exemplo MA 2 𝑌𝑡 𝛽0 𝜃1𝜀𝑡1 𝜃2𝜀𝑡2 𝜀𝑡 3 ARMA Autoregressivo Média Móvel Pode ser ARMA 11 ARMA 22 ARMA 31 Exemplo ARMA 11 𝑌𝑡 𝛽0 𝛽1𝑌𝑡1 𝜃1𝜀𝑡1 𝜀𝑡 Como sei qual o formato da minha série Ou melhor como sei se devo ou não diferenciar minha série ou mesmo usar intercepto e tendência Esta pergunta está associada à observação ou não de estacionaridade Este conceito diz respeito ao fato de dado série temporal ter uma trajetória não explosiva Ou seja temos que a série temporal não cresce infinitamente ou decresce infinitamente Melhor dizendo se ela não cresce ou decresce infinitamente podemos inferir algo sobre ela Para que dada série seja ou não estacionária devemos garantir a seguinte condição 𝑌𝑡 𝛽0 𝛽1𝑌𝑡1 𝛽2𝑌𝑡2𝛽3𝑌𝑡3 𝜀𝑡 Usando a condição de expectativas iteradas podemos supor que 𝐸𝑌𝑡 𝐸𝑌𝑡1 𝐸𝑌𝑡2 𝐸𝑌𝑡3 Logo 𝑌𝑡 𝛽0 𝛽1𝑌𝑡1 𝛽2𝑌𝑡2𝛽3𝑌𝑡3 𝜀𝑡 𝑌𝑡 𝛽1𝑌𝑡1 𝛽2𝑌𝑡2 𝛽3𝑌𝑡3 𝛽0 𝜀𝑡 𝑌𝑡1 𝛽1 𝛽2 𝛽3 𝛽0 𝜀𝑡 𝑌𝑡 𝛽0 𝜀𝑡 1 𝛽1 𝛽2 𝛽3 Logo a condição para que a série seja passível de previsão é que a soma dos termos betas seja diferente de 1 Se por acaso a soma de betas for igual a 1 teremos 𝑌𝑡 𝛽0 𝜀𝑡 1 1 𝑌𝑡 𝛽0 𝜀𝑡 0 A qual não seria previsível Portanto para que dada série seja estacionária e passível de previsão devemos garantir que seus coeficientes angulares tenham uma soma diferente de 1 Ou seja em outras palavras devemos garantir que a raiz dessa soma não seja unitária Para garantir a previsibilidade acima o Gretl nos fornece o teste de DickeyFuller Aumento O qual pode ser acessado da seguinte forma Clicando em Teste de DickeyFuller aumentado teremos o seguinte quadro Onde Usar nível da variável Testa a estacionaridade no nível ou seja testa os parâmetros da série tempo para saber se a série tem raiz unitária e pode ser prevista Se esse teste tiver pvalor igual a 0 podemos usar a variável e observarmos seus correlograma no nível Usar a primeira diferença da variável Caso o pvalor do teste no nível seja maior do que 0 devemos testar a primeira diferença da série Esta primeira diferença modifica a série da seguinte forma 𝑌𝑡 𝜃𝑌𝑡1 𝜀𝑡 𝑌𝑡 𝑌𝑡1 𝜃𝑌𝑡1 𝑌𝑡1 𝜀𝑡 𝑌𝑡 𝜃 1𝑌𝑡1 𝜀𝑡 Ou seja busca estacionarizar o parâmetro da série até que este tenha um valor diferente de 1 Teste sem constantecom constante Retira a constante do teste e verifica se a série é ou não estacionária Com constante e tendência Testa se nossa série possui apenas uma tendência linear e temporal do tipo 𝑌𝑡 𝛽𝑡 𝜀𝑡 Onde o 𝛽𝑡 é uma variável que assume valores de 0 até infinito sendo esta o tempo transcorrido Com constante e tendência e quadrado da tendência Inclui ao modelo de teste a seguinte especificação 𝑌𝑡 𝛽𝑡 𝛽𝑡 2 𝜀𝑡 A qual pretende testar a existência de uma tendência quadrática Modelando com BoxJenkins 1 Passo Conhecendo a série Bem agora que nós conhecemos algumas sutilezas das séries temporais estamos aptos a modelar alguma variável A série escolhida aqui será o PIB mensal brasileiro A extensão de tempo desta série é de 1990 até 2020 no mês de março O primeiro passo é observar o gráfico da série Para isso clique em cima da série que você deseja modelar No quadro que aparece clique exatamente na figura de gráfico que aparece em vermelho Clicando no ícone observase o gráfico da série Note que dado o gráfico da série há um aumento expressivo desta o qual não parece ceder em nenhum momento de seu percurso temporal Portanto há indícios que tal série seja explosiva isto é de que não há convergência ou sinal de que ela sinalizará em uma direção estável 2 Passo Teste DickeyFuller de Raiz Unitária Neste segundo passo vamos observar se a série em questão possui raiz unitária Lembrando a presença de raiz unitária inibe qualquer tentativa de previsão da série No primeiro momento vamos observar se a série em questão é estacionária no nível ou seja se ela precisa ou não ser diferenciado ou mesmo se tem uma tendência temporal 0 100000 200000 300000 400000 500000 600000 700000 1990 1995 2000 2005 2010 2015 2020 PIBRmilhoes Ao clicarmos neste comando teremos a saída da seguinte caixa de diálogo Clique em OK e o seguinte teste aparecerá Nesta saída do Gretl devemos nos atentar para o pvalor O que seria esse pvalor Este pvalor é a probabilidade de encontrarmos um valor de zero no parâmetro de nossa série temporal Ou seja ele testa a seguinte condição 𝑌𝑡 𝜃 1𝑌𝑡1 𝜀𝑡 𝐻0 𝜃 1 0 𝑌𝑡 𝑛ã𝑜 é 𝑒𝑠𝑡𝑎𝑐𝑖𝑜𝑛á𝑟𝑖𝑜 𝑜𝑢 𝐻1 𝜃 1 1 𝑌𝑡 é 𝑒𝑠𝑡𝑎𝑐𝑖𝑜𝑛á𝑟𝑖𝑜 Lembrese se o valor do parâmetro acima for igual a zero significa que o valor do coeficiente é 1 se ele é igual a 1 então a série é imprevisível Logo como regra de bolso iremos aceitar a estacionaridade da nossa série se o pvalor associado ao teste de dickey fuller for menor do que 005 Para valores maiores iremos testar as outras condições Para a série em questão temos que o pvalor é alto em ambas estimações tanto no modelo com constante quanto no modelo com constante e tendência é maior do que 001 1 Logo a estacionaridade não é garantida no nível o que significa dizer que devemos diferenciar esta série Como diferenciar a série Aplicar uma diferença em uma série temporal nada mais é do que descontar da série seu valor defasado ou em termos técnicos aplicar um filtro linear na série 𝑌𝑡 𝜃𝑌𝑡1 𝜀𝑡 𝑌𝑡 𝑌𝑡1 𝜃𝑌𝑡1 𝑌𝑡1 𝜀𝑡 𝑌𝑡 𝜃 1𝑌𝑡1 𝜀𝑡 Para fazer isso no Gretl use o seguinte comando A série criada terá o seguinte formato e é com ele que trabalharemos a partir de agora Em seguida testase novamente a estacionariedade da série com o teste de raiz unitária E novamente teremos a seguinte saída Perceba agora que os pvalores caíram para 009261 para o modelo com constante e 01218 para o modelo com constante e tendência Dado esse nível de probabilidade podese continuar com a estimação da série na primeira diferença 3 Passo Correlograma É a partir de agora que iremos modelar nossa série de tempo Primeiro devemos fazer Perceba estamos olhando a relação entre as variáveis defasadas e também os termos de erro defasados na primeira diferença e não no nível Isso acontece porque descobrimos que esta série tem raiz unitária e portanto precisou ser diferenciada Neste caso ao clicarmos no ok acima teremos as seguintes saídas 1 05 0 05 1 0 5 10 15 20 25 defasagem FAC para dPIBRmilhoes 196T05 1 05 0 05 1 0 5 10 15 20 25 defasagem FACP para dPIBRmilhoes 196T05 Podemos perceber que o tipo de relação que está ocorrendo nesta série é do tipo ARIMA p 1 q Olhando a FAC Médias Móveis vêse que há vários indícios de autocorrelação pois os termos defasados do termo de erro indicam autocorrelação estatisticamente significante Do lado da FACP Função de Autocorrelação Parcial também há indícios de autocorrelação com os termos defasados da série Neste caso o provável modelo será Δ𝑌𝑡 𝛽0 𝛽1𝑌𝑡𝑖 𝜀𝑡 𝜃𝜀𝑡𝑖 Ou Δ𝑃𝐼𝐵 𝛽0 𝛽1𝑃𝐼𝐵𝑡𝑖 𝜀𝑡 𝜃𝜀𝑡𝑖 Onde o PIB pode ser explicado pelos componentes defasados dele mesmo acrescidos de alguma relação com os termos defasados do componente de erro 4 Passo Modelagem Agora para modelarmos esta série de tempo precisamos demonstrar como ela se comporta no tempo Para tal é necessário fazer o seguinte comando Então ao apertar o comando ARIMA temos a seguinte saída Note que escolhemos a variável dPIBmilhoes justamente a variável diferenciada dado que a série original não era estacionária Escolha a variável dependente com a seta azul Abaixo da caixa de comando de variáveis vêse também os comandos de escolha para as defasagens AR e MA Para a escolha do modelo a ser estimado é necessário que se leve em consideração o correlograma e todos as interações temporais que ele nos mostrou anteriormente A partir dele teremos os critérios de escolha para AR e MA Não existe escolha certa ou errada nesta etapa desde que os modelos escolhidos levem e consideração a significância estatística do passo 3 Logo observando o correlograma podemos estimar 2 modelos diferentes Δ𝑃𝐼𝐵𝑡 𝛼 𝛽1𝑃𝐼𝐵𝑡1 𝛽2𝑃𝐼𝐵𝑡2 𝜀𝑡 𝜃1𝜀𝑡1 𝜃2𝜀𝑡2 Que é um ARIMA 212 E também Δ𝑃𝐼𝐵𝑡 𝛼 𝛽1𝑃𝐼𝐵𝑡1 𝛽2𝑃𝐼𝐵𝑡2 𝛽3𝑃𝐼𝐵𝑡3 𝛽4𝑃𝐼𝐵𝑡4 𝜀𝑡 𝜃1𝜀𝑡1 𝜃2𝜀𝑡2 Que é um ARIMA 412 O primeiro modelo tem as seguintes saídas Ao clicar em OK as estimações são Funções calculadas 67 Cálculos de gradientes 19 Modelo 5 ARMA usando as observações 199002202003 T 362 Estimado usando AS 197 Máxima verossimilhança exata Variável dependente dPIBRmilhoes Erros padrão baseados na Hessiana coeficiente erro padrão z pvalor const 170133 211006 8063 745e016 phi1 0468288 0221404 2113 00344 phi2 0304054 0103920 2926 00034 theta1 0851618 0226130 3766 00002 theta2 0197734 0175886 1126 02601 Média var dependente 1672236 DF var dependente 1073869 Média de inovações 1190269 DP das inovações 9648654 Rquadrado 0190475 Rquadrado ajustado 0183691 Log da verossimilhança 3835087 Crtério de Akaike 7682174 Critério de Schwarz 7705524 Critério HannanQuinn 7691457 Real Imaginaría Módulo Frequência AR Raiz 1 07701 16419 18135 01802 Raiz 2 07701 16419 18135 01802 MA Raiz 1 21534 06481 22488 00465 Raiz 2 21534 06481 22488 00465 Ao clicar em OK novamente temse Ao escrevermos estes de forma equacional temos Modelo 1 Δ𝑃𝐼𝐵𝑡 170133 04682𝑃𝐼𝐵𝑡1 03040𝑃𝐼𝐵𝑡2 08516𝜀𝑡1 01977𝜀𝑡2 Modelo 2 Δ𝑃𝐼𝐵𝑡 167211 177159𝑃𝐼𝐵𝑡1 1512𝑃𝐼𝐵𝑡2 08125𝑃𝐼𝐵𝑡3 04452𝑃𝐼𝐵𝑡4 1685𝜀𝑡1 09398𝜀𝑡2 5 Passo Uma segunda olhada no correlograma Vamos novamente olhar o correlograma a fim de observar se não deixamos nada de fora de nosso modelo No modelo 1 clique no seguinte comando Ao clicarmos em OK ele nos dará Clique em OK novamente e mais uma vez teremos a seguinte saída 1 05 0 05 1 0 5 10 15 20 25 defasagem FAC dos Resíduos 196T05 1 05 0 05 1 0 5 10 15 20 25 defasagem FACP dos Resíduos 196T05 A partir da análise deste correlograma fica fácil identificar que outros fatores estão ainda influenciando a nossa série de tempo Uma das vantagens da modelagem de Box Jenkins é que podemos corrigir isso de forma extremamente fácil Para isso basta introduzirmos no modelo todas as defasagens que ainda causam ruído em nosso modelo Abrindo novamente o comando de editar e depois modificar modelo na saída da regressão podemos voltar na seguinte etapa Perceba que agora inserimos no modelo um termo Sazonal em 4 para verificarmos se as perturbações no correlograma tem tal caráter Ao clicar em OK temos Checando novamente o correlograma deste modelo temos 015 01 005 0 005 01 015 0 5 10 15 20 25 defasagem FAC dos Resíduos 196T05 015 01 005 0 005 01 015 0 5 10 15 20 25 defasagem FACP dos Resíduos 196T05 Perceba que agora os ruídos já não são mais estatisticamente significantes Nem no gráfico e nem no correlograma E se tivéssemos que escolher entre dois modelos que não demonstrassem nenhum ruído R Para esses casos teríamos que usar o menor critério de informação isto é aquele no qual o modelo é menos punido por variável inserida No exemplo dado usaríamos os seguintes critérios Critério de Schwarz O Critério Bayesiano de Schwarz BIC tem como pressuposto a existência de um modelo verdadeiro que descreve a relação entre a variável dependente e as diversas variáveis explanatórias entre os diversos modelos sob seleção Assim o critério é definido como a estatística que maximiza a probabilidade de se identificar o verdadeiro modelo dentre os avaliados Critério de Akaike O Critério de Informação de Akaike AIC admite a existência de um modelo real que descreve os dados que é desconhecido e tenta escolher dentre um grupo de modelos avaliados o que minimiza a divergência de KullbackLeibler K L Critério de HannanQuinn Alternativamente podese dizer que tal critério é indicado para o caso de pequenas amostras e é análogo ao critério de Schwarz Logo entre dois modelos que não apresentem ruído algum em seu correlograma leve em consideração aquele com menor critério de informação 6 Passo Previsão Agora que encontramos um modelo livre da influência de qualquer fator externo ou interno podemos usálo para prever um período a frente Selecione previsão estática e dê OK Está é a saída com o modelo original dPIBRmilhoes e com o modelo previsto previsão Para sabermos qual o valor futuro basta irmos na outra caixa que se abrirá com esse comando e verificarmos qual o valor saído para o período seguinte dos nossos dados 40000 30000 20000 10000 0 10000 20000 30000 40000 50000 2012 2013 2014 2015 2016 2017 2018 2019 2020 dPIBRmilhoes previsão Logo o valor de 69747 é o valor previsto para o mês 4 da série