·

Economia ·

Econometria

Send your question to AI and receive an answer instantly

Ask Question

Preview text

MÉTODOS ESTATÍSTICOS Juliane Silveira Freire da Silva Séries temporais Objetivos de aprendizagem Ao final deste texto você deve apresentar os seguintes aprendizados Identificar as características de um modelo de séries temporais Classificar os fenômenos típicos de séries temporais Descrever os modelos ARIMA e SARIMA Introdução As séries temporais podem ser úteis para descrever e acompanhar fenômenos nas mais diversas áreas das ciências Neste capítulo vamos descrever as características de um modelo de séries temporais além de identificar quais são seus fenômenos típicos Nesse contexto você verá os métodos de previsão de tendências além de ser apresentado aos modelos ARIMA e SARIMA 1 Modelo de séries temporais A análise de séries temporais é muito útil na economia para acompanhamento de PIB oferta e demanda dentre outras análises Além disso é muito utilizada para acompanhamento de fenômenos da natureza em análise demográfica em marketing nas áreas de controle de qualidade e da saúde Sendo assim ela pode ser muito útil para a ciência de dados A análise de séries temporais como o próprio nome indica é a investigação de variáveis observadas ao longo do tempo com a pretensão de realizar previsões para períodos futuros Segundo Morettin e Toloi 2018 p 3 quando temos uma série temporal podemos estar interessados em 1 investigar o mecanismo gerador da série temporal por exemplo ana lisando uma série de alturas de ondas podemos querer saber como essas ondas foram geradas 2 fazer previsões de valores futuros da série essas podem ser a curto prazo como para séries de vendas produção ou estoque ou a longo prazo como para séries populacionais de produtividade etc 3 descrever apenas o comportamento da série nesse caso a construção do gráfico a verificação da existência de tendências ciclos e variações sa zonais a construção de histogramas e diagramas de dispersão etc podem ser ferramentas úteis 4 procurar periodicidades relevantes nos dados com o auxílio de análise espectral Conforme Doane e Seward 2014 as empresas de negócios utilizam dados de séries temporais para monitorar se um processo em particular se apresenta estável ou instável e para auxiliar a predizer o futuro o que chamamos de previsão em séries temporais Além de presentes em negócios vemos dados de séries temporais econômicos Embora os dados mais comuns sejam em negócios e economia podemos vêlos na população nas áreas de saúde na segurança pública nos esportes e nos problemas sociais Em geral os dados de séries temporais são apresentados em um gráfico como na Figura 1 a seguir Como se pode observar no eixo x existe o intervalo de tempo e no eixo y a variável de interesse O gráfico que representa uma série temporal é o gráfico de linhas sempre observando uma variável ao longo do tempo Há muitos métodos de previsão elaborados para situações específicas como modelos de tendência que são muito comuns em negócios Também podemos usar decomposição para fazer ajustes na sazonalidade e usar mo delos de suavização A Figura 2 a seguir resume as principais categorias de modelos de previsão Séries temporais 2 Figura 1 Séries temporais de desemprego nos EUA Fonte Adaptada de Doane e Seward 2014 Figura 2 Visão geral de previsão em séries temporais Fonte Doane e Seward 2014 p 601 3 Séries temporais Para os modelos de tendência há os ajustes mais comuns que são o linear o exponencial e o quadrático Os modelos de tendência mais utilizados são escritos da seguinte forma yt a bt ajuste linear yt aebt ajuste exponencial yt a bt ct2 ajuste quadrático O problema mais crítico para se estimar y por meio de uma dessas funções de tendência é que apesar de uma função apresentar um bom ajuste no intervalo de tempo amostrado as projeções futuras podem afastarse da realizada Para escolher qual dos modelos de ajuste é o mais adequado aos dados podemos usar o coeficiente de determinação optando pelo que mais se aproxima de 1 Fique atento O coeficiente de determinação é o poder de explicação da função tempo Um valor que varia de 0 a 1 Quanto mais próximo de 1 maior é o poder explicativo do tempo sobre a variável do modelo A tendência linear pode ser desenvolvida com a análise de regressão linear simples por meio da qual podemos calcular os coeficientes da reta e o coeficiente de determinação e validar o ajuste Assim realizase as previsões de acordo com essa tendência para períodos futuros O ajuste exponencial justificase quando temos uma taxa b constante de crescimento ou de decréscimo Uma característica atraente do modelo exponencial é que você pode comparar duas taxas de crescimento em duas variáveis de séries temporais com unidades de dados diferentes isto é uma taxa de crescimento percentual é adimensional Em algumas situações pode não haver muita diferença entre um modelo linear e um exponencial quando a taxa de crescimento é pequena e o conjunto de dados cobre apenas uns poucos períodos DOANE SEWARD 2014 A tendência quadrática será preferida quando a for não linear a série tiver algum pico e um decaimento Isso ocorre devido ao coeficiente c da função quadrática Quando esse coeficiente é muito pequeno ou próximo de zero a função vai se aproximar do ajuste linear A Figura 3 a seguir mostra a comparação desses ajustes graficamente de acordo com o comportamento de cada um Figura 3 Exemplos de ajustes linear exponencial e quadrático Fonte Adaptada de Doane e Seawrd 2014 5 Séries temporais Devemos iniciar essa análise com o ajuste linear e a observação do co eficiente de determinação Depois ir ajustando as demais funções sempre optando pelo ajuste com o maior poder explicativo 2 Fenômenos típicos de séries temporais Podemos considerar que a variável estudada que definiremos aqui como variável y pode ser classificada por quatro componentes os quais podem aparecer separadamente em uma série ou de forma combinada Tendência Ocorre quando temos na amostra indicação visual de uma tendência de crescimento ou de queda na evolução da variável pelo tempo Por exemplo o aumento crescente da população de determinado país considerado com uma base jovem Notoriamente sabemos que países jovens têm a propensão de aumentar a sua população com o passar dos anos o que indica uma tendência de crescimento Isso possibilitaria a obtenção de uma tendência matemática que possa predizer a população para os próximos anos justificando um modelo matemático para explicar esse fenômeno Muitos de nós pensamos em três padrões gerais crescimento estabilidade ou decaimento Mas há outras tendências sutis dentro de cada categoria Uma série temporal pode progredir a uma taxa linear estável por exemplo o número de livros que você já leu na sua vida a uma taxa crescente por exemplo o custo de assistência médica para uma população em envelhecimento ou a uma taxa decrescente por exemplo o público presente nos jogos de futebol norteamericano da NFL Ela pode crescer um pouco e depois estabilizar por exemplo vendas de HDTV ou crescer em direção a uma assíntota por exemplo porcentagem dos adultos que possuem um celular com câmera DOANE SEWARD 2014 Séries temporais 6 Ciclo Ciclos são movimentos ascendentes ou descendentes em uma linha temporal que ocorrem de forma cíclica dentro de uma tendência Isso pode ocorrer com a venda de produtos que possam ser substituídos a cada nova tecnologia Um exemplo é a venda de televisores essa venda pode ter apresentado uma ascendência na linha quando houve a entrada da imagem 4K outra com o ultra HD e mais atualmente com a inserção de inteligência artificial com comando de voz nos televisores 4k UHD Esses ciclos são baseados principalmente na vida do produto e nos ciclos de reposição Em qualquer economia de mercado existem ciclos amplos de negócios que afetam o emprego e a produção Depois de extrairmos a tendência e a sazonalidade de uma série temporal um ciclo pode ser detectado como autocorrelação nos resíduos Apesar de serem importantes não há uma teoria geral de ciclos e mesmo aqueles identificados em indústrias específicas têm ritmo irregular e causas complexas que desafiam uma generalização Em um pequeno número de períodos uma situação típica de previsão os ciclos não são detectáveis ou podem parecer uma tendência DOANE SEWARD 2014 Sazonalidade É um componente que é explicado com um movimento na linha temporal que ocorre repetidamente em períodos específicos Por exemplo para dados de produção de morangos apesar de haver a possibilidade de produção durante os 12 meses do ano com a adição de tecnologias ao plantio existem os pe ríodos em que a produção aumenta pois são os meses que a fruta floresceria normalmente Apesar de pensarmos frequentemente na sazonalidade como ondas se noidais os padrões sazonais podem não ser suaves Picos e declínios podem ocorrer em qualquer mês ou trimestre e cada indústria defrontase com seu próprio padrão sazonal exclusivo Por exemplo os casamentos em junho podem criar um pico agudo nas vendas relacionadas a noivas mas não há nenhum padrão senoidal nessas vendas Por definição dados anuais não têm sazonalidade DOANE SEWARD 2014 7 Séries temporais Irregularidade A irregularidade é considerada com um ruído um erro aleatório presente no modelo de série temporal Tudo que não representar uma tendência um ciclo ou uma sazonalidade é considerado um erro aleatório ou seja uma irregularidade Quando o componente irregular é grande pode ser difícil isolar outros componentes individuais do modelo Alguns dados são puramente erros ale atórios Em tais casos usamos técnicas para fazer previsões de curto prazo Ao se defrontarem com dados erráticos especialistas podem usar seus próprios conhecimentos de uma indústria particular para fazer previsões sensatas Por exemplo ao prever vendas mensais de um automóvel em particular pode se combinar as previsões sensatas de revendedores assessoria financeira e economistas DOANE SEWARD 2014 A Figura 4 ilustra esses componentes em uma série temporal hipotética que pode sobreporse para produzir a série temporal de fato Neste exemplo o componente irregular I é grande o suficiente para ofuscar os componentes ciclo C e sazonal S mas não o componente de tendência T Entretanto podemos usualmente extrair com métodos estatísticos os componentes ori ginais das séries temporais Supõese que eles seguem um modelo aditivo ou multiplicativo DOANE SEWARD 2014 Figura 4 Séries de desemprego nos EUA Fonte Doane e Seward 2014 p 599 Séries temporais 8 Técnicas estatísticas são utilizadas para isolar os componentes sazonalidade S tendência T ciclo C e irregularidade I Assim eles podem seguir modelos aditivos ou multiplicativos No aditivo considerase o crescimento ou decréscimo em valores absolutos constantes Y S C T I Já no modelo multiplicativo o crescimento ou decréscimo é em valores percentuais constantes Y S C T I Suavização Segundo Morettin e Toloi 2018 muitas vezes precisamos realizar uma suavização nos dados quando há suposição de que a tendência possa ser representada por um polinômio de baixo grau Dentre essas suavizações a mais conhecida é a por médias móveis é feito é um filtro linear que transforma a série de valores yt em yt Na suavização por médias móveis a nova série criada fica menor e livre de tendência Porém existem desvantagens em usar médias móveis Por exemplo as inferências estatísticas do método são limitadas pois essa suavização não se baseia em nenhum modelo probabilístico e não é possível obter estimativas de tendência em alguns instantes da série Não existe nenhum critério na escolha do número de termos nas médias móveis Porém podemos simular com números de termos diferentes Devemos escolher o número de termos que gerar o menor erro para verificar qual número de termos pode comparar a média móvel com o valor original da série por meio do cálculo do erro médio quadrático O número de termos que gerar o menor erro médio quadrático deve ser o número de termos escolhido para o cálculo das médias móveis A média móvel é dada por 9 Séries temporais Exemplo Um cientista de dados quer prever as vendas para o próximo ano por médias móveis Para isso observou as vendas nos últimos 10 anos A média móvel de ordem 3 será calculada para essa previsão Os dados encontramse a seguir Ano Montante milhões Média móvel centrada 2009 45163 2010 45998 2011 46816 2012 47311 2013 47758 2014 48164 2015 48548 2016 47915 2018 49315 2019 49768 A previsão para o ano de 2020 ficaria Séries temporais 10 Graficamente podemos visualizar a série original e a série suavizada conforme segue Existem outras suavizações que podem ser realizadas como a suavização exponencial das diferenças e da média móvel centrada A mais popular é a de médias móveis que vimos Para saber mais sobre suavização exponencial busque em seu navegador suavização exponencial simples SES disponibilizada no Portal Action 3 Modelos ARIMA e SARIMA Um modelo ARIMA é um caso específico de um modelo ARMA O ARMA é um modelo autorregressivo de médias móveis e o ARIMA é autorregressivo integrado de médias móveis Antes disso podemos citar os modelos AR que são os modelos autorregressivos Modelos ARIMA são aplicados a modelos estacionários 11 Séries temporais Uma das suposições mais frequentes que se faz a respeito de uma série temporal é a de que ela é estacionária ou seja desenvolvese no tempo ale atoriamente ao redor de uma média constante refletindo alguma forma de equilíbrio estável Porém a maior parte das séries que encontramos na prática apresenta alguma forma de não estacionariedade Assim as séries econômicas e financeiras apresentam em geral tendências sendo que o caso mais simples é aquele em que a série flutua ao redor de uma reta com inclinação positiva ou negativa tendência linear Podemos ter também uma forma de não es tacionariedade explosiva como o crescimento de uma colônia de bactérias A classe dos modelos ARIMA será capaz de descrever de maneira sa tisfatória séries estacionárias e não estacionárias mas que não apresentem comportamento explosivo Esse tipo de não estacionariedade é chamado homogêneo MORETTIN TOLOI 2018 A metodologia ARIMA consiste em ajustar modelos autorregressivos integrados de médias móveis ARIMApdq a um conjunto de dados Para a construção do modelo seguimos um algoritmo no qual a escolha da estrutura do modelo é baseada nos próprios dados Segundo Morettin 2011 no estabelecimento de um modelo ARIMA para uma série temporal há três estágios a considerar 1 identificação 2 estimação 3 diagnóstico 4 aplicação A identificação do particular modelo ARIMA a ser ajustado aos dados é talvez a fase mais crítica dos estágios descritos Essa escolha é feita princi palmente com base nas autocorrelações e autocorrelações parciais estimadas que esperamos representar adequadamente as respectivas quantidades teóricas que são desconhecidas Primeiramente para a identificação fazse um gráfico da série depois analisase a estacionariedade dela por meio da função de autocorrelações Se a série não for estacionária é necessário tornála sem tendência e sem sazonalidade Verificar o termo constante no modelo estabelecer a ordem p e q com testes de hipóteses Séries temporais 12 Conforme Morettin e Toloi 2018 o objetivo da identificação de um modelo ARIMA é determinar os valores de p d e q do modelo ARIMAp d q O procedimento de identificação consiste em três partes 1 verificar se existe necessidade de uma transformação na série original com o objetivo de estabilizar sua variância tal identificação pode ser realizada com o auxílio de gráficos 2 tomar diferenças da série obtida no item 1 tantas vezes quanto necessárias para se obter uma série estacionária de modo que o processo Δd yt seja reduzido a um ARMAp q o número de diferenças d necessárias para que o processo se torne estacionário é alcançado quando a fac função de autocorrelação amostral de wt Δd yt decresce rapidamente para zero 3 identificar o processo ARMAp q resultante por meio da análise das autocorrelações e autocorrelações parciais estimadas cujos comportamentos devem imitar os das respectivas quantidades teóricas Dada a forma complicada da fac e da facp de um modelo ARMA essas funções não são muito úteis para identificar tais modelos O que se recomenda nesse caso é ajustar alguns modelos de baixa ordem por exemplo 11 12 21 e utilizar critérios que permitam escolher o modelo mais adequado O maior problema nesse estágio do procedimento é evitar um excesso de diferenças um número excessivo de diferenças resulta em um valor negativo da autocorrelação de ordem 1 da série diferençada nesse caso ρ1 05 quando a série é corretamente diferençada a variância da série transformada diminui e por outro lado o excesso de diferenças aumentará essa variância assim o monitoramento da variância é bastante útil para escolher o valor apropriado de d Na prática d 0 1 ou 2 e é suficiente inspecionar as primeiras 15 ou 20 autocorrelações da série e de suas diferenças Os modelos SARIMA seguem a mesma lógica dos ARIMA porém considerando uma sazonalidade estocástica na série Sendo assim o modelo SARIMA é sazonal de um modelo ARIMA Análises de modelos AR MA ARMA ARIMA e SARIMA possuem uma grande dificuldade de resolução de forma manual envolvendo cálculos e integrais bastante elaborados Por esse motivo as fórmulas foram omitidas neste tópico Com a facilidade de acesso a pacotes computacionais disponíveis para esse tipo de análise podemos utilizar o R SPLUS MINITAB SCA ITSM e EViews DOANE D P SEWARD L E Estatística aplicada à administração e economia 4 ed Porto Alegre AMGH 2014 MORETTIN P A Econometria financeira um curso em séries temporais financeiras 2 ed São Paulo Blucher 2011 MORETTIN P A TOLOI C M C Análise de séries temporais 3 ed São Paulo Blucher 2018 Leituras recomendadas BUENO R L S Econometria de séries temporais 2 ed São Paulo Cengage Learning 2018 PORTAL ACTION Modelos ARIMA 2020 Disponível em httpwwwportalactioncom brseriestemporaismodelosarima Acesso em 18 ago 2020 PORTAL ACTION Suavização exponencial simples SES 2020 Disponível em http wwwportalactioncombrseriestemporais32suavizacaoexponencialsimplesses Acesso em 18 ago 2020 Os links para sites da web fornecidos neste capítulo foram todos testados e seu fun cionamento foi comprovado no momento da publicação do material No entanto a rede é extremamente dinâmica suas páginas estão constantemente mudando de local e conteúdo Assim os editores declaram não ter qualquer responsabilidade sobre qualidade precisão ou integralidade das informações referidas em tais links Séries temporais 14 Conteúdo SaGaH SOLUÇÕES EDUCACIONAIS INTEGRADAS