·

Ciências Econômicas ·

Econometria

Send your question to AI and receive an answer instantly

Ask Question

Preview text

Econometria UNIDADE 1 O MODELO ECONOMÉTRICO Autoria José Tadeu de Almeida Revisão técnica Jorge Lisandro Maia Ussan Introdução Caroa estudante seja bemvindoa à disciplina de Econometria Ao longo de nossos estudos conheceremos os métodos de análise que são utilizados pelos economistas para estimar e avaliar tendências e comportamentos de séries de dados Conforme você verá a econometria é uma disciplina que tem uma aplicação objetiva na vida profissional ajudando a entender diferentes realidades e variáveis bem como correlacionandoas conforme os objetivos de uma pesquisa Sabendo disso nesta unidade resgataremos alguns conceitos e conteúdos de estatística em particular relacionados à estatística descritiva os quais são utilizados sistematicamente para a criação de indicadores que permitem avaliar o desenvolvimento e as características das variáveis anteriormente mencionadas Diante disso perguntase como podemos associar variáveis em uma pesquisa Essas relações podem ser graficamente visualizadas E qual a diferença entre um parâmetro e um estimador Por meio de conceitos como universo amostra e distribuição você poderá responder a essas perguntas compreendendo de que modo são processadas as técnicas de coleta apuração e apresentação de diferentes séries de dados que podem ser convertidas em informações relevantes ao pesquisador de acordo com as suas necessidades de investigação Veremos ainda as principais etapas para a criação de um modelo econométrico e por fim os diferentes tipos de modelos utilizados nas análises econômicas Bons estudos 11 Importância da inferência estatística na econometria A estatística é uma ciência que utiliza procedimentos de coleta interpretação e análise de dados com o objetivo de favorecer a avaliação e a tomada de decisões de um agente em relação a um problema ou a uma variável Desse modo essa ciência pode abranger e relacionarse com diferentes expressões do conhecimento humano tais como a demografia a ciência política a economia e a sociologia entre outros ramos da ciência CRESPO 2011 Dentro dos referenciais dessa disciplina a inferência estatística é uma área de conhecimento que utiliza diferentes argumentos e unidades de medida para elaborar inferências isto é afirmações a respeito de dados e características de toda uma população ou universo a partir de um conjunto de dados aleatoriamente coletados na forma de uma amostra 111 Amostras e indicadores amostrais O uso de amostras e a manipulação das informações que são geradas por essas amostras é um processo comum ao funcionamento da sociedade Profissionais da costura por exemplo costumam adquirir pequenas quantidades de tecido para apresentar aos clientes o material que será escolhido para a criação de uma peça de roupa Os promotores de vendas por sua vez oferecem pequenas porções de alimentos e produtos em supermercados para incentivar a compra pelos clientes Balconistas de lojas de materiais de construção contam com paletas de cores de determinadas tintas Por fim a coleta de amostras de sangue permite observar características hematológicas que podem ser indicativas de diferentes tipos de enfermidades Figura 1 Profissional de laboratório em coleta de amostra Fonte YakobchukOlena iStock 2021 PraCegoVer fotografia frontal de uma profissional da área da saúde usando máscara e luvas segurando uma amostra de sangue para análise em laboratório Em todos esses exemplos a decisão de compra produção ação ou consumo está essencialmente baseada na observação e na análise de uma amostra No entanto há outras situações que envolvem a manipulação de informações com maior tamanho ou dimensão exigindo uma formulação especial para a sua análise CRESPO 2011 Você sabia Uma amostra corresponde a um subconjunto de uma população estatística total Por meio dela é possível criar parâmetros de análise que demonstrem as características de toda a população Nessas situações se a amostra for selecionada de modo eficiente por meio de uma coleta de dados proporcional ao número de habitantes de todos os bairros níveis de renda e escolaridade no caso de uma pesquisa socioeconômica há uma probabilidade alta de que as informações obtidas possam representar adequadamente o comportamento da população geral Assim podese deduzir isto é inferir o comportamento de um universo estatístico por meio de uma amostra BUSSAB MORETTIN 2017 Após selecionar a amostra é preciso que ela seja trabalhada produzindo os resultados e estatísticas necessários ao pesquisador criando por exemplo indicadores como a média amostral de uma variável X com n indivíduos expressa do seguinte modo X barra 1n X1 X2 Xn 1n Σ de i1 até n Xi A média X barra portanto é uma variável aleatória haja vista que representa um resultado possível ou esperado de um determinado experimento estatístico a partir da coleta aleatória de dados de uma população Caso Considere que em uma cidade com 100 mil eleitores há um candidato a vereador que deseja avaliar o seu potencial de eleição isto é as chances reais de que ele seja eleito Para isso ele deverá selecionar uma amostra de quatrocentas pessoas 04 da população total que irá responder se deseja sim 1 votar nesse candidato ou em outro não 0 É necessário obter a porcentagem de votos esperada pelo candidato Assim devese elaborar uma média X barra dos votos dos indivíduos X1 X2 Xn que foram entrevistados e que compõem um espaço amostral finito com n 400 X barra 1n X1 X2 Xn 1n Σ de i1 até n Xi Nesse caso é possível verificar que a média X barra remete a uma série de opiniões coletadas por amostragem tratase portanto de diferentes valores esperados 0 ou 1 que são associados a um eventofunção o voto no candidato a vereador Se nessa pesquisa oito pessoas 8400 20 disserem que irão votar no candidato sua expectativa é de que a sua votação na cidade seja semelhante a essa porcentagem ou seja ele espera obter em torno de 2 mil votos na próxima eleição As variáveis aleatórias são funções responsáveis por associar um valor real a um resultado de um espaço amostral finito criando variáveis aleatórias discretas ou infinito variáveis aleatórias contínuas Uma variável contínua pode ser verificada na contagem de tempo de um experimento no qual um intervalo de um minuto pode conter infinitos resultados possíveis de segundos a milésimos de segundo BUSSAB MORETTIN 2017 Outros fatores indicadores de medida podem ainda ser utilizados para estudar algum aspecto ou característica da amostra como a sua variância a dispersão dos valores ao redor da média Independentemente de qual unidade de medida for utilizada todos estarão estruturados em torno da distribuição amostral X1 X2 Xn Essas unidades são portanto estatísticas relacionadas à amostra ou seja são funções de uma distribuição amostral A média X barra e a variância s² são exemplos de estatísticas relacionadas a um conjunto amostral 112 Parâmetros e estimadores Ao manipular conjuntos de dados de acordo com a inferência estatística é necessário ter sempre em consideração que a amostra é um segmento da população Quando um indicador é construído a partir da população estatística como um todo esse indicador é conhecido como parâmetro Contudo quando o parâmetro não pode ser obtido em vista de um número alto de dados em uma população por exemplo podese estimálo adotando um indicador conhecido como estimador Desse modo em resumo os indicadores que dizem respeito a uma população configuramse como parâmetros já os indicadores que remetem a uma amostra mais utilizados na inferência estatística são estimadores BUSSAB MORETTIN 2017 Vamos Praticar O prefeito de uma cidade com 600 mil habitantes afirma que apenas 05 da população do município vive com renda abaixo da linha de pobreza Caso uma pesquisa seja realizada com uma amostra aleatória de 6200 pessoas quantas pessoas devem responder que se encontram nessa faixa de renda para que a afirmação do prefeito seja verdadeira Nesse caso a pesquisa deverá estruturar uma porcentagem semelhante em relação ao número de entrevistados Logo o montante esperado de indivíduos nessa condição é igual a 056200 62000005 31 respondentes Por exemplo se um pesquisador colhe informações sobre uma população obtendo uma amostra expressa por X a sua média μ ou seja a média populacional representa um parâmetro EX isto é o valor esperado para um elemento X colhido aleatoriamente A variância populacional por sua vez é representada pelo parâmetro σ² VarX Mas ao lançar mão de uma amostra a média e a variância amostrais são dadas pelas estatísticas X barra e s² Observe os exemplos mais comuns de parâmetros e indicadores por meio do quadro a seguir Tabela com os parâmetros e estimadores comuns em inferência estatística Quadro 1 Parâmetros e estimadores comuns em inferência estatística Fonte Elaborada pelo autor baseada em BUSSAB MORETTIN 2017 PraCegoVer quadro composto por três colunas apresentando os símbolos relacionados aos parâmetros populacionais e aos estimadores amostrais em diferentes tipos Na primeira coluna à esquerda são apresentadas as denominações média mediana variância número de elementos proporção quantil quartis distância entre quartis Na segunda e na terceira colunas respectivamente são apresentados os símbolos relativos à população e à amostra de cada uma das denominações A partir de uma amostra podese portanto efetuar afirmações gerais com elevada precisão sobre os parâmetros de uma população utilizando diferentes tipos de estimadores No próximo tópico veremos com mais detalhes a contribuição desses estimadores para a formação de modelos e para a avaliação de hipóteses Teste seus conhecimentos Atividade não pontuada Os conceitos de inferência estatística devem ser observados para a análise de dados que envolvem populações e amostras Desse modo tornase possível compreender os principais aspectos dessas séries de dados com a extração de indicadores apropriados Considerando o conteúdo apresentado é correto afirmar que a a diferença entre população e amostra existe somente quando há criação de experimentos aleatórios com reposição em uma população infinita b um fenômeno estatístico é um processo ausente em situações que envolvem o uso de amostras pois diz respeito apenas a populações c toda população apresenta dimensões infinitas pois é gerada a partir de uma variável aleatória demandando assim o uso de estimadores amostrais d uma distribuição por frequências absolutas apresenta os dados amostrais extraídos de uma população como proporçõespercentuais dessa população e uma população amostral é um subconjunto extraído de uma população e tem dimensões conhecidas e finitas Verificar 12 Estratégia de decisão na inferência estatística Ao definir a relevância dos processos de inferência estatística para a construção de modelos econométricos é importante entender de que forma esses processos podem auxiliar um agente econômico o gestor de uma empresa um responsável técnico ou um formulador de políticas públicas por exemplo a efetivar decisões Você quer ler A econometria pode ser usada não apenas para estimar tendências futuras mas também para a análise de dados históricos No artigo de Thais Carrança 2021 denominado Como a escravidão atrasou o processo de industrialização do Brasil você poderá conhecer uma aplicação prática dos estudos econométricos em um tema de nossa história colonial e independente Acesse httpswwwbbccomportuguesebrasil55670561 Vale destacar ainda que tais decisões irão impactar não apenas os resultados gerados por uma empresa ou instituição receitas lucros tributos a pagar etc mas também poderão orientar as políticas e planejamentos a serem efetivados por esses organismos ao longo do tempo 121 Métodos de amostragem e avaliação de dados Ao tratar do assunto decisão é necessário reforçar a compreensão da inferência estatística em relação a um método de análise e discussão de dados amostrais retirados de uma população Sabendose que uma amostra aleatoriamente colhida gera uma variável aleatória X esperase obter uma participação ou porcentagem θ de resultados esperados nessa amostra Por exemplo se um rebanho de bois apresenta animais doentes por febre aftosa é necessário estimar a proporção de bois que pode ter sido contaminada separando para isso uma amostra e efetivando uma testagem Se há x bois doentes temse que θ é a proporção de bois que está afetada pela enfermidade logo cada boi que tenha sido separado para amostragem também poderá apresentar a mesma doença com probabilidade θ de tal situação se manifestar BUSSAB MORETTIN 2017 Atribuindose por X a variável aleatória que diz respeito ao número de bois enfermos um gestor agroindustrial irá usar o valor observado X x para inferir a existência de um parâmetro θ de bois doentes em todo o seu rebanho tomando precauções de defesa sanitária compra de medicamentos vacinas separação de animais de acordo com essa possível realidade Suponha como referência que θ 01 ou seja 10 dos animais do rebanho podem estar contaminados pela febre aftosa Essa inferência pode ser expressa de diferentes modos tais como os que se seguem MAIA 2017 Em relação à criação de uma estimativa pontual Criação de uma estimativa pontual pode haver a fixação de um valor único e esperado para um parâmetro de modo que θ θ 01 Assim o gestor define que o número total de animais doentes é de exatos 10 do rebanho Elaboração de um intervalo de confiança Elaborase esse intervalo de modo a criar uma margem de segurança ao redor da estimativa com um certo nível de certeza de que o estimador é correto por exemplo há 95 de certeza de que aproximadamente 8 a 12 dos animais estão doentes Criação de um teste de hipótese Esse teste permitirá validar ou rejeitar a legitimidade de uma estimação associada a uma hipótese por exemplo podese testar a nível de 5 a hipótese da proporção de animais contaminados θ ser inferior a 0075 Elaboração de predições Com isso avaliase por exemplo a possibilidade de uma porcentagem maior de animais apresentar sintomas nas próximas semanas de acordo com as tendências de contaminação das semanas anteriores Estabelecimento de decisões Por exemplo pode haver a iniciativa de rastrear todos os animais que apresentem sintomas e abatêlos colocando em confinamento e testagem os outros bois que pertençam ao mesmo lote de animais doentes Em cada uma dessas situações observe que o fato do agente conhecer o valor X x que foi observado a partir da amostra coletada permite que ele realize inferências e decisões sobre uma certa proporção θ que ele espera observar em toda uma população 122 Testes de hipóteses sobre conjuntos amostrais Para dar sustentação a uma decisão como vimos anteriormente podese recorrer a um teste de hipótese Nesse caso o pesquisador verifica uma afirmação específica relacionada a uma população qualquer ou a um parâmetro ligado a essa população observando se os resultados gerados com a amostra podem ser capazes de confirmála ou contradizêla Em outras palavras a inferência estatística permite efetivar testes para confirmar hipóteses de estudo aplicados em relação a uma série de dados amostrais podendo confirmar ou não tais hipóteses Portanto um teste de hipótese permite criar metodologias de verificação de evidências sobre dados amostrais que possam dar credibilidade a uma hipótese amparada em um fenômeno estatístico BUSSAB MORETTIN 2017 De acordo com o procedimento de elaboração de um teste de hipótese seguindo o exemplo apresentado anteriormente é possível avaliar se a proporção de animais doentes será superior a 75 usando uma amostra de cem animais dos quais nove apresentaram sintomas Dessa forma a hipótese nula H0 é dada por H0 θ 0075 A hipótese alternativa H1 por sua vez gera uma distribuição unilateral à esquerda e é expressa do seguinte modo H1 θ 0075 Se a amostra é aleatória a proporção amostral θ terá uma distribuição que tende a uma distribuição normal com média e variância expressas da seguinte forma θN θ θ1θ n Supondo que a amostra tem dimensão n 100 que o nível de significância do teste é igual a α 5 e que a hipótese nula é verdadeira a distribuição desse estimador será dada por θN 0075 007510075 100 θN 0075 00007 Passando à busca do valor de referência para o estimador é preciso encontrar o valor θc capaz de gerar a seguinte equação P Z θc θ σ 005 De acordo com a tabela normal padrão a probabilidade P 005 está associada ao valor Z 1645 Logo se a distribuição é unilateral à esquerda temse o sinal negativo na estatística Z θc0075 0007 1645 θc 0139 0075 0064 O valor θc 0064 delimita a região crítica para o teste mencionado Ora se nove animais estão doentes em uma amostra de cem animais a proporção amostral é igual a 009 Esse valor está dentro da região crítica de modo que se pode rejeitar a hipótese nula Há portanto indícios evidentes de que a proporção de animais doentes é superior a 75 Assim com base nesse diagnóstico o gestor deve efetivar ajustes de sua decisão tomando as medidas apropriadas para essa situação avaliando por exemplo as perdas que serão geradas com o abate de uma proporção ainda maior de seu rebanho Você pode perceber portanto a relevância de um procedimento de coleta de amostras para a criação de informações a respeito de uma população Entretanto é necessário operacionalizar essas informações de acordo com as suas tendências construindo um modelo econométrico cujos componentes serão apresentados no próximo tópico Acompanha dados amostrais para criar parâmetros que podem ser usados para inferir dados futuros e a projeção é uma conjectura prévia de uma situação futura a partir dos dados e elementos do tempo presente 13 Componentes do modelo econométrico Como pudemos observar até este momento a associação entre a análise econômica e a inferência estatística é útil para estimar resultados que são relacionados a diferentes variáveis No entanto essas variáveis podem ser associadas entre si construindo modelos econométricos de maior ou menor grau de complexidade os quais permitem gerar estimações ainda mais precisas acerca dessas amostras 131 Modelo econométrico básico Em alguns casos é possível entender uma associação entre duas variáveis a partir de indicadores mais simples como o coeficiente de correlação de Pearson com notação ρ que mede a intensidade da relação entre duas variáveis BUSSAB MORETTIN 2017 Você deve lembrar a partir dos conceitos de estatística básica que o coeficiente de correlação de Pearson assume valores em um intervalo dado por 11 de modo que um coeficiente ρ 1 indica uma correlação perfeita entre as variáveis se o valor de uma aumenta a outra também irá aumentar Se ρ 1 observase que uma variável terá o valor diminuído enquanto a outra aumentará Já valores iguais a zero indicam ausência de correlação No entanto embora esse indicador apresente sua utilidade o coeficiente de correlação pode ser insuficiente para entender outras dimensões dessa associação entre duas variáveis dadas por X e Y Por exemplo qual será a variação efetiva de Y a partir de uma variação de X Ou ainda qual o valor esperado de Y a partir de um determinado valor de X Tais questões de um modo geral somente podem ser explicadas ao recorrermos a um modelo econométrico Como referência para esses modelos temse o modelo de regressão linear Nesta unidade vamos primeiramente enfatizar o modelo de regressão linear simples De acordo com seus pressupostos há uma relação entre variáveis Y e X em uma certa população de modo que a variação de Y poderá ser explicada em maior ou menor grau pela variação de X cujos componentes são apresentados de acordo com a equação que se segue GUJARATI 2011 Yi α βXi ei Conforme a equação Y representa a variável dependente isto é a variável que é explicada pelas variações positivas ou negativas de X que por vez é chamada de variável independente ou explanatória Já a variável e apresenta os erros amostrais isto é os erros de estimação que não são captados ou explicados pelo modelo econométrico O modelo econométrico depende ainda da existência de um coeficiente angular β e de um coeficiente angular α que são parâmetros associados ao modelo isto é esses parâmetros determinam a inclinação da reta de regressão e a sua interceptação no eixo da variável independente Observe por exemplo na figura a seguir a evolução de um modelo expresso pela função Y 2X 3 Figura 2 Relação linear entre variáveis em uma função Y 2X 3 Fonte Elaborada pelo autor 2021 PraCegoVer gráfico em tendência crescente e linear contendo diferentes pontos em um plano cartesiano Uma função de regressão linear determina que um valor Yi relativo à variável dependente Y será expresso a partir da função linear de um valor conhecido Xi relativo à variável aleatória X acrescentandose um erro ei que não é previsto ou captado pelo modelo econométrico MAIA 2017 132 Notação e tipos de modelos Agora que você já conhece as principais características de um modelo econométrico é importante avaliar algumas de suas formas funcionais isto é os diferentes perfis de modelos que podem ser criados para explicar as associações entre variáveis Neste tópico estamos avaliando até o momento uma relação absolutamente linear entre duas variáveis esse é o padrão para uma regressão linear simples analisada anteriormente Tratase de um modelo que gera uma reta de valores estimados e que se configura como uma análise bivariada enfocando no caso duas variáveis Vale destacar ainda que uma análise univariada considera a formulação de indicadores baseados em uma única variável como a análise de índices de variância simples média moda mediana variância e desviopadrão por exemplo MAIA 2017 Ainda que essa regressão simples seja didaticamente útil para compreender o processo de associação entre variáveis há uma utilização prática relativamente limitada desse modelo Tal situação ocorre porque no mundo real há poucos elementos que dependam de apenas uma variável independente para terem a sua variabilidade explicada Por exemplo é possível relacionar a variação da taxa de desemprego que é a razão entre o número de pessoas desempregadas e o total da força de trabalho em uma economia e a taxa de inadimplência para o pagamento de despesas financeiras como aqueles efetuados em cartões de crédito Em uma primeira aproximação a relação de regressão poderia ser do tipo simples afinal as pessoas que estão desempregadas não teriam renda suficiente para arcar com as despesas financeiras de um cartão de crédito acelerando a inadimplência na economia e na sociedade No entanto há outros fatores que podem ser igualmente coerentes para explicar a evolução da taxa de inadimplência como a variação dos preços dos alimentos da cesta básica Ora as pessoas precisam se alimentar de modo que um aumento nesses preços levará a um maior gasto com alimentos e consequentemente a uma menor disponibilidade de recursos para o pagamento de dívidas contraídas Logo podese arbitrar sem muitas dúvidas que a inadimplência pode igualmente ser explicada pelo desemprego e pelo preço dos alimentos em maior ou menor proporção Nesse caso é preciso recorrer a um modelo de regressão linear múltipla pois se o pesquisador optar pela construção de um modelo simples haverá um erro amostral suficientemente significativo que irá tornar a sua análise viesada nas relações de causa e efeito Desse modo ao entender uma associação entre variáveis é preciso observar também os erros do modelo se o modelo gerar um erro muito alto há outros fatores que estão interferindo na sua evolução e que ainda não foram descobertos Sendo assim tornase necessário revisar essas variáveis para gerar uma modelagem mais precisa O modelo de regressão linear múltipla é elaborado em uma perspectiva multivariada com mais de uma variável independente sejam duas três ou n variáveis explicando as variações constantes da variável dependente do seguinte modo WOOLDRIDGE 2017 Yi α β1X1 β2X2 βnXn ei Nesse caso para um modelo com duas variáveis independentes a sua representação geométrica é expressa de acordo com a figura a seguir Nela observe que os pontos A B C D são tridimensionalmente estruturados isto é estão dispostos em um plano geométrico Figura 3 Relação entre três variáveis em um plano geométrico Fonte Elaborada pelo autor 2021 PraCegoVer gráfico contendo um conjunto de quatro pontos dispostos em um plano geométrico e em uma reta inserida em um plano de três dimensões Há ainda outros perfis de modelos e formas funcionais que precisam ser avaliados especialmente no caso das regressões haja vista que nem sempre as relações entre variáveis independentes e dependentes são absolutamente lineares Nesse caso comum à regressão linear simples bastaria estimar variações e os erros amostrais seriam pequenos ou praticamente nulos pois a variação de Y variável dependente ocorreria de forma constante em função das variações absolutas de X variável independente No entanto é necessário avaliar o que ocorre em situações em que a variável Y irá apresentar um crescimento mais rápido ou mais lento mas não constante em relação às variações absolutas de X MAIA 2017 Por exemplo supondo a existência de um modelo Yi Xi³ temse a formulação gráfica apresentada na sequência Figura 4 Modelo de crescimento exponencial Fonte Elaborada pelo autor 2021 PraCegoVer gráfico em tendência de crescimento exponencial isto é em pontos próximos de zero A linha cresce devagar e acelerase à medida que os valores do eixo horizontal aumentam ficando quase em uma vertical Analogamente um modelo Yi 1Xi³ apresentará valores infinitesimais à medida que X aumenta como aponta a figura a seguir Figura 5 Modelo Yi 1Xi³ Fonte Elaborada pelo autor 2021 PraCegoVer gráfico contendo um modelo decrescente com valores infinitesimais e próximos de zero em uma linha curva Essas estruturas de característica exponencial são comuns aos modelos do tipo loglin os quais podem ser operacionalizados ao transformar a variável dependente Y em seu logaritmo natural expresso por ln Y MAIA 2017 Assim o modelo que tinha uma dinâmica exponencial passa a caracterizarse como um modelo linear de acordo com o que se observa na figura apresentada na sequência Figura 6 Transformação de uma função de regressão loglin Fonte Elaborada pelo autor baseada em MAIA 2017 PraCegoVer plano cartesiano com a variável X no eixo horizontal e a variável do logaritmo natural de Y no eixo vertical Assim a linha exponencial transformase em uma reta A formulação algébrica desse modelo loglin é dada pela equação que se segue lnYi α βXi ei Essa situação demonstra que a cada variação absoluta marginal em ln y isto é quando há Δ ln Y observamse variações relativas na variável dependente Y em um montante igual a ΔY Yi MAIA 2017 Desse modo o coeficiente angular β representa a variação relativa em Y perante uma variação unitária da variável independente X haja vista que no momento em que ΔY 1 observase o seguinte ΔYYi β Por consequência podese verificar que a variação em Y será expressa do seguinte modo ΔY βYi α βXi1 α βXi βXi1 βXi Uma segunda forma funcional é o modelo linlog No modelo loglin você observou a ocorrência de variações relativas em Y exponenciais tendendo a zero ou a infinito a partir das variações absolutas pontuaislineares em X O modelo linlog por sua vez pressupõe que Y apresenta variações absolutas ou seja constantes diante de variações relativas sobre a variável independente X MAIA 2017 Nesse caso de acordo com o valor do coeficiente angular temse o que está expresso na figura a seguir Figura 7 Expressões de um modelo de regressão linlog Fonte Elaborada pelo autor baseada em MAIA 2017 PraCegoVer dois gráficos apresentando expressões de um modelo de regressão linlog O gráfico à esquerda tem uma linha decrescente que cruza o eixo horizontal quando Y é igual a zero Essa curva tem concavidade para cima O gráfico à direita contém um plano cartesiano no qual se insere uma linha crescente mas que cresce a taxas decrescentes formando uma curva com a concavidade para baixo A formulação algébrica desse modelo é expressa da seguinte forma MAIA 2017 Yi α β1 lnXi ei O modelo linlog entre Y e lnX é expresso graficamente conforme apresentado na figura a seguir Figura 8 Transformação de uma função de regressão linlog Fonte Elaborada pelo autor baseada em MAIA 2017 PraCegoVer plano cartesiano com a variável do logaritmo natural de X no eixo horizontal e a variável Y no eixo vertical Assim a linha exponencial do gráfico anterior transformase em uma reta Nesse modelo observase que as variações absolutas em ln X expressas por Δ ln X irão representar variações relativas em X iguais a ΔXXi Dessa forma o coeficiente angular β irá representar variações absolutas em Y dadas por ΔY a uma variação unitária em X Um terceiro tipo de modelo é conhecido como loglog ou logduplo muito utilizado em análises econômicas De acordo com esse modelo as variações relativas da variável independente X implicarão em variações relativas constantes da variável dependente Y Desse modo tornase necessário realizar uma transformação para o logaritmo natural de Y ln Y e de X ln X MAIA 2017 Sua representação gráfica é estruturada conforme evidencia a figura a seguir Figura 9 Expressões de um modelo de regressão logduplo Fonte Elaborada pelo autor baseada em MAIA 2017 PraCegoVer dois gráficos apresentando expressões de um modelo de regressão logduplo O gráfico à esquerda contém uma curva com a parte côncava para cima mas que não cruza o eixo horizontal O gráfico à direta contém duas curvas uma com taxa crescente e exponencial e outra com crescimento a taxas decrescentes Observe que se o coeficiente angular apresentar um valor no intervalo 1 0 o modelo tem uma declividade negativa a taxas crescentes as variações relativas de X correspondem a variações relativas de Y tendendo a zero Se o coeficiente apresentar valores entre 0 e 1 o modelo tem uma tendência crescente porém a taxas decrescentes tendendo a um valorlimite de Y quando X tende a infinito Finalmente se o coeficiente β é positivo e maior que 1 o modelo apresenta tendência de crescimento a taxas crescentes pequenas variações relativas de X geram aumentos substanciais em Y MAIA 2017 Na transformação dessas variáveis em seus logaritmos naturais temse o que é apresentado a seguir Figura 10 Transformação de uma função de regressão logduplo Fonte Elaborada pelo autor baseada em MAIA 2017 PraCegoVer plano cartesiano com a variável do logaritmo natural de X no eixo horizontal e a variável do logaritmo natural de Y no eixo vertical Assim a linha exponencial do gráfico anterior transformase em uma reta Sabendo que as variações absolutas de ln X e de ln Y implicam em variações relativas de X e de Y respectivamente observase que o coeficiente angular dado por β irá na verdade representar as variações relativas que ocorrem na variável dependente ΔYYi a cada variação relativa e unitária 1 100 da variável independente X ou seja quando ΔXXi 1 Observando as variações marginais 1 portanto esperase que a cada variação percentual de X haja uma variação de Y em magnitude igual a β100 MAIA 2017 Por fim o modelo linlin ou nívelnível pressupõe uma relação especificamente linear entre variáveis sendo comum aos casos de regressão simples Você o conhece Alexandre Gori Maia atua no Instituto de Economia da Universidade Estadual de Campinas IEUnicamp e se especializou na construção de modelos econométricos que enfocam temas de desenvolvimento econômico tais como a demografia a dinâmica do mercado de trabalho e o desenvolvimento do setor agropecuário no país Ele é autor de um dos livros de referência para esta disciplina A construção do modelo econométrico determina as suas características a partir do conjunto de informações criado pelo pesquisador No entanto a expressão desse modelo irá depender de seus coeficientes linear e angular estruturados a partir de uma rotina de procedimentos algébricos que será destacada no tópico seguinte Vamos Praticar Para melhor compreender as características dos modelos econométricos apresentados nesta seção consulte o Capítulo 4 Formas funcionais do livro de Alexandre Gori Maia Econometria conceitos e aplicações aprenda os fundamentos da análise econométrica e resolva problemas econômicos concretos presente em sua biblioteca virtual Nele é possível conhecer de forma mais detalhada os modos de associação absoluta e relativa que geram os modelos econométricos apresentados nesta unidade Procure ainda resolver os exercícios propostos pelo autor 14 Etapas do processo de modelagem econométrica As fases que compõem o procedimento para a elaboração de uma regressão simples se iniciam com a obtenção das estimativas que estão relacionadas aos parâmetros linear e angular respectivamente dados por α e β Esses coeficientes irão determinar aspectos importantes como o ponto de interceptação das variáveis se ele existir e a inclinação da reta de regressão 141 Coeficientes linear e angular As estimativas ligadas aos coeficientes linear e angular serão criadas com base nos coeficientes amostrais que são dados por a e b a partir de uma amostra de n pares ordenados relacionados a duas variáveis isto é às variáveis independente e dependente X Y gerando valores estimados para a variável Y HOFFMANN 2016 Você quer ver Você pode complementar o conhecimento adquirido ao longo desta unidade acessando o canal da Universidade Virtual do Estado de São Paulo Univesp Na videoaula n 28 do curso de Estatística Exercícios sobre regressão ministrada pelo professor doutor André Fleury são apresentados exemplos de regressão linear baseados em temas econômicos e no cotidiano das empresas relacionando práticas de investimento e efeitos em receita de vendas entre outros casos Acesse httpswwwyoutubecomwatchv15nlzjMjjEQ Esses valores estimados de Yi são expressos por Ỹi de acordo com a equação que se segue Ỹi a bXi Nesse sentido o resíduo representa a diferença ou o desvio entre o valor real da variável dependente Yi e o seu valor estimado por Ỹi Assim sendo para cada resíduo expresso por ei temse que ei Yi Ỹi Consequentemente a soma desses desvios dados por ei será igual a zero de acordo com as propriedades do modelo de regressão HOFFMANN 2016 ni1 ei 0 Os coeficientes a e b devem ser calculados de acordo com as seguintes equações a Y bX b XYx2 XiYiY xiX² Em que x e y são determinados pela diferença entre cada um dos valores Xi e Yi e suas médias respectivamente expressas por X e Y Teste seus conhecimentos Atividade não pontuada Considere a seguinte situaçãoproblema um sargento das forças policiais utiliza procedimentos de regressão linear para estimar os rendimentos esperados em relação aos soldados que ele treina Desse modo ele coletou o número de flexões efetuadas Y por um grupo de soldados em função de diferentes intervalos de tempo gerando o seguinte conjunto de dados XY 1012 1114 129 1110 1115 1410 1511 1518 1514 167 Eventuais valores decimais devem ser arredondados para baixo Considerando essas informações e o conteúdo estudado sobre regressão linear simples é correto afirmar que O a em 22 segundos esperase que os soldados efetivem 16 flexões O b a razão entre o coeficiente linear e o coeficiente angular é igual a 3226 O c o rendimento esperado dos soldados em 13 segundos é igual a 14 O d a equação de regressão é dada por Ỹi a bXi 1155 012X O e em 12 segundos o rendimento esperado será de 15 flexões Verificar Considerando um exemplo suponha a existência do seguinte conjunto de dados expresso no quadro a seguir cujos números serão comparados para verificar a relação de associação entre eles a ser elaborada mediante a criação de um modelo econométrico X Y X Y 2 14 32 134 5 15 35 132 8 32 38 139 11 39 41 171 14 64 44 184 17 75 47 186 20 51 50 205 23 92 26 97 29 121 Quadro 2 Associação entre variáveis Fonte Elaborado pelo autor 2021 PraCegoVer quadro contendo um conjunto de números que pertencem a uma variável X primeira e terceira colunas e um conjunto de números que pertencem a uma variável Y segunda e quarta colunas Agora é necessário obter as médias de X e Y de modo que a média amostral X é igual a 26 e a média amostral Y é igual a 103 Na sequência devese efetivar a estimação dos coeficientes a e b relacionados a essa distribuição Assim a sua obtenção deverá ser feita de modo que x X X e y Y Y Portanto temse a seguinte situação b XYx2 XiYiY xiX² b 21410351510350205103 226²526²5026² b 14889 3672 4055 Consequentemente é possível elaborar o coeficiente linear HOFFMANN 2016 a Y bX 103 405526 243 Assim a reta de regressão relacionada a uma distribuição de valores esperados Ỹi relativos à variável dependente é dada por Ỹi 243 4055Xi Essa reta de regressão demonstra que a cada variação absoluta uma unidade em X haverá uma variação de 4055 unidades na variável dependente Y Portanto tratase um modelo de tendência crescente cuja reta intercepta o eixo Y no ponto 0 243 Vamos Praticar Considerando a existência do modelo Yi 243 4055 Xi quais serão os valores estimados para o conjunto de pontos dado por X 52 64 75 Apresente os pares ordenados X Y relacionados a esse conjunto Em sua resolução conforme você verá para os valores apresentados da variável independente X os valores de Y variável dependente serão estruturados da seguinte forma X 52 Y 243 405552 20843 Logo X Y 52 20843 X 64 Y 243 405554 21654 Logo X Y 64 21654 X 75 Y 243 405575 30169 Logo X Y 75 30169 Conclusão Nesta unidade vimos que a econometria não consiste apenas em um aprofundamento da estatística econômica Embora sejam utilizadas várias ferramentas dessa área de conhecimento como o cálculo de médias e desvios o principal propósito da econometria consiste em gerar ferramentas e métodos descritivos da variação de diferentes conjuntos de dados Dessa forma é possível estimar mudanças futuras que podem afetar diretamente a capacidade decisória de um agente econômico Nesta unidade você teve a oportunidade de operar um modelo econométrico simples por meio dos processos de regressão linear conhecer as principais finalidades e objetivos de um modelo econométrico e as suas respectivas aplicações contribuindo para o seu universo profissional distinguir conceitos de inferência estatística como os conceitos de população amostra indicador estimador e parâmetro Referências BUSSAB W O MORETTIN P Estatística básica 7 ed São Paulo Saraiva 2017 CARRANÇA T Como a escravidão atrasou o processo de industrialização do Brasil BBC Brasil São Paulo 16 jan 2021 Disponível em httpswwwbbccomportuguesebrasil55670561 httpswwwbbccomportuguesebrasil55670561 Acesso em 29 jan 2021 CRESPO A A Estatística fácil 20 ed São Paulo Saraiva 2011 ESTATÍSTICA Aula 28 Exercícios sobre regressão S l s n 2016 1 vídeo 17 min Publicado pelo canal UNIVESP Disponível em httpswwwyoutubecomwatchv15nlzjMjjEQ httpswwwyoutubecomwatchv15nlzjMjjEQ Acesso em 26 jan 2021 GUJARATI D N Econometria básica 5 ed Porto Alegre Bookman 2011 HOFFMANN R Análise de regressão uma introdução à econometria Piracicaba Edição do Autor 2016 MAIA A G Econometria conceitos e aplicações aprenda os fundamentos da análise econométrica e resolva problemas econômicos concretos São Paulo Saint Paul 2017 ESTIMAÇÃO In DICIONÁRIO brasileiro da língua portuguesa Michaelis São Paulo Melhoramentos 2021 Disponível em httpsmichaelisuolcombrmodernoportuguesbuscaportuguesbrasileiroestimaC3A7C3A3o httpsmichaelisuolcombrmodernoportuguesbuscaportuguesbrasileiroestimaC3A7C3A3o Acesso em 31 jan 2021 PREDIÇÃO In DICIONÁRIO brasileiro da língua portuguesa Michaelis São Paulo Melhoramentos 2021 Disponível em httpsmichaelisuolcombrmodernoportuguesbuscaportuguesbrasileiroprediC3A7C3A3o httpsmichaelisuolcombrmodernoportuguesbuscaportuguesbrasileiroprediC3A7C3A3o Acesso em 31 jan 2021 PREVISÃO In DICIONÁRIO brasileiro da língua portuguesa Michaelis São Paulo Melhoramentos 2021 Disponível em httpsmichaelisuolcombrmodernoportuguesbuscaportuguesbrasileiroprevisC3A3o httpsmichaelisuolcombrmodernoportuguesbuscaportuguesbrasileiroprevisC3A3o Acesso em 31 jan 2021 PROJEÇÃO In DICIONÁRIO brasileiro da língua portuguesa Michaelis São Paulo Melhoramentos 2021 Disponível em httpsmichaelisuolcombrmodernoportuguesbuscaportuguesbrasileiroprojeC3A7C3A3o httpsmichaelisuolcombrmodernoportuguesbuscaportuguesbrasileiroprojeC3A7C3A3o Acesso em 31 jan 2021 WOOLDRIDGE J M Introdução à econometria uma abordagem moderna 6 ed São Paulo Cengage Learning 2017