·
Administração ·
Econometria
Envie sua pergunta para a IA e receba a resposta na hora
Texto de pré-visualização
Econometria A natureza da Econometria A econometria é baseada no desenvolvimento de métodos estatísticos para estimar as relações econômicas testar teorias avaliar e implementar políticas de governo e de negócios A econometria se desenvolveu de forma separada da estatística porque enfoca problemas inerentes à coleta e à análise de dados econômicos não experimentais Dados não experimentais não são acumulados por meio de experimentos controlados de indivíduos firmas ou segmentos da sociedade o pesquisador é um coletor passivo de dados Os métodos econométricos são relevantes quando temos em mente uma relação que apresenta alguma importância para decisões de negócios ou análises de políticas públicas Econometria Como se estrutura uma análise econométrica O primeiro passo é a formulação da questão de interesse do pesquisador Por exemplo Estudar os efeitos dos gastos em campanhas políticas sobre os resultados de eleições ou A relação entre o tempo de estudo com o salário pago Em alguns casos é necessário construir um modelo econômico Um modelo econômico consiste em equações matemáticas que descrevem várias relações É necessário a construção de um modelo econométrico Os modelos econométricos são modelos observacionais que permitem estimar rapidamente as tendências econômicas futuras Para isso são utilizados dados do presente e do passado Econometria A estrutura dos dados econométricos Os dados econométricos apresentamse em vários tipos Os mais importantes e mais usados são Dados de corte transversal crosssection Um conjunto de dados de corte transversal consiste em uma amostra de indivíduos consumidores empresas cidades estados países ou uma variedade de outras unidades tomada em um determinado ponto no tempo Análise de dados de secção transversal geralmente consiste em comparar as diferenças entre os indivíduos Em uma análise de dados de corte transversal na coleta de dados são ignoradas quaisquer diferenças de tempo não importantes Uma característica importante dos dados de corte transversal é que não é possível considerar que eles foram obtidos por amostragem aleatória da população A ordenação dos dados não importa para a análise econométrica de dados de corte transversal Econometria Estrutura dos dados econométricos Dados de séries temporais Um conjunto de dados de séries temporais consiste em observações sobre uma variável ou muitas variáveis ao longo do tempo Como eventos passados podem influenciar eventos futuros e como nas ciências sociais as defasagens do comportamento são prevalecentes o tempo é uma dimensão importante em um conjunto de dados de séries temporais Diferentemente do arranjo dos dados de corte transversal a ordenação cronológica das observações em uma série temporal transmite informações importantes Uma característica importante dos dados de série temporal que torna essa análise mais difícil do que os dados de corte transversal é que raramente é possível assumir que as observações são independentes ao longo do tempo Outra característica dos dados de série temporais é a frequência dos dados na qual eles são coletados Muitas séries temporais exibem um forte padrão sazonal Econometria Estrutura dos dados econométricos Cortes transversais agrupados Alguns conjuntos de dados tem tanto características de corte transversal quanto de séries temporais Agrupar cortes transversais de diferentes períodos é frequentemente um modo eficaz de analisar os efeitos de uma política pública O propósito é coletar dados de anos anteriores e posteriores relacionados a uma mudança de política governamental A análise de um corte transversal agrupado é bastante parecida com a de um corte transversal padrão exceto pelo fato de que é necessário muitas vezes considerar diferenças periódicas das variáveis ao longo do tempo Econometria Estrutura dos dados econométricos Dados em painel ou dados longitudinais Um conjunto de dados em painel ou dados longitudinais consiste em uma série temporal para cada registro do corte transversal do conjunto de dados A característica essencial dos dados em painel que os distingue dos dados de corte transversal agrupado é que as mesmas unidades do corte transversal indivíduos empresas ou municípios por exemplo são acompanhados ao longo de um determinado período Como os dados em painel requerem a repetição das mesmas unidades ao longo do tempo os conjuntos de dados em painel são mais difíceis de obter que os cortes transversais agrupados O uso de mais de uma observação pode facilitar a inferência causal em situação em que inferir causalidade é mais difícil se somente um único corte transversal estiver disponível Os dados em painel permitem estudar a importância das defasagens do comportamento Econometria Exemplo de análise econométrica O modelo econômico do crime proposto por Gary Becker Como descrever a participação de um indivíduo no crime Crimes tem recompensas econômicas evidentes mas também o comportamento criminoso tem custos O custo de oportunidade do crime impede que o criminoso participe de outras atividades Existem custos associados com a possibilidade de ser capturado e se condenado existem custos associados com o cumprimento da pena A questão proposta por Gary Becker é que a decisão de empreender a atividade ilegal é uma decisão de alocação de recursos com os benefícios e custos das atividades concorrentes sendo consideradas Econometria O modelo econômico do crime Gary Becker É possível construir uma equação que descreve a quantidade de tempo gasto na atividade criminosa como uma função de vários fatores 𝑦 𝑓𝑥1 𝑥2 𝑥3 𝑥4 𝑥5 𝑥6 𝑥7 onde y horas gastas na atividade criminosa X1 salário por hora ocupada na atividade criminosa X2 saláriohora em emprego legal X3 renda de outras atividades X4probabilidade de ser capturado X5probabilidade de ser condenado caso capturado X6sentença esperada se condenado X7idade Econometria Exemplo de análise econométrica O modelo econométrico pode ser 𝑐𝑟𝑖𝑚𝑒 𝛽0 𝛽1𝑠𝑎𝑙á𝑟𝑖𝑜𝑚 𝛽2𝑜𝑢𝑡𝑟𝑒𝑛𝑑𝑎 𝛽3𝑓𝑟𝑒𝑞𝑝𝑟𝑖𝑠 𝛽4𝑓𝑟𝑒𝑞𝑐𝑜𝑛𝑑 𝛽5𝑠𝑒𝑛𝑡𝑚𝑒𝑑 𝛽6𝑖𝑑𝑎𝑑𝑒 𝑢 A escolha dessas variáveis é determinada a partir de considerações sobre os dados O termo u contem fatores não observados tais como o salário da atividade criminosa o caráter a formação da família etc u é um termo de erro ou termo de perturbação As constantes 𝛽0 𝛽1 𝛽6 são os parâmetros do modelo econométrico e descrevem as direções e as influências da relação entre crime e fatores usados para determinar o crime no modelo Econometria Na maioria dos casos a análise econométrica começa pela especificação de um modelo econométrico sem maiores considerações de detalhes da criação do modelo A partir da especificação do modelo econométrico devem ser considerados tanto o raciocínio econômico quanto o senso comum Tendo sido especificado o modelo econométrico é possível formular hipóteses de interesse por exemplo A hipótese de que o 𝑠𝑎𝑙á𝑟𝑖𝑜𝑚 que poderia ser ganho no emprego legal não tem efeito sobre o comportamento criminoso assim 𝛽1 0 Uma análise requer dados e após os dados terem sido coletados os métodos econométricos são usados para estimar os parâmetros do modelo e formalmente testar as hipóteses Econometria Modelo de Regressão Simples Antes de entender como funciona o modelo de regressão simples devemos entender o que significa correlação entre dados amostrais emparelhados ou dados bivariados Correlação pode ser definida da seguinte maneira Existe uma correlação entre duas variáveis quando os valores de uma variável estão relacionados de alguma maneira com os valores da outra variável A partir da definição de correlação é possível introduzir o coeficiente de correlação linear r que é uma medida numérica da força da relação entre duas variáveis que representam dados quantitativos Econometria Modelo de Regressão Simples Antes de ser feita qualquer análise estatística é possível usar um diagrama de dispersão para explorar os dados visualmente É possível analisar um diagrama de dispersão em relação a quaisquer padrões distintos e em relação a valores atípicos que são pontos distantes do demais pontos Como estamos analisando uma correlação linear significa que em um diagrama de dispersão os pontos se aproximam do padrão de uma reta No próximo slide temos um exemplo de um diagrama de dispersão entre dados bivariados ou dados emparelhados os pontos alinhados tendem a se aproximar de um padrão de reta Econometria Modelo de Regressão Simples Diagrama de dispersão entre dados bivariados 20 15 10 05 00 20 15 10 05 00 C2 C1 Gráfico de Dispersão de C1 versus C2 Econometria Modelo de Regressão Simples Coeficiente de correlação linear r O coeficiente de correlação linear r mede a força da correlação linear entre valores quantitativos emparelhados bivariados de x e y em uma amostra O coeficiente de correlação linear r é também chamado de coeficiente de correlação do produto dos momentos de Pearson em homenagem ao matemático Karl Pearson 18571936 O coeficiente de correlação linear r é calculado pela fórmula 𝑟 𝑛σ 𝑥𝑦σ 𝑥σ 𝑦 𝑛σ 𝑥2σ 𝑥2 𝑛σ 𝑦2σ 𝑦2 Econometria Modelo de Regressão Simples Coeficiente de correlação linear r Na fórmula temos n número de pares de dados amostrais Σ A soma dos itens indicados Σx soma de todos os valores de x Σx2 Indica que cada valor de x deve ser elevado ao quadrado e então esses quadrados devem ser somados Σx2 indica que os valores de x devem ser somados e o total então deve ser elevado ao quadrado Σxy indica que cada valor de x deve primeiro ser multiplicado por seu correspondente valor de y Depois de obtidos todos esses produtos eles devem ser somados r coeficiente de correlação linear para dados amostrais ρ coeficiente de correlação linear para uma população de dados emparelhados Econometria Modelo de Regressão Simples Propriedades do coeficiente de correlação linear r O valor de r está sempre entre 1 e 1 inclusive 𝟏 𝒓 𝟏 O valor de r não é afetado pela escolha de x e y troque todos os valores de x pelos valores de y e o valor de r não mudará r mede a intensidade de uma relação linear Ele não é planejado para medir a intensidade de uma relação não linear r é muito sensível a valores atípicos no sentido de que um único valor atípico pode afetar significativamente seu valor Econometria Modelo de Regressão Simples Exercício Coeficiente de correlação linear r Verifique se é possível afirmar se há uma correlação entre o custo de uma fatia de pizza e a tarifa do metrô na cidade de New York no período determinado Vocês deverão a partir dessas informações calcular o coeficiente de correlação linear r e construir o diagrama de dispersão destes dados Ano 1960 1973 1986 1995 2002 2003 Fatia de pizza 015 035 100 125 175 200 Tarifa do metrô 015 035 100 135 150 200 IPC 302 483 1123 1622 1919 1978 Custo de uma fatia de pizza tarifa de metrô e inflação IPC Econometria Modelo de Regressão Simples Coeficiente de correlação linear r Interpretação do resultado Correlação C1 C2 Correlação de Pearson de C1 e C2 0988 ValorP 0000 Esses valores e o diagrama de dispersão foram calculados através do aplicativo estatístico Minitab 20 15 10 05 00 20 15 10 05 00 C2 C1 Gráfico de Dispersão de C1 versus C2 Econometria Modelo de Regressão Simples Coeficiente de correlação linear r Interpretação do resultado A partir dos resultados apresentados no slide anterior a questão é podemos afirmar que existe uma correlação entre o preço de uma fatia de pizza e a tarifa do metrô em New York A tabela do próximo slide apresenta os valores críticos do coeficiente de correlação de Pearson r para os níveis de significância iguais a 005 e 001 Para n 6 seis pares de dados e nível de significância α igual a 005 temos um valor crítico para r 0811 Isso significa que há uma chance de 5 de que r exceda o valor crítico Como o r encontrado foi r 0988 e o valor crítico é igual a 0811 é possível concluir que existe uma correlação entre o preço de uma fatia de pizza e a tarifa do metrô Também é possível analisar em relação ao valor P Como o valor P encontrado foi igual a 0 e se esse valor P for menor que o nível de significância α 005 podemos concluir que existe uma correlação entre os dados Econometria Modelo de Regressão Simples Coeficiente de correlação linear r Interpretação do resultado Pela tabela dos valores críticos do Coeficiente de Correlação r podese afirmar que há uma correlação linear se r exceder o valor encontrado na tabela r deve ser maior do que o valor da tabela ou menor que o simétrico do valor da tabela Para α 005 o valor critico tabelado é 0811 r 0988 então 0811 0988 0811 Há correlação Não há correlação Há correlação r 0811 r 0811 Econometria Modelo de Regressão Simples Coeficiente de correlação linear r O valor P apresentado no slide anterior mostra se os dados analisados fazem parte de uma distribuição normal ou não Caso 𝑃 𝛼 os dados não seguem uma distribuição normal Caso 𝑃 𝛼 os dados seguem uma distribuição normal É importante frisar que a correlação entre dados não significa uma causalidade entre os dados não é possível concluir que uma aumento no preço da fatia de pizza cause um aumento nas tarifas do metrô Ambos podem ser afetados por uma variável oculta ou seja variável não considerada Econometria Modelo de Regressão Simples Coeficiente de correlação linear r Teste de hipótese formal Um teste de hipótese formal é usado para se determinar se há ou não uma correlação linear significante entre duas variáveis Hipóteses 𝐻0 𝑝 0 𝑛ã𝑜 ℎá 𝑐𝑜𝑟𝑟𝑒𝑙𝑎çã𝑜 𝐻0 𝑝 0 ℎá 𝑐𝑜𝑟𝑟𝑒𝑙𝑎çã𝑜 Estatística de teste Tabela de valores críticos Se r valor crítico rejeita H0 e conclui que há evidência suficiente para apoiar a afirmativa de existência de uma correlação linear Se r valor crítico deixa de rejeitar H0 e conclui que não há evidência suficiente para apoiar a afirmativa de existência de uma correlação linear Econometria Modelo de Regressão Simples Coeficiente de correlação linear r Teste de hipótese formal Valor p Na estatística o valorp também chamado de nível descritivo ou probabilidade de significância é a probabilidade de se obter uma estatística de teste igual ou mais extrema que aquela observada em uma amostra sob a hipótese nula Se o valor p for menor do que ou igual ao nível de significância rejeite H0 e conclua que há evidência suficiente para apoiar a afirmativa da existência de correlação linear p α Se o valor p for maior do que o nível de significância deixe de rejeitar H0 e conclua que não há evidência suficiente para apoiar a afirmativa da existência de uma correlação linear p α Econometria Modelo de Regressão Simples Coeficiente de correlação linear r Teste de hipótese formal Hipóteses 𝐻0 𝑝 0 𝑛ã𝑜 ℎá 𝑐𝑜𝑟𝑟𝑒𝑙𝑎çã𝑜 𝐻1 𝑝 0 ℎá 𝑐𝑜𝑟𝑟𝑒𝑙𝑎çã𝑜 A estatística de teste t é 𝑡 𝑟 𝑛2 1𝑟2 Onde n 2 representa o grau de liberdade Calculando t e encontrando o valor p podese concluir se há evidência ou não de existência de correlação Econometria Modelo de Regressão Simples Modelos de análise econométrica começam com a seguinte premissa y e x são das variáveis que representam alguma população e é necessário explicar y em termos de x ou dito de outra forma estudar como y varia com variações de x Por exemplo y é a produção de cenoura e x é a quantidade de fertilizantes y é o salário e x representa anos de estudo y é a criminalidade em uma região e x o número de policiais Algumas questão são colocadas 1 como nunca há uma relação exata entre duas variáveis como considerar outros fatores que afetam y 2 qual é a relação funcional entre y e x 3 como é possível ter certeza em se estabelecer uma condição ceteris paribus entre y e x Econometria Modelo de Regressão Simples A partir da determinação se existe ou não uma correlação entre um conjunto de pares de dados se torna necessário encontrar a equação da reta que melhor se ajusta aos dados amostrais emparelhados Essa equação descreve algebricamente a relação entre duas variáveis A reta de melhor ajuste é denominada reta de regressão e sua equação é denominada equação de regressão A definição de uma reta de regressão é Dada uma coleção de dados amostrais emparelhados a equação de regressão 𝑦 𝛽0 𝛽1𝑥 descreve algebricamente a relação entre as duas variáveis x e y O gráfico da equação de regressão é a reta de melhor ajuste ou reta de mínimos quadrados Econometria Modelo de Regressão Simples É possível determinar uma equação que relaciona y e x 𝑦 𝛽0 𝛽1𝑥 𝑢 Essa equação é válida para a população em interesse e define o modelo de regressão linear simples ou modelo de regressão linear simples de duas variáveis Quando relacionadas y e x assumem designações distintas y é chamada de variável dependente ou variável explicada ou variável de resposta ou variável prevista ou regressando x é chamada de variável independente ou variável explicativa ou variável de controle ou variável previsora ou regressor A variável u é chamada de termo de erro ou perturbação da relação e representa outros fatores além de x que afetam y Se os demais fatores em u são mantidos fixos 𝑢 0 então x tem um efeito linear sobre y ou seja 𝑦 𝛽1𝑥 𝑠𝑒 𝑢 0 Econometria Modelo de Regressão Simples Assim a variação em y é 𝛽1 multiplicado pela variação de x 𝛽1 é o parâmetro de inclinação da relação entre y e x mantendo fixos os outros fatores em u Dessa forma dada uma coleção de dados amostrais emparelhados a equação de regressão 𝑦 𝛽0 𝛽1𝑥 μ Descreve algebricamente a relação entre as duas variáveis x e y O gráfico da equação de regressão é chamado de reta de regressão ou reta de melhor ajuste ou reta de mínimos quadrados A explicação anterior mostra a equação típica da reta 𝑦 𝑚𝑥 𝑏 é expressa na forma 𝑦 𝛽0 𝛽1𝑥 onde 𝛽0 é o intercepto y isto é a interseção da reta com o eixo y e 𝛽1 é a inclinação da reta ou coeficiente angular Econometria Modelo de Regressão Simples A inclinação 𝛽1 e o intercepto 𝛽0 podem ser encontrados usandose as seguintes fórmulas 𝛽1 𝑛σ 𝑥𝑦σ 𝑥σ 𝑦 𝑛σ 𝑥2σ 𝑥2 𝛽0 σ 𝑦σ 𝑥2σ 𝑥σ 𝑥𝑦 𝑛σ 𝑥2σ 𝑥2 Uma vez que 𝛽1 𝑒 𝛽0 forem calculados é possível identificar a equação de regressão estimada que tem a seguinte propriedade A reta de regressão é a que melhor se ajusta aos dados amostrais Econometria Modelo de Regressão Simples Uma outra maneira de determinar o valor da inclinação 𝛽1 e o intercepto 𝛽0 é 𝐴 𝑖𝑛𝑐𝑙𝑖𝑛𝑎çã𝑜 𝛽1 𝑟 𝑠𝑦 𝑠𝑥 onde 𝑠𝑦 𝑒 𝑠𝑥 𝑠ã𝑜 𝑜𝑠 𝑑𝑒𝑠𝑣𝑖𝑜𝑠 𝑝𝑎𝑑𝑟𝑜𝑒𝑠 𝑑𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒 𝑑𝑒 𝑥 𝑒 𝑦 𝑂 𝑖𝑛𝑡𝑒𝑟𝑐𝑒𝑝𝑡𝑜 𝛽0 ത𝑦 𝛽1 ҧ𝑥 Onde ഥ𝑦 𝑒 ҧ𝑥 são as médias aritméticas de y e x Por sua vez o desviopadrão de uma conjunto de dados amostrais é 𝐷𝑃 σ𝑖1 𝑛 𝑥 ҧ𝑥2 𝑛1 Econometria Modelo de Regressão Simples Voltemos ao exemplo do preço da pizza e o valor da tarifa do metrô em NY Os dados são Utilizando as fórmulas dos slides anteriores temos 𝛽0 0346 𝑒 𝛽1 0945 Dessa forma a equação que melhor explica a relação entre as duas variáveis é 𝑦 00346 0945𝑥 𝜇 Onde 𝜇 é o termo de erro que representa outros fatores além de x que afetam y Pizza 015 035 100 125 175 200 Metrô 015 035 100 135 150 200 Econometria Modelo de Regressão Simples As equações de regressão podem ser úteis para a predição previsão do valor de uma variável dado algum valor particular da outra variável Para isso devemos considerar É possível usar a equação de regressão para previsão apenas se o gráfico da reta de regressão no diagrama confirmar que a reta de regressão se ajusta os dados Usar a equação de regressão para previsões apenas se o coeficiente de correlação linear r indicar que há uma correlação linear entre as duas variáveis Usar a equação de regressão para predições apenas se os dados não forem muito além dos dados amostrais disponíveis Caso as respostas a estas três considerações a equação de regressão se torna um bom modelo Diante disso basta substituir o valor dado de x na equação de regressão 𝑦 𝛽0 𝛽1𝑥 Econometria Modelo de Regressão Simples Assim considerando a equação de regressão 𝑦 00346 0945𝑥 Qual seria o preço da tarifa do metrô caso o preço da fatia de pizza de queijo for igual a 225 Substituindo na equação de regressão temos 𝑦 00346 0945 225 𝑦 00346 213 𝑦 216
Envie sua pergunta para a IA e receba a resposta na hora
Texto de pré-visualização
Econometria A natureza da Econometria A econometria é baseada no desenvolvimento de métodos estatísticos para estimar as relações econômicas testar teorias avaliar e implementar políticas de governo e de negócios A econometria se desenvolveu de forma separada da estatística porque enfoca problemas inerentes à coleta e à análise de dados econômicos não experimentais Dados não experimentais não são acumulados por meio de experimentos controlados de indivíduos firmas ou segmentos da sociedade o pesquisador é um coletor passivo de dados Os métodos econométricos são relevantes quando temos em mente uma relação que apresenta alguma importância para decisões de negócios ou análises de políticas públicas Econometria Como se estrutura uma análise econométrica O primeiro passo é a formulação da questão de interesse do pesquisador Por exemplo Estudar os efeitos dos gastos em campanhas políticas sobre os resultados de eleições ou A relação entre o tempo de estudo com o salário pago Em alguns casos é necessário construir um modelo econômico Um modelo econômico consiste em equações matemáticas que descrevem várias relações É necessário a construção de um modelo econométrico Os modelos econométricos são modelos observacionais que permitem estimar rapidamente as tendências econômicas futuras Para isso são utilizados dados do presente e do passado Econometria A estrutura dos dados econométricos Os dados econométricos apresentamse em vários tipos Os mais importantes e mais usados são Dados de corte transversal crosssection Um conjunto de dados de corte transversal consiste em uma amostra de indivíduos consumidores empresas cidades estados países ou uma variedade de outras unidades tomada em um determinado ponto no tempo Análise de dados de secção transversal geralmente consiste em comparar as diferenças entre os indivíduos Em uma análise de dados de corte transversal na coleta de dados são ignoradas quaisquer diferenças de tempo não importantes Uma característica importante dos dados de corte transversal é que não é possível considerar que eles foram obtidos por amostragem aleatória da população A ordenação dos dados não importa para a análise econométrica de dados de corte transversal Econometria Estrutura dos dados econométricos Dados de séries temporais Um conjunto de dados de séries temporais consiste em observações sobre uma variável ou muitas variáveis ao longo do tempo Como eventos passados podem influenciar eventos futuros e como nas ciências sociais as defasagens do comportamento são prevalecentes o tempo é uma dimensão importante em um conjunto de dados de séries temporais Diferentemente do arranjo dos dados de corte transversal a ordenação cronológica das observações em uma série temporal transmite informações importantes Uma característica importante dos dados de série temporal que torna essa análise mais difícil do que os dados de corte transversal é que raramente é possível assumir que as observações são independentes ao longo do tempo Outra característica dos dados de série temporais é a frequência dos dados na qual eles são coletados Muitas séries temporais exibem um forte padrão sazonal Econometria Estrutura dos dados econométricos Cortes transversais agrupados Alguns conjuntos de dados tem tanto características de corte transversal quanto de séries temporais Agrupar cortes transversais de diferentes períodos é frequentemente um modo eficaz de analisar os efeitos de uma política pública O propósito é coletar dados de anos anteriores e posteriores relacionados a uma mudança de política governamental A análise de um corte transversal agrupado é bastante parecida com a de um corte transversal padrão exceto pelo fato de que é necessário muitas vezes considerar diferenças periódicas das variáveis ao longo do tempo Econometria Estrutura dos dados econométricos Dados em painel ou dados longitudinais Um conjunto de dados em painel ou dados longitudinais consiste em uma série temporal para cada registro do corte transversal do conjunto de dados A característica essencial dos dados em painel que os distingue dos dados de corte transversal agrupado é que as mesmas unidades do corte transversal indivíduos empresas ou municípios por exemplo são acompanhados ao longo de um determinado período Como os dados em painel requerem a repetição das mesmas unidades ao longo do tempo os conjuntos de dados em painel são mais difíceis de obter que os cortes transversais agrupados O uso de mais de uma observação pode facilitar a inferência causal em situação em que inferir causalidade é mais difícil se somente um único corte transversal estiver disponível Os dados em painel permitem estudar a importância das defasagens do comportamento Econometria Exemplo de análise econométrica O modelo econômico do crime proposto por Gary Becker Como descrever a participação de um indivíduo no crime Crimes tem recompensas econômicas evidentes mas também o comportamento criminoso tem custos O custo de oportunidade do crime impede que o criminoso participe de outras atividades Existem custos associados com a possibilidade de ser capturado e se condenado existem custos associados com o cumprimento da pena A questão proposta por Gary Becker é que a decisão de empreender a atividade ilegal é uma decisão de alocação de recursos com os benefícios e custos das atividades concorrentes sendo consideradas Econometria O modelo econômico do crime Gary Becker É possível construir uma equação que descreve a quantidade de tempo gasto na atividade criminosa como uma função de vários fatores 𝑦 𝑓𝑥1 𝑥2 𝑥3 𝑥4 𝑥5 𝑥6 𝑥7 onde y horas gastas na atividade criminosa X1 salário por hora ocupada na atividade criminosa X2 saláriohora em emprego legal X3 renda de outras atividades X4probabilidade de ser capturado X5probabilidade de ser condenado caso capturado X6sentença esperada se condenado X7idade Econometria Exemplo de análise econométrica O modelo econométrico pode ser 𝑐𝑟𝑖𝑚𝑒 𝛽0 𝛽1𝑠𝑎𝑙á𝑟𝑖𝑜𝑚 𝛽2𝑜𝑢𝑡𝑟𝑒𝑛𝑑𝑎 𝛽3𝑓𝑟𝑒𝑞𝑝𝑟𝑖𝑠 𝛽4𝑓𝑟𝑒𝑞𝑐𝑜𝑛𝑑 𝛽5𝑠𝑒𝑛𝑡𝑚𝑒𝑑 𝛽6𝑖𝑑𝑎𝑑𝑒 𝑢 A escolha dessas variáveis é determinada a partir de considerações sobre os dados O termo u contem fatores não observados tais como o salário da atividade criminosa o caráter a formação da família etc u é um termo de erro ou termo de perturbação As constantes 𝛽0 𝛽1 𝛽6 são os parâmetros do modelo econométrico e descrevem as direções e as influências da relação entre crime e fatores usados para determinar o crime no modelo Econometria Na maioria dos casos a análise econométrica começa pela especificação de um modelo econométrico sem maiores considerações de detalhes da criação do modelo A partir da especificação do modelo econométrico devem ser considerados tanto o raciocínio econômico quanto o senso comum Tendo sido especificado o modelo econométrico é possível formular hipóteses de interesse por exemplo A hipótese de que o 𝑠𝑎𝑙á𝑟𝑖𝑜𝑚 que poderia ser ganho no emprego legal não tem efeito sobre o comportamento criminoso assim 𝛽1 0 Uma análise requer dados e após os dados terem sido coletados os métodos econométricos são usados para estimar os parâmetros do modelo e formalmente testar as hipóteses Econometria Modelo de Regressão Simples Antes de entender como funciona o modelo de regressão simples devemos entender o que significa correlação entre dados amostrais emparelhados ou dados bivariados Correlação pode ser definida da seguinte maneira Existe uma correlação entre duas variáveis quando os valores de uma variável estão relacionados de alguma maneira com os valores da outra variável A partir da definição de correlação é possível introduzir o coeficiente de correlação linear r que é uma medida numérica da força da relação entre duas variáveis que representam dados quantitativos Econometria Modelo de Regressão Simples Antes de ser feita qualquer análise estatística é possível usar um diagrama de dispersão para explorar os dados visualmente É possível analisar um diagrama de dispersão em relação a quaisquer padrões distintos e em relação a valores atípicos que são pontos distantes do demais pontos Como estamos analisando uma correlação linear significa que em um diagrama de dispersão os pontos se aproximam do padrão de uma reta No próximo slide temos um exemplo de um diagrama de dispersão entre dados bivariados ou dados emparelhados os pontos alinhados tendem a se aproximar de um padrão de reta Econometria Modelo de Regressão Simples Diagrama de dispersão entre dados bivariados 20 15 10 05 00 20 15 10 05 00 C2 C1 Gráfico de Dispersão de C1 versus C2 Econometria Modelo de Regressão Simples Coeficiente de correlação linear r O coeficiente de correlação linear r mede a força da correlação linear entre valores quantitativos emparelhados bivariados de x e y em uma amostra O coeficiente de correlação linear r é também chamado de coeficiente de correlação do produto dos momentos de Pearson em homenagem ao matemático Karl Pearson 18571936 O coeficiente de correlação linear r é calculado pela fórmula 𝑟 𝑛σ 𝑥𝑦σ 𝑥σ 𝑦 𝑛σ 𝑥2σ 𝑥2 𝑛σ 𝑦2σ 𝑦2 Econometria Modelo de Regressão Simples Coeficiente de correlação linear r Na fórmula temos n número de pares de dados amostrais Σ A soma dos itens indicados Σx soma de todos os valores de x Σx2 Indica que cada valor de x deve ser elevado ao quadrado e então esses quadrados devem ser somados Σx2 indica que os valores de x devem ser somados e o total então deve ser elevado ao quadrado Σxy indica que cada valor de x deve primeiro ser multiplicado por seu correspondente valor de y Depois de obtidos todos esses produtos eles devem ser somados r coeficiente de correlação linear para dados amostrais ρ coeficiente de correlação linear para uma população de dados emparelhados Econometria Modelo de Regressão Simples Propriedades do coeficiente de correlação linear r O valor de r está sempre entre 1 e 1 inclusive 𝟏 𝒓 𝟏 O valor de r não é afetado pela escolha de x e y troque todos os valores de x pelos valores de y e o valor de r não mudará r mede a intensidade de uma relação linear Ele não é planejado para medir a intensidade de uma relação não linear r é muito sensível a valores atípicos no sentido de que um único valor atípico pode afetar significativamente seu valor Econometria Modelo de Regressão Simples Exercício Coeficiente de correlação linear r Verifique se é possível afirmar se há uma correlação entre o custo de uma fatia de pizza e a tarifa do metrô na cidade de New York no período determinado Vocês deverão a partir dessas informações calcular o coeficiente de correlação linear r e construir o diagrama de dispersão destes dados Ano 1960 1973 1986 1995 2002 2003 Fatia de pizza 015 035 100 125 175 200 Tarifa do metrô 015 035 100 135 150 200 IPC 302 483 1123 1622 1919 1978 Custo de uma fatia de pizza tarifa de metrô e inflação IPC Econometria Modelo de Regressão Simples Coeficiente de correlação linear r Interpretação do resultado Correlação C1 C2 Correlação de Pearson de C1 e C2 0988 ValorP 0000 Esses valores e o diagrama de dispersão foram calculados através do aplicativo estatístico Minitab 20 15 10 05 00 20 15 10 05 00 C2 C1 Gráfico de Dispersão de C1 versus C2 Econometria Modelo de Regressão Simples Coeficiente de correlação linear r Interpretação do resultado A partir dos resultados apresentados no slide anterior a questão é podemos afirmar que existe uma correlação entre o preço de uma fatia de pizza e a tarifa do metrô em New York A tabela do próximo slide apresenta os valores críticos do coeficiente de correlação de Pearson r para os níveis de significância iguais a 005 e 001 Para n 6 seis pares de dados e nível de significância α igual a 005 temos um valor crítico para r 0811 Isso significa que há uma chance de 5 de que r exceda o valor crítico Como o r encontrado foi r 0988 e o valor crítico é igual a 0811 é possível concluir que existe uma correlação entre o preço de uma fatia de pizza e a tarifa do metrô Também é possível analisar em relação ao valor P Como o valor P encontrado foi igual a 0 e se esse valor P for menor que o nível de significância α 005 podemos concluir que existe uma correlação entre os dados Econometria Modelo de Regressão Simples Coeficiente de correlação linear r Interpretação do resultado Pela tabela dos valores críticos do Coeficiente de Correlação r podese afirmar que há uma correlação linear se r exceder o valor encontrado na tabela r deve ser maior do que o valor da tabela ou menor que o simétrico do valor da tabela Para α 005 o valor critico tabelado é 0811 r 0988 então 0811 0988 0811 Há correlação Não há correlação Há correlação r 0811 r 0811 Econometria Modelo de Regressão Simples Coeficiente de correlação linear r O valor P apresentado no slide anterior mostra se os dados analisados fazem parte de uma distribuição normal ou não Caso 𝑃 𝛼 os dados não seguem uma distribuição normal Caso 𝑃 𝛼 os dados seguem uma distribuição normal É importante frisar que a correlação entre dados não significa uma causalidade entre os dados não é possível concluir que uma aumento no preço da fatia de pizza cause um aumento nas tarifas do metrô Ambos podem ser afetados por uma variável oculta ou seja variável não considerada Econometria Modelo de Regressão Simples Coeficiente de correlação linear r Teste de hipótese formal Um teste de hipótese formal é usado para se determinar se há ou não uma correlação linear significante entre duas variáveis Hipóteses 𝐻0 𝑝 0 𝑛ã𝑜 ℎá 𝑐𝑜𝑟𝑟𝑒𝑙𝑎çã𝑜 𝐻0 𝑝 0 ℎá 𝑐𝑜𝑟𝑟𝑒𝑙𝑎çã𝑜 Estatística de teste Tabela de valores críticos Se r valor crítico rejeita H0 e conclui que há evidência suficiente para apoiar a afirmativa de existência de uma correlação linear Se r valor crítico deixa de rejeitar H0 e conclui que não há evidência suficiente para apoiar a afirmativa de existência de uma correlação linear Econometria Modelo de Regressão Simples Coeficiente de correlação linear r Teste de hipótese formal Valor p Na estatística o valorp também chamado de nível descritivo ou probabilidade de significância é a probabilidade de se obter uma estatística de teste igual ou mais extrema que aquela observada em uma amostra sob a hipótese nula Se o valor p for menor do que ou igual ao nível de significância rejeite H0 e conclua que há evidência suficiente para apoiar a afirmativa da existência de correlação linear p α Se o valor p for maior do que o nível de significância deixe de rejeitar H0 e conclua que não há evidência suficiente para apoiar a afirmativa da existência de uma correlação linear p α Econometria Modelo de Regressão Simples Coeficiente de correlação linear r Teste de hipótese formal Hipóteses 𝐻0 𝑝 0 𝑛ã𝑜 ℎá 𝑐𝑜𝑟𝑟𝑒𝑙𝑎çã𝑜 𝐻1 𝑝 0 ℎá 𝑐𝑜𝑟𝑟𝑒𝑙𝑎çã𝑜 A estatística de teste t é 𝑡 𝑟 𝑛2 1𝑟2 Onde n 2 representa o grau de liberdade Calculando t e encontrando o valor p podese concluir se há evidência ou não de existência de correlação Econometria Modelo de Regressão Simples Modelos de análise econométrica começam com a seguinte premissa y e x são das variáveis que representam alguma população e é necessário explicar y em termos de x ou dito de outra forma estudar como y varia com variações de x Por exemplo y é a produção de cenoura e x é a quantidade de fertilizantes y é o salário e x representa anos de estudo y é a criminalidade em uma região e x o número de policiais Algumas questão são colocadas 1 como nunca há uma relação exata entre duas variáveis como considerar outros fatores que afetam y 2 qual é a relação funcional entre y e x 3 como é possível ter certeza em se estabelecer uma condição ceteris paribus entre y e x Econometria Modelo de Regressão Simples A partir da determinação se existe ou não uma correlação entre um conjunto de pares de dados se torna necessário encontrar a equação da reta que melhor se ajusta aos dados amostrais emparelhados Essa equação descreve algebricamente a relação entre duas variáveis A reta de melhor ajuste é denominada reta de regressão e sua equação é denominada equação de regressão A definição de uma reta de regressão é Dada uma coleção de dados amostrais emparelhados a equação de regressão 𝑦 𝛽0 𝛽1𝑥 descreve algebricamente a relação entre as duas variáveis x e y O gráfico da equação de regressão é a reta de melhor ajuste ou reta de mínimos quadrados Econometria Modelo de Regressão Simples É possível determinar uma equação que relaciona y e x 𝑦 𝛽0 𝛽1𝑥 𝑢 Essa equação é válida para a população em interesse e define o modelo de regressão linear simples ou modelo de regressão linear simples de duas variáveis Quando relacionadas y e x assumem designações distintas y é chamada de variável dependente ou variável explicada ou variável de resposta ou variável prevista ou regressando x é chamada de variável independente ou variável explicativa ou variável de controle ou variável previsora ou regressor A variável u é chamada de termo de erro ou perturbação da relação e representa outros fatores além de x que afetam y Se os demais fatores em u são mantidos fixos 𝑢 0 então x tem um efeito linear sobre y ou seja 𝑦 𝛽1𝑥 𝑠𝑒 𝑢 0 Econometria Modelo de Regressão Simples Assim a variação em y é 𝛽1 multiplicado pela variação de x 𝛽1 é o parâmetro de inclinação da relação entre y e x mantendo fixos os outros fatores em u Dessa forma dada uma coleção de dados amostrais emparelhados a equação de regressão 𝑦 𝛽0 𝛽1𝑥 μ Descreve algebricamente a relação entre as duas variáveis x e y O gráfico da equação de regressão é chamado de reta de regressão ou reta de melhor ajuste ou reta de mínimos quadrados A explicação anterior mostra a equação típica da reta 𝑦 𝑚𝑥 𝑏 é expressa na forma 𝑦 𝛽0 𝛽1𝑥 onde 𝛽0 é o intercepto y isto é a interseção da reta com o eixo y e 𝛽1 é a inclinação da reta ou coeficiente angular Econometria Modelo de Regressão Simples A inclinação 𝛽1 e o intercepto 𝛽0 podem ser encontrados usandose as seguintes fórmulas 𝛽1 𝑛σ 𝑥𝑦σ 𝑥σ 𝑦 𝑛σ 𝑥2σ 𝑥2 𝛽0 σ 𝑦σ 𝑥2σ 𝑥σ 𝑥𝑦 𝑛σ 𝑥2σ 𝑥2 Uma vez que 𝛽1 𝑒 𝛽0 forem calculados é possível identificar a equação de regressão estimada que tem a seguinte propriedade A reta de regressão é a que melhor se ajusta aos dados amostrais Econometria Modelo de Regressão Simples Uma outra maneira de determinar o valor da inclinação 𝛽1 e o intercepto 𝛽0 é 𝐴 𝑖𝑛𝑐𝑙𝑖𝑛𝑎çã𝑜 𝛽1 𝑟 𝑠𝑦 𝑠𝑥 onde 𝑠𝑦 𝑒 𝑠𝑥 𝑠ã𝑜 𝑜𝑠 𝑑𝑒𝑠𝑣𝑖𝑜𝑠 𝑝𝑎𝑑𝑟𝑜𝑒𝑠 𝑑𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒 𝑑𝑒 𝑥 𝑒 𝑦 𝑂 𝑖𝑛𝑡𝑒𝑟𝑐𝑒𝑝𝑡𝑜 𝛽0 ത𝑦 𝛽1 ҧ𝑥 Onde ഥ𝑦 𝑒 ҧ𝑥 são as médias aritméticas de y e x Por sua vez o desviopadrão de uma conjunto de dados amostrais é 𝐷𝑃 σ𝑖1 𝑛 𝑥 ҧ𝑥2 𝑛1 Econometria Modelo de Regressão Simples Voltemos ao exemplo do preço da pizza e o valor da tarifa do metrô em NY Os dados são Utilizando as fórmulas dos slides anteriores temos 𝛽0 0346 𝑒 𝛽1 0945 Dessa forma a equação que melhor explica a relação entre as duas variáveis é 𝑦 00346 0945𝑥 𝜇 Onde 𝜇 é o termo de erro que representa outros fatores além de x que afetam y Pizza 015 035 100 125 175 200 Metrô 015 035 100 135 150 200 Econometria Modelo de Regressão Simples As equações de regressão podem ser úteis para a predição previsão do valor de uma variável dado algum valor particular da outra variável Para isso devemos considerar É possível usar a equação de regressão para previsão apenas se o gráfico da reta de regressão no diagrama confirmar que a reta de regressão se ajusta os dados Usar a equação de regressão para previsões apenas se o coeficiente de correlação linear r indicar que há uma correlação linear entre as duas variáveis Usar a equação de regressão para predições apenas se os dados não forem muito além dos dados amostrais disponíveis Caso as respostas a estas três considerações a equação de regressão se torna um bom modelo Diante disso basta substituir o valor dado de x na equação de regressão 𝑦 𝛽0 𝛽1𝑥 Econometria Modelo de Regressão Simples Assim considerando a equação de regressão 𝑦 00346 0945𝑥 Qual seria o preço da tarifa do metrô caso o preço da fatia de pizza de queijo for igual a 225 Substituindo na equação de regressão temos 𝑦 00346 0945 225 𝑦 00346 213 𝑦 216