·

Economia ·

Econometria

Send your question to AI and receive an answer instantly

Ask Question

Recommended for you

Preview text

Roteiro para elaboração do trabalho de Econometria I Objetivo Aplicar os métodos econométricos a dados empíricos disponíveis por meio da estimação de modelos de regressão Estrutura O trabalho deve conter a seguinte estrutura i introdução breve ii referencial teórico breve iii metodologia breve focada na construção do modelo e detalhamento da fonte de dados iv resultados com os seguintes itens para análise a estatísticas descritivas b matriz de correlação simples c modelo estimado d análise do modelo coeficientes testes de hipótese e violação dos pressupostos Dados Os dados podem ser de corte transversal ou série de tempo Um painel pode até ser empreendido mas como seus dados são mais difíceis de compilar não será exigido Componentes até 4 discentes Entrega até 5 de julho de 2024 NOME DA UNIVERSIDADE NOME DA MATÉRIA NOME DO ALUNO Análise da Renda Familiar Modelagem e Avaliação dos Pressupostos da Regressão Linear CIDADE 2024 Sumário 1 Introdução2 2 Referencial Teórico3 3 Metodologia4 4 Resultados5 41 Estatística Descritiva5 42 Matriz de Correlação7 43 Modelo Estimado8 431 Multicolineariedade10 432 Pressuposto de Normalidade11 433 Pressuposto de Independência12 434 Pressuposto de Homocedasticidade12 5 Conclusão13 Referências14 1 Introdução A análise das determinantes do rendimento no trabalho é importante para entender as desigualdades econômicas e sociais em uma sociedade De acordo com Gomes Souza no contexto brasileiro as características demográficas e ocupacionais dos trabalhadores desempenham um papel fundamental na determinação dos rendimentos Sendo assim este estudo utiliza dos dados da Pesquisa Nacional por Amostra de Domicílios Contínua PNAD Contínua para investigar se fatores como gênero idade raça anos de estudo horas trabalhadas número de pessoas no domicílio e tipo de ocupação influenciam a renda per capita Para abordar esta questão utilizouse de Modelo de Regressão Linear Múltipla MRLM Esta abordagem econométrica nos permitirá quantificar o impacto marginal de cada variável explicativa sobre a renda per capita As variáveis independentes consideradas neste estudo são mulher idade negro anos de estudo horas trabalhadas renda do trabalho principal número de pessoas no domicílio e tipo de ocupação O MRLM é adequado para esta análise porque nos ajuda a identificar quais características têm maior influência na renda per capita e como essas influências variam entre diferentes grupos demográficos e ocupacionais 2 Referencial Teórico De acordo com Vieira 2017 o estado de Minas Gerais uma das maiores unidades federativas do Brasil destacase por sua heterogeneidade econômica apresentando tanto regiões altamente desenvolvidas quanto áreas menos favorecidas Esta variabilidade torna o estado um cenário ideal para estudar as determinantes do rendimento no trabalho permitindo uma análise mais próxima da realidade sobre desigualdades econômicas A diversidade econômica e social presente em Minas Gerais proporciona um ambiente rico para a investigação dos fatores que influenciam a renda per capita dos seus moradores destacando a importância de considerar múltiplas variáveis demográficas e ocupacionais na análise Em seus estudos Figueiredo Filho 2011 definiu a Regressão Linear Múltipla como uma técnica estatística utilizada para examinar a relação entre uma variável dependente e múltiplas variáveis independentes Matematicamente ela é expressa como Y iβ0β1 X1β2 X2βn X nϵ i Onde Y i é o valor estimado da variável dependente variável de interesse do estudo β0 é a estimativo do intercepto da reta de regressão β1 β2 βn são os parâmetros do modelo estimado cada parâmetro expressa o efeito que a variável independente tem sobre a variável dependente X1 X2 Xn São as variáveis independentes utilizadas para prever a variável dependente ϵ i é o termo de erro associado à iésima observação Segundo Farah 2014 os pressupostos da Regressão Linear Múltipla incluem a linearidade da relação entre a variável dependente Y e as variáveis independentes Xi s assegurando que essa relação é linear ao longo do intervalo de dados analisado Além disso é assumido que as observações são independentes entre si garantindo que os resultados de uma observação não influenciem os resultados de outras A homocedasticidade é uma condição em que a variância dos erros ϵ i permanece constante para todas as observações o que é crucial para a precisão das inferências estatísticas Os erros são também supostos seguir uma distribuição normal e sejam independentes facilitando a aplicação de testes estatísticos apropriados Outro pressuposto importante é a ausência de multicolinearidade que implica que as variáveis independentes não estão altamente correlacionadas entre si evitando problemas na interpretação dos coeficientes estimados Por outro lado a Regressão Linear Múltipla possui limitações De acordo com Carvalho 2015 ela pode não capturar relações não lineares entre as variáveis limitando sua capacidade de modelar comportamentos complexos nos dados Se variáveis importantes forem omitidas do modelo pode ocorrer viés nos resultados comprometendo a validade das conclusões tiradas Além disso problemas de multicolinearidade quando as variáveis independentes estão fortemente correlacionadas podem afetar a precisão das estimativas dos coeficientes dificultando a distinção dos efeitos individuais das variáveis explicativas sobre a variável dependente 3 Metodologia Utilizando dados da Pesquisa Nacional por Amostra de Domicílios Contínua PNAD Contínua este estudo busca identificar os fatores que influenciam a renda per capita dos moradores de Minas Gerais A abordagem econométrica de Regressão Linear Múltipla será empregada para quantificar o impacto de diversas variáveis explicativas sobre a renda per capita O software R será utilizado para encontrar os parâmetros estimados do modelo proposto As variáveis independentes consideradas neste estudo incluem gênero idade raça anos de estudo horas trabalhadas renda do trabalho principal número de pessoas no domicílio e tipo de ocupação A modelagem será feita pela seguinte equação ln r fpcβ0β1mulhe riβ2idad ei β3negr oi β4 renda piβ5 anosest iβ5horas piβ6npesβ7 posocupaçãoϵ i A definição das variáveis será apresentada na Tabela 1 abaixo Variáveis Descrição Rfpc Renda familiar per capita mulher 1 se mulher 0 se homem Idade Idade em anos negro 1 se negro ou pardo 0 caso contrário Rendap Rendimento no trabalho principal Anosest Número de anos de estudo Horas Número de horas trabalhadas na semana Npes Número de pessoas no domicílio posocupação 1 se com carteira 2 se sem carteira 3 se contaprópria 4 se empregador 5 se militar e 6 se funcionário público Tabela 1 Descrição das variáveis 4 Resultados 41 Estatística Descritiva Neste subcapítulo apresentase uma análise estatística descritiva dos dados coletados da Pesquisa Nacional por Amostra de Domicílios Contínua PNAD Contínua focando nas variáveis que influenciam a renda per capita familiar dos moradores do Estado de Minas Gerais Os resultados são apresentados na Tabela 2 abaixo que inclui dados quantitativos como renda familiar per capita idade média horas trabalhadas semanalmente entre outros além das categorias qualitativas como tipo de ocupação Tabela 2 Resumo Estatístico dos dados quantitativos Posição de Ocupação Grupo 1 Com carteira assinada 586 participantes Grupo 2 Sem carteira assinada 396 participantes Grupo 3 Por conta própria 332 participantes Grupo 4 Empregadores 87 participantes Grupo 5 Militares 3 participantes Grupo 6 Funcionários públicos 100 participantes Os dados da Tabela 2 revelam uma distribuição variada da renda familiar per capita RFPC entre os participantes da pesquisa A mediana de R 27708 indica que metade das famílias apresenta um rendimento per capita abaixo desse valor enquanto a média mais elevada de R 48693 sugere a presença de valores extremos na amostra como o máximo de R 1166000 Cerca de 41 dos participantes são mulheres com uma idade média de aproximadamente 36 anos e uma predominância de 52 de indivíduos identificados como negros ou pardos Esta análise fornece uma visão abrangente das características demográficas e socioeconômicas dos participantes da pesquisa Os dados quantitativos revelam uma variedade significativa nos rendimentos e condições de trabalho dos entrevistados enquanto as categorias qualitativas destacam a diversidade de ocupações presentes no estudo Esses resultados são importantes para compreender as dinâmicas socioeconômicas dos entrevistados e podem subsidiar políticas públicas voltadas para a equidade e inclusão social no Brasil 42 Matriz de Correlação A representação da matriz de correlação pode ser observada na Figura 1 Nesta figura tons mais escuros de azul indicam correlações positivas mais fortes entre as variáveis enquanto tonalidades mais avermelhadas indicam correlações negativas mais intensas Figura 1 Representação gráfica da matriz de correlação Com base na análise da matriz de correlação destacase as principais relações entre as variáveis estudadas A renda per capita familiar rfpc mostrouse fortemente correlacionada positivamente com a renda individual rendap indicando que famílias com maiores rendas individuais tendem a apresentar uma maior renda per capita ρ072 Por outro lado observouse uma correlação negativa moderada entre o número de pessoas no domicílio npes e a renda per capita ρ019 sugerindo que famílias com mais membros tendem a ter uma renda per capita menor A idade e os anos de estudo anosest exibiram uma correlação positiva moderada ρ037 revelando que indivíduos mais velhos tendem a possuir um nível educacional mais elevado Em contraste variáveis como gênero mulher e horas trabalhadas por semana horasp mostraram correlações próximas de zero com a renda per capita indicando uma influência limitada no contexto estudado A etnia negro apresentou uma correlação negativa moderada ρ015 com a renda per capita sugerindo que famílias autodeclaradas como negras tendem a ter uma renda per capita ligeiramente inferior 43 Modelo Estimado O modelo estimado foi Modelo de Regressão Linear Multiplo Dependent variable logrfpc mulher 0028 0036 idade 0012 0001 negro 0124 0034 rendap 00003 000002 anosest 0086 0005 horasp 0002 0001 npes 0127 0011 posocupacao2 0101 0043 posocupacao3 0025 0046 posocupacao4 0241 0078 posocupacao5 0339 0365 posocupacao6 0057 0070 Constant 5105 0112 Observations 1504 R2 0533 Adjusted R2 0529 Residual Std Error 0629 df 1491 F Statistic 141556 df 12 1491 Note p01 p005 p001 Primeiramente foi realizada uma análise para verificar a significância do modelo ou seja sua capacidade de explicar as variações na variável dependente Utilizouse o teste F para esta avaliação onde a hipótese nula sugere que o modelo não é significativo enquanto a hipótese alternativa afirma que o modelo é significativo O resultado do teste F mostrou um pvalor próximo de zero permitindonos rejeitar a hipótese nula Isso indica que o modelo é significativo evidenciando que pelo menos uma das variáveis independentes é capaz de explicar as variações na variável dependente Considerando um nível de significância de 5 os resultados do modelo indicam que variáveis como idade renda anos de estudo anosest número de pessoas na família npes e algumas posições ocupacionais têm impacto significativo na renda per capita familiar A idade e a renda apresentam coeficientes positivos significativos indicando que quanto maior a idade e a renda familiar maior tende a ser a renda per capita Por outro lado ser negro apresenta uma correlação negativa significativa com a renda per capita sugerindo que a etnia pode influenciar negativamente nesse aspecto Algumas variáveis de posição ocupacional também mostraram impacto significativo com posições específicas contribuindo positiva ou negativamente para a renda per capita conforme os coeficientes estimados No entanto variáveis como gênero e horas de trabalho semanais não apresentaram impacto estatisticamente significativo na renda per capita familiar neste modelo O coeficiente de determinação R 2 do modelo é uma medida que indica a proporção da variabilidade da variável dependente renda per capita familiar rfpc que é explicada pelas variáveis independentes incluídas no modelo No caso específico deste modelo de regressão linear múltipla o R 2 é de aproximadamente 0533 Isso significa que aproximadamente 533 da variabilidade da renda per capita familiar pode ser explicada pelas variáveis mulher idade negro renda pessoal anos de estudo horas trabalhadas por semana número de pessoas na família e posição de ocupação Em termos simples o modelo consegue explicar uma parte significativa das variações observadas na rfpc com base nessas variáveis independentes Sendo assim será analisado se o modelo satisfaz os pressupostos necessários 431 Multicolineariedade Os valores de VIF Variance Inflation Factor e GVIF Generalized VIF fornecem informações sobre a multicolinearidade entre as variáveis independentes no modelo de regressão A Tabela 3 mostra quais foram os valores encontrados no modelo Tabela 3 Valores do VIF do modelo Valores de VIF próximo de 1 indica que não há multicolinearidade significativa Já o GVIFRaiz é usada para calcular a inflação da variância considerando o número de graus de liberdade Df valores próximos a 1 indicam baixa multicolinearidade enquanto valores mais altos indicam maior potencial de multicolinearidade Com base nos valores da Tabela 3 podese concluir que não há evidências significativas de multicolinearidade entre as variáveis independentes no modelo de regressão analisado Isso é indicado pelos valores de VIF que estão bem abaixo dos limites críticos e pelo fato de GVIFRaiz estar próximo de 1 para todas as variáveis indicando baixa inflação da variância devido à multicolinearidade Isso significa que os coeficientes estimados no modelo de regressão são confiáveis e as interpretações dos efeitos das variáveis independentes na variável dependente rfpc podem ser consideradas robustas 432 Pressuposto de Normalidade O teste de normalidade como o ShapiroWilk é uma ferramenta estatística importante para avaliar se os resíduos do modelo seguem uma distribuição normal A hipótese nula desse teste afirma que os resíduos são normalmente distribuídos Em contrapartida a hipótese alternativa sugere que os resíduos não são normalmente distribuídos Será utilizado o teste de ShapiroWilk para avaliar a normalidade dos resíduos Os resíduos são diferenças entre os valores observados e os valores preditos pelo modelo de regressão Se os resíduos não seguem uma distribuição normal isso pode comprometer a validade das inferências feitas com base no modelo Com um pvalor inferior a 005 e uma significância de 5 rejeitase a hipótese nula indicando que o modelo proposto não atende ao pressuposto de normalidade dos resíduos 433 Pressuposto de Independência O teste de DurbinWatson é uma ferramenta estatística utilizada para verificar a presença de autocorrelação nos resíduos de um modelo de regressão Autocorrelação ocorre quando os erros não são independentes entre si ao longo das observações o que pode comprometer a validade das inferências feitas com base no modelo A hipótese nula do teste de DurbinWatson é que não há autocorrelação nos resíduos ou seja eles são independentes Por outro lado a hipótese alternativa sugere a presença de autocorrelação indicando que os resíduos estão correlacionados de alguma maneira Como o pvalor do teste DW foi maior que 005 com 5 de significância não há evidência suficiente para rejeitar a hipótese nula logo podese concluir que os resíduos do modelo satisfazem o pressuposto de independência 434 Pressuposto de Homocedasticidade O teste de homocedasticidade é crucial na análise de modelos de regressão para verificar se a variância dos resíduos é constante em relação às variáveis independentes Essa suposição é fundamental para a correta interpretação das estimativas dos parâmetros e para a validade das inferências feitas a partir do modelo A hipótese nula do teste de homocedasticidade como realizado pelo teste de Breusch Pagan BP postula que a variância dos resíduos é constante homocedástica para todas as observações independentemente dos valores das variáveis explicativas incluídas no modelo Em contrapartida a hipótese alternativa sugere que existe heterocedasticidade ou seja a variância dos resíduos varia de acordo com as variáveis independentes O teste BreuschPagan resultou pvalor muito baixo indicando forte evidência contra a hipótese nula de homocedasticidade dos resíduos Isso sugere que a variância dos resíduos não é constante em relação às variáveis independentes do modelo de regressão 5 Conclusão Com base nos resultados obtidos neste trabalho podemos concluir que o modelo de regressão proposto apresentou significância estatística conforme evidenciado pelo teste F com pvalor significativamente baixo Isso indica que pelo menos uma das variáveis independentes é capaz de explicar as variações na variável dependente renda per capita familiar Além disso o coeficiente de determinação R 2 foi de aproximadamente 0533 o que significa que cerca de 533 da variabilidade na renda per capita familiar pode ser explicada pelas variáveis incluídas no modelo Analisando os pressupostos da regressão identificamos que os resíduos não atenderam ao pressuposto de normalidade conforme indicado pelo teste de Shapiro Wilk Isso sugere que os resíduos não seguem uma distribuição normal o que pode afetar a validade das inferências estatísticas realizadas Quanto à multicolinearidade verificamos que as variáveis no modelo não apresentaram problemas significativos conforme indicado pelos valores VIF E foi verificado que os resíduos satisfazem o pressuposto de independência pelo teste de Durbin Watson por outro lado o teste de BreuschPagan indicou que os resíduos não apresentam homocedasticidade sugerindo que a variância dos resíduos não é constante em relação às variáveis independentes do modelo Esses resultados destacam a importância de considerar cuidadosamente os pressupostos da regressão linear ao interpretar os resultados bem como a necessidade de cautela ao realizar inferências sobre a relação entre as variáveis no contexto estudado Referências FARAH Jaqueline Medeiros A diminuição da geração de finos na granulação uma aplicação da Análise de Regressão Linear Múltipla como ferramenta de apoio para a solução de problemas não estruturados na indústria 2014 FIGUEIREDO FILHO Dalson et al O que fazer e o que não fazer com a regressão pressupostos e aplicações do modelo linear de Mínimos Quadrados Ordinários MQO Revista Política Hoje v 20 n 1 2011 FIGUEIREDO FILHO Dalson et al Regressão logística em ciência política Texto preparado como material complementar do curso de Tópicos Avançados de Metodologia de Pesquisa ministrado pelo prof Enivaldo Rocha no Departamento de Ciência Política da Universidade Federal de Pernambuco 2015 GOMES Magno Rogério SOUZA Solange de Cassia Inforzato de Assimetrias salariais de gênero ea abordagem regional no Brasil uma análise segundo a admissão no emprego e setores de atividade Revista de Economia Contemporânea v 22 n 3 p e182234 2019 VIEIRA Michelle Aparecida Efeitos das transferências intergovernamentais na redução das desigualdades e na promoção do desenvolvimento socioeconômico das regiões brasileiras 2017