·

Ciências Econômicas ·

Econometria

Send your question to AI and receive an answer instantly

Ask Question

Preview text

TRABALHO FINAL DE APLICAÇÃO 10 DA NOTA FINAL Vence 1 de julho de 2024 às 2359 Fecha 1 de julho de 2024 às 2359 Instruções Trabalho de Aplicação Grupo de até três componentes 1 Um ou dois parágrafos com a revisão de literatura teórica que fundamenta as hipóteses ou pressupostos do exercício econométrico de aplicação È obrigatório fazer citação indireta baseada nas Referências Bibliográficas utilizadas listadas ao final do trabalho A citação e referência bibliográfica deve ser feita conforme ABNT consultar o Manual de Trabalhos Acadêmicos da UDESC 2 Descrever o modelo econométrico explicitando a equação a ser estimada e descrevendo os seus componentes e os resultados esperados conforme as hipóteses ou pressupostos 3 Descrever a fonte de dados e o método escolhido para a estimativa bem como os testes que serão aplicados Utilizar o Gujarati ou qualquer outro livro da Bibliografia da disciplina para fundamentar 4 Estimar os resultados e analisálos conforme inferência e testes propostos A formatação de espaços fonte da letra parágrafos figuras e tabelas deve seguir o Manual de Trabalhos Acadêmicos da UDESC PONTOS Sem pontos O trabalho deve ser entregue em word ou pdf Critérios de Avaliação 10 Apresentação e adequação a norma apresentação de trabalhos acadêmicos 20 Descrição completa do modelo econométrico 20 Descrição da fonte de dados e metodologia incluindo os testes a serem aplicados 50 A correta e completa análise dos resultados NOME DA UNIVERSIDADE NOME DA MATÉRIA NOME DO ALUNO Análise Econométrica das Determinantes do Rendimento no Trabalho no Brasil Uma Abordagem com Regressão Linear Múltipla Regressão Probit e Análise de Componentes Principais CIDADE 2024 Sumário 1 Introdução3 11 Objetivo do Estudo4 2 Referencial Teórico4 21 Modelos Econométricos4 211 Regressão Linear Multipla5 212 Regressão Probit6 213 Análise de Componentes Principais PCA7 3 Metodologia7 31 Modelo de Regressão Linear Múltiplo8 32 Modelo de Regressão Probit8 33 Análise de Componentes Principais PCA8 4 Resultados9 41 Regressão Linear Multipla9 411 Multicolineariedade11 412 Normalidade dos Resíduos11 413 Independência dos Resíduos13 414 Homocedasticidade13 415 Conclusão14 42 Modelo Probit15 43 Análise dos Componentes Principais16 5 Conclusão17 Referências18 1 Introdução A análise das determinantes do rendimento no trabalho é importante para entender as desigualdades econômicas e sociais em uma sociedade No contexto brasileiro as características demográficas e ocupacionais dos trabalhadores desempenham um papel fundamental na determinação dos rendimentos Este estudo utiliza dados da Pesquisa Nacional por Amostra de Domicílios Contínua PNAD Contínua para investigar como fatores como gênero idade raça horas trabalhadas e tipo de ocupação influenciam o rendimento no trabalho principal Para abordar esta questão utilizamos três abordagens econométricas distintas a Regressão Linear Múltipla a Regressão Probit e a Análise de Componentes Principais PCA Cada uma dessas metodologias oferece uma perspectiva distinta sobre os dados e ajuda a revelar diferentes aspectos das relações entre as variáveis Primeiramente a Regressão Linear Múltipla é empregada para quantificar o impacto marginal de cada variável explicativa sobre o rendimento no trabalho principal Esta técnica permite identificar quais características têm maior influência nos rendimentos e como essas influências variam entre diferentes grupos demográficos e ocupacionais Em seguida a Regressão Probit é utilizada para modelar a probabilidade de um trabalhador ter carteira assinada um indicador importante de formalidade no emprego e frequentemente de maiores rendimentos e benefícios Este modelo é particularmente útil para entender os fatores que determinam a formalidade no mercado de trabalho brasileiro o que tem implicações diretas para políticas públicas de emprego Por fim a Análise de Componentes Principais PCA é aplicada para reduzir a dimensionalidade dos dados e identificar os principais padrões subjacentes nas características demográficas e ocupacionais A PCA facilita a visualização e interpretação dos dados permitindo uma compreensão mais profunda das estruturas latentes que influenciam os rendimentos Ao combinar essas três abordagens este estudo fornece uma análise abrangente das determinantes dos rendimentos no trabalho no Brasil Buscouse com esse trabalho contribuir para a literatura existente ao oferecer resultados sobre como diferentes fatores interagem para influenciar os rendimentos bem como ao identificar padrões estruturais importantes no mercado de trabalho brasileiro Além disso as conclusões deste estudo têm implicações significativas para o desenvolvimento de políticas públicas voltadas para a redução das desigualdades econômicas e a promoção de um mercado de trabalho mais equitativo e inclusivo 11 Objetivo do Estudo Estimar os determinantes do rendimento no trabalho principal utilizando a Regressão Linear Múltipla Analisar os fatores que influenciam a probabilidade de um trabalhador ter carteira assinada por meio da Regressão Probit Identificar padrões subjacentes nas características demográficas e ocupacionais dos trabalhadores utilizando a Análise de Componentes Principais 2 Referencial Teórico De acordo com Vieira 2017 o estado de Minas Gerais uma das maiores unidades federativas do Brasil destacase por sua heterogeneidade econômica apresentando tanto regiões altamente desenvolvidas quanto áreas menos favorecidas Esta variabilidade torna o estado um cenário ideal para estudar as determinantes do rendimento no trabalho permitindo uma análise rica e detalhada sobre desigualdades econômicas Utilizando dados da Pesquisa Nacional por Amostra de Domicílios Contínua PNAD Contínua este estudo examina os fatores que influenciam os rendimentos dos trabalhadores em Minas Gerais focando em três abordagens econométricas Regressão Linear Múltipla Regressão Probit e Análise de Componentes Principais PCA 21 Modelos Econométricos Para alcançar os objetivos propostos utilizaremos o software STATA para conduzir as análises econométricas As especificações dos modelos seus pressupostos e limitações são detalhados a seguir 211 Regressão Linear Multipla Em seus estudos Figueiredo Filho 2011 definiu a Regressão Linear Múltipla como uma técnica estatística utilizada para examinar a relação entre uma variável dependente e múltiplas variáveis independentes Matematicamente ela é expressa como Y iβ0β1 X1β2 X2βn X nϵ i Onde Y i é o valor estimado da variável dependente variável de interesse do estudo β0 é a estimativo do intercepto da reta de regressão β1 β2 βn são os parâmetros do modelo estimado cada parâmetro expressa o efeito que a variável independente tem sobre a variável dependente X1 X2 Xn São as variáveis independentes utilizadas para prever a variável dependente ϵ i é o termo de erro associado à iésima observação Segundo Farah 2014 os pressupostos da Regressão Linear Múltipla incluem a linearidade da relação entre a variável dependente Y e as variáveis independentes Xi s assegurando que essa relação é linear ao longo do intervalo de dados analisado Além disso é assumido que as observações são independentes entre si garantindo que os resultados de uma observação não influenciem os resultados de outras A homocedasticidade é uma condição em que a variância dos erros ϵ i permanece constante para todas as observações o que é crucial para a precisão das inferências estatísticas Os erros são também supostos seguir uma distribuição normal e sejam independentes facilitando a aplicação de testes estatísticos apropriados Outro pressuposto importante é a ausência de multicolinearidade que implica que as variáveis independentes não estão altamente correlacionadas entre si evitando problemas na interpretação dos coeficientes estimados Por outro lado a Regressão Linear Múltipla possui limitações De acordo com Carvalho 2015 ela pode não capturar relações não lineares entre as variáveis limitando sua capacidade de modelar comportamentos complexos nos dados Se variáveis importantes forem omitidas do modelo pode ocorrer viés nos resultados comprometendo a validade das conclusões tiradas Além disso problemas de multicolinearidade quando as variáveis independentes estão fortemente correlacionadas podem afetar a precisão das estimativas dos coeficientes dificultando a distinção dos efeitos individuais das variáveis explicativas sobre a variável dependente 212 Regressão Probit A Regressão Probit é utilizada para modelar a probabilidade de um evento binário ocorrer assumindo que essa probabilidade segue a distribuição normal acumulada A equação básica é dada por P Y i1Φβ0β1 X1β2 X2βn X n Onde Φ é a distribuição acumulada da distribuição normal X1 X2 Xn são as variáveis independentes β1 β2 βn são os coeficientes a serem estimados cada parâmetro expressa o efeito que a variável independente tem sobre a variável dependente Segundo Figueiredo Filho 2015 Na Regressão Probit os pressupostos incluem a independência das observações garantindo que cada observação seja independente das outras o que é importante para inferências válidas A correta especificação do modelo pressupõe que a forma funcional do modelo está adequadamente especificada assegurando que a relação entre as variáveis independentes e a probabilidade de Y i1 seja representada de maneira precisa e relevante Além disso é assumido que a relação entre as variáveis independentes e a probabilidade linear de Y i1 seja mantida No entanto a Regressão Probit apresenta limitações como a interpretação não direta dos coeficientes em termos de efeitos nas probabilidades exigindo uma interpretação cuidadosa dos resultados Além disso é sensível a outliers e valores extremos nos dados o que pode afetar a robustez dos resultados Também requer um número suficiente de observações para estimar corretamente os parâmetros do modelo garantindo que as estimativas sejam precisas e confiáveis 213 Análise de Componentes Principais PCA A Análise de Componentes Principais PCA é uma técnica de redução de dimensionalidade que extrai informações importantes de um grande conjunto de variáveis correlacionadas permitindo a simplificação da estrutura dos dados A transformação linear é dada pela equação Ziα 1 X1α2 X2α 2 X p Onde Zi é o iésimo componente principal X1 X2 X p são as variáveis originais α 1α 2 α p são os coeficientes ou pesos associados a cada variável original X j que são escolhidos de modo que maximizem a variância dos dados explicada por Zi Segundo Vicini 2005 cada componente principal Zi é ortogonal aos demais o que significa que eles são independentes entre si A análise de Componentes Principais é útil para reduzir a dimensionalidade dos dados enquanto mantém a maior quantidade possível de informação facilitando a interpretação e a análise dos padrões subjacentes nos dados originais 3 Metodologia Neste estudo serão aplicados três modelos econométricos fundamentais para investigar as relações entre variáveis socioeconômicas dos indivíduos em Minas Gerais utilizando dados da PNAD Cada modelo oferece uma abordagem única para analisar e compreender diferentes aspectos dos dados 31 Modelo de Regressão Linear Múltiplo A Regressão Linear Múltipla será utilizada para examinar como variáveis como idade gênero raça e horas trabalhadas influenciam o logaritmo natural do rendimento no trabalho principal dos indivíduos A modelagem será feita pela seguinte equação ln rendiment oiβ0β1 Idad eiβ2 Sex oiβ3 Raç aiβ4 HorasTrabalhada siϵ i Onde ln rendiment oi é o logaritmo natural do rendimento no trabalho principal do indivíduo i Idad eiSex oi Raçaie HorasTrabalhada si são variáveis explicativas como idade em anos sexo dummy onde 1 representa mulher e 0 homem raça dummy onde 1 representa negro ou pardo e 0 caso contrário e número de horas trabalhadas semanalmente 32 Modelo de Regressão Probit A Regressão Probit será utilizada para modelar a probabilidade de um indivíduo ser empregado com carteira assinada considerando variáveis como idade sexo raça e educação A equação de probabilidade é dada por P Carteir ai1Φβ0β1 Idad ei β2Sex oi β3 Raçaiβ4 Horasi 33 Análise de Componentes Principais PCA A Análise de Componentes Principais PCA será aplicada para reduzir a dimensionalidade dos dados e explorar padrões subjacentes entre variáveis socioeconômicas Nesse caso será aplicados todas as variáveis que são Tabela 1 As variáveis utilizadas no estudo 4 Resultados 41 Regressão Linear Multipla A regressão linear múltipla foi utilizada para investigar os determinantes do logaritmo natural do rendimento no trabalho principal dos indivíduos em Minas Gerais Os resultados do modelo estão apresentados na tabela abaixo Tabela 2 Estimação dos parâmetros do MRLM Sendo assim o modelo estimado foi ln rendiment oi6546200047 Idad ei02049Sex oi02710 Raçai00093 HorasTrabalhada siϵ i Primeiramente será analisado se o modelo é estatisticamente significativo para analisar as variações da variável dependente para isso utilizamos o teste F onde as hipóteses do teste são H 0 Modelonão é significativo H 1 Modeloé significativo A estatística F calculada para o modelo foi de 51585 com um pvalor de aproximadamente zero sendo assim a hipótese nula é rejeitada indicando que o modelo como um todo é estatisticamente significativo Isso significa que há evidências robustas de que pelo menos uma das variáveis independentes idade sexo raça e horas trabalhadas está associada a variabilidade do rendimento no trabalho principal dos indivíduos Ao examinar os coeficientes das variáveis independentes de acordo com a Tabela 2 observase que a idade tem um impacto positivo significativo para cada ano adicional de idade está associado a um aumento estimado de aproximadamente 047 nos rendimentos mantendo todas as outras variáveis constantes Em contrapartida o sexo feminino demonstra um efeito negativo substancial com mulheres apresentando rendimentos estimados 2049 menores do que os homens após ajuste para outras variáveis A autodeclaração como negro também está associada a uma redução significativa nos rendimentos estimandose uma queda de aproximadamente 271 em comparação com indivíduos que não se autodeclararam negros Além disso cada hora adicional de trabalho semanal está associada a um aumento estimado de 093 nos rendimentos Agora para analisar se as variáveis são significativas individualmente utilizaremos o teste T onde as hipóteses são H0 βi0 variável nãoé estatiscamente significativano modelo H1 β10 v é estatisticamente significativanomodelo De acordo com os pvalores do teste T apresentados na Tabela 2 temse que todas as variáveis foram estatisticamente significativas com pvalores próximos de zero levando a rejeição da hipótese nula Além disso o modelo apresentou um coeficiente de determinação R 2 de 00872 indicando que aproximadamente 872 da variação no logaritmo do rendimento é explicada pelas variáveis incluídas Agora será verificado os pressupostos do MRLM 411 Multicolineariedade Primeiramente foi calculado a matriz de correlação entra as variáveis independentes Agora calculando o VIF temse Todos os VIFs estão próximos de 1 indicando que não há multicolinearidade significativa entre as variáveis Valores próximos de 1 são desejáveis pois sugerem que a variável em questão não é fortemente correlacionada com as outras Portanto temse que o modelo satisfaz o pressuposta de Multicolineariedade 412 Normalidade dos Resíduos Um dos pressupostos fundamentais da regressão linear múltipla é a normalidade dos resíduos que é crucial para inferências estatísticas válidas Este estudo investiga a adequação deste pressuposto ao analisar os resíduos da regressão linear múltipla utilizada para modelar os rendimentos no trabalho principal dos indivíduos em Minas Gerais Antes de proceder com testes formais de normalidade é essencial iniciar com uma análise visual dos resíduos por meio de histogramas Esse método proporciona uma primeira avaliação da distribuição dos resíduos em relação à distribuição normal oferecendo resultados preliminares sobre a validade do pressuposto Figura 1 Histograma dos resíduos do MRLM Ao realizar uma análise gráfica conforme mostrado na Figura 1 observase que os resíduos aparentemente satisfazem o pressuposto de normalidade Para confirmar esta suposição foi conduzido o teste de ShapiroWilk o qual avalia a normalidade dos resíduos As hipóteses testadas são H 0Osresíduos temdistribuiçãonormal H 1Osresíduos nãotemdistribuiçãonormal O teste obteve os seguintes resultados Como o pvalor do teste foi próximo de zero logo a hipótese nula é rejeitada concluindo que os resíduos não satisfazem o pressuposto de normalidade 413 Independência dos Resíduos Outro pressuposto fundamental da regressão linear múltipla é a independência dos resíduos que implica que os erros não devem apresentar correlação estrutural entre si Este estudo examina a adequação deste pressuposto ao analisar os resíduos da regressão utilizada para modelar os rendimentos no trabalho principal dos indivíduos em Minas Gerais As hipóteses do teste são H 0Osresíduos temdistribuiçãonormal H 1Osresíduos nãotemdistribuiçãonormal O pvalor do teste DurbinWatson DW foi superior a 005 indicando que com um nível de significância de 5 não há evidência suficiente para rejeitar a hipótese nula Portanto podemos concluir que os resíduos são independentes o que é consistente com o pressuposto de independência na regressão linear múltipla utilizada para modelar os rendimentos no trabalho principal dos indivíduos em Minas Gerais 414 Homocedasticidade O último pressuposto da regressão linear múltipla é a homocedasticidade dos resíduos o que implica que a variância dos erros deve ser constante em relação às variáveis independentes Este estudo investiga a adequação deste pressuposto ao analisar os resíduos da regressão utilizada para modelar os rendimentos no trabalho principal dos indivíduos em Minas Gerais Para testar a homocedasticidade dos resíduos será realizado o teste de BreuschPagan suas hipóteses são H 0Osresíduos são hocedasticos H 1Osresíduos são heterocedasticos O resultado do teste foi Com um pvalor inferior a 005 e um nível de significância de 5 rejeitamos a hipótese nula indicando que os dados não satisfazem o pressuposto de homoscedasticidade Isso implica que a variância dos resíduos não é constante em relação às variáveis independentes na regressão utilizada para modelar os rendimentos no trabalho principal dos indivíduos em Minas Gerais 415 Conclusão O modelo revelou que a idade dos indivíduos tem um efeito positivo significativo nos rendimentos indicando que a cada ano adicional de idade os rendimentos tendem a aumentar em aproximadamente 047 mantendose as outras variáveis constantes Por outro lado o fato de ser mulher e autodeclarado negro mostrou associações negativas significativas com os rendimentos com mulheres apresentando rendimentos estimados 2049 menores que os homens e autodeclarados negros com rendimentos 271 inferiores aos não autodeclarados negros Além disso cada hora adicional de trabalho semanal está associada a um aumento estimado de 093 nos rendimentos Ao avaliar os pressupostos do modelo constatamos que os resíduos não satisfazem os critérios de normalidade o que pode comprometer as inferências estatísticas Além disso identificamos evidências de heterocedasticidade nos resíduos sugerindo que a variância dos erros não é constante em relação às variáveis independentes Portanto apesar de capturar algumas das relações entre variáveis importantes o modelo apresenta limitações significativas em relação aos pressupostos fundamentais da regressão linear múltipla Esses resultados destacam a complexidade na determinação dos rendimentos individuais e ressaltam a necessidade de considerar cuidadosamente os pressupostos e limitações ao interpretar os resultados da análise 42 Modelo Probit Este capítulo analisa um modelo Probit utilizado para investigar os determinantes do registro com carteira de trabalho entre indivíduos em Minas Gerais O modelo Probit é escolhido devido à natureza binária da variável dependente onde ccart indica se o indivíduo possui registro com carteira de trabalho 1 ou não 0 As variáveis independentes incluídas são idade sexo mulher autodeclaração racial negro e horas semanais de trabalho O modelo Probit foi ajustado aos dados utilizando uma amostra de N22142 observações Os resultados do modelo estão apresentados na Tabela 3 Tabela 3 Estimativas dos parâmetros do modelo Probit Os resultados revelam que todas as variáveis independentes possuem coeficientes estatisticamente significativos indicando que idade sexo autodeclaração racial e horas de trabalho têm efeitos significativos na probabilidade de ter registro com carteira de trabalho Especificamente observase que a idade exerce um impacto negativo significativo sugerindo que a probabilidade de ter registro com carteira diminui à medida que a idade aumenta Além disso ser mulher e autodeclarado negro está positivamente associado à probabilidade de possuir registro com carteira Aumentar as horas semanais de trabalho também aumenta a probabilidade de ter registro formal Em conclusão o modelo Probit oferece resultados importante sobre os determinantes do registro com carteira de trabalho em Minas Gerais enfatizando a importância dessas variáveis na definição do status formal de emprego 43 Análise dos Componentes Principais A Análise de Componentes Principais ACP foi conduzida para explorar a estrutura subjacente das variáveis observadas no conjunto de dados O objetivo é reduzir a dimensionalidade mantendo o máximo de informação possível Neste estudo foram incluídas oito variáveis peso idade sexo autodeclaração racial rendimento horas de trabalho empregador e trabalhador por conta própria Os resultados da ACP revelam que oito componentes principais foram extraídos explicando completamente a variância total dos dados A Tabela 4 abaixo resume as principais estatísticas dos componentes principais Tabela 4 Modelo ACP Os eigenvectors ou vetores próprios mostram como cada variável original contribui para cada componente principal Isso pode ser interpretado como a combinação linear das variáveis originais que compõem cada componente Abaixo esta a Tabela 5 com os coeficientes eigenvectors para cada variável nos oito componentes principais Tabela 5 O quando cada variável contribui para cada componente do ACP De acordo com o modelo de Análise de Componentes Principais ACP foi identificado que seis componentes principais capturam aproximadamente 8286 da variabilidade das variáveis originais Isso indica que esses seis componentes são suficientes para representar de forma significativa a estrutura subjacente dos dados condensando a informação contida nas variáveis originais de forma mais compacta e interpre tando A análise de componentes principais oferece uma visão detalhada sobre como as variáveis selecionadas estão estruturadas e como elas contribuem para a variabilidade dos dados Esses componentes podem ser utilizados para reduzir a dimensionalidade dos dados originais facilitando análises posteriores e possibilitando uma melhor compreensão das relações entre as variáveis estudadas 5 Conclusão Este estudo explorou diversas técnicas estatísticas para investigar os determinantes do rendimento no trabalho principal em Minas Gerais Inicialmente utilizamos a Regressão Linear Múltipla para examinar a relação entre variáveis como idade gênero autodeclaração racial e horas de trabalho com o rendimento Os resultados destacaram que o aumento da idade tende a estar associado a rendimentos mais elevados enquanto ser mulher e autodeclarado negro mostrou uma associação negativa com o rendimento evidenciando desigualdades persistentes no mercado de trabalho Além disso empregamos o modelo Probit para investigar a probabilidade de registro com carteira de trabalho encontrando que idade gênero autodeclaração racial e horas de trabalho são fatores significativos na determinação deste status Especificamente observamos que a idade avançada diminui a probabilidade de registro com carteira enquanto ser mulher e autodeclarado negro aumenta essa probabilidade O aumento das horas de trabalho semanais também contribui para uma maior probabilidade de registro formal Finalmente aplicamos a Análise de Componentes Principais ACP para explorar a estrutura subjacente das variáveis estudadas Com seis componentes principais conseguimos capturar aproximadamente 8286 da variabilidade das variáveis originais fornecendo uma abordagem eficaz para reduzir a dimensionalidade dos dados sem perda significativa de informação Referências CARVALHO Grazielle Anjos Contribuições metodológicas ao Planejamento Urbano comparação de métodos de análise multivariada e modelos de mudança da paisagem urbanaaplicações na Regional PampulhaBelo Horizonte Minas GeraisBrasil 2015 FARAH Jaqueline Medeiros A diminuição da geração de finos na granulação uma aplicação da Análise de Regressão Linear Múltipla como ferramenta de apoio para a solução de problemas não estruturados na indústria 2014 FIGUEIREDO FILHO Dalson et al O que fazer e o que não fazer com a regressão pressupostos e aplicações do modelo linear de Mínimos Quadrados Ordinários MQO Revista Política Hoje v 20 n 1 2011 FIGUEIREDO FILHO Dalson et al Regressão logística em ciência política Texto preparado como material complementar do curso de Tópicos Avançados de Metodologia de Pesquisa ministrado pelo prof Enivaldo Rocha no Departamento de Ciência Política da Universidade Federal de Pernambuco 2015 VICINI Lorena ANÊLISE MULTIVARIADA DA TEORIA PRÊTICA 2005 VIEIRA Michelle Aparecida Efeitos das transferências intergovernamentais na redução das desigualdades e na promoção do desenvolvimento socioeconômico das regiões brasileiras 2017