·

Economia ·

Econometria

Send your question to AI and receive an answer instantly

Ask Question

Preview text

Olá tudo bem Meu nome é Daniele e preciso de ajuda para rodar o modelo de regressão Logit no R O meu problema é que eu erro códigos Você pode rodar o modelo Serão duas regressões uma para o ano de 2019 e outra para o ano de 2023 usando Microdados da Pnad contínua para pessoas acima de 60 anos do Paraná Segue abaixo a minha metodologia onde preciso que siga os passos descritos para os dois anos apresentando se possível os resultados com as tabelas os gráficos necessários para interpretação e o passo a passo de como fazer isso no R METODOLOGIA Para atingir os objetivos desta monografia será utilizada uma abordagem mista qualitativa e qualitativa A primeira se refere a caracterização do fenômeno social do envelhecimento com relação ao mercado de trabalho levando em consideração o contexto e as características sociais do estado do Paraná a fim de identificar o perfil dos idosos inseridos no mercado de trabalho Já a abordagem quantitativa estará presente com o uso de recursos econométricos para quantificar quais características do idoso aumentam a probabilidade de estar inserido no mercado de trabalho Com isso esperase obter uma resposta para o problema de pesquisa Quais são as características socioeconômicas do idoso inserido no mercado de trabalho do estado do Paraná nos anos de 2019 e 2023 O estado do Brasil escolhido para a pesquisa é o Paraná que tem cerca de 118 milhões de habitantes dos quais 18 milhões de residentes são pessoas com 60 anos ou mais o que representa cerca de 16 da população do estado Segundo o IBGE representa a sexta população mais envelhecida do país cuja expectativa média foi de 792 anos vida em 2024 No tocante ao recorte temporal o uso de dados dos anos de 2019 e 2023 possibilitarão uma análise comparativa antes e depois do período da pandemia do virús COVID19 que afetou a sociedade e a economia não somente do Paraná mas também do país e do mundo O tipo de pesquisa que melhor se adequa aos objetivos desse trabalho é a explicativa e a descritiva pois permitirão entender os aspectos que determinaram a permanência dos idosos no mercado de trabalho 31 ESTATÍSTICAS DESCRITIVAS A estatística descritiva tratase de um componente importante na análise econométrica uma vez que essa etapa auxilia a organizar os dados facilitando a sua manipulação e interpretação posteriormente Nesse sentido para iniciar a descrição da maneira como a pesquisa será conduzida os dados usados nessa pesquisa serão obtidos a partir do levantamento dos microdados da Pesquisa Nacional por Amostra de Domicílios contínua PNADC disponibilizada pelo Instituto Brasileiro de Geografia e Estatística IBGE A PNAD contínua é uma pesquisa feita em domicílios selecionados para a amostra que são pesquisados uma vez a cada trimestre durante cinco trimestres sucessivos A escolha desses dados se justifica devido a existência de informações confiáveis de dados individuais sobre diversas características das populações de diferentes localidades Com isso através da linguagem de programação R para o estudo presente serão filtradas as informações das pessoas consideradas idosas isto é das pessoas com 60 anos ou mais residentes no estado do Paraná Portanto para analisar os determinantes do idoso no mercado de trabalho paranaense no período pré e pós pandêmico serão levadas em consideração características como o sexo a idade a coretnia a escolaridade estado civil a renda individual e renda domiciliar per capita Essas variáveis foram escolhidas pois podem influenciar na permanência ou retorno dos idosos ao mercado de trabalho As estatísticas descritivas com as variáveis escolhidas serão apresentadas em forma de tabelas descritivas 3 2 MODELO ECONOMÉTRICO LOGIT Ademais das estatísticas descritivas será feita uma regressão logística que é uma técnica estatística que tem o objetivo de formar um modelo que indica valores geralmente binários tomados por uma variável categórica dependente em função de uma ou mais variáveis independentes binárias e contínuas Então a partir desse modelo gerado é possível calcular ou prever a probabilidade de um evendo ocorrer dado uma observação aleatória Gonzalez2018 p 14 Portanto para estimar os determinantes do idoso no mercado de trabalho serão feitas duas regressões sendo uma para o ano de 2019 e outra para o ano de 2023 Quadro 1 Descrição da variável dependente em cada uma das duas regressões Variável dependente Descrição Trabalha 1 se a pessoa trabalha 0 se ela não trabalha Fonte Elaborado pelo autor Quadro 2 Descrição das variáveis independentes utilizadas no modelo Variáveis independentes Descrição c asado 1 se a pessoa for casada 0 se não for casada renda Para estimação das regressões utilizouse tal variável como contínua representada pela renda em R i dade Para a estimação das regressões utilizouse tal variável como contínua representada pela idade em anos e duc 1 se a pessoa tem ensino superior completo 0 se a pessoa não tem ensino superior completo c or 1 se a pessoa não é da cor branca 0 se a pessoa é da cor branca s exo 1 se a pessoa for uma mulher 0 se a pessoa for um homem Fonte E laborado pelo autor Com base nas variáveis dependentes e independentes temse a equação logit L i ln P i 1 P i β 0 β 1 X 1 β 2 X 2 β 3 X 3 β 4 X 4 u i 1 Na Equação 1 L i é o logit P i é a probabilidade de que a variável dependente Y seja igual a 1 considerando o agrupamento das variáveis independentes X Nesse sentido β 0 indica o intercepto e β 1 β 2 β 3 e β 4 são os coeficientes estimados da equação e u é o termo de erro Portanto nessa pesquisa em questão a equação de regressão logística é L P i 1 P i β 0 β 1 idade β 2 educ β 3 cor β 4 sexo β 5 casado β 6 renda u i 2 Em seguida há a estimação de máxima verossimilhança EMV que indica os valores dos parâmetros mais prováveis de terem produzido os dados em outras palavras o EMV tratase da média da amostra normalmente distribuído em amostras grandes Stock e Watson 2004 Pseudo R 2 1 In L modelo In L nulo 3 Após a estimação do modelo logit e da estimação de máxima verossimilhança o próximo passo para a análise é equação do índice Pseudo R² conforme a equação 3 índice que busca capturar a qualidade do ajuste da modelagem das probabilidades do logit Segundo McFadden 1974 o pseudoR² p ossibilita comparar o ajuste da logverossimilhança do modelo completo em relação a logverossimilhança de um modelo de base nulo que não usa variáveis explicativas apenas o intercepto β 0 Woodridge 2018 Atrelado a isso temse o t este da razão de verossimilhança X² que testa a significancia global do modelo Ou seja X² é uma medida de ajustamento dos modelos que verifica se o modelo com todas as variáveis socioeconômicas e demográficas melhora em relação a um modelo nulo Portanto calculase o percentual de situações previstas de maneira correta no modelo com base no total de observações analisadas evidenciando a precisão do modelo Em seguida calculase a razão de chances RC obtida a partir da exponencial dos coeficientes a qual mensura a chance de o evento de interesse acontecer com base em uma alteração em X i em outras palavras quantas vezes aumenta ou diminui a chance de o idoso estar ocupado dado um aumento de 1 unidade em uma variável Como resultados se os valores forem maiores que 1 indicam um aumento das chances mas se forem menores do que 1 reduzemse as probabilidades RC e β i X i 4 A demais é possível calcular os efeitos marginais médios para cada variável independente do modelo os quais mensuram o impacto percentual de cada variável explicativa sobre Y isto é a variação em pontos percentuais na probabilidade o que permite uma interpretação mais simples da razão de chances EMM i e β 0 X i β 1 e β 0 X i β x ² 5 Na Equação 5 EMM i é o efeito marginal médio de X i na chance do evento de interesse ocorrer mantendo as demais variáveis constantes Nesse sentido a função de distribuição acumulada logística possui uma forma funcional específica definida em termos da função exponencial na qual utilizase e para o c á lcu lo exponencial dos parâmetros estimados no modelo logit entre eles β 0 e β x Stock e Watson2004 Com a aplicação da sequência metodológica descrita acima buscase atender ao objetivo geral da pesquisa que consiste em analisar os determinantes da participação dos idosos no mercado de trabalho no estado do Paraná nos anos de 2019 e 2023 Por fim esperase contempla r o objetivo específico de mensurar a probabilidade de ocupação dos idosos co mparando as alterações dos anos de 2019 e 2023 quanto a participação do idoso no mercado de trabalho tendo em vista características socioeconômicas e demográficas