·
Economia ·
Econometria
Send your question to AI and receive an answer instantly
Recommended for you
20
Lista de Exercícios de Econometria no R
Econometria
PUC
2
3ª Prova Online de Econometria II - FEA PUC
Econometria
PUC
2
Atividade
Econometria
PUC
5
Lista de Questões de Econometria no R
Econometria
PUC
4
Resenha Artigos Econometricos
Econometria
PUC
1
Prova Econometria 2 2023 - Análise de Autocorrelação e Heteroscedasticidade
Econometria
PUC
23
Prova de Econometria
Econometria
PUC
2
Fazer 2 Artigos Econométricos
Econometria
PUC
14
Lista de 5 Questões de Econometria no R
Econometria
PUC
11
Lista de Exercícios
Econometria
PUC
Preview text
Laboratório de Econometria I 20241 Lista 5 de 5 Departamento de Economia PUCRio Prof Gilberto Boaretto Monitores André Alvarenga e Guilherme Campanha Entrega até 27062024 às 23h59 via EAD da disciplina INSTRUÇÕES Esta lista possui duas questões com quatro itens cada A lista pode ser feita individualmente ou em dupla Coloquem nome completo e matrícula no início da lista A lista deve ser entregue em um documento PDF com a resposta para cada questão resposta nesta ordem se for o caso 1 Código de R utilizado 2 Tabelas eou figuras com os resultados obtidos 3 Interpretação dos resultados Entregar em formato diferente de PDF acarretará em penalização Sugestão não obrigatório entregar um relatório em PDF gerado no RMarkdown Alerta alunos ou duplas diferentes com respostas idênticas ou muito similares terão a pontuação da questão zerada Nessa segunda parte de Laboratório de Econometria I iremos cobrir o conteúdo que seria distribuído em três listas em apenas duas 1 Laboratório de Econometria I 20241 Questão 1 50 Nesta questão vocês empregarão dados da PNAD Contínua As definições das variáveis utilizadas são apresentadas Tabela 1 a seguir Os dados estão na base de dados intitulada PnadcUFdta disponível na pasta PNAD2 do arquivo compactado dadoslista5zip dis ponível para download no Moodle Cada aluno deverá usar os dados referentes a uma determinada UF conforme escolha indicada na planilha a seguir httpsdocsgooglecomspreadsheetsd1IO91C9kVmO4UpzBBHvwrwdrKlxUiiQEO vvXueObIcedituspsharing Tabela 1 PNAD Contínua descrição das variáveis da base de dados Variáveis Descrição ano Ano da pesquisa UF Código da unidade da federação entrevista 1 para a primeira entrevista 2 para a segunda entrevista mulher 1 se mulher 0 se homem Idade Idade em anos negro 1 se negro ou pardo 0 caso contrário rendimento Rendimento no trabalho principal horas Número de horas trabalhadas na semana ccart 1 se empregado com carteira 0 caso contrário scart 1 se empregado sem carteira 0 caso contrário contapropria 1 se trabalhador por contaprópria 0 caso contrário militfpub 1 se militar ou funcionário público 0 caso contrário empregador 1 se empregador 0 caso contrário indice Identificador do indivíduo peso Peso da pessoa na pesquisa Responda as questões a seguir a Usando dados para as duas entrevistas de cada indivíduo estime a regressão a seguir empregando mínimos quadrados ordinários MQO empilhado lnrendimentoit β0 δ0 d2t β1 ccartit β2 scartit β3 contapropriait uit 1 em que d2t é uma dummy que assume o valor 1 para valores referentes a segunda entre vista entrevista 2 e igual a zero caso contrário Note que o grupo de referência para a posição na ocupação é formado por militares funcionários públicos e empregadores Utilize o teste BreuschPagan BP para testar se o termo de erro do modelo 1 estimado por MQO empilhado é heteroscedástico Tendo como base o resultado do teste verifique se os coeficientes das variáveis d2 ccart scart e contapropria na equação 1 são estatisticamente diferentes de zero ao nível de 10 Note que você deverá considerar errospadrão robustos à heteroscedasticidade caso a hipótese nula do teste BP tenha sido rejeitada Reporte códigos todos os resultados e os explique PUCRio Gilberto Boaretto 2 Laboratório de Econometria I 20241 b Agora estime a equação a seguir empregando o estimador de efeitos fixos lnrendimentoit β0 δ0 d2t β1 ccartit β2 scartit β3 contapropriait αi uit 2 em que αi i 1 N representam os efeitos fixos de indivíduo Utilize o teste BreuschPagan BP para verificar se o termo de erro do modelo 2 é heteroscedástico À luz do resultado do teste verifique se os coeficientes estimados por efeitos fixos das variáveis d2 ccart scart e contapropria na equação 2 são estatisticamente diferentes de zero ao nível de 10 Reporte códigos todos os resultados e os explique c Finalmente estime o modelo em primeiras diferenças ou seja estime lnrendimentoi δ0 β1 ccarti β2 scarti β3 contapropriai ui 3 em que representa o operador de primeira diferença Utilize o teste BreuschPagan BP para testar se o termo de erro do modelo 3 estimado por primeiras diferenças é heteroscedástico A partir do resultado do teste verifique se os coeficientes estimados por primeiras di ferenças das variáveis ccart scart e contapropria na equação 3 são estatisticamente diferentes de zero ao nível de 10 Reporte códigos todos os resultados e os explique d Considerando todos os resultados anteriores apresenteos conjuntamente usando o star gazer e interprete e compare os coeficientes estimados por cada métodos para as variá veis d2 ccart scart e contapropria nas equações 1 2 e 3 Lembrese de no caso de termo de erro heteroscedástico reportar errospadrão robustos Reporte códigos outputs e explique sucintamente as diferenças verificadas Questão 2 50 Nesta questão vocês usarão dados individuais da PNAD Contínua As definições das va riáveis utilizadas são apresentadas na Tabela 2 Os dados estão na base de dados intitulada UFdta disponível na pasta PNAD2 do arquivo compactado dadoslista5zip disponível para download no EAD da disciplina Cada aluno ou dupla deverá usar dados da mesma UF escolhida na questão anterior PUCRio Gilberto Boaretto 3 Laboratório de Econometria I 20241 Tabela 2 PNAD descrição das variáveis da base de dados individuais Variáveis Descrição uf Código da unidade da federação mulher 1 se mulher 0 se homem idade Idade em anos negro 1 se negro ou pardo 0 caso contrário rendap Rendimento no trabalho principal anosest Número de anos de estudo horasp Número de horas trabalhadas na semana setor 1 se agrícola 2 se indústria 3 se construção 4 se comércio 5 se serviços 6 se administração e 7 se outros nascmunicip 1 se a pessoa nasceu no município 0 caso contrário npes Número de pessoas no domicílio rfpc Renda familiar per capita desempregado 1 se a pessoa está desempregada 0 se está empregada inativo 1 se a pessoa não está participando do mercado de trabalho 0 caso contrário posocupacao 1 se com carteira 2 se sem carteira 3 se contaprópria 4 se empregador 5 se militar e 6 se funcionário público nc05 Número de crianças com 5 anos ou menos de idade nc610 Número de crianças com idade entre 6 e 10 anos nc1114 Número de crianças com idade entre 11 e 14 anos tempotrab Tempo de casa ao trabalho 0 se 30 minutos ou menos 1 se entre 30 minutos e 1 hora 2 se entre 1 e 2 horas e 3 se mais de 2 horas educm Educação média dos adultos no domicílio recebebolsafamilia 1 se a família recebe Bolsa família 0 caso contrário peso Peso da pessoa na pesquisa Responda as questões a seguir a Estime a probabilidade de um indivíduo não participar do mercado de trabalho inativo 1 em função de uma constante da sua idade idade da escolaridade anosest do gênero mulher e do número de crianças com idade entre 0 e 5 anos no do micílio nc05 usando o modelo de probabilidade linear MPL Utilize errospadrão robustos à heteroscedasticidade Reporte e analise os resultados b Estime a probabilidade de um indivíduo não participar do mercado de trabalho em função dos regressores incluídos no item anterior mas usando o modelo probit Faça o teste BreuschPagan BP de heteroscedasticidade e se necessário reporte os resultados com errospadrão robustos Reporte os resultados Os sinais dos efeitos parciais do modelo probit são semelhantes aos sinais dos efeitos parciais do MPL Comente c Repita o item anterior mas agora estimando um modelo logit Faça o teste Breusch Pagan BP de heteroscedasticidade e se necessário reporte os resultados com erros padrão robustos Reporte os resultados Os sinais dos efeitos parciais do modelo logit são semelhantes aos sinais dos efeitos parciais do MPL Comente d Obtenha e interprete os efeitos parciais médio e na média APE e PAE da variável mulher na probabilidade de um indivíduo não participar do mercado de trabalho de acordo com os modelos probit e logit Reporte códigos outputs e interprete os resulta dos PUCRio Gilberto Boaretto 4 Laboratório de Econometria I 20241 Dica os comandos probitmfx e logitmfx do package mfx calcula tanto o efeito parcial médio APE quanto o efeito parcial na média PAE Observação atentese para a configuração do argumento atmean Compare os efeitos parciais com o coeficiente obtido para a variável mulher no modelo de probabilidade linear MPL estimado por MQO No caso das diferenças se mostrarem acentuadas explique o motivo para isso PUCRio Gilberto Boaretto 5 Lista 5 Rafael 20240627 Questão 1 A tibble 10 15 ano UF entrevista peso idade mulher negro rendimento horas indice ccart dbl dbl dbl dbl dbl dbl dbl dbl dbl dbl dbl 1 2012 31 1 173 53 0 0 0 38 120e6 0 2 2015 31 1 532 28 1 0 2479 40 120e6 0 3 2012 31 1 665 55 1 0 1924 44 119e6 1 4 2013 31 2 255 35 1 1 914 20 115e6 0 5 2014 31 1 100 33 1 0 631 48 119e6 0 6 2015 31 2 921 54 0 0 3216 48 120e6 0 7 2014 31 2 1153 41 0 1 3158 18 122e6 1 8 2013 31 2 228 44 1 1 1546 30 115e6 0 9 2015 31 1 276 64 0 1 672 44 130e6 1 10 2016 31 1 1033 48 0 1 1805 48 133e6 1 ℹ 4 more variables scart dbl militfpub dbl empregador dbl contapropria dbl a MQO Empilhado com teste BreuschPagan O modelo a ser estimado é ln rendiment oβ0δ0d 2tβ1 ccar t β2scar t β3contapropriau em que d 2t é uma dummy que assume o valor 1 para valores referentes a segunda entrevista entrevista 2 e igual a zero caso contrário Criando a variável dummy d2 dadosd2 ifelsedadosentrevista 2 1 0 attachdados headdados 10 A tibble 10 16 ano UF entrevista peso idade mulher negro rendimento horas indice ccart dbl dbl dbl dbl dbl dbl dbl dbl dbl dbl dbl 1 2012 31 1 173 53 0 0 0 38 120e6 0 2 2015 31 1 532 28 1 0 2479 40 120e6 0 3 2012 31 1 665 55 1 0 1924 44 119e6 1 4 2013 31 2 255 35 1 1 914 20 115e6 0 5 2014 31 1 100 33 1 0 631 48 119e6 0 6 2015 31 2 921 54 0 0 3216 48 120e6 0 7 2014 31 2 1153 41 0 1 3158 18 122e6 1 8 2013 31 2 228 44 1 1 1546 30 115e6 0 9 2015 31 1 276 64 0 1 672 44 130e6 1 10 2016 31 1 1033 48 0 1 1805 48 133e6 1 ℹ 5 more variables scart dbl militfpub dbl empregador dbl contapropria dbl d2 dbl Modelo MQO Emplilhado dadoslogrendimento logrendimento dados2 subsetdados isfinitelogrendimento m1 lmlogrendimento d2 ccart scart contapropria data dados2 summarym1 Call lmformula logrendimento d2 ccart scart contapropria data dados2 Residuals Min 1Q Median 3Q Max 46144 04647 00379 03924 38084 Coefficients Estimate Std Error t value Prt Intercept 7491027 0014187 528010 2e16 d2 0008526 0009965 0856 0392 ccart 0535608 0015186 35271 2e16 scart 1106900 0017587 62938 2e16 contapropria 0832139 0016933 49144 2e16 Signif codes 0 0001 001 005 01 1 Residual standard error 07324 on 21608 degrees of freedom Multiple Rsquared 0172 Adjusted Rsquared 01719 Fstatistic 1122 on 4 and 21608 DF pvalue 22e16 Como o pvalor do tetes F foi de aproximadamente 0 isso significa que o modelo MOQ Empilhado é estatisticamente significativo ou seja pelo menos uma variável independente é capaz de explicar as variações da variável dependente que é log rendiment o De acordo com o pvalor do teste T as variáveis independentes ccart scart e contapropria são estatisticamente significativas pvalor01 isso significa que elas são capazes de explicar as variações da variável dependente Por outro lado a variável independente d 2 não se mostrou estatisticamente significativa pvalor01 Teste BreuschPagan para heteroscedasticidade librarylmtest Carregando pacotes exigidos zoo Attaching package zoo The following objects are masked from packagebase asDate asDatenumeric bptestm1 studentized BreuschPagan test data m1 BP 86416 df 4 pvalue 22e16 O teste BreuschPagan studentizado indica que há evidências significativas de heterocedasticidade nos resíduos do modelo Isso significa que a variância dos erros não é constante para todos os níveis das variáveis independentes o que pode afetar a eficiência dos estimadores e a validade das inferências estatísticas realizadas Errospadrões Robusto librarysandwich Warning package sandwich was built under R version 433 coefs coefm1 se sqrtdiagvcovHCm1 Verificando significância ao nível de 10 pvalor 1 ptabscoefs se df nrowdados2 lengthcoefs pvalor Intercept d2 ccart scart contapropria 00000000 01961666 00000000 00000000 00000000 Os pvalores calculados com errospadrões robusto confirma que as variáveis independentes ccart scart e contapropria são estatísticamente significativas no modelo de regressão linear multiplo por MQO Emplilhado encontrato a variável indepnendte d 2 se mostrou não ser significativa no modelo b Estimador de Efeitos Fixos O modelo a ser estimado é ln rendiment oβ0δ0d 2tβ1 ccar t β2scar t β3contapropriaα iu Onde αi12 N representam os efeitos fixos de indivíduo libraryplm Warning package plm was built under R version 433 Convertendo dados para o formato de painel dados3 pdataframedados2 index cano Estimando o modelo de efeitos fixos m2 plmlogrendimento d2 ccart scart contapropria data dados3 model within summarym2 Oneway individual effect Within Model Call plmformula logrendimento d2 ccart scart contapropria data dados3 model within Unbalanced Panel n 6 T 5664495 N 21613 Residuals Min 1st Qu Median 3rd Qu Max 4634940 0462508 0037336 0389584 3778508 Coefficients Estimate Std Error tvalue Prt d2 0016344 0010104 16175 01058 ccart 0536264 0015173 353437 2e16 scart 1106104 0017573 629451 2e16 contapropria 0833660 0016923 492624 2e16 Signif codes 0 0001 001 005 01 1 Total Sum of Squares 13975 Residual Sum of Squares 11568 RSquared 017224 Adj RSquared 01719 Fstatistic 112381 on 4 and 21603 DF pvalue 222e16 De acordo com o pvalor do teste F o modelo é estatisticamente significativo ou seja o modelo é capaz de explicar as variações da variável log rendiment o analogamente tem se que as variáveis ccart scart e contapropria são estatisticamente significantes no modelo enquando a variável independente dummy d 2 não se mostrou novamente estatisticamente significante para explicar as variações da variável dependente Também é notal que o coeficiente de determinação R 2 foi semelhante em ambos os modelos seu valor é de aproximadamente 0172 ou seja os modelos explicam cerca de 172 da variação do log rendiment o Teste BreuschPagan para heteroscedasticidade nos efeitos fixos bptestm2 studentized BreuschPagan test data m2 BP 86416 df 4 pvalue 22e16 O teste BP indica que há evidências significativas de heterocedasticidade nos resíduos do modelo Isso significa que a variância dos erros não é constante para todos os níveis das variáveis independentes o que pode afetar a eficiência dos estimadores e a validade das inferências estatísticas realizadas c Primeiras Diferenças com teste BreuschPagan O modelo a ser estimado é Δln rendiment oδ0β1 ccar tβ2scar t β3contapropriaα i Δu em que Δ representa o operador de primeira diferença m3 plmdifflogrendimento ccart scart contapropria data dados3 model fd summarym3 Oneway individual effect FirstDifference Model Call plmformula difflogrendimento ccart scart contapropria data dados3 model fd Unbalanced Panel n 6 T 5654494 N 21607 Observations used in estimation 21601 Residuals Min 1st Qu Median 3rd Qu Max 9793037 1081611 0052102 1110928 11331690 Coefficients Estimate Std Error tvalue Prt Intercept 000018369 001254425 00146 09883 ccart 080068907 002701562 296380 2e16 scart 168555954 003133792 537866 2e16 contapropria 126366386 003011220 419652 2e16 Signif codes 0 0001 001 005 01 1 Total Sum of Squares 84621 Residual Sum of Squares 73410 RSquared 013248 Adj RSquared 013236 Fstatistic 109934 on 3 and 21597 DF pvalue 222e16 O modelo se mostrou estatisticamente significativo e com todas as variáveis independentes significativas e com um nível de significância de 10 o parametro estimado δ 0 não é estatisticamente significativo O coeficiente de determinação do modelo foi um pouco menor que os outros com o valor de 01325 ou seja cerca de 1325 das variações da Δlog rendiment o é explicada pelo modelo bptestm3 studentized BreuschPagan test data m3 BP 23335 df 3 pvalue 22e16 O teste BP indica que há evidências significativas de heterocedasticidade nos resíduos do modelo Isso significa que a variância dos erros não é constante para todos os níveis das variáveis independentes o que pode afetar a eficiência dos estimadores e a validade das inferências estatísticas realizadas d Comparação dos Resultados librarystargazer Please cite as Hlavac Marek 2022 stargazer WellFormatted Regression and Summary Statistics Tables R package version 523 httpsCRANRprojectorgpackagestargazer Criando um vetor com os modelos estimados modelos listMQO empilhado m1 Efeitos fixos m2 Primeiras diferenças m3 Gerando a tabela com stargazer stargazermodelos type text se listcoefm1 coefm2 coefm3 Dependent variable logrendimento difflogrendimento OLS panel panel linear linear 1 2 3 d2 0009 0016 0009 0016 ccart 0536 0536 0801 0536 0536 0801 scart 1107 1106 1686 1107 1106 1686 contapropria 0832 0834 1264 0832 0834 1264 Constant 7491 00002 7491 00002 Observations 21613 21613 21601 R2 0172 0172 0132 Adjusted R2 0172 0172 0132 Residual Std Error 0732 df 21608 F Statistic 1122432 df 4 21608 1123809 df 4 21603 1099341 df 3 21597 Note p01 p005 p001 Os modelos apresentados oferecem diferentes abordagens para analisar a relação entre as variáveis explicativas e o rendimento utilizando dados de painel O Modelo 1 baseado em Mínimos Quadrados Ordinários MQO empilhados estima diretamente os efeitos das variáveis como d 2 indicando a segunda entrevista ccart empregado com carteira scart empregado sem carteira contapropria trabalhador por conta própria e uma constante sobre o logaritmo do rendimento Este modelo considera todas as observações empilhadas ignorando efeitos individuais não observados persistentes ao longo do tempo O Modelo 2 usando Efeitos Fixos controla esses efeitos individuais inobservados que podem ser constantes ao longo do tempo para cada indivíduo Isso permite focar nas variações dentro dos indivíduos ao longo do tempo capturando melhor as mudanças no rendimento que são específicas de cada pessoa além das características que variam entre os indivíduos O Modelo 3 baseado em Primeira Diferença estima as mudanças no rendimento ao longo do tempo eliminando os efeitos fixos individuais não observados Ele é útil para analisar como as variáveis explicativas influenciam as variações no rendimento dentro dos indivíduos ao longo de períodos consecutivos Cada modelo apresenta seus próprios coeficientes estimados medidas de ajuste como R 2 e estatísticas F para testar a significância conjunta das variáveis explicativas Essas abordagens permitem uma análise abrangente das relações entre as variáveis explicativas como tipo de emprego e entrevista e o rendimento considerando tanto variações individuais como mudanças ao longo do tempo Ambos os modelos se mostraram estatisticamente significativo o Modelo 3 foi o que teve o menor R 2 isso inidica que é o modelo que menor explica as variações da variável dependente já a variável d 2 se mostrou não significativa nos modelos 1 e 2 Questão 2 A tibble 10 21 uf idade rendap peso recebebolsafamilia mulher negro anosest rfpc dbl dbl dbl dbl dbl dbl dbl dbl dbl 1 31 16 0 393 0 0 1 7 780 2 31 40 530 392 0 0 1 8 292 3 31 39 0 579 0 1 0 5 725 4 31 17 0 392 0 0 1 9 280 5 31 4 0 578 0 0 1 0 833 6 31 26 350 393 0 1 0 11 407 7 31 26 0 392 1 1 1 11 845 8 31 10 0 579 0 1 1 3 260 9 31 19 0 392 0 0 1 8 80 10 31 47 260 578 0 1 1 4 317 ℹ 12 more variables npes dbl horasp dbl desempregado dbl inativo dbl setor dbl posocupacao dbl nc05 dbl nc610 dbl nc1114 dbl educm dbl tempotrabalho dbl nascmunicip dbl a Modelo de Probabilidade Linear MPL m4 lminativo idade anosest mulher nc05 data dados4 summarym4 Call lmformula inativo idade anosest mulher nc05 data dados4 Residuals Min 1Q Median 3Q Max 091925 038104 002943 035893 129868 Coefficients Estimate Std Error t value Prt Intercept 08219072 00189570 43356 2e16 idade 00041699 00003807 10953 2e16 anosest 00484052 00016970 28524 2e16 mulher 01640604 00144751 11334 2e16 nc05 00012868 00116289 0111 0912 Signif codes 0 0001 001 005 01 1 Residual standard error 04331 on 3609 degrees of freedom 2 observations deleted due to missingness Multiple Rsquared 02498 Adjusted Rsquared 02489 Fstatistic 3004 on 4 and 3609 DF pvalue 22e16 O modelo revela que idade anos deestudo e gê nero têm influências significativas na probabilidade de um indivíduo estar inativo no mercado de trabalho Especificamente cada ano a mais de idade está associado a uma diminuição de aproximadamente 00042 unidades na probabilidade de inatividade enquanto cada ano adicional de estudo reduz essa probabilidade em cerca de 00484 unidades Ser mulher aumenta a probabilidade de inatividade em aproximadamente 01641 unidades No entanto o número de crianças de 0 a 5 anos no domicílio nc05 não demonstrou ter um efeito estatisticamente significativo sobre a inatividade no mercado de trabalho neste modelo O ajuste do modelo medido pelo coeficiente de determinação R 2 de 02498 indica que cerca de 2498 da variabilidade na inatividade pode ser explicada pelas variáveis incluídas O teste F com um valorp extremamente baixo confirma que o modelo como um todo é estatisticamente significativo errospadrão robustos serobusto sqrtdiagvcovHCm4 type HC1 Extraindo coeficientes e pvalues coefs2 coefm4 pvalores 1ptabscoefs2 serobusto df nrowdados4 lengthcoefs2 sigm4 pvalores 005 considerando significância ao nível de 5 Criando tabela de resultados resultados dataframe Coeficientes coefs2 SERobustos serobusto PValue pvalores Significativo sigm4 resultados Coeficientes SERobustos PValue Significativo Intercept 0821907167 00177027945 00000000 TRUE idade 0004169906 00004104731 00000000 TRUE anosest 0048405219 00016393120 00000000 TRUE mulher 0164060365 00144089133 00000000 TRUE nc05 0001286811 00102202455 04499059 FALSE b Modelo Probit libraryMASS Estimando o modelo Probit m5 glminativo idade anosest mulher nc05 data dados4 family binomiallink probit summarym5 Call glmformula inativo idade anosest mulher nc05 family binomiallink probit data dados4 Coefficients Estimate Std Error z value Prz Intercept 0983367 0062242 15799 2e16 idade 0013152 0001220 10781 2e16 anosest 0145345 0005875 24740 2e16 mulher 0509146 0046652 10914 2e16 nc05 0023024 0037964 0606 0544 Signif codes 0 0001 001 005 01 1 Dispersion parameter for binomial family taken to be 1 Null deviance 50049 on 3613 degrees of freedom Residual deviance 39923 on 3609 degrees of freedom 2 observations deleted due to missingness AIC 40023 Number of Fisher Scoring iterations 5 O modelo de regressão logística probit estimado indica que idade anos deestudo e ser mul her têm efeitos estatisticamente significativos na probabilidade de um indivíduo estar inativo no mercado de trabalho Especificamente cada ano a mais de idade está associado a uma redução de aproximadamente 00132 na probabilidade de inatividade enquanto cada ano adicional de estudo diminui essa probabilidade em cerca de 01453 Ser mulher aumenta a probabilidade de inatividade em aproximadamente 05091 unidades Por outro lado o número de crianças de 0 a 5 anos no domicílio nc05 não mostrou ter um efeito estatisticamente significativo sobre a probabilidade de inatividade neste modelo O ajuste do modelo medido pelo AIC de 40023 indica que ele se adequa bem aos dados disponíveis com a desvio residual indicando um bom ajuste do modelo aos dados observados Teste de BreuschPagan para heteroscedasticidade bptestm5 studentized BreuschPagan test data m5 BP 4743 df 4 pvalue 22e16 O teste BP aplicado ao modelo m5 indica heterocedasticidade significativa nos resíduos com um pvalor muito baixo aproximadamente zero Isso implica que os erros padrão dos coeficientes estimados deve ser corrigidos utilizando métodos robustos para lidar com essa heterogeneidade na variância dos resíduos Calculando errospadrão robustos serobustoprobit sqrtdiagvcovHCm5 type HC1 Extraindo coeficientes e pvalues coefsprobit coefm5 pvaloresprobit 1 ptabscoefsprobit serobustoprobit df nrowdados4 lengthcoefsprobit sigprobit pvaloresprobit 005 considerando significância ao nível de 5 Criando tabela de resultados resultadoprobit dataframe Coeficientes coefsprobit SERobustos serobustoprobit PValores pvaloresprobit Significância sigprobit resultadoprobit Coeficientes SERobustos PValores Significância Intercept 098336724 0061861167 00000000 TRUE idade 001315161 0001355490 00000000 TRUE anosest 014534468 0006574139 00000000 TRUE mulher 050914580 0047688518 00000000 TRUE nc05 002302374 0033618653 02467412 FALSE c Modelo Logit m6 glminativo idade anosest mulher nc05 data dados4 family binomiallink logit summarym6 Call glmformula inativo idade anosest mulher nc05 family binomiallink logit data dados4 Coefficients Estimate Std Error z value Prz Intercept 1674151 0107683 1555 2e16 idade 0023200 0002076 1118 2e16 anosest 0248781 0010454 2380 2e16 mulher 0884832 0079556 1112 2e16 nc05 0019491 0064867 030 0764 Signif codes 0 0001 001 005 01 1 Dispersion parameter for binomial family taken to be 1 Null deviance 50049 on 3613 degrees of freedom Residual deviance 39800 on 3609 degrees of freedom 2 observations deleted due to missingness AIC 3990 Number of Fisher Scoring iterations 4 O modelo logit estimado mostra que idade anos deestudo e ser mul her são variáveis significativas na probabilidade de um indivíduo estar inativo no mercado de trabalho Especificamente cada ano a mais de idade reduz a probabilidade de inatividade enquanto anos adicionais de estudo e ser mulher aumentam essa probabilidade O número de crianças de 0 a 5 anos no domicílio não apresentou impacto significativo O modelo ajusta se bem aos dados conforme indicado pelo AIC de 3990 e pelo desvio e residual Teste de BreuschPagan para heteroscedasticidade bptestm6 studentized BreuschPagan test data m6 BP 4743 df 4 pvalue 22e16 O teste BP aplicado ao modelo m5 indica heterocedasticidade significativa nos resíduos com um pvalor muito baixo aproximadamente zero Isso implica que os erros padrão dos coeficientes estimados deve ser corrigidos utilizando métodos robustos para lidar com essa heterogeneidade na variância dos resíduos Calculando errospadrão robustos serobustologit sqrtdiagvcovHCm6 type HC1 Extraindo coeficientes e pvalues coefslogit coefm6 pvaloreslogit 1 ptabscoefslogit serobustologit df nrowdados4 lengthcoefslogit siglogit pvaloreslogit 005 considerando significância ao nível de 5 Criando tabela de resultados resultadologit dataframe Coeficientes coefslogit SERobustos serobustologit PValores pvaloreslogit Significância siglogit resultadologit Coeficientes SERobustos PValores Significância Intercept 167415133 0103721266 00000000 TRUE idade 002320043 0002214962 00000000 TRUE anosest 024878086 0011119641 00000000 TRUE mulher 088483187 0080853982 00000000 TRUE nc05 001949097 0058300264 03690786 FALSE d Efeitos Parciais Médio e na Média APE e PAE librarymfx Warning package mfx was built under R version 433 Carregando pacotes exigidos betareg Warning package betareg was built under R version 433 Calculando efeitos parciais médio e na média para Probit mfxprobit probitmfxm5 atmean TRUE data dados4 mfxprobit Call probitmfxformula m5 data dados4 atmean TRUE Marginal Effects dFdx Std Err z Pz idade 000523394 000048521 107870 2e16 anosest 005784271 000234166 247016 2e16 mulher 020048269 001797852 111512 2e16 nc05 000916274 001510784 06065 05442 Signif codes 0 0001 001 005 01 1 dFdx is for discrete change for the following variables 1 mulher Calculando efeitos parciais médio e na média para Logit mfxlogit logitmfxm6 atmean TRUE data dados4 mfxlogit Call logitmfxformula m6 data dados4 atmean TRUE Marginal Effects dFdx Std Err z Pz idade 000578871 000051747 111865 2e16 anosest 006207299 000261311 237544 2e16 mulher 021727935 001891636 114863 2e16 nc05 000486317 001618421 03005 07638 Signif codes 0 0001 001 005 01 1 dFdx is for discrete change for the following variables 1 mulher Os efeitos marginais médios calculados nos modelos probit e logit indicam que idade anos deestudo e ser mul her têm impactos estatisticamente significativos na probabilidade de um indivíduo estar inativo no mercado de trabalho Especificamente um ano a mais de idade reduz essa probabilidade em cerca de 052 no modelo probit e 058 no modelo logit Cada ano adicional de estudo diminui a probabilidade de inatividade em aproximadamente 578 no probit e 621 no logit Ser mulher aumenta a probabilidade de inatividade em aproximadamente 2005 no probit e 2173 no logit Por outro lado o número de crianças de 0 a 5 anos no domicílio não mostrou ter um impacto significativo na probabilidade de inatividade conforme indicado pela falta de significância estatística em ambos os modelos
Send your question to AI and receive an answer instantly
Recommended for you
20
Lista de Exercícios de Econometria no R
Econometria
PUC
2
3ª Prova Online de Econometria II - FEA PUC
Econometria
PUC
2
Atividade
Econometria
PUC
5
Lista de Questões de Econometria no R
Econometria
PUC
4
Resenha Artigos Econometricos
Econometria
PUC
1
Prova Econometria 2 2023 - Análise de Autocorrelação e Heteroscedasticidade
Econometria
PUC
23
Prova de Econometria
Econometria
PUC
2
Fazer 2 Artigos Econométricos
Econometria
PUC
14
Lista de 5 Questões de Econometria no R
Econometria
PUC
11
Lista de Exercícios
Econometria
PUC
Preview text
Laboratório de Econometria I 20241 Lista 5 de 5 Departamento de Economia PUCRio Prof Gilberto Boaretto Monitores André Alvarenga e Guilherme Campanha Entrega até 27062024 às 23h59 via EAD da disciplina INSTRUÇÕES Esta lista possui duas questões com quatro itens cada A lista pode ser feita individualmente ou em dupla Coloquem nome completo e matrícula no início da lista A lista deve ser entregue em um documento PDF com a resposta para cada questão resposta nesta ordem se for o caso 1 Código de R utilizado 2 Tabelas eou figuras com os resultados obtidos 3 Interpretação dos resultados Entregar em formato diferente de PDF acarretará em penalização Sugestão não obrigatório entregar um relatório em PDF gerado no RMarkdown Alerta alunos ou duplas diferentes com respostas idênticas ou muito similares terão a pontuação da questão zerada Nessa segunda parte de Laboratório de Econometria I iremos cobrir o conteúdo que seria distribuído em três listas em apenas duas 1 Laboratório de Econometria I 20241 Questão 1 50 Nesta questão vocês empregarão dados da PNAD Contínua As definições das variáveis utilizadas são apresentadas Tabela 1 a seguir Os dados estão na base de dados intitulada PnadcUFdta disponível na pasta PNAD2 do arquivo compactado dadoslista5zip dis ponível para download no Moodle Cada aluno deverá usar os dados referentes a uma determinada UF conforme escolha indicada na planilha a seguir httpsdocsgooglecomspreadsheetsd1IO91C9kVmO4UpzBBHvwrwdrKlxUiiQEO vvXueObIcedituspsharing Tabela 1 PNAD Contínua descrição das variáveis da base de dados Variáveis Descrição ano Ano da pesquisa UF Código da unidade da federação entrevista 1 para a primeira entrevista 2 para a segunda entrevista mulher 1 se mulher 0 se homem Idade Idade em anos negro 1 se negro ou pardo 0 caso contrário rendimento Rendimento no trabalho principal horas Número de horas trabalhadas na semana ccart 1 se empregado com carteira 0 caso contrário scart 1 se empregado sem carteira 0 caso contrário contapropria 1 se trabalhador por contaprópria 0 caso contrário militfpub 1 se militar ou funcionário público 0 caso contrário empregador 1 se empregador 0 caso contrário indice Identificador do indivíduo peso Peso da pessoa na pesquisa Responda as questões a seguir a Usando dados para as duas entrevistas de cada indivíduo estime a regressão a seguir empregando mínimos quadrados ordinários MQO empilhado lnrendimentoit β0 δ0 d2t β1 ccartit β2 scartit β3 contapropriait uit 1 em que d2t é uma dummy que assume o valor 1 para valores referentes a segunda entre vista entrevista 2 e igual a zero caso contrário Note que o grupo de referência para a posição na ocupação é formado por militares funcionários públicos e empregadores Utilize o teste BreuschPagan BP para testar se o termo de erro do modelo 1 estimado por MQO empilhado é heteroscedástico Tendo como base o resultado do teste verifique se os coeficientes das variáveis d2 ccart scart e contapropria na equação 1 são estatisticamente diferentes de zero ao nível de 10 Note que você deverá considerar errospadrão robustos à heteroscedasticidade caso a hipótese nula do teste BP tenha sido rejeitada Reporte códigos todos os resultados e os explique PUCRio Gilberto Boaretto 2 Laboratório de Econometria I 20241 b Agora estime a equação a seguir empregando o estimador de efeitos fixos lnrendimentoit β0 δ0 d2t β1 ccartit β2 scartit β3 contapropriait αi uit 2 em que αi i 1 N representam os efeitos fixos de indivíduo Utilize o teste BreuschPagan BP para verificar se o termo de erro do modelo 2 é heteroscedástico À luz do resultado do teste verifique se os coeficientes estimados por efeitos fixos das variáveis d2 ccart scart e contapropria na equação 2 são estatisticamente diferentes de zero ao nível de 10 Reporte códigos todos os resultados e os explique c Finalmente estime o modelo em primeiras diferenças ou seja estime lnrendimentoi δ0 β1 ccarti β2 scarti β3 contapropriai ui 3 em que representa o operador de primeira diferença Utilize o teste BreuschPagan BP para testar se o termo de erro do modelo 3 estimado por primeiras diferenças é heteroscedástico A partir do resultado do teste verifique se os coeficientes estimados por primeiras di ferenças das variáveis ccart scart e contapropria na equação 3 são estatisticamente diferentes de zero ao nível de 10 Reporte códigos todos os resultados e os explique d Considerando todos os resultados anteriores apresenteos conjuntamente usando o star gazer e interprete e compare os coeficientes estimados por cada métodos para as variá veis d2 ccart scart e contapropria nas equações 1 2 e 3 Lembrese de no caso de termo de erro heteroscedástico reportar errospadrão robustos Reporte códigos outputs e explique sucintamente as diferenças verificadas Questão 2 50 Nesta questão vocês usarão dados individuais da PNAD Contínua As definições das va riáveis utilizadas são apresentadas na Tabela 2 Os dados estão na base de dados intitulada UFdta disponível na pasta PNAD2 do arquivo compactado dadoslista5zip disponível para download no EAD da disciplina Cada aluno ou dupla deverá usar dados da mesma UF escolhida na questão anterior PUCRio Gilberto Boaretto 3 Laboratório de Econometria I 20241 Tabela 2 PNAD descrição das variáveis da base de dados individuais Variáveis Descrição uf Código da unidade da federação mulher 1 se mulher 0 se homem idade Idade em anos negro 1 se negro ou pardo 0 caso contrário rendap Rendimento no trabalho principal anosest Número de anos de estudo horasp Número de horas trabalhadas na semana setor 1 se agrícola 2 se indústria 3 se construção 4 se comércio 5 se serviços 6 se administração e 7 se outros nascmunicip 1 se a pessoa nasceu no município 0 caso contrário npes Número de pessoas no domicílio rfpc Renda familiar per capita desempregado 1 se a pessoa está desempregada 0 se está empregada inativo 1 se a pessoa não está participando do mercado de trabalho 0 caso contrário posocupacao 1 se com carteira 2 se sem carteira 3 se contaprópria 4 se empregador 5 se militar e 6 se funcionário público nc05 Número de crianças com 5 anos ou menos de idade nc610 Número de crianças com idade entre 6 e 10 anos nc1114 Número de crianças com idade entre 11 e 14 anos tempotrab Tempo de casa ao trabalho 0 se 30 minutos ou menos 1 se entre 30 minutos e 1 hora 2 se entre 1 e 2 horas e 3 se mais de 2 horas educm Educação média dos adultos no domicílio recebebolsafamilia 1 se a família recebe Bolsa família 0 caso contrário peso Peso da pessoa na pesquisa Responda as questões a seguir a Estime a probabilidade de um indivíduo não participar do mercado de trabalho inativo 1 em função de uma constante da sua idade idade da escolaridade anosest do gênero mulher e do número de crianças com idade entre 0 e 5 anos no do micílio nc05 usando o modelo de probabilidade linear MPL Utilize errospadrão robustos à heteroscedasticidade Reporte e analise os resultados b Estime a probabilidade de um indivíduo não participar do mercado de trabalho em função dos regressores incluídos no item anterior mas usando o modelo probit Faça o teste BreuschPagan BP de heteroscedasticidade e se necessário reporte os resultados com errospadrão robustos Reporte os resultados Os sinais dos efeitos parciais do modelo probit são semelhantes aos sinais dos efeitos parciais do MPL Comente c Repita o item anterior mas agora estimando um modelo logit Faça o teste Breusch Pagan BP de heteroscedasticidade e se necessário reporte os resultados com erros padrão robustos Reporte os resultados Os sinais dos efeitos parciais do modelo logit são semelhantes aos sinais dos efeitos parciais do MPL Comente d Obtenha e interprete os efeitos parciais médio e na média APE e PAE da variável mulher na probabilidade de um indivíduo não participar do mercado de trabalho de acordo com os modelos probit e logit Reporte códigos outputs e interprete os resulta dos PUCRio Gilberto Boaretto 4 Laboratório de Econometria I 20241 Dica os comandos probitmfx e logitmfx do package mfx calcula tanto o efeito parcial médio APE quanto o efeito parcial na média PAE Observação atentese para a configuração do argumento atmean Compare os efeitos parciais com o coeficiente obtido para a variável mulher no modelo de probabilidade linear MPL estimado por MQO No caso das diferenças se mostrarem acentuadas explique o motivo para isso PUCRio Gilberto Boaretto 5 Lista 5 Rafael 20240627 Questão 1 A tibble 10 15 ano UF entrevista peso idade mulher negro rendimento horas indice ccart dbl dbl dbl dbl dbl dbl dbl dbl dbl dbl dbl 1 2012 31 1 173 53 0 0 0 38 120e6 0 2 2015 31 1 532 28 1 0 2479 40 120e6 0 3 2012 31 1 665 55 1 0 1924 44 119e6 1 4 2013 31 2 255 35 1 1 914 20 115e6 0 5 2014 31 1 100 33 1 0 631 48 119e6 0 6 2015 31 2 921 54 0 0 3216 48 120e6 0 7 2014 31 2 1153 41 0 1 3158 18 122e6 1 8 2013 31 2 228 44 1 1 1546 30 115e6 0 9 2015 31 1 276 64 0 1 672 44 130e6 1 10 2016 31 1 1033 48 0 1 1805 48 133e6 1 ℹ 4 more variables scart dbl militfpub dbl empregador dbl contapropria dbl a MQO Empilhado com teste BreuschPagan O modelo a ser estimado é ln rendiment oβ0δ0d 2tβ1 ccar t β2scar t β3contapropriau em que d 2t é uma dummy que assume o valor 1 para valores referentes a segunda entrevista entrevista 2 e igual a zero caso contrário Criando a variável dummy d2 dadosd2 ifelsedadosentrevista 2 1 0 attachdados headdados 10 A tibble 10 16 ano UF entrevista peso idade mulher negro rendimento horas indice ccart dbl dbl dbl dbl dbl dbl dbl dbl dbl dbl dbl 1 2012 31 1 173 53 0 0 0 38 120e6 0 2 2015 31 1 532 28 1 0 2479 40 120e6 0 3 2012 31 1 665 55 1 0 1924 44 119e6 1 4 2013 31 2 255 35 1 1 914 20 115e6 0 5 2014 31 1 100 33 1 0 631 48 119e6 0 6 2015 31 2 921 54 0 0 3216 48 120e6 0 7 2014 31 2 1153 41 0 1 3158 18 122e6 1 8 2013 31 2 228 44 1 1 1546 30 115e6 0 9 2015 31 1 276 64 0 1 672 44 130e6 1 10 2016 31 1 1033 48 0 1 1805 48 133e6 1 ℹ 5 more variables scart dbl militfpub dbl empregador dbl contapropria dbl d2 dbl Modelo MQO Emplilhado dadoslogrendimento logrendimento dados2 subsetdados isfinitelogrendimento m1 lmlogrendimento d2 ccart scart contapropria data dados2 summarym1 Call lmformula logrendimento d2 ccart scart contapropria data dados2 Residuals Min 1Q Median 3Q Max 46144 04647 00379 03924 38084 Coefficients Estimate Std Error t value Prt Intercept 7491027 0014187 528010 2e16 d2 0008526 0009965 0856 0392 ccart 0535608 0015186 35271 2e16 scart 1106900 0017587 62938 2e16 contapropria 0832139 0016933 49144 2e16 Signif codes 0 0001 001 005 01 1 Residual standard error 07324 on 21608 degrees of freedom Multiple Rsquared 0172 Adjusted Rsquared 01719 Fstatistic 1122 on 4 and 21608 DF pvalue 22e16 Como o pvalor do tetes F foi de aproximadamente 0 isso significa que o modelo MOQ Empilhado é estatisticamente significativo ou seja pelo menos uma variável independente é capaz de explicar as variações da variável dependente que é log rendiment o De acordo com o pvalor do teste T as variáveis independentes ccart scart e contapropria são estatisticamente significativas pvalor01 isso significa que elas são capazes de explicar as variações da variável dependente Por outro lado a variável independente d 2 não se mostrou estatisticamente significativa pvalor01 Teste BreuschPagan para heteroscedasticidade librarylmtest Carregando pacotes exigidos zoo Attaching package zoo The following objects are masked from packagebase asDate asDatenumeric bptestm1 studentized BreuschPagan test data m1 BP 86416 df 4 pvalue 22e16 O teste BreuschPagan studentizado indica que há evidências significativas de heterocedasticidade nos resíduos do modelo Isso significa que a variância dos erros não é constante para todos os níveis das variáveis independentes o que pode afetar a eficiência dos estimadores e a validade das inferências estatísticas realizadas Errospadrões Robusto librarysandwich Warning package sandwich was built under R version 433 coefs coefm1 se sqrtdiagvcovHCm1 Verificando significância ao nível de 10 pvalor 1 ptabscoefs se df nrowdados2 lengthcoefs pvalor Intercept d2 ccart scart contapropria 00000000 01961666 00000000 00000000 00000000 Os pvalores calculados com errospadrões robusto confirma que as variáveis independentes ccart scart e contapropria são estatísticamente significativas no modelo de regressão linear multiplo por MQO Emplilhado encontrato a variável indepnendte d 2 se mostrou não ser significativa no modelo b Estimador de Efeitos Fixos O modelo a ser estimado é ln rendiment oβ0δ0d 2tβ1 ccar t β2scar t β3contapropriaα iu Onde αi12 N representam os efeitos fixos de indivíduo libraryplm Warning package plm was built under R version 433 Convertendo dados para o formato de painel dados3 pdataframedados2 index cano Estimando o modelo de efeitos fixos m2 plmlogrendimento d2 ccart scart contapropria data dados3 model within summarym2 Oneway individual effect Within Model Call plmformula logrendimento d2 ccart scart contapropria data dados3 model within Unbalanced Panel n 6 T 5664495 N 21613 Residuals Min 1st Qu Median 3rd Qu Max 4634940 0462508 0037336 0389584 3778508 Coefficients Estimate Std Error tvalue Prt d2 0016344 0010104 16175 01058 ccart 0536264 0015173 353437 2e16 scart 1106104 0017573 629451 2e16 contapropria 0833660 0016923 492624 2e16 Signif codes 0 0001 001 005 01 1 Total Sum of Squares 13975 Residual Sum of Squares 11568 RSquared 017224 Adj RSquared 01719 Fstatistic 112381 on 4 and 21603 DF pvalue 222e16 De acordo com o pvalor do teste F o modelo é estatisticamente significativo ou seja o modelo é capaz de explicar as variações da variável log rendiment o analogamente tem se que as variáveis ccart scart e contapropria são estatisticamente significantes no modelo enquando a variável independente dummy d 2 não se mostrou novamente estatisticamente significante para explicar as variações da variável dependente Também é notal que o coeficiente de determinação R 2 foi semelhante em ambos os modelos seu valor é de aproximadamente 0172 ou seja os modelos explicam cerca de 172 da variação do log rendiment o Teste BreuschPagan para heteroscedasticidade nos efeitos fixos bptestm2 studentized BreuschPagan test data m2 BP 86416 df 4 pvalue 22e16 O teste BP indica que há evidências significativas de heterocedasticidade nos resíduos do modelo Isso significa que a variância dos erros não é constante para todos os níveis das variáveis independentes o que pode afetar a eficiência dos estimadores e a validade das inferências estatísticas realizadas c Primeiras Diferenças com teste BreuschPagan O modelo a ser estimado é Δln rendiment oδ0β1 ccar tβ2scar t β3contapropriaα i Δu em que Δ representa o operador de primeira diferença m3 plmdifflogrendimento ccart scart contapropria data dados3 model fd summarym3 Oneway individual effect FirstDifference Model Call plmformula difflogrendimento ccart scart contapropria data dados3 model fd Unbalanced Panel n 6 T 5654494 N 21607 Observations used in estimation 21601 Residuals Min 1st Qu Median 3rd Qu Max 9793037 1081611 0052102 1110928 11331690 Coefficients Estimate Std Error tvalue Prt Intercept 000018369 001254425 00146 09883 ccart 080068907 002701562 296380 2e16 scart 168555954 003133792 537866 2e16 contapropria 126366386 003011220 419652 2e16 Signif codes 0 0001 001 005 01 1 Total Sum of Squares 84621 Residual Sum of Squares 73410 RSquared 013248 Adj RSquared 013236 Fstatistic 109934 on 3 and 21597 DF pvalue 222e16 O modelo se mostrou estatisticamente significativo e com todas as variáveis independentes significativas e com um nível de significância de 10 o parametro estimado δ 0 não é estatisticamente significativo O coeficiente de determinação do modelo foi um pouco menor que os outros com o valor de 01325 ou seja cerca de 1325 das variações da Δlog rendiment o é explicada pelo modelo bptestm3 studentized BreuschPagan test data m3 BP 23335 df 3 pvalue 22e16 O teste BP indica que há evidências significativas de heterocedasticidade nos resíduos do modelo Isso significa que a variância dos erros não é constante para todos os níveis das variáveis independentes o que pode afetar a eficiência dos estimadores e a validade das inferências estatísticas realizadas d Comparação dos Resultados librarystargazer Please cite as Hlavac Marek 2022 stargazer WellFormatted Regression and Summary Statistics Tables R package version 523 httpsCRANRprojectorgpackagestargazer Criando um vetor com os modelos estimados modelos listMQO empilhado m1 Efeitos fixos m2 Primeiras diferenças m3 Gerando a tabela com stargazer stargazermodelos type text se listcoefm1 coefm2 coefm3 Dependent variable logrendimento difflogrendimento OLS panel panel linear linear 1 2 3 d2 0009 0016 0009 0016 ccart 0536 0536 0801 0536 0536 0801 scart 1107 1106 1686 1107 1106 1686 contapropria 0832 0834 1264 0832 0834 1264 Constant 7491 00002 7491 00002 Observations 21613 21613 21601 R2 0172 0172 0132 Adjusted R2 0172 0172 0132 Residual Std Error 0732 df 21608 F Statistic 1122432 df 4 21608 1123809 df 4 21603 1099341 df 3 21597 Note p01 p005 p001 Os modelos apresentados oferecem diferentes abordagens para analisar a relação entre as variáveis explicativas e o rendimento utilizando dados de painel O Modelo 1 baseado em Mínimos Quadrados Ordinários MQO empilhados estima diretamente os efeitos das variáveis como d 2 indicando a segunda entrevista ccart empregado com carteira scart empregado sem carteira contapropria trabalhador por conta própria e uma constante sobre o logaritmo do rendimento Este modelo considera todas as observações empilhadas ignorando efeitos individuais não observados persistentes ao longo do tempo O Modelo 2 usando Efeitos Fixos controla esses efeitos individuais inobservados que podem ser constantes ao longo do tempo para cada indivíduo Isso permite focar nas variações dentro dos indivíduos ao longo do tempo capturando melhor as mudanças no rendimento que são específicas de cada pessoa além das características que variam entre os indivíduos O Modelo 3 baseado em Primeira Diferença estima as mudanças no rendimento ao longo do tempo eliminando os efeitos fixos individuais não observados Ele é útil para analisar como as variáveis explicativas influenciam as variações no rendimento dentro dos indivíduos ao longo de períodos consecutivos Cada modelo apresenta seus próprios coeficientes estimados medidas de ajuste como R 2 e estatísticas F para testar a significância conjunta das variáveis explicativas Essas abordagens permitem uma análise abrangente das relações entre as variáveis explicativas como tipo de emprego e entrevista e o rendimento considerando tanto variações individuais como mudanças ao longo do tempo Ambos os modelos se mostraram estatisticamente significativo o Modelo 3 foi o que teve o menor R 2 isso inidica que é o modelo que menor explica as variações da variável dependente já a variável d 2 se mostrou não significativa nos modelos 1 e 2 Questão 2 A tibble 10 21 uf idade rendap peso recebebolsafamilia mulher negro anosest rfpc dbl dbl dbl dbl dbl dbl dbl dbl dbl 1 31 16 0 393 0 0 1 7 780 2 31 40 530 392 0 0 1 8 292 3 31 39 0 579 0 1 0 5 725 4 31 17 0 392 0 0 1 9 280 5 31 4 0 578 0 0 1 0 833 6 31 26 350 393 0 1 0 11 407 7 31 26 0 392 1 1 1 11 845 8 31 10 0 579 0 1 1 3 260 9 31 19 0 392 0 0 1 8 80 10 31 47 260 578 0 1 1 4 317 ℹ 12 more variables npes dbl horasp dbl desempregado dbl inativo dbl setor dbl posocupacao dbl nc05 dbl nc610 dbl nc1114 dbl educm dbl tempotrabalho dbl nascmunicip dbl a Modelo de Probabilidade Linear MPL m4 lminativo idade anosest mulher nc05 data dados4 summarym4 Call lmformula inativo idade anosest mulher nc05 data dados4 Residuals Min 1Q Median 3Q Max 091925 038104 002943 035893 129868 Coefficients Estimate Std Error t value Prt Intercept 08219072 00189570 43356 2e16 idade 00041699 00003807 10953 2e16 anosest 00484052 00016970 28524 2e16 mulher 01640604 00144751 11334 2e16 nc05 00012868 00116289 0111 0912 Signif codes 0 0001 001 005 01 1 Residual standard error 04331 on 3609 degrees of freedom 2 observations deleted due to missingness Multiple Rsquared 02498 Adjusted Rsquared 02489 Fstatistic 3004 on 4 and 3609 DF pvalue 22e16 O modelo revela que idade anos deestudo e gê nero têm influências significativas na probabilidade de um indivíduo estar inativo no mercado de trabalho Especificamente cada ano a mais de idade está associado a uma diminuição de aproximadamente 00042 unidades na probabilidade de inatividade enquanto cada ano adicional de estudo reduz essa probabilidade em cerca de 00484 unidades Ser mulher aumenta a probabilidade de inatividade em aproximadamente 01641 unidades No entanto o número de crianças de 0 a 5 anos no domicílio nc05 não demonstrou ter um efeito estatisticamente significativo sobre a inatividade no mercado de trabalho neste modelo O ajuste do modelo medido pelo coeficiente de determinação R 2 de 02498 indica que cerca de 2498 da variabilidade na inatividade pode ser explicada pelas variáveis incluídas O teste F com um valorp extremamente baixo confirma que o modelo como um todo é estatisticamente significativo errospadrão robustos serobusto sqrtdiagvcovHCm4 type HC1 Extraindo coeficientes e pvalues coefs2 coefm4 pvalores 1ptabscoefs2 serobusto df nrowdados4 lengthcoefs2 sigm4 pvalores 005 considerando significância ao nível de 5 Criando tabela de resultados resultados dataframe Coeficientes coefs2 SERobustos serobusto PValue pvalores Significativo sigm4 resultados Coeficientes SERobustos PValue Significativo Intercept 0821907167 00177027945 00000000 TRUE idade 0004169906 00004104731 00000000 TRUE anosest 0048405219 00016393120 00000000 TRUE mulher 0164060365 00144089133 00000000 TRUE nc05 0001286811 00102202455 04499059 FALSE b Modelo Probit libraryMASS Estimando o modelo Probit m5 glminativo idade anosest mulher nc05 data dados4 family binomiallink probit summarym5 Call glmformula inativo idade anosest mulher nc05 family binomiallink probit data dados4 Coefficients Estimate Std Error z value Prz Intercept 0983367 0062242 15799 2e16 idade 0013152 0001220 10781 2e16 anosest 0145345 0005875 24740 2e16 mulher 0509146 0046652 10914 2e16 nc05 0023024 0037964 0606 0544 Signif codes 0 0001 001 005 01 1 Dispersion parameter for binomial family taken to be 1 Null deviance 50049 on 3613 degrees of freedom Residual deviance 39923 on 3609 degrees of freedom 2 observations deleted due to missingness AIC 40023 Number of Fisher Scoring iterations 5 O modelo de regressão logística probit estimado indica que idade anos deestudo e ser mul her têm efeitos estatisticamente significativos na probabilidade de um indivíduo estar inativo no mercado de trabalho Especificamente cada ano a mais de idade está associado a uma redução de aproximadamente 00132 na probabilidade de inatividade enquanto cada ano adicional de estudo diminui essa probabilidade em cerca de 01453 Ser mulher aumenta a probabilidade de inatividade em aproximadamente 05091 unidades Por outro lado o número de crianças de 0 a 5 anos no domicílio nc05 não mostrou ter um efeito estatisticamente significativo sobre a probabilidade de inatividade neste modelo O ajuste do modelo medido pelo AIC de 40023 indica que ele se adequa bem aos dados disponíveis com a desvio residual indicando um bom ajuste do modelo aos dados observados Teste de BreuschPagan para heteroscedasticidade bptestm5 studentized BreuschPagan test data m5 BP 4743 df 4 pvalue 22e16 O teste BP aplicado ao modelo m5 indica heterocedasticidade significativa nos resíduos com um pvalor muito baixo aproximadamente zero Isso implica que os erros padrão dos coeficientes estimados deve ser corrigidos utilizando métodos robustos para lidar com essa heterogeneidade na variância dos resíduos Calculando errospadrão robustos serobustoprobit sqrtdiagvcovHCm5 type HC1 Extraindo coeficientes e pvalues coefsprobit coefm5 pvaloresprobit 1 ptabscoefsprobit serobustoprobit df nrowdados4 lengthcoefsprobit sigprobit pvaloresprobit 005 considerando significância ao nível de 5 Criando tabela de resultados resultadoprobit dataframe Coeficientes coefsprobit SERobustos serobustoprobit PValores pvaloresprobit Significância sigprobit resultadoprobit Coeficientes SERobustos PValores Significância Intercept 098336724 0061861167 00000000 TRUE idade 001315161 0001355490 00000000 TRUE anosest 014534468 0006574139 00000000 TRUE mulher 050914580 0047688518 00000000 TRUE nc05 002302374 0033618653 02467412 FALSE c Modelo Logit m6 glminativo idade anosest mulher nc05 data dados4 family binomiallink logit summarym6 Call glmformula inativo idade anosest mulher nc05 family binomiallink logit data dados4 Coefficients Estimate Std Error z value Prz Intercept 1674151 0107683 1555 2e16 idade 0023200 0002076 1118 2e16 anosest 0248781 0010454 2380 2e16 mulher 0884832 0079556 1112 2e16 nc05 0019491 0064867 030 0764 Signif codes 0 0001 001 005 01 1 Dispersion parameter for binomial family taken to be 1 Null deviance 50049 on 3613 degrees of freedom Residual deviance 39800 on 3609 degrees of freedom 2 observations deleted due to missingness AIC 3990 Number of Fisher Scoring iterations 4 O modelo logit estimado mostra que idade anos deestudo e ser mul her são variáveis significativas na probabilidade de um indivíduo estar inativo no mercado de trabalho Especificamente cada ano a mais de idade reduz a probabilidade de inatividade enquanto anos adicionais de estudo e ser mulher aumentam essa probabilidade O número de crianças de 0 a 5 anos no domicílio não apresentou impacto significativo O modelo ajusta se bem aos dados conforme indicado pelo AIC de 3990 e pelo desvio e residual Teste de BreuschPagan para heteroscedasticidade bptestm6 studentized BreuschPagan test data m6 BP 4743 df 4 pvalue 22e16 O teste BP aplicado ao modelo m5 indica heterocedasticidade significativa nos resíduos com um pvalor muito baixo aproximadamente zero Isso implica que os erros padrão dos coeficientes estimados deve ser corrigidos utilizando métodos robustos para lidar com essa heterogeneidade na variância dos resíduos Calculando errospadrão robustos serobustologit sqrtdiagvcovHCm6 type HC1 Extraindo coeficientes e pvalues coefslogit coefm6 pvaloreslogit 1 ptabscoefslogit serobustologit df nrowdados4 lengthcoefslogit siglogit pvaloreslogit 005 considerando significância ao nível de 5 Criando tabela de resultados resultadologit dataframe Coeficientes coefslogit SERobustos serobustologit PValores pvaloreslogit Significância siglogit resultadologit Coeficientes SERobustos PValores Significância Intercept 167415133 0103721266 00000000 TRUE idade 002320043 0002214962 00000000 TRUE anosest 024878086 0011119641 00000000 TRUE mulher 088483187 0080853982 00000000 TRUE nc05 001949097 0058300264 03690786 FALSE d Efeitos Parciais Médio e na Média APE e PAE librarymfx Warning package mfx was built under R version 433 Carregando pacotes exigidos betareg Warning package betareg was built under R version 433 Calculando efeitos parciais médio e na média para Probit mfxprobit probitmfxm5 atmean TRUE data dados4 mfxprobit Call probitmfxformula m5 data dados4 atmean TRUE Marginal Effects dFdx Std Err z Pz idade 000523394 000048521 107870 2e16 anosest 005784271 000234166 247016 2e16 mulher 020048269 001797852 111512 2e16 nc05 000916274 001510784 06065 05442 Signif codes 0 0001 001 005 01 1 dFdx is for discrete change for the following variables 1 mulher Calculando efeitos parciais médio e na média para Logit mfxlogit logitmfxm6 atmean TRUE data dados4 mfxlogit Call logitmfxformula m6 data dados4 atmean TRUE Marginal Effects dFdx Std Err z Pz idade 000578871 000051747 111865 2e16 anosest 006207299 000261311 237544 2e16 mulher 021727935 001891636 114863 2e16 nc05 000486317 001618421 03005 07638 Signif codes 0 0001 001 005 01 1 dFdx is for discrete change for the following variables 1 mulher Os efeitos marginais médios calculados nos modelos probit e logit indicam que idade anos deestudo e ser mul her têm impactos estatisticamente significativos na probabilidade de um indivíduo estar inativo no mercado de trabalho Especificamente um ano a mais de idade reduz essa probabilidade em cerca de 052 no modelo probit e 058 no modelo logit Cada ano adicional de estudo diminui a probabilidade de inatividade em aproximadamente 578 no probit e 621 no logit Ser mulher aumenta a probabilidade de inatividade em aproximadamente 2005 no probit e 2173 no logit Por outro lado o número de crianças de 0 a 5 anos no domicílio não mostrou ter um impacto significativo na probabilidade de inatividade conforme indicado pela falta de significância estatística em ambos os modelos