·
Economia ·
Econometria
Send your question to AI and receive an answer instantly
Recommended for you
5
Análise de Covariância e Variância em Processos Estocásticos
Econometria
IBMEC
2
Análise de Séries Temporais com ARIMA e Diagnóstico de Estacionaridade
Econometria
IBMEC
9
Atividade no R
Econometria
IBMEC
23
Introdução às Séries Temporais: Conceitos Fundamentais e Previsões
Econometria
IBMEC
2
Lista de Exercicios Microeconometria IbmecRJ 2023-2 - Analise de Dados PNAD
Econometria
IBMEC
8
Resumo sobre Processos Estocásticos e Determinísticos
Econometria
IBMEC
1
Analise-Fatores-Influenciam-Preco-Petroleo-Modelo-Regressao-Multipla
Econometria
IBMEC
Preview text
Microeconometria IbmecRJ 20232 Prof Gilberto Boaretto Lista de Exercıcios Praticos 2 Entrega ate 01112023 quartafeira as 23h59 via Teams Valor 5 de 20 da AC 5 da nota total do curso INSTRUC OES Consulte codigos de R na aula 10 sobre variaveis instrumentais e aulas anteriores sobre MQO se necessario Na pasta do Dropbox e no Teams vocˆe encontrara a base de dados carddta Organizem o trabalho de modo a ter sequencialmente na resposta para cada questao codigo em R output tabela ou figura com resultados e explicacao se solicitado Mandem o trabalho em formato PDF Retorno salarial da educacao O arquivo carddta contem informacoes de 3010 indivıduos do sexo masculino extraıdas da NLS Young Men Cohort of the National Longitudinal Survey A variavel lwage denota o logaritmo natural do salario por hora dos indivıduos a variavel educ denota o numero de anos de escolaridade do indivıduo exper denota o numero de anos de experiˆencia do indivıduo black e uma dummy que denota se o indivıduo e negro married e uma dummy que indica se o indivıduo e casado smsa e uma dummy que indica se o indivıduo em uma regiao metropolitana e nearc4 e uma dummy que indica a presenca de faculdades no condado onde o indivıduo reside Considere o seguinte modelo empırico conectando salarios e escolaridade lwage β0 β1 educ β2 exper β3 black β4 south β5 married β6 smsa ui 1 Utilize os dados da NLS Young Men Cohort of the National Longitudinal Survey para estimar empregando mınimos quadrados ordinarios MQO os parˆametros desse modelo empırico Interprete os coeficientes desse modelo 2 Discuta que hipotese e necessaria para que o parˆametro associado a escolaridade seja nao viesado Discuta se essa hipotese e plausıvel nesse caso 3 David Card sugere que a presenca de faculdades em um condado pode ser um bom instrumento para a educacao porque a proximidade de faculdades muda exogenamente os custos de frequentar uma faculdade Discuta as hipoteses necessarias para near4c ser um bom instrumento para educ 4 Reestime os parˆametros do modelo empırico conectando salarios com caracterısticas individuais por mınimos quadrados de dois estagios MQ2E utilizando near4c como instrumento para educ Interprete os resultados do modelo 5 Discuta as diferencas entre os parˆametros associados a escolaridade estimados por MQO e MQ2E 1 Lista de Exercícios Praticos 2 20231031 Enunciado O arquivo carddta contém informações de 3010 indivíduos do sexo masculino extraídas da NLS Young Men Cohort of the National Longitudinal Survey A variável lwage denota o logaritmo natural do salário por hora dos indivíduos a variável educ denota o número de anos de escolaridade do indivíduo exper denota o número de anos de experiência do indivíduo black é uma dummy que denota se o indivíduo é negro married é uma dummy que indica se o indivíduo é casado smsa é uma dummy que indica se o indivíduo em uma região metropolitana e nearc4 é uma dummy que indica a presença de faculdades no condado onde o indivíduo reside Considere o seguinte modelo empírico conectando salários e escolaridade l wa geβ0β1e ducβ2 e x pe r β3bl ac kβ4s out hβ5m arr i edβ6s ms aui Questão 1 Utilize os dados da NLS Young Men Cohort of the National Longitudinal Survey para estimar empregando mínimos quadrados ordinários MQO os parâmetros desse modelo empírico Interprete os coeficientes desse modelo Exportando os dados libraryhaven dados readdtacarddta attachdados m1 lmlwage educ exper black south married smsa summarym1 Call lmformula lwage educ exper black south married smsa Residuals Min 1Q Median 3Q Max 159924 023035 001812 023046 136797 Coefficients Estimate Std Error t value Prt Intercept 5063317 0063740 79437 2e16 educ 0071173 0003482 20438 2e16 exper 0034152 0002214 15422 2e16 black 0166027 0017614 9426 2e16 south 0131552 0014969 8788 2e16 married 0035871 0003401 10547 2e16 smsa 0175787 0015458 11372 2e16 Signif codes 0 0001 001 005 01 1 Residual standard error 03702 on 2996 degrees of freedom 7 observations deleted due to missingness Multiple Rsquared 0305 Adjusted Rsquared 03036 Fstatistic 2192 on 6 and 2996 DF pvalue 22e16 Considerando um nível de significância de 5 podemos concluir que o Modelo de Regressão Linear Múltipla MRLM é estatisticamente significativo Isso se baseia no teste F que obteve um pvalor menor que 005 Portanto rejeitamos a hipótese nula de que o modelo não é significativo indicando que o MRLM é capaz de explicar as variações da variável dependente lwage Ao analisar os parâmetros individualmente pelo teste t observamos que todos os parâmetros são significativos a um nível de 5 de significância Isso significa que cada variável independente ou coeficiente contribui de maneira estatisticamente significativa para a explicação das variações em lwage Além disso o coeficiente de determinação R 2 foi calculado como 03036 Isso indica que aproximadamente 3036 das variações no logaritmo natural dos salários são explicadas pelo modelo Em outras palavras o modelo é capaz de capturar uma parcela significativa da variabilidade em lwage No entanto é importante notar que ainda existe uma quantidade considerável de variação que não é explicada pelo modelo Sendo assim o modelo estomado foi l wa ge5063300712ed uc00342 e x pe r01660bl ac k 01316 sout h00359 mar r ie d01758 sm s aui Questão 2 Discuta que hipótese é necessária para que o parâmetro associado à escolaridade seja não viesado Discuta se essa hipótese é plausível nesse caso Para que um parâmetro seja não viesado é preciso que E β β Isso significa que para que o parâmetro associado à escolaridade β1 seja não viesado é necessário que a variável educ número de anos de escolaridade seja exógena em relação ao modelo ou seja que ela não seja correlacionada com o termo de erro ui Em outras palavras a escolaridade não deve ser endógena ou seja não deve ser afetada por outros fatores não observados no modelo No contexto do modelo onde lwage logaritmo natural do salário por hora é modelado em relação à escolaridade educ e outras variáveis independentes a hipótese de exogeneidade da escolaridade pode ser plausível desde que a escolaridade seja determinada fora do modelo ou seja não seja influenciada por fatores não observados na equação No entanto existem situações em que a exogeneidade da escolaridade pode ser questionável Por exemplo se houver evidências de que a escolaridade seja influenciada por variáveis não observadas que também afetam o salário como salários médio dos pais isso poderia levar a um viés nos coeficientes estimados Questão 3 David Card sugere que a presença de faculdades em um condado pode ser um bom instrumento para a educação porque a proximidade de faculdades muda exogenamente os custos de frequentar uma faculdade Discuta as hipóteses necessárias para nearc4 ser um bom instrumento para educ Em primeiro lugar o instrumento deve ser relevante para a variável endógena educ Isso significa que o nearc4 deve estar significativamente correlacionado com a educação dos indivíduos Essa relevância é essencial para garantir que o instrumento tenha um impacto potencial na variável de interesse Em segundo lugar o nearc4 deve satisfazer a hipótese de exogeneidade Isso implica que o nearc4 não está associado ao termo de erro ui do modelo A exogeneidade assegura que o instrumento não seja afetado por fatores não observados que possam influenciar tanto a educação quanto a variável de resultado evitando assim vieses nos resultados Por fim o nearc4 não deve estar correlacionado com outras variáveis explicativas excluindo a própria educ Isso é importante para garantir que o instrumento seja especificamente relevante para a educação e não introduza correlação espúria com outras variáveis independentes o que poderia afetar negativamente a validade das estimativas Portanto a validade do instrumento nearc4 depende de sua capacidade de satisfazer essas três hipóteses críticas o que é fundamental para garantir que a análise seja livre de vieses de endogeneidade e produza resultados confiáveis Questão 4 Reestime os parâmetros do modelo empírico conectando salários com características individuais por mínimos quadrados de dois estágios MQ2E utilizando nearc4 como instrumento para educ Interprete os resultados do modelo Exportando os dados Etapa 1 Estime os coeficientes do primeiro estágio modelo de educação em função de nearc4 firststage lmeduc nearc4 summaryfirststage Call lmformula educ nearc4 Residuals Min 1Q Median 3Q Max 11698 1527 0527 2473 5302 Coefficients Estimate Std Error t value Prt Intercept 1269801 008564 148269 2e16 nearc4 082902 010370 7994 184e15 Signif codes 0 0001 001 005 01 1 Residual standard error 2649 on 3008 degrees of freedom Multiple Rsquared 002081 Adjusted Rsquared 002048 Fstatistic 6391 on 1 and 3008 DF pvalue 1838e15 Etapa 2 Estime o segundo estágio modelo principal usando os resultados do primeiro estágio m2 lmlwage fittedfirststage exper black south married smsa summarym2 Call lmformula lwage fittedfirststage exper black south married smsa Residuals Min 1Q Median 3Q Max 15503 02458 00088 02607 14359 Coefficients Estimate Std Error t value Prt Intercept 5629816 0267164 21073 2e16 fittedfirststage 0049018 0020263 2419 001562 exper 0005372 0001822 2948 000322 black 0233335 0018449 12647 2e16 south 0150085 0016113 9314 2e16 married 0041001 0003617 11336 2e16 smsa 0199967 0017296 11561 2e16 Signif codes 0 0001 001 005 01 1 Residual standard error 03948 on 2996 degrees of freedom 7 observations deleted due to missingness Multiple Rsquared 02097 Adjusted Rsquared 02081 Fstatistic 1325 on 6 and 2996 DF pvalue 22e16 No primeiro estágio realizamos uma regressão linear para avaliar como a proximidade de faculdades representada pela variável nearc4 influencia a educação dos indivíduos Os resultados revelam que a proximidade de faculdades tem um impacto estatisticamente significativo na educação Para cada aumento unitário em nearc4 a média da educação dos indivíduos aumenta aproximadamente 08290 anos Isso indica que a disponibilidade de instituições educacionais próximas está associada a níveis mais elevados de escolaridade entre os participantes do estudo No entanto a parcela de variação explicada no modelo é relativamente baixa cerca de 208 sugerindo que outros fatores também desempenham um papel importante na determinação da educação No segundo estágio o modelo principal explora como o logaritmo natural dos salários lwage é influenciado por diversas variáveis incluindo a educação prevista a partir do primeiro estágio fittedfirststage Os resultados indicam que a educação continua a ser um preditor significativo dos salários mesmo após controlar outros fatores como experiência exper etnia black localização geográfica south e smsa e estado civil married O coeficiente associado a fittedfirststage é positivo 0049 o que significa que mantendo todas as outras variáveis constantes um aumento de 1 ano de educação conforme previsto a partir do primeiro estágio resulta em um aumento de 0049 na ariável lwage Globalmente o modelo MQ2E aponta que a proximidade de faculdades nearc4 é um instrumento útil para explicar a educação educ e que a educação tem um efeito positivo e significativo nos salários lwage quando outras variáveis são consideradas O coeficiente de determinação R 2 de 2097 no segundo estágio sugere que o modelo é capaz de explicar uma parte substancial da variação nos salários mas ainda existe variação não explicada Portanto esses resultados destacam a importância da educação na determinação dos salários ao mesmo tempo em que reconhecem a presença de outros fatores que também desempenham um papel relevante nesse contexto Questão 3 Discuta as diferenças entre os parâmetros associados á escolaridade estimados por MQO e MQ2E Comparando os parâmetros associados à variável educação estimados pelo Modelo de Mínimos Quadrados Ordinários MQO e pelo Modelo de Mínimos Quadrados de Dois Estágios MQ2E observamos diferenças significativas No MQO o coeficiente de educação educ é estimado em 00711 indicando que um aumento de um ano de escolaridade está associado a um aumento de 00711 no logaritmo natural dos salários lwage Este coeficiente é altamente significativo No entanto no MQ2E o coeficiente associado à educação prevista a partir do primeiro estágio é estimado em 00490 com um erro padrão maior Essa diferença reflete o esforço do MQ2E em controlar a endogeneidade da educação Portanto o MQ2E fornece uma estimativa mais conservadora do efeito da educação nos salários enquanto o MQO pode superestimar esse efeito devido à endogeneidade A escolha entre os modelos depende da validade das hipóteses do MQ2E e da natureza das relações nas variáveis envolvidas Lista de Exercícios Praticos 2 20231031 Enunciado O arquivo carddta contém informações de 3010 indivíduos do sexo masculino extraídas da NLS Young Men Cohort of the National Longitudinal Survey A variável lwage denota o logaritmo natural do salário por hora dos indivíduos a variável educ denota o número de anos de escolaridade do indivíduo exper denota o número de anos de experiência do indivíduo black é uma dummy que denota se o indivíduo é negro married é uma dummy que indica se o indivíduo é casado smsa é uma dummy que indica se o indivíduo em uma região metropolitana e nearc4 é uma dummy que indica a presença de faculdades no condado onde o indivíduo reside Considere o seguinte modelo empírico conectando salários e escolaridade 𝑙𝑤𝑎𝑔𝑒 𝛽0 𝛽1 𝑒𝑑𝑢𝑐 𝛽2 𝑒𝑥𝑝𝑒𝑟 𝛽3 𝑏𝑙𝑎𝑐𝑘 𝛽4 𝑠𝑜𝑢𝑡ℎ 𝛽5 𝑚𝑎𝑟𝑟𝑖𝑒𝑑 𝛽6𝑠𝑚𝑠𝑎 𝑢𝑖 Questão 1 Utilize os dados da NLS Young Men Cohort of the National Longitudinal Survey para estimar empregando mínimos quadrados ordinários MQO os parâmetros desse modelo empírico Interprete os coeficientes desse modelo Exportando os dados libraryhaven dados readdtacarddta attachdados m1 lmlwage educ exper black south married smsa summarym1 Call lmformula lwage educ exper black south married smsa Residuals Min 1Q Median 3Q Max 159924 023035 001812 023046 136797 Coefficients Estimate Std Error t value Prt Intercept 5063317 0063740 79437 2e16 educ 0071173 0003482 20438 2e16 exper 0034152 0002214 15422 2e16 black 0166027 0017614 9426 2e16 south 0131552 0014969 8788 2e16 married 0035871 0003401 10547 2e16 smsa 0175787 0015458 11372 2e16 Signif codes 0 0001 001 005 01 1 Residual standard error 03702 on 2996 degrees of freedom 7 observations deleted due to missingness Multiple Rsquared 0305 Adjusted Rsquared 03036 Fstatistic 2192 on 6 and 2996 DF pvalue 22e16 Considerando um nível de significância de 5 podemos concluir que o Modelo de Regressão Linear Múltipla MRLM é estatisticamente significativo Isso se baseia no teste F que obteve um pvalor menor que 005 Portanto rejeitamos a hipótese nula de que o modelo não é significativo indicando que o MRLM é capaz de explicar as variações da variável dependente lwage Ao analisar os parâmetros individualmente pelo teste t observamos que todos os parâmetros são significativos a um nível de 5 de significância Isso significa que cada variável independente ou coeficiente contribui de maneira estatisticamente significativa para a explicação das variações em lwage Além disso o coeficiente de determinação 𝑅2 foi calculado como 03036 Isso indica que aproximadamente 3036 das variações no logaritmo natural dos salários são explicadas pelo modelo Em outras palavras o modelo é capaz de capturar uma parcela significativa da variabilidade em lwage No entanto é importante notar que ainda existe uma quantidade considerável de variação que não é explicada pelo modelo Sendo assim o modelo estomado foi 𝑙𝑤𝑎𝑔𝑒 50633 00712 𝑒𝑑𝑢𝑐 00342 𝑒𝑥𝑝𝑒𝑟 01660 𝑏𝑙𝑎𝑐𝑘 01316 𝑠𝑜𝑢𝑡ℎ 00359 𝑚𝑎𝑟𝑟𝑖𝑒𝑑 01758 𝑠𝑚𝑠𝑎 𝑢𝑖 Questão 2 Discuta que hipótese é necessária para que o parâmetro associado à escolaridade seja não viesado Discuta se essa hipótese é plausível nesse caso Para que um parâmetro seja não viesado é preciso que 𝐸𝛽 𝛽 Isso significa que para que o parâmetro associado à escolaridade 𝛽1 seja não viesado é necessário que a variável educ número de anos de escolaridade seja exógena em relação ao modelo ou seja que ela não seja correlacionada com o termo de erro 𝑢𝑖 Em outras palavras a escolaridade não deve ser endógena ou seja não deve ser afetada por outros fatores não observados no modelo No contexto do modelo onde lwage logaritmo natural do salário por hora é modelado em relação à escolaridade educ e outras variáveis independentes a hipótese de exogeneidade da escolaridade pode ser plausível desde que a escolaridade seja determinada fora do modelo ou seja não seja influenciada por fatores não observados na equação No entanto existem situações em que a exogeneidade da escolaridade pode ser questionável Por exemplo se houver evidências de que a escolaridade seja influenciada por variáveis não observadas que também afetam o salário como salários médio dos pais isso poderia levar a um viés nos coeficientes estimados Questão 3 David Card sugere que a presença de faculdades em um condado pode ser um bom instrumento para a educação porque a proximidade de faculdades muda exogenamente os custos de frequentar uma faculdade Discuta as hipóteses necessárias para nearc4 ser um bom instrumento para educ Em primeiro lugar o instrumento deve ser relevante para a variável endógena educ Isso significa que o nearc4 deve estar significativamente correlacionado com a educação dos indivíduos Essa relevância é essencial para garantir que o instrumento tenha um impacto potencial na variável de interesse Em segundo lugar o nearc4 deve satisfazer a hipótese de exogeneidade Isso implica que o nearc4 não está associado ao termo de erro 𝑢𝑖 do modelo A exogeneidade assegura que o instrumento não seja afetado por fatores não observados que possam influenciar tanto a educação quanto a variável de resultado evitando assim vieses nos resultados Por fim o nearc4 não deve estar correlacionado com outras variáveis explicativas excluindo a própria educ Isso é importante para garantir que o instrumento seja especificamente relevante para a educação e não introduza correlação espúria com outras variáveis independentes o que poderia afetar negativamente a validade das estimativas Portanto a validade do instrumento nearc4 depende de sua capacidade de satisfazer essas três hipóteses críticas o que é fundamental para garantir que a análise seja livre de vieses de endogeneidade e produza resultados confiáveis Questão 4 Reestime os parâmetros do modelo empírico conectando salários com características individuais por mínimos quadrados de dois estágios MQ2E utilizando nearc4 como instrumento para educ Interprete os resultados do modelo Exportando os dados Etapa 1 Estime os coeficientes do primeiro estágio modelo de educação em função de nearc4 firststage lmeduc nearc4 summaryfirststage Call lmformula educ nearc4 Residuals Min 1Q Median 3Q Max 11698 1527 0527 2473 5302 Coefficients Estimate Std Error t value Prt Intercept 1269801 008564 148269 2e16 nearc4 082902 010370 7994 184e15 Signif codes 0 0001 001 005 01 1 Residual standard error 2649 on 3008 degrees of freedom Multiple Rsquared 002081 Adjusted Rsquared 002048 Fstatistic 6391 on 1 and 3008 DF pvalue 1838e15 Etapa 2 Estime o segundo estágio modelo principal usando os resultados do primeiro estágio m2 lmlwage fittedfirststage exper black south married smsa summarym2 Call lmformula lwage fittedfirststage exper black south married smsa Residuals Min 1Q Median 3Q Max 15503 02458 00088 02607 14359 Coefficients Estimate Std Error t value Prt Intercept 5629816 0267164 21073 2e16 fittedfirststage 0049018 0020263 2419 001562 exper 0005372 0001822 2948 000322 black 0233335 0018449 12647 2e16 south 0150085 0016113 9314 2e16 married 0041001 0003617 11336 2e16 smsa 0199967 0017296 11561 2e16 Signif codes 0 0001 001 005 01 1 Residual standard error 03948 on 2996 degrees of freedom 7 observations deleted due to missingness Multiple Rsquared 02097 Adjusted Rsquared 02081 Fstatistic 1325 on 6 and 2996 DF pvalue 22e16 No primeiro estágio realizamos uma regressão linear para avaliar como a proximidade de faculdades representada pela variável nearc4 influencia a educação dos indivíduos Os resultados revelam que a proximidade de faculdades tem um impacto estatisticamente significativo na educação Para cada aumento unitário em nearc4 a média da educação dos indivíduos aumenta aproximadamente 08290 anos Isso indica que a disponibilidade de instituições educacionais próximas está associada a níveis mais elevados de escolaridade entre os participantes do estudo No entanto a parcela de variação explicada no modelo é relativamente baixa cerca de 208 sugerindo que outros fatores também desempenham um papel importante na determinação da educação No segundo estágio o modelo principal explora como o logaritmo natural dos salários lwage é influenciado por diversas variáveis incluindo a educação prevista a partir do primeiro estágio fittedfirststage Os resultados indicam que a educação continua a ser um preditor significativo dos salários mesmo após controlar outros fatores como experiência exper etnia black localização geográfica south e smsa e estado civil married O coeficiente associado a fittedfirststage é positivo 0049 o que significa que mantendo todas as outras variáveis constantes um aumento de 1 ano de educação conforme previsto a partir do primeiro estágio resulta em um aumento de 0049 na ariável lwage Globalmente o modelo MQ2E aponta que a proximidade de faculdades nearc4 é um instrumento útil para explicar a educação educ e que a educação tem um efeito positivo e significativo nos salários lwage quando outras variáveis são consideradas O coeficiente de determinação 𝑅2 de 2097 no segundo estágio sugere que o modelo é capaz de explicar uma parte substancial da variação nos salários mas ainda existe variação não explicada Portanto esses resultados destacam a importância da educação na determinação dos salários ao mesmo tempo em que reconhecem a presença de outros fatores que também desempenham um papel relevante nesse contexto Questão 3 Discuta as diferenças entre os parâmetros associados á escolaridade estimados por MQO e MQ2E Comparando os parâmetros associados à variável educação estimados pelo Modelo de Mínimos Quadrados Ordinários MQO e pelo Modelo de Mínimos Quadrados de Dois Estágios MQ2E observamos diferenças significativas No MQO o coeficiente de educação educ é estimado em 00711 indicando que um aumento de um ano de escolaridade está associado a um aumento de 00711 no logaritmo natural dos salários lwage Este coeficiente é altamente significativo No entanto no MQ2E o coeficiente associado à educação prevista a partir do primeiro estágio é estimado em 00490 com um erro padrão maior Essa diferença reflete o esforço do MQ2E em controlar a endogeneidade da educação Portanto o MQ2E fornece uma estimativa mais conservadora do efeito da educação nos salários enquanto o MQO pode superestimar esse efeito devido à endogeneidade A escolha entre os modelos depende da validade das hipóteses do MQ2E e da natureza das relações nas variáveis envolvidas
Send your question to AI and receive an answer instantly
Recommended for you
5
Análise de Covariância e Variância em Processos Estocásticos
Econometria
IBMEC
2
Análise de Séries Temporais com ARIMA e Diagnóstico de Estacionaridade
Econometria
IBMEC
9
Atividade no R
Econometria
IBMEC
23
Introdução às Séries Temporais: Conceitos Fundamentais e Previsões
Econometria
IBMEC
2
Lista de Exercicios Microeconometria IbmecRJ 2023-2 - Analise de Dados PNAD
Econometria
IBMEC
8
Resumo sobre Processos Estocásticos e Determinísticos
Econometria
IBMEC
1
Analise-Fatores-Influenciam-Preco-Petroleo-Modelo-Regressao-Multipla
Econometria
IBMEC
Preview text
Microeconometria IbmecRJ 20232 Prof Gilberto Boaretto Lista de Exercıcios Praticos 2 Entrega ate 01112023 quartafeira as 23h59 via Teams Valor 5 de 20 da AC 5 da nota total do curso INSTRUC OES Consulte codigos de R na aula 10 sobre variaveis instrumentais e aulas anteriores sobre MQO se necessario Na pasta do Dropbox e no Teams vocˆe encontrara a base de dados carddta Organizem o trabalho de modo a ter sequencialmente na resposta para cada questao codigo em R output tabela ou figura com resultados e explicacao se solicitado Mandem o trabalho em formato PDF Retorno salarial da educacao O arquivo carddta contem informacoes de 3010 indivıduos do sexo masculino extraıdas da NLS Young Men Cohort of the National Longitudinal Survey A variavel lwage denota o logaritmo natural do salario por hora dos indivıduos a variavel educ denota o numero de anos de escolaridade do indivıduo exper denota o numero de anos de experiˆencia do indivıduo black e uma dummy que denota se o indivıduo e negro married e uma dummy que indica se o indivıduo e casado smsa e uma dummy que indica se o indivıduo em uma regiao metropolitana e nearc4 e uma dummy que indica a presenca de faculdades no condado onde o indivıduo reside Considere o seguinte modelo empırico conectando salarios e escolaridade lwage β0 β1 educ β2 exper β3 black β4 south β5 married β6 smsa ui 1 Utilize os dados da NLS Young Men Cohort of the National Longitudinal Survey para estimar empregando mınimos quadrados ordinarios MQO os parˆametros desse modelo empırico Interprete os coeficientes desse modelo 2 Discuta que hipotese e necessaria para que o parˆametro associado a escolaridade seja nao viesado Discuta se essa hipotese e plausıvel nesse caso 3 David Card sugere que a presenca de faculdades em um condado pode ser um bom instrumento para a educacao porque a proximidade de faculdades muda exogenamente os custos de frequentar uma faculdade Discuta as hipoteses necessarias para near4c ser um bom instrumento para educ 4 Reestime os parˆametros do modelo empırico conectando salarios com caracterısticas individuais por mınimos quadrados de dois estagios MQ2E utilizando near4c como instrumento para educ Interprete os resultados do modelo 5 Discuta as diferencas entre os parˆametros associados a escolaridade estimados por MQO e MQ2E 1 Lista de Exercícios Praticos 2 20231031 Enunciado O arquivo carddta contém informações de 3010 indivíduos do sexo masculino extraídas da NLS Young Men Cohort of the National Longitudinal Survey A variável lwage denota o logaritmo natural do salário por hora dos indivíduos a variável educ denota o número de anos de escolaridade do indivíduo exper denota o número de anos de experiência do indivíduo black é uma dummy que denota se o indivíduo é negro married é uma dummy que indica se o indivíduo é casado smsa é uma dummy que indica se o indivíduo em uma região metropolitana e nearc4 é uma dummy que indica a presença de faculdades no condado onde o indivíduo reside Considere o seguinte modelo empírico conectando salários e escolaridade l wa geβ0β1e ducβ2 e x pe r β3bl ac kβ4s out hβ5m arr i edβ6s ms aui Questão 1 Utilize os dados da NLS Young Men Cohort of the National Longitudinal Survey para estimar empregando mínimos quadrados ordinários MQO os parâmetros desse modelo empírico Interprete os coeficientes desse modelo Exportando os dados libraryhaven dados readdtacarddta attachdados m1 lmlwage educ exper black south married smsa summarym1 Call lmformula lwage educ exper black south married smsa Residuals Min 1Q Median 3Q Max 159924 023035 001812 023046 136797 Coefficients Estimate Std Error t value Prt Intercept 5063317 0063740 79437 2e16 educ 0071173 0003482 20438 2e16 exper 0034152 0002214 15422 2e16 black 0166027 0017614 9426 2e16 south 0131552 0014969 8788 2e16 married 0035871 0003401 10547 2e16 smsa 0175787 0015458 11372 2e16 Signif codes 0 0001 001 005 01 1 Residual standard error 03702 on 2996 degrees of freedom 7 observations deleted due to missingness Multiple Rsquared 0305 Adjusted Rsquared 03036 Fstatistic 2192 on 6 and 2996 DF pvalue 22e16 Considerando um nível de significância de 5 podemos concluir que o Modelo de Regressão Linear Múltipla MRLM é estatisticamente significativo Isso se baseia no teste F que obteve um pvalor menor que 005 Portanto rejeitamos a hipótese nula de que o modelo não é significativo indicando que o MRLM é capaz de explicar as variações da variável dependente lwage Ao analisar os parâmetros individualmente pelo teste t observamos que todos os parâmetros são significativos a um nível de 5 de significância Isso significa que cada variável independente ou coeficiente contribui de maneira estatisticamente significativa para a explicação das variações em lwage Além disso o coeficiente de determinação R 2 foi calculado como 03036 Isso indica que aproximadamente 3036 das variações no logaritmo natural dos salários são explicadas pelo modelo Em outras palavras o modelo é capaz de capturar uma parcela significativa da variabilidade em lwage No entanto é importante notar que ainda existe uma quantidade considerável de variação que não é explicada pelo modelo Sendo assim o modelo estomado foi l wa ge5063300712ed uc00342 e x pe r01660bl ac k 01316 sout h00359 mar r ie d01758 sm s aui Questão 2 Discuta que hipótese é necessária para que o parâmetro associado à escolaridade seja não viesado Discuta se essa hipótese é plausível nesse caso Para que um parâmetro seja não viesado é preciso que E β β Isso significa que para que o parâmetro associado à escolaridade β1 seja não viesado é necessário que a variável educ número de anos de escolaridade seja exógena em relação ao modelo ou seja que ela não seja correlacionada com o termo de erro ui Em outras palavras a escolaridade não deve ser endógena ou seja não deve ser afetada por outros fatores não observados no modelo No contexto do modelo onde lwage logaritmo natural do salário por hora é modelado em relação à escolaridade educ e outras variáveis independentes a hipótese de exogeneidade da escolaridade pode ser plausível desde que a escolaridade seja determinada fora do modelo ou seja não seja influenciada por fatores não observados na equação No entanto existem situações em que a exogeneidade da escolaridade pode ser questionável Por exemplo se houver evidências de que a escolaridade seja influenciada por variáveis não observadas que também afetam o salário como salários médio dos pais isso poderia levar a um viés nos coeficientes estimados Questão 3 David Card sugere que a presença de faculdades em um condado pode ser um bom instrumento para a educação porque a proximidade de faculdades muda exogenamente os custos de frequentar uma faculdade Discuta as hipóteses necessárias para nearc4 ser um bom instrumento para educ Em primeiro lugar o instrumento deve ser relevante para a variável endógena educ Isso significa que o nearc4 deve estar significativamente correlacionado com a educação dos indivíduos Essa relevância é essencial para garantir que o instrumento tenha um impacto potencial na variável de interesse Em segundo lugar o nearc4 deve satisfazer a hipótese de exogeneidade Isso implica que o nearc4 não está associado ao termo de erro ui do modelo A exogeneidade assegura que o instrumento não seja afetado por fatores não observados que possam influenciar tanto a educação quanto a variável de resultado evitando assim vieses nos resultados Por fim o nearc4 não deve estar correlacionado com outras variáveis explicativas excluindo a própria educ Isso é importante para garantir que o instrumento seja especificamente relevante para a educação e não introduza correlação espúria com outras variáveis independentes o que poderia afetar negativamente a validade das estimativas Portanto a validade do instrumento nearc4 depende de sua capacidade de satisfazer essas três hipóteses críticas o que é fundamental para garantir que a análise seja livre de vieses de endogeneidade e produza resultados confiáveis Questão 4 Reestime os parâmetros do modelo empírico conectando salários com características individuais por mínimos quadrados de dois estágios MQ2E utilizando nearc4 como instrumento para educ Interprete os resultados do modelo Exportando os dados Etapa 1 Estime os coeficientes do primeiro estágio modelo de educação em função de nearc4 firststage lmeduc nearc4 summaryfirststage Call lmformula educ nearc4 Residuals Min 1Q Median 3Q Max 11698 1527 0527 2473 5302 Coefficients Estimate Std Error t value Prt Intercept 1269801 008564 148269 2e16 nearc4 082902 010370 7994 184e15 Signif codes 0 0001 001 005 01 1 Residual standard error 2649 on 3008 degrees of freedom Multiple Rsquared 002081 Adjusted Rsquared 002048 Fstatistic 6391 on 1 and 3008 DF pvalue 1838e15 Etapa 2 Estime o segundo estágio modelo principal usando os resultados do primeiro estágio m2 lmlwage fittedfirststage exper black south married smsa summarym2 Call lmformula lwage fittedfirststage exper black south married smsa Residuals Min 1Q Median 3Q Max 15503 02458 00088 02607 14359 Coefficients Estimate Std Error t value Prt Intercept 5629816 0267164 21073 2e16 fittedfirststage 0049018 0020263 2419 001562 exper 0005372 0001822 2948 000322 black 0233335 0018449 12647 2e16 south 0150085 0016113 9314 2e16 married 0041001 0003617 11336 2e16 smsa 0199967 0017296 11561 2e16 Signif codes 0 0001 001 005 01 1 Residual standard error 03948 on 2996 degrees of freedom 7 observations deleted due to missingness Multiple Rsquared 02097 Adjusted Rsquared 02081 Fstatistic 1325 on 6 and 2996 DF pvalue 22e16 No primeiro estágio realizamos uma regressão linear para avaliar como a proximidade de faculdades representada pela variável nearc4 influencia a educação dos indivíduos Os resultados revelam que a proximidade de faculdades tem um impacto estatisticamente significativo na educação Para cada aumento unitário em nearc4 a média da educação dos indivíduos aumenta aproximadamente 08290 anos Isso indica que a disponibilidade de instituições educacionais próximas está associada a níveis mais elevados de escolaridade entre os participantes do estudo No entanto a parcela de variação explicada no modelo é relativamente baixa cerca de 208 sugerindo que outros fatores também desempenham um papel importante na determinação da educação No segundo estágio o modelo principal explora como o logaritmo natural dos salários lwage é influenciado por diversas variáveis incluindo a educação prevista a partir do primeiro estágio fittedfirststage Os resultados indicam que a educação continua a ser um preditor significativo dos salários mesmo após controlar outros fatores como experiência exper etnia black localização geográfica south e smsa e estado civil married O coeficiente associado a fittedfirststage é positivo 0049 o que significa que mantendo todas as outras variáveis constantes um aumento de 1 ano de educação conforme previsto a partir do primeiro estágio resulta em um aumento de 0049 na ariável lwage Globalmente o modelo MQ2E aponta que a proximidade de faculdades nearc4 é um instrumento útil para explicar a educação educ e que a educação tem um efeito positivo e significativo nos salários lwage quando outras variáveis são consideradas O coeficiente de determinação R 2 de 2097 no segundo estágio sugere que o modelo é capaz de explicar uma parte substancial da variação nos salários mas ainda existe variação não explicada Portanto esses resultados destacam a importância da educação na determinação dos salários ao mesmo tempo em que reconhecem a presença de outros fatores que também desempenham um papel relevante nesse contexto Questão 3 Discuta as diferenças entre os parâmetros associados á escolaridade estimados por MQO e MQ2E Comparando os parâmetros associados à variável educação estimados pelo Modelo de Mínimos Quadrados Ordinários MQO e pelo Modelo de Mínimos Quadrados de Dois Estágios MQ2E observamos diferenças significativas No MQO o coeficiente de educação educ é estimado em 00711 indicando que um aumento de um ano de escolaridade está associado a um aumento de 00711 no logaritmo natural dos salários lwage Este coeficiente é altamente significativo No entanto no MQ2E o coeficiente associado à educação prevista a partir do primeiro estágio é estimado em 00490 com um erro padrão maior Essa diferença reflete o esforço do MQ2E em controlar a endogeneidade da educação Portanto o MQ2E fornece uma estimativa mais conservadora do efeito da educação nos salários enquanto o MQO pode superestimar esse efeito devido à endogeneidade A escolha entre os modelos depende da validade das hipóteses do MQ2E e da natureza das relações nas variáveis envolvidas Lista de Exercícios Praticos 2 20231031 Enunciado O arquivo carddta contém informações de 3010 indivíduos do sexo masculino extraídas da NLS Young Men Cohort of the National Longitudinal Survey A variável lwage denota o logaritmo natural do salário por hora dos indivíduos a variável educ denota o número de anos de escolaridade do indivíduo exper denota o número de anos de experiência do indivíduo black é uma dummy que denota se o indivíduo é negro married é uma dummy que indica se o indivíduo é casado smsa é uma dummy que indica se o indivíduo em uma região metropolitana e nearc4 é uma dummy que indica a presença de faculdades no condado onde o indivíduo reside Considere o seguinte modelo empírico conectando salários e escolaridade 𝑙𝑤𝑎𝑔𝑒 𝛽0 𝛽1 𝑒𝑑𝑢𝑐 𝛽2 𝑒𝑥𝑝𝑒𝑟 𝛽3 𝑏𝑙𝑎𝑐𝑘 𝛽4 𝑠𝑜𝑢𝑡ℎ 𝛽5 𝑚𝑎𝑟𝑟𝑖𝑒𝑑 𝛽6𝑠𝑚𝑠𝑎 𝑢𝑖 Questão 1 Utilize os dados da NLS Young Men Cohort of the National Longitudinal Survey para estimar empregando mínimos quadrados ordinários MQO os parâmetros desse modelo empírico Interprete os coeficientes desse modelo Exportando os dados libraryhaven dados readdtacarddta attachdados m1 lmlwage educ exper black south married smsa summarym1 Call lmformula lwage educ exper black south married smsa Residuals Min 1Q Median 3Q Max 159924 023035 001812 023046 136797 Coefficients Estimate Std Error t value Prt Intercept 5063317 0063740 79437 2e16 educ 0071173 0003482 20438 2e16 exper 0034152 0002214 15422 2e16 black 0166027 0017614 9426 2e16 south 0131552 0014969 8788 2e16 married 0035871 0003401 10547 2e16 smsa 0175787 0015458 11372 2e16 Signif codes 0 0001 001 005 01 1 Residual standard error 03702 on 2996 degrees of freedom 7 observations deleted due to missingness Multiple Rsquared 0305 Adjusted Rsquared 03036 Fstatistic 2192 on 6 and 2996 DF pvalue 22e16 Considerando um nível de significância de 5 podemos concluir que o Modelo de Regressão Linear Múltipla MRLM é estatisticamente significativo Isso se baseia no teste F que obteve um pvalor menor que 005 Portanto rejeitamos a hipótese nula de que o modelo não é significativo indicando que o MRLM é capaz de explicar as variações da variável dependente lwage Ao analisar os parâmetros individualmente pelo teste t observamos que todos os parâmetros são significativos a um nível de 5 de significância Isso significa que cada variável independente ou coeficiente contribui de maneira estatisticamente significativa para a explicação das variações em lwage Além disso o coeficiente de determinação 𝑅2 foi calculado como 03036 Isso indica que aproximadamente 3036 das variações no logaritmo natural dos salários são explicadas pelo modelo Em outras palavras o modelo é capaz de capturar uma parcela significativa da variabilidade em lwage No entanto é importante notar que ainda existe uma quantidade considerável de variação que não é explicada pelo modelo Sendo assim o modelo estomado foi 𝑙𝑤𝑎𝑔𝑒 50633 00712 𝑒𝑑𝑢𝑐 00342 𝑒𝑥𝑝𝑒𝑟 01660 𝑏𝑙𝑎𝑐𝑘 01316 𝑠𝑜𝑢𝑡ℎ 00359 𝑚𝑎𝑟𝑟𝑖𝑒𝑑 01758 𝑠𝑚𝑠𝑎 𝑢𝑖 Questão 2 Discuta que hipótese é necessária para que o parâmetro associado à escolaridade seja não viesado Discuta se essa hipótese é plausível nesse caso Para que um parâmetro seja não viesado é preciso que 𝐸𝛽 𝛽 Isso significa que para que o parâmetro associado à escolaridade 𝛽1 seja não viesado é necessário que a variável educ número de anos de escolaridade seja exógena em relação ao modelo ou seja que ela não seja correlacionada com o termo de erro 𝑢𝑖 Em outras palavras a escolaridade não deve ser endógena ou seja não deve ser afetada por outros fatores não observados no modelo No contexto do modelo onde lwage logaritmo natural do salário por hora é modelado em relação à escolaridade educ e outras variáveis independentes a hipótese de exogeneidade da escolaridade pode ser plausível desde que a escolaridade seja determinada fora do modelo ou seja não seja influenciada por fatores não observados na equação No entanto existem situações em que a exogeneidade da escolaridade pode ser questionável Por exemplo se houver evidências de que a escolaridade seja influenciada por variáveis não observadas que também afetam o salário como salários médio dos pais isso poderia levar a um viés nos coeficientes estimados Questão 3 David Card sugere que a presença de faculdades em um condado pode ser um bom instrumento para a educação porque a proximidade de faculdades muda exogenamente os custos de frequentar uma faculdade Discuta as hipóteses necessárias para nearc4 ser um bom instrumento para educ Em primeiro lugar o instrumento deve ser relevante para a variável endógena educ Isso significa que o nearc4 deve estar significativamente correlacionado com a educação dos indivíduos Essa relevância é essencial para garantir que o instrumento tenha um impacto potencial na variável de interesse Em segundo lugar o nearc4 deve satisfazer a hipótese de exogeneidade Isso implica que o nearc4 não está associado ao termo de erro 𝑢𝑖 do modelo A exogeneidade assegura que o instrumento não seja afetado por fatores não observados que possam influenciar tanto a educação quanto a variável de resultado evitando assim vieses nos resultados Por fim o nearc4 não deve estar correlacionado com outras variáveis explicativas excluindo a própria educ Isso é importante para garantir que o instrumento seja especificamente relevante para a educação e não introduza correlação espúria com outras variáveis independentes o que poderia afetar negativamente a validade das estimativas Portanto a validade do instrumento nearc4 depende de sua capacidade de satisfazer essas três hipóteses críticas o que é fundamental para garantir que a análise seja livre de vieses de endogeneidade e produza resultados confiáveis Questão 4 Reestime os parâmetros do modelo empírico conectando salários com características individuais por mínimos quadrados de dois estágios MQ2E utilizando nearc4 como instrumento para educ Interprete os resultados do modelo Exportando os dados Etapa 1 Estime os coeficientes do primeiro estágio modelo de educação em função de nearc4 firststage lmeduc nearc4 summaryfirststage Call lmformula educ nearc4 Residuals Min 1Q Median 3Q Max 11698 1527 0527 2473 5302 Coefficients Estimate Std Error t value Prt Intercept 1269801 008564 148269 2e16 nearc4 082902 010370 7994 184e15 Signif codes 0 0001 001 005 01 1 Residual standard error 2649 on 3008 degrees of freedom Multiple Rsquared 002081 Adjusted Rsquared 002048 Fstatistic 6391 on 1 and 3008 DF pvalue 1838e15 Etapa 2 Estime o segundo estágio modelo principal usando os resultados do primeiro estágio m2 lmlwage fittedfirststage exper black south married smsa summarym2 Call lmformula lwage fittedfirststage exper black south married smsa Residuals Min 1Q Median 3Q Max 15503 02458 00088 02607 14359 Coefficients Estimate Std Error t value Prt Intercept 5629816 0267164 21073 2e16 fittedfirststage 0049018 0020263 2419 001562 exper 0005372 0001822 2948 000322 black 0233335 0018449 12647 2e16 south 0150085 0016113 9314 2e16 married 0041001 0003617 11336 2e16 smsa 0199967 0017296 11561 2e16 Signif codes 0 0001 001 005 01 1 Residual standard error 03948 on 2996 degrees of freedom 7 observations deleted due to missingness Multiple Rsquared 02097 Adjusted Rsquared 02081 Fstatistic 1325 on 6 and 2996 DF pvalue 22e16 No primeiro estágio realizamos uma regressão linear para avaliar como a proximidade de faculdades representada pela variável nearc4 influencia a educação dos indivíduos Os resultados revelam que a proximidade de faculdades tem um impacto estatisticamente significativo na educação Para cada aumento unitário em nearc4 a média da educação dos indivíduos aumenta aproximadamente 08290 anos Isso indica que a disponibilidade de instituições educacionais próximas está associada a níveis mais elevados de escolaridade entre os participantes do estudo No entanto a parcela de variação explicada no modelo é relativamente baixa cerca de 208 sugerindo que outros fatores também desempenham um papel importante na determinação da educação No segundo estágio o modelo principal explora como o logaritmo natural dos salários lwage é influenciado por diversas variáveis incluindo a educação prevista a partir do primeiro estágio fittedfirststage Os resultados indicam que a educação continua a ser um preditor significativo dos salários mesmo após controlar outros fatores como experiência exper etnia black localização geográfica south e smsa e estado civil married O coeficiente associado a fittedfirststage é positivo 0049 o que significa que mantendo todas as outras variáveis constantes um aumento de 1 ano de educação conforme previsto a partir do primeiro estágio resulta em um aumento de 0049 na ariável lwage Globalmente o modelo MQ2E aponta que a proximidade de faculdades nearc4 é um instrumento útil para explicar a educação educ e que a educação tem um efeito positivo e significativo nos salários lwage quando outras variáveis são consideradas O coeficiente de determinação 𝑅2 de 2097 no segundo estágio sugere que o modelo é capaz de explicar uma parte substancial da variação nos salários mas ainda existe variação não explicada Portanto esses resultados destacam a importância da educação na determinação dos salários ao mesmo tempo em que reconhecem a presença de outros fatores que também desempenham um papel relevante nesse contexto Questão 3 Discuta as diferenças entre os parâmetros associados á escolaridade estimados por MQO e MQ2E Comparando os parâmetros associados à variável educação estimados pelo Modelo de Mínimos Quadrados Ordinários MQO e pelo Modelo de Mínimos Quadrados de Dois Estágios MQ2E observamos diferenças significativas No MQO o coeficiente de educação educ é estimado em 00711 indicando que um aumento de um ano de escolaridade está associado a um aumento de 00711 no logaritmo natural dos salários lwage Este coeficiente é altamente significativo No entanto no MQ2E o coeficiente associado à educação prevista a partir do primeiro estágio é estimado em 00490 com um erro padrão maior Essa diferença reflete o esforço do MQ2E em controlar a endogeneidade da educação Portanto o MQ2E fornece uma estimativa mais conservadora do efeito da educação nos salários enquanto o MQO pode superestimar esse efeito devido à endogeneidade A escolha entre os modelos depende da validade das hipóteses do MQ2E e da natureza das relações nas variáveis envolvidas