·

Economia ·

Econometria

Send your question to AI and receive an answer instantly

Ask Question

Preview text

Econometria II Lista de exercícios 3 Probit logit tobit e heckit Para resolver esta lista utilize o código do R scriptlista3finalR e o conjunto de dados lista3dadosRdata O objetivo da análise empírica é estimar equações que expliquem a participação das mulheres no mercado de trabalho e a remuneração por elas recebida Os dados provêm da PNAD 2009 Q1 Estimar com base no conjunto de dados 1 dmicrohfe a equação de participação no mercado de trabalho abaixo Pdemp 1X Gβ0 β1anoseduc β2exper β3exper2 β4dbca β5dno β6dse β7dsu β8dco β9nfilhos β10rendadompc β11drural Em que demp assume valor unitário para indivíduos empregados Empregar os três modelos de probabilidade quais sejam MLP G 1 probit G FDA da normal padrão e logit G logística Atenção apenas para o MLP é preciso corrigir a matriz de variânciacovariância dos estimadores de MQO empregando o método de White Obter o valor da estatística do teste de significância individual atenção não se trata do pvalor para cada uma das seguintes variáveis anoseduc exper expersq nfilhos e drural e para cada um dos três modelos Preencher a tabela abaixo incluindo o valor da estatística pedida para cada uma das possíveis combinações explicativamodelo Explicativa modelo Estimativas pontuais Estatística t MLP Probit Logit MLP Probit Logit anoseduc exper expersq nfilhos drural A seção Exporta tabelas do scriptlista2 apresenta um procedimento para exportar tabelas com resultados de estimação A utilização dele simplifica a resolução das questões desta lista que envolvem o preenchimento de tabelas Q2 Interpretar os coeficientes das explicativas mencionadas na Q1 respondendo às seguintes perguntas Q2a Considerando apenas os resultados do modelo probit responda qual das explicativas mencionadas em Q1 possui o maior efeito marginal atenção considerar 1 não apenas o valor absoluto mas também o sinal do efeito marginal Descrever a medida de efeito marginal utilizada e justificar a opção por ela Q2b Porque as estimativas pontuais para os coeficientes diferem comparandose os três modelos MLP probit e logit Q3 Estimar com base no conjunto de dados 3 dmicrohff a equação de Mincer a seguir rendatrabpri10 β0 β1anoseduc β2exper β3exper2 β4dbca β5dno β6dseβ7dsu β8dco β9dindu β10dapub β11dserv β12horastrabprisref β13dformal ei Desta vez porém é preciso corrigir a descontinuidade da variável dependente no valor de seu domínio de variação que coincide com o valor do salário mínimo referente ao ano de 2009 R46500 Empregar portanto o modelo tobit com censura à esquerda em R46500 Estimar a equação de Mincer i por mínimos quadrados ordinários MQO empregando o estimador para a matriz de variânciacovariância de White MQOW e ii a partir do modelo tobit Q3a Preencha a tabela abaixo Explicativa Estimativas pontuais Estatística t MQOW Tobit MQOW Tobit anoseduc exper expersq dbca dno dse dsu dco dindu dapub dserv horastrabprisre f dformal Q3b Porque as estimativas pontuais diferem das reportadas pelo modelo tobit Explicar procurando detalhar as diferenças entre os dois métodos Q4 Estimar a equação de Mincer proposta no exercício anterior seguindo agora os seguintes passos 2 Passo 1 Tome o conjunto de dados 2 dmicrohfj o qual contém apenas as mulheres empregadas Com base nele estime a equação de Mincer por MQO com o estimador de White para a matriz de variânciacovariância Armazene os resultados de estimação estimativas pontuais e testes de significância individual em um objeto denominado mqomincer Passo 2 Tome o conjunto de dados 1 dmicrohfe o qual contém todas as mulheres empregadas ou não empregadas Com base nele estime a equação de Mincer a partir do procedimento de dois estágios de Heckman o qual também pressupõe a especificação da equação de seleção Esta deve ser equivalente à equação de participação no mercado de trabalho descrita em Q1 Armazene os resultados de estimação em um objeto denominado hecmincer Atenção estimar o modelo a partir do procedimento de dois estágios e não por máxima verossimilhança Para isso confirmar que a opção method 2step consta ao final do comando selection Com base nos resultados obtidos mqomincer e hecmincer resolva as questões a seguir Q4a Preencha a tabela abaixo Explicativa Estimativas pontuais MQO Heckman exper expersq dbca dno dse dsu dco dindu dapub dserv horastrabprisre f dformal Q4b Explique porque as estimativas pontuais geradas pelos métodos diferem apresentando para isso razões que dizem respeito ao problema que o método de Heckman procura resolver 3 Lista de exercícios 3 Probit logit tobit e heckit Visualizando os dados loadCUserskarolDownloads1678646231090lista3dadosRdata Viewdmicrohfe Definindo a matriz X dados dmicrohfe attachdados matx dataframeanoseduc exper expersq dbca dno dse dsu dco nfilhos rendadompc drural Resumo estatístico das variáveis explicativas summarymatx Definindo o vetor resposta y demp Modelo Linear de Probabilidade MLP m1 lmy matx summarym1 Modelo Probit m2 glmy matx familybinomiallinkprobit summarym2 Modelo logit m3 glmy matx familybinomiallinklogit summarym3 Efeito marginal no modelo probit Instalar o pacote caso não tenha installpackagesmargins librarymargins marginsm2 type response Questão 3 dados2 dmicrohff Viewdados2 attachdados2 Variáveis Independente varind dataframeanoseduc exper expersq dbca dno dse dsu dco dindu dapub dserv horastrabprisref dformal Variável Dependente vardep rendatrabpri10 MQO lmlogvardep varind librarysandwich vcov vcovHCMQO type HC0 coefficientsMQO vcov vcov summaryMQO vcov vcov installpackagesAER Instalar o pacote caso não tenha libraryAER tobit tobitdmicrohferendatrabpri10 dmicrohfeanoseduc dmicrohfeexper dmicrohfeexpersq dmicrohfedbca dmicrohfedno dmicrohfedse dmicrohfedsu dmicrohfedco dmicrohfedindu dmicrohfedapub dmicrohfedserv dmicrohfehorastrabprisref dmicrohfedformal left 465 summarytobit Questão 4 dados3 dmicrohfj attachdados3 Variáveis Independentes xs dataframeanoseduc exper expersq dbca dno dse dsu dco dindu dapub dserv horastrabprisref dformal variável dependente y4 rendatrabpri10 mqomincer lmy4 xs summarymqomincer installpackagessampleSelection librarysampleSelection hecmincer selectiondmicrohfedemp dmicrohfeanoseduc dmicrohfeexper dmicrohfeexpersq dmicrohfedbca dmicrohfedno dmicrohfedse dmicrohfedsu dmicrohfedco dmicrohfenfilhos dmicrohferendadompc dmicrohfedrural dmicrohferendatrabpri10 dmicrohfeanoseduc dmicrohfeexper dmicrohfeexpersq dmicrohfedbca dmicrohfedno dmicrohfedse dmicrohfedsu dmicrohfedco dmicrohfedindu dmicrohfedapub dmicrohfedserv dmicrohfehorastrabprisref dmicrohfedformal method 2step summaryhecmincer Econometria II Lista de exercícios 3 Probit logit tobit e heckit Para resolver esta lista utilize o código do R scriptlista3finalR e o conjunto de dados lista3dadosRdata O objetivo da análise empírica é estimar equações que expliquem a participação das mulheres no mercado de trabalho e a remuneração por elas recebida Os dados provêm da PNAD 2009 Q1 Estimar com base no conjunto de dados 1 dmicrohfe a equação de participação no mercado de trabalho abaixo Pdemp 1X Gβ0 β1anoseduc β2exper β3exper2 β4dbca β5dno β6dse β7dsu β8dco β9nfilhos β10rendadompc β11drural Em que demp assume valor unitário para indivíduos empregados Empregar os três modelos de probabilidade quais sejam MLP G 1 probit G FDA da normal padrão e logit G logística Atenção apenas para o MLP é preciso corrigir a matriz de variânciacovariância dos estimadores de MQO empregando o método de White Obter o valor da estatística do teste de significância individual atenção não se trata do pvalor para cada uma das seguintes variáveis anoseduc exper expersq nfilhos e drural e para cada um dos três modelos Preencher a tabela abaixo incluindo o valor da estatística pedida para cada uma das possíveis combinações explicativamodelo m1 é o MLP gerado a partir da função lm do R 1 m2 é o modelo probit gerado pela função glm do R m3 é o modelo logit gerado pela função glm no R 2 Visto os resultados obtido a partir dos print do programa R foi completado a tabela Explicativa modelo Estimativas pontuais Estatística t MLP Probit Logit MLP Probit Logit anoseduc 001979 004820 007785 36202 31308 30928 Exper 001177 006592 01125 31860 47653 48079 expersq 00002277 0001312 0002258 46331 55615 54847 nfilhos 0007443 002544 004505 6639 7089 7409 drural 002801 009415 01511 4743 5629 5532 A seção Exporta tabelas do scriptlista2 apresenta um procedimento para exportar tabelas com resultados de estimação A utilização dele simplifica a resolução das questões desta lista que envolvem o preenchimento de tabelas Q2 Interpretar os coeficientes das explicativas mencionadas na Q1 respondendo às seguintes perguntas Q2a Considerando apenas os resultados do modelo probit responda qual das explicativas mencionadas em Q1 possui o maior efeito marginal atenção considerar não apenas o valor absoluto mas também o sinal do efeito marginal Descrever a medida de efeito marginal utilizada e justificar a opção por ela 3 Portanto considerando as variáveis mencionadas em Q1 e modelo de regressão probit a variável que possui o maior efeito marginal é a variável explicativa drural onde seu efeito marginal é de 003291 isso implica que a cada aumento em uma unidade de medida da variável drural a variável resposta que é demp diminuí em torno de 003291 unidades de medida Q2b Porque as estimativas pontuais para os coeficientes diferem comparandose os três modelos MLP probit e logit As estimativas dos modelos de regressão MLP probit e logit são diferentes porque usam diferentes funções matemáticas para modelar a relação entre a variável dependente e as variáveis independentes O modelo linear de probabilidade MLP assume que a variável dependente tem uma relação linear com as variáveis independentes Ele usa o método dos mínimos quadrados ordinários MQO para estimar os parâmetros do modelo A regressão logit modela a probabilidade de um resultado binário 0 ou 1 como uma função das variáveis independentes usando uma função logística Ele usa estimativa de máxima verossimilhança EMV para estimar os parâmetros do modelo A regressão Probit é outro método para modelar resultados binários Ele modela a probabilidade de um resultado binário usando uma função de distribuição normal Assim como a regressão logit ela usa o EMV para estimar os parâmetros do modelo Portanto as estimativas dos modelos de regressão MLP probit e logit são diferentes porque usam diferentes funções matemáticas para modelar a relação entre a variável resposta e as variáveis explicativas e usam diferentes métodos de estimação para estimar os parâmetros dos modelos Q3 Estimar com base no conjunto de dados 3 dmicrohff a equação de Mincer a seguir rendatrabpri10 β0 β1anoseduc β2exper β3exper2 β4dbca β5dno β6dseβ7dsu β8dco β9dindu β10dapub β11dserv β12horastrabprisref β13dformal ei 4 Desta vez porém é preciso corrigir a descontinuidade da variável dependente no valor de seu domínio de variação que coincide com o valor do salário mínimo referente ao ano de 2009 R46500 Empregar portanto o modelo tobit com censura à esquerda em R46500 Estimar a equação de Mincer i por mínimos quadrados ordinários MQO empregando o estimador para a matriz de variânciacovariância de White MQOW e ii a partir do modelo tobit Q3a Preencha a tabela abaixo Para encontrar os parâmetros do modelo MQOW foi usado o método MQO empregado o estimador para a matriz de variânciacovariância de white através do comando vcov do R Para encontrar o modelo Tobit foi usado a função tobit do pacote ARE do R e os parâmetros encontrados foram 5 Explicativa Estimativas pontuais Estatística t MQOW Tobit MQOW Tobit anoseduc 006531 7222 76476 83279 Exper 001156 1167 12921 13541 expersq 000006101 006020 3425 3572 dbca 006285 7437 11118 13227 dno 01022 1481 10657 15823 dse 01115 2060 15469 27938 dsu 01388 2404 16439 27845 dco 009808 1839 10373 19555 dindu 004498 2280 1987 1041 dapub 002426 1390 1025 6064 dserv 004889 6134 2234 0294 horastrabprisref 0002548 5424 8847 22505 dformal NA 2617 NA 42931 Q3b Porque as estimativas pontuais diferem das reportadas pelo modelo tobit Explicar procurando detalhar as diferenças entre os dois métodos 6 Os modelos MQOW e Tobit são modelos de regressão usados para analisar dados que possuem censura ou truncamento A principal diferença entre os dois modelos está no tipo de censura ou truncamento com que lidam Os modelos Tobit são usados quando a variável dependente é censurada por baixo eou por cima o que significa que algumas observações têm valores que ficam fora de um determinado intervalo e são truncadas ou censuradas Nos modelos Tobit assumese que a variável dependente tem uma distribuição normal e as observações censuradas são incluídas no processo de estimação como se fossem valores ausentes Os modelos MQOW são usados quando a variável dependente é uma variável categórica com múltiplas categorias e há um viés para uma categoria específica Esse viés pode surgir quando algumas categorias estão subrepresentadas na amostra ou quando algumas categorias são mais difíceis de obter do que outras Nos modelos MQOW a variável dependente é reponderada para contabilizar o viés e o modelo estima as probabilidades de cada categoria Q4 Estimar a equação de Mincer proposta no exercício anterior seguindo agora os seguintes passos Passo 1 Tome o conjunto de dados 2 dmicrohfj o qual contém apenas as mulheres empregadas Com base nele estime a equação de Mincer por MQO com o estimador de White para a matriz de variânciacovariância Armazene os resultados de estimação estimativas pontuais e testes de significância individual em um objeto denominado mqomincer Passo 2 Tome o conjunto de dados 1 dmicrohfe o qual contém todas as mulheres empregadas ou não empregadas Com base nele estime a equação de Mincer a partir do procedimento de dois estágios de Heckman o qual também pressupõe a especificação da equação de seleção Esta deve ser equivalente à equação de participação no mercado de trabalho descrita em Q1 Armazene os resultados de estimação em um objeto denominado hecmincer Atenção estimar o modelo a partir do procedimento de dois estágios e não por máxima verossimilhança Para isso confirmar que a opção method 2step consta ao final do comando selection Com base nos resultados obtidos mqomincer e hecmincer resolva as questões a seguir Q4a Preencha a tabela abaixo Para estimar o parâmetros pelo MQO Mínimos Quadrados Ordinários fui usada a função lm do R e encontrado os seguintes parâmetros 7 Para o modelo Heckman foi usado a função selection do pacote sampleSelection no R 8 Explicativa Estimativas pontuais MQO Heckma n Exper 982989 2882790 expersq 007090 072335 dbca 5178161 1174999 1 dno 8584863 6001237 dse 8863633 2351352 dsu 10273719 9289630 dco 8999243 1351809 dindu 1806373 9 5515824 dapub 11791761 7889439 dserv 269264 3904120 horastrabpris ref 383239 363280 dformal 18002469 175860 10 Q4b Explique porque as estimativas pontuais geradas pelos métodos diferem apresentando para isso razões que dizem respeito ao problema que o método de Heckman procura resolver O que diferencia os parâmetros encontrados são os métodos utilizados pois cada modelo utiliza de um método diferente de estimar os parâmetros da equação de regressão O modelo de regressão de Heckman também conhecido como modelo de seleção de Heckman ou modelo de seleção de amostra é um método estatístico usado para lidar com o viés de seleção de amostra O viés de seleção da amostra ocorre quando a amostra utilizada em um estudo não é representativa da população de interesse seja porque certos indivíduos ou observações são sistematicamente excluídos da amostra seja porque a probabilidade de inclusão na amostra depende da variável de resultado ou de algum outra variável de interesse Esse procedimento utiliza duas etapas que tenta corrigir o viés de seleção da amostra modelando explicitamente o processo de seleção e em seguida usando as probabilidades previstas de seleção como uma variável adicional na equação de resultado A equação de seleção modela a relação entre a probabilidade de seleção e as variáveis que determinam se uma observação é incluída na amostra enquanto a equação de resultado modela a relação entre a variável de resultado e as variáveis preditoras enquanto controla o processo de seleção Ao incluir as probabilidades previstas de seleção na equação de resultado o modelo de Heckman considera o fato de que a probabilidade de ser incluído na amostra pode depender da variável de resultado ou de alguma outra variável de interesse e portanto ajusta as estimativas dos coeficientes de regressão para melhor refletir a população de interesse Em resumo o modelo de regressão de Heckman tenta resolver o problema do viés de seleção da amostra modelando explicitamente o processo de seleção e ajustando as estimativas dos coeficientes de regressão para refletir melhor a população de interesse 10