·

Ciências Econômicas ·

Econometria

Send your question to AI and receive an answer instantly

Ask Question

Preview text

Variáveis Dummy Prof Samira Schatzmann Variáveis dummy 1 O que é 2 Exemplos de uso deste tipo de variável 3 Usos da dummy em modelos de regressão linear 4 Lidando com a multicolinearidade 5 Exercícios O QUE É Variáveis dummy outros nomes Variável binária Variável dicotômica Variável indicadora Variáveis Dummy Binárias Assumem 2 valores 0 e 1 Frequentemente usamos p1 variáveis qualitativas ou para critérios que queremos definir como nos exemplos a seguir Exemplos e Usos Exemplo 1 Variável qualitativa sexo Sexo Homem Mulher Variável categoria Exemplo 1 Variável qualitativa sexo Sexo Homem 0 Mulher 1 Variável categoria Ou seja em casos como esse transformamos as CATEGORIAS das variáveis em NOVAS VALORES Vejamos mais exemplos a seguir 2 Variável qualitativa nível de escolaridade ordinal Aluno Escolaridade A Ana Pós 4 B Beto Ens Médio 2 C Carlos Fund I 1 D Dani Fund I 1 E Elciane Fund II 0 3 Variável quali ordinal pesquisa Satisfação 4 Critéio baseado em variá rel quantitativa contínua Pessoas com mais de 170 170 m 0 170 m 1 Percebam que é uma função Pessoa tem de 170m 1 se sim 0 cc 5 Série Temporal Sazonalidade J F M A M J J A S O N D 00 00 1 00 1 00 00 1998 1 1999 0 2000 0 2001 1 2002 1 2003 0 2004 0 2005 1 2006 Copa do Mundo 6 Dados espaciais geográficos Município de SP São Vicente P Prudent B de Juliana Bauru Osasco Dummy 0 0 0 0 1 1 RM SP 1 Municípios que fazem fronteira ca capital 7 Como variáveis indicadoras de modelos de inferência causal Ceteris paribus qual o efeito de ter um computador ter computador 1 0 cc Ceteris paribus qual o efeito de uma política de refoço escolar Estudou em escola que teve refoço 1 0 cc 8 Como Efeitos Fixos em modelos de Painel i pessoa c município s estado m mês y ano t tempo Xcsmy Yit fixo CS Yt ifixo TS Yit Painel USO EM MRL As dummies podem ser a intercepto b coefs angular c mista Vamos ver as formas funcionais a Intercepto Yi α β₁X₁i β₂Dᵢ εᵢ b Coef angular Yi α β₁X₁i β₂X₁iDᵢ εᵢ c Mista Yi α β₁X₁i β₂Dᵢ β₃X₁iDᵢ εᵢ Entra como uma Exógena no modelo ou multiplicando a exógena a Intercepto Yi α β1 Xi β2 Di εi Di 0 1 0 Yi α β1 Xi εi Di 0 yi α β₁Xi εi 1 yi α β₁Xi β₂ εi yi α β₁Xi β₂Di εi yi α β1 Xi β2 Di εi yi α β1 Xi β2 Di εi yi α β1 Xi β2 Xi Di εi Coef angulár Yi α β1 Xi1 β2 Di β3 Xi1 Di εi Yi α β1 Xi1 β2 Di β3 Xi1 Di εi c Mistau Yi α β1 Xi β2 Di β3 Xi Di εi D 00 Yi α β1 Xi εi 11 Yi α βn Xi β2 β3 Xi εi Yi α β2 βn β3 Xi εi α β2 β2 0 β3 0 modelo vs lineares Heckman 30 anos QI tratado Controle Em resumo Usamos a dummy como intercepto quando temos uma suposição de que existe uma diferença de partida que não cresce ou diminui ao conforme aumenta a variável exógena ou as variáveis Usamos a dummy interagindo com a variável exógena dummy de coeficiente angular quando temos uma suposição de que há um ponto de partida comum mesmo intercepto mas que há uma diferença crescente ao longo da variável exógena Fazemos uso misto da dummy intercepto e interação quando achamos que há uma diferença de partida e que aumenta ou diminui ao longo da variável exógena LIDANDO COM A MULTICOLINEARIDADE DEPENDÊNCIA LINEAR Como lidar c a multicolinearidade 1 variável X categorias X dummies mas incluo só X1 dummies no modelo Excluo qualquer variável Poder pode mas não deve É bom ter critério pexcluir Ex 1 Sexo mulher Yi α β1X1i β2 mulher εi EXERCÍCIOS Usando uma base de dados que têm informação de 65535 trabalhadores queremos verificar se existe desigualdade salarial entre os setores da economia Consideramos que a economia está dividida em 4 setores indústria comércio serviços e construção Cada um dos trabalhadores está em um dos quatro setores e eles são mutuamente exclusivos Seja Yi o salário mensal do trabalhador i e definimos para cada setor uma variável binária que é igual a 1 se o trabalhador está em determinado setor e 0 caso contrário Estimando um modelo linear de regressão obtemos o seguinte resultado Ȳi 400 012 educi 003 idadei 040 Homemi 005DIi 015DCj 025DConsi R²083 em que educ representa o número de anos de estudos de cada trabalhador idade é medida em anos Homem é uma variável binária que assume valor igual a 1 se i é homem e 0 caso contrário DI representa a dummy para indústria DC para o comércio e DCons para o setor de construção Entre parênteses encontrase o erro padrão Usando dados de uma amostra aleatória da população com 80000 indivíduos é estimada uma regressão pelo método de Mínimos Quadrados Ordinários Os resultados dessa regressão são mostrados abaixo em que os errospadrão são mostrados entre parênteses Para a resolução desta questão talvez lhe seja útil saber que se Z tem distribuição normal padrão então PZ1645010 e PZ196005 lnsalário 030 010 escol 003 idade 015 mulher 005mulher escol R² 045 e n80000 em que escol representa o número de anos de estudo idade é a idade do indivíduo em anos e mulher é uma variável dummy igual a 1 se o trabalhador for do sexo feminino e igual a 0 se for do sexo masculino Todas as suposições usuais acerca do modelo de regressão linear clássico são satisfeitas Com base nos resultados acima e supondo que a amostra é suficientemente grande para que aproximações assintóticas sejam válidas é correto afirmar que O governo gostaria de estimar o efeito do Programa Saúde da Família sobre a taxa de internação por difteria das crianças entre 0 e 4 anos de idade Para isso ele gostaria de estimar o seguinte modelo de regressão Yi β0 β1Xi εi no qual Yi é a taxa de internação do município i Xi é uma variável binária que é igual a 1 se o município i participa do programa e 0 caso contrário Usando os dados para o Brasil em 2013 temos os seguintes resultados Ȳ1 85 Ȳ0 65 Neste caso Ȳ1 é a média da taxa de internação para os municípios que participaram do Programa e Ȳ0 é a média da taxa de internação para os municípios que não participaram do Programa Além disso 70 dos municípios brasileiros participam do Programa Saúde da Família Você estima o modelo acima por Mínimos Quadrados Ordinários Qual o valor obtido para o coeficiente associado a Xi Exercícios para estudo Hill Cap 9 91 97 Gujarati Cap 9 93 916 Wooldridge Cap 7 até item 74 71 7c4 Modelos de escolha Binária MPL MQO Probit Logit até agora estudamos a dummy como uma variável exógena X Os modelos de escolha binária estudam a variável endógena Y como binária Quando a exógena é binária a gente estuda mudança de probabilidade de ocorrência de um evento Exemplos morrer não morrer casar não casar ter filhos não ter filhos Ter covid não ter covid Ser preso por um crime não ser preso por um crime Ser elite não ser elite Começar a investigar não começar Ter laboratório de computador não ter hospital tem UTI neonatal não tem Base de dados