·
Ciências Econômicas ·
Econometria
Send your question to AI and receive an answer instantly
Recommended for you
Preview text
1 ECONOMETRIA II 3 Modelos de Escolha Qualitativa Até agora analisamos modelos cuja variável dependente assume apenas valores quantitativos enquanto as variáveis independentes podiam assumir valores quantitativos qualitativos ou ainda uma combinação entre ambos Nesta seção vamos abordar modelos que apresentam variáveis dependentes na forma qualitativa ou seja a variável assume apenas o valor 1 ou 01 Como exemplos para a variável y temos A escolha entre dois partidos políticos 1 se o voto é do PSDB 0 se for do PT A escolha de uma pessoa entrar ou não na força de trabalho 1 se entrar 0 caso contrário A probabilidade de um aluno ser aprovado ou não 1 se for aprovado 0 caso contrário 31 O modelo de Probabilidade Linear MPL Suponha o seguinte modelo de regressão múltipla 𝑦 𝛽0 𝛽1𝑋1 𝛽2𝑋2 𝛽𝑘𝑋𝑘 𝑢 1 Onde y é uma variável binária que assume somente dois valores 1 e 0 1Variáveis que assumem apenas dois valores 0 e 1 são chamadas de dicotômicas Em econometria existem diversos modelos que trabalham com variáveis que se enquadram em múltiplas categorias Modelos de escolha multinomial na qual y assume diferente categorias Ex A escolha de um aluno entre escolher cursar Economia Administração Engenharia e Letras Modelos de Escolha Ordenada onde as categorias aparecem de maneira ordenada Ex A resposta de uma pessoa a questionários de pesquisa que oferecem alternativas do tipo discorda fortemente discorda neutro concorda e concorda fortemente Modelos de dados de contagem ou Regressão de Poisson na qual y assume o número de ocorrências de um evento Ex O número de crianças em uma família 2 Observe que nesse modelo cada 𝛽𝑗 não pode ser interpretado como a mudança em y devido ao aumento de uma unidade em 𝑋𝑗 mantendo fixo todos os outros fatores já que y somente muda de zero para um ou de um para zero O modelo 1 é chamado de Modelo de Probabilidade Linear e pode ser escrito como 𝑃𝑦 1𝑋 𝛽0 𝛽1𝑋1 𝛽2𝑋2 𝛽𝑘𝑋𝑘 𝑢 2 Onde 𝑃𝑦 1𝑋 é chamado de probabilidade de resposta Se Pi probabilidade de que Yi 1 e 1 Pi probabilidade de que Yi 0 a variável Yi tem a seguinte distribuição de probabilidade Yi Probabilidade 0 1 Pi 1 Pi Total 1 Assim Yi segue uma distribuição de probabilidade de Bernoulli Observe que em 2 cada 𝛽𝑗 mede a mudança na probabilidade de sucesso quando 𝑋𝑗 muda mantendo fixos os outros fatores Exemplo 1 A tabela 151Gujaratti pág 475 apresenta dados relativos a posse ou não da casa própria em função da renda de 40 famílias O modelo teórico é dado abaixo 𝑃𝑦 1𝑋 𝛽0 𝛽1𝑋1 𝑢 Onde Y 1 se a família possui casa própria 0 caso contrário X é a renda da família em milhares de US Inicialmente insira os dados no Gretl Agora vamos rodar o MPL Clique em Modelo Mínimos Quadrados Ordinários e insira a equação acima A saída abaixo mostra os resultados 3 Interpretação O intercepto 09457 nos dá a probabilidade de que uma família sem renda possua casa própria Como o valor é negativo tratamos esse valor como zero O termo de inclinação 𝛽1 indica que se a renda aumentar em 1 unidade a probabilidade de se possuir uma casa própria aumenta 01021 ou 1021 A probabilidade real de se possuir casa própria dado um determinado nível de renda pode ser calculado diretamente pela saída de regressão Assim se a renda for de 12000 x 12 a probabilidade de se possuir casa própria é 2795 𝑃𝑦𝑖𝑥 12 09457 1201021 Observe que o MPL nada mais é do que o uso de MQO quando a variável y assume dois valores 0 e 1 Embora a estimação seja simples o modelo de probabilidade linear apresenta vários problemas 1 Ausência de normalidade dos termos de erro Lembrese que a distribuição de 𝑢𝑖 é dado por Yi 𝒖𝒊 Probabilidade 1 1 𝛽0 𝛽1𝑋1 Pi 0 0 𝛽0 𝛽1𝑋1 1 Pi Total 1 Ou seja 𝑢𝑖 também segue uma distribuição de Bernoulli 2 Variâncias heterocedásticas dos termos de erro A variância de uma distribuição de Bernoulli é dada por 𝑣𝑎𝑟𝑢𝑖 𝑃𝑖1 𝑃𝑖 4 Sendo que como 𝑃𝑖 𝐸𝑌𝑖𝑋𝑖 𝛽0 𝛽1𝑋𝑖 a variância de 𝑢𝑖 depende dos valores de X o que a torna heterocedástica2 3 Impossibilidade de satisfazer 𝟎 𝑬𝒀𝒊𝑿𝒊 𝟏 Lembrese que 𝐸𝑌𝑖𝑋𝑖 calcula a probabilidade de y ocorrer dado algum valor de x Neste caso o uso de MPL não garante que os 𝑌𝑖 os valores estimados se situem entre 0 e 1 Para mostrar esse fato vamos usar os dados do exemplo 1 Clique na equação estimada seguido de Análise e selecione Mostrar efetivo ajustado resíduos A figura abaixo mostra os valores ajustados de Y 2 Lembrese que na presença de heterocedasticidade os estimadores de MQO embora sejam não tendenciosos não são mais eficientes ou seja não apresentam mais variância mínima 5 Observe que existem 12 valores de 𝑌𝑖 que são maiores que 1 ou menores que 0 4 Considera uma relação linear entre Pi e Xi No exemplo 1 o MPL considera que se x aumenta uma unidade a probabilidade de possuir casa própria aumenta sempre na mesma quantia de 010 independentemente do nível de renda O que não é lógico já que pessoas com nível de renda maior possuem mais chance de adquirir a casa própria Exemplo 2 O arquivo força de trabalho modificado Wooldridge pág 526 apresenta dados relativos a participação da mulher na força de trabalho O modelo teórico é dado abaixo 𝑃𝑦 1𝑥 𝛽0 𝛽1𝑛𝑒𝑠𝑝𝑟𝑒𝑑 𝛽2𝑒𝑑𝑢𝑐 𝛽3𝑒𝑥𝑝 𝛽4𝑒𝑥𝑝2𝛽5𝑖𝑑𝑎𝑑𝑒 𝛽6𝑐𝑟𝑖𝑎𝑚𝑒𝑑06 𝛽7𝑐𝑟𝑖𝑎𝑚𝑎6 𝑢 Onde nespred representa um índice de renda familiar Criamed06 nº de filhos menores de seis anos Criama6 nº de filhos maiores de seis anos Idade Idade da mulher Insira os dados no Gretl e rode o modelo acima Lembrese de criar a variável exp2 Abaixo segue a saída de regressão Interpretação 6 Um aumento de 10 unidades na renda familiar diminui a probabilidade de participação da mulher na força de trabalho em 34 Ter mais um filho diminui a probabilidade de participação da mulher na força de trabalho em 2618 Um ano a mais de educação aumenta a probabilidade participação da mulher na força de trabalho em 37 Os fatores listados acima restringem o uso de MPL Para resolver esses fatores precisamos de um modelo que tenha duas características A medida que Xi aumenta a Pi EY1X aumenta mas nunca sai da faixa de 0 1 A relação entre Pi e Xi é não linear ou seja se aproxima de zero a taxa cada vez menores quando x se reduz e se aproxima de 1 a taxas cada vez maiores a medida que Xi aumenta Modelos com essas características serão tratados nas próximas seções 32 Modelo Logit O modelo Logit é um modelo de escolha binária na forma 𝑃Y1X G𝛽0 𝛽1𝑋1 𝛽2𝑋2 𝛽𝑘𝑋𝑘 𝐺𝛽0 𝑿𝛽 1 Onde G é uma função de distribuição acumulada logística e apresenta as seguintes características 0 GZ 1 A relação entre Pi e Xi é não linear Graficamente temos 7 Uma função logística é definida como 𝐺𝑍 1 1 𝑒𝑧 1 1 1 𝑒𝑧 1 𝑒𝑧 1 𝑒𝑧 𝑒𝑧 1 𝑒𝑧 Dessa forma podemos escrever 1 como 𝑃𝑖 𝐸𝑌 𝑋𝑖 1 1 𝑒𝛽0 𝛽1𝑋1 𝛽2𝑋2 𝛽𝑘𝑋𝑘 2 Observe que 𝑃𝑖 é não linear tanto em Xi como em cada 𝛽 Dessa forma embora a função logística gere um 𝑃𝑖 entre 0 e 1 não podemos usar MQO diretamente em sua estimação Para resolver esse problema vamos linearizar a equação 2 Assim temos 𝑃𝑖 𝑒𝑧 1𝑒𝑧 𝑒 1 𝑃𝑖 1 𝑒𝑧 1𝑒𝑧 1 1𝑒𝑧 Temos que 𝑃𝑖 1 𝑃𝑖 𝑒𝑧 1 𝑒𝑧 1 1 𝑒𝑧 𝑒𝑧 onde 𝑃𝑖 1 𝑃𝑖 mede a razão da probabilidade de um evento ocorrer contra a probabilidade de não ocorrer3 3 Ex Se Pi 08 𝑃𝑖 1 𝑃𝑖 4 o que indica que a probabilidade de um evento ocorrer é quatro vezes maior do que não ocorrer FDA 1 0 X 8 Aplicando ln temos 𝐿𝑖 𝑙𝑛 𝑃𝑖 1 𝑃𝑖 𝑍𝑖 𝛽0 𝛽1𝑋1 𝛽2𝑋2 𝛽𝑘𝑋𝑘 3 Onde cada coeficiente angular 𝛽1 𝛽𝑘 mede a variação de L em resposta a uma unidade de variação de X isto é nos diz o quanto o logaritmo das chances favoráveis à ocorrência do evento variam em resposta a mudanças de uma unidade de X Observação Quando P vai de 0 a 1 z vai de 𝑎 o logit L vai de 𝑎 ou seja as probabilidades estão entre 0 e 1enquanto os logit não são limitados 321 Estimação do modelo Logit A estimação de um modelo Logit depende do tipo de dados que temos 4Basicamente os dados podem ser a nível individual ou a nível agrupado a Dados em nível individual Exemplo os dados usados no exemplo 1 na qual cada observação se refere a uma família Neste caso a estimação de 3 por MQO é inviável5 já que no exemplo 𝑃𝑖 1 se a família possui casa própria e 𝑃𝑖 0 caso contrário Esse fato pode ser visto facilmente na utilização da equação Logit 𝐿𝑖 𝑙𝑛 𝑃𝑖 1𝑃𝑖 𝑙𝑛 1 0 se a família possuir casa própria 𝐿𝑖 𝑙𝑛 𝑃𝑖 1𝑃𝑖 ln 0 1 em caso contrário Exemplo 1 Notas de alunos Gujarati pág 559 A tabela 157 apresenta um modelo das notas finais na disciplina de Microeconomia em função de algumas características O modelo teórico é 𝑁𝑜𝑡𝑎𝑖 𝛽1 𝛽2𝐺𝑃𝐴 𝛽3𝑇𝑈𝐶𝐸 𝛽4𝑃𝑆𝐼 4 Inicialmente veremos apenas a estimação a nível individual 5 Embora não podemos usar MQO a estimação de um modelo Logit para dados individuais pode ser feita por meio do método de Máxima Verossimilhança MV 9 Que pode ser escrito como 𝐿𝑖 𝑙𝑛 𝑃𝑖 1 𝑃𝑖 𝛽1 𝛽2𝐺𝑃𝐴 𝛽3𝑇𝑈𝐶𝐸 𝛽4𝑃𝑆𝐼 Onde Notas 1 se o conceito final for A 0 se o conceito final for B ou C GPA média de pontos no início do curso TUCE Pontuação em prova dada no início do semestre para testar o conhecimento inicial em macroeconomia PSI 1 se o aluno utilizou algum método extra de ensino ex nivelamento na Fecap 0 caso contrário Vamos inserir os dados no Gretl e estimar o modelo proposto Clique em Modelo Variável Limitada Dependente Logit e Binário O gretl apresenta a possibilidade de criar uma saída com pvalores ou com inclinações calculadas na média A saída abaixo mostra os resultados considerando pvalores 10 Interpretação Existem 21 pessoas 183 linha efetivo que não tiraram A e 11 38 pessoas que tiraram A Cada coeficiente angular mede a variação no logit estimado para uma variação unitária do valor do regressor mantendose as demais variáveis constantes O aumento de uma unidade nas notas médias do início do curso GPA gera um aumento de 283 no logit ou seja o aumento de uma unidade de GPA aumenta o logaritmo das chances de um aluno tirar A em comparação a não tirar A Todos os coeficientes não são significativos ao nível de 1 Como o modelo Logit utiliza o método de Máxima Verosimilhança a significância estatística de um coeficiente pela estatística Z Normal Usamos o teste Razão de Verosimilhança LR statistic para testar a significância conjunta das variáveis cuja a hipótese nula é de que todos os coeficientes menos a constante são iguais a zero Neste caso como o p valor é menor que o nível de significância 00015 001 rejeitamos a hipótese nula ou seja os coeficientes em conjunto são significativos Para interpretarmos cada coeficiente em termos de chances precisamos calcular o antilogaritmo Assim temos Coeficiente PSI 𝑒2378688 1079 Interpretação Os alunos que se submeteram ao método extra de ensino possuem dez vezes mais chances de obterem A do que aqueles que não se submeteram 11 A medida de ajustamento R2 não é usada em modelos de escolha qualitativa Uma alternativa são os chamados Pseudo R2 Neste caso no Gretl essa medida é dada pelo R2 de MacFadden cuja interpretação é semelhante ao R2 tradicional ou seja 3741 do y é explicado pela parte explicativa Existem outras análises interessantes que podem ser obtidas com o software Gretl 1 Probabilidade Estimada Podemos calcular a probabilidade estimada pelo modelo para cada observação pessoa do nosso exemplo Assim clique em Análise seguindo de Mostrar Efetivo ajustado resíduos Observase que para a observação 10 a probabilidade estimada é de 069351 69351 Como o estudante tirou A inicialmente atribuímos uma probabilidade igual a um o que difere da probabilidade estimada pelo modelo 069351 Dessa 12 forma até que ponto os dados estimados possuem um bom ajustamento com os dados reais Uma maneira de responder a esta questão é calcular um outro pseudo R2 chamado de Count R2 𝑅2 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑝𝑟𝑒𝑣𝑖𝑠õ𝑒𝑠 𝑐𝑜𝑟𝑟𝑒𝑡𝑎𝑠 𝑛ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎çõ𝑒𝑠 O cálculo desse coeficiente é feito atribuindo valor 1 a todas as probabilidades previstas que são maiores que 05 denominado valor c enquanto que as probabilidades menores que 05 são atribuídas o valor 0 Depois contamos o número de previsões corretas e jogamos na fórmula acima Para mostrar isso vamos salvar os valores ajustados da saída de regressão do modelo Logit Clique em Salvar Valores ajustados Salve com o nome Notaprop Agora vamos classificar cada probabilidade como 1 ou 0 Clique em Acrescentar Definir nova Variável Crie a variável Notaclas com o comando notaclas notaprop 056 Temos os seguintes resultados 6 Esse comando define como valor 1 a observação que possui valor igual ou superior a 05 e zero caso contrário 13 Agora selecione as variáveis Nota Notaprop e notaclas Clique em Dados Mostrar valores Temos os seguintes resultados 14 No exemplo seguindo esse critério temos 06 previsões erradas 14 19 24 26 31 e 32 o que gerou o seguinte cálculo para o Count R2 𝑅2 26 32 08125 Vamos montar agora uma tabela cruzada com as variáveis nota e notaclass Selecione as duas variáveis e clique em Ver tabulação cruzada 15 Observe que Essa tabela é a mesma que aparece na saída de regressão do logit Do total de 32 pessoas da amostra 21 pessoas não tiraram A e 11 pessoas tiraram A Do total de 21 observações de valor 0 para a variável dependente o modelo estimou 18 ocorrências do valor 0 O que garante um percentual de 8571 de acerto Do total de 32 observações o modelo estimou 26 observações corretas O que garante um percentual de 8125 de acerto Esse percentual representa o Count R2 2 Probabilidades Ao salvar o valores ajustados notap achamos a série de probabilidades 𝑃𝑖 𝑒𝑧 1 𝑒𝑧 Com essa série é possível calcular a razão de chances entre o aluno tirar nota A e não tirar nota A ou seja 𝑃𝑖 1 𝑃𝑖 𝑒𝑧 1 𝑒𝑧 1 1 𝑒𝑧 𝑒𝑧 Clique em Acrescentar Definir nova variável Coloque a equação chance p1p Teremos os seguintes resultados 16 Observe que para a vigésima observação segundo o modelo estimado a chance do aluno tirar A é 194 superior a chance de não tirar A A partir da série razão é possível criar a série de Logit 𝐿𝑖 𝑙𝑛 𝑃𝑖 1 𝑃𝑖 𝛽1 𝛽2𝐺𝑃𝐴 𝛽3𝑇𝑈𝐶𝐸 𝛽4𝑃𝑆𝐼 Clique em Acrescentar Definir nova variável Coloque a equação lograzao logchance Teremos os seguintes resultados 17 3 Impactos Marginais a Impacto de uma unidade sobre a razão chances Podemos calcular o impacto do aumento de uma unidade da variável independente sobre a razão das chances de tirar A ou não tirar A 𝑑𝑟𝑎𝑧ã𝑜 𝑑𝛽𝑗 exp 𝛽𝑗 Exemplo Suponha que queremos calcular o impacto de alteração de uma unidade no coeficiente 𝛽𝑇𝑈𝐶𝐸 18 𝑑𝑟𝑎𝑧ã𝑜 𝑑𝛽𝑇𝑈𝐶𝐸 exp𝛽𝑇𝑈𝐶𝐸 exp0095158 109983 A interpretação é a seguinte o aumento de uma unidade na nota da prova do início do curso tuce aumenta em 998 109983 1100 a chance de tirar nota A Os mesmos resultados podem ser cálculos com o seguinte comando do Gretl Scalar nomeexpcoeffn Abra o modulo de comandos do Gretl clicando em Ferramentas console gretl Coloque o seguinte comando logit NOTA const GPA PSI TUCE Dessa forma rodamos o modelo logit utilizando o console de comandos7 scalar btuce expcoeffTUCE b Impacto da variação de uma unidade sobre a probabilidade Podemos também calcular o impacto da variação de uma unidade independente sobre a probabilidade 𝑑𝑝𝑟𝑜𝑏 𝑑𝛽𝑗 𝛽𝑗 𝑃𝑖1 𝑃𝑖 Observe que esse cálculo depende de cada probabilidade calculada pelo modelo e portanto os resultados representam uma nova série O comando do Gretl será Series impactoprob nome da equaçãocoefsnsériep1 sériep Exemplo suponha que queremos calcular o impacto da variação de uma unidade em GPA sobre as probabilidades 𝑑𝑝𝑟𝑜𝑏 𝑑𝛽𝐺𝑃𝐴 𝛽𝐺𝑃𝐴 𝑃𝑖1 𝑃𝑖 series impactogpa coeffGPAp1p O Gretl cria uma nova série com os resultados 7 Essa ação é necessária para poder inserir novos comandos no Gretl 19 Interpretação Para o aluno n 17 o aumento de uma unidade em GPA aumenta a probabilidade desse aluno tirar A em 1434 c Impacto individual dos coeficientes calculados pelos valores médios das variáveis O Gretl apresenta o impacto individual das variáveis sobre a probabilidade do evento sucesso usando como base o valor médio dos regressores Lembrese que a probabilidade do evento sucesso é dado por 𝑃Y1X G𝛽0 𝛽1𝑋1 𝛽2𝑋2 𝛽𝑘𝑋𝑘 𝐺𝛽0 𝑿𝛽 1 Onde G é uma função de distribuição acumulada logística Dessa forma o impacto individual será dado pela seguinte derivada 20 𝑑𝑔 𝑑𝑥𝑖 𝑔𝛽0 𝑿𝛽𝛽𝑥𝑖 Observe que o impacto individual de um regressor depende do seu 𝛽 e da função de densidade de probabilidade fdp calculada para valores de X Neste caso o Gretl utiliza como X os valores médios de cada variável e apresenta o resultado dessa derivada na própria estimação do modelo Logit8 Observe que O valor de 𝑔𝛽0 𝑿𝛽 é dado pelo termo fbetax Dessa forma o seu valor é de 0189 O valor da inclinação para todos os coeficientes é dado pela multiplicação de fbetax pelo respectivo 𝛽 O valor de 𝑔𝛽0 𝑿𝛽 representa o valor da distribuição acumulada logística calculada com os valores médios de cada variável Selecione as variáveis e clique em Ver estatísticas descritivas Dessa forma temos 8 No momento da estimação é preciso selecionar a opção mostrar inclinações na média 21 Inclinação GPA Dado um valor médio de 3117 o aumento de um ponto na média dos alunos no início do curso aumenta a probabilidade do aluno tirar nota A em 5338 Inclinação Tuce Dado um valor médio de 2194 o aumento de um ponto na nota de conhecimento inicial em economia aumenta a probabilidade do aluno tirar nota A em 180 Inclinação PSI Um aluno que resolve participar do programa de nivelamento aumenta a probabilidade de tirar nota A em 4565 Exemplo 2 O arquivo força de trabalho Wooldridge pág 526 apresenta dados relativos a participação da mulher na força de trabalho O modelo teórico é dado abaixo 𝑃𝑦 1𝑥 𝛽0 𝛽1𝑛𝑒𝑠𝑝𝑟𝑒𝑑 𝛽2𝑒𝑑𝑢𝑐 𝛽3𝑒𝑥𝑝 𝛽4𝑒𝑥𝑝2𝛽5𝑖𝑑𝑎𝑑𝑒 𝛽6𝑐𝑟𝑖𝑎𝑚𝑒𝑑06 𝛽7𝑐𝑟𝑖𝑎𝑚𝑎6 𝑢 Onde nespred representa um índice de renda familiar Criamed06 nº de filhos menores de seis anos Criama6 nº de filhos maiores de seis anos Idade Idade da mulher Insira os dados no Gretl e rode o modelo acima usando o método Logit com p valor Abaixo segue a saída de regressão 22 Interpretação Existem 428 81 347 mulheres que entraram na força de trabalho e 325 207 118 pessoas que não entraram O aumento de um ano a mais de educação gera um aumento de 0221 no Logit ou seja um ano a mais de educação aumenta o logaritmo das chances de uma mulher entrar na força de trabalho em comparação a não entrar no mercado de trabalho Com exceção dos coeficientes Nesprend e Criama6 todos os coeficientes são significativos ao nível de 1 de significância Com relação ao teste LR rejeitamos a hipótese nula de que todos os coeficientes menos a constante são iguais a zero As mulheres que possuem filhos maiores que 06 anos possuem 106 mais chances 𝑒0060112 de entrar na força de trabalho do que mulheres que não tem Temos que 2196 da variação do Y é explicado pela parte explicativa O Count R2 é igual a 7357 ou seja do total de 753 mulheres da amostra o modelo estimou 554 observações corretas Agora vamos estimar o modelo Logit com as inclinações 23 Lembrese que as inclinações são calculadas com o valor médio de cada variável Neste caso considerando um valor médio de 1228 anos de estudo o aumento de um ano a mais e de educação aumenta a probabilidade de participação da mulher na força de trabalho em 537 A série de probabilidades pode ser salva com o comando Salvar Valores ajustados Observe que para a observação número 05 a probabilidade é de 05811 ou seja o modelo estimou que a referida mulher possui uma probabilidade de 5811 de entrar no mercado de trabalho A partir da série de probabilidades criamos a série de razão de chances Clique em Acrescentar Definir nova variável Coloque a equação chance p1 p Teremos os seguintes resultados 24 Observe que para a observação 5 a chance da mulher entrar na força de trabalho é 138 superior a chance de não entrar 33 Modelo Probit O modelo Probit é um modelo de escolha binária na forma 𝑃Y1X G𝛽0 𝛽1𝑋1 𝛽2𝑋2 𝛽𝑘𝑋𝑘 𝐺𝛽0 𝑿𝛽 1 Onde G é uma função de distribuição acumulada normal e apresenta as seguintes características 0 GZ 1 A relação entre Pi e Xi é não linear 𝐺𝑥 1 2𝜎2𝜋 𝑒 𝑥𝜇2 2𝜎2 𝑥0 Para conhecer o efeito de uma variação unitária em X sobre a probabilidade de y 1 basta derivar 1 25 𝑑𝑃𝑖 𝑑𝑥𝑖 𝑓𝛽0 𝛽1𝑋1 𝛽2𝑋2 𝛽𝑘𝑋𝑘𝛽𝑖 Observe que A função 𝑓 é a função de densidade de probabilidade normal padrão em 𝛽0 𝑿𝛽 A variação depende do valor de x A estimação de um modelo Probit também depende do tipo de dados que temos disposiçãodados em nível individual ou agrupados a Dados em nível individual Exemplo 1 Notas de alunos Gujarati pág 559 A tabela 157 apresenta um modelo das notas finais na disciplina de Microeconomia em função de algumas características O modelo teórico é 𝑁𝑜𝑡𝑎𝑖 𝛽1 𝛽2𝐺𝑃𝐴 𝛽3𝑇𝑈𝐶𝐸 𝛽4𝑃𝑆𝐼 Onde Notas 1 se o conceito final for A 0 se o conceito final for B ou C GPA média de pontos no início do curso TUCE Pontuação em prova dada no início do semestre para testar o conhecimento inicial em macroeconomia PSI 1 se o aluno utilizou algum método extra de ensino ex nivelamento na Fecap 0 caso contrário Insira os dados no Gretl e estime o modelo Probit Clique em Modelo Variável Dependente Limitada Probit Binário Abaixo temos os seguintes resultados selecionando a opção com pvalor 26 Observe que As variáveis não são significativas ao nível de 1 Do total da variação da variável y 3774 se deve a variação da parte explicativa Foram encontradas 21 observações com y 0 e 11 com y 1 Rejeitamos a hipótese nula de que todos os coeficientes com exceção da constante são iguais a zero 00014 001 ao nível de significância de 1 A variável GPA indica que o aumento de uma unidade em gpa gera um aumento de 162 no Index Do total de 32 observações o modelo acertou 812 Aceitamos a hipótese nula de que o erro possui distribuição normal 0164426 001 A saída com as inclinações é dada abaixo 27 Observe que Inclinação GPA Dado um valor médio de 3117 o aumento de um ponto na média dos alunos no início do curso aumenta a probabilidade do aluno tirar nota A em 5333 Inclinação Tuce Dado um valor médio de 2194 o aumento de um ponto na nota de conhecimento inicial em economia aumenta a probabilidade do aluno tirar nota A em 17 Inclinação PSI Um aluno que resolve participar do programa de nivelamento aumenta a probabilidade de tirar nota A em 4644 Podemos calcular as probabilidades estimadas pelo modelo Probit Após rodar o modelo clique em Salvar valores ajustados 28 Para a observação 3 o modelo Probit estimou uma probabilidade de 1899 de chance de o aluno tirar A em Microeconomia Podemos calcular o impacto da variação de GPA sobre a probabilidade de y 1 ou seja 𝑑𝑃𝑖 𝑑𝑥𝑖 𝑓𝛽0 𝛽1𝑋1 𝛽2𝑋2 𝛽𝑘𝑋𝑘𝛽𝑖 Nesse caso para o exercício temos 𝑑𝑃𝑖 𝑑𝐺𝑃𝐴 𝑓𝛽0 𝛽1𝑋1 𝛽2𝑋2 𝛽𝑘𝑋𝑘𝛽𝑔𝑝𝑎 O comando do Gretl para esse cálculo seria series x dnormcoeffconstcoeffGPAGPAcoeffTUCETUCEcoeffPSIPSIcoeffGPA Executando este comando temos uma nova série Para a observação 1 temos que o aumento de uma unidade em gpa gera um aumento de 725 a probabilidade do aluno tirar A na prova 29 Comparação entre modelos Logit e Probit Na maioria das aplicações os modelos Logit e Probit apresentam resultados parecidos A principal diferença é o fato da distribuição logística apresentar caudas ligeiramente mais pesadas que a distribuição normal Na prática os coeficientes dos Modelos Probit e Logit não podem ser diretamente comparados Uma maneira alternativa para comparar os modelos de MPL Logit e Probit é aplicar os seguintes fatores de conversão 𝛽𝑀𝑃𝐿 025𝛽𝐿𝑜𝑔𝑖𝑡 exceto para o intercepto 𝛽𝑀𝑃𝐿 025𝛽𝐿𝑜𝑔𝑖𝑡 05 para o intercepto 𝛽𝑃𝑟𝑜𝑏𝑖𝑡 0625𝛽𝐿𝑜𝑔𝑖𝑡 𝛽𝐿𝑜𝑔𝑖𝑡 16𝛽𝑃𝑟𝑜𝑏𝑖𝑡 Exemplo 2 Transporte Coletivo x Transporte de automóvel Hill Griffiths e Judge pág 433 O arquivo dat 181 apresenta a escolha entre transporte coletivo e transporte de automóvel para uma amostra de 21 pessoas O modelo teórico é dado abaixo 𝑌𝑖 𝛽0 𝛽1𝑋1 30 Onde 𝑌𝑖 1 se a pessoa escolheu o transporte de carro 0 caso contrário 𝑋1 variável que mede a diferença entre tempo de ônibus e o tempo de carro Insira os dados no Gretl e rode o modelo Probit Abaixo segue a respectiva saída Observe que O sinal positivo da variável x indica que o aumento no tempo gasto com transporte coletivo gera um aumento da probabilidade do indivíduo escolher viajar de carro próprio O intercepto vertical é não significativo enquanto o intercepto linear é significativo ao nível de 1 O R2 de MacFadden indica que 5757 da variação de Y se deve a variação da parte explicativa O Count R2 indica que o modelo acertou 905 do total de observações previstas Dado o valor médio de 12238 o aumento de uma unidade na diferença de tempo entre transporte coletivo e carro aumenta a probabilidade do indivíduo escolher o carro próprio em 119 O Count R2 pode ser visto com a tabela de Avaliação Expectativa Observe que o Count R2 é de 9048 indicando um alto poder de previsão do modelo Probit estimado para a variável y 31 Podemos calcular o impacto da variação de X sobre a probabilidade de y 1 ou seja 𝑑𝑃𝑖 𝑑𝑥 𝑓𝛽0 𝛽1𝑋1 𝛽2𝑋2 𝛽𝑘𝑋𝑘𝛽𝑥 Neste caso para o exercício temos 𝑑𝑃𝑖 𝑑𝑥 𝑓𝛽0 𝛽1𝑋1𝛽1 O comando do Gretl para esse cálculo seria series impact dnormcoeffconstcoeffXXcoeffX Temos o seguinte resultado Dessa forma para a observação 1 o aumento de uma unidade em X gera um aumento de 377 na probabilidade dessa pessoa escolher usar o carro próprio Podemos calcular qual é probabilidade de um indivíduo escolher usar o carro próprio dado que o percurso de ônibus leva 30 minutos a mais do que o automóvel O comando do Gretl para esse cálculo será scalar y30cnormcoeffconstcoeffX30 Temos a seguinte saída 32 Dessa forma considerando que o ônibus gasta 30 minutos a mais que o automóvel a probabilidade de um indivíduo escolher usar o carro próprio é de 7982
Send your question to AI and receive an answer instantly
Recommended for you
Preview text
1 ECONOMETRIA II 3 Modelos de Escolha Qualitativa Até agora analisamos modelos cuja variável dependente assume apenas valores quantitativos enquanto as variáveis independentes podiam assumir valores quantitativos qualitativos ou ainda uma combinação entre ambos Nesta seção vamos abordar modelos que apresentam variáveis dependentes na forma qualitativa ou seja a variável assume apenas o valor 1 ou 01 Como exemplos para a variável y temos A escolha entre dois partidos políticos 1 se o voto é do PSDB 0 se for do PT A escolha de uma pessoa entrar ou não na força de trabalho 1 se entrar 0 caso contrário A probabilidade de um aluno ser aprovado ou não 1 se for aprovado 0 caso contrário 31 O modelo de Probabilidade Linear MPL Suponha o seguinte modelo de regressão múltipla 𝑦 𝛽0 𝛽1𝑋1 𝛽2𝑋2 𝛽𝑘𝑋𝑘 𝑢 1 Onde y é uma variável binária que assume somente dois valores 1 e 0 1Variáveis que assumem apenas dois valores 0 e 1 são chamadas de dicotômicas Em econometria existem diversos modelos que trabalham com variáveis que se enquadram em múltiplas categorias Modelos de escolha multinomial na qual y assume diferente categorias Ex A escolha de um aluno entre escolher cursar Economia Administração Engenharia e Letras Modelos de Escolha Ordenada onde as categorias aparecem de maneira ordenada Ex A resposta de uma pessoa a questionários de pesquisa que oferecem alternativas do tipo discorda fortemente discorda neutro concorda e concorda fortemente Modelos de dados de contagem ou Regressão de Poisson na qual y assume o número de ocorrências de um evento Ex O número de crianças em uma família 2 Observe que nesse modelo cada 𝛽𝑗 não pode ser interpretado como a mudança em y devido ao aumento de uma unidade em 𝑋𝑗 mantendo fixo todos os outros fatores já que y somente muda de zero para um ou de um para zero O modelo 1 é chamado de Modelo de Probabilidade Linear e pode ser escrito como 𝑃𝑦 1𝑋 𝛽0 𝛽1𝑋1 𝛽2𝑋2 𝛽𝑘𝑋𝑘 𝑢 2 Onde 𝑃𝑦 1𝑋 é chamado de probabilidade de resposta Se Pi probabilidade de que Yi 1 e 1 Pi probabilidade de que Yi 0 a variável Yi tem a seguinte distribuição de probabilidade Yi Probabilidade 0 1 Pi 1 Pi Total 1 Assim Yi segue uma distribuição de probabilidade de Bernoulli Observe que em 2 cada 𝛽𝑗 mede a mudança na probabilidade de sucesso quando 𝑋𝑗 muda mantendo fixos os outros fatores Exemplo 1 A tabela 151Gujaratti pág 475 apresenta dados relativos a posse ou não da casa própria em função da renda de 40 famílias O modelo teórico é dado abaixo 𝑃𝑦 1𝑋 𝛽0 𝛽1𝑋1 𝑢 Onde Y 1 se a família possui casa própria 0 caso contrário X é a renda da família em milhares de US Inicialmente insira os dados no Gretl Agora vamos rodar o MPL Clique em Modelo Mínimos Quadrados Ordinários e insira a equação acima A saída abaixo mostra os resultados 3 Interpretação O intercepto 09457 nos dá a probabilidade de que uma família sem renda possua casa própria Como o valor é negativo tratamos esse valor como zero O termo de inclinação 𝛽1 indica que se a renda aumentar em 1 unidade a probabilidade de se possuir uma casa própria aumenta 01021 ou 1021 A probabilidade real de se possuir casa própria dado um determinado nível de renda pode ser calculado diretamente pela saída de regressão Assim se a renda for de 12000 x 12 a probabilidade de se possuir casa própria é 2795 𝑃𝑦𝑖𝑥 12 09457 1201021 Observe que o MPL nada mais é do que o uso de MQO quando a variável y assume dois valores 0 e 1 Embora a estimação seja simples o modelo de probabilidade linear apresenta vários problemas 1 Ausência de normalidade dos termos de erro Lembrese que a distribuição de 𝑢𝑖 é dado por Yi 𝒖𝒊 Probabilidade 1 1 𝛽0 𝛽1𝑋1 Pi 0 0 𝛽0 𝛽1𝑋1 1 Pi Total 1 Ou seja 𝑢𝑖 também segue uma distribuição de Bernoulli 2 Variâncias heterocedásticas dos termos de erro A variância de uma distribuição de Bernoulli é dada por 𝑣𝑎𝑟𝑢𝑖 𝑃𝑖1 𝑃𝑖 4 Sendo que como 𝑃𝑖 𝐸𝑌𝑖𝑋𝑖 𝛽0 𝛽1𝑋𝑖 a variância de 𝑢𝑖 depende dos valores de X o que a torna heterocedástica2 3 Impossibilidade de satisfazer 𝟎 𝑬𝒀𝒊𝑿𝒊 𝟏 Lembrese que 𝐸𝑌𝑖𝑋𝑖 calcula a probabilidade de y ocorrer dado algum valor de x Neste caso o uso de MPL não garante que os 𝑌𝑖 os valores estimados se situem entre 0 e 1 Para mostrar esse fato vamos usar os dados do exemplo 1 Clique na equação estimada seguido de Análise e selecione Mostrar efetivo ajustado resíduos A figura abaixo mostra os valores ajustados de Y 2 Lembrese que na presença de heterocedasticidade os estimadores de MQO embora sejam não tendenciosos não são mais eficientes ou seja não apresentam mais variância mínima 5 Observe que existem 12 valores de 𝑌𝑖 que são maiores que 1 ou menores que 0 4 Considera uma relação linear entre Pi e Xi No exemplo 1 o MPL considera que se x aumenta uma unidade a probabilidade de possuir casa própria aumenta sempre na mesma quantia de 010 independentemente do nível de renda O que não é lógico já que pessoas com nível de renda maior possuem mais chance de adquirir a casa própria Exemplo 2 O arquivo força de trabalho modificado Wooldridge pág 526 apresenta dados relativos a participação da mulher na força de trabalho O modelo teórico é dado abaixo 𝑃𝑦 1𝑥 𝛽0 𝛽1𝑛𝑒𝑠𝑝𝑟𝑒𝑑 𝛽2𝑒𝑑𝑢𝑐 𝛽3𝑒𝑥𝑝 𝛽4𝑒𝑥𝑝2𝛽5𝑖𝑑𝑎𝑑𝑒 𝛽6𝑐𝑟𝑖𝑎𝑚𝑒𝑑06 𝛽7𝑐𝑟𝑖𝑎𝑚𝑎6 𝑢 Onde nespred representa um índice de renda familiar Criamed06 nº de filhos menores de seis anos Criama6 nº de filhos maiores de seis anos Idade Idade da mulher Insira os dados no Gretl e rode o modelo acima Lembrese de criar a variável exp2 Abaixo segue a saída de regressão Interpretação 6 Um aumento de 10 unidades na renda familiar diminui a probabilidade de participação da mulher na força de trabalho em 34 Ter mais um filho diminui a probabilidade de participação da mulher na força de trabalho em 2618 Um ano a mais de educação aumenta a probabilidade participação da mulher na força de trabalho em 37 Os fatores listados acima restringem o uso de MPL Para resolver esses fatores precisamos de um modelo que tenha duas características A medida que Xi aumenta a Pi EY1X aumenta mas nunca sai da faixa de 0 1 A relação entre Pi e Xi é não linear ou seja se aproxima de zero a taxa cada vez menores quando x se reduz e se aproxima de 1 a taxas cada vez maiores a medida que Xi aumenta Modelos com essas características serão tratados nas próximas seções 32 Modelo Logit O modelo Logit é um modelo de escolha binária na forma 𝑃Y1X G𝛽0 𝛽1𝑋1 𝛽2𝑋2 𝛽𝑘𝑋𝑘 𝐺𝛽0 𝑿𝛽 1 Onde G é uma função de distribuição acumulada logística e apresenta as seguintes características 0 GZ 1 A relação entre Pi e Xi é não linear Graficamente temos 7 Uma função logística é definida como 𝐺𝑍 1 1 𝑒𝑧 1 1 1 𝑒𝑧 1 𝑒𝑧 1 𝑒𝑧 𝑒𝑧 1 𝑒𝑧 Dessa forma podemos escrever 1 como 𝑃𝑖 𝐸𝑌 𝑋𝑖 1 1 𝑒𝛽0 𝛽1𝑋1 𝛽2𝑋2 𝛽𝑘𝑋𝑘 2 Observe que 𝑃𝑖 é não linear tanto em Xi como em cada 𝛽 Dessa forma embora a função logística gere um 𝑃𝑖 entre 0 e 1 não podemos usar MQO diretamente em sua estimação Para resolver esse problema vamos linearizar a equação 2 Assim temos 𝑃𝑖 𝑒𝑧 1𝑒𝑧 𝑒 1 𝑃𝑖 1 𝑒𝑧 1𝑒𝑧 1 1𝑒𝑧 Temos que 𝑃𝑖 1 𝑃𝑖 𝑒𝑧 1 𝑒𝑧 1 1 𝑒𝑧 𝑒𝑧 onde 𝑃𝑖 1 𝑃𝑖 mede a razão da probabilidade de um evento ocorrer contra a probabilidade de não ocorrer3 3 Ex Se Pi 08 𝑃𝑖 1 𝑃𝑖 4 o que indica que a probabilidade de um evento ocorrer é quatro vezes maior do que não ocorrer FDA 1 0 X 8 Aplicando ln temos 𝐿𝑖 𝑙𝑛 𝑃𝑖 1 𝑃𝑖 𝑍𝑖 𝛽0 𝛽1𝑋1 𝛽2𝑋2 𝛽𝑘𝑋𝑘 3 Onde cada coeficiente angular 𝛽1 𝛽𝑘 mede a variação de L em resposta a uma unidade de variação de X isto é nos diz o quanto o logaritmo das chances favoráveis à ocorrência do evento variam em resposta a mudanças de uma unidade de X Observação Quando P vai de 0 a 1 z vai de 𝑎 o logit L vai de 𝑎 ou seja as probabilidades estão entre 0 e 1enquanto os logit não são limitados 321 Estimação do modelo Logit A estimação de um modelo Logit depende do tipo de dados que temos 4Basicamente os dados podem ser a nível individual ou a nível agrupado a Dados em nível individual Exemplo os dados usados no exemplo 1 na qual cada observação se refere a uma família Neste caso a estimação de 3 por MQO é inviável5 já que no exemplo 𝑃𝑖 1 se a família possui casa própria e 𝑃𝑖 0 caso contrário Esse fato pode ser visto facilmente na utilização da equação Logit 𝐿𝑖 𝑙𝑛 𝑃𝑖 1𝑃𝑖 𝑙𝑛 1 0 se a família possuir casa própria 𝐿𝑖 𝑙𝑛 𝑃𝑖 1𝑃𝑖 ln 0 1 em caso contrário Exemplo 1 Notas de alunos Gujarati pág 559 A tabela 157 apresenta um modelo das notas finais na disciplina de Microeconomia em função de algumas características O modelo teórico é 𝑁𝑜𝑡𝑎𝑖 𝛽1 𝛽2𝐺𝑃𝐴 𝛽3𝑇𝑈𝐶𝐸 𝛽4𝑃𝑆𝐼 4 Inicialmente veremos apenas a estimação a nível individual 5 Embora não podemos usar MQO a estimação de um modelo Logit para dados individuais pode ser feita por meio do método de Máxima Verossimilhança MV 9 Que pode ser escrito como 𝐿𝑖 𝑙𝑛 𝑃𝑖 1 𝑃𝑖 𝛽1 𝛽2𝐺𝑃𝐴 𝛽3𝑇𝑈𝐶𝐸 𝛽4𝑃𝑆𝐼 Onde Notas 1 se o conceito final for A 0 se o conceito final for B ou C GPA média de pontos no início do curso TUCE Pontuação em prova dada no início do semestre para testar o conhecimento inicial em macroeconomia PSI 1 se o aluno utilizou algum método extra de ensino ex nivelamento na Fecap 0 caso contrário Vamos inserir os dados no Gretl e estimar o modelo proposto Clique em Modelo Variável Limitada Dependente Logit e Binário O gretl apresenta a possibilidade de criar uma saída com pvalores ou com inclinações calculadas na média A saída abaixo mostra os resultados considerando pvalores 10 Interpretação Existem 21 pessoas 183 linha efetivo que não tiraram A e 11 38 pessoas que tiraram A Cada coeficiente angular mede a variação no logit estimado para uma variação unitária do valor do regressor mantendose as demais variáveis constantes O aumento de uma unidade nas notas médias do início do curso GPA gera um aumento de 283 no logit ou seja o aumento de uma unidade de GPA aumenta o logaritmo das chances de um aluno tirar A em comparação a não tirar A Todos os coeficientes não são significativos ao nível de 1 Como o modelo Logit utiliza o método de Máxima Verosimilhança a significância estatística de um coeficiente pela estatística Z Normal Usamos o teste Razão de Verosimilhança LR statistic para testar a significância conjunta das variáveis cuja a hipótese nula é de que todos os coeficientes menos a constante são iguais a zero Neste caso como o p valor é menor que o nível de significância 00015 001 rejeitamos a hipótese nula ou seja os coeficientes em conjunto são significativos Para interpretarmos cada coeficiente em termos de chances precisamos calcular o antilogaritmo Assim temos Coeficiente PSI 𝑒2378688 1079 Interpretação Os alunos que se submeteram ao método extra de ensino possuem dez vezes mais chances de obterem A do que aqueles que não se submeteram 11 A medida de ajustamento R2 não é usada em modelos de escolha qualitativa Uma alternativa são os chamados Pseudo R2 Neste caso no Gretl essa medida é dada pelo R2 de MacFadden cuja interpretação é semelhante ao R2 tradicional ou seja 3741 do y é explicado pela parte explicativa Existem outras análises interessantes que podem ser obtidas com o software Gretl 1 Probabilidade Estimada Podemos calcular a probabilidade estimada pelo modelo para cada observação pessoa do nosso exemplo Assim clique em Análise seguindo de Mostrar Efetivo ajustado resíduos Observase que para a observação 10 a probabilidade estimada é de 069351 69351 Como o estudante tirou A inicialmente atribuímos uma probabilidade igual a um o que difere da probabilidade estimada pelo modelo 069351 Dessa 12 forma até que ponto os dados estimados possuem um bom ajustamento com os dados reais Uma maneira de responder a esta questão é calcular um outro pseudo R2 chamado de Count R2 𝑅2 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑝𝑟𝑒𝑣𝑖𝑠õ𝑒𝑠 𝑐𝑜𝑟𝑟𝑒𝑡𝑎𝑠 𝑛ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎çõ𝑒𝑠 O cálculo desse coeficiente é feito atribuindo valor 1 a todas as probabilidades previstas que são maiores que 05 denominado valor c enquanto que as probabilidades menores que 05 são atribuídas o valor 0 Depois contamos o número de previsões corretas e jogamos na fórmula acima Para mostrar isso vamos salvar os valores ajustados da saída de regressão do modelo Logit Clique em Salvar Valores ajustados Salve com o nome Notaprop Agora vamos classificar cada probabilidade como 1 ou 0 Clique em Acrescentar Definir nova Variável Crie a variável Notaclas com o comando notaclas notaprop 056 Temos os seguintes resultados 6 Esse comando define como valor 1 a observação que possui valor igual ou superior a 05 e zero caso contrário 13 Agora selecione as variáveis Nota Notaprop e notaclas Clique em Dados Mostrar valores Temos os seguintes resultados 14 No exemplo seguindo esse critério temos 06 previsões erradas 14 19 24 26 31 e 32 o que gerou o seguinte cálculo para o Count R2 𝑅2 26 32 08125 Vamos montar agora uma tabela cruzada com as variáveis nota e notaclass Selecione as duas variáveis e clique em Ver tabulação cruzada 15 Observe que Essa tabela é a mesma que aparece na saída de regressão do logit Do total de 32 pessoas da amostra 21 pessoas não tiraram A e 11 pessoas tiraram A Do total de 21 observações de valor 0 para a variável dependente o modelo estimou 18 ocorrências do valor 0 O que garante um percentual de 8571 de acerto Do total de 32 observações o modelo estimou 26 observações corretas O que garante um percentual de 8125 de acerto Esse percentual representa o Count R2 2 Probabilidades Ao salvar o valores ajustados notap achamos a série de probabilidades 𝑃𝑖 𝑒𝑧 1 𝑒𝑧 Com essa série é possível calcular a razão de chances entre o aluno tirar nota A e não tirar nota A ou seja 𝑃𝑖 1 𝑃𝑖 𝑒𝑧 1 𝑒𝑧 1 1 𝑒𝑧 𝑒𝑧 Clique em Acrescentar Definir nova variável Coloque a equação chance p1p Teremos os seguintes resultados 16 Observe que para a vigésima observação segundo o modelo estimado a chance do aluno tirar A é 194 superior a chance de não tirar A A partir da série razão é possível criar a série de Logit 𝐿𝑖 𝑙𝑛 𝑃𝑖 1 𝑃𝑖 𝛽1 𝛽2𝐺𝑃𝐴 𝛽3𝑇𝑈𝐶𝐸 𝛽4𝑃𝑆𝐼 Clique em Acrescentar Definir nova variável Coloque a equação lograzao logchance Teremos os seguintes resultados 17 3 Impactos Marginais a Impacto de uma unidade sobre a razão chances Podemos calcular o impacto do aumento de uma unidade da variável independente sobre a razão das chances de tirar A ou não tirar A 𝑑𝑟𝑎𝑧ã𝑜 𝑑𝛽𝑗 exp 𝛽𝑗 Exemplo Suponha que queremos calcular o impacto de alteração de uma unidade no coeficiente 𝛽𝑇𝑈𝐶𝐸 18 𝑑𝑟𝑎𝑧ã𝑜 𝑑𝛽𝑇𝑈𝐶𝐸 exp𝛽𝑇𝑈𝐶𝐸 exp0095158 109983 A interpretação é a seguinte o aumento de uma unidade na nota da prova do início do curso tuce aumenta em 998 109983 1100 a chance de tirar nota A Os mesmos resultados podem ser cálculos com o seguinte comando do Gretl Scalar nomeexpcoeffn Abra o modulo de comandos do Gretl clicando em Ferramentas console gretl Coloque o seguinte comando logit NOTA const GPA PSI TUCE Dessa forma rodamos o modelo logit utilizando o console de comandos7 scalar btuce expcoeffTUCE b Impacto da variação de uma unidade sobre a probabilidade Podemos também calcular o impacto da variação de uma unidade independente sobre a probabilidade 𝑑𝑝𝑟𝑜𝑏 𝑑𝛽𝑗 𝛽𝑗 𝑃𝑖1 𝑃𝑖 Observe que esse cálculo depende de cada probabilidade calculada pelo modelo e portanto os resultados representam uma nova série O comando do Gretl será Series impactoprob nome da equaçãocoefsnsériep1 sériep Exemplo suponha que queremos calcular o impacto da variação de uma unidade em GPA sobre as probabilidades 𝑑𝑝𝑟𝑜𝑏 𝑑𝛽𝐺𝑃𝐴 𝛽𝐺𝑃𝐴 𝑃𝑖1 𝑃𝑖 series impactogpa coeffGPAp1p O Gretl cria uma nova série com os resultados 7 Essa ação é necessária para poder inserir novos comandos no Gretl 19 Interpretação Para o aluno n 17 o aumento de uma unidade em GPA aumenta a probabilidade desse aluno tirar A em 1434 c Impacto individual dos coeficientes calculados pelos valores médios das variáveis O Gretl apresenta o impacto individual das variáveis sobre a probabilidade do evento sucesso usando como base o valor médio dos regressores Lembrese que a probabilidade do evento sucesso é dado por 𝑃Y1X G𝛽0 𝛽1𝑋1 𝛽2𝑋2 𝛽𝑘𝑋𝑘 𝐺𝛽0 𝑿𝛽 1 Onde G é uma função de distribuição acumulada logística Dessa forma o impacto individual será dado pela seguinte derivada 20 𝑑𝑔 𝑑𝑥𝑖 𝑔𝛽0 𝑿𝛽𝛽𝑥𝑖 Observe que o impacto individual de um regressor depende do seu 𝛽 e da função de densidade de probabilidade fdp calculada para valores de X Neste caso o Gretl utiliza como X os valores médios de cada variável e apresenta o resultado dessa derivada na própria estimação do modelo Logit8 Observe que O valor de 𝑔𝛽0 𝑿𝛽 é dado pelo termo fbetax Dessa forma o seu valor é de 0189 O valor da inclinação para todos os coeficientes é dado pela multiplicação de fbetax pelo respectivo 𝛽 O valor de 𝑔𝛽0 𝑿𝛽 representa o valor da distribuição acumulada logística calculada com os valores médios de cada variável Selecione as variáveis e clique em Ver estatísticas descritivas Dessa forma temos 8 No momento da estimação é preciso selecionar a opção mostrar inclinações na média 21 Inclinação GPA Dado um valor médio de 3117 o aumento de um ponto na média dos alunos no início do curso aumenta a probabilidade do aluno tirar nota A em 5338 Inclinação Tuce Dado um valor médio de 2194 o aumento de um ponto na nota de conhecimento inicial em economia aumenta a probabilidade do aluno tirar nota A em 180 Inclinação PSI Um aluno que resolve participar do programa de nivelamento aumenta a probabilidade de tirar nota A em 4565 Exemplo 2 O arquivo força de trabalho Wooldridge pág 526 apresenta dados relativos a participação da mulher na força de trabalho O modelo teórico é dado abaixo 𝑃𝑦 1𝑥 𝛽0 𝛽1𝑛𝑒𝑠𝑝𝑟𝑒𝑑 𝛽2𝑒𝑑𝑢𝑐 𝛽3𝑒𝑥𝑝 𝛽4𝑒𝑥𝑝2𝛽5𝑖𝑑𝑎𝑑𝑒 𝛽6𝑐𝑟𝑖𝑎𝑚𝑒𝑑06 𝛽7𝑐𝑟𝑖𝑎𝑚𝑎6 𝑢 Onde nespred representa um índice de renda familiar Criamed06 nº de filhos menores de seis anos Criama6 nº de filhos maiores de seis anos Idade Idade da mulher Insira os dados no Gretl e rode o modelo acima usando o método Logit com p valor Abaixo segue a saída de regressão 22 Interpretação Existem 428 81 347 mulheres que entraram na força de trabalho e 325 207 118 pessoas que não entraram O aumento de um ano a mais de educação gera um aumento de 0221 no Logit ou seja um ano a mais de educação aumenta o logaritmo das chances de uma mulher entrar na força de trabalho em comparação a não entrar no mercado de trabalho Com exceção dos coeficientes Nesprend e Criama6 todos os coeficientes são significativos ao nível de 1 de significância Com relação ao teste LR rejeitamos a hipótese nula de que todos os coeficientes menos a constante são iguais a zero As mulheres que possuem filhos maiores que 06 anos possuem 106 mais chances 𝑒0060112 de entrar na força de trabalho do que mulheres que não tem Temos que 2196 da variação do Y é explicado pela parte explicativa O Count R2 é igual a 7357 ou seja do total de 753 mulheres da amostra o modelo estimou 554 observações corretas Agora vamos estimar o modelo Logit com as inclinações 23 Lembrese que as inclinações são calculadas com o valor médio de cada variável Neste caso considerando um valor médio de 1228 anos de estudo o aumento de um ano a mais e de educação aumenta a probabilidade de participação da mulher na força de trabalho em 537 A série de probabilidades pode ser salva com o comando Salvar Valores ajustados Observe que para a observação número 05 a probabilidade é de 05811 ou seja o modelo estimou que a referida mulher possui uma probabilidade de 5811 de entrar no mercado de trabalho A partir da série de probabilidades criamos a série de razão de chances Clique em Acrescentar Definir nova variável Coloque a equação chance p1 p Teremos os seguintes resultados 24 Observe que para a observação 5 a chance da mulher entrar na força de trabalho é 138 superior a chance de não entrar 33 Modelo Probit O modelo Probit é um modelo de escolha binária na forma 𝑃Y1X G𝛽0 𝛽1𝑋1 𝛽2𝑋2 𝛽𝑘𝑋𝑘 𝐺𝛽0 𝑿𝛽 1 Onde G é uma função de distribuição acumulada normal e apresenta as seguintes características 0 GZ 1 A relação entre Pi e Xi é não linear 𝐺𝑥 1 2𝜎2𝜋 𝑒 𝑥𝜇2 2𝜎2 𝑥0 Para conhecer o efeito de uma variação unitária em X sobre a probabilidade de y 1 basta derivar 1 25 𝑑𝑃𝑖 𝑑𝑥𝑖 𝑓𝛽0 𝛽1𝑋1 𝛽2𝑋2 𝛽𝑘𝑋𝑘𝛽𝑖 Observe que A função 𝑓 é a função de densidade de probabilidade normal padrão em 𝛽0 𝑿𝛽 A variação depende do valor de x A estimação de um modelo Probit também depende do tipo de dados que temos disposiçãodados em nível individual ou agrupados a Dados em nível individual Exemplo 1 Notas de alunos Gujarati pág 559 A tabela 157 apresenta um modelo das notas finais na disciplina de Microeconomia em função de algumas características O modelo teórico é 𝑁𝑜𝑡𝑎𝑖 𝛽1 𝛽2𝐺𝑃𝐴 𝛽3𝑇𝑈𝐶𝐸 𝛽4𝑃𝑆𝐼 Onde Notas 1 se o conceito final for A 0 se o conceito final for B ou C GPA média de pontos no início do curso TUCE Pontuação em prova dada no início do semestre para testar o conhecimento inicial em macroeconomia PSI 1 se o aluno utilizou algum método extra de ensino ex nivelamento na Fecap 0 caso contrário Insira os dados no Gretl e estime o modelo Probit Clique em Modelo Variável Dependente Limitada Probit Binário Abaixo temos os seguintes resultados selecionando a opção com pvalor 26 Observe que As variáveis não são significativas ao nível de 1 Do total da variação da variável y 3774 se deve a variação da parte explicativa Foram encontradas 21 observações com y 0 e 11 com y 1 Rejeitamos a hipótese nula de que todos os coeficientes com exceção da constante são iguais a zero 00014 001 ao nível de significância de 1 A variável GPA indica que o aumento de uma unidade em gpa gera um aumento de 162 no Index Do total de 32 observações o modelo acertou 812 Aceitamos a hipótese nula de que o erro possui distribuição normal 0164426 001 A saída com as inclinações é dada abaixo 27 Observe que Inclinação GPA Dado um valor médio de 3117 o aumento de um ponto na média dos alunos no início do curso aumenta a probabilidade do aluno tirar nota A em 5333 Inclinação Tuce Dado um valor médio de 2194 o aumento de um ponto na nota de conhecimento inicial em economia aumenta a probabilidade do aluno tirar nota A em 17 Inclinação PSI Um aluno que resolve participar do programa de nivelamento aumenta a probabilidade de tirar nota A em 4644 Podemos calcular as probabilidades estimadas pelo modelo Probit Após rodar o modelo clique em Salvar valores ajustados 28 Para a observação 3 o modelo Probit estimou uma probabilidade de 1899 de chance de o aluno tirar A em Microeconomia Podemos calcular o impacto da variação de GPA sobre a probabilidade de y 1 ou seja 𝑑𝑃𝑖 𝑑𝑥𝑖 𝑓𝛽0 𝛽1𝑋1 𝛽2𝑋2 𝛽𝑘𝑋𝑘𝛽𝑖 Nesse caso para o exercício temos 𝑑𝑃𝑖 𝑑𝐺𝑃𝐴 𝑓𝛽0 𝛽1𝑋1 𝛽2𝑋2 𝛽𝑘𝑋𝑘𝛽𝑔𝑝𝑎 O comando do Gretl para esse cálculo seria series x dnormcoeffconstcoeffGPAGPAcoeffTUCETUCEcoeffPSIPSIcoeffGPA Executando este comando temos uma nova série Para a observação 1 temos que o aumento de uma unidade em gpa gera um aumento de 725 a probabilidade do aluno tirar A na prova 29 Comparação entre modelos Logit e Probit Na maioria das aplicações os modelos Logit e Probit apresentam resultados parecidos A principal diferença é o fato da distribuição logística apresentar caudas ligeiramente mais pesadas que a distribuição normal Na prática os coeficientes dos Modelos Probit e Logit não podem ser diretamente comparados Uma maneira alternativa para comparar os modelos de MPL Logit e Probit é aplicar os seguintes fatores de conversão 𝛽𝑀𝑃𝐿 025𝛽𝐿𝑜𝑔𝑖𝑡 exceto para o intercepto 𝛽𝑀𝑃𝐿 025𝛽𝐿𝑜𝑔𝑖𝑡 05 para o intercepto 𝛽𝑃𝑟𝑜𝑏𝑖𝑡 0625𝛽𝐿𝑜𝑔𝑖𝑡 𝛽𝐿𝑜𝑔𝑖𝑡 16𝛽𝑃𝑟𝑜𝑏𝑖𝑡 Exemplo 2 Transporte Coletivo x Transporte de automóvel Hill Griffiths e Judge pág 433 O arquivo dat 181 apresenta a escolha entre transporte coletivo e transporte de automóvel para uma amostra de 21 pessoas O modelo teórico é dado abaixo 𝑌𝑖 𝛽0 𝛽1𝑋1 30 Onde 𝑌𝑖 1 se a pessoa escolheu o transporte de carro 0 caso contrário 𝑋1 variável que mede a diferença entre tempo de ônibus e o tempo de carro Insira os dados no Gretl e rode o modelo Probit Abaixo segue a respectiva saída Observe que O sinal positivo da variável x indica que o aumento no tempo gasto com transporte coletivo gera um aumento da probabilidade do indivíduo escolher viajar de carro próprio O intercepto vertical é não significativo enquanto o intercepto linear é significativo ao nível de 1 O R2 de MacFadden indica que 5757 da variação de Y se deve a variação da parte explicativa O Count R2 indica que o modelo acertou 905 do total de observações previstas Dado o valor médio de 12238 o aumento de uma unidade na diferença de tempo entre transporte coletivo e carro aumenta a probabilidade do indivíduo escolher o carro próprio em 119 O Count R2 pode ser visto com a tabela de Avaliação Expectativa Observe que o Count R2 é de 9048 indicando um alto poder de previsão do modelo Probit estimado para a variável y 31 Podemos calcular o impacto da variação de X sobre a probabilidade de y 1 ou seja 𝑑𝑃𝑖 𝑑𝑥 𝑓𝛽0 𝛽1𝑋1 𝛽2𝑋2 𝛽𝑘𝑋𝑘𝛽𝑥 Neste caso para o exercício temos 𝑑𝑃𝑖 𝑑𝑥 𝑓𝛽0 𝛽1𝑋1𝛽1 O comando do Gretl para esse cálculo seria series impact dnormcoeffconstcoeffXXcoeffX Temos o seguinte resultado Dessa forma para a observação 1 o aumento de uma unidade em X gera um aumento de 377 na probabilidade dessa pessoa escolher usar o carro próprio Podemos calcular qual é probabilidade de um indivíduo escolher usar o carro próprio dado que o percurso de ônibus leva 30 minutos a mais do que o automóvel O comando do Gretl para esse cálculo será scalar y30cnormcoeffconstcoeffX30 Temos a seguinte saída 32 Dessa forma considerando que o ônibus gasta 30 minutos a mais que o automóvel a probabilidade de um indivíduo escolher usar o carro próprio é de 7982