·

Cursos Gerais ·

Econometria

Send your question to AI and receive an answer instantly

Ask Question

Preview text

REGRESSÃO LOGÍSTICA Uma introdução ao modelo estatístico Exemplo de aplicação ao Revolving Credit ANTÓNIO MANUEL SARMENTO BATISTA REGRESSÃO LOGÍSTICA Uma introdução ao modelo estatístico Exemplo de aplicação ao Revolving Credit Vida Económica ANTÓNIO MANUEL SARMENTO BATISTA REGRESSÃO LOGÍSTICA Uma introdução ao modelo estatístico Exemplo de aplicação ao Revolving Credit VidaEconómica FICHA TÉCNICA Título Regressão Logística Autor António Manuel Sarmento Batista Editor Vida Económica – Editorial, SA R. Gonçalo Cristóvão, 116 - 6º Esq • 4049-037 Porto www.vidaeconomica.pt • http://livraria.vidaeconomica.pt Composição e montagem Vida Económica Impressão e acabamento Unirarte Gráfica, S.A. • 4300-414 Porto Depósito Legal 392530/15 ISBN Executado em maio de 2015 ©Todos os direitos reservados para Vida Económica, Editorial, SA Nenhuma parte deste livro pode ser utilizada ou reproduzida, no todo ou em parte, por qualquer processo mecânico, fotográfico, electrónico ou de gravação, ou qualquer outra forma copiada, para uso público ou privado (além do uso legal como breve citação em artigos e críticas), sem autorização prévia, por escrito, da Vida Económica – Editorial, S.A. Veja ao final deste livro como se registar na n/ editora e receber informação sobre lançamentos, iniciativas e promoções da Vida Económica – Editorial SA ÍNDICE Notas prévias .......................................................................................................... 9 Objetivo................................................................................................................ 9 Caso prático........................................................................................................ 9 Crédito ao consumo......................................................................................... 11 Métodos estatísticos ........................................................................................ Capítulo 1 – Introdução ....................................................................................... 13 Capítulo 2 – Alguns modelos estatísticos utilizados na previsão do incumprimento 2.1 – Análise discriminante ............................................................................... 18 2.2 – Análise discriminante univariada ............................................................ 19 2.3 – Análise discriminante multivariada ........................................................ 20 2.4 – Função discriminante ............................................................................ 23 Capítulo 3 – Regressão logística 3.1 – Modelo de regressão logística ............................................................... 25 3.2 – Função logística....................................................................................... 26 3.3 – Modelo logístico...................................................................................... 28 3.4 – Transformação das probabilidades em odds ........................................ 29 3.5 – Logaritmo natural dos odds ................................................................... 30 3.6 – Significado dos odds ............................................................................ 31 3.7 – Logged odds (ou logit) .......................................................................... 33 3.8 – Propriedades do logit ............................................................................ 34 3.9 – Obtenção das probabilidades através dos logits .................................. 35 3.10 – Uma outra fórmula alternativa para o cálculo da probabilidade ............ 37 Capítulo 4 – Procedimento geral na estimação de parâmetros 4.1 – Introdução ............................................................................................... 39 4.2 – Nomenclatura e acrónimos utilizados .................................................... 39 REGRESSÃO LOGÍSTICA 4.3 – Método de máxima verosimilhança ............................................................ 40 4.3.1 – Técnicas de regressão logística “passo a passo” ......................................... 43 4.4 – Classificação das características das variáveis........................................... 46 4.5 – Estimação por Máxima verosimilhança vs Análise discriminante ................. 47 4.6 – A Função Verosimilhança (FV) e a sua utilização no procedimento de Máxima verosimilhança (FVMax) ........................................................... 48 4.7 – Função log-verosimilhança (LFV) .................................................................... 56 4.8 – Estimação de parâmetros .............................................................................. Capítulo 5 – Testes de significância utilizando valores de log-verosimilhança (LFV) 5.1 – Distinção entre probabilidade e verosimilhança.......................................... 61 5.2 – Teste do Rácio de Verosimilhança ou de Razão de Verosimilhança ...... 62 5.3 – Testes de significância .................................................................................. 63 Capítulo 6 – Avaliação do modelo logistico 6.1 – Introdução ...................................................................................................... 73 6.2 – Estatística R² ..................................................................................................... 76 6.3 – Estatística pseudo-R² ...................................................................................... 6.3.1 – R² de McFadden ......................................................................................... 79 6.3.2 – R² de Cox e Snell ......................................................................................... 79 6.4 – Programas estatísticos .................................................................................... 81 6.5 – Teste Z-Wald .................................................................................................... 81 Capítulo 7 – Curvas ROC 7.1 – Introdução ...................................................................................................... 85 7.2 – Teoria da deteção de sinal .............................................................................. 86 7.2.1 – Deteção de sinal ......................................................................................... 88 7.3 – Teoria estatística ............................................................................................. 90 7.4 – Matriz de confusão .......................................................................................... 93 7.5 – Outputs de programas informáticos ............................................................. 96 7.6 – Traçado gráfico das curvas ROC ..................................................................... 99 7.7 – Área sob a curva ROC (AUROC) .................................................................. 103 7.8 – Erros do Tipo I e Tipo II .................................................................................. 106 Capítulo 8 – Aplicação prática ao crédito bancário por Revolving credit 8.1 – Metodologia .................................................................................................... 111 8.2 – Análise de dados ............................................................................................ 113 8.3 – Distinção entre Bom e Mau utilizador de cartão de crédito ....................... 115 8.4 – Agrupamento de variáveis segundo a sua natureza ................................... 117 8.5 – Interpretação de variáveis........................................................................... 118 8.5.1 – Descrição versus identificação do estado da conta ................................. 119 ÍNDICE 8.5.2 – Descrição versus identificação da classe da conta ................................... 119 8.5.3 – Contas vencidas há mais de 60 dias versus 90 dias................................ 120 8.5.4 – Género .......................................................................................................... 122 8.5.5 – Estado civil.................................................................................................. 123 8.5.6 – Escala de scoring comportamental referente à conta atual do utilizador de cartão de crédito.......................................................... 125 8.5.7 – Limite de crédito ......................................................................................... 125 8.5.8 – Saldo atual da conta .................................................................................. 127 8.5.9 – Revolving .................................................................................................... 127 8.5.10 – Rendibilidade ............................................................................................. 127 8.5.11 – Idade ........................................................................................................... 127 8.5.12 – Habilitações literárias................................................................................ 128 8.5.13 – Rendimento................................................................................................ 128 8.6 – Transformação de dados ............................................................................... 128 8.7 – Caraterização das variáveis por medidas de estatística descritiva ............ 131 8.8 – Aplicação do modelo logit aos dados amostrais.......................................... 134 8.8.1 – Aplicação do modelo aos dados in-sample .............................................. 135 8.8.2 – Avaliação da qualidade de ajustamento................................................... 136 8.8.3 – Efeitos marginais das variáveis explicativas sobre a probabilidade de um utilizador de cartão de crédito ser bom pagador ........................................................................................... 140 8.8.4 – Teste à heterocedasticidade dos erros ...................................................... 144 8.9 – Validação do modelo através da out-of-sample .......................................... 146 8.10 – Conclusões ................................................................................................... 147 Anexo - Apresentação parcial da visualização de dados e visualização de variáveis .... 149 NOTAS PRÉVIAS Objetivo O objetivo deste livro é apresentar uma introdução ao modelo estatístico de regressão logística e exemplificar a sua utilização num caso prático. Caso prático O caso prático apresentado no Capítulo 8 é uma aplicação do modelo de regressão logística ao crédito ao consumo e tem como finalidade construir um modelo estatístico com robustez preditiva, capaz de prever o incumprimento de pagamento, por utilizadores de cartões de crédito. Crédito ao consumo Este tipo de crédito (ao consumo), materializado pela utilização de cartões de crédito, é designado por Revolving credit ou crédito rotativo e cujo reembolso à instituição financeira não tem um número fixo de pagamentos. O mutuário (o utente do cartão de crédito) pode utilizar ou retirar fundos da instituição de crédito, da qual é cliente, até um determinado limite de crédito, que lhe foi concedido previamente. O reembolso ao mutuante (à instituição de crédito) é efectuado através de pagamentos periódicos (totais ou parciais) acrescidos de juros. 9