1
Análise de Regressão
CASTELLI ESH
1
Análise de Regressão
UFSM
1
Análise de Regressão
UFSM
11
Análise de Regressão
UFRJ
1
Análise de Regressão
CASTELLI ESH
1
Análise de Regressão
CASTELLI ESH
Texto de pré-visualização
Problema 03 Uma universidade deseja identificar fatores associados à evasão estudantil abandono de curso antes da conclusão O objetivo é prever a probabilidade de um aluno evadir ainda nos dois primeiros anos identificar fatores de risco para evasão propor intervenções de apoio acadêmico Os dados sobre 500 estudantes são apresentados no arquivo educacaoevasaoProblema03 nas extensões csv xls e txt Variáveis evasao 1 aluno evadiu abandono 0 aluno permaneceu matriculado idadeingresso anos idade ao ingressar no curso sexo MF media1ano média geral das disciplinas no 1º ano 010 horastrabalhosemana horas semanais de trabalho remunerado bolsa 1 possui bolsa de estudosauxílio 0 não curso fator com 3 áreas Exatas Humanas Saúde Proceda a análise de regressão logística adequada ao problema e interprete os resultados Apresente estes resultados bem como o script R ou Python utilizado em um relatório ANÁLISE DE FATORES ASSOCIADOS À EVASÃO ESTUDANTIL Seu Nome POR QUE ISSO É IMPORTANTE A evasão representa uma perda significativa de talentos investimentos e prestígio para a instituição Ações reativas são ineficazes Precisase de uma estratégia proativa para identificar e apoiar alunos em risco Quais são os fatores mensuráveis que realmente influenciam a decisão de um aluno abandonar o curso 2 FONTE DOS DADOS PERFIL DEMOGRÁFICO CONTEXTO ACADÊMICO FATORES EXTERNOS Análise de um conjunto de dados com 500 estudantes de diversas áreas da universidade com as seguintes variáveis Idade e Sexo Área do Curso e Média do 1º ano Trabalho e Bolsa de Estudos 3 USANDO DADOS PARA ENCONTRAR RESPOSTAS REFINANDO O MODELO SELEÇÃO DE VARIÁVEIS O MODELO INICIAL O primeiro modelo incluiu 7 variáveis preditoras A METODOLOGIA Utilizamos a seleção de variáveis stepwise para construir um modelo mais parcimonioso removendo os preditores sexo e curso que não contribuíam para a performance do modelo RESULTADO O modelo final é mais enxuto e possui um melhor ajuste Modelo Completo AIC 6133 Modelo Final AIC 6107 Menor é melhor 4 5 COEFICIENTES DO MODELO LOGÍSTICO FINAL Variável Estimativa LogOdds Valorp Intercepto 1968 00007 Idade de Ingresso 0026 00295 Média 1º Ano 0567 0001 Horas de Trabalho Semanal 0046 0001 Bolsa de Estudos Sim 0324 01010 Obs Os coeficientes do modelo são expressos em uma escala matemática logodds que não é intuitiva Precisamos convertêlos para Razão de Chances e transformálos em um multiplicador direto Isso permite interpretar o impacto real de cada fator em termos de aumento ou diminuição percentual na chance de evasão MÉDIA DO 1º ANO Razão de Chances 057 Para cada 1 ponto a mais na média a chance de evasão diminui em 43 HORAS DE TRABALHO Razão de Chances 1047 Para cada hora a mais de trabalho a chance de evasão aumenta em 47 IDADE DE INGRESSO Razão de Chances 1027 Para cada ano a mais na idade de ingresso a chance de evasão aumenta em 27 6 TRADUZINDO OS COEFICIENTES EM IMPACTO REAL BOLSA DE ESTUDOS Razão de Chances 072 Ter uma bolsa de estudos reduz a chance de evasão em 28 Nota p010 indicando uma tendência forte mas não conclusiva ao nível de 95 de confiança VISUALIZANDO O FATOR DE MAIOR IMPACTO 7 O gráfico comprova visualmente o que o coeficiente nos disse A diferença na distribuição de notas entre os grupos que evadiram e os que permaneceram é clara e estatisticamente significante A CURVA LOGÍSTICA Esta curva em S é a representação visual do nosso modelo Ela mostra como a probabilidade de evasão eixo Y muda drasticamente com a variação da média do aluno eixo X A inclinação acentuada na faixa de médias 5 a 7 revela um ponto crítico 20XX Apresentação 8 DAS ESTATÍSTICAS À ESTRATÉGIA Média 1º ano é o fator mais forte Recomendação Implementar programa de monitoramento e tutoria no primeiro ano Idade de Ingresso é um fator de risco Recomendação Desenvolver programas de acolhimento para alunos mais velhos Horas de trabalho é um fator de risco Recomendação Criar políticas de flexibilização de horários e avaliar alternativas EADhíbridas Bolsa têm uma tendência protetora Recomendação Expandir programas de auxílio financeiro é uma estratégia promissora para reduzir o risco especialmente entre os alunos trabalhadores CONCLUSÃO Construímos um modelo estatístico robusto que identifica como vetores da evasão o desempenho inicial a carga de trabalho a idade de ingresso e a ausência de apoio financeiro bolsa Próximos Passos Utilizar o modelo para criar um Score de Risco Implementar os programas de intervenção propostos Coletar novos dados para reavaliar o modelo anualmente OBRIGADO Seu nome
1
Análise de Regressão
CASTELLI ESH
1
Análise de Regressão
UFSM
1
Análise de Regressão
UFSM
11
Análise de Regressão
UFRJ
1
Análise de Regressão
CASTELLI ESH
1
Análise de Regressão
CASTELLI ESH
Texto de pré-visualização
Problema 03 Uma universidade deseja identificar fatores associados à evasão estudantil abandono de curso antes da conclusão O objetivo é prever a probabilidade de um aluno evadir ainda nos dois primeiros anos identificar fatores de risco para evasão propor intervenções de apoio acadêmico Os dados sobre 500 estudantes são apresentados no arquivo educacaoevasaoProblema03 nas extensões csv xls e txt Variáveis evasao 1 aluno evadiu abandono 0 aluno permaneceu matriculado idadeingresso anos idade ao ingressar no curso sexo MF media1ano média geral das disciplinas no 1º ano 010 horastrabalhosemana horas semanais de trabalho remunerado bolsa 1 possui bolsa de estudosauxílio 0 não curso fator com 3 áreas Exatas Humanas Saúde Proceda a análise de regressão logística adequada ao problema e interprete os resultados Apresente estes resultados bem como o script R ou Python utilizado em um relatório ANÁLISE DE FATORES ASSOCIADOS À EVASÃO ESTUDANTIL Seu Nome POR QUE ISSO É IMPORTANTE A evasão representa uma perda significativa de talentos investimentos e prestígio para a instituição Ações reativas são ineficazes Precisase de uma estratégia proativa para identificar e apoiar alunos em risco Quais são os fatores mensuráveis que realmente influenciam a decisão de um aluno abandonar o curso 2 FONTE DOS DADOS PERFIL DEMOGRÁFICO CONTEXTO ACADÊMICO FATORES EXTERNOS Análise de um conjunto de dados com 500 estudantes de diversas áreas da universidade com as seguintes variáveis Idade e Sexo Área do Curso e Média do 1º ano Trabalho e Bolsa de Estudos 3 USANDO DADOS PARA ENCONTRAR RESPOSTAS REFINANDO O MODELO SELEÇÃO DE VARIÁVEIS O MODELO INICIAL O primeiro modelo incluiu 7 variáveis preditoras A METODOLOGIA Utilizamos a seleção de variáveis stepwise para construir um modelo mais parcimonioso removendo os preditores sexo e curso que não contribuíam para a performance do modelo RESULTADO O modelo final é mais enxuto e possui um melhor ajuste Modelo Completo AIC 6133 Modelo Final AIC 6107 Menor é melhor 4 5 COEFICIENTES DO MODELO LOGÍSTICO FINAL Variável Estimativa LogOdds Valorp Intercepto 1968 00007 Idade de Ingresso 0026 00295 Média 1º Ano 0567 0001 Horas de Trabalho Semanal 0046 0001 Bolsa de Estudos Sim 0324 01010 Obs Os coeficientes do modelo são expressos em uma escala matemática logodds que não é intuitiva Precisamos convertêlos para Razão de Chances e transformálos em um multiplicador direto Isso permite interpretar o impacto real de cada fator em termos de aumento ou diminuição percentual na chance de evasão MÉDIA DO 1º ANO Razão de Chances 057 Para cada 1 ponto a mais na média a chance de evasão diminui em 43 HORAS DE TRABALHO Razão de Chances 1047 Para cada hora a mais de trabalho a chance de evasão aumenta em 47 IDADE DE INGRESSO Razão de Chances 1027 Para cada ano a mais na idade de ingresso a chance de evasão aumenta em 27 6 TRADUZINDO OS COEFICIENTES EM IMPACTO REAL BOLSA DE ESTUDOS Razão de Chances 072 Ter uma bolsa de estudos reduz a chance de evasão em 28 Nota p010 indicando uma tendência forte mas não conclusiva ao nível de 95 de confiança VISUALIZANDO O FATOR DE MAIOR IMPACTO 7 O gráfico comprova visualmente o que o coeficiente nos disse A diferença na distribuição de notas entre os grupos que evadiram e os que permaneceram é clara e estatisticamente significante A CURVA LOGÍSTICA Esta curva em S é a representação visual do nosso modelo Ela mostra como a probabilidade de evasão eixo Y muda drasticamente com a variação da média do aluno eixo X A inclinação acentuada na faixa de médias 5 a 7 revela um ponto crítico 20XX Apresentação 8 DAS ESTATÍSTICAS À ESTRATÉGIA Média 1º ano é o fator mais forte Recomendação Implementar programa de monitoramento e tutoria no primeiro ano Idade de Ingresso é um fator de risco Recomendação Desenvolver programas de acolhimento para alunos mais velhos Horas de trabalho é um fator de risco Recomendação Criar políticas de flexibilização de horários e avaliar alternativas EADhíbridas Bolsa têm uma tendência protetora Recomendação Expandir programas de auxílio financeiro é uma estratégia promissora para reduzir o risco especialmente entre os alunos trabalhadores CONCLUSÃO Construímos um modelo estatístico robusto que identifica como vetores da evasão o desempenho inicial a carga de trabalho a idade de ingresso e a ausência de apoio financeiro bolsa Próximos Passos Utilizar o modelo para criar um Score de Risco Implementar os programas de intervenção propostos Coletar novos dados para reavaliar o modelo anualmente OBRIGADO Seu nome