Investigating Student Dropout Risk in Higher Education through Machine Learning
Resumo
In recent years, there has been a significant increase in the student dropout rate in Higher Education. Various reasons are cited, such as difficulty learning the content, the proposed course structure, and lack of financial resources. This study explores machine learning (ML) in the student dropout problem. The experiments were conducted with a dataset from the Academic System of a Federal University listing different academic features of the students. They showed promising results, with Random Forest accurately predicting the student situation with an average F-Score of 0.959. However, most relevant features are expected and do not provide any new insight regarding the dropout imminence. Future experiments can fix it with a more robust feature engineering process.
Referências
de Almeida Teodoro, L. and Kappel, M. A. A. (2020). Aplicação de técnicas de aprendizado de máquina para predição de risco de evasão escolar em instituições públicas de ensino superior no brasil. Revista Brasileira de Informática na Educação, 28:838–863.
dos Santos, R. S. S. (2022). Evasão escolar universitária e estratégias de intervenções para retenção do estudante: Um estudo de caso na universidade federal de são carlos. Master’s thesis, Universidade de São Paulo.
Evangelista, R. W. (2017). Estudo da evasão do Bacharelado em Humanidades da UFVJM: causas e consequências. PhD thesis, Programa de Pós-Graduação em Educação, Universidade Federal dos Vales do Jequitinhonha e Mucuri, Diamantina.
Filho, F. W. B. H., Vinuto, T. S., and Leal, B. C. (2020). Análise de classificadores para predição de evasão dos campi de uma instituição de ensino federal. In Anais do XXXI Simpósio Brasileiro de Informática na Educação, pages 1132–1141, Porto Alegre, RS, Brasil. SBC.
Kabathova, J. and Drlik, M. (2021). Towards predicting student’s dropout in university courses using different machine learning techniques. Applied Sciences, 11(7).
Marques, L. T., Marques, B. T., Rocha, R. S., e Silva, L. C., Queiroz, P. G. G., and de Castro, A. F. (2020). Evasão acadêmica e suas causas em cursos de bacharelado em ciência da computação: Um estudo de caso na ufersa. In Anais dos Workshops do IX Congresso Brasileiro de Informática na Educação (CBIE 2020), pages 1042 – 1051.
Martins, C. V. M., Lacerda, F. C., do Carmo, I. P., da Silva, E. V. S., Alves, T. O. M., Gomes, J. M., and Campos, R. S. (2023). Modelos de previsão de evasão tardia na graduação de uma universidade pública. pages 41–50. Sociedade Brasileira de Computação - SBC.
Mitchell, T. (1997). Machine Learning. McGraw-Hill International Editions. McGraw-Hill, Nova York.
Ramos, J., Silva, J., Prado, L., Gomes, A., and Rodrigues, R. (2018). Um estudo comparativo de classificadores na previsão da evasão de alunos em ead. Brazilian Symposium on Computers in Education (Simpósio Brasileiro de Informática na Educação - SBIE), 29(1):1463.
Santafe, G., Inza, I., and Lozano, J. A. (2015). Dealing with the evaluation of supervised classification algorithms. Artificial Intelligence Review, 44:467–508
Viana, F. S., Santana, A. M., and de Andrade Lira Rabêlo, R. (2022). Avaliação de classificadores para predição de evasão no ensino superior utilizando janela semestrais. In Anais dos Workshops do XI Congresso Brasileiro de Informática na Educação (CBIE 2022), pages 908 – 919.
Vossen, L. V., Santos, M. S., Frigo, L., and Gasparini, I. (2023). Dropoutless: plataforma colaborativa de predição de evasão. In Anais do XVIII Simpósio Brasileiro de Sistemas Colaborativos, pages 193–201, Porto Alegre, RS, Brasil. SBC.