É Possível Prever Evasão com Base Apenas no Desempenho Acadêmico?

Resumo


Um dos grande problemas do ensino superior no Brasil é o alto índice de evasão dos estudantes. Neste trabalho, aplicamos técnicas de Mineração de Dados, mais especificamente, técnicas de classificação, para prever e tentar evitar a evasão. Os modelos preditivos são gerados apenas com base no desempenho dos estudantes nas disciplinas cursadas. São criados n diferentes modelos, dos quais o i-ésimo modelo, 1 =< i <= n, é capaz de prever, ao fim do i-ésimo semestre de um estudante, se ele ou ela irá evadir os se formar no futuro. Os experimentos realizados com uma base de dados real, sobre estudantes de uma universidade brasileira, mostraram que os modelos são capazes de atingir acurácia preditiva entre 79,31% e 98,25%.

Palavras-chave: predição de evasão escolar, mineração de dados, árvore de decisão, random forest

Referências

Alban, M. and Mauricio, D. (2019). Predicting university dropout through data mining: A systematic literature. Indian Journal of Science and Technology, 12(4):1–12.

Aulck, L. S., Nambi, D., Velagapudi, N., Blumenstock, J. E., and West, J. D. (2019). Mining university registrar records to predict first-year undergraduate attrition. In Proceedings of the 12th International Conference on Educational Data Mining.

Breiman, L. (2001). Random forests. Machine learning, 45(1):5–32.

Carrano, D., Tuler, E., Infante, C., and Rocha, L. (2019). Combinando técnicas de mineração de dados para melhorar a detecção de indicadores de evasão universitária. In Anais do XXX Simpósio Brasileiro de Informática na Educação.

da Silva, D. R., de Lima Martins, S., and Maciel, C. (2017). Identification and systematization of indicatives and data mining techniques for detecting evasion in distance education. In Proceedings of Twelfth Latin-American Conference on Learning Technologies (LACLO).

da Silva, H. F. D. and Marques, W. (2017). Evasão na educação superior no brasil: Desafio à gestão acadêmica. Quaestio, 19(1):197–208.

de Brito, D. M., de Almeida Júnior, I. A., Queiroga, E. V., and do Rêgo, T. G. (2014). Predição de desempenho de alunos do primeiro período baseado nas notas de ingresso utilizando métodos de aprendizagem de máquina. In Anais do XXV Simpósio Brasileiro de Informática na Educação.

Hess, F. (2018). The college dropout problem. Forbes.

J. Han, M. K. and Pei, J. (2012). Data Mining: Concepts and Techniques. Morgan Kaufmann, third edition.

Moissa, B., Gasparini, I., and Kemczinski, A. (2015). Educational data mining versus learning analytics: estamos reinventando a roda? um mapeamento sistemático. In Anais do XXVI Simpósio Brasileiro de Informática na Educação.

Rai, S. and Jain, A. K. (2013). Students’ dropout risk assessment in undergraduate courses of ict at residential university - a case study. International Journal of Computer Applications, 84(14):31–36.

Romero, C. and Ventura, S. (2020). Educational data mining and learning analytics: An updated survey. WIREs Data Mining and Knowledge Discovery, 10(3):e1355.

Sales, A., Balby, L., and Cajueiro, A. (2016). Exploiting academic records for predicting student drop out: A case study in brazilian higher education. Journal of Information and Data Management, 7(2):166–166.

Santos, G. A. S., Bordignon, A. L., Oliveira, S. L. G., Haddad, D. B.,Brandão, D. N., and Belloze, K. T. (2018). A brief review about educational data mining applied to predict student’s dropout. In Anais da V Escola Regional de Sistemas de Informação do Rio de Janeiro, pages 86–91. SBC.
Publicado
22/11/2021
SANTOS, Carlos Henrique D. C.; MARTINS, Simone de Lima; PLASTINO, Alexandre. É Possível Prever Evasão com Base Apenas no Desempenho Acadêmico?. In: SIMPÓSIO BRASILEIRO DE INFORMÁTICA NA EDUCAÇÃO (SBIE), 32. , 2021, Online. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2021 . p. 792-802. DOI: https://doi.org/10.5753/sbie.2021.218105.