Evaluation of Classifiers for Dropout Prediction in Higher Education using Semestral Window
Abstract
The high dropout rate in Federal Institutions of Higher Education (IFES) is a phenomenon that increasingly concerns teachers and educational managers. In this sense, strategies such as Educational Data Mining have been used to mitigate this problem. A proposal for classifying Dropouts and Graduates is presented in this work, generating trained models for each semester window. The experiments were carried out with data from the Computer Science and Information Systems courses at the Federal University of Piauí (UFPI). The results of the Mining process are promising with accuracies of 85% and 96%.
Keywords:
Classifiers, Dropout Prediction, Higher Education, Semestral Window
References
Agrusti, F., Bonavolonta, G., and Mezzini, M. (2019). University dropout prediction through educational data mining techniques: A systematic review. Journal of e-Learning and Knowledge Society, pages 161–182 Pages.
Araujo, F. H. D. d. (2014). Descoberta de conhecimento em base de dados para o aprendizado da regulação médica/odontológica em operadora de plano de saúde. Master’s thesis, Pos-Graduação em Ciência da Computação, Universidade Federal do Piauí.
Bitencourt, P. B. d. and Ferrero, C. (2019). Predição de risco de evasão de alunos usando métodos de aprendizado de máquina em cursos técnicos. In Anais dos Workshops do VIII Congresso Brasileiro de Informática na Educação (CBIE 2019), page 149. Brazilian Computer Society (Sociedade Brasileira de Computação - SBC).
BRASIL (2020). Instituto nacional de estudos e pesquisas educacionais anísio teixeira. Site do INEP.
Fayyad, U., Piatetsky-Shapiro, G., and Smyth, P. (1996). From data mining to knowledge discovery in databases. AI Magazine, 17(3):37.
Filho, F., Vinuto, T., and Leal, B. (2020). Análise de classificadores para predição de evasão dos campi de uma instituição de ensino federal. In Anais do XXXI Simpósio Brasileiro de Informática na Educação, pages 1132–1141, Porto Alegre, RS, Brasil. SBC.
Fonseca, S. O. d., Namen, A. A., Moura Neto, F. D., Silva, A. D. R., Ortigão, M. I. R., and Rohrer, U. A. B. V. (2019). Mineração de dados orientada pelo domínio educacional: uma prova de conceito. Estudos em Avaliação Educacional, 30(74):420.
Friedman, M. (1937). The use of ranks to avoid the assumption of normality implicit in the analysis of variance. Journal of the American Statistical Association, 32(200):675–701.
GOMES, A. K. (2002). Classificadores simbólicos utilizando medidas de avaliação e de interessabilidade. Master’s thesis, Pos-Graduação em Ciência da Computação e Matemática Computacional, Universidade de São Paulo.
Hoed, R. M. (2016). Análise de evasão em cursos superiores: o caso da evasão em cursos superiores da area de computação. Master’s thesis, Pós-Graduação em Computação Aplicada, Universidade de Brasília.
Landis, J. R. and Koch, G. G. (1977). The measurement of observer agreement for categorical data. Biometrics, 33(1):159–174.
Manhães, L. M. B. (2020). Predição do desempenho acadêmico de alunos da graduação utilizando mineração de dados. Simpósio de Pesquisa Operacional e Logística da Marinha - Publicação Online, 3(1):2050 – 2064.
Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V., Thirion, B., Grisel, O., Blondel, M., Prettenhofer, P., Weiss, R., Dubourg, V., Vanderplas, J., Passos, A., Cournapeau, D., Brucher, M., Perrot, M., and Duchesnay, E. (2011). Scikit-learn: Machine learning in Python. Journal of Machine Learning Research, 12:2825–2830.
Rajab, M. and Wang, D. (2020). Practical challenges and recommendations of filter methods for feature selection. Journal of Information & Knowledge Management, 19(01):2040019.
Romero, C. and Ventura, S. (2013). Data mining in education. WIREs Data Mining and Knowledge Discovery, 3(1):12–27.
Santos, C. H. D. C., Martins, S. d. L., and Plastino, A. (2021). É possível prever evasão com base apenas no desempenho acadêmico? In Anais do XXXII Simpósio Brasileiro de Informática na Educação (SBIE 2021), page 792–802, Brasil. Sociedade Brasileira de Computação - SBC.
SANTOS, K. J. d. O. S. (2020). Education data mining para apoio a gestão estratégica da identificação de perfis evasivos e atenuação da evasão escolar no ensino superior. Master’s thesis, Programa de Pos-Graduação em Ciência da Computação, Universidade Federal de Sergipe.
Torres Marques, L., Félix De Castro, A., Torres Marques, B., Carvalho Pereira Silva, J., and Gabriel Gadelha Queiroz, P. (2019). Mineração de dados auxiliando na descoberta das causas da evasão escolar: Um mapeamento sistemático da literatura. RENOTE, 17(3):194–203.
Yakub, S., Arowolo, M., Abdulsalam, S., and M.D., S. (2016). A feature selection based on one way anova for microarray data classification. pages 30–35.
Araujo, F. H. D. d. (2014). Descoberta de conhecimento em base de dados para o aprendizado da regulação médica/odontológica em operadora de plano de saúde. Master’s thesis, Pos-Graduação em Ciência da Computação, Universidade Federal do Piauí.
Bitencourt, P. B. d. and Ferrero, C. (2019). Predição de risco de evasão de alunos usando métodos de aprendizado de máquina em cursos técnicos. In Anais dos Workshops do VIII Congresso Brasileiro de Informática na Educação (CBIE 2019), page 149. Brazilian Computer Society (Sociedade Brasileira de Computação - SBC).
BRASIL (2020). Instituto nacional de estudos e pesquisas educacionais anísio teixeira. Site do INEP.
Fayyad, U., Piatetsky-Shapiro, G., and Smyth, P. (1996). From data mining to knowledge discovery in databases. AI Magazine, 17(3):37.
Filho, F., Vinuto, T., and Leal, B. (2020). Análise de classificadores para predição de evasão dos campi de uma instituição de ensino federal. In Anais do XXXI Simpósio Brasileiro de Informática na Educação, pages 1132–1141, Porto Alegre, RS, Brasil. SBC.
Fonseca, S. O. d., Namen, A. A., Moura Neto, F. D., Silva, A. D. R., Ortigão, M. I. R., and Rohrer, U. A. B. V. (2019). Mineração de dados orientada pelo domínio educacional: uma prova de conceito. Estudos em Avaliação Educacional, 30(74):420.
Friedman, M. (1937). The use of ranks to avoid the assumption of normality implicit in the analysis of variance. Journal of the American Statistical Association, 32(200):675–701.
GOMES, A. K. (2002). Classificadores simbólicos utilizando medidas de avaliação e de interessabilidade. Master’s thesis, Pos-Graduação em Ciência da Computação e Matemática Computacional, Universidade de São Paulo.
Hoed, R. M. (2016). Análise de evasão em cursos superiores: o caso da evasão em cursos superiores da area de computação. Master’s thesis, Pós-Graduação em Computação Aplicada, Universidade de Brasília.
Landis, J. R. and Koch, G. G. (1977). The measurement of observer agreement for categorical data. Biometrics, 33(1):159–174.
Manhães, L. M. B. (2020). Predição do desempenho acadêmico de alunos da graduação utilizando mineração de dados. Simpósio de Pesquisa Operacional e Logística da Marinha - Publicação Online, 3(1):2050 – 2064.
Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V., Thirion, B., Grisel, O., Blondel, M., Prettenhofer, P., Weiss, R., Dubourg, V., Vanderplas, J., Passos, A., Cournapeau, D., Brucher, M., Perrot, M., and Duchesnay, E. (2011). Scikit-learn: Machine learning in Python. Journal of Machine Learning Research, 12:2825–2830.
Rajab, M. and Wang, D. (2020). Practical challenges and recommendations of filter methods for feature selection. Journal of Information & Knowledge Management, 19(01):2040019.
Romero, C. and Ventura, S. (2013). Data mining in education. WIREs Data Mining and Knowledge Discovery, 3(1):12–27.
Santos, C. H. D. C., Martins, S. d. L., and Plastino, A. (2021). É possível prever evasão com base apenas no desempenho acadêmico? In Anais do XXXII Simpósio Brasileiro de Informática na Educação (SBIE 2021), page 792–802, Brasil. Sociedade Brasileira de Computação - SBC.
SANTOS, K. J. d. O. S. (2020). Education data mining para apoio a gestão estratégica da identificação de perfis evasivos e atenuação da evasão escolar no ensino superior. Master’s thesis, Programa de Pos-Graduação em Ciência da Computação, Universidade Federal de Sergipe.
Torres Marques, L., Félix De Castro, A., Torres Marques, B., Carvalho Pereira Silva, J., and Gabriel Gadelha Queiroz, P. (2019). Mineração de dados auxiliando na descoberta das causas da evasão escolar: Um mapeamento sistemático da literatura. RENOTE, 17(3):194–203.
Yakub, S., Arowolo, M., Abdulsalam, S., and M.D., S. (2016). A feature selection based on one way anova for microarray data classification. pages 30–35.
Published
2022-11-16
How to Cite
VIANA, Filipe Soares; SANTANA, André Macêdo; RABÊLO, Ricardo de Andrade Lira.
Evaluation of Classifiers for Dropout Prediction in Higher Education using Semestral Window. In: BRAZILIAN SYMPOSIUM ON COMPUTERS IN EDUCATION (SBIE), 33. , 2022, Manaus.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2022
.
p. 908-919.
DOI: https://doi.org/10.5753/sbie.2022.224764.
