Cluster Analysis for Characterization of Dropout Indicators

  • Daniel Victor Saraiva IFCE
  • Silas S. L. Pereira IFCE
  • Reinaldo B. Braga IFCE
  • Carina T. de Oliveira IFCE

Abstract


Understanding the behavior of students at risk of dropout is essential for actions to encourage their permanence and success. In this context, this paper presents a proposal that performs data clustering to identify student profiles with risk of dropout, considering academic and socioeconomic information of students. A case study is presented taking into account a database of a Technical Informatics course. The results show that variables such as family income, study shift, student sex, age group and mother's level of education can influence students' academic performance.
Keywords: Dropout, Machine Learning, Data Mining, Knowledge Extraction.

References

Arthur, D. and Vassilvitskii, S. (2007). k-means++: The advantages of careful seeding. In ACM-SIAM Symposium on Discrete algorithms, pages 1027–1035. Society for Industrial and Applied Mathematics.

BRASIL (1988). Constituição da República Federativa do Brasil. Constituicão (1988), Senado Federal.

BRASIL (1996). Lei nº 9.394, de 1996, que estabelece as diretrizes e bases da educação nacional, e legislação correlata. BRASIL. Lei de Diretrizes e Bases da Educação Nacional.

Castro, L. N. and Ferrari, D. G. (2016). Introducão à mineração de dados: conceitos básicos, algoritmos e aplicações. Saraiva, São Paulo, 1 edition.

Dharmawan, T., Ginardi, H., and Munif, A. (2018). Dropout detection using nonacademic data. In 4th International Conference on Science and Technology (ICST), pages 1–4.

Faceli, K., Lorena, A. C., Gama, J., and de Carvalho, A. C. P. L. F. (2011). Inteligência Artificial - Uma Abordagem de Aprendizado de Máquina. LTC, Rio de Janeiro.

Gonçalves, T., Silva, J., and Cortes, O. (2018). Técnicas de mineração de dados: um estudo de caso da evasão no ensino superior do instituto federal do maranhão. Revista Brasileira de Computação Aplicada, 10(3):11–20.

Hegde, V. and Prageeth, P. P. (2018). Higher education student dropout prediction and analysis through educational data mining. In 2nd International Conference on Inventive Systems and Control (ICISC), pages 694–699.

IBGE (2020). Educação: 2019. IBGE. Instituto Brasileiro de Geografia e Estatistica.

IFCE (2017). Plano estratégico para permanência e êxito dos estudantes do IFCE. IFCE. Instituto Federal de Educação, Ciência e Tecnologia do Ceará. Pró-reitoria de Ensino - PROEN, Fortaleza.

INEP (2021). Resumo técnico do Censo da Educação Superior 2019. INEP. Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira, Brasília-DF.

Lanes, M. and Alcântara, C. (2018). Predição de alunos com risco de evasão: estudo de caso usando mineração de dados. In Simpósio Brasileiro de Informática na Educação - SBIE, volume 29, page 1921.

Maria, W., Damiani, J. L., and Pereira, M. (2016). Rede bayesiana para previsão de evasão escolar. In V Congresso Brasileiro de Informática na Educação (CBIE), pages 920 – 929.

Paz, F. J. and Cazella, S. C. (2017). Identificando o perfil de evasão de alunos de graduação através da mineração de dados educacionais: um estudo de caso de uma universidade comunitária. In VI Congresso Brasileiro de Informática na Educação (CBIE).

Perez, B., Castellanos, C., and Correal, D. (2018). Applying data mining techniques to predict student dropout: A case study. In IEEE 1st Colombian Conference on Applications in Computational Intelligence (ColCACI), pages 1–6.

Silva, L. A., Peres, S. M., and Boscarioli, C. (2016). Introdução à mineração de dados: com aplicações em R. Elsevier, Rio de Janeiro, 1 edition.

Solis, M., Moreira, T., Gonzalez, R., Fernandez, T., and Hernandez, M. (2018). Perspectives to predict dropout in university students with machine learning. In IEEE International Work Conference on Bioinspired Intelligence (IWOBI), pages 1–6.

Wirth, R. and Hipp, J. (2000). Crisp-dm: Towards a standard process model for data mining. In Proceedings of the 4th international conference on the practical applications of knowledge discovery and data mining, pages 29–39. Citeseer.

Wu, X., Kumar, V., Quinlan, J. R., Ghosh, J., Yang, Q., Motoda, H., McLachlan, G. J., Ng, A., Liu, B., Philip, S. Y., et al. (2008). Top 10 algorithms in data mining. Knowledge and information systems, 14(1):1–37.

Zhang, L. and Li, K. F. (2018). Education analytics: Challenges and approaches. In 32nd International Conference on Advanced Information Networking and Applications Workshops (WAINA), pages 193–198.
Published
2021-07-20
SARAIVA, Daniel Victor; PEREIRA, Silas S. L.; BRAGA, Reinaldo B.; OLIVEIRA, Carina T. de. Cluster Analysis for Characterization of Dropout Indicators. In: WORKSHOP ON COMPUTING EDUCATION (WEI), 29. , 2021, Evento Online. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2021 . p. 238-247. ISSN 2595-6175. DOI: https://doi.org/10.5753/wei.2021.15915.