Uma Investigação Sobre a Identificação de Indicadores de Evasão de Alunos Utilizando Mineração de Dados

  • Francisco da Conceição Silva IFMA
  • Josenildo Costa da Silva IFMA
  • Arthur Mota França IFMA
  • George Sanders Carvalho Araújo IFMA
  • Emerson Elias Moraes IFMA

Abstract


In this work, we investigate indicators to help interested parties (teachers, managers, etc.) identifing students who may drop out later from courses of a technical and technological education institution. As part of the research, we developed a tool to identify relationships in student data on learning performance. These data were submitted to data mining techniques to generate predictive models. Decision tree-based models, specifically XGboost, had the best performances to classify a student as possible dropout with accuracy and sensitivity of 96% and 83% respectively.

References

Fayyad, U., Piatetsky-Shapiro, G., and Smyth, P. (1996). From data mining to knowledge discovery in databases. AI magazine, 17(3):37-37.

Kemp, C. and Gyger, B. (2013). Professional Heroku Programming. ITPro collection. Wiley.

Kuhn, M. and Johnson, K. (2013). Applied Predictive Modeling. Springer.

Middleton, N. and Schneeman, R. (2013). Heroku: Up and Running: Effortless Application Deployment and Scaling. O'Reilly Media.

Pascoal, T. A., Brito, D., and Rêgo, T. (2015). Uma abordagem para a previsão de desempenho de alunos de computação em disciplinas de programação. Nuevas Ideas en Informática Educativa TISE, 2015(454-458):2.

Romero, C., Espejo, P. G., Zafra, A., Romero, J. R., and Ventura, S. (2013). Web usage mining for predicting final marks of students that use moodle courses. Computer Applications in Engineering Education, 21(1):135-146.

Romero, C., Ventura, S., and García, E. (2008). Data mining in course management systems: Moodle case study and tutorial. Computers & Education, 51(1):368-384.

Santana, M. A. et al. (2015). Um estudo comparativo das técnicas de predição na identificação de insucesso acadêmico dos estudantes durante cursos de programação introdutória. Universidade Federal de Alagoas, Maceió, AL.

Silva, F., da Silva, J., Silva, R., and Fonseca, L. C. (2015). Um modelo preditivo para diagnóstico de evasão baseado nas interações de alunos em fóruns de discussão. In Brazilian Symposium on Computers in Education (Simpósio Brasileiro de Informática na Educação-SBIE), page 1187.

Silva, M. M. (2017). Mineração de dados no Twitter: uma ferramenta prática para extração e análise dos resultados. Universidade Federal de Outro Preto.

Soares, F. A. L. and Carvalho, R. B. (2017). Proposta de um portal educacional para estudantes de programação de computadores. Abakós, 5(2):36-58.

Vieira, C. E. C., de Lima Junior, J. A. T., de Paula Vieira, P., et al. (2015). Dificuldades no processo de aprendizagem de algoritmos: uma análise dos resultados na disciplina de algoritmos do curso de sistemas de informação da faeterj-campus paracambi. Cadernos UniFOA, 10(27):5-15.

Witten, I. H., Frank, E., and Hall, M. A. (2011). Data Mining: Practical Machine Learning Tools and Techniques. Morgan Kaufmann, 3 edition.
Published
2022-09-28
SILVA, Francisco da Conceição; SILVA, Josenildo Costa da; FRANÇA, Arthur Mota; ARAÚJO, George Sanders Carvalho; MORAES, Emerson Elias. Uma Investigação Sobre a Identificação de Indicadores de Evasão de Alunos Utilizando Mineração de Dados. In: REGIONAL SCHOOL ON COMPUTING OF CEARÁ, MARANHÃO, AND PIAUÍ (ERCEMAPI), 10. , 2022, São Luís/MA. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2022 . p. 69-78. DOI: https://doi.org/10.5753/ercemapi.2022.225945.