A comparative study of classifiers for predicting student dropout in distance education
Abstract
The use of machine learning and data mining algorithms in educational contexts has evolved due to the large availability of data generated mainly in virtual learning environments. This study makes a comparative analysis of five classifiers in the task of predicting students with risk of dropping out in undergraduate courses by distance education. The results showed a small advantage for the use of Logistic Regression in the data analyzed, with success rates above 90% in the predictive model.
Keywords:
data mining, machine learning, student dropout, distance education
References
ABED. Censo EAD.BR: Relatório Analítico da Aprendizagem a Distância no Brasil - 2016. Associação Brasileira de Educação a Distância. 2017.
DOS SANTOS, R. et al. Uma Abordagem Genérica de Identificação Precoce de Estudantes com Risco de Evasão em um AVA utilizando Técnicas de Mineração de Dados. XIX Congresso Internacional de Informática Educativa. Fortaleza - CE, 2014.
FAWCETT, T. An introduction to ROC analysis. Pattern Recognition Letters, v. 27, n. 8, p. 861-874, 2006. ISSN 0167-8655.
FAYYAD, U.; PIATETSKY-SHAPIRO, G.; SMYTH, P. From data mining to knowledge discovery in databases. AI Magazine, v. 17, n. 3, p. 37, 1996. ISSN 0738-4602.
HAN, J.; KAMBER, M.; PEI, J. Data Mining: Concepts and Techniques. Elsevier, 2011. ISBN 0123814804.
HUANG, X. et al. Understanding transactional distance in web-based learning environments: An empirical study. British Journal of Educational Technology, 2015. ISSN 1467-8535.
IBM. IBM SPSS Modeler 16 User's Guide. p. 50. 2013.
LANTZ, B. Machine Learning with R. Packt Publishing Ltd, 2013. ISBN 1782162151.
MAIMON, O.; ROKACH, L. Data Mining and Knowledge Discovery Handbook. 2nd ed. Springer, 2010. ISBN 978-0-387-09822-7. Disponível em: [link].
MARBOUTI, F.; DIEFES-DUX, H. A.; MADHAVAN, K. Models for early prediction of at-risk students in a course using standards-based grading. Computers & Education, v. 103, p. 1-15, 2016.
MOORE, M. G. The theory of transactional distance. In: MOORE, M. G. (Ed.). Handbook of Distance Education. New York: Routledge, 2013. cap. 5, p. 66-85.
MOORE, M. G. Theory of transactional distance. In: MOORE, M. G. (Ed.). Theoretical Principles of Distance Education. New York: Routledge, 1993. p. 2-29.
PAZ, F.; CAZELLA, S. Identificando o perfil de evasão de alunos de graduação através da Mineração de Dados Educacionais: um estudo de caso de uma Universidade Comunitária. In: Anais dos Workshops do Congresso Brasileiro de Informática na Educação. 2017. p. 624.
PEÑA-AYALA, A. Educational data mining: A survey and a data mining-based analysis of recent works. Expert Systems with Applications, v. 41, n. 4, Part 1, p. 1432-1462, 2014a. ISSN 0957-4174. Disponível em: [link].
QUEIROGA, E.; CECHINEL, C.; ARAÚJO, R. Predição de estudantes com risco de evasão em cursos técnicos a distância. In: Simpósio Brasileiro de Informática na Educação - SBIE. 2017. p. 1547.
RAMOS, J. L. C.; SILVA, J.; RODRIGUES, R.; GOMES, A. S.; DE SOUZA, F. D. F. Mapeamento de dados de um LMS para medida de construtos da distância transacional. In: Simpósio Brasileiro de Informática na Educação - SBIE. 2016. p. 1056.
RIGO, S. J. et al. Aplicações de Mineração de Dados Educacionais e Learning Analytics com foco na evasão escolar: oportunidades e desafios. Revista Brasileira de Informática na Educação, v. 22, n. 01, p. 132, 2014.
SILVA, L. A.; PERES, S. M.; BOSCARIOLI, C. Introdução à Mineração de Dados - Com Aplicações em R. 1. Rio de Janeiro: Elsevier, 2016.
TAN, P.-N.; STEINBACH, M.; KUMAR, V. Introdução ao data mining: Mineração de Dados. Ciência Moderna, 2009. ISBN 8573937610.
WITTEN, I. H.; FRANK, E.; HALL, M. A. Data Mining: Practical Machine Learning Tools and Techniques. Morgan Kaufmann, 2011. ISBN 008047702X.
DOS SANTOS, R. et al. Uma Abordagem Genérica de Identificação Precoce de Estudantes com Risco de Evasão em um AVA utilizando Técnicas de Mineração de Dados. XIX Congresso Internacional de Informática Educativa. Fortaleza - CE, 2014.
FAWCETT, T. An introduction to ROC analysis. Pattern Recognition Letters, v. 27, n. 8, p. 861-874, 2006. ISSN 0167-8655.
FAYYAD, U.; PIATETSKY-SHAPIRO, G.; SMYTH, P. From data mining to knowledge discovery in databases. AI Magazine, v. 17, n. 3, p. 37, 1996. ISSN 0738-4602.
HAN, J.; KAMBER, M.; PEI, J. Data Mining: Concepts and Techniques. Elsevier, 2011. ISBN 0123814804.
HUANG, X. et al. Understanding transactional distance in web-based learning environments: An empirical study. British Journal of Educational Technology, 2015. ISSN 1467-8535.
IBM. IBM SPSS Modeler 16 User's Guide. p. 50. 2013.
LANTZ, B. Machine Learning with R. Packt Publishing Ltd, 2013. ISBN 1782162151.
MAIMON, O.; ROKACH, L. Data Mining and Knowledge Discovery Handbook. 2nd ed. Springer, 2010. ISBN 978-0-387-09822-7. Disponível em: [link].
MARBOUTI, F.; DIEFES-DUX, H. A.; MADHAVAN, K. Models for early prediction of at-risk students in a course using standards-based grading. Computers & Education, v. 103, p. 1-15, 2016.
MOORE, M. G. The theory of transactional distance. In: MOORE, M. G. (Ed.). Handbook of Distance Education. New York: Routledge, 2013. cap. 5, p. 66-85.
MOORE, M. G. Theory of transactional distance. In: MOORE, M. G. (Ed.). Theoretical Principles of Distance Education. New York: Routledge, 1993. p. 2-29.
PAZ, F.; CAZELLA, S. Identificando o perfil de evasão de alunos de graduação através da Mineração de Dados Educacionais: um estudo de caso de uma Universidade Comunitária. In: Anais dos Workshops do Congresso Brasileiro de Informática na Educação. 2017. p. 624.
PEÑA-AYALA, A. Educational data mining: A survey and a data mining-based analysis of recent works. Expert Systems with Applications, v. 41, n. 4, Part 1, p. 1432-1462, 2014a. ISSN 0957-4174. Disponível em: [link].
QUEIROGA, E.; CECHINEL, C.; ARAÚJO, R. Predição de estudantes com risco de evasão em cursos técnicos a distância. In: Simpósio Brasileiro de Informática na Educação - SBIE. 2017. p. 1547.
RAMOS, J. L. C.; SILVA, J.; RODRIGUES, R.; GOMES, A. S.; DE SOUZA, F. D. F. Mapeamento de dados de um LMS para medida de construtos da distância transacional. In: Simpósio Brasileiro de Informática na Educação - SBIE. 2016. p. 1056.
RIGO, S. J. et al. Aplicações de Mineração de Dados Educacionais e Learning Analytics com foco na evasão escolar: oportunidades e desafios. Revista Brasileira de Informática na Educação, v. 22, n. 01, p. 132, 2014.
SILVA, L. A.; PERES, S. M.; BOSCARIOLI, C. Introdução à Mineração de Dados - Com Aplicações em R. 1. Rio de Janeiro: Elsevier, 2016.
TAN, P.-N.; STEINBACH, M.; KUMAR, V. Introdução ao data mining: Mineração de Dados. Ciência Moderna, 2009. ISBN 8573937610.
WITTEN, I. H.; FRANK, E.; HALL, M. A. Data Mining: Practical Machine Learning Tools and Techniques. Morgan Kaufmann, 2011. ISBN 008047702X.
Published
2018-10-29
How to Cite
RAMOS, Jorge L. C.; SILVA, João C. Sedraz; PRADO, Leonardo C.; GOMES, Alex S.; RODRIGUES, Rodrigo L..
A comparative study of classifiers for predicting student dropout in distance education. In: BRAZILIAN SYMPOSIUM ON COMPUTERS IN EDUCATION (SBIE), 29. , 2018, Fortaleza/CE.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2018
.
p. 1463-1472.
DOI: https://doi.org/10.5753/cbie.sbie.2018.1463.
