Big Data na Educação: Predição de Evasão Estudantil com Aprendizado de Máquina
Resumo
Este trabalho apresenta uma metodologia para a predição da evasão, utilizando dados de big data (N = 466387) de um ambiente de data lake na AWS. O treinamento dos modelos é realizado de forma automatizada utilizando o framework AWS SageMaker Autopilot, menos dependente de cientista de dados e especialistas em IA. Como resultado, foram gerados modelos para diferentes estágios do semestre, alcançando uma acurácia de até 83%. A metodologia oferece um framework replicável para instituições de ensino, preenchendo uma lacuna na literatura sobre a aplicação prática de ETL e AutoML em contextos educacionais e fornecendo uma base para o desenvolvimento de sistemas de apoio à decisão que podem levar a intervenções eficazes e personalizadas.Referências
Alamri, A., Alshehri, M., Cristea, A., Pereira, F. D., Oliveira, E., Shi, L., and Stewart, C. (2019). Predicting moocs dropout using only two easily obtainable features from the first week’s activities. In Intelligent Tutoring Systems: 15th International Conference, ITS 2019, Kingston, Jamaica, June 3–7, 2019, Proceedings 15, pages 163–173. Springer.
Alghamdi, S., Soh, B., and Li, A. (2025). A comprehensive review of dropout prediction methods based on multivariate analysed features of mooc platforms. Multimodal Technologies and Interaction, 9(1):3.
Alves, A., Inácio, C., Pozzebon, E., and Silva, J. (2024). Aspectos relevantes dos modelos preditivos de inteligência artificial no combate à evasão escolar em cursos de graduação: uma revisão sistemática. In Anais do XXXV Simpósio Brasileiro de Informática na Educação, pages 1503–1514, Porto Alegre, RS, Brasil. SBC.
Andrade, T., Almeida, C., Barbosa, J., and Rigo, S. (2024). Análise de desempenho dos alunos após a utilização do sistema de recomendação Éforo-sr para a mitigação de evasão e promoção da retenção. In Anais do XXXV Simpósio Brasileiro de Informática na Educação, pages 85–100, Porto Alegre, RS, Brasil. SBC.
Carvalho, C., Mattos, J., and Aguiar, M. (2024). Interpretabilidade e justiça algorítmica: Avançando na transparência de modelos preditivos de evasão escolar. In Anais do XXXV Simpósio Brasileiro de Informática na Educação, pages 1658–1673, Porto Alegre, RS, Brasil. SBC.
Nagy, M. and Molontay, R. (2024). Interpretable dropout prediction: towards xai-based personalized intervention. International Journal of Artificial Intelligence in Education, 34(2):274–300.
Patgiri, R., Deka, G. C., and Biswas, A. (2023). Principles of big graph: In-depth insight.
Pereira, F. D., Oliveira, E., Cristea, A., Fernandes, D., Silva, L., Aguiar, G., Alamri, A., and Alshehri, M. (2019). Early dropout prediction for programming courses supported by online judges. In International conference on artificial intelligence in education, pages 67–72. Springer.
Rabelo, A. M. and Zárate, L. E. (2025). A model for predicting dropout of higher education students. Data Science and Management, 8(1):72–85.
Radovanović, S., Delibašić, B., and Suknović, M. (2021). Predicting dropout in online learning environments. Computer Science and Information Systems/ComSIS, 18(3):957–978.
Santos, C. H., Martins, S., and Plastino, A. (2021). É possível prever evasão com base apenas no desempenho acadêmico? In Anais do XXXII Simpósio Brasileiro de Informática na Educação, pages 792–802, Porto Alegre, RS, Brasil. SBC.
Silva, F., Feitosa, R., Batista, L., and Santana, A. (2024). Análise comparativa de métodos de explicabilidade da inteligência artificial no cenário educacional: um estudo de caso sobre evasão. In Anais do XXXV Simpósio Brasileiro de Informática na Educação, pages 2968–2977, Porto Alegre, RS, Brasil. SBC.
Sosa-Alonso, J. J., López-Aguilar, D., Álvarez-Pérez, P. R., and González-Morales, O. (2025). Predicting university dropout: connecting big data and structural models. Studies in Higher Education, pages 1–18.
Stojanov, A. and Daniel, B. K. (2024). A decade of research into the application of big data and analytics in higher education: A systematic review of the literature. Education and information technologies, 29(5):5807–5831.
Talebi, K., Torabi, Z., and Daneshpour, N. (2024). Ensemble models based on cnn and lstm for dropout prediction in mooc. Expert Systems with Applications, 235:121187.
Vaarma, M. and Li, H. (2024). Predicting student dropouts with machine learning: An empirical study in finnish higher education. Technology in Society, 76:102474.
Êrica Carmo, Gasparini, I., and Oliveira, E. (2022). Identificação de trajetórias de aprendizagem em um curso de graduação e sua relação com a evasão escolar. In Anais do XXXIII Simpósio Brasileiro de Informática na Educação, pages 323–333, Porto Alegre, RS, Brasil. SBC.
Alghamdi, S., Soh, B., and Li, A. (2025). A comprehensive review of dropout prediction methods based on multivariate analysed features of mooc platforms. Multimodal Technologies and Interaction, 9(1):3.
Alves, A., Inácio, C., Pozzebon, E., and Silva, J. (2024). Aspectos relevantes dos modelos preditivos de inteligência artificial no combate à evasão escolar em cursos de graduação: uma revisão sistemática. In Anais do XXXV Simpósio Brasileiro de Informática na Educação, pages 1503–1514, Porto Alegre, RS, Brasil. SBC.
Andrade, T., Almeida, C., Barbosa, J., and Rigo, S. (2024). Análise de desempenho dos alunos após a utilização do sistema de recomendação Éforo-sr para a mitigação de evasão e promoção da retenção. In Anais do XXXV Simpósio Brasileiro de Informática na Educação, pages 85–100, Porto Alegre, RS, Brasil. SBC.
Carvalho, C., Mattos, J., and Aguiar, M. (2024). Interpretabilidade e justiça algorítmica: Avançando na transparência de modelos preditivos de evasão escolar. In Anais do XXXV Simpósio Brasileiro de Informática na Educação, pages 1658–1673, Porto Alegre, RS, Brasil. SBC.
Nagy, M. and Molontay, R. (2024). Interpretable dropout prediction: towards xai-based personalized intervention. International Journal of Artificial Intelligence in Education, 34(2):274–300.
Patgiri, R., Deka, G. C., and Biswas, A. (2023). Principles of big graph: In-depth insight.
Pereira, F. D., Oliveira, E., Cristea, A., Fernandes, D., Silva, L., Aguiar, G., Alamri, A., and Alshehri, M. (2019). Early dropout prediction for programming courses supported by online judges. In International conference on artificial intelligence in education, pages 67–72. Springer.
Rabelo, A. M. and Zárate, L. E. (2025). A model for predicting dropout of higher education students. Data Science and Management, 8(1):72–85.
Radovanović, S., Delibašić, B., and Suknović, M. (2021). Predicting dropout in online learning environments. Computer Science and Information Systems/ComSIS, 18(3):957–978.
Santos, C. H., Martins, S., and Plastino, A. (2021). É possível prever evasão com base apenas no desempenho acadêmico? In Anais do XXXII Simpósio Brasileiro de Informática na Educação, pages 792–802, Porto Alegre, RS, Brasil. SBC.
Silva, F., Feitosa, R., Batista, L., and Santana, A. (2024). Análise comparativa de métodos de explicabilidade da inteligência artificial no cenário educacional: um estudo de caso sobre evasão. In Anais do XXXV Simpósio Brasileiro de Informática na Educação, pages 2968–2977, Porto Alegre, RS, Brasil. SBC.
Sosa-Alonso, J. J., López-Aguilar, D., Álvarez-Pérez, P. R., and González-Morales, O. (2025). Predicting university dropout: connecting big data and structural models. Studies in Higher Education, pages 1–18.
Stojanov, A. and Daniel, B. K. (2024). A decade of research into the application of big data and analytics in higher education: A systematic review of the literature. Education and information technologies, 29(5):5807–5831.
Talebi, K., Torabi, Z., and Daneshpour, N. (2024). Ensemble models based on cnn and lstm for dropout prediction in mooc. Expert Systems with Applications, 235:121187.
Vaarma, M. and Li, H. (2024). Predicting student dropouts with machine learning: An empirical study in finnish higher education. Technology in Society, 76:102474.
Êrica Carmo, Gasparini, I., and Oliveira, E. (2022). Identificação de trajetórias de aprendizagem em um curso de graduação e sua relação com a evasão escolar. In Anais do XXXIII Simpósio Brasileiro de Informática na Educação, pages 323–333, Porto Alegre, RS, Brasil. SBC.
Publicado
24/11/2025
Como Citar
PEREIRA, Filipe Dwan et al.
Big Data na Educação: Predição de Evasão Estudantil com Aprendizado de Máquina. In: SIMPÓSIO BRASILEIRO DE INFORMÁTICA NA EDUCAÇÃO (SBIE), 36. , 2025, Curitiba/PR.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2025
.
p. 1805-1814.
DOI: https://doi.org/10.5753/sbie.2025.12943.
