Análise de Fatores de Risco para a Evasão Escolar na Educação Básica usando Modelos Preditivos de Machine Learning
Resumo
A evasão escolar segue como um dos principais desafios educacionais do Brasil, impactando o desenvolvimento social e econômico do país. Este estudo emprega técnicas de Machine Learning para prever a evasão escolar com base em dados do INEP, utilizando os algoritmos Regressão Linear, Random Forest e XGBoost. As análises foram conduzidas com dados do Censo Escolar 2023 e indicadores de rendimento, abrangendo os segmentos dos Anos Iniciais, Anos Finais e Ensino Médio. O modelo XGBoost obteve o melhor desempenho, com R² = 0,503 no Ensino Médio, demonstrando capacidade de explicar 50,3% da variabilidade na evasão. Variáveis de infraestrutura, como refeitório, biblioteca e quadra de esportes, apresentaram alta relevância preditiva. Os achados destacam disparidades regionais e apontam subsídios para políticas públicas mais direcionadas. O estudo ressalta que os resultados indicam correlação estatística, não causalidade, e discute as limitações do uso de dados públicos e ausência de variáveis socioemocionais.
Palavras-chave:
Evasão Escolar, Educação Básica, Machine Learning, Modelos Preditivos, Mineração de Dados Educacionais
Referências
BRASIL, M. (2023). Instituto nacional de estudos e pesquisas educacionais anísio teixeira (inep). Censo Escolar. Acessado em: 30 out. 2024.
Breiman, L. (2001). Random forests. Machine learning, 45:5–32.
Chen, T. and Guestrin, C. (2016). Xgboost: A scalable tree boosting system. In Proceedings of the 22nd acm sigkdd international conference on knowledge discovery and data mining, pages 785–794.
de Brito, J. J. R. T., da Silva, G. C., Rodrigues, R. L., Amorim, A. N. G. F., et al. (2022). A relação entre nível socioeconômico e proficiência em matemática de estudantes pernambucanos do 9º ano através da mineração de dados educacionais. Amazônia: Revista de Educação em Ciências e Matemáticas, 18(41):112–126.
de Faria, D. R., Silvestre, J. V. R., de Oliveira Neto, P. M., and Silva, V. E. P. (2022). A utilização de aprendizado de máquina supervisionado para predição de evasão no ensino superior.
de Jesus, J. A. and de Gusmão, R. P. (2024). Investigação da evasão estudantil por meio da mineração de dados e aprendizagem de máquina: Um mapeamento sistemático. Revista Brasileira de Informática na Educação, 32.
de Oliveira Almeida et al., C. (2021). Políticas educacionais brasileiras para ejai e a educação permanente. Revista HISTEDBR On-line, 21:e021025–e021025.
do Nascimento, R. L. S., da Cruz Junior, G. G., and de Araújo Fagundes, R. A. (2018). Mineração de dados educacionais: Um estudo sobre indicadores da educação em bases de dados do inep. Revista Novas Tecnologias na Educação, 16(1).
Fayyad, U., Piatetsky-Shapiro, G., and Smyth, P. (1996). From data mining to knowledge discovery in databases. AI magazine, 17(3):37–37.
Gramacho, W. G. M. (2019). Algoritmos de mineração de dados para análise de evasão na graduação da universidade de brasília.
Lima, J. A. and Fagundes, R. A. (2023). Análise comparativa de algoritmos de machine learning para prever a evasão escolar: Uma revisão sistemática da literatura. Revista Novas Tecnologias na Educação, 21(2):362–371.
Breiman, L. (2001). Random forests. Machine learning, 45:5–32.
Chen, T. and Guestrin, C. (2016). Xgboost: A scalable tree boosting system. In Proceedings of the 22nd acm sigkdd international conference on knowledge discovery and data mining, pages 785–794.
de Brito, J. J. R. T., da Silva, G. C., Rodrigues, R. L., Amorim, A. N. G. F., et al. (2022). A relação entre nível socioeconômico e proficiência em matemática de estudantes pernambucanos do 9º ano através da mineração de dados educacionais. Amazônia: Revista de Educação em Ciências e Matemáticas, 18(41):112–126.
de Faria, D. R., Silvestre, J. V. R., de Oliveira Neto, P. M., and Silva, V. E. P. (2022). A utilização de aprendizado de máquina supervisionado para predição de evasão no ensino superior.
de Jesus, J. A. and de Gusmão, R. P. (2024). Investigação da evasão estudantil por meio da mineração de dados e aprendizagem de máquina: Um mapeamento sistemático. Revista Brasileira de Informática na Educação, 32.
de Oliveira Almeida et al., C. (2021). Políticas educacionais brasileiras para ejai e a educação permanente. Revista HISTEDBR On-line, 21:e021025–e021025.
do Nascimento, R. L. S., da Cruz Junior, G. G., and de Araújo Fagundes, R. A. (2018). Mineração de dados educacionais: Um estudo sobre indicadores da educação em bases de dados do inep. Revista Novas Tecnologias na Educação, 16(1).
Fayyad, U., Piatetsky-Shapiro, G., and Smyth, P. (1996). From data mining to knowledge discovery in databases. AI magazine, 17(3):37–37.
Gramacho, W. G. M. (2019). Algoritmos de mineração de dados para análise de evasão na graduação da universidade de brasília.
Lima, J. A. and Fagundes, R. A. (2023). Análise comparativa de algoritmos de machine learning para prever a evasão escolar: Uma revisão sistemática da literatura. Revista Novas Tecnologias na Educação, 21(2):362–371.
Publicado
09/09/2025
Como Citar
LIRA, Rodrigo Antonio da S.; ALENCAR, Fernanda Maria Ribeiro.
Análise de Fatores de Risco para a Evasão Escolar na Educação Básica usando Modelos Preditivos de Machine Learning. In: CONGRESSO SOBRE TECNOLOGIAS NA EDUCAÇÃO (CTRL+E), 9. , 2025, Fortaleza/CE.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2025
.
p. 22-31.
DOI: https://doi.org/10.5753/ctrle.2025.11936.
