Aplicações de Aprendizagem de Máquina com dados do INEP: Uma Revisão de Literatura
Resumo
Este estudo revisa 27 artigos sobre o uso de aprendizado de máquina em dados do INEP, com ênfase no ENADE e no ENEM. Destacam-se temas como desigualdades, desempenho e evasão, com predominância de técnicas supervisionadas, como Random Forest, SVM e redes neurais. Os resultados apontam avanços analíticos e sugerem a integração de bases de dados e o desenvolvimento de ferramentas interativas para subsidiar políticas públicas.
Referências
Azevedo S, J. e. a. (2024). Desafios e oportunidades do ensino em computação: Uma análise exploratória e multivariada dos dados do enade. Intersaberes, 19.
Barbosa, P. L. S. et al. (2023). O sucesso não é apenas uma questão de sorte: um mapeamento sistemático sobre técnicas de análise do Enade da área de Computação . Sociedade Brasileira de Computação.
Barros, A. N. e. a. (2023). Aplicação de learning analytics para identificação de tomada de decisão sobre a distorção idade-série no Brasil. In Workshop de Aplicações Práticas de Learning Analytics em Instituições de Ensino no Brasil (WAPLA) , pages 21–31.
Brasil (2004). Lei nº 10.861, de 14 de abril de 2004. institui o sistema nacional de avaliação da educação superior (sinaes). [link]. Acesso em: 30 abr. 2025.
Cunha, R. F. e. a. (2021). Análise automática dos microdados do ENADE para prover melhorias em cursos de ciência da computação.
da Educação, B. M. (2018). Portaria normativa mec nº 840, de 24 de agosto de 2018. [link]. Acesso em: 30 abr. 2025.
da Silva M, e. a. (2024). Uso de técnicas de aprendizado de máquina para predição do tempo de graduação dos discentes de engenharia da computação na região sudeste do Brasil.
da Silva R., C. C. e. a. (2022). O impacto de aspectos socioeconômicos no desempenho de estudantes de sistemas de informação no Enade. Revista Brasileira de Informática na Educação , 30:157–181.
De Castro Soares, R., Weber Neto, N., Reis Coutinho, L., Da Silva e Silva, F. J., Viana dos Santos, D., and Soares Teles, A. (2021). Mineração de dados da educação básica brasileira usando as bases do INEP: Uma revisão sistemática da literatura.
Dos Santos, Vandeir Vioti, N. P. (2023). Analysis of the importance of social/racial quotas through enem 's microdata mining. Informática na educação: teoria & prática ´ , 26(1):110–117.
Dutra, J. F., Firmino Junior, J. B., and Fernandes, D. Y. S. (2023). Fatores que podem interferir no desempenho dos estudantes no enem: uma revisão sistemática da literatura. Revista Brasileira de Informática na Educação, 31:323–351. Acesso em: 29 abr. 2025.
Estivalete, P. e. a. (2021). Descoberta de conhecimentos sobre integração curricular nos estados da região sul do Brasil por meio do Enade 2012: um estudo utilizando mineração de dados educacionais.
Franco, J. J. e. a. (2020). Usando mineração de dados para identificar fatores mais importantes do enem dos últimos 22 anos. In Simpósio Brasileiro de Informática na Educação (SBIE) , pages 1112–1121.
Freitas, C. N., Gouveia, M. M. R., Rodrigues, M. E., Alves, G., Batista, M. C., and Rodrigues, R. L. (2023). Detecção de outliers em finanças de instituições de ensino superior brasileiras utilizando aprendizado de máquina não supervisionado.
Garcia, D. H. A., Silva, A. C. R. d., Silva, M. G. d., and Santos, A. A. (2022). Mineração de dados educacionais na predição do desempenho acadêmico: um prognóstico a partir do percurso curricular realizado. In Anais do Simpósio Brasileiro de Informática na Educação (SBIE), páginas 1124–1134. Sociedade Brasileira de Computação.
Gomes, C. M. A., Fleith, D. d. S., Marinho-Araujo, C. M., and Rabelo, M. L. (2020). Pre dictors of students’ mathematics achievement in secondary education. Psicologia: Teoria e Pesquisa, 36 e 38.
Gondran, E. e. a. (2022). Analyzing the determinant characteristics for a good performance at ENADE brazilian exam stratified by teaching modality: Face-to-face versus online. In ICEIS (1), pages 234–242.
INEP (2025). Microdados do enade. [link]. Acesso em: 30 abr. 2025.
Instituto Brasileiro de Geografia e Estatística (IBGE) (2024). Exame nacional de desempenho dos estudantes (enade) - metadados. [link]. Acessado em: maio 2025.
Kitchenham, B. (2007). Guidelines for performing systematic literature reviews in software engineering. Acesso em: 23 abr. 2025.
Lima, N. C. A., Fagundes, A. d. A., and R. (2020). Educational data mining: A study of the factors that cause school dropout in higher education institutions in brazil.
Lima, P. d. S. N. e. a. (2021). Análise de conteúdo das provas do Enade para os alunos do curso de bacharelado em ciência da computação. Revista Brasileira de Informática na Educação, 29:385–413.
Magalhães, Leandro Cunha, S. T. F. M. (2025). Enadequest-um sistema de geração de questões no modelo Enade.Caderno de Estudos em Sistemas de Informação, 11(2).
Maretti, Leitao Lucas de Carvalho, V. B. P. R. (2023). Influências socioeconômicas e geográficas no desempenho do enem 2023: Um estudo estatístico e de aprendizado de máquina.
Marques, R., Gouveia, R., Junior, G., and Batista, M. (2023). Aprendizado de máquina para agrupamento e associação de dados do ensino superior público brasileiro.
Neto, F., Silva, R., Gouveia, R., Batista, M., and Oliveira, I. (2020). Computação em nuvem e aprendizado de máquina para análise de grandes volumes de dados educacionais. In Anais do Encontro Nacional de Inteligência Artificial e Computacional (ENIAC). Sociedade Brasileira de Computação.
Rosa, E. R., Ferreira, D. J., Silva, N. F. F. d., and Assis, A. (2021). Estudo exploratório através de análises longitudinais aplicado à ciência da computação a partir da base de dados do Enade.
Sakashita, Renan GA, B. D. S. A. L. (2023). Predição do conceito enade dos cursos de computação no brasil. In Simpósio Brasileiro de Informática na Educação (SBIE), pages 1305–1316.
Silva, J. C. P. e. a. (2020). Data analysis of the performance of brazilian higher education medicine courses. In Proceedings of the 10th Euro-American Conference on Telematics and Information Systems, pages 1–8.
Silva S F, Carlos Enrique Carrasco Gutierrez, T. C. S. (2023). Percepções e práticas educativas no desempenho acadêmico: uma abordagem machine learning.
Souza, K. E., Neto, M. M., and Lana, C. A. (2024). Classificação curricular das questões do Enade em engenharia de computação: uma mineração de texto. In Anais do Simpósio Brasileiro de Informática na Educação (SBIE), pages 3009–3019, Porto Alegre. SBC.
Souza, K. E., Toledo, P. G. Neto, M. M., Villela, M. M., and Lana, A. C. (2025). C3 miner text: Uma ferramenta para classificação Ao de componentes curriculares de questões do Enade.
Teixeira de J, Alef Aparecido, G. L. A. F. (2020). Um estudo comparativo entre os frameworks de aprendizado de máquina scikit-learning vs. caret: Aplicado no desempenho de notas no enem.
Vieira, A. d. S., Bertolini, D., and Schwerz, A. L. (2022). Análise do desempenho no enredo dos concluintes de computação usando técnica de agrupamento.
