Identificação de Desigualdades Sociais a partir do desempenho dos alunos do Ensino Médio no ENEM 2019 utilizando Mineração de Dados

Resumo


O presente trabalho apresenta o uso de técnicas de Mineração de Dados com foco na identificação de desigualdades sociais a partir da análise do desempenho dos estudantes concluintes do ensino médio que prestaram o Exame Nacional do Ensino Médio - ENEM no ano 2019. O uso de algoritmos de Clusterização e de Regras de Associação permitiu mapear as variáveis determinantes no desempenho dos estudantes bem como caracterizar dois grupos bem definidos a partir dos resultados obtidos nas cinco avaliações do exame.
Palavras-chave: Mineração de Dados Educacionais, ENEM, Clusterização, Mineração de Regras Associação

Referências

Agrawal, R., Srikant, R., et al. (1994). Fast algorithms for mining association rules. In Proc. 20th int. conf. very large data bases, VLDB, volume 1215, pages 487–499.


Alves, R. D., Cechinel, C., and Queiroga, E. (2018). Predição do desempenho de matemática e suas tecnologias do enem utilizando técnicas de mineração de dados. In Workshops do Congresso Brasileiro de Informática na Educação, volume 7, page 469.


Demšar, J. et al. (2013). Orange: Data mining toolbox in python. Journal of Machine Learning Research, 14:2349–2353.


Gomes, T., Gouveia, R., and Batista, M. (2017). Dados educacionais abertos: associações em dados dos inscritos do exame nacional do ensino médio. In Anais do Workshop de Informática na Escola, volume 23, page 895.


INEP (2020). Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira - Microdados do ENEM 2019. http://portal.inep.gov.br/web/guest/microdados. Online: acessado 03 Julho 2020.


Leoni, R. C. and Sampaio, N. (2017). Desempenho das escolas públicas e privadas da região do vale do paraíba: Uma aplicação da técnica de agrupamentos kmeans com base nas variáveis do enem 2015. Cadernos do IME-Série Estatística, 42:31.


Lima, P. d. S. N., Ambrósio, A. P. L., Ferreira, D. J., and Brancher, J. D. (2019). Análise de dados do enade e enem: uma revisão sistemática da literatura. Avaliação: Revista da Avaliação da Educação Superior, 24(1):89–107.


Pedregosa, F. et al. (2011). Scikit-learn: Machine learning in Python. Journal of Machine Learning Research, 12:2825–2830.


Rousseeuw, P. J. (1987). Silhouettes: a graphical aid to the interpretation and validation of cluster analysis. Journal of computational and applied mathematics, 20:53–65.


Silva, L. A., Morino, A. H., and Sato, T. M. C. (2014). Prática de mineraçao de dados no exame nacional do ensino médio. In Anais dos Workshops do Congresso Brasileiro de Informática na Educação, volume 3, page 651.


Simon, A. and Cazella, S. (2017). Mineração de dados educacionais nos resultados do enem de 2015. In Anais dos Workshops do Congresso Brasileiro de Informática na Educação, volume 6, page 754.


Souza, P. F. d., Ribeiro, C. A. C., and Carvalhaes, F. (2010). Desigualdade de oportunidades no brasil: considerações sobre classe, educação e raça. Revista Brasileira de Ciências Sociais, 25(73):77–100.


Wes McKinney (2010). Data Structures for Statistical Computing in Python. In Stéfan van der Walt and Jarrod Millman, editors, Proceedings 9th Python in Science Conference, pages 56 – 61.
Publicado
24/11/2020
SILVA, Vinicius Alberto Alves da; MORENO, Lorenza Leão Oliveira; GONÇALVES, Luciana Brugiolo; SOARES, Stênio Sã Rosário Furtado; SOUZA JÚNIOR, Robson Rocha. Identificação de Desigualdades Sociais a partir do desempenho dos alunos do Ensino Médio no ENEM 2019 utilizando Mineração de Dados. In: SIMPÓSIO BRASILEIRO DE INFORMÁTICA NA EDUCAÇÃO (SBIE), 31. , 2020, Online. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2020 . p. 72-81. DOI: https://doi.org/10.5753/cbie.sbie.2020.72.