Taschetto, L., & Fileto, R. (2025). Evaluating Large Language Models through Multidimensional Item Response Theory: A Comprehensive Case Study on ENEM. In Anais do XVI Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana, (pp. 455-466). Porto Alegre: SBC. doi:10.5753/stil.2025.37846