Renato Miyaji, Renato Moulin, Samuel Monção, and Leonardo Machado. 2025.
Evaluating RAG-based QA Systems: A Comparative Analysis of LLM as a Judge, Traditional Metrics, and Human Alignment. In Anais do XVI Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana, setembro 29, 2025, Fortaleza/CE, Brasil. SBC, Porto Alegre, Brasil, 247-258. DOI: https://doi.org/10.5753/stil.2025.37829.