Miyaji, R., Moulin, R., Monção, S., & Machado, L. (2025). Evaluating RAG-based QA Systems: A Comparative Analysis of LLM as a Judge, Traditional Metrics, and Human Alignment. In Anais do XVI Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana, (pp. 247-258). Porto Alegre: SBC. doi:10.5753/stil.2025.37829