R. Miyaji, R. Moulin, S. Monção, and L. Machado.
" Evaluating RAG-based QA Systems: A Comparative Analysis of LLM as a Judge, Traditional Metrics, and Human Alignment", in Anais do XVI Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana, Fortaleza/CE, 2025, pp. 247-258, doi: https://doi.org/10.5753/stil.2025.37829.