MIYAJI, Renato; MOULIN, Renato; MONÇÃO, Samuel; MACHADO, Leonardo.
Evaluating RAG-based QA Systems: A Comparative Analysis of LLM as a Judge, Traditional Metrics, and Human Alignment. In: SIMPÓSIO BRASILEIRO DE TECNOLOGIA DA INFORMAÇÃO E DA LINGUAGEM HUMANA (STIL), 16. , 2025, Fortaleza/CE.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2025
.
p. 247-258.
DOI: https://doi.org/10.5753/stil.2025.37829.