MIYAJI, Renato; MOULIN, Renato; MONÇÃO, Samuel; MACHADO, Leonardo. Evaluating RAG-based QA Systems: A Comparative Analysis of LLM as a Judge, Traditional Metrics, and Human Alignment. In: SIMPÓSIO BRASILEIRO DE TECNOLOGIA DA INFORMAÇÃO E DA LINGUAGEM HUMANA (STIL), 16. , 2025, Fortaleza/CE. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2025 . p. 247-258. DOI: https://doi.org/10.5753/stil.2025.37829.