COSTA, Leandro Yamachita da; OLIVEIRA E SOUZA FILHO, João Baptista de.
LLM Agents for Search via Reinforcement Learning with Trajectory-Level Self-Evaluation. In: ENCONTRO NACIONAL DE INTELIGÊNCIA ARTIFICIAL E COMPUTACIONAL (ENIAC), 22. , 2025, Fortaleza/CE.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2025
.
p. 1221-1232.
ISSN 2763-9061.
DOI: https://doi.org/10.5753/eniac.2025.14460.