Costa, Leandro, E Oliveira e Souza Filho, João. " LLM Agents for Search via Reinforcement Learning with Trajectory-Level Self-Evaluation" Anais do Encontro Nacional de Inteligência Artificial e Computacional (ENIAC) [Online], (29 setembro 2025)