G. Bromonschenkel, H. Oliveira, and T. Paixão. " A Comparative Evaluation of Transformer-Based Vision Encoder-Decoder Models for Brazilian Portuguese Image Captioning", in Anais da XXXVII Conference on Graphics, Patterns and Images, Manaus/AM, 2024.