Muitas Classes Desbalanceadas? Escale na Nuvem! Um Relato de Uso da AWS para Classificação de Texto com RAG-labels

Celso França; Leonardo Rocha; Marcos André Gonçalves

doi:10.5753/pesquisanuvem.2026.22215

Celso França UFMG
Leonardo Rocha UFSJ
Marcos André Gonçalves UFMG

DOI: https://doi.org/10.5753/pesquisanuvem.2026.22215

Resumo

Este artigo apresenta a experiência usando a infraestrutura AWS para desenvolvimento e experimentação em larga escala do RAG-Fuse, combinando Amazon Bedrock para gerar representações semânticas de classes (RAG-labels), instâncias EC2 com GPU para o fine-tuning de Small Language Models (SLMs) e AWS S3 para armazenamento de dados e modelos. A arquitetura resultante viabiliza um pipeline escalável, eficiente e alinhado a aplicações do mundo real, sendo até 70% mais eficaz e consumindo até 10 vezes menos recursos do que LLMs com bilhões de parâmetros.

Referências

Bassani, E. (2023). ranxhub: An online repository for information retrieval runs. In SIGIR, page 3210–3214.

Chen, Y. et al. (2024). PRompt optimization in multi-step tasks (PROMST): Integrating human feedback and heuristic-based sampling. In EMNLP, pages 3859–3920.

de Andrade, C. M. et al. (2023). On the class separability of contextual embeddings representations – or “the classifier does not matter when the (text) representation is so good!”. Information Processing Management, 60(4).

Dettmers, T. et al. (2023). Qlora: Efficient finetuning of quantized llms. In Oh, A., Naumann, T., Globerson, A., Saenko, K., Hardt, M., and Levine, S., editors, Advances in Neural Information Processing Systems, volume 36, pages 10088–10115.

França, C., Nunes, I., Salles, T., Cunha, W., Jallais, G., Rocha, L., and Gonçalves, M. A. (2025). Muitas classes desbalanceadas? não classifique-ranqueie! uma abordagem baseada em retrieval-augmented generation (rag)-labels para classificação textual multi-classe. In Simpósio Brasileiro de Banco de Dados (SBBD), pages 264–277. SBC.

Lewis, M., Liu, Y., Goyal, N., Ghazvininejad, M., Mohamed, A., Levy, O., Stoyanov, V., and Zettlemoyer, L. (2020a). BART: Denoising sequence-to-sequence pre-training for natural language generation, translation, and comprehension. In Proceedings of the 58th ACL, pages 7871–7880, Online.

Lewis, P., Perez, E., Piktus, A., Petroni, F., Karpukhin, V., Goyal, N., Küttler, H., Lewis, M., Yih, W.-t., Rocktäschel, T., Riedel, S., and Kiela, D. (2020b). Retrieval-augmented generation for knowledge-intensive nlp tasks. In Advances in Neural Information Processing Systems, pages 9459–9474.

Sikosana, M., Ajao, O., and Maudsley-Barton, S. (2024). A comparative study of hybrid models in health misinformation text classification. OASIS ’24, page 18–25.

Sy, C. Y., Maceda, L. L., Canon, M. J. P., and Flores, N. M. (2024). Beyond bert: Exploring the efficacy of roberta and albert in supervised multiclass text classification. International Journal of Advanced Computer Science & Applications, 15(3).