Análise de Eficiência Computacional em Sistemas RAG com Busca Vetorial: Um Estudo de Caso no ProbY

  • Luis Oliveira ProbY: A Smart Platform for Global Problems
  • Douglas Zanini ProbY: A Smart Platform for Global Problems
  • Alex Camargo ProbY: A Smart Platform for Global Problems

Resumo


Este trabalho apresenta uma análise da integração entre Retrieval-Augmented Generation (RAG) e busca vetorial sob a perspectiva de eficiência computacional. O estudo avalia o desempenho das etapas de geração de embeddings, recuperação vetorial e geração de respostas por modelos de linguagem. A partir de um benchmarking simplificado, são avaliadas métricas de latência e custo do pipeline. Os resultados indicam que a recuperação vetorial apresenta baixa latência, enquanto a geração de texto concentra a maior parte do tempo de processamento.

Referências

Gupta, S.; Verma, R.; Sharma, A. (2024). A Comprehensive Survey of RetrievalAugmented Generation (RAG). arXiv. Disponível em: [link]. Acesso em: 3 mar. 2026.

Ji, Z.; Lee, N.; Frieske, R.; Yu, T.; Su, D.; Xu, Y.; Ishii, E.; Bang, Y.; Madotto, A.; Fung, P. (2023). Survey of Hallucination in Natural Language Generation. ACM Computing Surveys. Disponível em: [link]. Acesso em: 6 mar. 2026.

Johnson, J.; Douze, M.; Jégou, H. (2025). Faiss: A Library for Efficient Similarity Search and Clustering of Dense Vectors. arXiv. Disponível em: [link]. Acesso em: 7 mar. 2026.

ProbY. (2026). ProbY – Plataforma Inteligente de Problemas Globais. Disponível em: [link]. Acesso em: 6 mar. 2026.

Zhao, P.; Liu, Y.; Wang, H. (2026). Retrieval-Augmented Generation for AI-Generated Content. Springer. Disponível em: [link]. Acesso em: 5 mar. 2026.
Publicado
06/05/2026
OLIVEIRA, Luis; ZANINI, Douglas; CAMARGO, Alex. Análise de Eficiência Computacional em Sistemas RAG com Busca Vetorial: Um Estudo de Caso no ProbY. In: ESCOLA REGIONAL DE ALTO DESEMPENHO DA REGIÃO SUL (ERAD-RS), 26. , 2026, Bagé/RS. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2026 . p. 37-40. ISSN 2595-4164. DOI: https://doi.org/10.5753/eradrs.2026.21493.