Análise de Eficiência Computacional em Sistemas RAG com Busca Vetorial: Um Estudo de Caso no ProbY

Luis Oliveira; Douglas Zanini; Alex Camargo

doi:10.5753/eradrs.2026.21493

Luis Oliveira ProbY: A Smart Platform for Global Problems
Douglas Zanini ProbY: A Smart Platform for Global Problems
Alex Camargo ProbY: A Smart Platform for Global Problems

DOI: https://doi.org/10.5753/eradrs.2026.21493

Resumo

Este trabalho apresenta uma análise da integração entre Retrieval-Augmented Generation (RAG) e busca vetorial sob a perspectiva de eficiência computacional. O estudo avalia o desempenho das etapas de geração de embeddings, recuperação vetorial e geração de respostas por modelos de linguagem. A partir de um benchmarking simplificado, são avaliadas métricas de latência e custo do pipeline. Os resultados indicam que a recuperação vetorial apresenta baixa latência, enquanto a geração de texto concentra a maior parte do tempo de processamento.

Referências

Gupta, S.; Verma, R.; Sharma, A. (2024). A Comprehensive Survey of RetrievalAugmented Generation (RAG). arXiv. Disponível em: [link]. Acesso em: 3 mar. 2026.

Ji, Z.; Lee, N.; Frieske, R.; Yu, T.; Su, D.; Xu, Y.; Ishii, E.; Bang, Y.; Madotto, A.; Fung, P. (2023). Survey of Hallucination in Natural Language Generation. ACM Computing Surveys. Disponível em: [link]. Acesso em: 6 mar. 2026.

Johnson, J.; Douze, M.; Jégou, H. (2025). Faiss: A Library for Efficient Similarity Search and Clustering of Dense Vectors. arXiv. Disponível em: [link]. Acesso em: 7 mar. 2026.

ProbY. (2026). ProbY – Plataforma Inteligente de Problemas Globais. Disponível em: [link]. Acesso em: 6 mar. 2026.

Zhao, P.; Liu, Y.; Wang, H. (2026). Retrieval-Augmented Generation for AI-Generated Content. Springer. Disponível em: [link]. Acesso em: 5 mar. 2026.