Análise de Eficiência Computacional em Sistemas RAG com Busca Vetorial: Um Estudo de Caso no ProbY
Resumo
Este trabalho apresenta uma análise da integração entre Retrieval-Augmented Generation (RAG) e busca vetorial sob a perspectiva de eficiência computacional. O estudo avalia o desempenho das etapas de geração de embeddings, recuperação vetorial e geração de respostas por modelos de linguagem. A partir de um benchmarking simplificado, são avaliadas métricas de latência e custo do pipeline. Os resultados indicam que a recuperação vetorial apresenta baixa latência, enquanto a geração de texto concentra a maior parte do tempo de processamento.
Referências
Ji, Z.; Lee, N.; Frieske, R.; Yu, T.; Su, D.; Xu, Y.; Ishii, E.; Bang, Y.; Madotto, A.; Fung, P. (2023). Survey of Hallucination in Natural Language Generation. ACM Computing Surveys. Disponível em: [link]. Acesso em: 6 mar. 2026.
Johnson, J.; Douze, M.; Jégou, H. (2025). Faiss: A Library for Efficient Similarity Search and Clustering of Dense Vectors. arXiv. Disponível em: [link]. Acesso em: 7 mar. 2026.
ProbY. (2026). ProbY – Plataforma Inteligente de Problemas Globais. Disponível em: [link]. Acesso em: 6 mar. 2026.
Zhao, P.; Liu, Y.; Wang, H. (2026). Retrieval-Augmented Generation for AI-Generated Content. Springer. Disponível em: [link]. Acesso em: 5 mar. 2026.
