Análise Comparativa de LLMs na Otimização de Índices em Banco de Dados: Um Estudo com GPT-4, Claude 3.7 Sonnet e Gemini 2.0 Flash

  • Daniel Costa IFPB
  • Danyllo Albuquerque IFPB
  • Bruno Moreno IFPB

Resumo


Este estudo apresenta uma análise comparativa entre três Grandes Modelos de Linguagem (LLMs) — GPT-4, Claude 3.7 Sonnet e Gemini 2.0 Flash — com foco em sua capacidade de sugerir índices para otimização de desempenho em bancos de dados relacionais. Utilizando um sistema PostgreSQL hospedado no Supabase, foram aplicadas sugestões de indexação fornecidas por cada modelo e avaliados os tempos de execução de um conjunto padronizado de consultas SQL. Os resultados demonstraram que, embora todos os modelos tenham gerado recomendações válidas, apenas o GPT-4 apresentou impacto mínimo sobre o desempenho, com o menor acréscimo médio de tempo (+0.097ms). Claude 3.7 Sonnet obteve desempenho intermediário (+0.102ms), incluindo sugestões adicionais como constraints, enquanto o Gemini 2.0 Flash apresentou o maior overhead (+0.149ms), indicando menor eficácia prática. A pesquisa contribui para a compreensão do uso de LLMs como ferramentas auxiliares na engenharia de dados, fornecendo evidências empíricas sobre sua aplicabilidade e limitações em cenários de otimização automatizada de bancos de dados.

Referências

Date, C. J. (2004). Introdução a sistemas de bancos de dados. Elsevier Brasil.

de Menezes, I. V. C. B., de Oliveira Barbosa, L. S., and Garzon, N. A. (2023). Aplicações de inteligência artificial na otimização de banco de dados. RECIMA21-Revista Científica Multidisciplinar-ISSN 2675-6218, 4(12):e4124516–e4124516.

Heuser, C. A. (2009). Projeto de banco de dados, volume 6. Bookman Porto Alegre.

Hong, Z., Yuan, Z., Zhang, Q., Chen, H., Dong, J., Huang, F., and Huang, X. (2024). Next-generation database interfaces: A survey of llm-based text-to-sql. arXiv preprint arXiv:2406.08426.

Jingru Gan, Peichen Zhong, Y. D. Y. Z. C. D. H. W. C. P. G. K. A. P. D. S.-K. W. W. (2025). Large language models are innate crystal structure generators. arXiv:2502.20933.

Pereira, P. C. (2021). Introdução a banco de dados. São Paulo: Editora Senac.

Sriram Dharwada, Himanshu Devrani, J. H. H. D. (2025). Query rewriting via llms. arXiv:2502.12918.

Tan, J., Zhao, K., Li, R., Yu, J. X., Piao, C., Cheng, H., Meng, H., Zhao, D., and Rong, Y. (2025). Can large language models be query optimizer for relational databases? arXiv preprint arXiv:2502.05562.

Yao, Y., Duan, J., Xu, K., Cai, Y., Sun, Z., and Zhang, Y. (2024). A survey on large language model (llm) security and privacy: The good, the bad, and the ugly. High-Confidence Computing, page 100211.

Zhou, X., Sun, Z., and Li, G. (2024). Db-gpt: Large language model meets database. Data Science and Engineering, 9(1):102–111.
Publicado
20/07/2025
COSTA, Daniel; ALBUQUERQUE, Danyllo; MORENO, Bruno. Análise Comparativa de LLMs na Otimização de Índices em Banco de Dados: Um Estudo com GPT-4, Claude 3.7 Sonnet e Gemini 2.0 Flash. In: ENCONTRO NACIONAL DE COMPUTAÇÃO DOS INSTITUTOS FEDERAIS (ENCOMPIF), 12. , 2025, Maceió/AL. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2025 . p. 131-138. ISSN 2763-8766. DOI: https://doi.org/10.5753/encompif.2025.9369.