Querying Databases with Natural Language: The use of Large Language Models for Text-to-SQL tasks

  • Eduardo Roger S. Nascimento Pontifícia Universidade Católica do Rio de Janeiro (PUC-Rio) http://orcid.org/0009-0005-3391-7813
  • Marco Antonio Casanova Pontifícia Universidade Católica do Rio de Janeiro (PUC-Rio)


A tarefa de Texto-para-SQL envolve a geração de consultas SQL com base em um banco de dados relacional e uma pergunta em Linguagem Natural (LN). Embora os Modelos de Linguagem Grandes (LLMs) apresentem bom desempenho em benchmarks conhecidos, eles são avaliados em bancos de dados com esquemas mais simples. Esta dissertação avalia inicialmente sua eficácia em um banco de dados complexo e disponível publicamente (Mondial) utilizando GPT-3.5 e GPT-4. Os resultados indicam que os modelos baseados em LLM têm desempenho inferior e dificuldades com a vinculação de esquemas e joins. Para melhorar a precisão, este trabalho propõe o uso de views e descrições de dados amigáveis para LLMs. Um segundo experimento, em um banco de dados do mundo real, confirma que essa abordagem aumenta a precisão na tarefa de Texto-para-SQL.

Palavras-chave: Text-to-SQL, Large Language Models, LangChain, GPT


NASCIMENTO, Eduardo Roger S.; CASANOVA, Marco Antonio. Querying Databases with Natural Language: The use of Large Language Models for Text-to-SQL tasks. In: CONCURSO DE TESES E DISSERTAÇÕES (CTDBD) - SIMPÓSIO BRASILEIRO DE BANCO DE DADOS (SBBD), 39. , 2024, Florianópolis/SC. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2024 . p. 196-201. DOI: https://doi.org/10.5753/sbbd_estendido.2024.240552.