摘要
一种基于大语言模型的文本到结构化查询语言转换方法,包括:裁剪数据库纲要信息,通过相关性评分和斯坦纳树问题求解,消除非目标结构化查询语言SQL查询所需的表和列;筛选上下文样例,利用交叉编码器语言模型预测文本到结构化查询语言Text‑to‑SQL相似性得分,选出与查询问题最相关的样例;将裁剪后的数据库表和列信息及筛选出的上下文样例注入提示词模板,使用大语言模型生成SQL查询语句。本发明可用于优化自然语言到SQL的自动转换过程,提高其转换准确率,用于为非SQL使用者提供快捷方便的数据库检索机制,及为大语言模型检索增强生成RAG等机制提供更广泛形式的数据接入方式等应用。