基于大语言模型生成多轮Text-to-SQL的方法及系统
申请号:CN202510239022
申请日期:2025-03-03
公开号:CN120196647A
公开日期:2025-06-24
类型:发明专利
摘要
本发明公开了一种基于大语言模型生成多轮Text‑to‑SQL的方法及系统,方法包括采用原始数据集中的SQL作为增强SQL参照的目标SQL,用于引导大语言模型生成逐步趋于目标SQL的问答对;设定n轮问答,每轮随机组合问答类型和上下文关联类型,生成多样化且具有上下文关联关系的多轮问答内容;在每轮问答过程中,大语言模型根据数据库模式以及目标SQL生成各种类型的随机问答,针对可回答的问题,大语言模型生成多个问题及相应的SQL回答,并通过数据库执行校验,保留可执行且结果非空的回答,以此生成多个问答对。本发明方法通过引导大语言模型生成多轮问答内容,以逐步接近目标SQL,提升数据质量和多样性。
技术关键词
大语言模型
自然语言
处理器
模块
可读存储介质
模式
关系
存储器
计算机
样本
电子设备
指令
程序
数据