基于大语言模型和门控机制的多任务NL2SQL方法及系统
申请号:CN202510436671
申请日期:2025-04-09
公开号:CN120316127A
公开日期:2025-07-15
类型:发明专利
摘要
本发明公开了基于大语言模型和门控机制的多任务NL2SQL方法及系统,属于自然语言处理技术领域,本发明要解决的技术问题为如何对查询文本进行深度语义解析,提高SQL语句生成的准确率,进而提升查询结果的匹配率,采用的技术方案为:获取查询文本及数据表结构以及相应SQL查询语句;设定SQL生成的多个训练学习任务及相关参数:根据SQL查询语句的示例,将总体任务分解为八个子任务;对查询文本内容S及数据表结构进行处理:将查询文本与表结构信息进行拼接获取拼接后的文本以及拼接后文本张量T的维度为RL,实现语义信息的融合;通过词嵌入层对文本张量T进行处理获取嵌入向量G;其中,G∈RL×E;E表示词嵌入的维度且E为正整数;搭建抽取框架Encoder层。
技术关键词
数据表结构
大语言模型
文本
多任务
深度学习训练方法
语句
机制
标签
样本
随机梯度下降
网络
文字特征
笛卡尔
语义
可读存储介质
处理器
标识
关系
参数