一种基于大语言模型的私有领域Text-to-SQL方法及系统
申请号:CN202411650036
申请日期:2024-11-19
公开号:CN119646028A
公开日期:2025-03-18
类型:发明专利
摘要
本申请公开了一种基于大语言模型的私有领域Text‑to‑SQL方法及系统,涉及自然语言处理技术,包括:获取原始查询语句;基于提取查询语句的第一Prompt,利用第一大模型提取原始查询语句中的关键语义成分,并进行语义增强;根据语义增强的结果,基于预设用于问答的第二Prompt,利用第二大模型生成SQL的第一问答对;根据语义增强的结果,基于预设用于问答的第三Prompt,利用第一大模型生成包含查询局部信息的第二问答对;基于第一问答对以及第二问答对作为训练集,对第三大模型执行训练。本申请通过知识蒸馏将大语言模型在Text‑to‑SQL任务中的优势高效传递给私有领域应用的小型模型,从而构建高效、低成本、高性能的私有领域Text‑to‑SQL模型。
技术关键词
原始查询语句
大语言模型
语义
上下文查询
训练集
自然语言
同义词
存储器
处理器
高性能
低成本
数据
蒸馏
文本
格式