一种基于大语言模型的私有领域Text-to-SQL方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于大语言模型的私有领域Text-to-SQL方法及系统
申请号:CN202411650036
申请日期:2024-11-19
公开号:CN119646028A
公开日期:2025-03-18
类型:发明专利
摘要
本申请公开了一种基于大语言模型的私有领域Text‑to‑SQL方法及系统,涉及自然语言处理技术,包括:获取原始查询语句;基于提取查询语句的第一Prompt,利用第一大模型提取原始查询语句中的关键语义成分,并进行语义增强;根据语义增强的结果,基于预设用于问答的第二Prompt,利用第二大模型生成SQL的第一问答对;根据语义增强的结果,基于预设用于问答的第三Prompt,利用第一大模型生成包含查询局部信息的第二问答对;基于第一问答对以及第二问答对作为训练集,对第三大模型执行训练。本申请通过知识蒸馏将大语言模型在Text‑to‑SQL任务中的优势高效传递给私有领域应用的小型模型,从而构建高效、低成本、高性能的私有领域Text‑to‑SQL模型。
技术关键词
原始查询语句 大语言模型 语义 上下文查询 训练集 自然语言 同义词 存储器 处理器 高性能 低成本 数据 蒸馏 文本 格式