大语言模型微调及基于大语言模型的文本处理方法及设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
大语言模型微调及基于大语言模型的文本处理方法及设备
申请号:CN202411818936
申请日期:2024-12-10
公开号:CN119961281A
公开日期:2025-05-09
类型:发明专利
摘要
本申请涉及数据处理技术领域,尤其涉及大语言模型微调及基于大语言模型的文本处理方法及设备。在微调阶段,基于大语言模型增量微调技术,基于行业知识构建数据集,基于该数据集对大语言模型进行第一次微调,得到学习到了行业知识的中间大语言模型。基于用于学习text2sql能力的指令数据,对中间大语言模型进行text2sql任务增量微调,微调后的收敛模型即为最终微调得到的大语言模型,使得最终微调后的大语言模型能够基于行业知识进行文本处理。在推理阶段,电子设备召回与待处理文本相关的表数据和目标行业知识,并基于该表数据和目标行业知识构建prompt,能够更加准确的生成sql语句,提升text2sql的准确率。
技术关键词
大语言模型 文本处理方法 字段 微调方法 结构化查询语句 结构化查询语言 收敛模型 微调技术 电子设备 模板 数据处理技术 业务表 指令 存储器 处理器 算法 阶段