大语言模型微调及基于大语言模型的文本处理方法及设备

申请号：CN202411818936

申请日期：2024-12-10

公开号：CN119961281A

公开日期：2025-05-09

类型：发明专利

摘要

本申请涉及数据处理技术领域，尤其涉及大语言模型微调及基于大语言模型的文本处理方法及设备。在微调阶段，基于大语言模型增量微调技术，基于行业知识构建数据集，基于该数据集对大语言模型进行第一次微调，得到学习到了行业知识的中间大语言模型。基于用于学习text2sql能力的指令数据，对中间大语言模型进行text2sql任务增量微调，微调后的收敛模型即为最终微调得到的大语言模型，使得最终微调后的大语言模型能够基于行业知识进行文本处理。在推理阶段，电子设备召回与待处理文本相关的表数据和目标行业知识，并基于该表数据和目标行业知识构建prompt，能够更加准确的生成sql语句，提升text2sql的准确率。

技术关键词

大语言模型文本处理方法字段微调方法结构化查询语句结构化查询语言收敛模型微调技术电子设备模板数据处理技术业务表指令存储器处理器算法阶段