基于检索增强的生成式语言模型的训练方法、对话生成方法及装置
申请号:CN202510101063
申请日期:2025-01-22
公开号:CN120087475A
公开日期:2025-06-03
类型:发明专利
摘要
本发明公开了一种基于检索增强的生成式语言模型的训练方法、对话生成方法及装置,包括:对原始历史对话进行数据清洗,构建经过预训练的第一大语言模型和第二大语言模型,将清洗后的历史对话输入到第一大语言模型,生成对应的问题描述语句和回复语句;将问题描述语句和回复语句输入到第二大语言模型,生成对应的单条第一知识,再进行数据筛选,得到筛选后的数据;将数据库中检索到的n条第二知识与生成的单条第一知识构成每条高质量历史对话对应的n+1条知识,构建得到混合训练数据;利用混合训练数据训练生成式语言模型。本发明能够解决训练数据获取难度大,现有RAG系统回复不够准确等问题。
技术关键词
大语言模型
语句
对话生成方法
BERT模型
模型训练模块
多层感知机
数据处理模块
处理器
样本
训练装置
存储装置
可读存储介质
程序
电子设备
计算机