基于检索增强的生成式语言模型的训练方法、对话生成方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于检索增强的生成式语言模型的训练方法、对话生成方法及装置
申请号:CN202510101063
申请日期:2025-01-22
公开号:CN120087475A
公开日期:2025-06-03
类型:发明专利
摘要
本发明公开了一种基于检索增强的生成式语言模型的训练方法、对话生成方法及装置,包括:对原始历史对话进行数据清洗,构建经过预训练的第一大语言模型和第二大语言模型,将清洗后的历史对话输入到第一大语言模型,生成对应的问题描述语句和回复语句;将问题描述语句和回复语句输入到第二大语言模型,生成对应的单条第一知识,再进行数据筛选,得到筛选后的数据;将数据库中检索到的n条第二知识与生成的单条第一知识构成每条高质量历史对话对应的n+1条知识,构建得到混合训练数据;利用混合训练数据训练生成式语言模型。本发明能够解决训练数据获取难度大,现有RAG系统回复不够准确等问题。
技术关键词
大语言模型 语句 对话生成方法 BERT模型 模型训练模块 多层感知机 数据处理模块 处理器 样本 训练装置 存储装置 可读存储介质 程序 电子设备 计算机