一种信息生成和模型训练方法、装置、存储介质及设备

申请号：CN202510585936

申请日期：2025-05-07

公开号：CN120633826A

公开日期：2025-09-12

类型：发明专利

摘要

本说明书提供了一种信息生成和模型训练方法、装置、存储介质及设备。在此方法中，获取多轮对话中最新一轮对话的当前输入数据和至少一个历史轮次对话的历史对话数据；构建针对预先训练的问答模型的提示词；提示词中包含按时间顺序依次排列的历史对话数据和当前输入数据；将提示词输入问答模型，以使问答模型针对提示词中的每个token，若该token所在的输入文本为查询文本，则基于双向注意力机制确定该token对应的输出特征表示，若该token所在的输入文本为检索结果或答复信息，则基于单向注意力机制确定该token对应的输出特征表示，以及，根据提示词中的每个token对应的输出特征表示，生成最新一轮对话的答复信息。本方案提高了多轮对话的连贯性和答复信息的准确性。

技术关键词

问答模型输出特征双向注意力机制文本多轮对话模型训练方法数据信息生成方法信息生成装置模型训练装置处理器指令计算机程序产品输入模块可读存储介质偏差电子设备