摘要
本说明书提供了一种信息生成和模型训练方法、装置、存储介质及设备。在此方法中,获取多轮对话中最新一轮对话的当前输入数据和至少一个历史轮次对话的历史对话数据;构建针对预先训练的问答模型的提示词;提示词中包含按时间顺序依次排列的历史对话数据和当前输入数据;将提示词输入问答模型,以使问答模型针对提示词中的每个token,若该token所在的输入文本为查询文本,则基于双向注意力机制确定该token对应的输出特征表示,若该token所在的输入文本为检索结果或答复信息,则基于单向注意力机制确定该token对应的输出特征表示,以及,根据提示词中的每个token对应的输出特征表示,生成最新一轮对话的答复信息。本方案提高了多轮对话的连贯性和答复信息的准确性。