一种生成多会话对话的大语言模型

申请号：CN202411946785

申请日期：2024-12-27

公开号：CN119760096A

公开日期：2025-04-04

类型：发明专利

摘要

本发明提供一种生成多会话对话的大语言模型，包括原始大语言模型、VAE单元、LoRA单元和隐藏状态生成单元；VAE单元接收当前查询，或从对话历史中提取每轮对话中的查询，然后生成当前查询和对话历史对应的隐式向量表征，并将该隐式向量表征传送到隐藏状态生成单元；LoRA单元连接在原始大语言模型的每一层的输出之后，将每一层的输出叠加权重矩阵，然后将结果传送给隐藏状态生成单元；隐藏状态生成单元接收LoRA单元和VAE单元的输出以及原始大模型每一层的参数，将三者相加得到原始大语言模型每一层的新的隐藏状态。本发明可以生成和对话历史一致的回复，提升大语言模型的对话能力，可以丰富用户的对话体验并吸引用户的对话兴趣。

技术关键词

大语言模型聊天机器人参数编码器模块矩阵数据编码传播算法适配器标签兴趣重构文本因子