一种生成多会话对话的大语言模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种生成多会话对话的大语言模型
申请号:CN202411946785
申请日期:2024-12-27
公开号:CN119760096A
公开日期:2025-04-04
类型:发明专利
摘要
本发明提供一种生成多会话对话的大语言模型,包括原始大语言模型、VAE单元、LoRA单元和隐藏状态生成单元;VAE单元接收当前查询,或从对话历史中提取每轮对话中的查询,然后生成当前查询和对话历史对应的隐式向量表征,并将该隐式向量表征传送到隐藏状态生成单元;LoRA单元连接在原始大语言模型的每一层的输出之后,将每一层的输出叠加权重矩阵,然后将结果传送给隐藏状态生成单元;隐藏状态生成单元接收LoRA单元和VAE单元的输出以及原始大模型每一层的参数,将三者相加得到原始大语言模型每一层的新的隐藏状态。本发明可以生成和对话历史一致的回复,提升大语言模型的对话能力,可以丰富用户的对话体验并吸引用户的对话兴趣。
技术关键词
大语言模型 聊天机器人 参数 编码器 模块 矩阵 数据编码 传播算法 适配器 标签 兴趣 重构 文本 因子