一种基于大语言模型的数字人交互方法及装置

申请号：CN202411941771

申请日期：2024-12-26

公开号：CN119961429A

公开日期：2025-05-09

类型：发明专利

摘要

本申请公开了一种基于大语言模型的数字人交互方法及装置。所述方法包括：客户端获取用户输入的待交互语音信息、待交互视频信息、待交互文本信息；通过经过训练的所述多模态压缩模型对待交互语音信息、待交互视频信息、待交互文本信息压缩后获取第一压缩信息并发送给云端；云端进行解压缩；云端获取经过训练的大语言模型；云端将所述原始的待交互语音信息、原始的待交互视频信息、原始的待交互文本信息输入至经过训练的大语言模型中从而获取回复信息以及回复视频信息；云端将获取的回复信息以及回复视频信息通过所述云端多模态压缩模型进行压缩从而获取第二压缩信息；云端将第二压缩信息发送给所述客户端。

技术关键词

交互视频人交互方法大语言模型客户端节点语义语音多模态云端检验器特征提取器交互装置文本信息提取联合损失函数融合特征输入解码器图谱