摘要
本申请公开了一种基于大语言模型的数字人交互方法及装置。所述方法包括:客户端获取用户输入的待交互语音信息、待交互视频信息、待交互文本信息;通过经过训练的所述多模态压缩模型对待交互语音信息、待交互视频信息、待交互文本信息压缩后获取第一压缩信息并发送给云端;云端进行解压缩;云端获取经过训练的大语言模型;云端将所述原始的待交互语音信息、原始的待交互视频信息、原始的待交互文本信息输入至经过训练的大语言模型中从而获取回复信息以及回复视频信息;云端将获取的回复信息以及回复视频信息通过所述云端多模态压缩模型进行压缩从而获取第二压缩信息;云端将第二压缩信息发送给所述客户端。