3D头部动画生成方法、装置、计算机设备和存储介质

申请号：CN202510855961

申请日期：2025-06-24

公开号：CN120782925A

公开日期：2025-10-14

类型：发明专利

摘要

本申请提供了一种3D头部动画生成方法、装置、计算机设备和存储介质，涉及动画、金融科技及医疗健康领域。该方法包括：获取第一说话者的第一视频样本数据，基于第一视频样本数据获取头部图像和音频数据；基于头部图像和音频数据进行模型训练生成头部动画生成模型；获取目标说话者的视频数据，将视频数据输入至头部动画生成模型输出针对目标说话者的3D头部动画；头部动画生成模型包括音频编码器、自回归音素解码器以及可适应运动解码器，音频编码器提取音频数据的音频特征，自回归音素解码器基于音频特征生成与第一说话者的语音特性无关的音素特征序列，可适应运动解码器根据音素特征序列生成符合第一说话者的个性化特征的头部运动信息。

技术关键词

个性化特征音频特征音频编码器动画生成方法解码器顶点视频数据样本网格序列计算机设备运动交叉注意力机制图像融合特征模型训练模块医疗健康