摘要
本申请公开了一种数字人生成方法、装置、设备及存储介质,涉及数字人技术领域,包括:获取数字人音频,将数字人音频输入至预设Audio2Face模型中,得到预设Audio2Face模型输出的表情系数和头部姿态,Audio2Face模型用于根据输入的音频文件生成对应的表情系数和头部姿态;根据表情系数和头部姿态确定目标图像的颜色和透明度;基于目标图像的颜色和透明度渲染出目标图像,并根据渲染出的目标图像生成数字人。相对于现有的通过三维建模软件手工创建数字人模型的方式,本申请能够生成实时性高,人物画面质量高、表情丰富的数字人。