数字人生成方法、装置、设备及存储介质

申请号：CN202410869883

申请日期：2024-07-01

公开号：CN118411452B

公开日期：2024-09-24

类型：发明专利

摘要

本申请公开了一种数字人生成方法、装置、设备及存储介质，涉及数字人技术领域，包括：获取数字人音频，将数字人音频输入至预设Audio2Face模型中，得到预设Audio2Face模型输出的表情系数和头部姿态，Audio2Face模型用于根据输入的音频文件生成对应的表情系数和头部姿态；根据表情系数和头部姿态确定目标图像的颜色和透明度；基于目标图像的颜色和透明度渲染出目标图像，并根据渲染出的目标图像生成数字人。相对于现有的通过三维建模软件手工创建数字人模型的方式，本申请能够生成实时性高，人物画面质量高、表情丰富的数字人。

技术关键词

音频特征透明度生成方法生成数字人图像颜色生成装置三维建模软件样本数据分割算法生成设备参数处理器模块可读存储介质网络存储器