一种语音驱动的动态三维人脸和动态纹理生成方法和系统

申请号：CN202510201053

申请日期：2025-02-24

公开号：CN120125723A

公开日期：2025-06-10

类型：发明专利

摘要

本发明涉及三维人脸动画生成技术领域，尤其为一种语音驱动的动态三维人脸和动态纹理生成方法和系统，包括以下步骤：S1，训练两个独立的自编码器分别学习人脸几何和褶皱的变化原语，以实现将面部运动贴图和褶皱贴图压缩至低维的隐式特征；S2，基于编码器生成的隐式特征zw和zf，训练一个基于扩散模型的协同生成网络，在音频特征的引导下，从噪声输入中生成干净的隐式特征；S3，使用风格i的说话风格轴心特征pf,i来构建隐式面部运动特征，并使用风格j的褶皱风格轴心特征pw,j来构建隐式纹理变化特征。本发明可以有效解决现有的语音驱动人脸动画方法都无法同时生成与面部运动一致协调变化的动态纹理贴图，缺少这些重要的面部细节会降低人脸动画的真实感，甚至导致恐怖谷效应，影响动画效果的问题。

技术关键词

动态纹理生成方法贴图音频特征风格编码器面部褶皱运动特征大规模语音数据动态人脸纹理特征人脸网格模型噪声样本轴心三维人脸动画

系统为您推荐了相关专利信息

一种基于联邦角度感知生成扩散模型的遥感图像生成方法

图像生成方法客户端方位角蒸馏服务器

基于跨模态空间超点的人车交互三维分割方法

三维分割方法文本特征向量跨模态三维点云数据网格特征

一种基于拓扑语义结构损失的无人机红外图像着色方法

无人机红外图像补丁彩色图像着色方法语义结构

自动泊车控制方法、装置及车辆

自动泊车控制方法轨迹图像序列生成训练数据

一种基于智能床垫的身体区域划分方法及设备

掩码矩阵区域划分方法身体压力元素