一种语音驱动的动态三维人脸和动态纹理生成方法和系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种语音驱动的动态三维人脸和动态纹理生成方法和系统
申请号:CN202510201053
申请日期:2025-02-24
公开号:CN120125723A
公开日期:2025-06-10
类型:发明专利
摘要
本发明涉及三维人脸动画生成技术领域,尤其为一种语音驱动的动态三维人脸和动态纹理生成方法和系统,包括以下步骤:S1,训练两个独立的自编码器分别学习人脸几何和褶皱的变化原语,以实现将面部运动贴图和褶皱贴图压缩至低维的隐式特征;S2,基于编码器生成的隐式特征zw和zf,训练一个基于扩散模型的协同生成网络,在音频特征的引导下,从噪声输入中生成干净的隐式特征;S3,使用风格i的说话风格轴心特征pf,i来构建隐式面部运动特征,并使用风格j的褶皱风格轴心特征pw,j来构建隐式纹理变化特征。本发明可以有效解决现有的语音驱动人脸动画方法都无法同时生成与面部运动一致协调变化的动态纹理贴图,缺少这些重要的面部细节会降低人脸动画的真实感,甚至导致恐怖谷效应,影响动画效果的问题。
技术关键词
动态纹理生成方法 贴图 音频特征 风格 编码器 面部 褶皱 运动特征 大规模语音数据 动态人脸 纹理特征 人脸网格模型 噪声样本 轴心 三维人脸动画
系统为您推荐了相关专利信息
图像生成方法 客户端 方位角 蒸馏 服务器
三维分割方法 文本特征向量 跨模态 三维点云数据 网格特征
无人机红外图像 补丁 彩色图像 着色方法 语义结构
自动泊车控制方法 轨迹 图像 序列 生成训练数据
掩码矩阵 区域划分方法 身体 压力 元素