一种基于局部风格编码器的语音驱动三维人体运动方法
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种基于局部风格编码器的语音驱动三维人体运动方法
申请号:
CN202511414903
申请日期:
2025-09-30
公开号:
CN120894473A
公开日期:
2025-11-04
类型:
发明专利
摘要
本发明公开了一种基于局部风格编码器的语音驱动三维人体运动方法,涉及一般的图像数据处理或产生,包括语音驱动风格化三维人体运动整体模型构建步骤和具有参考风格的三维人体运动网络输出步骤,语音驱动风格化三维人体运动整体模型通过局部风格编码器提取局部感知风格特征,并从语音中提取语义、韵律和情感特征。将这些多种条件注入到部分感知扩散模型中,通过参考运动风格和语音信息,合成具有参考风格的三维人体运动。本发明能够合成具有参考风格的三维人体运动,显著提升生成的三维运动序列的自然性和表现力。
技术关键词
三维人体运动
运动特征
风格
情感特征
韵律特征
语义特征
运动编码器
样本
序列
梯度下降法
图像数据处理
网格
注意力
语音编码
网络
表达式