基于多模态特征动态融合的数字人语音口型同步控制系统

申请号：CN202510806848

申请日期：2025-06-17

公开号：CN120319262B

公开日期：2025-08-19

类型：发明专利

摘要

本发明涉及语音识别控制技术领域，具体为基于多模态特征动态融合的数字人语音口型同步控制系统，包括获取用户的历史讲话数据；对历史讲话数据进行特征识别，得到历史语音特征和历史口型特征，构建得到个性化语音档案；并基于历史语音特征和历史口型特征构建得到语音映射模型；接收用户输入的数据，得到第一数据；基于第一数据进行特征识别，得到第一数据特征；基于语音映射模型和第一数据特征生成第二数据；构建映射校正模型对第二数据进行校正，输出第三控制参数。本发明通过第三控制参数实现数字人语音口型的同步控制。

技术关键词

语音特征同步控制系统个性化语音多模态特征异常数据数据输出模块语音识别控制技术校正动态三维运动轨迹韵律模式数据输入模块深度学习网络联动规则声学特征视频发音