基于多模态特征动态融合的数字人语音口型同步控制系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于多模态特征动态融合的数字人语音口型同步控制系统
申请号:CN202510806848
申请日期:2025-06-17
公开号:CN120319262B
公开日期:2025-08-19
类型:发明专利
摘要
本发明涉及语音识别控制技术领域,具体为基于多模态特征动态融合的数字人语音口型同步控制系统,包括获取用户的历史讲话数据;对历史讲话数据进行特征识别,得到历史语音特征和历史口型特征,构建得到个性化语音档案;并基于历史语音特征和历史口型特征构建得到语音映射模型;接收用户输入的数据,得到第一数据;基于第一数据进行特征识别,得到第一数据特征;基于语音映射模型和第一数据特征生成第二数据;构建映射校正模型对第二数据进行校正,输出第三控制参数。本发明通过第三控制参数实现数字人语音口型的同步控制。
技术关键词
语音特征 同步控制系统 个性化语音 多模态特征 异常数据 数据输出模块 语音识别控制技术 校正 动态 三维运动轨迹 韵律模式 数据输入模块 深度学习网络 联动规则 声学特征 视频 发音