基于多语言适配与个性化定制技术的数字人唇形合成系统
申请号:CN202510610163
申请日期:2025-05-13
公开号:CN120580326A
公开日期:2025-09-02
类型:发明专利
摘要
本发明公开了基于多语言适配与个性化定制技术的数字人唇形合成系统,属于数字人技术领域,包括多维信息获取模块和信息处理模块;本发明中,通过在内设置有唇部运动轨迹合成模块,该模块不仅能够对于音频进行唇形合成,同时能够将音频转换为文本信息,能够使得数字人能够针对于音频、文本进行唇形合成,同时,系统内还针对于方言语音进行了优化,使得数字人还能够识别方言,进行唇形合成,系统内设置有唇形动画生成模块,能够对于音频与唇形运动轨迹的时间戳进行一一对应,能够极大的保证音频与唇形的同步,提高数字人的真实度,同时系统内还提供个性化定制功能,用户能够根据自己的喜好对于数字人进行设定,提高了该系统的交互效果。
技术关键词
定制技术
多语言
输入端
唇形动画
信息处理模块
音频
机器深度学习
唇形特征
特征点
个性化定制功能
交互终端
面部特征
数据分类
测试模块
异常数据
虚拟现实设备
识别方言
计算机图形学
文本