一种基于音素和面部姿态混合的语音口型同步系统

申请号：CN202410840152

申请日期：2024-06-26

公开号：CN119229843A

公开日期：2024-12-31

类型：发明专利

摘要

本发明公开了一种基于音素和面部姿态混合的语音口型同步系统，涉及计算机动画和语音合成领域，实现一种高效的文本到语音与口型同步技术，通过TTS服务，首先将文本转换为语音，并生成音素信息，随后根据语音的时长，精确计算每个音素峰值的时间点，设计师将预先准备每个音素对应的口型姿态，在两个音素之间逐步减少上一个音素的权重，同时增加下一个音素的权重，每个音素对应于虚幻引擎姿态资产中的一条曲线，通过动态调整音素权重来修改曲线值，从而生成最终的口型动画，此外通过面部动画蓝图，混合情绪值实现更逼真的面部表情，该方案在实时性和网络延迟方面表现卓越，所需的动画序列资产仅20个，相较于传统方案降低了资源消耗，提升了效率。

技术关键词

语音面部动画匹配模块文本差值算法分析工具资产语句计算机曲线数据发声序列动态元件网络资源

系统为您推荐了相关专利信息

一种基于机器学习的视觉语言模型构建方法

语言模型构建方法语言编码器屏幕视觉补丁

银行基层员工压力感知与行为调整方法

员工压力面部表情识别办公终端心理健康

基于长期记忆的检索增强生成方法、系统、电子设备及存储介质

答案生成方法大语言模型多层注意力机制构建算法

基于提示学习的多模态细粒度分子预训练模型的分子结构预测系统

预训练模型文本编码器分子多模态预测系统

一种基于AI的协作创新系统与智能可穿戴终端

可穿戴终端创新系统人机交互单元员工数据采集单元