一种基于音素和面部姿态混合的语音口型同步系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于音素和面部姿态混合的语音口型同步系统
申请号:CN202410840152
申请日期:2024-06-26
公开号:CN119229843A
公开日期:2024-12-31
类型:发明专利
摘要
本发明公开了一种基于音素和面部姿态混合的语音口型同步系统,涉及计算机动画和语音合成领域,实现一种高效的文本到语音与口型同步技术,通过TTS服务,首先将文本转换为语音,并生成音素信息,随后根据语音的时长,精确计算每个音素峰值的时间点,设计师将预先准备每个音素对应的口型姿态,在两个音素之间逐步减少上一个音素的权重,同时增加下一个音素的权重,每个音素对应于虚幻引擎姿态资产中的一条曲线,通过动态调整音素权重来修改曲线值,从而生成最终的口型动画,此外通过面部动画蓝图,混合情绪值实现更逼真的面部表情,该方案在实时性和网络延迟方面表现卓越,所需的动画序列资产仅20个,相较于传统方案降低了资源消耗,提升了效率。
技术关键词
语音 面部 动画 匹配模块 文本 差值算法 分析工具 资产 语句 计算机 曲线 数据 发声 序列 动态 元件 网络 资源
系统为您推荐了相关专利信息
语言模型构建方法 语言编码器 屏幕 视觉 补丁
员工 压力 面部表情识别 办公终端 心理健康
答案 生成方法 大语言模型 多层注意力机制 构建算法
预训练模型 文本编码器 分子 多模态 预测系统
可穿戴终端 创新系统 人机交互单元 员工 数据采集单元