一种基于声学模型和声码器解耦架构的高效训练及高表现力语音转换模型
申请号:CN202510815121
申请日期:2025-06-18
公开号:CN120636425A
公开日期:2025-09-12
类型:发明专利
摘要
本发明公开了一种基于声学模型和声码器解耦架构的高效训练及高表现力语音转换模型,包括声学模型和声码器;所述声学模型包括说话人编码器、内容编码器、归一化流、后验编码器、梅尔解码器和判别器。优点是:在提高语音转换模型训练效率、音质表现、情感表达与交互控制等方面均实现了显著技术突破,为高质量、可控性强的语音合成系统提供了全新解决方案,具备良好的实用价值与产业应用前景。
技术关键词
解码器
编码器
音频
局部结构特征
数据
变量
自然语音
线性
声码器
指数
发音
风格
参数
时序
算法
频率