一种基于声学模型和声码器解耦架构的高效训练及高表现力语音转换模型

申请号：CN202510815121

申请日期：2025-06-18

公开号：CN120636425A

公开日期：2025-09-12

类型：发明专利

摘要

本发明公开了一种基于声学模型和声码器解耦架构的高效训练及高表现力语音转换模型，包括声学模型和声码器；所述声学模型包括说话人编码器、内容编码器、归一化流、后验编码器、梅尔解码器和判别器。优点是：在提高语音转换模型训练效率、音质表现、情感表达与交互控制等方面均实现了显著技术突破，为高质量、可控性强的语音合成系统提供了全新解决方案，具备良好的实用价值与产业应用前景。

技术关键词

解码器编码器音频局部结构特征数据变量自然语音线性声码器指数发音风格参数时序算法频率

系统为您推荐了相关专利信息

一种小麦玉米轮作水肥决策控制终端

小麦玉米决策控制模块水肥无人机监控数据传输模块

一种光伏面板表面缺陷识别和分类方法及系统

光伏面板纹理特征卷积神经网络模型分类方法初始聚类中心

一种基于随机森林模型的农作物精细分类方法

归一化植被指数农作物精细分类方法随机森林模型 NDVI时间序列谐波

基于时间片的车站客流仿真方法、系统、设备和存储介质

时间片轮转调度环境设备构建轨道交通仿真方法场景

一种基于电动进给钻设备的控制方法及系统

伺服驱动器令牌桶算法节点刀具脉冲