一种基于声学模型和声码器解耦架构的高效训练及高表现力语音转换模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于声学模型和声码器解耦架构的高效训练及高表现力语音转换模型
申请号:CN202510815121
申请日期:2025-06-18
公开号:CN120636425A
公开日期:2025-09-12
类型:发明专利
摘要
本发明公开了一种基于声学模型和声码器解耦架构的高效训练及高表现力语音转换模型,包括声学模型和声码器;所述声学模型包括说话人编码器、内容编码器、归一化流、后验编码器、梅尔解码器和判别器。优点是:在提高语音转换模型训练效率、音质表现、情感表达与交互控制等方面均实现了显著技术突破,为高质量、可控性强的语音合成系统提供了全新解决方案,具备良好的实用价值与产业应用前景。
技术关键词
解码器 编码器 音频 局部结构特征 数据 变量 自然语音 线性 声码器 指数 发音 风格 参数 时序 算法 频率
系统为您推荐了相关专利信息
小麦玉米 决策控制模块 水肥 无人机监控 数据传输模块
光伏面板 纹理特征 卷积神经网络模型 分类方法 初始聚类中心
归一化植被指数 农作物精细分类方法 随机森林模型 NDVI时间序列 谐波
时间片轮转调度 环境设备 构建轨道交通 仿真方法 场景
伺服驱动器 令牌桶算法 节点 刀具 脉冲