一种基于风格向量调控的高保真语音风格迁移方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于风格向量调控的高保真语音风格迁移方法
申请号:CN202511298157
申请日期:2025-09-11
公开号:CN120998176A
公开日期:2025-11-21
类型:发明专利
摘要
本发明涉及语音信号处理技术领域,具体涉及一种基于风格向量调控的高保真语音风格迁移方法,包括:获取待处理的原始语音信号,对语音信号进行数据预处理,得到待输入语音特征表示;构建并训练神经网络,得到训练好的端到端神经网络模型,作为风格迁移神经网络模型;所述风格迁移神经网络模型包括内容编码器、风格编码器、风格调控模块和解码器;将待输入语音特征表示输入到风格迁移神经网络模型中,得到高保真语音波形。本发明通过结合端到端神经网络和风格向量的精细化调控机制,实现高保真、稳定且可控的语音风格迁移。
技术关键词
语音风格迁移方法 神经网络模型 语音特征 编码器 解耦机制 损失函数设计 辅助分类器 解码器 训练神经网络 语音信号处理技术 调控单元 短时傅里叶变换 注意力机制 波形 自然语言 模板