一种基于风格向量调控的高保真语音风格迁移方法
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种基于风格向量调控的高保真语音风格迁移方法
申请号:
CN202511298157
申请日期:
2025-09-11
公开号:
CN120998176A
公开日期:
2025-11-21
类型:
发明专利
摘要
本发明涉及语音信号处理技术领域,具体涉及一种基于风格向量调控的高保真语音风格迁移方法,包括:获取待处理的原始语音信号,对语音信号进行数据预处理,得到待输入语音特征表示;构建并训练神经网络,得到训练好的端到端神经网络模型,作为风格迁移神经网络模型;所述风格迁移神经网络模型包括内容编码器、风格编码器、风格调控模块和解码器;将待输入语音特征表示输入到风格迁移神经网络模型中,得到高保真语音波形。本发明通过结合端到端神经网络和风格向量的精细化调控机制,实现高保真、稳定且可控的语音风格迁移。
技术关键词
语音风格迁移方法
神经网络模型
语音特征
编码器
解耦机制
损失函数设计
辅助分类器
解码器
训练神经网络
语音信号处理技术
调控单元
短时傅里叶变换
注意力机制
波形
自然语言
模板