一种提升合成音频自然度以及降噪的方法
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种提升合成音频自然度以及降噪的方法
申请号:
CN202510003560
申请日期:
2025-01-02
公开号:
CN119785762B
公开日期:
2025-09-16
类型:
发明专利
摘要
本发明涉及一种提升合成音频自然度以及降噪的方法,包括以下步骤:步骤1,构建音素编码器,步骤2,构建方差适配器,步骤3,构建频谱降噪器,实现提升合成音频自然度以及降噪;该方案提出在音素编码器阶段,加入基于Transformer的双向编码器,能够利用较少的训练资源,完成语音合成模型的训练;本发明首次将具有选择性状态空间的线性时间序列建模用于语音合成任务,借助于小波分解在图像去噪领域的应用,将其引入语音合成网络,成功地减少了生成音频的噪声。
技术关键词
编码器
音频
适配器
深度学习模型
维基百科
时间序列模型
降噪器
符号
线性
生成训练样本
语音
数据
状态空间模型
前馈神经网络
文本
处理器
注意力机制
计算机