一种基于渐进式跳跃连接的扩散模型语音增强方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于渐进式跳跃连接的扩散模型语音增强方法
申请号:CN202510404705
申请日期:2025-04-01
公开号:CN120260600A
公开日期:2025-07-04
类型:发明专利
摘要
本发明公开了人工智能技术领域,具体涉及一种基于渐进式跳跃连接的扩散模型语音增强方法,以含噪语音和随机采样的标准高斯噪声作为输入,按照设定时间步,利用语音预测器进行采样,得到干净语音;语音预测器包括若干依次设置的残差层;将含噪语音嵌入经投影模块和跳跃连接系数调节得到的条件信息投影至各残差层。本发明将作为条件信息的含躁语音通过跳跃连接输入到语音预测期的各残差层,避免了随着网络深度增加和训练过程中条件信息的优先级被降低,从而有效解决了扩散模型语音增强方法中条件崩溃的问题,并有效提高语音增强的稳定性,增强了泛化能力。
技术关键词
语音 投影模块 深度神经网络 噪声 网络深度 人工智能技术 残差模块 采样方法 积层 编码 阶段 参数