摘要
本发明提供了一种基于BGRU及参考噪声的语音增强方法,包含以下网络结构:推理时,接受两路输入:参考噪声、带噪语音,两路噪声分别经过短时傅里叶变换编码器输入到增强网络模块,得到噪声估计和语音估计,将语音估计经过逆短时傅里叶变换得到降噪后的语音;训练时,接受四路输入:参考噪声、带噪语音、噪声真值、语音真值,四路噪声分别经过短时傅里叶变化编码器,编码后的参考噪声与带噪语音通过增强网络模块计算,得到噪声估计和语音估计;编码后的语音真值和噪声真值以及噪声估计和语音估计均送入3CL损失模块,计算得到损失后反馈给增强网络模块,调整参数,完善增强网络模块性能。本发明能在极低信噪比的条件下提高语音质量和可懂度。