一种基于双向门控神经网络及参考噪声的语音增强方法

申请号：CN202510028428

申请日期：2025-01-08

公开号：CN119811405B

公开日期：2025-12-05

类型：发明专利

摘要

本发明提供了一种基于BGRU及参考噪声的语音增强方法，包含以下网络结构：推理时，接受两路输入：参考噪声、带噪语音，两路噪声分别经过短时傅里叶变换编码器输入到增强网络模块，得到噪声估计和语音估计，将语音估计经过逆短时傅里叶变换得到降噪后的语音；训练时，接受四路输入：参考噪声、带噪语音、噪声真值、语音真值，四路噪声分别经过短时傅里叶变化编码器，编码后的参考噪声与带噪语音通过增强网络模块计算，得到噪声估计和语音估计；编码后的语音真值和噪声真值以及噪声估计和语音估计均送入3CL损失模块，计算得到损失后反馈给增强网络模块，调整参数，完善增强网络模块性能。本发明能在极低信噪比的条件下提高语音质量和可懂度。

技术关键词

门控神经网络短时傅里叶变换语音网络模块解码器信号噪声提取傅里叶变换处理记忆输入模块编码器模块计算机可读取存储介质注意力机制线性输出模块处理器