一种基于双向门控神经网络及参考噪声的语音增强方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于双向门控神经网络及参考噪声的语音增强方法
申请号:CN202510028428
申请日期:2025-01-08
公开号:CN119811405B
公开日期:2025-12-05
类型:发明专利
摘要
本发明提供了一种基于BGRU及参考噪声的语音增强方法,包含以下网络结构:推理时,接受两路输入:参考噪声、带噪语音,两路噪声分别经过短时傅里叶变换编码器输入到增强网络模块,得到噪声估计和语音估计,将语音估计经过逆短时傅里叶变换得到降噪后的语音;训练时,接受四路输入:参考噪声、带噪语音、噪声真值、语音真值,四路噪声分别经过短时傅里叶变化编码器,编码后的参考噪声与带噪语音通过增强网络模块计算,得到噪声估计和语音估计;编码后的语音真值和噪声真值以及噪声估计和语音估计均送入3CL损失模块,计算得到损失后反馈给增强网络模块,调整参数,完善增强网络模块性能。本发明能在极低信噪比的条件下提高语音质量和可懂度。
技术关键词
门控神经网络 短时傅里叶变换 语音 网络模块 解码器 信号 噪声提取 傅里叶变换处理 记忆 输入模块 编码器模块 计算机可读取存储介质 注意力机制 线性 输出模块 处理器