一种面向数据中心场景的语音降噪方法、系统、终端及存储介质
申请号:CN202510883804
申请日期:2025-06-30
公开号:CN120564740A
公开日期:2025-08-29
类型:发明专利
摘要
本发明涉及语音降噪技术领域,具体涉及一种面向数据中心场景的语音降噪方法、系统、终端及存储介质,包括:对待降噪语音进行STFT时频变换,得到待降噪语音的复数频谱;采用多尺度CNN卷积神经网络,对所述复数频谱进行特征提取;使用双向长短期记忆网络LSTM对提取的特征进行时序建模;分离出时序建模后的特征中的语音特征;对分离出的语音特征进行混响抑制;对混响抑制后的语音特征进行逆STFT重建,得到降噪后的语音。本发明用于解决数据中心噪声时‑频‑空三维耦合难题。
技术关键词
双向长短期记忆网络
面向数据中心
语音降噪方法
多尺度
Sigmoid函数
输出端
滤波器
网络架构
语音降噪系统
积层
语音降噪技术
时序
场景
训练集
卷积神经网络提取
线性预测系数
语音特征提取
模块