一种面向数据中心场景的语音降噪方法、系统、终端及存储介质

申请号：CN202510883804

申请日期：2025-06-30

公开号：CN120564740A

公开日期：2025-08-29

类型：发明专利

摘要

本发明涉及语音降噪技术领域，具体涉及一种面向数据中心场景的语音降噪方法、系统、终端及存储介质，包括：对待降噪语音进行STFT时频变换，得到待降噪语音的复数频谱；采用多尺度CNN卷积神经网络，对所述复数频谱进行特征提取；使用双向长短期记忆网络LSTM对提取的特征进行时序建模；分离出时序建模后的特征中的语音特征；对分离出的语音特征进行混响抑制；对混响抑制后的语音特征进行逆STFT重建，得到降噪后的语音。本发明用于解决数据中心噪声时‑频‑空三维耦合难题。

技术关键词

双向长短期记忆网络面向数据中心语音降噪方法多尺度 Sigmoid函数输出端滤波器网络架构语音降噪系统积层语音降噪技术时序场景训练集卷积神经网络提取线性预测系数语音特征提取模块

系统为您推荐了相关专利信息

一种芯片缺陷视觉检测方法

缺陷视觉检测方法直方图均衡化焊点缺陷多尺度特征编码器

一种基于AI的医学影像自动分割与标注系统

医学影像数据医疗知识图谱双向长短期记忆网络标注系统特征提取模块

基于改进YOLOv8模型的绝缘子缺陷检测方法

多层感知机模块多尺度特征绝缘子装置通道注意力机制

基于三维扫描的锚注节理剪切破坏演化监测方法及系统

监测方法点云载荷岩石力学研究裂纹扩展速率

一种复杂场景下多模态遥感数据自动分类方法

自动分类方法影像多尺度特征提取多光谱滑动窗口技术