一种面向数据中心场景的语音降噪方法、系统、终端及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种面向数据中心场景的语音降噪方法、系统、终端及存储介质
申请号:CN202510883804
申请日期:2025-06-30
公开号:CN120564740A
公开日期:2025-08-29
类型:发明专利
摘要
本发明涉及语音降噪技术领域,具体涉及一种面向数据中心场景的语音降噪方法、系统、终端及存储介质,包括:对待降噪语音进行STFT时频变换,得到待降噪语音的复数频谱;采用多尺度CNN卷积神经网络,对所述复数频谱进行特征提取;使用双向长短期记忆网络LSTM对提取的特征进行时序建模;分离出时序建模后的特征中的语音特征;对分离出的语音特征进行混响抑制;对混响抑制后的语音特征进行逆STFT重建,得到降噪后的语音。本发明用于解决数据中心噪声时‑频‑空三维耦合难题。
技术关键词
双向长短期记忆网络 面向数据中心 语音降噪方法 多尺度 Sigmoid函数 输出端 滤波器 网络架构 语音降噪系统 积层 语音降噪技术 时序 场景 训练集 卷积神经网络提取 线性预测系数 语音特征提取 模块
系统为您推荐了相关专利信息
缺陷视觉检测方法 直方图均衡化 焊点缺陷 多尺度特征 编码器
医学影像数据 医疗知识图谱 双向长短期记忆网络 标注系统 特征提取模块
多层感知机 模块 多尺度特征 绝缘子装置 通道注意力机制
监测方法 点云 载荷 岩石力学研究 裂纹扩展速率
自动分类方法 影像 多尺度特征提取 多光谱 滑动窗口技术