基于混合DSP深度学习方法的实时全频带语音降噪增强方法
申请号:CN202510306980
申请日期:2025-03-15
公开号:CN120108412A
公开日期:2025-06-06
类型:发明专利
摘要
本申请涉及语音信号处理和深度学习领域,公开了基于混合DSP深度学习方法的实时全频带语音降噪增强方法,包括以下步骤:信号预处理:对输入的时域语音信号进行分帧处理,得到一系列语音帧,并对每帧语音信号应用窗函数;频谱划分:对每一帧信号执行快速傅里叶变换,得到频谱数据,并将所述频谱数据划分为多个频带,形成多频带频谱;特征提取:提取每个频带的特征,并通过卷积神经网络对所述特征进行处理。本发明通过混合DSP深度学习方法优化频带增益和增益平滑,提升语音清晰度和可懂度,增强了模型在复杂噪声环境下的鲁棒性,并通过多频带处理和算法优化减少计算复杂度,确保低延迟、高效的实时语音处理,适用于低功耗设备。
技术关键词
深度学习方法
深度学习模型
高层次
语音信号处理
局部特征提取
数据
模型压缩
实时语音
卡尔曼滤波
语音特征
信号失真
估计误差
复杂度
浮点数
噪声
低延迟
鲁棒性
低功耗