一种面向实际通信场景的语音带宽扩展方法

申请号：CN202510264624

申请日期：2025-03-06

公开号：CN120108415A

公开日期：2025-06-06

类型：发明专利

摘要

本申请涉及语音信号处理技术领域，其具体地公开了一种面向实际通信场景的语音带宽扩展方法，其采用“由粗到细”的双层架构，首先利用基于源滤波器模型的传统语音带宽扩展技术对窄带语音信号进行初步扩展，得到粗略扩展语音；接着构建轻量级深度神经网络模型，该模型包含编码器模块、解码器模块和轻量级分组LSTM(GLSTM)模块；在模型训练过程中，使用多尺度鉴别器进行对抗训练，优化模型性能；最后通过优化后的轻量级深度神经网络模型对粗略扩展语音进行精细化频谱优化和特征增强，输出高质量宽带语音。本申请融合传统信号处理与轻量级深度学习技术，显著降低计算复杂度，保证语音扩展的高质量，并可实时处理语音信号。

技术关键词

语音带宽扩展轻量级深度神经网络窄带语音信号宽带语音信号多尺度鉴别器编码器模块短时傅里叶变换粗略滤波器模型场景支路语音信号处理技术轻量级深度学习解码器扩展模块波形网络拓扑结构分辨率