摘要
本申请涉及语音信号处理技术领域,其具体地公开了一种面向实际通信场景的语音带宽扩展方法,其采用“由粗到细”的双层架构,首先利用基于源滤波器模型的传统语音带宽扩展技术对窄带语音信号进行初步扩展,得到粗略扩展语音;接着构建轻量级深度神经网络模型,该模型包含编码器模块、解码器模块和轻量级分组LSTM(GLSTM)模块;在模型训练过程中,使用多尺度鉴别器进行对抗训练,优化模型性能;最后通过优化后的轻量级深度神经网络模型对粗略扩展语音进行精细化频谱优化和特征增强,输出高质量宽带语音。本申请融合传统信号处理与轻量级深度学习技术,显著降低计算复杂度,保证语音扩展的高质量,并可实时处理语音信号。