一种面向实际通信场景的语音带宽扩展方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种面向实际通信场景的语音带宽扩展方法
申请号:CN202510264624
申请日期:2025-03-06
公开号:CN120108415A
公开日期:2025-06-06
类型:发明专利
摘要
本申请涉及语音信号处理技术领域,其具体地公开了一种面向实际通信场景的语音带宽扩展方法,其采用“由粗到细”的双层架构,首先利用基于源滤波器模型的传统语音带宽扩展技术对窄带语音信号进行初步扩展,得到粗略扩展语音;接着构建轻量级深度神经网络模型,该模型包含编码器模块、解码器模块和轻量级分组LSTM(GLSTM)模块;在模型训练过程中,使用多尺度鉴别器进行对抗训练,优化模型性能;最后通过优化后的轻量级深度神经网络模型对粗略扩展语音进行精细化频谱优化和特征增强,输出高质量宽带语音。本申请融合传统信号处理与轻量级深度学习技术,显著降低计算复杂度,保证语音扩展的高质量,并可实时处理语音信号。
技术关键词
语音带宽扩展 轻量级深度神经网络 窄带语音信号 宽带语音信号 多尺度鉴别器 编码器模块 短时傅里叶变换 粗略 滤波器模型 场景 支路 语音信号处理技术 轻量级深度学习 解码器 扩展模块 波形 网络拓扑结构 分辨率