一种基于多通道可学习小波变换的语音识别采样方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于多通道可学习小波变换的语音识别采样方法
申请号:CN202511222260
申请日期:2025-08-29
公开号:CN120998179A
公开日期:2025-11-21
类型:发明专利
摘要
本发明公开了一种基于多通道可学习小波变换的语音识别采样方法,属于自动语音识别技术技术领域;方法为:获取语音信号计算后的fbank频谱图;构建语音识别模型,采用可学习小波变换方法对语音识别模型进行优化;基于优化后的语音识别模型完成语音识别采样。本发明通过利用小波变换具备多分辨率分析能力的特点,能够把信号分解成不同尺度和方向的子信号,降噪处理后再特征融合,有助于模型捕捉音频在不同尺度和方向上的特征;使用自动学习最优的小波滤波器,从而更好地适应不同的音频数据特征,提升了模型的表达能力和泛化性能基于可学习的非线性阈值,能够提高模型抑制噪声和不重要的特征的能力。
技术关键词
采样方法 多通道 构建语音识别模型 小波变换方法 高通滤波器 低通滤波器 卷积模块 编码器模块 自动语音识别技术 采样模块 表达式 非线性 多分辨率 信号 矩阵 音频