基于多频带分析的声纹识别方法及装置

申请号：CN202510877113

申请日期：2025-06-27

公开号：CN120932653A

公开日期：2025-11-11

类型：发明专利

摘要

本发明涉及声音识别技术领域，尤其涉及基于多频带分析的声纹识别方法及装置，包括有数据准备与预处理、动态频带划分与特征提取、模型训练与优化、实时推理与部署以及评估与迭代；本发明相对于现有技术采用固定频带划分进行声纹特征提取，存在频带划分僵化、无法适应复杂噪声环境与跨设备频响差异的缺陷，本方案通过可学习滤波器组动态优化频带中心频率与带宽，在训练中结合损失函数反向传播自适应聚焦区分性强的频段(如基频谐波与共振峰区域)，同时引入频带注意力机制抑制低信噪比子带干扰，此方案使声纹识别在噪声环境下的错误率降低，跨设备场景识别精度提升，显著增强了复杂场景的鲁棒性。

技术关键词

声纹识别方法滤波器多模态特征鲁棒模型低功耗策略动态语音全局平均池化跨设备低信噪比抑制低频噪声估计噪声功率声纹识别装置声音识别技术注意力机制时域特征提取频域特征提取