基于多频带分析的声纹识别方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于多频带分析的声纹识别方法及装置
申请号:CN202510877113
申请日期:2025-06-27
公开号:CN120932653A
公开日期:2025-11-11
类型:发明专利
摘要
本发明涉及声音识别技术领域,尤其涉及基于多频带分析的声纹识别方法及装置,包括有数据准备与预处理、动态频带划分与特征提取、模型训练与优化、实时推理与部署以及评估与迭代;本发明相对于现有技术采用固定频带划分进行声纹特征提取,存在频带划分僵化、无法适应复杂噪声环境与跨设备频响差异的缺陷,本方案通过可学习滤波器组动态优化频带中心频率与带宽,在训练中结合损失函数反向传播自适应聚焦区分性强的频段(如基频谐波与共振峰区域),同时引入频带注意力机制抑制低信噪比子带干扰,此方案使声纹识别在噪声环境下的错误率降低,跨设备场景识别精度提升,显著增强了复杂场景的鲁棒性。
技术关键词
声纹识别方法 滤波器 多模态特征 鲁棒模型 低功耗策略 动态 语音 全局平均池化 跨设备 低信噪比 抑制低频噪声 估计噪声功率 声纹识别装置 声音识别技术 注意力机制 时域特征提取 频域特征提取