一种动物音频声纹识别的智能深度学习方法及系统

申请号：CN202510622265

申请日期：2025-05-15

公开号：CN120148525A

公开日期：2025-06-13

类型：发明专利

摘要

本发明公开了一种动物音频声纹识别的智能深度学习方法及系统，涉及了音频识别技术领域，采集目标区域内多个监测节点的动物音频，将动物音频处理为标准化音频信息包，滤除非目标声源，提取目标声源，对目标声源进行多模态特征提取，得到多模态声纹特征后进行置信度评估，获取满足置信筛选阈值的多模态声纹特征作为建模数据集，构建混合深度学习模型，输入建模数据集后声纹建模，生成声纹特征库以及目标声纹模板，将需要识别的动物音频声纹录入至声纹特征库，计算声纹相似度，标记出符合目标声纹模板的目标声纹片段，判断其是否存在模糊片段区域，根据判断结果决定是否进行上下文语义补全，输出最终完整声纹信息的识别结果。

技术关键词

声纹特征智能深度学习混合深度学习模型动物模板采集终端时域特征提取频域特征提取录音设备语义特征提取多模态独立成分分析算法指标节点处置信度阈值音频识别技术