摘要
本发明公开了一种动物音频声纹识别的智能深度学习方法及系统,涉及了音频识别技术领域,采集目标区域内多个监测节点的动物音频,将动物音频处理为标准化音频信息包,滤除非目标声源,提取目标声源,对目标声源进行多模态特征提取,得到多模态声纹特征后进行置信度评估,获取满足置信筛选阈值的多模态声纹特征作为建模数据集,构建混合深度学习模型,输入建模数据集后声纹建模,生成声纹特征库以及目标声纹模板,将需要识别的动物音频声纹录入至声纹特征库,计算声纹相似度,标记出符合目标声纹模板的目标声纹片段,判断其是否存在模糊片段区域,根据判断结果决定是否进行上下文语义补全,输出最终完整声纹信息的识别结果。