一种动物音频声纹识别的智能深度学习方法及系统

申请号：CN202510943637

申请日期：2025-07-09

公开号：CN120564730A

公开日期：2025-08-29

类型：发明专利

摘要

本发明公开了一种动物音频声纹识别的智能深度学习方法及系统，涉及了音频识别技术领域，采集目标区域内多个监测节点的动物音频，将动物音频处理为标准化音频信息包，滤除非目标声源，提取目标声源，对目标声源进行多模态特征提取，得到多模态声纹特征后进行置信度评估，获取满足置信筛选阈值的多模态声纹特征作为建模数据集，构建混合深度学习模型，输入建模数据集后声纹建模，生成声纹特征库以及目标声纹模板，将需要识别的动物音频声纹录入至声纹特征库，计算声纹相似度，标记出符合目标声纹模板的目标声纹片段，判断其是否存在模糊片段区域，根据判断结果决定是否进行上下文语义补全，输出最终完整声纹信息的识别结果。

技术关键词

声纹特征智能深度学习混合深度学习模型动物模板采集终端时域特征提取频域特征提取录音设备语义特征提取多模态独立成分分析算法指标节点处置信度阈值音频识别技术

系统为您推荐了相关专利信息

选择性敲除成纤维细胞内整合素α5分子小鼠模型构建方法

小鼠模型构建方法整合素引物核苷酸敲除小鼠

玉米群体冠层语义三维重建方法及系统

三维网格模型三维模型三维重建方法方位角植株三维点云

JMJD6在制备治疗心肌肥大的药物中的应用

药物组合物表达腺病毒口服剂型重组载体小鼠心肌

多模态声纹识别的智能座舱自适应系统及权限控制方法

智能座舱声纹特征权限控制方法身份乘员

物种检测方法、装置、电子装置和计算机可读存储介质

动物物种图像分类结构状态检测模块特征提取模块