一种动物音频声纹识别的智能深度学习方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种动物音频声纹识别的智能深度学习方法及系统
申请号:CN202510622265
申请日期:2025-05-15
公开号:CN120148525A
公开日期:2025-06-13
类型:发明专利
摘要
本发明公开了一种动物音频声纹识别的智能深度学习方法及系统,涉及了音频识别技术领域,采集目标区域内多个监测节点的动物音频,将动物音频处理为标准化音频信息包,滤除非目标声源,提取目标声源,对目标声源进行多模态特征提取,得到多模态声纹特征后进行置信度评估,获取满足置信筛选阈值的多模态声纹特征作为建模数据集,构建混合深度学习模型,输入建模数据集后声纹建模,生成声纹特征库以及目标声纹模板,将需要识别的动物音频声纹录入至声纹特征库,计算声纹相似度,标记出符合目标声纹模板的目标声纹片段,判断其是否存在模糊片段区域,根据判断结果决定是否进行上下文语义补全,输出最终完整声纹信息的识别结果。
技术关键词
声纹特征 智能深度学习 混合深度学习模型 动物 模板 采集终端 时域特征提取 频域特征提取 录音设备 语义特征提取 多模态 独立成分分析算法 指标 节点处 置信度阈值 音频识别技术