一种基于图网络信息交互的多模态目标检测方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于图网络信息交互的多模态目标检测方法
申请号:CN202511520142
申请日期:2025-10-23
公开号:CN120976536A
公开日期:2025-11-18
类型:发明专利
摘要
本发明提出一种基于图网络信息交互的多模态目标检测方法,该方法包括:通过摄像头与红外热成像头采集可见光与红外图像,并由特征提取模块提取多尺度特征,多模态特征交互模块对双模态的多尺度特征进行模态间与模态内信息交互,增强特征表示,有门控融合模块融合交互后的特征,生成多模态融合特征,多模态融合特征检测头输出预测结果。本发明本设计了一个基于图网络的多模态特征交互模块,通过图推理来捕获多模态数据之间的互补信息和长程空间依赖,进而提升显著目标检测的性能,整个流程分为两个阶段:模态间图推理和模态内图推理;这两个阶段共同作用,使得模态间的信息能够充分融合,并且模态内部的空间结构得到强化。
技术关键词
网络信息交互 多尺度特征 多模态信息 上下文语义信息 融合特征 多模态特征 特征提取模块 可见光图像 节点特征 通道 机制 全局平均池化 表达式 检测头