摘要
本发明属于图像处理技术领域,涉及一种跨模态注意力融合机制的光学‑红外目标检测方法,通过引入隐式神经表示,将多模态特征从传统的离散像素网格提升至一个连续的函数空间,学习并构建一个从空间坐标到特征向量的连续映射函数;旨在借助一种新颖的隐式注意力机制,支持在任意查询坐标点自适应地聚合目标模态的特征信息,突破了传统方法在感受野和对齐精度上的瓶颈;本方法通过基于隐式神经表示的连续性优势,实现了不同尺度特征的无损对齐,充分挖掘尺度间的互补信息以提升融合效果。本发明通过将隐式神经表示与Mamba架构相结合,将跨模态融合从离散空间拓展至连续函数空间,在提升检测鲁棒性与泛化能力的同时,保持了模型的计算效率。