复杂场景下基于混合注意力的显著性目标检测方法及系统
申请号:CN202510250696
申请日期:2025-03-04
公开号:CN120219709A
公开日期:2025-06-27
类型:发明专利
摘要
本发明公开了一种复杂场景下基于混合注意力的显著性目标检测方法及系统,涉及计算机视觉和图像处理技术领域,该方法包括步骤:将RGB图像和深度图像分别输入编码器提取不同层级的图像特征;对不同层级的深度图像特征进行特征增强,过滤掉冗余信息;将RGB图像特征与增强的深度特征根据对应层级基于混合注意力机制进行跨模态交互融合;将不同层级的特征图从高级到低级进行跨尺度融合,逐级解码得到跨尺度融合后的不同层级的显著特征图;调整不同层级的显著特征图的大小和通道,将最低层级的显著特征图作为显著性目标检测的结果。该方法的优势在于能够有效地应对比较复杂的场景,并且能够准确的检测到显著物体。
技术关键词
层级
注意力机制
多模态特征
场景
跨模态
Softmax函数
可读存储介质
混合损失函数
编码器模块
终端设备
解码
通道
图像处理技术
数据获取模块
处理器
数据标签
计算机视觉