基于图像块敏感代理注意力网络的开放词汇语义分割方法
申请号:CN202510826246
申请日期:2025-06-19
公开号:CN120807910A
公开日期:2025-10-17
类型:发明专利
摘要
本发明提供一种基于图像块敏感代理注意力网络的开放词汇语义分割方法,包括下列步骤:构建基于图像块敏感代理注意力网络,包括文本编码器、两个图像编码器,其中,两个图像编码器分别是经过预训练的CLIP图像编码器和视觉基础模型VFM编码器;对于给定的图像,给出对应图像的语义标注信息,包括物体所属的具体类别和物体掩码的Ground Truth图,利用骨干网的CLIP图像编码器和视觉基础模型VFM编码器分别提取图像特征;图像块敏感的代理注意力处理;图像块自适应归一化处理;掩码处理得到注意力图;图像分割。
技术关键词
图像编码器
语义分割方法
注意力
图像块
文本编码器
图像分割
归一化模块
视觉
网络
物体
基础
参数