融合DINOv2与全局注意力的无人机影像建筑物提取方法及系统
申请号:CN202411638169
申请日期:2024-11-16
公开号:CN119851111A
公开日期:2025-04-18
类型:发明专利
摘要
本发明涉及图像分割技术领域,特别涉及一种融合DINOv2与全局注意力的无人机影像建筑物提取方法及系统,基于DINOv2与全局注意力构建建筑物分割网络,所述建筑物分割网络包括:用于提取输入图像特征图并进行编码输出的编码器网络和用于对编码输出进行解码并分割预测输入图像建筑物的解码器网络,且编码器网络采用DINOv2视觉模型作为提取图像特征图的主干网络,解码器网络利用全局注意力机制和特征增强机制来捕获图像空间语义信息以进行语义分割预测;基于目标损失函数并利用样本数据集对建筑物分割网络进行训练,以利用训练后模型对无人机影像建筑物进行分割。本发明能够更加稳健地获取图像建筑物特征,提升网络性能,满足高分辨率无人机影像语义丰富且背景信息复杂建筑物提取。
技术关键词
建筑物提取方法
遥感图像数据
无人机
图像块
注意力机制
解码器
影像
编码器
语义
模型训练模块
样本
图像分割技术
前馈神经网络
分支
支路