摘要
本发明涉及一种基于多模态提示的遥感图像指代分割方法及系统,属于计算机视觉与遥感智能解译技术领域。该方法包括:S1:数据预处理:划分遥感图像指代分割数据集;S2:构建基于多模态提示的遥感图像指代分割模型,包括图像编码器、空间先验模块、文本编码器、细粒度视觉语言交互器和多模态提示编码器;S3:训练基于多模态提示的遥感图像指代分割模型:对于遥感图像指代分割模型的训练,使用Focal损失、交叉熵损失和Dice损失三者结合的损失函数对模型优化训练;S4:输出分割结果:将待分割遥感图像输入到训练好的模型中,然后将模型输出结果输入到掩码解码器中,完成对目标物体的指代分割。本发明提升了解译效率。