摘要
本发明公开了一种基于迭代推理的光学遥感图像标注引擎构建方法及装置;本方法可以作为光学遥感图像训练样本人工标注方法的一种补充,降低光学遥感图像训练数据的标注成本和难度。本方法面向多模态大模型的训练作业场景,旨在基于海量的真实光学遥感图像生成多粒度多模态的合成标注数据集,从而支撑多模态大模型在图像分类、图像描述、图像问答、图像区域分类、图像区域描述、图像区域问答、目标检测、Vision Grounding、目标掩膜提取、实例分割、引用表达分割等多种光学遥感图像解译任务上的训练。本发明使单一模型具备处理各种空间层次结构和语义粒度的能力。