基于多源遥感影像的视觉大模型构建方法、装置、设备及介质
申请号:CN202510709069
申请日期:2025-05-29
公开号:CN120612601A
公开日期:2025-09-09
类型:发明专利
摘要
本申请涉及一种基于多源遥感影像的视觉大模型构建方法、装置、设备及介质,方法包括:针对光学遥感影像、SAR遥感影像与红外遥感影像像特征差异大、模型跨源泛化性弱的问题,研究基于多源遥感影像的视觉大模型,通过融合多模态数据互补特征,建立跨源目标统一表征空间,解决单一模型对不同影像源特征适应性不足的瓶颈,重点挖掘多源影像中目标纹理、几何与辐射特性的关联性,设计多层级特征交互与自适应融合机制,增强模型对跨源目标的语义一致性理解,最终构建具备强泛化能力的视觉大模型,为星上轻量化小模型提供高精度监督信号,确保跨源遥感影像目标检测性能的稳定性。本申请能够降低对目标域标注数据的依赖,使模型保持良好的泛化能力。
技术关键词
光学遥感影像
红外遥感影像
雷达遥感影像
多源遥感影像
局部细节特征
模型构建方法
交叉注意力机制
对象
重构
视觉
编码器
语义
融合特征
特征提取网络
SAR遥感影像
多源融合
掩码矩阵
识别头