基于多源遥感影像的视觉大模型构建方法、装置、设备及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于多源遥感影像的视觉大模型构建方法、装置、设备及介质
申请号:CN202510709069
申请日期:2025-05-29
公开号:CN120612601A
公开日期:2025-09-09
类型:发明专利
摘要
本申请涉及一种基于多源遥感影像的视觉大模型构建方法、装置、设备及介质,方法包括:针对光学遥感影像、SAR遥感影像与红外遥感影像像特征差异大、模型跨源泛化性弱的问题,研究基于多源遥感影像的视觉大模型,通过融合多模态数据互补特征,建立跨源目标统一表征空间,解决单一模型对不同影像源特征适应性不足的瓶颈,重点挖掘多源影像中目标纹理、几何与辐射特性的关联性,设计多层级特征交互与自适应融合机制,增强模型对跨源目标的语义一致性理解,最终构建具备强泛化能力的视觉大模型,为星上轻量化小模型提供高精度监督信号,确保跨源遥感影像目标检测性能的稳定性。本申请能够降低对目标域标注数据的依赖,使模型保持良好的泛化能力。
技术关键词
光学遥感影像 红外遥感影像 雷达遥感影像 多源遥感影像 局部细节特征 模型构建方法 交叉注意力机制 对象 重构 视觉 编码器 语义 融合特征 特征提取网络 SAR遥感影像 多源融合 掩码矩阵 识别头