一种基于多模态提示的遥感图像指代分割方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于多模态提示的遥感图像指代分割方法及系统
申请号:CN202510868462
申请日期:2025-06-26
公开号:CN120783046A
公开日期:2025-10-14
类型:发明专利
摘要
本发明涉及一种基于多模态提示的遥感图像指代分割方法及系统,属于计算机视觉与遥感智能解译技术领域。该方法包括:S1:数据预处理:划分遥感图像指代分割数据集;S2:构建基于多模态提示的遥感图像指代分割模型,包括图像编码器、空间先验模块、文本编码器、细粒度视觉语言交互器和多模态提示编码器;S3:训练基于多模态提示的遥感图像指代分割模型:对于遥感图像指代分割模型的训练,使用Focal损失、交叉熵损失和Dice损失三者结合的损失函数对模型优化训练;S4:输出分割结果:将待分割遥感图像输入到训练好的模型中,然后将模型输出结果输入到掩码解码器中,完成对目标物体的指代分割。本发明提升了解译效率。
技术关键词
多模态 文本编码器 分割方法 图像编码器 解码器 视觉 图像空间信息 多尺度特征融合 自然语言文本 图像分割模型 解译技术 物体 代表 表达式 理解系统 分析模块