一种基于视觉大模型多尺度提示的小样本语义分割方法

申请号：CN202510113896

申请日期：2025-01-24

公开号：CN120107579B

公开日期：2025-12-09

类型：发明专利

摘要

本发明公开了一种基于视觉大模型多尺度提示的小样本语义分割方法，步骤如下：构建同类的支持查询样本对；获取支持融合特征、查询融合特征和查询图像的视觉先验对支持融合特征和查询融合特征进行建模及下采样，提取多尺度的支持特征和查询特征；利用多尺度的支持特征和查询特征生成多尺度的提示编码和生成目标提示编码；将目标提示编码和查询图像输入到提示型视觉大模型中，获取查询图像的分割结果；将小样本数据中的支持查询样本对输入经训练的预测模型，对查询图像进行分割，根据预测结果计算分割准确率。与现有方法相比，本发明能充分利用多尺度下的语义信息，生成的提示信息更加准确，在多种场景下能够进一步提升小样本语义分割任务的精度。

技术关键词

语义分割方法查询特征融合特征提取注意力视觉多尺度特征提取双线性插值掩膜样本金字塔特征图像编码生成多尺度构建预测模型矩阵多尺度特征金字塔解码器