一种基于视觉大模型多尺度提示的小样本语义分割方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于视觉大模型多尺度提示的小样本语义分割方法
申请号:CN202510113896
申请日期:2025-01-24
公开号:CN120107579B
公开日期:2025-12-09
类型:发明专利
摘要
本发明公开了一种基于视觉大模型多尺度提示的小样本语义分割方法,步骤如下:构建同类的支持查询样本对;获取支持融合特征、查询融合特征和查询图像的视觉先验对支持融合特征和查询融合特征进行建模及下采样,提取多尺度的支持特征和查询特征;利用多尺度的支持特征和查询特征生成多尺度的提示编码和生成目标提示编码;将目标提示编码和查询图像输入到提示型视觉大模型中,获取查询图像的分割结果;将小样本数据中的支持查询样本对输入经训练的预测模型,对查询图像进行分割,根据预测结果计算分割准确率。与现有方法相比,本发明能充分利用多尺度下的语义信息,生成的提示信息更加准确,在多种场景下能够进一步提升小样本语义分割任务的精度。
技术关键词
语义分割方法 查询特征 融合特征提取 注意力 视觉 多尺度特征提取 双线性插值 掩膜 样本 金字塔特征 图像编码 生成多尺度 构建预测模型 矩阵 多尺度特征金字塔 解码器