基于千问大模型指导主干网络进行图像分割的方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于千问大模型指导主干网络进行图像分割的方法
申请号:CN202510795227
申请日期:2025-06-15
公开号:CN120318522B
公开日期:2025-09-26
类型:发明专利
摘要
本发明公开了基于千问大模型指导主干网络进行图像分割的方法,包括:将训练集中的文档图片输入到UNet主干分割网络中,得到特征图;将文档图片和人工设计的提示输入千问2多模态大模型中,获得其隐藏层的特征信息;将特征信息放入可变形代理注意力机制中进行融合,得到语义与视觉特征互相融合的更加完整的信息;将可学习的查询向量和融合信息放入解码器层中等步骤,本发明加快模型的收敛速度,使模型训练更加稳定。不仅可以减少计算开销,降低显存使用,同时还能加强代理量获取的灵活性,让模型更加自适应地学习到合理、有用的知识,得到更加灵活的注意力,有效地通过千问的指导,提高了主干分割网络的性能,对文档图片进行了较为清晰地分割。
技术关键词
视觉特征信息 融合特征 图像分割 注意力机制 语义特征 解码模块 网络 图片 采样方法 双线性插值 池化方法 解码器 元素 键值 多层结构 掩膜 训练集
系统为您推荐了相关专利信息
语音情绪识别方法 文本 融合特征 情感特征 注意力机制
图像编码器 物体 交叉注意力机制 图像特征信息 点云特征
融合机器视觉 一体化方法 多模态 一体化系统 关联算法
温度监测系统 粒子滤波模型 储能电池 电池核心温度 LightGBM模型
回波 人体感知方法 信号 序列 空洞卷积神经网络