基于分流分解注意力的视觉Transformer分类方法
申请号:CN202410900869
申请日期:2024-07-05
公开号:CN119027709A
公开日期:2024-11-26
类型:发明专利
摘要
本发明公开了基于分流分解注意力的视觉Transformer分类方法,本发明方法对PVT图像分类算法进行改进,在其基础上设计了更高效的分流分解注意力SDSA,提出将注意力分解为位置相关的局部注意力PWSA和稀疏全局的网格注意力GridSA,通过在局部注意力中加入位置信息,每个位置都能获得与自身依赖性最强的信息交互。将PWSA与GridSA进行串联,同时加入多分支的结构,能够在同一层中关注不同大小的感受野,更有利于对多尺度对象的识别,仅具有线性复杂度,能够同时建模局部细节和全局依赖关系。
技术关键词
分类方法
前馈神经网络
图像块
图像分类算法
网格
视觉
线性
注意力机制
多分支
标签
训练集
矩阵
复杂度
参数
支路
模块
对象