摘要
本发明提供了一种基于ViT的无监督域适应图像分类方法,在原始ViT中引入基于全局对应关系的领域交叉注意力模块,用于在领域级别上交互不同域之间的样本特征,捕获跨领域样本特征之间的全局对应关系;基于捕获的跨领域样本特征之间的全局对应关系获取全局特征;通过在原始ViT中引入特征交互模块来获取局部特征;局部特征与全局特征进行交互和叠加;原始ViT引入了领域交叉注意力模块和卷积‑transformer特征交互模块后形成融合ViT,训练融合ViT,得到训练好的融合ViT;采用所述训练好的融合ViT执行图像分类任务。解决了现有无监督域适应图像分类方法中缺乏对领域级信息捕获和局部信息交互的问题。