摘要
本申请实施例提供了一种图像识别方法、设备和存储介质,可以应用于高分辨率医学图像识别任务中,该方法包括通过大规模预训练模型中的N个Transformer模块获得待识别图像的N个中间图特征序列,然后将N个中间图特征序列对应输入侧融合网络模型的N个融合模块,并向输入侧融合网络模型输入提示向量,以通过提示向量帮助融合模块理解和处理中间图特征序列,进而通过N个融合模块输出待识别图像的目标图特征序列,最终基于目标图特征序列获得待识别图像的识别结果。本方案在训练阶段可以冻结大规模预训练模型的参数,只对侧融合网络模型以及提示向量进行参数更新,从而减少了训练阶段的资源消耗,有助于在训练过程中提升模型在处理高分辨率图像方面的能力。