摘要
本发明公开了一种基于特征缓存优化的少样本分类方法研究,该方法包括:(1)使用一种基于改进的ResNet作为骨干的SwAV模型,用于生成辅助特征;(2)将图像数据和文本描述作为原始输入,利用GPT‑3生成具有丰富下游语言语义的文本输入,作为CLIP模型的文本提示;(3)通过基于特征相似性和差异性的特征选择方法,解决特征选择过程中存在的特征冗余和选择不准确的问题,识别出具有较高选择价值的特征维度,并对这些特征进行归一化和增强缩放处理;(4)利用SwAV的视觉对比知识,引入可学习的缓存模型,自适应地混合来自CLIP和SwAV的预测结果。本发明在无需额外训练的CLIP框架下,通过特征缓存优化和自适应混合策略,有效提高了少样本图像分类的准确性。