摘要
本发明公开了基于两级提示的持续学习方法,包括:将输入图像输入至参数冻结的CLIP图像编码器生成图像嵌入,并将图像嵌入与前缀标记拼接形成拼接图像嵌入;将输入图像对应的输入文本提示与类别名称关联形成第一级提示,并将第一级提示输入至参数冻结的CLIP文本编码器生成文本嵌入;计算图像嵌入和文本嵌入的相似度,并利用自适应权重对相似度进行调整、从而得到调整后的相似度分数中最大的K个值以形成第二级提示;将拼接图像嵌入和第二级提示输入至预训练模型VIT中,输出得到最终嵌入、并将最终嵌入进行softmax操作得到最终预测。本发明无需微调任何参数,不需要任何缓冲区来存储过去的实例样本,适用于数据隐私敏感的场景。