摘要
本发明公开了一种多模态长尾数据挖掘方法、系统、车辆及存储介质,基于参数微调后的CLI P模型对长尾数据进行数据挖掘,得到长尾数据的数据挖掘结果;其中,CLI P模型的参数微调的步骤为:利用预先训练的CLI P模型对多个样本图像进行单目标分类,得到单目标分类预测结果,接收对单目标分类预测结果中多个语义类别的标注信息,得到标注样本集,基于标注样本集得到参数微调的CLI P模型。本实施例方法通过人工标注增加语义类别数据,以人工标注的语义类别数据对CLI P模型进行微调,利用微调后的CLI P模型对长尾数据进行挖掘,从而实现更有效的挖掘出预定义语义类别,提高了长尾数据挖掘的准确度。