摘要
本发明提供了一种基于文本引导挖掘的特征增强方法及系统,该方法通过对接收到的样本图像进行多模态特征提取,生成多模态特征,并基于分类器对该多模态特征进行分类,进而基于分类结果以及经过分类器后生成的每个类别对应的文本特征的预测分数确定每个类别对应的文本特征集,再基于经过分类器后生成的图像特征对应的预测分数以及文本特征集确定每个图像匹配的目标文本特征,并在获取每个样本图像对应的图像浅层特征后,对基于图像浅层特征以及目标文本特征的匹配度确定待增强特征向量进行特征增强,生成目标增强特征,通过文本引导的注意力机制,增强图像中细节区域的特征,使得图像之间的差异更加明显,进一步提高后续进行图像分类的分类效果。