摘要
本发明提供一种多模态图像分类方法、系统、存储介质及电子设备,包括:抽取表示图像汇聚的特殊字符的字符特征;抽取待分类图像的图像特征;基于所述字符特征和所述图像特征获取第一字符向量、第二字符向量和第三字符向量;获取待分类图像的文本描述信息;基于文本描述信息获取第一文本向量、第二文本向量和第三文本向量;将所述第一字符向量、所述第二字符向量、所述第三字符向量、所述第一文本向量、所述第二文本向量和所述第三文本向量均输入分类模型,以获取所述待分类图像的分类结果。本发明的多模态图像分类方法、系统、存储介质及电子设备基于图像、文本等多模态信息实现图像的分类,有效提升了分类准确率。