摘要
本发明公开了一种融合注意力机制的多标签图像识别方法及装置,包括:获取多标签图像;对多标签图像进行预处理,得到预处理图像;提取预处理图像的局部特征和标签位置特征;根据局部特征和标签位置特征确定查询信息,计算查询信息中关键词的相关性,经softmax函数归一化得到权重,再计算加权和得到注意力值,确定关系特征;将注意力机制融入多标签图像类别识别模型中,将关系特征与局部特征融合,确定融合特征,并输入下一级网络进行信息传递,直至确定输出结果;根据输出结果和预设的分类阈值,确定预处理图像所属的多个类别标签。便于提高对多标签图像的分类效率及分类准确性。