摘要
本发明公开了基于深度学习的多模态图像识别系统及方法,属于图像识别技术领域,包括以下步骤:S1、数据采集模块,整个系统的前端入口,在采集过程中依据具体应用场景,对设备的参数进行精细调整,确保采集到的图像数据具有高质量和高可用;S2、数据预处理模块,提升图像质量和统一数据格式,为后续的深度学习模型处理做好准备。通过多分支深度卷积神经网络和基于注意力机制的多尺度特征融合方法,能够充分利用各模态图像的独特信息和互补优势,深入挖掘关键特征,实现对复杂场景下多模态图像的精准识别,显著提高了图像识别的准确率,尤其在目标物体被遮挡、变形以及图像质量不佳等不利情况下,相比传统单一模态图像识别方法优势更加明显。