摘要
本申请实施例提供了一种模型训练、对象识别方法及装置,涉及人工智能技术领域,上述模型训练方法包括:将中性信号向量和图像块特征输入视觉转换器模型,得到视觉转换器模型输出的第一对象类别;将第一对象类别的类别文本特征和图像块特征输入视觉转换器模型,得到视觉转换器模型输出的第二对象类别;基于第一对象类别和对象的真实类别标签,确定视觉转换器模型产生的第一损失,并基于第二对象类别和真实类别标签,确定视觉转换器模型产生的第二损失;基于第一损失和第二损失,确定总损失,基于总损失进行反向梯度传播,更新视觉转换器模型的权重系数,得到对象识别模型。应用本申请实施例提供的方案,能够提高对象识别的准确度。