一种模型训练、对象识别方法及装置

申请号：CN202510165461

申请日期：2025-02-14

公开号：CN120107984A

公开日期：2025-06-06

类型：发明专利

摘要

本申请实施例提供了一种模型训练、对象识别方法及装置，涉及人工智能技术领域，上述模型训练方法包括：将中性信号向量和图像块特征输入视觉转换器模型，得到视觉转换器模型输出的第一对象类别；将第一对象类别的类别文本特征和图像块特征输入视觉转换器模型，得到视觉转换器模型输出的第二对象类别；基于第一对象类别和对象的真实类别标签，确定视觉转换器模型产生的第一损失，并基于第二对象类别和真实类别标签，确定视觉转换器模型产生的第二损失；基于第一损失和第二损失，确定总损失，基于总损失进行反向梯度传播，更新视觉转换器模型的权重系数，得到对象识别模型。应用本申请实施例提供的方案，能够提高对象识别的准确度。

技术关键词

图像块特征对象识别模型文本转换器视觉大语言模型对象识别方法模型训练方法子模块对象识别装置标签模型训练装置通信接口信号可读存储介质

系统为您推荐了相关专利信息

长文本的标签分类方法、装置、设备、存储介质及产品

标签分类方法文本大语言模型注意力机制梯度下降算法

一种平滑融像训练强度实时化调整方法

蓝色红色像素图片显示装置

基于人工智能的过桥箱加工质量的检测方法

特征值代表过桥热成像模态特征

一种基于自然语言故障特征与大模型知识增强推理的工业故障诊断方法及系统

工业故障诊断方法故障特征故障知识库结构化自然语言故障诊断推理

用于校园人身安全的滑板车防超员监测系统

滑板车算法模型监测系统校园高清摄像头