一种基于图像的五元特征检测模型训练方法、系统及设备
申请号:CN202511133765
申请日期:2025-08-14
公开号:CN120726420B
公开日期:2025-12-05
类型:发明专利
摘要
本申请公开了一种基于图像的五元特征检测模型训练方法、系统及设备,该方法包括:获取待训练图像;将待训练图像输入初始模型中,对待训练图像进行视觉特征提取处理,得到待训练图像中每帧待训练图片的初始三元特征;基于初始三元特征进行元素构造,得到初始五元特征;对初始五元特征进行时空聚合处理,得到对应的待训练图片的目标五元特征;确定目标五元特征的预测置信度,并基于预测置信度和目标五元特征对初始模型进行调整,得到目标模型。解决了现有模型输出的二元元素特征关系难以充分体现图像中存在的主体使用工具对对象进行操作的复杂操作关系,降低模型对图片的元素特征关系的识别准确性的问题。
技术关键词
检测模型训练方法
图片
元素
视觉特征提取
预测类别
多尺度特征融合
图像
对象
多头注意力机制
融合特征
关系
特征提取模块
交互动作
处理器
存储器
动态