图像二分类模型的训练方法、图像二分类方法、装置、电子设备和介质
申请号:CN202511054197
申请日期:2025-07-30
公开号:CN120612551A
公开日期:2025-09-09
类型:发明专利
摘要
本发明提供一种图像二分类模型的训练方法,包括:获取包括多对图像样本和图像标签的样本集;获取由对图像二分类模型进行初步训练得到的基础图像二分类模型,并复制得到参考模型;分别使用基础图像分类模型和参考模型针对每一个像素点进行分类,得到预测概率和参考概率;比较图像标签和预测概率,得到奖励和预测正确概率;根据奖励和预测正确概率,使用改进优势函数计算得到优势,且使用改进损失函数计算得到损失值,并根据损失值更新基础图像分类模型的参数;循环训练得到目标图像分类模型。通过充分利用图像二分类任务只有两种结果的特点,对GRPO强化学习算法进行改进,省略了用于采样的旧模型和采样步骤,有效节省了算力资源。
技术关键词
二分类模型
图像分类模型
二分类方法
样本
像素点
基础
标签
变化检测模型
强化学习算法
电子设备
图像获取模块
可读存储介质
处理器
分类装置
模型更新
训练装置
存储器