摘要
本发明公开了一种多模态强化微调的电力检测方法及系统,涉及视觉驱动的智能电力巡检技术领域,方法包括:步骤1:获取电力巡检图像并对图像进行标注;步骤2:将标注后的图像输入到初始视觉‑语言模型中,并冷启动监督微调对初始视觉‑语言模型进行训练,得到经过监督微调的模型;步骤3:对经过监督微调的模型进行强化微调,更新模型参数,得到PowerGPT‑R1模型;步骤4:基于测试集对PowerGPT‑R1模型性能进行评估,验证电力检测的可靠性。本发明在少样本条件下的检测精度显著提高,同时展现出视觉感知模型所不具备的多模态推理能力,在智能电网基础设施的自主巡检中具有重要的应用价值。