摘要
本发明公开了一种电力多模态样本标注方法及相关装置,统一图像样本对应标注文件的标签,确保不同来源图像样本的标注标准化;基于得到的图像样本标签,全面标注所有相关物体和缺陷;对标注完成的图像样本标注格式进行转换;设计目标检测任务问答对模板,将标注数据转换为问答对形式;针对图像理解任务,基于得到的问答对形式构建多轮次问答对数据集,利用构建的多轮次问答对数据集训练大语言模型,用于识别和分析图像中的安全行为;通过开源大语言模型丰富问答对的表达,保持语义等价的同时增加语言多样性,提升大语言模型的泛化能力和适应性。