摘要
本申请涉及图像数据处理技术领域,公开了一种用于电网图纸的多模态大模型审图优化方法及系统,其中方法包括:构建电网逻辑图谱;通过多模态大语言模型对目标图纸进行视觉识别,定位并识别出目标设备,生成视觉识别结果;将目标设备与电网逻辑图谱中逻辑节点进行关联,生成逻辑锚定结果;基于逻辑锚定结果查询电网逻辑图谱,获取与目标设备具有逻辑关联的关联设备的设备信息;根据关联设备的设备信息,预测并生成下一个待审查的视觉焦点区域;通过多模态大语言模型对待审查的视觉焦点区域进行识别与校验,得到对应的审查结果。本申请能够实现基于设备逻辑关系的动态焦点转移,优化电网图纸审图路径,提高审图的智能化程度和缺陷识别能力。