基于多模态大模型的输电线路的山火隐患识别方法及装置
申请号:CN202511340011
申请日期:2025-09-19
公开号:CN120852793B
公开日期:2025-11-21
类型:发明专利
摘要
本发明公开了一种基于多模态大模型的输电线路的山火隐患识别方法及装置,本发明针对传统目标检测模型输出的含烟雾或者火焰的图像,来构建出了山火隐患识别模型,该模型通过结合山火隐患识别引导对话集,来融合对话上下文与图像视觉特征,从而实现了对文本语义与烟火图像特征的深度融合;最后,再将前述深度融合后的特征输入至大语言模型,则可利用大语言模型的深度语义理解能力,来得到输电线路的山火隐患输出对话,进而得出输电线路的山火隐患识别结果;由此,本发明实现了烟火是否会危害输电线路的判断,完成了从烟火存在检测到设备威胁研判的技术升级,基于此,可避免传统技术上报所有烟火信息所造成的资源浪费和危机响应不及时的问题。
技术关键词
融合图像特征
文本
语义向量
图像特征提取
加权特征
交叉注意力机制
线路
投影单元
大语言模型
烟火
编码模块
跨模态
二次特征
多模态
识别方法