跨模态电力视频定位方法、系统、电子设备和存储介质

申请号：CN202411913811

申请日期：2024-12-24

公开号：CN119888563B

公开日期：2026-01-02

类型：发明专利

摘要

本发明涉及视频理解技术领域，具体公开一种跨模态电力视频定位方法、系统、电子设备和存储介质，包括：对每个样本电力视频依次进行视觉边界分割、语义边界分割与上下文动态聚合，得到每个样本电力视频对应的至少一个目标伪监督对；每个目标伪监督对包括：对应的样本电力视频、伪查询文本以及伪查询文本对应在样本电力视频中的起止时间；基于每个样本电力视频对应的目标伪监督对，对预设的跨模态电力视频定位模型进行训练，得到训练好的跨模态电力视频定位模型；将待测电力视频与查询文本输入训练好的跨模态电力视频定位模型，得到视频定位结果。本发明实现了稳健且高效的零样本跨模态电力异常行为定位，提高了跨模态电力视频定位的准确性和效率。

技术关键词

视频定位方法电力视觉视频定位系统关键帧样本跨模态标签文本语义大语言模型电子设备可读存储介质动态理解技术模块处理器计算机多模态

系统为您推荐了相关专利信息

一种电力生产场所指示型设备状态检测识别方法及系统

检测识别方法把手开关旋钮开关空气开关检测模型训练

交互方法、装置、设备和存储介质

虚拟对象实时通信交互方法信息展示界面频道

基于巡检机器人与单目视觉的带式输送机煤流量监测方法

巡检机器人流量监测方法语义分割模型带式输送机单目深度估计

一种装配式建筑器具的辅助安装设备及人机协同安装方法

装配式建筑器具安装器具辅助安装设备视觉装置人机协同

一种钛金属的房屋框架组装方法

焊接工艺参数组装方法视觉装置专家数据库房屋框架