跨模态电力视频定位方法、系统、电子设备和存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
跨模态电力视频定位方法、系统、电子设备和存储介质
申请号:CN202411913811
申请日期:2024-12-24
公开号:CN119888563B
公开日期:2026-01-02
类型:发明专利
摘要
本发明涉及视频理解技术领域,具体公开一种跨模态电力视频定位方法、系统、电子设备和存储介质,包括:对每个样本电力视频依次进行视觉边界分割、语义边界分割与上下文动态聚合,得到每个样本电力视频对应的至少一个目标伪监督对;每个目标伪监督对包括:对应的样本电力视频、伪查询文本以及伪查询文本对应在样本电力视频中的起止时间;基于每个样本电力视频对应的目标伪监督对,对预设的跨模态电力视频定位模型进行训练,得到训练好的跨模态电力视频定位模型;将待测电力视频与查询文本输入训练好的跨模态电力视频定位模型,得到视频定位结果。本发明实现了稳健且高效的零样本跨模态电力异常行为定位,提高了跨模态电力视频定位的准确性和效率。
技术关键词
视频定位方法 电力 视觉 视频定位系统 关键帧 样本 跨模态 标签文本 语义 大语言模型 电子设备 可读存储介质 动态 理解技术 模块 处理器 计算机 多模态
系统为您推荐了相关专利信息
检测识别方法 把手开关 旋钮开关 空气开关 检测模型训练
虚拟对象 实时通信 交互方法 信息展示界面 频道
巡检机器人 流量监测方法 语义分割模型 带式输送机 单目深度估计
装配式建筑器具 安装器具 辅助安装设备 视觉装置 人机协同
焊接工艺参数 组装方法 视觉装置 专家数据库 房屋框架