基于全局和局部变化的视频理解方法、系统、设备及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于全局和局部变化的视频理解方法、系统、设备及介质
申请号:CN202411491511
申请日期:2024-10-24
公开号:CN119380241A
公开日期:2025-01-28
类型:发明专利
摘要
本发明公开了一种基于全局和局部变化的视频理解方法、系统、设备及介质,在视频的不同帧图片上构建含有目标物的图表示;通过图神经网络对视频帧含有目标物的图表示进行训练,获得相邻图表示之间的动作转移信息;将训练视频的所有帧图片的动作转移信息表示拼接为一个统一的动作变化矩阵;将动作变化矩阵输入到Transformer模型中,提取视频帧图片不同隐式表示之间的变化关系。本发明利用整个视频帧图片上的目标物体构建相应的图表示;利用图神经网络训练获取单个帧图片上的动作变化趋势之后,通过Transformer模型获取不同帧图片上的动作关系,专注于动作变化最明显的时刻,提升视频理解的准确率。
技术关键词
视频理解方法 图片 视频帧 矩阵 理解系统 神经网络训练 动作关系 多层感知机 捕捉器 处理器 模块 可读存储介质 存储器 计算机 噪声 电子设备 标签