一种基于多维度时空信息激励的视频人体行为识别方法

申请号：CN202410711053

申请日期：2024-06-04

公开号：CN118628953A

公开日期：2024-09-10

类型：发明专利

摘要

本发明涉及深度学习以及视频分析领域，本发明提供了一种基于多维度时空信息激励的视频人体行为识别方法。该方法包括：将处理好的视频帧图像数据输入到基于2D卷积的视频动作分类模型中，通过多维度时空特征增强模块沿不同轴上下文校准基于多尺度卷积结构学习到的时空特征；通过多尺度运动差分注意模块提取不同时空尺度下的运动信息；通过自适应运动信息聚合模块聚合提取到的多尺度运动信息；将最终的模型学习到的时空特征和运动特征表示累加聚合并输入到结构为全连接层的分类器中得到最终的动作分类结果。本发明方法能够帮助模型更有效地学习显著性时空特征并且更好地平衡计算消耗和分类准确率。

技术关键词

运动特征多尺度识别方法卷积结构学习人体视频动作分类分支通道分类器更新模型参数全局平均池化注意力分类准确率生成动作动作特征对齐模块视频分析