摘要
本发明涉及深度学习以及视频分析领域,本发明提供了一种基于多维度时空信息激励的视频人体行为识别方法。该方法包括:将处理好的视频帧图像数据输入到基于2D卷积的视频动作分类模型中,通过多维度时空特征增强模块沿不同轴上下文校准基于多尺度卷积结构学习到的时空特征;通过多尺度运动差分注意模块提取不同时空尺度下的运动信息;通过自适应运动信息聚合模块聚合提取到的多尺度运动信息;将最终的模型学习到的时空特征和运动特征表示累加聚合并输入到结构为全连接层的分类器中得到最终的动作分类结果。本发明方法能够帮助模型更有效地学习显著性时空特征并且更好地平衡计算消耗和分类准确率。