一种基于多维度时空信息激励的视频人体行为识别方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于多维度时空信息激励的视频人体行为识别方法
申请号:CN202410711053
申请日期:2024-06-04
公开号:CN118628953A
公开日期:2024-09-10
类型:发明专利
摘要
本发明涉及深度学习以及视频分析领域,本发明提供了一种基于多维度时空信息激励的视频人体行为识别方法。该方法包括:将处理好的视频帧图像数据输入到基于2D卷积的视频动作分类模型中,通过多维度时空特征增强模块沿不同轴上下文校准基于多尺度卷积结构学习到的时空特征;通过多尺度运动差分注意模块提取不同时空尺度下的运动信息;通过自适应运动信息聚合模块聚合提取到的多尺度运动信息;将最终的模型学习到的时空特征和运动特征表示累加聚合并输入到结构为全连接层的分类器中得到最终的动作分类结果。本发明方法能够帮助模型更有效地学习显著性时空特征并且更好地平衡计算消耗和分类准确率。
技术关键词
运动特征 多尺度 识别方法 卷积结构学习 人体 视频动作分类 分支 通道 分类器 更新模型参数 全局平均池化 注意力 分类准确率 生成动作 动作特征 对齐模块 视频分析