摘要
本发明公开了一种基于多粒度时空特征增强的小样本动作识别方法,包括步骤:视频数据分割,利用FFMPEG将视频随机切割为多个视频帧;特征提取,使用预训练神经网络提取视频帧的视觉特征;视频特征多粒度空间编码,利用块级、窗口级和帧级编码模块对所述视频特征进行编码,提取视频中静态的视觉信息;视频特征时序编码,利用基于Vmamba的时序编码模块进行编码,学习视频中动作的时序信息,生成每种动作类别的特征原型;组合原型匹配,计算查询视频与支持视频原型的匹配程度,从而是被查询视频的动作类别。本发明克服了小样本视频动作识别任务固有的样本稀疏性限制,模型过拟合和泛化性低的问题,有效地提高视频动作识别的准确率。