基于多模态知识图谱推理增强的人体行为识别方法及设备
申请号:CN202510320959
申请日期:2025-03-18
公开号:CN120236331A
公开日期:2025-07-01
类型:发明专利
摘要
本发明公开了一种基于多模态知识图谱推理增强的人体行为识别方法及设备,涉及图像处理技术领域,包括:获取待识别的视频数据;对待识别的视频数据均匀采样,得到多个关键帧;采用训练好的人体行为识别网络对多个关键帧进行处理,利用视觉信息和文本信息之间的互补性,得到待识别的视频数据的类别结果;其中,训练好的人体行为识别网络以预设类别的数据作为训练集,对初始的人体行为识别网络进行训练得到。本发明能够提高模型的语义理解能力和时空建模能力。
技术关键词
知识图谱推理
节点特征
识别方法
锚点
多模态
视觉
人体
语义
表达式
关键帧
图像编码器
网络
数据
多层感知机
代表性视频帧
文本编码器