一种对象行为识别方法、模型训练方法、装置及电子设备
申请号:CN202511199883
申请日期:2025-08-26
公开号:CN120997740A
公开日期:2025-11-21
类型:发明专利
摘要
本发明实施例提供了一种对象行为识别方法、模型训练方法、装置及电子设备,涉及视频处理技术领域。对象行为识别方法包括:获取待识别视频;将待识别视频输入预先训练的对象行为识别模型中的视频特征提取网络,得到待识别视频的全局时域特征和全局空间特征,作为待处理特征;利用第一特征提取网络,提取待识别视频中待识别对象所占图像区域的图像特征,作为待识别对象的外观特征;对待识别对象的外观特征和待处理特征进行特征融合,得到对象形态适应特征;基于第一大语言模型对待识别特征进行深层特征提取,得到待识别对象的目标行为识别结果,降低画风差异带来的干扰,提高对象行为识别模型的泛用性。
技术关键词
深层特征提取
大语言模型
样本
对象
特征提取网络
识别特征
视频特征提取
多层感知机
融合特征
形态
时域特征
特征提取模块
模型训练方法
分类网络
标签
识别方法
图像
注意力机制