一种基于人体肢体技能操作视频的内容标注方法、装置、计算机设备及可读存储介质
申请号:CN202410785783
申请日期:2024-06-18
公开号:CN118781516B
公开日期:2025-05-06
类型:发明专利
摘要
本发明公开了一种基于人体肢体技能操作视频的内容标注方法、装置、计算机设备及可读存储介质,包括:首先获取并预处理多路视频流媒体数据,提取视频关键帧、视觉及声学特征。随后,通过匹配识别操作生成视频和音频评价结果数据,并据此确定操作要点和操作单元的视频片段定位。利用预训练的内容标签库进行标签标注,生成待定标签标注结果。待审核通过后,该结果将作为最终的目标标注结果。如此设计,提高了标注精度和效率,为人体肢体技能操作的准确评估提供了有力支持。
技术关键词
声学特征
内容标注方法
视觉特征
音频
视频特征数据
标签
视频流
计算机设备
关键帧内容
文本
人体
媒体
自动语音识别技术
偏移特征
MFCC算法