具身智能数据处理方法以及设备

申请号：CN202510119577

申请日期：2025-01-24

公开号：CN120147918B

公开日期：2025-11-18

类型：发明专利

摘要

本申请提供一种具身智能数据处理方法以及设备，涉及具身智能领域，该具身智能数据处理方法包括：获取具身智能体的任务参考视频；对任务参考视频进行多模态特征提取，得到任务参考视频的视觉语义特征和任务执行对象的身体姿态特征；对视觉语义特征和身体姿态特征进行融合，得到融合特征；根据融合特征，对任务参考视频进行任务识别和对任务执行对象进行行为意图识别，得到识别结果；根据识别结果，确定任务参考视频的有效视频片段，有效视频片段用于具身智能体执行任务过程中的操作的验证和/或参考。本申请通过多模态技术实现具身智能数据的自动化处理，提高了数据处理效率和准确性，节省了人力成本。

技术关键词

智能数据处理方法意图类别姿态特征融合特征阶段语义特征意图识别对象计算机执行指令标记深度学习模型视频片段识别身体多模态技术运动轨迹数据多头注意力机制视觉