一种基于演示视频模仿学习的机械臂智能控制方法

申请号：CN202511006977

申请日期：2025-07-22

公开号：CN120791761A

公开日期：2025-10-17

类型：发明专利

摘要

本发明公开了一种基于演示视频模仿学习的机械臂智能控制方法，首先获取包含任务目标的人类演示视频，得到关键点标记的视频；利用多模态大语言模型分层提取语义信息与空间几何信息，将任务分解为多个子任务阶段，并生成每个子任务阶段的子目标约束函数与路径约束函数；在机械臂仿真环境中布置与人类演示视频相似的任务场景，通过特征提取与聚类生成环境关键点；构建从视频关键点到环境关键点的映射函数；求解当前机械臂工作环境的子目标约束函数与路径约束函数的最优解，驱动机械臂执行动作直至任务完成。本发明通过细粒度关键点分析、多模态信息融合及跨场景映射，显著提升了机械臂在动作理解准确性、复杂场景适应性与任务泛化能力。

技术关键词

关键点特征大语言模型视频智能控制方法物体驱动机械臂场景多模态信息融合求解算法仿真环境人类语义模拟退火算法标记规划算法阶段聚类

系统为您推荐了相关专利信息

一种基于AI人工智能的叉车安全智能化操作系统

智能化操作系统 AI人工智能探测机构叉车策略

一种基于PSO-MPC融合的多智能体路径规划方法

智能体路径规划方法障碍物人工智能路径规划技术全局路径规划路径规划算法

舌诊数据采集方法、装置、计算机设备及可读存储介质

舌诊图像高分辨率相机联合检测模型语音视频

一种多退化视频的通用修复方法

空间模块浅层特征提取视频帧通用修复方法扫描模块

基于面部刚性变换的多视角虚拟试衣视频生成方法及系统

虚拟试衣视频生成方法面部多视角服装