基于实体-环境-策略原型学习的通用具身策略建模方法和任务处理方法
申请号:CN202511193564
申请日期:2025-08-25
公开号:CN121031650A
公开日期:2025-11-28
类型:发明专利
摘要
本申请提供了一种基于实体‑环境‑策略原型学习的通用具身策略建模方法和任务处理方法,涉及具身智能技术领域。该方法包括:获取具身交互数据的实体特征和环境特征;根据原型空间的实体原型和环境原型,分别将实体特征和环境特征映射为实体原型表征和环境原型表征;将原型空间中的任意实体原型和任意环境原型组合为实体‑环境原型对,并为每个实体‑环境原型对确定一个关联的策略原型网络;根据实体原型表征和环境原型表征,构建联合路由权重矩阵;将联合路由权重矩阵中联合路由权重值大于权重阈值的实体‑环境原型对激活,并利用激活的实体‑环境原型对关联的激活策略原型网络生成候选动作;根据候选动作对所述激活策略网络进行更新。
技术关键词
原型
实体
策略
掩码矩阵
交互特征
建模方法
控制智能体
特征提取网络
超参数
数据
重构
编码器
基础
无人机
机器人
模块
线性