一种机器人运动策略模型优化方法及相关装置

申请号：CN202411822900

申请日期：2024-12-12

公开号：CN119292077B

公开日期：2025-03-18

类型：发明专利

摘要

本申请公开了一种机器人运动策略模型优化方法及相关装置，涉及人工智能领域，该方法包括基于自主交互回放数据记忆库，对机器人运动策略模型进行初步训练，得到初步训练的机器人运动策略模型；根据第二机器人执行任务时的情况，判断是否有不满足要求的场景；若有，则针对不满足要求的场景，基于混合交互回放数据记忆库，对初步训练的机器人运动策略模型进行再训练，得到训练好的机器人运动策略模型；本申请针对初步训练的机器人运动策略模型执行任务不符合要求的场景，收集人的演示数据，从而有针对性的进行后混合训练，从而能够使机器人运动策略模型更快地达到训练要求，提升机器人运动策略模型的训练效率，缩短训练周期，降低训练成本。

技术关键词

机器人模型优化方法策略数据深度Q学习记忆运动样本门控循环单元传播算法时序参数场景计算机程序产品处理器网络结构计算机设备模块存储器