一种改进深度强化学习PPO的七自由度机械臂轨迹规划方法

申请号：CN202510870903

申请日期：2025-06-26

公开号：CN120503206A

公开日期：2025-08-19

类型：发明专利

摘要

本发明公开了一种改进深度强化学习PPO的七自由度机械臂轨迹规划方法，属于工业机器人智能控制技术领域。针对深度强化学习在七自由度冗余机械臂轨迹规划中面临的学习能力不好和收敛速度慢的问题，设计分阶段奖励函数，通过两个阶段逐步引导七自由度机械臂完成任务。设计一种分层经验回放机制，依据奖励值将训练过程中的经验分别存储在优先经验存储区和次级经验存储区；通过无偏采样策略平衡两类存储区的采样比例，提升经验样本的利用率，与传统的优先经验回放机制相比，该方法在减少计算量的同时，有效避免了训练过程中的过拟合问题。通过分阶段奖励函数和分层经验回放机制有效缩短七自由度机械臂在复杂环境中的学习时间，显著提高了收敛速度。

技术关键词

深度强化学习冗余机械臂控制机械臂运动分阶段七自由度机械臂机械臂末端执行器工业机器人智能控制技术关节存储结构逆运动学分层机制策略规划轨迹障碍物样本

系统为您推荐了相关专利信息

一种安全高效的改进PBFT车联网区块链共识方法、系统、设备及介质

区块链共识方法路边单元多准则决策分析签名技术深度强化学习算法

一种未知动态环境中人机混合自主导航系统

自主导航系统策略人机交互模块障碍物迁移学习技术

基于深度强化学习的主动配电网两阶段云边协同调度方法及装置

协同调度方法两阶段历史功率数据深度强化学习模型模型训练方法

一种基于复杂强化学习的机器人路径规划方法

栅格地图决策数据路径导航方法自动路径规划

一种基于一云多芯异构算力平台的GPU算力调度方法

性能指标数据多芯异构容器化技术硬件抽象层