一种基于动力学增强的离线强化学习扩散轨迹规划方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于动力学增强的离线强化学习扩散轨迹规划方法
申请号:CN202511284877
申请日期:2025-09-09
公开号:CN120972965A
公开日期:2025-11-18
类型:发明专利
摘要
本发明提供了一种基于动力学增强的离线强化学习扩散轨迹规划方法,属于人工智能与机器人控制技术领域。本方法在扩散轨迹生成过程中引入前向动力学模型,通过建立规划轨迹与动力学预测轨迹之间的失配度,并在反向采样阶段施加梯度修正,实现轨迹分布的动态优化。结合变分自编码器对状态转移关系进行建模,并叠加起始与目标约束条件,引导生成符合真实动力学规律的轨迹。本方法能够有效缓解传统扩散式离线强化学习中因建模误差导致的误差累积问题,提升长时域轨迹的可执行性与稳定性。在D4RL基准的连续控制任务中,实验结果表明本方法具有良好的适应性与推广性,能够显著提升复杂环境下智能体的规划与控制能力,为相关智能系统的应用提供可靠支撑。
技术关键词
轨迹规划方法 编码器结构 机器人控制技术 离线 建模误差 生成轨迹 噪声模型 解码器 智能系统 变量 三元组 参数 偏差 度量 终点 基准