摘要
本发明提供了一种基于动力学增强的离线强化学习扩散轨迹规划方法,属于人工智能与机器人控制技术领域。本方法在扩散轨迹生成过程中引入前向动力学模型,通过建立规划轨迹与动力学预测轨迹之间的失配度,并在反向采样阶段施加梯度修正,实现轨迹分布的动态优化。结合变分自编码器对状态转移关系进行建模,并叠加起始与目标约束条件,引导生成符合真实动力学规律的轨迹。本方法能够有效缓解传统扩散式离线强化学习中因建模误差导致的误差累积问题,提升长时域轨迹的可执行性与稳定性。在D4RL基准的连续控制任务中,实验结果表明本方法具有良好的适应性与推广性,能够显著提升复杂环境下智能体的规划与控制能力,为相关智能系统的应用提供可靠支撑。