一种基于扩散模型和对抗逆强化学习的无人艇动态避碰决策方法及系统
申请号:CN202411867067
申请日期:2024-12-18
公开号:CN119840806B
公开日期:2025-11-21
类型:发明专利
摘要
本发明提出一种基于扩散模型和对抗逆强化学习的无人艇动态避碰决策方法及系统。包括步骤1,收集专家避碰数据;步骤2,训练扩散模型;步骤3,进行数据增强;步骤4,搭建训练环境;步骤5,构建生成器和判别器;步骤6,更新判别器;步骤7,更新生成器;步骤8,完成训练。通过有限专家样本数据训练扩散模型,使用所训练的扩散模型生成额外避碰数据,额外数据与原始专家数据共同参与对抗性逆强化学习的训练过程可以有效解决专家避碰数据受限的难题。并且针对提出算法提供工程应用计划,对本发明提出的算法进行验证,理论与实际相结合形成系统性方案。
技术关键词
避碰决策方法
无人艇
船舶运动模型
主控系统
传播算法
动态
噪声强度
数据分布
SAC算法
神经网络参数
预训练模型
噪声样本
仿真环境
噪声数据
坐标系