一种基于扩散模型和对抗逆强化学习的无人艇动态避碰决策方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于扩散模型和对抗逆强化学习的无人艇动态避碰决策方法及系统
申请号:CN202411867067
申请日期:2024-12-18
公开号:CN119840806B
公开日期:2025-11-21
类型:发明专利
摘要
本发明提出一种基于扩散模型和对抗逆强化学习的无人艇动态避碰决策方法及系统。包括步骤1,收集专家避碰数据;步骤2,训练扩散模型;步骤3,进行数据增强;步骤4,搭建训练环境;步骤5,构建生成器和判别器;步骤6,更新判别器;步骤7,更新生成器;步骤8,完成训练。通过有限专家样本数据训练扩散模型,使用所训练的扩散模型生成额外避碰数据,额外数据与原始专家数据共同参与对抗性逆强化学习的训练过程可以有效解决专家避碰数据受限的难题。并且针对提出算法提供工程应用计划,对本发明提出的算法进行验证,理论与实际相结合形成系统性方案。
技术关键词
避碰决策方法 无人艇 船舶运动模型 主控系统 传播算法 动态 噪声强度 数据分布 SAC算法 神经网络参数 预训练模型 噪声样本 仿真环境 噪声数据 坐标系
系统为您推荐了相关专利信息
惯性传感器 无人艇 ORB特征 定位方法 侧扫声呐图像
综合测试台 卷烟机 微波传感器 统计推断模型 参数校准方法
剩余寿命预测方法 剩余使用寿命预测 梯度下降算法 机械设备监控系统 设备运行数据
巨型水轮发电机组 传感器组 水轮机 控制中心 测试方法
序列 前馈神经网络 矩阵 注意力 场景