一种基于扩散模型和对抗逆强化学习的无人艇动态避碰决策方法及系统

申请号：CN202411867067

申请日期：2024-12-18

公开号：CN119840806B

公开日期：2025-11-21

类型：发明专利

摘要

本发明提出一种基于扩散模型和对抗逆强化学习的无人艇动态避碰决策方法及系统。包括步骤1，收集专家避碰数据；步骤2，训练扩散模型；步骤3，进行数据增强；步骤4，搭建训练环境；步骤5，构建生成器和判别器；步骤6，更新判别器；步骤7，更新生成器；步骤8，完成训练。通过有限专家样本数据训练扩散模型，使用所训练的扩散模型生成额外避碰数据，额外数据与原始专家数据共同参与对抗性逆强化学习的训练过程可以有效解决专家避碰数据受限的难题。并且针对提出算法提供工程应用计划，对本发明提出的算法进行验证，理论与实际相结合形成系统性方案。

技术关键词

避碰决策方法无人艇船舶运动模型主控系统传播算法动态噪声强度数据分布 SAC算法神经网络参数预训练模型噪声样本仿真环境噪声数据坐标系

系统为您推荐了相关专利信息

基于侧扫声呐与惯性传感器融合的无人艇定位方法、系统及介质

惯性传感器无人艇 ORB特征定位方法侧扫声呐图像

重量检测参数校准方法、装置、计算机设备和存储介质

综合测试台卷烟机微波传感器统计推断模型参数校准方法

一种机械设备的剩余寿命预测方法

剩余寿命预测方法剩余使用寿命预测梯度下降算法机械设备监控系统设备运行数据

一种巨型水轮发电机组压力脉动测试方法及系统

巨型水轮发电机组传感器组水轮机控制中心测试方法

一种基于TimeSformer模型的对抗结果预测方法及系统

序列前馈神经网络矩阵注意力场景