一种基于安全强化学习的无人艇姿态控制方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于安全强化学习的无人艇姿态控制方法
申请号:CN202510682316
申请日期:2025-05-26
公开号:CN120686810A
公开日期:2025-09-23
类型:发明专利
摘要
本发明涉及无人艇领域,具体涉及一种基于安全强化学习的无人艇姿态控制方法,包括如下步骤:获取无人艇的动作状态;将动作状态作为马尔科夫决策模型的状态空间,生成动作输入空间;根据无人艇姿态的安全性约束,设计安全强化学习算法,在考虑安全性约束成本条件下,动态生成控制无人艇动作的动作序列,并输出其中的最优动作序列;评估无人艇在执行所述最优动作序列后,无人艇的姿态是否在安全阈值内;将动作序列作为无人艇交互数据储存至经验回放缓冲区中作为经验,以供安全强化学习算法不断学习。在安全强化学习算法的优化目标中引入了安全性约束,用于平衡最大化奖励和安全约束成本,避免了无人艇只关注最大化奖励而忽略安全性的问题。
技术关键词
无人艇 姿态控制方法 强化学习算法 梯度下降法 坐标系 序列 生成动作 网络 闭环控制 纵摇角度 决策 定义 核心 参数 减摇鳍 陀螺 误差 动态 力矩 速度
系统为您推荐了相关专利信息
连续血压监测 脉搏 患者 波形 血压记录仪
驱动关节 监视器 生成提示信息 控制臂 坐标系
智能音响系统 模式识别模型 数据 音响设备 铁路道口
电网设备运行状态 超参数 无监督 解码器 数据压缩