一种基于安全强化学习的无人艇姿态控制方法

申请号：CN202510682316

申请日期：2025-05-26

公开号：CN120686810A

公开日期：2025-09-23

类型：发明专利

摘要

本发明涉及无人艇领域，具体涉及一种基于安全强化学习的无人艇姿态控制方法，包括如下步骤：获取无人艇的动作状态；将动作状态作为马尔科夫决策模型的状态空间，生成动作输入空间；根据无人艇姿态的安全性约束，设计安全强化学习算法，在考虑安全性约束成本条件下，动态生成控制无人艇动作的动作序列，并输出其中的最优动作序列；评估无人艇在执行所述最优动作序列后，无人艇的姿态是否在安全阈值内；将动作序列作为无人艇交互数据储存至经验回放缓冲区中作为经验，以供安全强化学习算法不断学习。在安全强化学习算法的优化目标中引入了安全性约束，用于平衡最大化奖励和安全约束成本，避免了无人艇只关注最大化奖励而忽略安全性的问题。

技术关键词

无人艇姿态控制方法强化学习算法梯度下降法坐标系序列生成动作网络闭环控制纵摇角度决策定义核心参数减摇鳍陀螺误差动态力矩速度

系统为您推荐了相关专利信息

一种可穿戴连续血压监测设备及其系统

连续血压监测脉搏患者波形血压记录仪

手术机器人医生控制台视野调节方法、装置、设备、介质和产品

基座坐标系主操作手校正直线视野

内窥镜运动控制方法及手术机器人

驱动关节监视器生成提示信息控制臂坐标系

一种智能音响系统及方法

智能音响系统模式识别模型数据音响设备铁路道口

一种基于多因素耦合的电网事故预警和处理方法