一种无人艇逃脱深度强化学习训练方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种无人艇逃脱深度强化学习训练方法
申请号:CN202411941652
申请日期:2024-12-26
公开号:CN120087442A
公开日期:2025-06-03
类型:发明专利
摘要
一种无人艇逃脱深度强化学习训练方法,该方法针对无人艇逃脱场景,采用深度强化学习策略训练无人艇逃脱策略的情况,设定了状态空间与环境奖励,对无人艇所处环境部分状态进行筛选,设定合理的逃脱策略状态,既能反应无人艇逃脱时所要关注状态,又不将状态复杂化;从逃脱成功、逃脱失败、逃脱时间、航向角角度、航向角角速度等多方面对无人艇逃脱时的环境奖励进行综合设定,使无人艇逃脱策略训练能够收敛达到理想训练效果。
技术关键词
无人艇 深度强化学习 强化学习策略 SAC算法 网络 速度 场景 运动 坐标 定义 框架