基于隐式时间刻度强化学习的自动驾驶车辆决策方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于隐式时间刻度强化学习的自动驾驶车辆决策方法
申请号:CN202411655835
申请日期:2024-11-19
公开号:CN119459751B
公开日期:2025-09-19
类型:发明专利
摘要
本发明公开了一种基于隐式时间刻度强化学习的自动驾驶车辆决策方法,包括基于隐式时间刻度的决策模型、改进的强化学习探索方法、基于规则和学习的移动方法以及智能环境车辆模型;基于隐式时间刻度的决策模型将时间刻度信息以隐式的方法导入状态价值表,从而提高决策行为的延续性;改进的强化学习探索方法使用基于预设策略的探索方法、基于反向传播的值表更新方法和基于动量法的局部最优点突破对强化学习的探索效率进行了改进;基于规则和学习的移动方法和智能环境车辆模型可以建立仿真环境对本发明决策的有效性和延续性进行验证。本发明将时间信息隐于状态价值表中,提高了车辆的决策延续性与安全性。
技术关键词
决策方法 刻度 更新方法 延续性 车道 车辆模型 ABS机制 构建决策模型 风格 仿真环境 移动单元 超车意图 贪心策略 习惯 有效性 阶段