一种基于风险敏感强化学习的自动驾驶决策方法、系统、终端及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于风险敏感强化学习的自动驾驶决策方法、系统、终端及存储介质
申请号:CN202511555348
申请日期:2025-10-29
公开号:CN121019625A
公开日期:2025-11-28
类型:发明专利
摘要
本发明涉及机器学习与自动驾驶技术领域,公开了一种基于风险敏感强化学习的自动驾驶决策方法、系统、终端及存储介质,所述方法包括:构建与自动驾驶风险对应的广义风险函数,将广义风险函数中累计成本的负值作为增广状态,获取自动驾驶的原始状态空间,根据增广状态和所述原始状态空间构建增广状态空间,构建风险敏感驾驶策略模型,基于增广状态空间向量对风险敏感驾驶策略模型进行优化,得到目标模型;根据当前原始状态空间和当前增广状态构建当前增广状态空间向量,将当前增广状态空间向量输入到目标模型,输出控制指令,并根据控制指令完成自动驾驶控制。本发明保证决策过程的时间一致性,显著提升行车安全性,有效规避碰撞等高风险事件。
技术关键词
自动驾驶决策方法 策略 广义 车辆传感器 决策系统 动态 网络 控制执行模块 变量 自动驾驶技术 随机梯度下降 可读存储介质 处理器 终端 高风险 交通 存储器 计算机 刹车