一种基于风险敏感强化学习的自动驾驶决策方法、系统、终端及存储介质
申请号:CN202511555348
申请日期:2025-10-29
公开号:CN121019625A
公开日期:2025-11-28
类型:发明专利
摘要
本发明涉及机器学习与自动驾驶技术领域,公开了一种基于风险敏感强化学习的自动驾驶决策方法、系统、终端及存储介质,所述方法包括:构建与自动驾驶风险对应的广义风险函数,将广义风险函数中累计成本的负值作为增广状态,获取自动驾驶的原始状态空间,根据增广状态和所述原始状态空间构建增广状态空间,构建风险敏感驾驶策略模型,基于增广状态空间向量对风险敏感驾驶策略模型进行优化,得到目标模型;根据当前原始状态空间和当前增广状态构建当前增广状态空间向量,将当前增广状态空间向量输入到目标模型,输出控制指令,并根据控制指令完成自动驾驶控制。本发明保证决策过程的时间一致性,显著提升行车安全性,有效规避碰撞等高风险事件。
技术关键词
自动驾驶决策方法
策略
广义
车辆传感器
决策系统
动态
网络
控制执行模块
变量
自动驾驶技术
随机梯度下降
可读存储介质
处理器
终端
高风险
交通
存储器
计算机
刹车