一种基于风险敏感强化学习的自动驾驶决策方法、系统、终端及存储介质

申请号：CN202511555348

申请日期：2025-10-29

公开号：CN121019625A

公开日期：2025-11-28

类型：发明专利

摘要

本发明涉及机器学习与自动驾驶技术领域，公开了一种基于风险敏感强化学习的自动驾驶决策方法、系统、终端及存储介质，所述方法包括：构建与自动驾驶风险对应的广义风险函数，将广义风险函数中累计成本的负值作为增广状态，获取自动驾驶的原始状态空间，根据增广状态和所述原始状态空间构建增广状态空间，构建风险敏感驾驶策略模型，基于增广状态空间向量对风险敏感驾驶策略模型进行优化，得到目标模型；根据当前原始状态空间和当前增广状态构建当前增广状态空间向量，将当前增广状态空间向量输入到目标模型，输出控制指令，并根据控制指令完成自动驾驶控制。本发明保证决策过程的时间一致性，显著提升行车安全性，有效规避碰撞等高风险事件。

技术关键词

自动驾驶决策方法策略广义车辆传感器决策系统动态网络控制执行模块变量自动驾驶技术随机梯度下降可读存储介质处理器终端高风险交通存储器计算机刹车