基于闭环强化学习的自动驾驶交通流仿真方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于闭环强化学习的自动驾驶交通流仿真方法及装置
申请号:CN202511012492
申请日期:2025-07-22
公开号:CN120930470A
公开日期:2025-11-11
类型:发明专利
摘要
本发明涉及交通仿真技术领域,特别涉及一种基于闭环强化学习的自动驾驶交通流仿真方法及装置,其中,方法包括:基于预先构建的自动驾驶车辆为中心的交通流仿真框架获取真实驾驶数据集;根据真实驾驶数据集进行模仿学习预训练,以得到初始轨迹生成模型;根据初始轨迹生成模型构建闭环强化学习微调目标函数,并利用闭环强化学习微调目标函数对初始轨迹生成模型进行更新,以得到最终轨迹生成模型。由此,解决了现有技术存在或在真实性与可控性之间无法兼顾,或在闭环部署中面临协变量偏移、模式塌缩与训练不稳定等问题。
技术关键词
交通流仿真方法 闭环 轨迹 仿真框架 车辆 交通流仿真装置 地图特征 交通仿真技术 多模态 高层次 处理器 计算机程序产品 表达式 数据 可读存储介质 存储器 解码器 编码 场景