数据驱动的交叉口车辆复杂交互行为策略仿真方法和系统
申请号:CN202510276008
申请日期:2025-03-10
公开号:CN120317096A
公开日期:2025-07-15
类型:发明专利
摘要
本发明涉及一种数据驱动的交叉口车辆复杂交互行为策略仿真方法和系统,方法包括:获取真实的交叉口车辆的交通轨迹数据,构建多个交互场景,提取各个时间步的观测信息,得到真实的车辆轨迹数据;以每个车辆作为智能体,基于预先按车辆类型构建的高斯策略网络,利用基于目标导向增益奖励以及来自判别器的奖励估计器计算奖励,生成模拟的车辆轨迹数据;基于所述真实的车辆轨迹数据和所述模拟的车辆轨迹数据,分别提取观察值‑动作对信息,以最大程度区分不同属性信息为目标更新智能体的判别器,同时,以最大程度混淆判别器为目标,更新生成器中的高斯策略网络和值估计器网络,实现基于多智能体对抗逆向强化学习的车辆复杂交互行为策略仿真。
技术关键词
交叉口车辆
车辆轨迹数据
仿真方法
策略
交通轨迹数据
网络
仿真模型
多层感知器
连续动作空间
仿真系统
代表
训练智能体
车道中心线
数据获取单元
数据处理单元
生成场景