摘要
本发明公开了基于强化学习的多模式公共交通出行激励策略优化方法,属于智能交通信息处理技术领域;该方法包括:基于真实路网和交通需求的多模式交通仿真平台搭建,借助交通仿真软件实现多模式公共交通联合出行线路推荐;将交通仿真平台作为智能体,根据出行激励优化目标确定强化学习模型的状态空间、动作空间和奖励函数;以最小化激励成本和交通系统运行成本为目标,对强化学习模型进行训练;基于训练好的所述强化学习模型,根据区域交通运行状况实时优化出行激励策略。本发明可根据交通运行状况并考虑出行激励对未来交通状态的影响,实时优化出行激励策略,利于缓解区域交通拥堵,减少碳排放量。