摘要
本发明公开了一种基于强化学习的移动充储车动态调度方法及系统,解决现有停车场固定充电设施调度灵活性不足及峰谷电价利用率低的问题。通过构建动态环境模型,整合移动充储车实时SOC、位置拓扑关系、充电需求时空分布,采用深度强化学习算法训练智能体生成多维度协同优化策略。该方法自主规划充/放电时序、任务路径及能量分配,创新性设计融合动态路径代价与能量约束的奖励函数机制,并建立多车异步协同决策框架,实现充电需求响应效率与运营成本优化的双重目标。该方法通过部署至支持ROS2通信协议、具备实时传感器数据处理能力的MCSV硬件嵌入式系统,实现了从理论策略到实际应用的有效过渡。