摘要
本申请涉及新能源汽车充电站运营策略领域,公开了一种V2G电动汽车充电站充放电决策优化方法及装置。基于V2G技术构建新能源汽车充电站交互环境;设置强化学习的状态变量、动作变量和奖励函数,奖励函数设置多个优化目标,可以平衡充电桩运营商、电网运营商和用户等各方利益,实现全局最优。采用SD3算法构建基于强化学习的电动汽车充电站充放电决策模型,通过训练获得最优电动汽车充电站充放电决策模型,根据实时数据和最优电动汽车充电站充放电决策模型计算获得最优充放电调度方案。能够在较少的训练样本下获得更优性能,能够在动态环境中确保智能决策的可靠性和训练过程中的稳定性。可以自动学习复杂环境下的决策策略,减轻人工规则设计的负担。