一种基于多任务离线元强化学习的车网互动调控方法及系统

申请号：CN202511248702

申请日期：2025-09-03

公开号：CN120725410B

公开日期：2025-11-11

类型：发明专利

摘要

本发明公开了一种基于多任务离线元强化学习的车网互动调控方法及系统，方法包括：构建基于离线元强化学习框架的调控策略训练机制，引入用于任务识别的元网络，通过大语言模型增强的语义—物理融合机制，实现对历史运行轨迹数据和专家调度文本知识的联合建模。所述元网络生成任务特定嵌入，用于引导下游策略网络快速适应动态调控任务，从而制定上下文感知的调控策略。本发明有效突破传统强化学习方法在任务迁移性和泛化能力方面的瓶颈，显著提升策略网络对多样化EV分布与调控目标的适应效率。

技术关键词

调控方法多任务配电网系统有功功率强化学习模型离线节点无功负荷语义样本网络功率变化系统轨迹配电网运行状态调控策略决策模拟电动汽车潮流计算方法