一种基于多任务离线元强化学习的车网互动调控方法及系统
申请号:CN202511248702
申请日期:2025-09-03
公开号:CN120725410B
公开日期:2025-11-11
类型:发明专利
摘要
本发明公开了一种基于多任务离线元强化学习的车网互动调控方法及系统,方法包括:构建基于离线元强化学习框架的调控策略训练机制,引入用于任务识别的元网络,通过大语言模型增强的语义—物理融合机制,实现对历史运行轨迹数据和专家调度文本知识的联合建模。所述元网络生成任务特定嵌入,用于引导下游策略网络快速适应动态调控任务,从而制定上下文感知的调控策略。本发明有效突破传统强化学习方法在任务迁移性和泛化能力方面的瓶颈,显著提升策略网络对多样化EV分布与调控目标的适应效率。
技术关键词
调控方法
多任务
配电网系统
有功功率
强化学习模型
离线
节点
无功负荷
语义
样本
网络
功率变化系统
轨迹
配电网运行状态
调控策略
决策
模拟电动汽车
潮流计算方法