一种基于多评估者和多专家模仿学习的PPO改进算法施肥模式优化方法
申请号:CN202511064835
申请日期:2025-07-31
公开号:CN120892742A
公开日期:2025-11-04
类型:发明专利
摘要
本发明提供了一种基于多评估者和多专家模仿学习的PPO改进算法施肥模式优化方法,该方法包括:将气象资料、土壤资料、田间管理资料和作物品种参数整合为模型数据库并构建DSSAT模型;通过GLUE法对DSSAT模型进行参数率定后再进行灌溉条件受限模拟,得到最优氮运筹模式;基于最优氮运筹模式和DSSAT模型,将施肥决策转化为马尔可夫决策过程并生成五元组;再通过多专家模仿学习和多评估者机制构建MEIL‑MCPPO算法框架,并通过最优氮运筹模式和五元组进行算法训练与评估,最终通过训练好的算法得到动态施肥策略。该方法通过结合多评估者方法和多专家模仿学习机制,并针对作物不同生长阶段构建独立价值函数,减少了无效探索并提升了算法性能。
技术关键词
模式优化方法
模仿学习机制
算法框架
施肥策略
资料
决策
网络
编码向量
阶段
蒙特卡洛方法
随机梯度下降
数据
气象
生成参数
施肥方法