电子组件车间AGV复合作业模式下的改进PPO调度方法、系统、介质及设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
电子组件车间AGV复合作业模式下的改进PPO调度方法、系统、介质及设备
申请号:CN202411556169
申请日期:2024-11-04
公开号:CN119417169A
公开日期:2025-02-11
类型:发明专利
摘要
本发明涉及电子组件车间AGV物流调度领域,公开了一种电子组件车间AGV复合作业模式下的改进PPO调度方法、系统、介质及设备,其包括:利用栅格建模对车间环境地图进行栅格化,通过多个任务订单使AGV在栅格地图进行A*搜索算法,获取批量的样本数据,根据样本预训练策略网络的模型参数,完成预训练;根据新的任务订单,AGV与环境进行交互,获取观测状态、动作空间和奖励值,将观测状态进行矩阵化处理后,作为PPO算法的输入数据,计算PPO算法的策略网络和价值网络损失值,并通过梯度下降法更新网络模型参数,完成PPO训练;在线生成实时任务订单,通过前两个阶段训练好的决策网络模型指导AGV完成路径规划和调度任务。本发明能快速学习获得电子组件车间AGV调度策略,学习效率显著提升并兼具稳定性。
技术关键词
电子组件 决策网络模型 栅格地图 梯度下降法 车间 搜索算法 策略 订单 样本 参数 批量 模式 矩阵 动作列表 数据 预训练模型