基于多智能体强化学习的导管装配顺序优化方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于多智能体强化学习的导管装配顺序优化方法
申请号:CN202411912341
申请日期:2024-12-24
公开号:CN119861667A
公开日期:2025-04-22
类型:发明专利
摘要
本发明涉及一种基于多智能体强化学习的导管装配顺序优化方法,属于质量与可靠性工程领域,其包括以下步骤:S1、基于导管装配引入多智能体强化学习框架,定义智能体及其状态空间;S2、定义智能体在状态空间内的动作空间;S3、定义智能体在各状态下采取指定动作对应的奖励函数,以及反映未来回报对当前决策影响程度的折扣因子;S4、定义各智能体在进行动作决策时的约束条件;S5、提出深度多智能体分层Q网络算法对导管装配顺序进行优化;S6、对导管装配位置优化方法进行验证。本发明提出了一种分层的深度多智能体Q网络算法,实现了装配顺序的优化,能够提升产品制造过程能力和质量的一致性和稳定性,为定量化技术支撑和决策提供依据。
技术关键词
多智能体强化学习 顺序优化方法 导管 阶段 强化学习模型 位置优化方法 偏差 决策 定义 深度确定性策略梯度 端点 两层网络结构 表达式 分布式策略 可靠性工程 分层 算法 因子