一种基于Q-learning改进NSGA-Ⅱ的多目标柔性作业车间调度方法
申请号:CN202411030408
申请日期:2024-07-30
公开号:CN118963277A
公开日期:2024-11-15
类型:发明专利
摘要
本申请公开了一种基于Q‑learning改进NSGA‑Ⅱ的多目标柔性作业车间调度方法,本申请设计了三种种群初始化规则,利用熵值法将多个目标进行加权处理,以便采用轮盘赌的方式提高种群的多样性。为了使交叉变异参数能够自适应当前种群的进化状态,在算法中加入了Q‑learning。在Q‑learning框架中,首先选取了适应度值作为当前的状态空间,将交叉率和变异率的选取作为动作空间,种群的平均适应度值和多样性设计了一种奖惩机制;在动作选择策略中,扩展了经典的ε‑greedy策略,引入了一种精英保存策略,使自适应参数能够在迭代前期更好地去选择更多的未知动作,在迭代后期能够更好地趋于收敛,并保存每一代中较优的个体。
技术关键词
柔性作业车间调度
策略
禁忌搜索算法
遗传算法
工件
奖惩机制
轮盘
能耗
邻域
参数
损耗
框架