摘要
本发明公开一种自适应资源调度与工单优先级排序的方法及系统,涉及工单系统技术领域,包括:以工单信息、环境信息和团队人员信息为状态观测变量,以工单优先级和分配策略为决策动作,以SLA达成奖励、总时长奖励、负载均衡奖励、分配质量奖励和优先级处理奖励构建总奖励函数,训练强化学习模型;接收待处理工单,根据当前环境信息和团队人员信息,确定决策动作集合,并根据总奖励函数,选择待处理工单的最佳优先级以及将待处理工单分配至最优团队或个人。动态感知环境状态、理解工单本质,并学习最优的工单分配和优先级调整策略,从而提升问题解决效率、优化资源利用率并保障环境稳定性。