摘要
本申请实施例提供一种智能体的动态分配方法、装置、设备、存储介质及产品,涉及人工智能领域。该方法应用于多智能体系统,该方法包括:对待分配智能体的任务进行特征提取,确定任务的任务特征;获取多智能体系统的资源利用数据,根据资源利用数据,确定资源状态;基于任务特征和资源利用数据,确定当前状态,并基于当前状态确定执行动作,执行动作用于指示从多智能体系统中,确定目标智能体;基于当前状态、执行动作的奖励值以及分配策略确定模型,确定决策结果,奖励值是基于历史执行数据和奖励函数确定的,分配策略确定模型是根据模拟环境或历史数据训练得到的。本申请的方法,提高了多智能体系统鲁棒性,提升了资源利用率和任务执行效率。