摘要
本申请公开了一种任务调度方法、装置、设备、存储介质及产品,涉及人工智能技术领域。本申请将大模型拆分为多个子任务,并实时对算力需求进行量化,结合各神经网络处理器节点的算力评估信息,计算可调度任务与各个神经网络处理器节点的匹配得分,将调度队列中优先级最高的可调度任务分配至匹配得分最高的神经网络处理器节点中,通过循环执行,从而对不同大模型的各子任务进行合理分配;另外,基于调度策略为调度队列中的多个待调度子任务分配优先级并通过贪心算法进行调度,能够保证每次的调度行为均为实时的最优调度方案,从而解决了如何更高效率地调度大模型任务,高效地利用神经网络处理器的算力资源以减少算力浪费的技术问题。