摘要
本申请提供一种深度探索AI推理方法及系统,所述方法包括:基于待推理任务,生成动态计算图,其中,动态计算图用于表征待推理任务的逻辑结构和数据流向,再对动态计算图执行风险评估,生成风险预测结果,风险评估至少包括复杂度评估、内存占用评估以及数据传输量评估;基于风险预测结果,对动态计算图执行优化处理,以生成优化计算图,优化计算图用于约束推理计算深度以及推理资源分配范围,所述方法将自然语言输入转化为语义加权的动态计算图,通过节点级复杂度评估识别资源风险;结合权限等级与强化学习进行自适应剪枝生成优化计算图;基于多目标模型和实时监控实施弹性资源调度,以解决推理深度与资源效率的协同性低的问题。