深度探索AI推理方法及系统

申请号：CN202510459650

申请日期：2025-04-11

公开号：CN120387515A

公开日期：2025-07-29

类型：发明专利

摘要

本申请提供一种深度探索AI推理方法及系统，所述方法包括：基于待推理任务，生成动态计算图，其中，动态计算图用于表征待推理任务的逻辑结构和数据流向，再对动态计算图执行风险评估，生成风险预测结果，风险评估至少包括复杂度评估、内存占用评估以及数据传输量评估；基于风险预测结果，对动态计算图执行优化处理，以生成优化计算图，优化计算图用于约束推理计算深度以及推理资源分配范围，所述方法将自然语言输入转化为语义加权的动态计算图，通过节点级复杂度评估识别资源风险；结合权限等级与强化学习进行自适应剪枝生成优化计算图；基于多目标模型和实时监控实施弹性资源调度，以解决推理深度与资源效率的协同性低的问题。

技术关键词

推理方法风险评估模型动态节点复杂度资源分配强化学习算法语义逻辑拉格朗日乘子法断点推理系统文本生成资源内存列表参数自然语言