一种面向智算系统的性能预测方法

申请号：CN202511158453

申请日期：2025-08-19

公开号：CN120896863A

公开日期：2025-11-04

类型：发明专利

摘要

本发明公开了一种面向智算系统的性能预测方法，该方法通过混合分析建模，实现了高效且可解释的性能预测。该方法主要包括：对目标深度学习模型进行追踪与程序化合成，生成包含完整计算及通信操作序列的最终算子图；采用基于可用并行度的动态重叠分析模型，结合机器学习方法预测独立的计算与访存效率，精确估算GPU算子执行延迟；基于可配置的网络拓扑，应用排队论网络模型，对通信操作在网络路径中各节点的排队和传输延迟进行白盒式建模；将各算子的计算与通信预测延迟，根据分布式策略的调度特性进行聚合，得到最终系统端到端时延。本发明提出的方法，能够在显著缩短预测时间的同时保证精度，具有高效率、强可解释性等优点。

技术关键词

性能预测方法分布式策略深度学习模型机器学习方法预测网络拓扑结构节点流水线并行策略瓶颈机器学习模型多处理器单层序列预测装置存储器网络通信