摘要
本发明公开了一种面向智算系统的性能预测方法,该方法通过混合分析建模,实现了高效且可解释的性能预测。该方法主要包括:对目标深度学习模型进行追踪与程序化合成,生成包含完整计算及通信操作序列的最终算子图;采用基于可用并行度的动态重叠分析模型,结合机器学习方法预测独立的计算与访存效率,精确估算GPU算子执行延迟;基于可配置的网络拓扑,应用排队论网络模型,对通信操作在网络路径中各节点的排队和传输延迟进行白盒式建模;将各算子的计算与通信预测延迟,根据分布式策略的调度特性进行聚合,得到最终系统端到端时延。本发明提出的方法,能够在显著缩短预测时间的同时保证精度,具有高效率、强可解释性等优点。