面向大规模超算中心场景的软硬件解决方案
概述
完善HPC与AI计算资源、负载管理, 交付时间一年。
需求详情
针对大型超算中心,加强产品HPC融合架构与软硬件集群管理能力,同时丰富行业EDA/CAE应用软件的调度和兼容能力,在AI4Science能力方面,进一步完善HPC与AI计算资源、负载管理。尤其体现在软硬件能力支持;兼容企业领域EDA/CAE软件,在仿真模拟类应用兼容能力进行提升;加强调度系统优化,实现商业软件调度和资源多种使用方式。构建面向大规模超算中心场景的软硬件解决方案,提升HPC产品线应对大型集群项目的竞争力,以及在巩固教科研场景基本盘方面具有重要作用。
项目预期
主要功能开发需求包括:1.兼容适配EDA、CAE领域常见的应用软件,在应用软件上直接提交作业,将可重复的使用计算流程复用,实现流程自动化,探索商业license调度;2. 监控系统的整合与优化,完成资源管理与监控的统一化;3. 提供精细化的计费管理,支持机型、应用等设置不同的费率;4. 统计分析集群运营情况:按资源、作业、用户和应用提供统计分析报表;5. 高性能图形显示卡和高性能图形加速卡统一调度;6. 高效的远程可视化,为传统用户提供批处理使用方式;7. 为仿真模拟类用户提供可视化桌面使用方式;8. 提供应用模版仓库,管理应用。平台开发需求涉及的技术方法路线及产品开发迭代逻辑和之前版本保持一致。
对接中
金额:180万元-240万元