概述
研究多Nand Die协同存储架构设计,实现各Die组的独立并行访问与负载均衡;研究随机读取、流式数据传输等优化方法,降低HBF数据访问延迟;研究“HBM+HBF”介质协同存储架构,结合Llama、千问、DeepSeek等主流大模型的访问模式,验证架构与调度策略的适配性。
需求详情
搭建多Nand Die协同HBF存储原型系统,支持12组以上NAND Die并行访问,总读取带宽≥3TB/s,随机读取延迟较现有方案降低30%以上;开发适配大模型推理的调度算法,在全量加载700B级参数模型时,词元吞吐率较HBM方案相比下降控制在2%以内;构建“HBM+HBF”介质架构,完成3种主流大模型的适配测试,发表CCF B类及以上论文不少于2篇,需出具出资方指定机构测试报告。