摘要
一种基于CPU/NPU协同计算的卷积神经网络编译方法,将各种CNN模型在不同网络框架下经过模型量化和压缩,以ONNX文件格式导出;通过ONNX‑MLIR工具链与NPU编译器的融合完成ONNX文件编译过程并分别生成分配到CPU和NPU的任务列表后,在CPU端,ONNX‑MLIR为CPU任务生成有效的RISC‑V指令,支持高效调度,在NPU端,定制的NPU编译器完成NPU任务在算法与硬件上的匹配并将算子高效映射到NPU平台。本发明通过功能函数并优化核心阶段,解决CNN在异构架构(RISC‑V CPU/NPU)上无法有效运行的问题,实现计算性能的显著提升。