基于CPU/NPU协同计算的卷积神经网络编译方法

申请号：CN202510014346

申请日期：2025-01-06

公开号：CN119938057B

公开日期：2025-12-26

类型：发明专利

摘要

一种基于CPU/NPU协同计算的卷积神经网络编译方法，将各种CNN模型在不同网络框架下经过模型量化和压缩，以ONNX文件格式导出；通过ONNX‑MLIR工具链与NPU编译器的融合完成ONNX文件编译过程并分别生成分配到CPU和NPU的任务列表后，在CPU端，ONNX‑MLIR为CPU任务生成有效的RISC‑V指令，支持高效调度，在NPU端，定制的NPU编译器完成NPU任务在算法与硬件上的匹配并将算子高效映射到NPU平台。本发明通过功能函数并优化核心阶段，解决CNN在异构架构(RISC‑V CPU/NPU)上无法有效运行的问题，实现计算性能的显著提升。

技术关键词

神经网络编译方法自定义算子数据传输开销最大化吞吐量任务调度高效机器模式异构平台内存打包技术自检功能残差网络阶段输出特征机制调度器列表指令变量