摘要
本发明公开了一种用于资源受限设备的深度学习模型编译优化系统,属于模型编译领域。利用MegCC工具,将MegEngine模型优化并编译为高度高效的可执行代码,以适应特定硬件平台的需求,先转换为ONNX格式,MgeConvert工具转换为MegEngine模型,通过执行mgb‑to‑tinynn工具,将MegCC优化后的模型转换为纯C代码的Kernel,并生成相应的模型文件。通过JSON文件指定模型路径、输入数据形状以及优化参数,执行mgb‑to‑tinynn命令,针对不同的目标架构编译生成适合各种硬件平台的模型运行文件,通过轻量级编译器实现移动设备的端侧高性能计算,通过此轻量级模型编译器能够在移动检测设备中实现高效的轻量化计算,支持有需求的人员基于低功耗设备完成目标识别等功能。