摘要
本发明涉及深度学习技术领域,公开一种基于拆分学习的端边云模型压缩与部署方法,包括:将深度学习模型拆分为前部模型、中部模型和后部模型,部署于客户端、边缘侧和云端;客户端对前部模型进行前向传播,将前向传播结果发送至边缘侧;边缘侧接收来自至少一个客户端的前向传播结果,利用中部模型对接收到的结果进行前向传播,将前向传播结果发送至云端;云端接收来自至少一个边缘侧的前向传播结果,利用后部模型完成前向传播,计算损失函数,进行反向传播,以更新前部模型、中部模型和后部模型;对前部模型、中部模型和后部模型进行迭代剪枝,并利用知识蒸馏对剪枝后的模型进行微调;将轻量化后的前部模型部署到客户端,以在客户端本地进行推理。