一种基于拆分学习的端边云模型压缩与部署方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于拆分学习的端边云模型压缩与部署方法
申请号:CN202510127152
申请日期:2025-01-31
公开号:CN119940455A
公开日期:2025-05-06
类型:发明专利
摘要
本发明涉及深度学习技术领域,公开一种基于拆分学习的端边云模型压缩与部署方法,包括:将深度学习模型拆分为前部模型、中部模型和后部模型,部署于客户端、边缘侧和云端;客户端对前部模型进行前向传播,将前向传播结果发送至边缘侧;边缘侧接收来自至少一个客户端的前向传播结果,利用中部模型对接收到的结果进行前向传播,将前向传播结果发送至云端;云端接收来自至少一个边缘侧的前向传播结果,利用后部模型完成前向传播,计算损失函数,进行反向传播,以更新前部模型、中部模型和后部模型;对前部模型、中部模型和后部模型进行迭代剪枝,并利用知识蒸馏对剪枝后的模型进行微调;将轻量化后的前部模型部署到客户端,以在客户端本地进行推理。
技术关键词
模型压缩 云端 深度学习模型 标签 知识蒸馏技术 学生 教师 深度学习技术 客户端设备 参数 样本 模型更新 逻辑 数据 度量 变量 资源