一种多模态大模型的端云协同部署方法、设备、介质及产品
申请号:CN202510190017
申请日期:2025-02-20
公开号:CN120050188A
公开日期:2025-05-27
类型:发明专利
摘要
本申请公开了一种多模态大模型的端云协同部署方法、设备、介质及产品,涉及多模态大模型部署领域,包括:云侧计算机获取待部署多模态大模型,根据待部署多模态大模型,确定优化后的编码模型和对应的切分候选点发送至端侧计算机;端侧计算机获取多模态数据,利用优化后的编码模型对多模态数据进行编码处理,得到中间数据和切分点位置信息;端侧计算机将中间数据和切分点位置信息进行压缩打包,并通过传输路径发送至云侧计算机,以利用处理模型对中间数据进行计算处理,得到计算结果,发送至端侧计算机,以利用解码模型对所述计算结果进行解码,并转换为输出格式,得到处理后的多模态数据。本申请能够动态调整计算任务的分配,提高推理效率。
技术关键词
多模态
解码模型
动态反馈机制
信息编码
数据
信息处理
动态混合调度
传输路径
动态调度算法
处理器
计算机程序产品
计算机设备
可读存储介质
格式
存储器