基于跨域边缘设备协同的大模型推理方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于跨域边缘设备协同的大模型推理方法及装置
申请号:CN202411606640
申请日期:2024-11-12
公开号:CN119558402A
公开日期:2025-03-04
类型:发明专利
摘要
本发明公开一种基于跨域边缘设备协同的大模型推理方法及装置,方法包括:基于分布式哈希表动态感知多个工作节点中图形处理器的可用资源情况,根据所述可用资源情况将大模型分块分配至所述工作节点;所述可用资源情况表征未分配的工作节点集;接收用户推理请求,所述推理请求中至少包括一个或多个推理任务;基于所述工作节点分配的大模型分块,将所述推理任务分配至一个或多个管理节点;每个所述管理节点所在区域包括一个工作节点集;所述管理节点将所述推理任务分配至本区域的所述工作节点集以进行推理;所述工作节点集包括多个工作节点。通过上述方法及装置不仅可以提升分布式推理任务的效率,还能实现资源的灵活分配和系统的高可靠性。
技术关键词
跨域边缘设备 节点 推理方法 分布式哈希表 图形处理器 分块 资源 分配单元 批量 推理装置 可读存储介质 动态 传输路径 处理单元 计算机 程序 网络 时延 队列 瓶颈