动态路由混合专家模型的推理方法、系统、设备及介质
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
动态路由混合专家模型的推理方法、系统、设备及介质
申请号:
CN202511537028
申请日期:
2025-10-27
公开号:
CN120996216A
公开日期:
2025-11-21
类型:
发明专利
摘要
本发明公开了一种动态路由混合专家模型的推理方法、系统、设备及介质,它们是相对应的方案,方案中:通过自动化的并行策略搜索,本发明能将模型切分为运行时间均衡的流水线阶段,减少计算单元的空闲率,进而有效地提升计算单元的执行效率;并且,本发明的自动化搜索过程通过细粒度的并行策略划分,能够在满足内存限制的情况下尽可能降低最大的流水线阶段运行时间,从而提高模型的推理性能。
技术关键词
并行策略
流水线
阶段
推理方法
模块
内存
动态
变换器
注意力
节点
符号
推理系统
序列
处理器
分析工具
定义
框架
可读存储介质
数据
系统为您推荐了相关专利信息
1
量子计算辅助系统和信息生成方法
历史会话
信息生成方法
辅助系统
大语言模型
记忆
2
基于直播交易订单数据的信息推送方法及系统
意图类别
订单
标记
信息推送方法
分类阈值
3
一种数据质量增强方法、系统、设备和存储介质
网格
样本
预测残差
聚类算法
解码器
4
基于随机森林机器学习的积雪产品去云方法及系统
积雪产品
去云方法
机器学习模型
水体
数据
5
云端机器人外呼方法、运营平台和计算机设备
云端机器人
客户通讯信息
外呼方法
场景
计算机设备