一种面向大模型应用的任务分发方法及系统
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种面向大模型应用的任务分发方法及系统
申请号:
CN202410970947
申请日期:
2024-07-19
公开号:
CN118939395A
公开日期:
2024-11-12
类型:
发明专利
摘要
本发明提供了一种面向大模型应用的任务分发方法及系统,涉及资源调度技术领域,方法包括:使用消息队列分发不同类型的任务到请求分发器;使用用户配置的分组策略对同一类型的任务分组,得到不同的任务组;基于最优匹配算法将不同的任务组调度到执行组件进行执行。本发明进行多个大模型任务的调度,能够充分利用到大模型推理优化手段中最重要的批处理方法,能够有效管理部署在多个节点的大模型,能够根据不同的请求类型对大模型任务进行分发,能够高效地调度大模型执行具体任务,还支持拓展或减少大模型任务类型。
技术关键词
分发器
分发系统
队列
消息
任务调度器
策略
配置系统信息
资源调度技术
批处理方法
算法
网关
接口单元
存储单元
管理器
标识
序列
程序
主题
节点