一种基于资源重分配的高可用的模型调度部署方法
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种基于资源重分配的高可用的模型调度部署方法
申请号:
CN202410863298
申请日期:
2024-06-29
公开号:
CN119356803A
公开日期:
2025-01-24
类型:
发明专利
摘要
本发明公开了一种基于资源重分配的高可用的模型调度部署方法,推荐模型通过在线调度系统来进行资源分配,自适应扩缩容,完成模型的调度和部署;上述方法为自适应扩缩容方法,可以实现模型自动化部署,解放运维人力;为了通过缩短资源重分配时间间隔,提升实验变更过程中服务的高可用,本方案采用布林带策略来进行模型服务资源的动态调整,可以同时兼顾实时性,可用率与资源利用率;该方案平均一次资源调整只需要十几秒就能完成,且模型服务的日常可用率可以达到99.99%。
技术关键词
资源重分配
扩缩容方法
调度系统
资源分配
策略
计算方法
在线
场景
动态
运维
离线
网格
曲线
算法
人力
数据