一种基于资源重分配的高可用的模型调度部署方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于资源重分配的高可用的模型调度部署方法
申请号:CN202410863298
申请日期:2024-06-29
公开号:CN119356803A
公开日期:2025-01-24
类型:发明专利
摘要
本发明公开了一种基于资源重分配的高可用的模型调度部署方法,推荐模型通过在线调度系统来进行资源分配,自适应扩缩容,完成模型的调度和部署;上述方法为自适应扩缩容方法,可以实现模型自动化部署,解放运维人力;为了通过缩短资源重分配时间间隔,提升实验变更过程中服务的高可用,本方案采用布林带策略来进行模型服务资源的动态调整,可以同时兼顾实时性,可用率与资源利用率;该方案平均一次资源调整只需要十几秒就能完成,且模型服务的日常可用率可以达到99.99%。
技术关键词
资源重分配 扩缩容方法 调度系统 资源分配 策略 计算方法 在线 场景 动态 运维 离线 网格 曲线 算法 人力 数据