一种模型服务的部署方法、装置、设备、介质及程序产品
申请号:CN202410724796
申请日期:2024-06-05
公开号:CN118484204A
公开日期:2024-08-13
类型:发明专利
摘要
本申请涉及云计算技术领域,提供一种模型服务的部署方法、装置、设备、介质及程序产品。该方法中,获取模型服务对应的部署清单;部署清单为终端设备根据用户部署需求生成并发送的;或部署清单为根据模型封装仓库中存储的新的模型封装代码生成的;确定部署清单对应的模型部署仓库、及模型部署仓库下的目录位置;根据目录位置,将部署清单存储至模型部署仓库;在监控到模型部署仓库发生更新时,确定模型部署仓库中的部署清单,根据模型部署仓库、以及目录位置,从多个待选容器编排引擎集群中,确定目标容器编排引擎集群;控制目标容器编排引擎集群根据部署清单,部署模型服务。实现了模型服务的自动部署,提高了模型服务的部署效率。
技术关键词
目录
集群
计算机执行指令
容器
终端设备
镜像仓库
可读存储介质
云计算技术
计算机程序产品
标识
处理器通信
存储器
模块