一种基于无服务器计算平台的模型迁移与部署方法及装置
申请号:CN202510742560
申请日期:2025-06-05
公开号:CN120596220A
公开日期:2025-09-05
类型:发明专利
摘要
本发明公开了一种基于无服务器计算平台的模型迁移与部署方法及装置,属于人工智能技术领域,所述方法为:获取第一模型的模型数据;基于模型结构配置文件根据数据量大小将模型数据切分为大型模型数据和核心模型数据;将大型模型数据迁移至外部云存储设备,将核心模型数据存储在无服务器计算平台本地;当需调用第一模型的第一函数启动时,检测第一模型的模型加载状态,以及计算第一函数的实例剩余可用时间;当实例剩余可用时间大于预设阈值时,确定模型启动方式;冷启动时,加载分片模型数据和核心模型数据运行第一函数;热启动时,仅加载核心模型数据运行第一函数。因此,通过实施本发明,能够解决现有技术存在的模型加载时启动延迟高的问题。
技术关键词
云存储设备
服务器
静态代码分析
分片
平台
数据迁移
模块调用关系
热启动
核心
函数调用信息
切片功能
数据获取模块
数据存储
目录
标记
分析模块
人工智能技术