一种基于算力网络的模型分布式训练方法和系统

申请号：CN202411376651

申请日期：2024-09-30

公开号：CN119167093B

公开日期：2025-08-29

类型：发明专利

摘要

本发明公开了一种基于算力网络的模型分布式训练方法，包括：获取用户上传的模型信息及模型文件，获取数据集的信息，判断得到的模型信息中的模型名称是否存在于预先建立的字典中，如果不是则创建主进程，利用该主进程、并根据分布式调用服务请求中的模型名称与数据集名称分别从预先建立的模型仓库和数据集仓库中加载对应的模型与数据集；使用加载的数据集对模型进行分布式训练，以得到分布式训练后的模型，通过主进程将分布式训练后的模型保存到分布式训练结果仓库中。本发明能够解决现有分布式系统用户自己搭建的模型传播范围小的技术问题,以及对不匹配的模型与数据集进行分布式训练，造成计算资源浪费的技术问题。

技术关键词

分布式训练方法进程数据仓库子模块参数深度神经网络模型深度学习框架字典分布式训练系统周期列表训练集分布式系统样本种子

系统为您推荐了相关专利信息

一种驾驶员脱手监测功能检测装置及方法

功能检测装置体感手套主控系统运动手掌

基于神经网络和遗传算法的蒙皮纵拉工艺参数优化方法

工艺参数优化方法蒙皮拉伸机遗传算法 BP神经网络

一种用于工程新材料研发管理的数据处理方法

工程新材料序列数据处理方法方差贡献率指数

一种储能电站调度优化方法及系统、设备、介质

储能系统调度优化方法功率分配模型指数风险

原料肉多形态机器仿人定量分切的路径规划方法及系统

密度分布特征路径规划方法数据预测模型形态大数据