一种模型训练方法、装置及设备、介质、产品

申请号：CN202411563583

申请日期：2024-11-05

公开号：CN119067201B

公开日期：2025-02-14

类型：发明专利

摘要

本申请提供了一种模型训练方法、装置及设备、介质、产品；该方法包括：获取待训练的网络模型，网络模型包括M个子网络模型；分别对每个子网络模型进行策略决策处理，得到每个子网络模型的并行策略；任一个子网络模型的并行策略用于指示该任一个子网络模型在模型训练过程中的并行训练任务及并行训练任务的执行方式；基于M个子网络模型的并行策略，构建网络模型的训练系统，训练系统包括M个通信组，一个通信组与一个子网络模型对应；在对网络模型进行模型训练的过程中，调用训练系统中的M个通信组分别按照对应子网络模型的并行策略所指示的执行方式，执行对应子网络模型的并行训练任务，以得到训练后的网络模型。本申请可以加快模型训练过程。

技术关键词

并行策略训练设备网络训练系统模型训练方法通信拓扑结构参数通信发射设备通信接收设备通信群编码器数据解码器文本多模态信息可读存储介质处理单元计算机程序产品流水线