一种模型训练方法、装置及设备、介质、产品

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种模型训练方法、装置及设备、介质、产品
申请号:CN202411563583
申请日期:2024-11-05
公开号:CN119067201B
公开日期:2025-02-14
类型:发明专利
摘要
本申请提供了一种模型训练方法、装置及设备、介质、产品;该方法包括:获取待训练的网络模型,网络模型包括M个子网络模型;分别对每个子网络模型进行策略决策处理,得到每个子网络模型的并行策略;任一个子网络模型的并行策略用于指示该任一个子网络模型在模型训练过程中的并行训练任务及并行训练任务的执行方式;基于M个子网络模型的并行策略,构建网络模型的训练系统,训练系统包括M个通信组,一个通信组与一个子网络模型对应;在对网络模型进行模型训练的过程中,调用训练系统中的M个通信组分别按照对应子网络模型的并行策略所指示的执行方式,执行对应子网络模型的并行训练任务,以得到训练后的网络模型。本申请可以加快模型训练过程。
技术关键词
并行策略 训练设备 网络 训练系统 模型训练方法 通信拓扑结构 参数 通信发射设备 通信接收设备 通信群 编码器 数据 解码器 文本 多模态信息 可读存储介质 处理单元 计算机程序产品 流水线