分布式训练系统、方法及设备、介质和计算机程序产品

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
分布式训练系统、方法及设备、介质和计算机程序产品
申请号:CN202410853489
申请日期:2024-06-28
公开号:CN118396048B
公开日期:2024-09-20
类型:发明专利
摘要
本发明公开了一种分布式训练系统、方法及设备、介质和计算机程序产品,涉及计算机技术领域,该系统包括I个第一计算节点和J个第二计算节点,第一计算节点包括本地内存,第二计算节点包括本地内存和通过计算快速链路内存扩展器扩展出的扩展内存,I个第一计算节点环形连接,J个第二计算节点环形连接,第一计算节点与连接的第二计算节点采用模型并行的方式训练卷积神经网络,I个第一计算节点采用数据并行方式训练卷积神经网络中的卷积层,J个第二计算节点采用数据并行方式训练卷积神经网络中的全连接层。本发明优化了卷积神经网络的训练效率和效果。
技术关键词
分布式训练方法 节点 分布式训练系统 辅助线 数据更新 训练卷积神经网络 标志位 内存 非易失性存储介质 数据广播 扩展器 计算机程序产品 参数 处理器 链路 存储计算机程序 进程 环形