用于异构设备的深度学习大模型训练方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
用于异构设备的深度学习大模型训练方法及系统
申请号:CN202510131779
申请日期:2025-02-06
公开号:CN119557113B
公开日期:2025-06-06
类型:发明专利
摘要
本发明提供了一种用于异构设备的深度学习大模型训练方法及系统,其属于模型训练技术领域,为了解决传统方案在深度学习大模型的训练时,无法对异构GPU集群进行有效利用的问题,所述方案基于提出的虚拟设备概念,通过将待训练的深度学习大模型的不同网络层划分为若干阶段,每个阶段所有网络层的前向传播和反向传播计算均由独立的虚拟设备执行,同时,结合提出的混合并行训练策略来协调不同构的GPU资源的利用,实现高效的模型训练。
技术关键词
虚拟设备 异构设备 模型训练方法 并行策略 流水线 数据并行处理 阶段 点对点方式 模型训练技术 计算机 集群 处理器 指令 可读存储介质 存储器 机制 动态
系统为您推荐了相关专利信息
语言模型训练方法 样本 模板 构建训练集 语言模型训练系统
并行优化方法 通信单元 卷积神经网络模型 存储单元 分配单元
图像嵌入 预训练模型 多模态 序列 文本特征向量
标签 网络 语义分割方法 基础 像素点
注意力 数据推理方法 元素 流水线 包头