用于异构设备的深度学习大模型训练方法及系统
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
用于异构设备的深度学习大模型训练方法及系统
申请号:
CN202510131779
申请日期:
2025-02-06
公开号:
CN119557113B
公开日期:
2025-06-06
类型:
发明专利
摘要
本发明提供了一种用于异构设备的深度学习大模型训练方法及系统,其属于模型训练技术领域,为了解决传统方案在深度学习大模型的训练时,无法对异构GPU集群进行有效利用的问题,所述方案基于提出的虚拟设备概念,通过将待训练的深度学习大模型的不同网络层划分为若干阶段,每个阶段所有网络层的前向传播和反向传播计算均由独立的虚拟设备执行,同时,结合提出的混合并行训练策略来协调不同构的GPU资源的利用,实现高效的模型训练。
技术关键词
虚拟设备
异构设备
模型训练方法
并行策略
流水线
数据并行处理
阶段
点对点方式
模型训练技术
计算机
集群
处理器
指令
可读存储介质
存储器
机制
动态
系统为您推荐了相关专利信息
1
一种大型语言模型训练方法及系统
语言模型训练方法
样本
模板
构建训练集
语言模型训练系统
2
一种GPGPU指令执行阶段的并行优化方法和系统
并行优化方法
通信单元
卷积神经网络模型
存储单元
分配单元
3
基于小样本提示微调的多模态检测模型训练方法和装置
图像嵌入
预训练模型
多模态
序列
文本特征向量
4
基于加权对比网络半监督语义分割和模型训练方法及装置
标签
网络
语义分割方法
基础
像素点
5
数据推理方法、网络设备、介质、电子设备和程序产品
注意力
数据推理方法
元素
流水线
包头