一种模型训练方法、装置、存储介质及设备
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种模型训练方法、装置、存储介质及设备
申请号:
CN202411666002
申请日期:
2024-11-20
公开号:
CN119168009B
公开日期:
2025-03-14
类型:
发明专利
摘要
本说明书公开了一种模型训练方法、装置、存储介质及设备,可以通过在模型进行训练的前向传播过程中,对待训练模型的每层网络层输出的激活值进行分组融合,并可以通过对每层网络层的激活值导数掩码张量进行位压缩,从而可以显著减少模型训练的过程中对内存的占用,进而可以提升模型的训练效率并降低模型的训练成本。
技术关键词
训练样本数据
节点
模型训练方法
业务执行装置
业务执行方法
模型训练装置
文本
音频
数据处理模块
处理器
视频
图像
关系
可读存储介质
存储器
电子设备
参数
内存