一种模型训练方法、装置、存储介质及设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种模型训练方法、装置、存储介质及设备
申请号:CN202411666002
申请日期:2024-11-20
公开号:CN119168009B
公开日期:2025-03-14
类型:发明专利
摘要
本说明书公开了一种模型训练方法、装置、存储介质及设备,可以通过在模型进行训练的前向传播过程中,对待训练模型的每层网络层输出的激活值进行分组融合,并可以通过对每层网络层的激活值导数掩码张量进行位压缩,从而可以显著减少模型训练的过程中对内存的占用,进而可以提升模型的训练效率并降低模型的训练成本。
技术关键词
训练样本数据 节点 模型训练方法 业务执行装置 业务执行方法 模型训练装置 文本 音频 数据处理模块 处理器 视频 图像 关系 可读存储介质 存储器 电子设备 参数 内存