一种大模型训练方法、装置及设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种大模型训练方法、装置及设备
申请号:CN202410743580
申请日期:2024-06-07
公开号:CN118586284A
公开日期:2024-09-03
类型:发明专利
摘要
本说明书实施例中公开了一种大模型训练方法、装置及设备。该方案可以包括:模型提供方可以根据预训练大模型中各个预设网络层的重要程度信息,将重要程度较低的第一网络层变更为预设轻量级网络层,并允许调整重要程度较高的第二网络层的参数,从而得到预训练大模型的仿真模型。后续,在数据所有方利用业务数据对该仿真模型进行训练,并反馈其取得的针对第二网络层的调整后参数数据后,模型提供方即可结合所述第二网络层的调整后参数数据以及所述预训练大模型,生成目标大模型。
技术关键词
动作策略 仿真模型 适配器 参数 业务数据处理 模型训练方法 强化学习算法 模型训练设备 插件 模型训练装置 关系 样本 处理器通信 数据处理单元 存储器 数据处理模块 方针