语言模型训练方法、装置、电子设备及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
语言模型训练方法、装置、电子设备及存储介质
申请号:CN202510408849
申请日期:2025-04-02
公开号:CN120471127A
公开日期:2025-08-12
类型:发明专利
摘要
本公开提供一种语言模型训练方法、装置、电子设备及存储介质。所述方法包括:对初始语言模型进行训练得到权重矩阵,对权重矩阵进行分解处理得到基础特征矩阵和初始任务适配矩阵;对初始任务适配矩阵进行更新处理得到更新任务适配矩阵;确定在当前训练周期的更新任务适配矩阵中每个奇异向量方向的当前敏感度;根据当前敏感度从多个奇异向量方向中确定敏感方向,对敏感方向关联的缩放系数进行正则化处理得到正则化损失函数;响应于确定在连续的预设数量训练周期内奇异向量方向的变化敏感度处于衰减状态,对缩放系数进行参数重置得到更新缩放系数;将基础特征矩阵和更新任务适配矩阵进行合并处理,并将更新语言模型作为目标语言模型。
技术关键词
矩阵 语言模型训练方法 周期 元素 均匀噪声 文本 样本 模型训练装置 基础 电子设备 数据 随机噪声 传播算法 模块 参数 计算机 处理器 存储器 指令