分离式架构LoRA模型训练方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
分离式架构LoRA模型训练方法
申请号:CN202511255749
申请日期:2025-09-04
公开号:CN120804720A
公开日期:2025-10-17
类型:发明专利
摘要
本发明涉及机器学习模型训练技术领域,公开了分离式架构LoRA模型训练方法。该方法实时获取初始训练数据集并提取初始特征序列,待训练LoRA模型包含多个分离式模块。从初始特征序列中提取交互特征,基于此根据不同模块的训练数据分辨率生成精细程度不同的模块,得到多粒度特征分布。分析训练序列得到训练载荷谱,基于此计算分离式模块的梯度分布,得到梯度状态数据。再根据梯度状态数据识别参数更新次数,结合模型更新规则得到剩余更新量,进而得到最终训练参数。该方法还包括响应分析指令得到目标模块的梯度分析结果等步骤。此方法能提升模型训练效果和适应性。
技术关键词
分离式模块 模型训练方法 交互特征 多粒度特征 特征提取网络 数据 子模块 唯一性 队列 序列 分辨率 机器学习模型训练 模块体 统计特征 模型更新 载荷 标识 基础 立体