一种基于神经网络关键层的分布式模型训练方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于神经网络关键层的分布式模型训练方法
申请号:CN202510580174
申请日期:2025-05-07
公开号:CN120409628A
公开日期:2025-08-01
类型:发明专利
摘要
本发明公开了一种基于神经网络关键层的分布式模型训练方法,通过结合以传输为中心和以计算为中心的方法,将数据和模型的匹配度作为选取高效参数的标准,采用可微神经网络架构搜索技术,以层为单位进行模型架构搜索,将选出的包含关键参数的层定义为关键层;在后续的分布式训练中,为进一步降低传输开销,针对关键层采用梯度稀疏化传输和误差累积策略传输参数,能够有效解决模型结构与训练数据之间的不匹配问题,极大地缓解数据传输瓶颈问题,同时保留了操作的可行性和便利性,在与现有方案的对比实验中展现出推理精度和训练速度上的优势。
技术关键词
分布式模型 参数可调 汇聚节点 神经网络架构搜索 动态更新参数 Softmax函数 分布式训练 控制可调 误差 数据 噪声 拷贝 精度 瓶颈 策略 定义 速度