分布式模型训练优化方法、装置、设备、介质和程序产品

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
分布式模型训练优化方法、装置、设备、介质和程序产品
申请号:CN202510944923
申请日期:2025-07-09
公开号:CN120851138A
公开日期:2025-10-28
类型:发明专利
摘要
本公开提供了一种分布式模型训练优化方法、装置、网络设备、介质和程序产品,涉及模型训练技术领域。其中,分布式模型训练优化方法包括:向所述参数服务器系统中的指定工作节点发送训练风险防控模型所需的模型参数;接收所述指定工作节点发送的第一映射表,所述第一映射表为所述模型参数的参数标识与压缩梯度之间的映射表,所述压缩梯度为所述指定工作节点对所述模型参数的风险特征梯度进行压缩得到;基于所述第一映射表对所述模型参数进行计数;基于计数结果检测到所述模型参数的访问频率大于频率阈值时,基于负载均衡规则处理所述模型参数。通过本公开的技术方案,有利于缓解网络带宽瓶颈。
技术关键词
训练优化方法 参数服务器系统 分布式模型 风险 模型参数识别 节点 标识 频率 模型训练技术 优化装置 策略 集群 延迟量 网络设备 副本 分片 处理器 模块