一种面向人工智能大模型高效训练的并行策略搜索方法

申请号：CN202411442290

申请日期：2024-10-16

公开号：CN118966321A

公开日期：2024-11-15

类型：发明专利

摘要

本发明公开了一种面向人工智能大模型高效训练的并行策略搜索方法，涉及人工智能技术领域，具体包括以下步骤：S1、输入人工智能大模型；S2、利用TensorFlow框架可视化人工智能大模型，生成大模型的计算图g，获取集群设备的拓扑图D；该面向人工智能大模型高效训练的并行策略搜索方法，通过挖掘神经网络模型并行训练过程中的计算和通信特点，建立分布式训练性能评估模型，更准确地评估并行策略的综合性能，通过采用双层策略网络构建智能体，减少搜索过程中的开销，防止内存溢出，通过采用随机梯度上升算法有利于算法在参数改变可能导致新旧策略概率分布的剧烈变化时保持平稳收敛。

技术关键词

并行策略搜索方法 TensorFlow框架分布式训练拓扑图内存集群模拟器浮点操作数算法参数衡量设备人工智能技术神经网络模型顶点规模综合性样本