摘要
本申请提供基于国产GPU显卡的AI GC大模型训练方法及系统,属于AI GC大模型系统构建技术领域,包括:获取国产图形处理单元的硬件特征数据集,数据集包括指令执行效率和数据传输模式的关键指标,确定硬件约束下的计算边界条件;根据语义变化量的量化结果,构建参数调整的触发条件,若语义变化量超过预设的阈值,则启动参数动态更新机制,确定更新后的参数配置;针对更新后的参数配置,结合增量训练效率需求,调整训练过程中的数据批次处理顺序,获取批次间的依赖关系,判断训练任务的完成情况;通过批次间的依赖关系,优化训练过程的并行计算逻辑,采用梯度下降法对参数进行迭代更新,得到每次迭代后的中间结果,确定训练收敛的方向。本发明能够有效提升国产图形处理单元的计算效率,实现动态数据的高效处理和模型参数的自适应更新,为复杂计算任务的优化执行提供了新的解决方案。