基于国产GPU显卡的AIGC大模型训练方法及系统

申请号：CN202511099040

申请日期：2025-08-06

公开号：CN121008889A

公开日期：2025-11-25

类型：发明专利

摘要

本申请提供基于国产GPU显卡的AI GC大模型训练方法及系统，属于AI GC大模型系统构建技术领域，包括：获取国产图形处理单元的硬件特征数据集，数据集包括指令执行效率和数据传输模式的关键指标，确定硬件约束下的计算边界条件；根据语义变化量的量化结果，构建参数调整的触发条件，若语义变化量超过预设的阈值，则启动参数动态更新机制，确定更新后的参数配置；针对更新后的参数配置，结合增量训练效率需求，调整训练过程中的数据批次处理顺序，获取批次间的依赖关系，判断训练任务的完成情况；通过批次间的依赖关系，优化训练过程的并行计算逻辑，采用梯度下降法对参数进行迭代更新，得到每次迭代后的中间结果，确定训练收敛的方向。本发明能够有效提升国产图形处理单元的计算效率，实现动态数据的高效处理和模型参数的自适应更新，为复杂计算任务的优化执行提供了新的解决方案。

技术关键词

GPU显卡模型训练方法语义指令执行效率图形处理单元资源分配优先级逻辑回归模型数据动态更新参数分析模块队列分析工具瓶颈系统构建技术指标关系