基于国产GPU显卡的AIGC大模型训练方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于国产GPU显卡的AIGC大模型训练方法及系统
申请号:CN202511099040
申请日期:2025-08-06
公开号:CN121008889A
公开日期:2025-11-25
类型:发明专利
摘要
本申请提供基于国产GPU显卡的AI GC大模型训练方法及系统,属于AI GC大模型系统构建技术领域,包括:获取国产图形处理单元的硬件特征数据集,数据集包括指令执行效率和数据传输模式的关键指标,确定硬件约束下的计算边界条件;根据语义变化量的量化结果,构建参数调整的触发条件,若语义变化量超过预设的阈值,则启动参数动态更新机制,确定更新后的参数配置;针对更新后的参数配置,结合增量训练效率需求,调整训练过程中的数据批次处理顺序,获取批次间的依赖关系,判断训练任务的完成情况;通过批次间的依赖关系,优化训练过程的并行计算逻辑,采用梯度下降法对参数进行迭代更新,得到每次迭代后的中间结果,确定训练收敛的方向。本发明能够有效提升国产图形处理单元的计算效率,实现动态数据的高效处理和模型参数的自适应更新,为复杂计算任务的优化执行提供了新的解决方案。
技术关键词
GPU显卡 模型训练方法 语义 指令执行效率 图形处理单元 资源分配优先级 逻辑回归模型 数据 动态更新 参数 分析模块 队列 分析工具 瓶颈 系统构建技术 指标 关系