一种多模态大模型的训练过程自适应优化方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种多模态大模型的训练过程自适应优化方法及系统
申请号:CN202411561472
申请日期:2024-11-01
公开号:CN119443193A
公开日期:2025-02-14
类型:发明专利
摘要
本发明提供一种多模态大模型的训练过程自适应优化方法及系统,其中所述方法包括:接收提交的多模态大模型的训练执行脚本以及训练策略;根据训练执行脚本以及训练策略,利用预存的大模型训练脚本执行分布式训练任务,以生成多模态大模型;获取在执行分布式训练任务的过程中生成的实时监控数据;基于实时监控数据进行训练策略的调整,根据大模型训练执行脚本以及调整后的训练策略,利用大模型训练脚本继续执行分布式训练任务,直至得到训练好的多模态大模型。实时动态调整训练策略,避免了不必要的计算资源浪费,缩短了模型的训练时间,以提升训练效率;可以根据监控数据的特点自适应地优化模型,提升最终得到的多模态大模型的准确性和泛化能力。
技术关键词
脚本 分布式云平台 多模态 数据并行策略 非暂态计算机可读存储介质 存储集群 数据接收模块 处理器 数据获取模块 计算机程序产品 数据存储 存储器 流水线 定义 电子设备 指令