大模型分布式分离训练方法和装置
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
大模型分布式分离训练方法和装置
申请号:
CN202510805445
申请日期:
2025-06-16
公开号:
CN120599441B
公开日期:
2025-12-23
类型:
发明专利
摘要
本公开提供了一种大模型分布式分离训练方法和装置,涉及人工智能技术领域,尤其涉及多模态大模型技术领域。该方法的一具体实施方式包括:将大语言模型切分为阶段序列,并在阶段序列中的每个阶段上复制视频编码器;将图像数据输入至阶段序列中的视频编码器,生成图像特征;利用图像特征,对阶段序列中的大语言模型部分进行训练,并在训练过程中将图像特征的梯度传回阶段序列中的视频编码器;利用图像数据,对阶段序列中的视频编码器进行训练。
技术关键词
视频编码器
阶段
生成图像特征
序列
大语言模型
数据
采样器
文本
人工智能技术
计算机程序产品
训练装置
处理器通信
编码模块
指令
可读存储介质
多模态
存储器