训练大语言模型的方法和装置
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
训练大语言模型的方法和装置
申请号:
CN202510874340
申请日期:
2025-06-26
公开号:
CN120764618A
公开日期:
2025-10-10
类型:
发明专利
摘要
本说明书实施例提供一种训练大语言模型的方法和装置。第一大语言模型的生成数据包括,针对输入问题的答案或者针对输入问题的查询语句。方法包括:获取第一训练样本和第二训练样本,所述第一训练样本中的样本标签包括针对该第一训练样本中的输入问题的答案,所述第二训练样本中的样本标签包括针对该第二训练样本中的输入问题的查询语句;基于所述第一训练样本和所述第二训练样本,对所述第一大语言模型进行监督训练。能够保证稳定训练。
技术关键词
大语言模型
语句
答案
样本
文本
标签
指令
标记
计算机
数据
可读存储介质
存储器
策略
处理器
参数
序列