训练大语言模型的方法和装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
训练大语言模型的方法和装置
申请号:CN202510874340
申请日期:2025-06-26
公开号:CN120764618A
公开日期:2025-10-10
类型:发明专利
摘要
本说明书实施例提供一种训练大语言模型的方法和装置。第一大语言模型的生成数据包括,针对输入问题的答案或者针对输入问题的查询语句。方法包括:获取第一训练样本和第二训练样本,所述第一训练样本中的样本标签包括针对该第一训练样本中的输入问题的答案,所述第二训练样本中的样本标签包括针对该第二训练样本中的输入问题的查询语句;基于所述第一训练样本和所述第二训练样本,对所述第一大语言模型进行监督训练。能够保证稳定训练。
技术关键词
大语言模型 语句 答案 样本 文本 标签 指令 标记 计算机 数据 可读存储介质 存储器 策略 处理器 参数 序列