一种对大语言模型进行微调的方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种对大语言模型进行微调的方法及装置
申请号:CN202510126462
申请日期:2025-01-27
公开号:CN120068851A
公开日期:2025-05-30
类型:发明专利
摘要
本说明书实施例提供了一种对大语言模型进行微调的方法,包括:确定第一问题,和针对所述第一问题的第一答案,其中,第一答案根据文档集合的内容经第一推理得到,第一推理包括,文档过滤、文档组合以及递推推理;将第一微调指令输入大语言模型,第一微调指令包括第一问题,文档集合,并指示大语言模型进行逐步推理,输出以第一标记标注的推理过程和以第二标记标注的推理答案;根据大语言模型输出的推理过程和推理答案,以及监督文本,对大语言模型进行微调,监督文本包括,以第一标记标注的第一推理文本,和以第二标记标注的第一答案。
技术关键词
大语言模型 答案 标记 文本 指令 计算机程序产品 处理器 输入模块 存储器 序列 关系