构建用于围棋对弈的大语言模型的方法、用于围棋对弈的计算设备、计算机可读存储介质和计算机程序产品

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
构建用于围棋对弈的大语言模型的方法、用于围棋对弈的计算设备、计算机可读存储介质和计算机程序产品
申请号:CN202511332136
申请日期:2025-09-18
公开号:CN120822623B
公开日期:2025-12-02
类型:发明专利
摘要
本发明涉及计算模型,公开了构建用于围棋对弈的大语言模型的方法、用于围棋对弈的计算设备、计算机可读存储介质和计算机程序产品。一种构建用于围棋对弈的大语言模型的方法,包括:S1:用第一训练输入对大语言模型基座进行监督微调,以获得初始大语言模型;S2:由初始大语言模型基于第二训练输入对围棋任务执行多次预测,以生成多个预测结果;S3:基于多个预测结果确定损失函数;以及S4:基于损失函数调整初始大语言模型的参数,以得到用于围棋对弈的大语言模型。根据本发明的方法克服了通用大语言模型对围棋任务的推理幻觉,通过基于专业围棋数据和奖励函数对大语言模型进行训练,提升了大语言模型预测下一步落子位置和对应胜率的能力。
技术关键词
大语言模型 计算机程序产品 专业 数据 执行围棋 可读存储介质 启发式规则 自然语言 格式化 分支 模板 处理器 基座 数学 参数 分段