一种大型语言模型训练方法及系统

申请号：CN202510866732

申请日期：2025-06-26

公开号：CN121029920A

公开日期：2025-11-28

类型：发明专利

摘要

本发明涉及人工智能技术领域，尤其涉及一种大型语言模型训练方法及系统。本发明设定证明者、建设性批评者、误导性批评者，建设性批评者的任务是在不直接纠正推理步骤的情况下，协助证明者修改错误预测答案。误导性批评者的任务是误导证明者将正确预测答案更改为错误答案，证明者的任务是在面临误导性批评时保持正确预测答案，面临建设性批评时纠正错误预测答案。通过强化学习共同优化证明者模型、建设性批评者模型、误导性批评者模型的模型参数，将训练好的证明者模型作为目标大型语言模型。本发明有效提高了大型语言模型的推理能力，提升了大型语言模型生成答案精度。

技术关键词

语言模型训练方法样本模板构建训练集语言模型训练系统生成答案人工智能技术纠正错误数学模块算法参数数据文本精度

系统为您推荐了相关专利信息

一种对纳米孔电流数据进行清洗和拟合的方法

纳米孔算法数据高斯概率密度函数样本

一种基于人体压力分布的睡姿检测系统

人体压力分布压力传感器位置轮廓区域数据模糊集合

一种基于负载预测的充电站电气设备转换效率自适应计算方法及系统

功率因数电气设备充电站长短期记忆网络 LSTM神经网络模型

一种基于改进YOLOv8的采摘机器人荔枝图像检测方法

荔枝果实图像检测方法采摘机器人 Ubuntu系统自动化农业技术

基于ISSA-HKLSSVM的浮选精矿品位预测方法

浮选精矿品位混合核函数多项式核函数数据归一化方法 X荧光分析仪