一种大型语言模型训练方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种大型语言模型训练方法及系统
申请号:CN202510866732
申请日期:2025-06-26
公开号:CN121029920A
公开日期:2025-11-28
类型:发明专利
摘要
本发明涉及人工智能技术领域,尤其涉及一种大型语言模型训练方法及系统。本发明设定证明者、建设性批评者、误导性批评者,建设性批评者的任务是在不直接纠正推理步骤的情况下,协助证明者修改错误预测答案。误导性批评者的任务是误导证明者将正确预测答案更改为错误答案,证明者的任务是在面临误导性批评时保持正确预测答案,面临建设性批评时纠正错误预测答案。通过强化学习共同优化证明者模型、建设性批评者模型、误导性批评者模型的模型参数,将训练好的证明者模型作为目标大型语言模型。本发明有效提高了大型语言模型的推理能力,提升了大型语言模型生成答案精度。
技术关键词
语言模型训练方法 样本 模板 构建训练集 语言模型训练系统 生成答案 人工智能技术 纠正错误 数学 模块 算法 参数 数据 文本 精度
系统为您推荐了相关专利信息
纳米孔 算法 数据 高斯概率密度函数 样本
人体压力分布 压力传感器位置 轮廓区域 数据 模糊集合
功率因数 电气设备 充电站 长短期记忆网络 LSTM神经网络模型
荔枝果实 图像检测方法 采摘机器人 Ubuntu系统 自动化农业技术
浮选精矿品位 混合核函数 多项式核函数 数据归一化方法 X荧光分析仪