基于预设错误模式的大语言模型负样本增强偏好优化方法
申请号:CN202510950747
申请日期:2025-07-10
公开号:CN120448546B
公开日期:2025-09-23
类型:发明专利
摘要
本发明提供一种基于预设错误模式的大语言模型负样本增强偏好优化方法及装置,涉及大语言处理技术领域。该方法包括:基于对话问答场景,采集对话问题以及问题对应正确回答的数据,获得正样本数据集;定义大语言模型回答的错误类型;根据错误类型构建错误描述文本;基于自监督错误注入机制,根据错误描述文本以及正样本数据集,使用目标大语言模型进行数据生成,获得负样本数据集;使用正样本数据集以及负样本数据集,对目标大语言模型进行KTO偏好优化训练,获得优化大语言模型。本发明是一种基于错误模式的效率高且鲁棒性好的大语言模型负样本增强偏好优化方法。
技术关键词
大语言模型
样本
数据
计算机可读取存储介质
问答场景
文本
计算机可读指令
优化设备
优化装置
机制
处理器
定义
模块
存储器
鲁棒性
答案
逻辑
链条
参数