一种基于数据对齐的大语言模型回复生成方法及系统

申请号：CN202411529670

申请日期：2024-10-30

公开号：CN119474269A

公开日期：2025-02-18

类型：发明专利

摘要

一种基于数据对齐的大语言模型回复生成方法及系统，它属于大语言模型回复生成领域。本发明解决了现有大语言模型有害输出的风险大的问题。本发明首先通过COD提示收集有害问题数据集和无害问题数据集，并利用收集的数据集对模型进行预训练，再利用收集的数据集和提出的对齐策略对模型进行训练，以最小化有害响应的负对数似然，同时惩罚有害响应，通过梯度上升优化样本损失，以强化模型的正面行为。然后通过向对齐后的模型权重中添加一个安全向量来校正模型的安全性，可以在保持模型原始任务性能的同时补偿模型的安全性损失，显著降低模型产生有害输出的概率。本发明方法可以应用于大语言模型安全回复生成领域。

技术关键词

回复生成方法大语言模型数据对齐模块样本生成系统参数生成对输入策略两阶段变量校正风险正面

系统为您推荐了相关专利信息

一种基于RFID的液体泄漏检测方法及检测系统

液体泄漏检测方法液体标签 RFID读写器射频信号处理模块数据

基于作物多生育期光谱效应的土壤微量元素快速监测方法

作物冠层叶片监测方法线性回归方程多元线性回归算法效应

一种基于大语言模型特征增强的多模态网络谣言检测方法

网络谣言检测方法大语言模型跨模态集成特征多头注意力机制

基于GRU神经网络信用风险模型训练、预测方法和装置

GRU神经网络样本序列模型训练方法模型训练装置

一种基于对象感知和上下文对比学习的LVM引导的红外和可见光图像融合方法

可见光图像样本模态特征融合特征注意力