模型训练方法、模型幻觉的处理方法、设备、介质及产品
申请号:CN202510076445
申请日期:2025-01-17
公开号:CN119886252A
公开日期:2025-04-25
类型:发明专利
摘要
本申请公开了一种模型训练方法、模型幻觉的处理方法、设备、介质及产品,涉及计算机技术领域。方法包括:将三元组数据输入至文本语言模型,获得文本语言模型被三元组数据刺激时目标模块对三元组数据的样本内部表示;采用幻觉处理模型中空间编码模块,对样本内部表示进行不同空间映射,得到真实空间下的样本真实潜在表示和语义空间下的样本语义潜在表示;基于样本真实潜在表示和样本语义潜在表示,采用解码模块对目标模块的内部表示进行重建,得到样本重建内部表示;基于样本重建内部表示、样本内部表示、样本真实潜在表示和样本语义潜在表示中的至少部分,确定目标损失;基于目标损失,对幻觉处理模型的参数进行调整,得到训练好的幻觉处理模型。
技术关键词
样本
模型训练方法
语义
编辑
编码模块
前馈神经网络
解码模块
文本
三元组
注意力
计算机设备
处理器
可读存储介质
计算机程序产品
数据
令牌
重构
存储器