摘要
本申请提供了一种判断大语言模型输出是否为幻觉的方法及装置。该方法包括:获取第一语言模型的输出,将输出按照预设单元划分为存在先后次序的多个单元,对各个单元进行命名实体识别,得到各个单元的类别;利用第二语言模型预测在输出的各个位置上生成该位置对应单元的概率;基于各个单元及其类别以及其对应的概率计算输出对应的第一幻觉程度值;依据输出和各个单元的类别生成多个问题,利用第一语言模型回答各个问题,得到各个问题的答案;基于输出和各个问题的答案计算输出对应的第二幻觉程度值;依据第一幻觉程度值和第二幻觉程度值判断输出是否为第一语言模型产生的幻觉。采用上述技术手段,解决现有技术中检测大语言模型幻觉效率低的问题。