一种大语言模型的可解释性测试评估方法及系统

申请号：CN202410861740

申请日期：2024-06-28

公开号：CN118861594A

公开日期：2024-10-29

类型：发明专利

摘要

本申请公开了一种大语言模型的可解释性测试评估方法及系统，包括：获取待测试的大语言模型对应的应用场景以及评估样本文本，并将评估样本文本输入至大语言模型，获得大语言模型输出的第一文本类别；将评估样本文本输入至机器学习模型集中应用场景对应的机器学习模型，获得机器学习模型输出的第二文本类别；机器学习模型基于各应用场景对应的训练样本文本及其样本标签训练，并经过验证样本文本及其样本标签进行准确率验证后获得；基于第一文本类别与第二文本类别，计算大语言模型在可解释性测试评估指标上的评估结果。通过本申请，实现统一规范化大语言模型可解释性的量化评估，有效提升测试评估效率和准确性，并且具有较高的动态可扩展性。

技术关键词

机器学习模型文本大语言模型样本测试评估方法频繁项集挖掘算法频繁模式增长算法场景动作指令数据测试评估系统标签计算机程序产品体感指令特征提取算法处理器随机森林模型朴素贝叶斯可读存储介质存储计算机程序指标