大语言模型的评测方法、装置、设备和存储介质

申请号：CN202510562533

申请日期：2025-04-29

公开号：CN120470284A

公开日期：2025-08-12

类型：发明专利

摘要

本申请一个或多个实施例提供一种大语言模型的评测方法、装置、设备和存储介质，该方法包括：获取样本集合；样本集合中的各个样本包括查询文本，以及与查询文本对应的生成答案文本和标准答案文本；生成答案文本为由第一大语言模型基于查询文本进行推理而生成的答案文本；基于样本集合中的各个样本生成提示文本，并将提示文本输入至少一个第二大语言模型，以由各个第二大语言模型在提示文本的引导下，根据提示文本中的评估规则，以及样本中的查询文本和标准答案文本，对样本中的生成答案文本进行正确性评估，并生成与样本对应的模型评估结果；基于与样本集合中的各个样本对应的模型评估结果，确定第一大语言模型的模型效果。

技术关键词

大语言模型文本样本生成答案评测方法评测装置处理器指令可读存储介质计算机电子设备模块存储器

系统为您推荐了相关专利信息

一种多模态情感强度预测方法、装置、介质及产品

情感强度预测方法情感分析模型多模态数据文本

基于网格搜索PCA-SVR-RF模型的小麦赤霉病等级预测方法及系统

小麦赤霉病气象网络架构主成分分析降维数据

一种多模态联邦学习方法、客户端、服务器和系统

客户端原型联邦学习方法服务器文本

基于多维度变换神经网络模型的血压测量方法和装置

脉搏波神经网络模型血压测量方法信号变换块

基于AI视觉检测的生产工艺参数动态调整方法及装置

视频流特征提取模块深度外观参数关键视觉信息