大语言模型的评测方法、装置、设备和存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
大语言模型的评测方法、装置、设备和存储介质
申请号:CN202510562533
申请日期:2025-04-29
公开号:CN120470284A
公开日期:2025-08-12
类型:发明专利
摘要
本申请一个或多个实施例提供一种大语言模型的评测方法、装置、设备和存储介质,该方法包括:获取样本集合;样本集合中的各个样本包括查询文本,以及与查询文本对应的生成答案文本和标准答案文本;生成答案文本为由第一大语言模型基于查询文本进行推理而生成的答案文本;基于样本集合中的各个样本生成提示文本,并将提示文本输入至少一个第二大语言模型,以由各个第二大语言模型在提示文本的引导下,根据提示文本中的评估规则,以及样本中的查询文本和标准答案文本,对样本中的生成答案文本进行正确性评估,并生成与样本对应的模型评估结果;基于与样本集合中的各个样本对应的模型评估结果,确定第一大语言模型的模型效果。
技术关键词
大语言模型 文本 样本 生成答案 评测方法 评测装置 处理器 指令 可读存储介质 计算机 电子设备 模块 存储器
系统为您推荐了相关专利信息
情感强度预测方法 情感分析模型 多模态 数据 文本
小麦赤霉病 气象 网络架构 主成分分析降维 数据
客户端 原型 联邦学习方法 服务器 文本
脉搏波 神经网络模型 血压测量方法 信号 变换块
视频流 特征提取模块 深度外观 参数 关键视觉信息