大模型评测方法、系统、介质与设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
大模型评测方法、系统、介质与设备
申请号:CN202510340119
申请日期:2025-03-21
公开号:CN120163253B
公开日期:2025-09-05
类型:发明专利
摘要
本发明公开了一种大模型评测方法、系统、介质与设备,涉及大模型测试领域,包括:获取动态评测文本数据集;对动态评测文本数据集进行文生图,得到动态评测图片集;对动态评测图片集进行数据质量管控,得到中间动态评测图片集;为中间动态评测图片集中的图片生成问题选项,得到动态评测数据集。本发明保证了性别公平性得分的真实可靠。本发明保证了构建出的动态评测数据集的高质量和随机性,有效避免了待评测的大模型根据静态评测数据集进行针对性训练或者由于数据与模型的随机性导致的评测结果的不稳定。
技术关键词
模型评测方法 动态 职业 数据 文本 图片 副本 评测系统 男性 女性 列表 处理器 可读存储介质 存储器 电子设备 模块 程序 计算机