一种自然资源领域大模型评测集生成方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种自然资源领域大模型评测集生成方法
申请号:CN202510233228
申请日期:2025-02-28
公开号:CN119721511B
公开日期:2025-06-03
类型:发明专利
摘要
本发明提供了一种自然资源领域大模型评测集生成方法,方法包括基于数据分布模型和标注模型,通过统计推断获得数据集的标注质量分布;将核密度估计的核函数数量设为自然资源领域数据源数量,对标注质量分布进行展开近似,确定各核函数的中心和带宽;将各核函数中心作为无偏估计值,通过加权平均融合算法优化数据融合,获得数据集标注质量的融合估计值。本发明可以提升数据集标注质量的准确性和可靠性,为大模型评测集的生成提供高质量的数据支持。
技术关键词
数据分布 非标准 核密度估计模型 自然资源 噪声 生成方法 融合算法 样本 协方差矩阵 生成装置 处理器 可读存储介质 关系 存储器 电子设备 模块 计算机