一种基于大模型的数据标注方法、系统、终端及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于大模型的数据标注方法、系统、终端及介质
申请号:CN202510912317
申请日期:2025-07-03
公开号:CN120408421B
公开日期:2025-10-31
类型:发明专利
摘要
本发明涉及数据标注领域,具体公开一种基于大模型的数据标注方法、系统、终端及介质,包括:获取标准化数据集;加载微调后的领域模型对标准化数据集进行批量预标注,获得标准化数据集的预标注结果;计算标准化数据集中每个样本的预测不确定性,根据预测不确定性选取若干样本构成第一待审核数据集;预测标准化数据集中每个样本对领域模型改进的贡献度,根据改进贡献度选取若干样本构成第二待审核数据集;将第一待审核数据集和第二待审核数据集取并集生成待审核目标数据集,对待审核目标数据集中的各个样本的预标注结果进行人工审核;根据人工审核结果获得标准化数据集的标注结果。本发明提高数据标注效率和精度。
技术关键词
数据标注方法 样本 数据标注系统 聚类算法 可读存储介质 参数 熵值法 序列 批量 动态 密度 程序 数据格式 终端 模块 训练集 处理器
系统为您推荐了相关专利信息
字符 图片 网络 矫正 生成算法
奇异值特征 矩阵 旁路 参数 基准
合规检测方法 动态图形用户界面 合规性 命名实体识别模型 命名实体模型
智能配货方法 订单 锚点 余弦距离计算方法 混合整数规划模型
内容审核模型 标签 多模态 文本编码器 图像编码器