摘要
本发明涉及数据标注领域,具体公开一种基于大模型的数据标注方法、系统、终端及介质,包括:获取标准化数据集;加载微调后的领域模型对标准化数据集进行批量预标注,获得标准化数据集的预标注结果;计算标准化数据集中每个样本的预测不确定性,根据预测不确定性选取若干样本构成第一待审核数据集;预测标准化数据集中每个样本对领域模型改进的贡献度,根据改进贡献度选取若干样本构成第二待审核数据集;将第一待审核数据集和第二待审核数据集取并集生成待审核目标数据集,对待审核目标数据集中的各个样本的预标注结果进行人工审核;根据人工审核结果获得标准化数据集的标注结果。本发明提高数据标注效率和精度。