摘要
本发明公开一种基于人工智能模型的训练数据集构建方法及系统,涉及人工智能技术领域。所述方法包括:对训练任务进行分析取得构建要素,通过数据采集需求生成算法取得训练所需数据采集需求并取得预计采集数据,通过价值资源匹配算法选择训练所需数据进行采集生成人工智能模型训练初始数据集并进行分类和标注生成人工智能模型训练分类标注数据集,将上述数据集划分为训练集、测试集和验证集,通过量子加密存储技术进行加密并存储,实时监测数据并动态更新训练数据集。本发明能够根据采集需求采集数据确保数据质量和数据多样性;本发明还能够在采集数据时分析数据价值与所占资源确保采集的数据价值高且所占资源小,有利于人工智能领域的可持续发展。