摘要
本发明提供一种基于数据血缘关系的字段级数据治理方法及系统,涉及数据处理技术领域,方法包括:获取待处理数据中各个字段的上游数据和下游数据;将上游数据和下游数据作为样本数据构建数据血缘图谱;确定各个字段之间的上下游血缘关系;确定各个字段的基础可信度评分、时效性权重评分以及规则校验分;构建可信度模型;将样本数据输入至可信度模型进行训练;获取待处理数据的实时样本数据;将实时样本数据输入至训练后的可信度模型,输出最终可信度;根据最终可信度对待处理数据进行数据治理;将数据治理结果标记为样本数据,再次输入至可信度模型进行训练。本发明可以实现数据的精细化治理,提高数据质量和可用性。