摘要
本发明公开了一种适用于复杂存储过程的数据血缘构建方法,属于数据处理技术领域;具体包括:解析待分析数据库存储过程源代码,获取原始SQL语句集合、过程内部及跨过程的调用关系结构、语句的上下文层级结构信息、数据库表标识符与字段标识符,字段在其所属语句中的语法结构位置标识、语法结构单元标识;将字段划分为输入字段或输出字段;将结构化语句拆分为语句片段,识别片段的字段级依赖关系并标注类型;构建字段粒度数据血缘图和表粒度数据血缘图。本发明的有益效果是:本发明能够显著提升血缘关系识别的准确性与覆盖率,减少对规则配置与人工分析的依赖,增强数据血缘分析在大规模数据系统中的可行性。