一种适用于复杂存储过程的数据血缘构建方法

申请号：CN202511121080

申请日期：2025-08-12

公开号：CN120973813A

公开日期：2025-11-18

类型：发明专利

摘要

本发明公开了一种适用于复杂存储过程的数据血缘构建方法，属于数据处理技术领域；具体包括：解析待分析数据库存储过程源代码，获取原始SQL语句集合、过程内部及跨过程的调用关系结构、语句的上下文层级结构信息、数据库表标识符与字段标识符，字段在其所属语句中的语法结构位置标识、语法结构单元标识；将字段划分为输入字段或输出字段；将结构化语句拆分为语句片段，识别片段的字段级依赖关系并标注类型；构建字段粒度数据血缘图和表粒度数据血缘图。本发明的有益效果是：本发明能够显著提升血缘关系识别的准确性与覆盖率，减少对规则配置与人工分析的依赖，增强数据血缘分析在大规模数据系统中的可行性。

技术关键词

语法结构语句数据血缘构建方法标识符字段关系层级表达式语义场景节点查询场景动态数据处理技术嵌套结构分支参数逻辑分析方法