一种可视化数据平台全链路数据流转溯源方法、系统、设备及介质
申请号:CN202510014454
申请日期:2025-01-06
公开号:CN119397073A
公开日期:2025-02-07
类型:发明专利
摘要
本发明涉及大数据治理与数据分析技术领域,公开了一种可视化数据平台全链路数据流转溯源方法、系统、设备及介质,包括:监听作业调度流程提交事件,解析各个作业节点的输入输出配置信息,转换成数据流转模型保存到溯源数据库中;对节点脚本和代码进行静态分析,保存解析结果到溯源数据库中;为每个数据记录生成唯一标识符,并在数据流转过程中记录相关信息;通过Kafka异步消息将数据流转关系写入到图数据库Neo4j中,用户通过可视化界面进行数据溯源查询。本发明的有益效果:提高了数据质量和安全性,解决主流开源工具在数据血缘分析功能方面的局限性和复杂度。
技术关键词
溯源数据库
节点
溯源方法
数据平台
队列
消息
链路
并行广度优先搜索
可视化界面
标识符
关系
作业提交
作业调度系统
自定义事件
有向图模型
时间序列模型
事件监听器
数据分析技术