摘要
本发明公开了一种企业数据链路治理及价值管理方法及系统,采用分布式数据采集引擎对企业内部各业务系统的多源异构数据进行实时抓取,通过预设的数据源适配器识别不同格式的原始数据类型,若检测到结构化数据则采用关系型数据库连接器进行提取,若识别为非结构化数据则启用文档解析模块进行内容提取,获得包含元数据标签的初始数据集合;根据预先建立的数据标准化规则库对初始数据集合进行格式转换和字段映射,通过数据清洗算法剔除重复记录和异常值,采用朴素贝叶斯分类器对数据质量等级进行自动评估,若数据质量分数低于预设阈值则触发数据修复流程,获得符合统一标准的规范化数据。本发明有效提升了数据管理的规范性和价值利用效率。