摘要
本发明涉及数据处理技术领域,具体涉及一种数据发现与识别的方法,包括以下步骤:通过基于机器学习和深度学习的混合算法对网络环境中的数据源进行扫描和识别,采用自动特征工程技术提取数据源的关键特性,并将其存储在特性库中,利用自适应分类算法结合模糊逻辑和贝叶斯分类器,将数据源分类为结构化数据、半结构化数据和非结构化数据,并进行自动标记,对分类后的数据源进行质量评估,并生成优先级列表,对高优先级的数据源进行数据抽取、数据转换和数据加载,确保整合后的数据具备高一致性和高可靠性。本发明方法通过系统化的流程,实现了数据源的智能化发现、精准分类、动态评估和高效整合,适用于大数据环境下的数据管理和业务决策支持。