一种基于摘要树的大数据差异检测方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于摘要树的大数据差异检测方法
申请号:CN202411815960
申请日期:2024-12-11
公开号:CN119759901A
公开日期:2025-04-04
类型:发明专利
摘要
本发明涉及一种基于摘要树的大数据差异检测方法,具体涉及大数据分析领域,将大数据集按照时间序列和地理位置进行划分,对每个大数据块应用哈希函数生成唯一的哈希值,作为该大数据块的唯一标识符并表示为大数据块摘要,将生成的大数据块摘要作为节点从下至上采用平衡二叉树算法构建一棵摘要树,利用深度优先方式逐层比较摘要树的节点,判断摘要树结构并比较两个摘要树节点的摘要信息,分析两个大数据集的摘要树存在的差异原因,反馈具体的差异数据,并创建可视化界面展示差异点的位置和数据内容,利用Z‑score算法实现存储数据集转换为具有零均值和单位标准差的标准正态分布,在选定的数据库管理系统中创建三维差异数据存储表实现数据存储管理。
技术关键词
摘要 差异检测方法 节点 大数据 平衡二叉树 创建可视化界面 数据库管理系统 数据存储管理 交互式可视化 信息比 数据库表结构 算法 标识符 邻居 标记 序列 因子