摘要
本发明属于数据安全技术领域,提出一种基于数据集中度的数据风险评估方法,该方法制定数据分类分级规则表,据此对结构化数据表的字段数据构建数据分类分级树,同时,将新的字段数据利用BERT模型插入数据分类分级树,根据数据分类分级树中字段数据的隐私级别赋予叶子节点权重,得到数据加权分类分级树,用广度优先搜索算法求数据加权分类分级树中任意两个叶子节点的最短路径距离,结合节点权重算出加权距离,构建叶子对加权距离集合,据此计算加权距离均值并取倒数,得到数据集中度指标,将风险评估阈值对比数据集中度指标,确定数据风险等级,并据此从预定义策略库中获取安全策略。该方法可科学评估数据泄露风险,为数据安全管理提供有力支持。