摘要
本发明涉及电力数据治理技术领域,提供了一种基于多模态融合的数据库表分类治理方法及系统。该方法包括,提取数据中台中的表信息,包括表的元数据信息和历史sql信息;基于提取到的元数据信息和历史sql信息构建多模态融合的特征向量;针对初始数据中台中已有的数据库表,基于其特征向量,计算每个表特征向量间的距离,采用层次聚类法,对数据表进行聚类分析;针对聚类结果中的每一类数据表,为其指定存储方案,形成已有数据库表的存储方案结果;基于已有数据库表的存储方案结果,构建基于注意力的分类模型;采用分类模型对新加入数据中台的数据库中的表进行分类,确定新加入表的存储方案结果。本发明能够自动为表分配最合理的存储方案。