摘要
本发明涉及电力数据管理的技术领域,公开了一种用于电力企业数据资源的规范方法,包括:采集来自电力企业不同系统、设备和部门的多源异构数据;利用数据融合技术,对多源异构数据进行识别、融合处理,生成多源异构融合数据;对多源异构融合数据进行数据清洗后,结合格式转换算法对其进行格式转换,生成文本数据;利用自然语言处理技术对文本数据进行文本分析,结合分类模型生成标签和分类结果;将标签和分类后的数据存储于标准化数据库中,以便于快速检索和应用。本发明能够高效地采集、识别和融合多源异构数据,并通过自然语言处理技术实现文本数据的分析与分类,将规范化的数据存储于标准化数据库中,便于快速检索和应用。