摘要
本申请涉及知识图谱领域,公开了一种企业地址数据处理及预测的方法和系统,该方法包括通过清洗多源异构地址数据构建知识库并训练嵌入增强模型,采用Word‑Pi ece算法和领域扩展词典进行多粒度分词,将结果输入模型生成初始层级标签序列,经地名识别模型校验补全后,基于优先级融合规则输出标准化结构化地址;该系统包括数据清洗与知识库构建模块,层级预测模型训练模块,多粒度分词模块,层级预测模块,层级校验与融合模块,分布式计算集群。本发明通过融合语义与地理特征提升解析准确性,结合动态知识库适应行政区划变更;采用分布式计算与加速技术优化处理效率;通过自动化校验减少人工干预,并生成标准化地址数据。