摘要
本申请属于工程能源行业技术领域。一种工程能源行业设备文档与图纸位号自动提取系统,包括文档图纸上传模块,用于将待处理的文件上传至系统;文档图纸预处理模块,用于对上传的文件进行预处理,得到目标文件;文档图纸OCR模块,用于对目标文件,进行OCR识别,提取文件中的文字,得到文字信息;位号信息提取模块,用于根据预设规则,对文字信息进行匹配,并提取,得到符合预设规则的位号信息;位号位置定位模块,用于将位号信息,定位到目标文件的位号位置,得到位号位置信息;位号准确率匹配模块,用于将位号信息与现有的位号库中的位号进行相似度匹配,得到相似度最高的位号信息;提取结果存储模块,用于位置信息进行存储。