摘要
本发明公开了一种工程图纸表格识别与设备数据自动校核方法,通过表格目标识别确定工程图纸中的表格位置;解析表格结构以明确各单元格的位置关系;利用RapidOCR进行文字识别,将提取的文本与单元格对应形成结构化表格数据;基于改进布谷鸟的语义相似度算法,对解析出的表格内容的总材料清册与分材料清册的数据进行匹配和一致性验证,最终输出核对结果。本发明针对表格结构识别采用分治法对大尺寸表格进行切割处理后再合并,有效提高了表格结构识别的准确率;同时,结合余弦相似度和词向量语义相似度的方法评价设备名称的相似性,增强了布谷鸟算法的局部搜索能力和跳出局部最优的能力,从而提升了设备名称匹配的准确率。