摘要
本发明公开了一种图纸表格识别系统,包括:图纸坐标获取模块,用于将图纸输入表格区域检测模型,得到图纸中各个单元格的顶点坐标,并根据各个单元格的顶点坐标计算各个单元格的中心点坐标;文本区域检测模块,用于将图纸输入OCR模型,得到图纸中各个文本框的顶点坐标和文本内容,并根据各个文本框的顶点坐标计算各个文本框的中心点坐标;文本框和单元格匹配模块,用于依次计算各个文本框的中心点坐标和各个单元格的中心点坐标之间的距离,将文本框的中心点坐标和单元格的中心点坐标之间距离最小的文本框和单元格匹配。本发明将表格区域检测模型和OCR模型结合,准确的还原文本框和单元格的匹配关系。