摘要
本发明公开一种基于深度学习的表格文本检测与识别方法及系统,涉及表格文本检测与识别技术领域,方法包括:基于深度学习框架,构建并优化单元格检测模型和文字识别模型;利用检测模型检测输入图像中的表格,提取表格中包含的所有单元格,并进行倾斜矫正;利用识别模型识别输入图像中的文本框及其文字信息;对单元格进行分簇处理,识别图片上的所有独立表格;应用Cell坐标聚合算法,将文本框与单元格匹配,获取单元格文本信息;使用密度聚类算法,将表格线合并为垂直线和水平线并排序,将水平线和垂直线的索引从0开始编号;按照行索引对单元格进行排序,并输出每个单元格的行和列信息。本发明可以提高表格文本检测识别的效率和准确性。