一种基于深度学习的表格文本检测与识别方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于深度学习的表格文本检测与识别方法及系统
申请号:CN202410924916
申请日期:2024-07-11
公开号:CN118968533A
公开日期:2024-11-15
类型:发明专利
摘要
本发明公开一种基于深度学习的表格文本检测与识别方法及系统,涉及表格文本检测与识别技术领域,方法包括:基于深度学习框架,构建并优化单元格检测模型和文字识别模型;利用检测模型检测输入图像中的表格,提取表格中包含的所有单元格,并进行倾斜矫正;利用识别模型识别输入图像中的文本框及其文字信息;对单元格进行分簇处理,识别图片上的所有独立表格;应用Cell坐标聚合算法,将文本框与单元格匹配,获取单元格文本信息;使用密度聚类算法,将表格线合并为垂直线和水平线并排序,将水平线和垂直线的索引从0开始编号;按照行索引对单元格进行排序,并输出每个单元格的行和列信息。本发明可以提高表格文本检测识别的效率和准确性。
技术关键词
表格 密度聚类算法 索引数据结构 文本 识别方法 深度学习框架 坐标 识别系统 扫描线算法 深度优先遍历 索引方式 图像 排序算法 顶点 处理单元 识别模块 图片 列表
系统为您推荐了相关专利信息
文档检索方法 文档关键词 样本 维基百科 文档检索系统
端点 坐标 边界线识别 表格 方程
交易检测方法 节点特征 金融 注意力 编码
生成方法 编辑 计算机可读指令 标记 图像生成技术
隧道缺陷 识别方法 多尺度谱聚类 平均Hausdorff距离 神经网络算法