一种文档中表格的识别方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种文档中表格的识别方法
申请号:CN202510498402
申请日期:2025-04-21
公开号:CN120014662B
公开日期:2025-06-20
类型:发明专利
摘要
本发明公开了一种文档中表格的识别方法,涉及表格识别技术领域,通过利用相似性传递性假设,该方法通过计算相邻表格之间的相似度,能够高效地判断不同表格区域是否存在跨页行为。通过设定相似度阈值,该方法能够自动识别相邻表格是否属于同一组表格,从而判断是否存在跨页表格,通过遍历完整表格内的所有单元格,并判断每个单元格是否属于合并单元格的一部分,本发明能够准确区分出空白合并单元格和真正的空白单元格,这一过程使得合并单元格的判定更加细致和准确,避免了传统方法中由于误判合并单元格而导致的数据解析错误。
技术关键词
合并单元格 识别方法 边缘检测 生成表格数据 表格识别技术 像素点 Otsu算法 文本 图像 类间方差 索引 坐标 强度 字体 编辑 变量
系统为您推荐了相关专利信息
语音识别模型 注意力机制 语音识别方法 数据 文本
边界检测方法 对比度 多算法融合 位置校正 红外摄像头
图像分析方法 混凝土 因子 均匀性特征 图像灰度共生矩阵
火焰识别方法 全局结构信息 图像 Sigmoid函数 着色
声学特征 声纹识别装置 声纹识别方法 模型构建方法 声纹识别系统