一种文档文件的表格识别方法及相关装置

申请号：CN202510016587

申请日期：2025-01-06

公开号：CN119445601B

公开日期：2025-04-25

类型：发明专利

摘要

本申请公开一种文档文件的表格识别方法及相关装置，涉及计算机应用与人工智能领域，所述方法包括：将待处理文档文件的页面转换成第一图像；对第一图像进行图像增强得到第二图像；利用目标智能体对第二图像进行表格检测，得到表格区域位置信息；目标智能体包括基于双支路模型调优构建的表格检测模型，目标智能体的第一支路用于学习与提取表格的结构性特征，第二支路用于学习与提取表格的文本语义特征；识别所述表格区域位置信息所指示表格区域中的表格数据，并将表格数据转换为结构化形式进行输出。本申请通过在表格识别中结合使用图像增强处理和基于深度学习的双支路模型调优等技术，可实现对文档文件进行高精度、高效率、高适应性的表格识别。

技术关键词

深度学习模型表格识别方法二值化图像区域位置信息语义特征颜色卷积神经网络提取文本轮廓信息图像转换模块像素图像增强模块对比度样本校正数据支路