提取文本文档表格中单元格内容的方法、设备和存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
提取文本文档表格中单元格内容的方法、设备和存储介质
申请号:CN202510991269
申请日期:2025-07-18
公开号:CN120745577A
公开日期:2025-10-03
类型:发明专利
摘要
本发明公开了一种提取文本文档表格中单元格内容的方法、设备和存储介质,预设多组参数;基于Python win32com库调用文本文档应用软件提供的编程接口读取文本文档;将所述文本文档中的表格内容转换为一段连续的字符串,通过字符串匹配确定包含所述关键词的表格为目标表格;基于Python win32com库复制目标表格得到第一数据表,遍历所述第一数据表每个单元格,并使用二维数组存储第一数据表各单元格内容;基于二维数组,查找要提取的内容。本发明的优点在于利用文本文档应用软件自带的功能接口就能完成对文本文档内单元格内容的批量化提取,不需要使用OCR技术对文本文档进行转换和训练人工智能模型,具有很强的通用性,对表格的形式没有具体的要求,使用灵活,成本低。
技术关键词
关键词 表格 计算机程序指令 合并单元格 训练人工智能模型 参数 处理器 元素 编程 可读存储介质 接口 存储器 批量 数据