基于OCR识别解析PDF文本、图片方法、设备和存储介质

申请号：CN202411838073

申请日期：2024-12-13

公开号：CN119672747A

公开日期：2025-03-21

类型：发明专利

摘要

发明公开了基于OCR识别解析PDF文本、图片方法、设备和存储介质，具体涉及文本图片处理领域，其中基于OCR识别解析PDF文本、图片方法，包括如下步骤：步骤S100，加载PDF文档，进行页面解析，提取页面元素，并处理页面布局信息；步骤S200，针对提取出的图片或扫描生成的PDF页面，利用深度学习模型进行高精度OCR识别，将图像中的文字转换为可编辑的文本。本发明实现了对PDF文档中复杂文本和图片内容的高效、精确解析，该技术方案不仅提升了解析精度与效率，增强了系统的灵活性与可扩展性，还促进了文档数字化与智能化应用的发展，同时，通过节约资源与时间成本，为企业和个人用户带来了显著的经济效益。

技术关键词

图片方法深度学习模型 OCR识别模型修正错别字格式化表格扫描页面读取页面可读存储介质文本段落逻辑布局结构训练集字符识别元素电子设备