基于OCR识别解析PDF文本、图片方法、设备和存储介质
申请号:CN202411838073
申请日期:2024-12-13
公开号:CN119672747A
公开日期:2025-03-21
类型:发明专利
摘要
发明公开了基于OCR识别解析PDF文本、图片方法、设备和存储介质,具体涉及文本图片处理领域,其中基于OCR识别解析PDF文本、图片方法,包括如下步骤:步骤S100,加载PDF文档,进行页面解析,提取页面元素,并处理页面布局信息;步骤S200,针对提取出的图片或扫描生成的PDF页面,利用深度学习模型进行高精度OCR识别,将图像中的文字转换为可编辑的文本。本发明实现了对PDF文档中复杂文本和图片内容的高效、精确解析,该技术方案不仅提升了解析精度与效率,增强了系统的灵活性与可扩展性,还促进了文档数字化与智能化应用的发展,同时,通过节约资源与时间成本,为企业和个人用户带来了显著的经济效益。
技术关键词
图片方法
深度学习模型
OCR识别模型
修正错别字
格式化
表格
扫描页面
读取页面
可读存储介质
文本段落
逻辑
布局结构
训练集
字符识别
元素
电子设备