摘要
本发明公开了结合OCR识别的PDF文档智能检索方法及系统,涉及光学字符识别技术领域,方法包括:在信息化平台输入检索词条,执行词条转换与OCR增强,确定增强词条体系;再对其设定跳视检索机制,生成基于概念变迁路径的动态检索链;最后通过交互线程写入寄存器,在文档数据库内进行动态OCR检索,确定并弹窗显示PDF检索单。本发明解决了传统PDF文档检索方法难以处理多源异构PDF中的图像化文字等内容,导致数据处理后的检索结果片面、关联性弱,无法满足精准高效的检索的技术问题,达到了对多源异构PDF中图像化文字等内容的有效处理,使数据处理后的检索结果更全面、关联性更强,满足精准高效检索的技术效果。