结合OCR识别的PDF文档智能检索方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
结合OCR识别的PDF文档智能检索方法及系统
申请号:CN202511484590
申请日期:2025-10-17
公开号:CN121030070A
公开日期:2025-11-28
类型:发明专利
摘要
本发明公开了结合OCR识别的PDF文档智能检索方法及系统,涉及光学字符识别技术领域,方法包括:在信息化平台输入检索词条,执行词条转换与OCR增强,确定增强词条体系;再对其设定跳视检索机制,生成基于概念变迁路径的动态检索链;最后通过交互线程写入寄存器,在文档数据库内进行动态OCR检索,确定并弹窗显示PDF检索单。本发明解决了传统PDF文档检索方法难以处理多源异构PDF中的图像化文字等内容,导致数据处理后的检索结果片面、关联性弱,无法满足精准高效的检索的技术问题,达到了对多源异构PDF中图像化文字等内容的有效处理,使数据处理后的检索结果更全面、关联性更强,满足精准高效检索的技术效果。
技术关键词
智能检索方法 统一数据接口 信息化平台 焦点 概念 动态光学 级联 光学字符识别技术 智能检索系统 文档检索方法 机制 节点 异构 语义 网络架构 信号 模块