一种文档信息提取方法及设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种文档信息提取方法及设备
申请号:CN202411925007
申请日期:2024-12-25
公开号:CN119851290A
公开日期:2025-04-18
类型:发明专利
摘要
本申请提出了一种创新的解决方案,在原有OCR文本框检测、文字识别提取的二阶方法之上,扩展图片文档分版面内信息的关系逻辑识别提取的高阶处理能力,能够充分利用文档的视觉特征和语义特征,在较少样本的情况下训练出效果很好的模型,且具备较强的泛化能力,从而快速满足企业中复杂版面文档信息抽取的需求。
技术关键词
文本 文档结构化信息 排版 信息提取方法 图像语义分割 表格 切片 样本 语义特征 线框 编码器 参数 视觉特征 算法 线条 计算机设备 关系 存储器 滤波 处理器