一种文档信息提取方法及设备
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种文档信息提取方法及设备
申请号:
CN202411925007
申请日期:
2024-12-25
公开号:
CN119851290A
公开日期:
2025-04-18
类型:
发明专利
摘要
本申请提出了一种创新的解决方案,在原有OCR文本框检测、文字识别提取的二阶方法之上,扩展图片文档分版面内信息的关系逻辑识别提取的高阶处理能力,能够充分利用文档的视觉特征和语义特征,在较少样本的情况下训练出效果很好的模型,且具备较强的泛化能力,从而快速满足企业中复杂版面文档信息抽取的需求。
技术关键词
文本
文档结构化信息
排版
信息提取方法
图像语义分割
表格
切片
样本
语义特征
线框
编码器
参数
视觉特征
算法
线条
计算机设备
关系
存储器
滤波
处理器