摘要
本发明公开了一种基于定值单模板的定值单PDF文件定值解析方法,基于收集的定值单样本构建定值单解析模板文件,定值单解析模板文件包括:公共信息关键字解析模板、信息区域划分基准文字模板、属性语义解析模板、杂质过滤规则模板、定值取值策略模板;并建立比对标准数据库;利用定值单解析模板文件对待处理的定值单PDF文件进行逐行解析;基于比对标准数据库对定值单PDF文件的解析结果进行核对,并发送相应提示或预警信息。本发明自动化的解析流程大大缩短了定值单处理时间且通过构建定值单解析模板文件使字符识别准确率显著提高。