一种建筑行业通信项目合同扫描件的智能识别与导入方法
申请号:CN202510764645
申请日期:2025-06-09
公开号:CN120671651A
公开日期:2025-09-19
类型:发明专利
摘要
本发明涉及一种建筑行业通信项目合同扫描件的智能识别与导入方法,包括:获取目标模板及待处理合同扫描件,对合同扫描件进行预处理,对目标模板进行结构化解析,提取字段标准值并标记字段类型,生成字段类型映射表;将预处理后的合同扫描件输入多模态特征解析模型中,获取合同信息提取集;将合同信息提取集与字段类型映射表进行语义匹配,生成字段匹配结果,将匹配成功的合同信息输入目标模板中;若必须字段缺失,通过实体识别与链接技术从动态知识库中检索关联历史信息,获取缺失宇段映射的合同信息,并将缺失宇段映射的合同信息输入目标模板中。本发明提高了识别正确率,降低了人工成本。
技术关键词
字段
模板
项目
语义
链接技术
多模态特征
编辑距离算法
文本
BERT模型
识别正确率
视觉
动态
实体
标记
企业
日期
数据
分支
标识符