一种合同数据识别提取方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种合同数据识别提取方法及系统
申请号:CN202411724106
申请日期:2024-11-28
公开号:CN119672725A
公开日期:2025-03-21
类型:发明专利
摘要
本发明提供一种合同数据识别提取方法及系统,构建合同图像数据集后将合同图像数据集划分为训练集和测试集;采用重新排列的CRNN特征序列化对合同图像进行文本行处理;基于FPN网络构建文字识别模型和数字识别模型;利用加权融合将文字识别模型和数字识别模型提取的特征合并成一个特征向量,构建CNN‑RECR模型后,将训练集输入模型中进行训练;将训练集和测试集分别输入训练后的模型,进行合同数据识别提取。本发明应用残差结构单元将特征向量转换为多维形式,以获取语句结构的分布情况,将文字识别模型以及数字识别模型融合后引入哈希层结合得到CNN‑RECR模型,通过将高维特征映射为低维的二进制码,有助于降低存储需求。
技术关键词
识别提取方法 文本行 数据 图像 训练集 结构单元 模型训练模块 生成哈希 测试模块 网络 符号 编码 语句 标签 像素 数值