一种自然场景下文档类财务报告识别方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种自然场景下文档类财务报告识别方法及装置
申请号:CN202411122947
申请日期:2024-08-15
公开号:CN119107659A
公开日期:2024-12-10
类型:发明专利
摘要
本发明提供一种自然场景下文档类财务报告识别方法及装置,包括:接收待识别的财务报告文件,将其转换为图像格式,得到财报图像;对财报图像进行方向矫正,并擦除覆盖在财报图像上的遮盖物;采用第一预设深度学习算法检测财务图像上的表格的位置,并裁剪出表格区域;在表格区域中,采用第二预设深度学习算法检测表结构的单元线,根据所述单元线划分单元格;对每个单元格进行中心化处理,以提取每个单元格的信息;对提取得到的信息按照科目类别进行标准化,以统一描述形式,得到识别结果;根据业务场景,将识别结果进行结构化输出。本发明提供的方法能够在复杂环境下准确检测并识别财务报告文档中的关键信息,实现自动化地文档管理和处理。
技术关键词
自然场景 深度学习算法 识别方法 图像 表格 检测表 生成对抗网络训练 矫正 文本分类算法 深度学习训练 财务 印章 识别装置 日期 输出模块 数据项 可读存储介质 对比度