摘要
本发明提供一种自然场景下文档类财务报告识别方法及装置,包括:接收待识别的财务报告文件,将其转换为图像格式,得到财报图像;对财报图像进行方向矫正,并擦除覆盖在财报图像上的遮盖物;采用第一预设深度学习算法检测财务图像上的表格的位置,并裁剪出表格区域;在表格区域中,采用第二预设深度学习算法检测表结构的单元线,根据所述单元线划分单元格;对每个单元格进行中心化处理,以提取每个单元格的信息;对提取得到的信息按照科目类别进行标准化,以统一描述形式,得到识别结果;根据业务场景,将识别结果进行结构化输出。本发明提供的方法能够在复杂环境下准确检测并识别财务报告文档中的关键信息,实现自动化地文档管理和处理。