摘要
本申请提供了一种正文和水印的识别方法、装置及应用方法,基于正文和水印的文本行在倾斜角度上的差异,能够高效准确区分并识别文档图像中的正文和水印,从而提高OCR识别的准确性。还能支持图像角度校正、含有水印信息的版面恢复等应用。方法包括:获取待处理文档图像;对待处理文档图像以文本行为目标利用深度学习模型进行目标检测,得到各文本行在图像中的位置信息,文本行为图像中包含文本的矩形区域;根据各文本行的位置信息,确定各文本行相比于水平方向的倾斜角度;根据各文本行的倾斜角度的差异,确定第一集合和第二集合,第一集合包含内容为正文文本的文本行,第二集合包含内容为水印文本的文本行。