一种正文和水印的识别方法、装置及应用方法

申请号：CN202510832182

申请日期：2025-06-20

公开号：CN120726638A

公开日期：2025-09-30

类型：发明专利

摘要

本申请提供了一种正文和水印的识别方法、装置及应用方法，基于正文和水印的文本行在倾斜角度上的差异，能够高效准确区分并识别文档图像中的正文和水印，从而提高OCR识别的准确性。还能支持图像角度校正、含有水印信息的版面恢复等应用。方法包括：获取待处理文档图像；对待处理文档图像以文本行为目标利用深度学习模型进行目标检测，得到各文本行在图像中的位置信息，文本行为图像中包含文本的矩形区域；根据各文本行的位置信息，确定各文本行相比于水平方向的倾斜角度；根据各文本行的倾斜角度的差异，确定第一集合和第二集合，第一集合包含内容为正文文本的文本行，第二集合包含内容为水印文本的文本行。

技术关键词

文本行水印光学字符识别校正识别文档图像识别方法训练深度学习模型基准图像获取模块样本分布特征识别装置像素曲线矩形数据