摘要
本申请公开了一种去除文档图像透字的方法。对文档图像进行切边,仅保留文档区域。采用双边滤波方式构建训练数据集。构建一种基于卷积神经网络的深度学习模型,采用一种端到端的强化式NUNet网络结构。采用所述训练数据集对所述深度学习模型进行训练,使其同时对文档图像进行透字去除与图像特征提取;图像特征提取用来在去除透字过程中提升图像的清晰度。采用训练好的所述深度学习模型对输入的文档图像进行处理后输出,所述处理是在去除透字的同时提升图像的清晰度。本申请不仅可以高效的去除文档图像中透字的区域,还可以充分保留文档正面字符,提高文档图像的清晰度和可读性。