一种面向不完整文本图像的图像修复方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种面向不完整文本图像的图像修复方法
申请号:CN202411850294
申请日期:2024-12-16
公开号:CN119887586B
公开日期:2025-11-28
类型:发明专利
摘要
本发明公开了一种面向不完整文本图像的图像修复方法。该方法主要包括两个阶段:文本结构重建和文本图像重建。在文本结构重建阶段,接收不完整文本图像作为输入,并通过编码器、中间模块和解码器的协同工作,实现文本结构的精确分割与预测,从而获得完整文本结构二进制图像。随后,在文本图像重建阶段,将重建后的完整文本结构图像与原始不完整文本图像共同作为条件输入。该阶段由识别引导模型和扩散模型组成。识别引导模型,即场景文本识别器,它通过分析不完整文本图像,预测每个字符属于特定字符集的概率分布,为文本修复提供语义指导。在语义指导的基础上,扩散模型对不完整文本图像进行精细化修复,显著提升了文本区域的可读性和图像的保真度。
技术关键词
图像修复方法 图像重建 识别器 编码器 解码器 文本识别 通道注意力机制 噪声参数 阶段 数据分布 语义特征 分辨率 场景 字符 超参数