一种基于分层上下文感知交互重构的场景文本消隐方法和系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于分层上下文感知交互重构的场景文本消隐方法和系统
申请号:CN202411723997
申请日期:2024-11-28
公开号:CN119648858B
公开日期:2025-12-02
类型:发明专利
摘要
本发明公开了一种基于分层上下文感知交互重构的场景文本消隐方法和系统,方法包括:通过轻量级的共享编码‑分离解码网络进行初步文本定位和文本区域背景重建,预测得到粗略文本掩码和粗略文本擦除图像;使用深度可分离卷积网络对粗略文本掩码进行精细化处理,通过层级掩码解码器对粗略文本掩码进行层级精细化处理;通过U‑Net特征提取器对粗略文本擦除图像进行下采样处理,并根据层级精细掩码逐层学习复杂背景与文本区域的上下文关系,解码出场景文本擦除图像;将原图像与场景文本擦除图像相加,得到最终预测图像。本发明实施例能够提供更准确的文本位置视觉信息来指导文本区域的重建,实现更好的重建效果,可广泛应用于计算机技术领域。
技术关键词
消隐方法 粗略 场景文本图像 层级 解码网络 重构 表达式 图像编码器 解码器 分层 代表 参数 语义特征 通道 特征提取网络