检测媒体字体素材的方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
检测媒体字体素材的方法及装置
申请号:CN202510834079
申请日期:2025-06-20
公开号:CN120808368A
公开日期:2025-10-17
类型:发明专利
摘要
本发明公开了一种检测媒体字体素材的方法,结合特征金字塔网络(FPN)、通道注意力机制(SE Block)和自注意力机制(Self‑Attention),极大增强了模型在多种复杂场景下的泛化能力和适应性。FPN 提供了多尺度特征融合,使模型能够在不同的分辨率下处理文本颜色信息;SE Block 通过调整特定通道的权重,增强了模型对关键颜色通道的感知能力;Self‑Attention 则进一步捕捉图像中全局颜色的相关性,确保模型在不同颜色分布和复杂背景下仍能稳定提取颜色信息。这种多模块的协同工作有效提升了模型的整体性能,能够应对多种类型的文本和背景颜色组合,确保在多种复杂场景中都能准确识别出背景色、填充色和描边色。
技术关键词
通道注意力机制 颜色 特征金字塔网络 深度学习模型 加权特征 生成多尺度 字体 媒体 图像 标签 全局平均池化 文本 特征提取模块 数据处理模块 像素 多模块 调度器