一种基于提示分割任务的混合监督文本检测方法

申请号：CN202410835540

申请日期：2024-06-26

公开号：CN118781606A

公开日期：2024-10-15

类型：发明专利

摘要

本发明涉及一种基于提示分割任务的混合监督文本检测方法，包括S1构建包括图像编码器，提示编码器和掩码解码器的混合监督文本检测模型TextSAM，TextSAM采用混合监督的训练模式，其训练数据集包含部分全监督数据集合和部分弱监督数据集合当时，即进行全监督训练；当时，即进行弱监督训练。将一张图像输入训练好的TextSAM，输出即是对该图像的预测标签。经过实验证明混合监督训练模式下，仅使用25％的全监督数据和75％的弱监督数据，TextSAM就能取得接近100％全监督数据时的性能，从而减少对标注数据的依赖。

技术关键词

文本检测方法标签教师图像编码器文本检测模型学生数据网络解码器计算方法梯度下降法轮廓因子分支参数模式