摘要
本发明涉及一种基于提示分割任务的混合监督文本检测方法,包括S1构建包括图像编码器,提示编码器和掩码解码器的混合监督文本检测模型TextSAM,TextSAM采用混合监督的训练模式,其训练数据集包含部分全监督数据集合和部分弱监督数据集合当时,即进行全监督训练;当时,即进行弱监督训练。将一张图像输入训练好的TextSAM,输出即是对该图像的预测标签。经过实验证明混合监督训练模式下,仅使用25%的全监督数据和75%的弱监督数据,TextSAM就能取得接近100%全监督数据时的性能,从而减少对标注数据的依赖。