一种基于提示分割任务的混合监督文本检测方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于提示分割任务的混合监督文本检测方法
申请号:CN202410835540
申请日期:2024-06-26
公开号:CN118781606A
公开日期:2024-10-15
类型:发明专利
摘要
本发明涉及一种基于提示分割任务的混合监督文本检测方法,包括S1构建包括图像编码器,提示编码器和掩码解码器的混合监督文本检测模型TextSAM,TextSAM采用混合监督的训练模式,其训练数据集包含部分全监督数据集合和部分弱监督数据集合当时,即进行全监督训练;当时,即进行弱监督训练。将一张图像输入训练好的TextSAM,输出即是对该图像的预测标签。经过实验证明混合监督训练模式下,仅使用25%的全监督数据和75%的弱监督数据,TextSAM就能取得接近100%全监督数据时的性能,从而减少对标注数据的依赖。
技术关键词
文本检测方法 标签 教师 图像编码器 文本检测模型 学生 数据 网络 解码器 计算方法 梯度下降法 轮廓 因子 分支 参数 模式