一种基于样本贡献感知的低资源语言图文识别方法、电子设备及计算机可读储存介质
申请号:CN202510104489
申请日期:2025-01-23
公开号:CN119942563B
公开日期:2025-10-24
类型:发明专利
摘要
本发明涉及一种基于样本贡献感知的低资源语言图文识别方法、电子设备及计算机可读储存介质,属于模型训练技术领域,通过获取待识别的低资源语言文本图像集合,并对其中少量的文本图像进行标注;使用带标注的文本图像集合训练文本识别网络;使用多个迭代步骤逐批地从未标注样本中选择贡献度最高的样本组并进行标注;通过弹性权重整合算法使用新标注的样本组对文本识别网络进行增量学习训练,并继续执行迭代,直到标注成本达到限定值;利用训练好的文本图像识别网络对任意输入的文本图像进行识别,输出识别结果。本发明可以在训练集图像标注成本有限的情况下,提升低资源语言图文识别模型的识别准确率。
技术关键词
图文识别方法
样本
计算机可读储存介质
视觉特征
文本图像识别
文本识别
模型训练技术
低资源语言
解码模块
电子设备
可读存储介质
识别标签
处理器
网络节点
存储器