一种基于样本贡献感知的低资源语言图文识别方法、电子设备及计算机可读储存介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于样本贡献感知的低资源语言图文识别方法、电子设备及计算机可读储存介质
申请号:CN202510104489
申请日期:2025-01-23
公开号:CN119942563B
公开日期:2025-10-24
类型:发明专利
摘要
本发明涉及一种基于样本贡献感知的低资源语言图文识别方法、电子设备及计算机可读储存介质,属于模型训练技术领域,通过获取待识别的低资源语言文本图像集合,并对其中少量的文本图像进行标注;使用带标注的文本图像集合训练文本识别网络;使用多个迭代步骤逐批地从未标注样本中选择贡献度最高的样本组并进行标注;通过弹性权重整合算法使用新标注的样本组对文本识别网络进行增量学习训练,并继续执行迭代,直到标注成本达到限定值;利用训练好的文本图像识别网络对任意输入的文本图像进行识别,输出识别结果。本发明可以在训练集图像标注成本有限的情况下,提升低资源语言图文识别模型的识别准确率。
技术关键词
图文识别方法 样本 计算机可读储存介质 视觉特征 文本图像识别 文本识别 模型训练技术 低资源语言 解码模块 电子设备 可读存储介质 识别标签 处理器 网络节点 存储器
系统为您推荐了相关专利信息
热值预测方法 城市固体废物 垃圾存储 入炉垃圾焚烧热值 视觉特征提取
高陡边坡 神经网络模型 可执行程序代码 图像 预警方法
卫星电源系统 多策略融合 故障诊断方法 深度学习模型 故障诊断模型
电池 计算方法 算法 误差 可读存储介质
路径规划方法 鲁棒性 强化学习模型 网络结构 误差