文本识别模型的训练方法、装置、设备及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
文本识别模型的训练方法、装置、设备及存储介质
申请号:CN202511038669
申请日期:2025-07-28
公开号:CN120951995A
公开日期:2025-11-14
类型:发明专利
摘要
本申请公开了一种文本识别模型的训练方法、装置、设备及存储介质,涉及计算机技术领域。所述方法包括:获取训练数据集,训练数据集包括至少一个训练样本,每个训练样本包括样本文本和样本文本对应的样本识别结果;根据样本文本,得到样本文本对应的相关词集合,相关词集合包括至少一个样本词汇,每个样本词汇包括样本文本中至少一个连续的字符;通过文本识别模型根据相关词集合,得到样本文本对应的至少两个预测输出结果;根据样本识别结果和至少两个预测输出结果,调整文本识别模型的参数,得到训练后的文本识别模型。本申请避免了模型虚构的问题,让文本识别模型所提取到的实体识别结果是合理且有事实依据的,提高了实体识别的准确性。
技术关键词
文本识别模型 样本 实体 格式 计算机程序产品 字符 计算机设备 模型训练模块 可读存储介质 参数 数据获取模块 处理器 训练装置 输出模块 存储器 数值