文本识别模型的训练方法、装置、设备及存储介质

申请号：CN202511038669

申请日期：2025-07-28

公开号：CN120951995A

公开日期：2025-11-14

类型：发明专利

摘要

本申请公开了一种文本识别模型的训练方法、装置、设备及存储介质，涉及计算机技术领域。所述方法包括：获取训练数据集，训练数据集包括至少一个训练样本，每个训练样本包括样本文本和样本文本对应的样本识别结果；根据样本文本，得到样本文本对应的相关词集合，相关词集合包括至少一个样本词汇，每个样本词汇包括样本文本中至少一个连续的字符；通过文本识别模型根据相关词集合，得到样本文本对应的至少两个预测输出结果；根据样本识别结果和至少两个预测输出结果，调整文本识别模型的参数，得到训练后的文本识别模型。本申请避免了模型虚构的问题，让文本识别模型所提取到的实体识别结果是合理且有事实依据的，提高了实体识别的准确性。

技术关键词

文本识别模型样本实体格式计算机程序产品字符计算机设备模型训练模块可读存储介质参数数据获取模块处理器训练装置输出模块存储器数值