摘要
本申请公开了一种证件识别方法、装置、设备及存储介质。包括:获取待识别的证件图片,识别证件图片中的文本内容和文本位置;基于文本内容和文本位置,确定待识别的字段名称;基于待识别的字段名称,获取字段名称对应的字段内容的预设位置区域,基于预设规则对位置区域进行扩充,得到目标区域;将字段名称与对应的目标区域内的文本组成特征数据,将特征数据输入预训练的增强大语言模型,得到证件识别结果。通过精准定位文本内容与位置,确定字段名称及其预设位置区域,可以在证件图片出现一定扭曲和字段内容发生一定错位的情况下,对证件进行精准识别,利用大语言模型的广义知识理解能力,能更好地处理字段内容串行等复杂情况。