基于Transformer架构的自动化票据信息处理方法
申请号:CN202510351830
申请日期:2025-03-24
公开号:CN119863807A
公开日期:2025-04-22
类型:发明专利
摘要
本发明公开了基于Transformer架构的自动化票据信息处理方法,包括以下步骤:输入票据图像,并进行分块预处理,形成多个图像块;将每个图像块映射到更小的向量空间,然后结合位置信息,形成每个图像块的向量序列;Transformer编码器对每个图像块的向量序列进行两个阶段的特征提取;然后输出向量经过一个额外的线性层;最后通过softmax函数完成对票据文字信息的分类和提取,并根据其输出向量的概率分布选择置信度最高的文字类别作为预测;对序列文字采用递归预测法,直至出现终止符,最后生成完整的票据文字内容。本发明具有针对票据版式多样性的高适应性,能够显著提升处理效率和实时性,且具有较强的模型泛化能力。
技术关键词
票据信息处理方法
前馈神经网络
图像块
编码器
序列
高维特征向量
矩阵
分块
注意力机制
非线性
程序
处理器
服务器
字符
可读存储介质
存储器