一种面向少数民族文献文字识别的方法、装置、存储介质及计算机设备
申请号:CN202510607937
申请日期:2025-05-13
公开号:CN120913227A
公开日期:2025-11-07
类型:发明专利
摘要
本发明公开了一种用于面向少数民族文献文字识别的方法、装置、工作介质及计算机设备。该方法包括以下步骤:S1、收集并标注少数民族文献文字图像样本,对图像进行预处理,构成数据集;S2、构建注意力机制增强的神经网络模型,神经网络模型包括依次连接的输入层、共享特征提取模块、注意力机制增强的特征融合模块和输出层;S3、采用多任务学习训练注意力机制对神经网络模型进行练,以对神经网络模型进行优化;S4、部署优化后的神经网络模型,以对少数民族文献图像进行文字区域检测和几何属性预测,得到少数民族文献文字检测识别结果。本发明同时利用图像特征和几何特征进行预测,提高了水书文献的检测精度。
技术关键词
神经网络模型
注意力机制
特征提取模块
训练注意力
图像
计算机设备
文字识别装置
多任务
执行存储器存储
文本
样本
通道
后处理模块
多尺度
数据处理模块
处理器
残差网络