摘要
本发明涉及技术领域,具体为一种基于深度学习的离线手写数学公式识别方法,包括数据采集处理、公式检测与符号分割、符号特征提取识别、结构分析重构以及评估优化。该基于深度学习的离线手写数学公式识别方法,通过采用分解重组提升模型对部分遮挡的鲁棒性,以局部畸变模拟真实手写形变,利用全局畸变增强泛化能力,根据CLAHE均衡化改善低对比度图像,减少光照影响,确保公式数据增强多样化处理,通过YOLOv5定位公式区域,根据U‑Net精准分割处理粘连符号并采用Transformer提取全局特征,通过调用Tesseract OCR并自定义符号库,将OCR与规则引擎结合能够提升特殊符号识别率,通过语法树与PCFG解析,递归下降生成语法树选择最优结构,并精准解析二维布局。