摘要
本发明提供了一种数学表达式识别模型构建、识别方法、装置和存储介质,涉及数据处理的技术领域,包括:获取公式数据集,对每个所述目标数学表达式进行分词,基于词元与索引值的映射关系构建词典,并设置编译规则,利用最大正向匹配算法基于所述词典和所述编译规则将所述目标数学表达式编译为索引值序列,生成至少一个第一目标LaTex标签,基于所述第一目标LaTex标签生成第一目标图像,将所述第一目标LaTex标签和所述第一目标图像输入至数学表达式识别模型中进行训练,通过本申请解决了现有技术中LaTeX标签序列无法表达一些特殊字符和字典膨胀的技术问题,减少了模型的计算量,相较于注意力机制的编码器-解码器,提升了模型的精度。