一种基于骨架塑形与字符计数模块的手写数学表达式识别方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于骨架塑形与字符计数模块的手写数学表达式识别方法
申请号:CN202511026414
申请日期:2025-07-24
公开号:CN120524991A
公开日期:2025-08-22
类型:发明专利
摘要
本发明涉及一种基于骨架塑形与字符计数模块的手写数学表达式识别方法,属于深度学习、图像内容识别技术领域。首先,构建编码器‑解码器模型的架构,采用DenseNet作为从图像中提取特征的编码器,采用Transformer作为解码器,通过自注意力机制来捕捉输入序列中的依赖关系。其次,提出一个骨架塑形与字符计数的模块,该模块通过字符频数分布预测模块来预测字符数量信息,通过骨架塑形器来提取表达式结构信息。然后,在结构校准模块中整合结构信息与解码后的特征,使得模型能够根据结构字符位置来确定序列中子结构的空间关系。最后,在数量校准模块中,模型可以利用已知的字符数量来推断最有可能的字符组合,并输出最终预测结果。
技术关键词
表达式 字符 识别方法 解码器模型 数学 编码器 矫正 模块 Softmax函数 序列 符号 图像内容识别 通道注意力机制 解码器架构 整合结构 多层感知机