一种基于计数模块的手写数学公式多尺度识别方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于计数模块的手写数学公式多尺度识别方法
申请号:CN202411455744
申请日期:2024-10-18
公开号:CN118968528B
公开日期:2025-01-28
类型:发明专利
摘要
一种基于计数模块的手写数学公式多尺度识别方法,涉及图像识别技术领域,解决现有技术针对手写体数字识别模型存在的识别准确性低的问题,本方法通过构建手写数学公式图像数据集,将手写数学公式图像输入构建基于计数模块的手写数学公式识别模型,采用ResNet对处理后的图像数据集中手写数学公式图像提取特征图,采用符号计数模块对特征图添加全局信息,通过LSTM输出预测的LaTeX序列。本方法将手写数学公式识别建模为一个图像至序列的任务。利用编码器被用于提取输入图像的特征,而解码器则逐步预测对应LaTeX序列。本方法有效地将手写数学公式识别问题转化为一个端到端的序列生成问题,简化了问题的复杂性。
技术关键词
多尺度识别方法 符号特征 手写数学公式识别 ResNet网络 图像提取特征 模块 手写体数字识别 序列 编码器 注意力 输入解码器 图像识别技术 通道 数据 元素