一种基于视觉状态空间的表格结构识别方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于视觉状态空间的表格结构识别方法及系统
申请号:CN202510907398
申请日期:2025-07-02
公开号:CN120412001B
公开日期:2025-08-29
类型:发明专利
摘要
本发明公开了一种基于视觉状态空间的表格结构识别方法及系统,所述方法包括:获取表格图像数据;构建表格结构识别模型,所述模型包括图像分割模块、线性模块、视觉状态空间模块、稀疏专家模块、图像文本融合模块、激活函数ReLU、Mamba模块以及序列预测模块;将获取的表格图像数据输入所述表格结构识别模型,识别得到表格图像数据对应的结构化标记序列。本发明提供的方法及系统,能在保持长距离依赖构建能力的前提下减少计算资源消耗,实现对表格结构的精确识别。
技术关键词
表格 结构识别方法 线性模块 空间模块 图像分割 文本 融合视觉特征 局部视觉特征 序列特征 标签 标记 样本 生成训练数据