一种基于视觉状态空间的表格结构识别方法及系统
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种基于视觉状态空间的表格结构识别方法及系统
申请号:
CN202510907398
申请日期:
2025-07-02
公开号:
CN120412001B
公开日期:
2025-08-29
类型:
发明专利
摘要
本发明公开了一种基于视觉状态空间的表格结构识别方法及系统,所述方法包括:获取表格图像数据;构建表格结构识别模型,所述模型包括图像分割模块、线性模块、视觉状态空间模块、稀疏专家模块、图像文本融合模块、激活函数ReLU、Mamba模块以及序列预测模块;将获取的表格图像数据输入所述表格结构识别模型,识别得到表格图像数据对应的结构化标记序列。本发明提供的方法及系统,能在保持长距离依赖构建能力的前提下减少计算资源消耗,实现对表格结构的精确识别。
技术关键词
表格
结构识别方法
线性模块
空间模块
图像分割
文本
融合视觉特征
局部视觉特征
序列特征
标签
标记
样本
生成训练数据