基于多级分类标引的公文文档智能切片处理方法及系统

申请号：CN202510764975

申请日期：2025-06-10

公开号：CN120656187A

公开日期：2025-09-16

类型：发明专利

摘要

本发明公开了基于多级分类标引的公文文档智能切片处理方法及系统，涉及公文文档切片处理技术领域，包括通过API接口获取公文文档的扫描件进行预处理，得到图像页面；使用PyTorch加载Swin‑B模型，并将图像页面作为输入，输出特征图进行划分，并定义为条带，利用平均池化操作压缩条带的高度维度，并结合L2范数计算条带的横向特征密度，使用网格生成法生成条带内像素点坐标，并通过poly2mask函数生成条带的空间掩膜，结合指示函数进行像素点筛选，计算距离权重，并构建加权核函数后结合特征密度，筛选有效条带；本发明显著提升了切片结果的完整性与准确性。

技术关键词

文本特征向量 Viterbi算法切片条带横向特征语义向量注意力初始聚类中心像素点定义输出特征标签页面视觉序列 BERT模型基础图像