一种基于html语义树的可控性表格重建模型的方法、装置及介质
申请号:CN202411696466
申请日期:2024-11-25
公开号:CN119670706A
公开日期:2025-03-21
类型:发明专利
摘要
本发明属于文本处理技术领域,提供了一种基于html语义树的可控性表格重建模型的方法、装置及介质。本发明通过tr个数预测、层次遍历序列两个任务的加入,在学习阶段可以引入更多的html语法树信息,让模型能充分学习表格html语法树的结构;在预测阶段,通过tr个数预测、层次遍历序列,能对模型的结构进行控制,减少错误行数预测的情况。
技术关键词
表格
语义
文本处理技术
解码
序列
标签
存储计算机程序
图片
存储器
编码器
处理器
阶段
可读存储介质