摘要
本申请涉及网表识别技术领域,公开一种类型识别模型的训练方法、确定表单类型的方法、设备。类型识别模型的训练方法包括:获取多个标注有表单类型的网页表单样本数据;从各网页表单样本数据中提取若干种表单特征;表单特征为描述表单设置情况的信息;构建综合识别模型,利用表单特征对综合识别模型进行训练,获得类型识别模型;类型识别模型用于识别网页表单的表单类型。这样,通过训练类型识别模型,使得用户利用该类型识别模型对网页表单进行识别时,能够提高识别表单的表单类型的效率。同时,即便表单在展现形式上做出调整,类型识别模型依然能够准确的识别出网页表单的表单类型,进而使得后续按照表单类型对网页表单进行分类的效果较好。