摘要
本说明书实施例公开了一种文档分类方法、装置、设备及介质,包括:获取预先生成的分类语料库;获取指定企业的领域词汇表;基于领域词汇表中的预设词汇与各文档的相关度,得到各文档的关键词;将多个文档特中的训练集文档与测试集文档,分别转化为由训练集文档的关键词的相关度组成的各训练集文档的第一特征向量,以及由测试集文档的关键词的相关度组成的各测试集文档的第二特征向量;基于各训练集文档的第一特征向量,训练得到文档分类器,文档分类器通过机器学习模型构建;基于第二特征向量对文档分类器进行测试评估;若文档分类器通过测试评估,将文档分类器进行部署,以便通过文档分类器对分类语料库的新增文档进行分类。