摘要
本申请公开了一种招投标文本分类方法,包括:获取待处理招投标文本的各个核心词,以各个核心词作为节点构建图结构,获取特征矩阵和共现矩阵;采用第一Transformer网络对特征矩阵进行处理,得到词级编码特征;确定各个句子向量,采用第二Transformer网络对各个句子向量、词级编码特征和共现矩阵进行处理,得到句级编码特征;采用Transformer变体对句级编码特征和共现矩阵进行处理,得到图级编码特征;将词级编码特征、句级编码特征和图级编码特征进行融合,得到融合特征;基于多标签文本分类模型对融合特征进行处理,输出待处理招投标文本的多标签分类结果。本申请能够捕捉招投标文本的不同层次化特征(词、句、图)的语义信息,提高招投标文本分类的效率和准确性。