摘要
基于树结构的可解释层次文本分类方法,属于自然语言处理的层次文本分类领域。本方法由特征提取模块和树形分类两个模块组成,每个模块包括对应的功能部分和可解释性部分。首先,特征提取模块选取合适的预训练模型,负责处理输入的文本并提取特征编码。此阶段可以将特征编码器的注意力权重可视化,以评估并展示对每个词的关注程度。其次,树形分类模块根据特征提取模块的文本特征对文本进行最终的分类。每个节点的最终决策由树结构的父节点和子节点联合决定。此阶段可以输出每个决策节点的预测概率,展示该方法做出最终分类的依据和过程。本方法利用预训练模型和树形结构,提升了层次文本分类的准确性和可解释性。