摘要
本申请公开了一种基于知识基座的域自适应文本分类方法及系统,涉及人工智能技术领域,方法包括:根据第一目标域无标注语料构建枢轴词与非枢轴词之间的三元组,进而构建知识图谱;根据源域标注数据训练神经网络模型,并使用源域标注数据、源域无标注数据和第二目标域无标注数据优化神经网络模型;在知识图谱中确定输入本文的枢轴词对应的三元组进而插入到输入文本中,得到知识注入文本;使用源域标注数据、源域无标注数据和第二目标域无标注数据的伪标签更新记忆库,以使神经网络模型动态学习枢轴词;利用神经网络模型对知识注入文本进行分类。本申请通过知识图谱可建模枢轴词和非枢轴词之间的关系,进而提高跨域自适的文本分类的准确率和效率。