摘要
本发明公开了一种基于因果驱动的中文医疗意图分类方法;其操作步骤如下:对原始医疗文本数据进行预处理,构建适应任务需求的训练数据集;利用预训练语言模型对医学文本进行编码,获取token级别的嵌入表示;将token嵌入表示输入语义因果增强模块,得到最终的句子嵌入表示;句子嵌入表示输入因果特征净化模块,提取与任务具有真实因果关系的关键特征;最终完成医疗意图的分类与识别。本发明通过引入语义因果增强模块,有效抑制了模型对对浅层模式的依赖,提高模型对句子深层语义的建模能力;通过引入因果特征净化模块,引导模型聚焦于对任务具有真实因果贡献的语义特征,提升了医疗意图识别的准确性和泛化能力。