摘要
基于层次关联和多样性增强的医疗代码分配方法,其步骤为:S1、数据预处理与图构建,基于ICD代码的树状层级分类架构,采用层级图模型对其进行可视化表征,并对临床记录文本构建其与ICD代码的共现矩阵;S2、应用Graph‑BERT图神经网络结构,对ICD代码体系的树状结构进行图结构的转化,并基于图transformer的编码器结构学习得到ICD代码的嵌入表示;S3、对临床文本进行分词处理后输入至bioBERT模型,得到其特征向量,并通过多模态融合的方式来达到临床记录的语义特征与ICD代码的层次特征、以及二者之间的相关关联信息的统一;S4、在得到临床记录文本的最终特征向量后,使用CorNet网络进行相关性增强预测,从而生成相关的概率矩阵,并将二元交叉熵损失函数扩展,与层级多样性损失和语义多样性损失共同构成多样化损失函数,与经典模型进行对比分析,以验证上述方法的准确性和有效性。