摘要
本申请公开了一种数据查询及其医疗领域语义网络构建方法及装置,方法包括:采集并预处理医疗领域的多源异构医疗数据,得到非结构化文本和结构化数据表;通过预设概念层和预设本体层,对非结构化文本进行知识抽取,得到知识库;预设概念层包括医疗敏感实体类、通用敏感实体类和公共实体类;预设本体层包括实体标识、关系标识、属性标识;根据预设同义词词典,对结构化数据表和知识库进行知识融合,得到医疗领域语义网络。采用本申请,预设概念层和预设本体层的设计使得医疗数据的管理和分析更加精细化,能针对不同类型的敏感数据采取更合适的脱敏策略。同时通过知识融合方式能快速识别并替换相似的实体,减少数据冗余,可直接有效应用于数据脱敏。