摘要
本发明公开了一种基于大数据的计算机数据挖掘系统,包括:数据预处理层:负责医疗健康数据的收集、清洗、整合和标准化处理;模型训练层:利用预处理后的数据对X‑CNN模型进行训练,对X‑CNN模型进行验证和测试;数据挖掘层:应用X‑CNN模型对医疗健康数据进行挖掘和分析,引入基于图论的特征选择方法,学习并提取最具代表性的特征,利用可视化技术生成特征可视化图和重要性评分图;结果解释层:对模型的决策进行解释和说明,将决策树划分为多个层次,每个层次代表模型决策的不同阶段,通过逐步展示每个层次的决策过程和结果,在每个层次上添加注释和标签,解释每个决策节点的意义和重要性,在展示决策树的不同层次时,同时提供LIME生成的局部解释。