摘要
本发明涉及数据处理技术领域,公开了一种肾脏病康复患者数据的处理方法及系统,采集多维度结构化数据,对多维度结构化数据进行数据清洗与标准化预处理,得到预处理后的数据;采用Hadoop分布式文件系统与Apache Cassandra数据库结合的存储架构,将预处理后的数据按时间序列分区存储,建立患者唯一标识与多维度指标的索引关联;基于处理后的数据,对高维量表数据进行降维,挖掘并发症拓扑关系,动态加权时序指标,形成多维度综合特征集;将多维度综合特征集输入孤立森林模型,预测患者疾病复发概率,输出疾病复发预测结果,并生成个性化康复方案;本发明突破传统单一指标评估的局限性,提升复发预测的全面性。