摘要
本发明公开了一种大规模非结构化数据联合处理方法及系统,包括:S1:采集大规模非结构化数据并构建动包含动态更新与索引检索优化的元数据特征库;S2:基于动态元数据特征库构建联邦化索引,在联邦化索引的基础上构建跨域联合索引并进行分层联邦架构优化,获得跨域联合优化索引;S3:基于跨域联合优化索引构建全局关联矩阵进行跨域关联建模,通过跨域关联建模获得全局关联函数;S4:基于全局关联函数进行联合优化求解实现非结构化数据联合处理,通过融合处理目标函数将聚类、标签预测和关联规则挖掘等任务统一优化,各任务之间相互协同,使整个数据处理过程更加智能高效,提高了数据处理结果的准确性。