摘要
本申请提供了一种共享文档多元化数据源的数据处理方法及系统,获取多源异构数据;进而对多源异构数据进行分区,得到冷数据区和热数据区;进一步对冷数据区进行异常检测,得到异构异常数据,从而确定用户在访问共享文档过程中的异构特征分布域,通过预设的数据增益值和异构特征分布域确定共享文档的多源异构增益熵;进而从热数据区中提取访问热度记录,从而确定在极端网络条件下每个用户的数据容灾系数,进一步确定共享文档的容灾分段存储序列;根据容灾分段存储序列对共享文档多元化数据进行分级存储处理。采用本申请的方案,可实现在极端网络条件下对服务器存储节点的数据进行数据容灾,从而提高存储多元化数据服务器的稳定性。