摘要
本发明公开了一种基于大数据的数据传输线路优化系统及方法,属于数据传输线路优化技术领域。本发明提取元数据,建立元数据索引,利用数据挖掘算法,挖掘不同档案信息的元数据之间的频繁项,得到频繁项集;基于频繁项集,进行内容相似性分析,得到相似度集;根据业务流程的逻辑顺序,确定业务中不同环节产生的档案之间的关联关系,得到关联关系集,构建档案信息关联网络;基于档案信息关联网络,获取不同档案的关联紧密程度,为不同的档案传输任务划分优先级;基于优先级,将相同优先级且传输方向一致的档案数据流量进行聚合和流量分流,得到流量分配方案;对网络中的节点设置缓存,进行路由优化,得到传输线路优化方案。