一种基于配置和聚合感知的Spark动态排序优化策略
申请号:CN202410885572
申请日期:2024-07-02
公开号:CN118860597A
公开日期:2024-10-29
类型:发明专利
摘要
本发明提供一种基于配置和聚合感知的Spark动态排序优化策略。该方法包括:步骤1:获取待处理任务的任务信息、对应的集群端配置信息和Driver端配置信息;其中,所述任务信息包括任务数据量和任务个数;步骤2:根据任务信息、集群端配置信息和Driver端配置信息分别确定在集群端对待处理任务拟执行排序算子所需的时间Ct以及Driver端拟获取待处理任务的数据传输时间Dt1和在Driver端对待处理任务拟执行排序算子所需的时间Dt2;步骤3:若Dt小于Ct,则将待处理任务直接分配至Driver端执行排序算子;其中,Dt为Dt1和Dt2之和。本发明能够减少集群负担,解决排序算子对数据处理先集群后Driver端导致的资源争用的问题。
技术关键词
集群
LSTM模型
排序算法
策略
动态
数据
内核
负担
阶段
资源