摘要
本申请实施例属于数据处理技术领域,涉及一种应用于开源数据库的区域数据分配方法及相关设备,该方法包括:根据大数据分析引擎读取目标数据仓库工具的分区数据,得到弹性分布式数据集;根据切分算法对弹性分布式数据集进行切分操作,得到均匀切割边界数据;根据均匀切割边界数据对弹性分布式数据集进行重分区操作,得到重分区数据;对重分区数据进行数据映射操作,得到hfile文件;根据均匀切割边界数据在目标开源数据库中创建预分区表;将hfile文件导入至预分区表中。本申请有效避免了hbase集群运行中发生的非常消耗资源的Major Compaction操作和因为region数据分布不均匀引起的查询热点问题。