摘要
本公开涉及一种文件处理方法、装置及电子设备,涉及云计算技术领域,其中方法包括:获取数据文件集;依次确定数据文件集中每个文件的第一数据内聚值,第一数据内聚值用于衡量每个文件内部键的内聚程度;依据第一数据内聚值确定第一目标文件之间的第二数据内聚值,第一目标文件为从数据文件集中挑选的文件,第二数据内聚值用于衡量第一目标文件之间键的重合程度;根据第二数据内聚值,选择第二目标文件作为待压实文件,第二目标文件为从第一目标文件中挑选的文件,通过本公开方案,可以准确识别出数据文件集中最需要被压实的待压实文件,提高查询效率。