摘要
本发明涉及一种基于大数据的多层次质量文件管理方法,通过建立随机森林模型量化质量文件信息与质量控制结果之间的关系,识别对质量控制结果具有重要影响的关键质量文件信息,为提高质量控制效果的质量文件信息改进提供了参考依据;采用聚类分析方法对质量文件使用频率进行聚类,根据聚类结果对质量文件的重要性进行排序,实现对质量文件的重要性进行分类存储,提高了文件管理效能。本发明通过对质量文件的关键质量文件信息识别和重要等级划分的双重重要性评估,解决了现有技术无法对质量文件的重要性进行评估导致管理效率低下的问题。