摘要
本发明涉及档案管理技术领域,尤其涉及一种基于大数据的数字化档案管理方法及系统。一种基于大数据的数字化档案管理方法,包括以下步骤:S1:获取目标用户的查询关键字,并根据所述查询关键字对档案进行查询,并将相关档案作为待处理档案序列;S2:获取目标用户的需求格式和权限数据,根据所述目标用户的需求格式将所述待处理档案序列分为第一查询档案序列与第二查询档案序列。本发明实现了对各档案格式的备份,并使用遗忘调整公式对各档案格式中不常用的档案部分内容进行遗忘处理;通过对不同档案格式中内容的相似度与档案格式数量进行分析,将保留不同档案格式内容的同时节省存储空间。