摘要
本发明公开了一种基于AI的智能化数字档案编研方法,涉及数字档案技术领域,其包括包括以下步骤:S1:源数据,档案管理系统中已经归档的数字化档案附件;S2:附件解析,采用OCR识别技术对不同格式的附件内容进行精准识别和提取,生成XML、JSON等类型的结构化数据,将转换后的文本数据保存至文档库S3:文本数据清洗,对解析输出的文本数据进行文本纠错、数据校验、格式调整;S4:抽取文本中的关键信息,包括文本摘要抽取、文本关键词抽取两部分。通过深度挖掘与智能分析分析海量的档案资料,准确把握专题方向、自动生成编研成果,极大提升数字档案编研的效率、质量与创造性,随着AI技术的不断发展,其在数字档案编研领域的应用前景将更加广阔。