一种基于AI的智能化数字档案编研方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于AI的智能化数字档案编研方法
申请号:CN202411665260
申请日期:2024-11-20
公开号:CN119513389A
公开日期:2025-02-25
类型:发明专利
摘要
本发明公开了一种基于AI的智能化数字档案编研方法,涉及数字档案技术领域,其包括包括以下步骤:S1:源数据,档案管理系统中已经归档的数字化档案附件;S2:附件解析,采用OCR识别技术对不同格式的附件内容进行精准识别和提取,生成XML、JSON等类型的结构化数据,将转换后的文本数据保存至文档库S3:文本数据清洗,对解析输出的文本数据进行文本纠错、数据校验、格式调整;S4:抽取文本中的关键信息,包括文本摘要抽取、文本关键词抽取两部分。通过深度挖掘与智能分析分析海量的档案资料,准确把握专题方向、自动生成编研成果,极大提升数字档案编研的效率、质量与创造性,随着AI技术的不断发展,其在数字档案编研领域的应用前景将更加广阔。
技术关键词
关键词 OCR识别技术 摘要 新词 档案管理系统 附件 抽取算法 大语言模型 海量文本数据 格式 切片 自然语言 档案技术 分析海量 统计特征 注意力机制 纠错 主题