摘要
本发明涉及人工智能与信息处理技术领域,具体公开了一种多模态档案智能分类与标签生成方法及系统。所述方法包括:获取档案中的文本段落、图像片段与视频关键帧数据,进行格式识别与区域分离,生成多模态内容结构数据;基于该数据提取语义特征并构建融合语义表示;利用融合语义向量生成主标签、子标签与关键词集合,构建多层级标签结构;进一步进行标签去冗余与结构优化,生成标签图谱,并通过标签图谱与语义表示结构进行一致性分析与反馈优化。相比现有技术,本发明能够有效融合多种模态信息,提升档案标签生成的准确性、层级结构性与语义一致性,具备高度智能化、自适应与可持续优化能力,适用于档案管理、内容审核与语义归档等多类场景。