摘要
本发明公开了文化遗产档案多维存储系统,涉及文化遗产数字化保护与智能存储领域,包括数据采集处理模块、双库管理模块、多维索引检索引擎、安全与合规模块和备份与容灾模块。本发明中,通过多种接口统一接入对结构化文本和非结构化文件,并采用专用工具链进行格式标准化,音视频经FFmpeg转码为H.264/AAC格式,图像通过ImageMagick调整分辨率与压缩,文本由ApacheTika提取纯文本并转换为UTF‑8编码,并将标准化的数据统一转为中间格式,便于其他模块接收数据,采用三层去重策略,对标准化后的输入数据进行精细化的冗余处理,显著降低存储冗余,文化遗产数据主库按“项目类型‑媒介类型‑年代”三层分区,传承人信息库按“省份‑传承人编号前缀”两级分区。