摘要
本发明公开了一种基于大模型的提取文档可信证据方法及系统,包括以下步骤:破损文档证据完形推理:构建图像、文本双分支模型,其中:图像分支通过融合跨模态注意力机制的改进型架构捕捉文档破损区域的边缘纹理,生成缺失区域的像素级预测掩码;文本分支基于在BERT基础上增加领域术语嵌入层并经文档证据语料微调的衍生模型,对残缺文本进行掩码语言建模,结合上下文语义及领域术语库生成候选补全内容,本发明通过图像、文本双分支模型的跨模态融合机制,结合改进型物理破损特征提取与领域适配语义补全模型,使破损文档证据提取的完整性与准确性显著提升,实现了破损区域像素级修复与语义逻辑连贯的双重优化。