摘要
本发明公开了面向行业标准文档的深度语义实体与关系自动抽取方法,涉及文档智能化处理技术领域,包括:将文档页面图像输入多模态文档理解模型处理,得到多模态文档异构图;变换器架构模型处理,得到语义实体;多级噪声降噪神经网络生成训练数据集,进行抽取异构图,得到异构图;边导向图注意力网络模型融合,得到异构图实体识别的关系结果;共指消解模型对多模态文档异构图、语义实体、异构图及异构图实体识别的关系结果处理,结合训练后链接预测模型计算,得到全局知识网络。本发明提供一个更纯净、更可靠的训练数据集,提升模型的抽取精度。