面向行业标准文档的深度语义实体与关系自动抽取方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
面向行业标准文档的深度语义实体与关系自动抽取方法
申请号:CN202511326445
申请日期:2025-09-17
公开号:CN120832418B
公开日期:2025-12-05
类型:发明专利
摘要
本发明公开了面向行业标准文档的深度语义实体与关系自动抽取方法,涉及文档智能化处理技术领域,包括:将文档页面图像输入多模态文档理解模型处理,得到多模态文档异构图;变换器架构模型处理,得到语义实体;多级噪声降噪神经网络生成训练数据集,进行抽取异构图,得到异构图;边导向图注意力网络模型融合,得到异构图实体识别的关系结果;共指消解模型对多模态文档异构图、语义实体、异构图及异构图实体识别的关系结果处理,结合训练后链接预测模型计算,得到全局知识网络。本发明提供一个更纯净、更可靠的训练数据集,提升模型的抽取精度。
技术关键词
语义实体 异构 多模态 关系 生成训练数据 页面 令牌 多层感知机 正则化技术 变换器 注意力机制 上下文无关文法 文本 三元组 图谱 分类器 逻辑 解码器模型