基于跨媒体知识图谱的案件信息结构化与抽取方法及系统
申请号:CN202510745336
申请日期:2025-06-05
公开号:CN121029908A
公开日期:2025-11-28
类型:发明专利
摘要
本发明提出基于跨媒体知识图谱的案件信息结构化与抽取方法及系统,包括如下步骤:步骤S1,获取电子卷宗文本、图像、视音频结构化数据集;步骤S2,构建面向电子卷宗数据的多源异质全量数据的跨媒体领域知识图谱;步骤S3,引入数据驱动的深度学习目标检测模型和知识驱动的跨媒体知识图谱方法,对多媒体电子卷宗数据进行结构化处理和知识抽取。本发明通过应用基于深度学习的目标检测技术,并引入规则库、概念库、事实库和本题库等技术,解决电子卷宗的具体领域特性,解决电子卷宗跨媒体知识图谱的自动动态构建难题,以体系化抽取电子卷宗多媒体数据中案件结构化信息。
技术关键词
图谱
多媒体
电子
数据
视音频
深度神经网络学习
预训练模型
OCR识别技术
抽取实体关系
图像
三元组
序列标注模型
非结构化文本
实体关系抽取
案件结构
长短期记忆网络
解码器
语音识别技术