摘要
本申请公开了一种数据抽取方法、系统、电子设备及存储介质。其中,方法包括:获取到多个待检测文档,以及构建目标业务的实体关系集合;其中,实体关系集合包括多个三元组,各三元组包括目标业务相关的两个实体以及两个实体的对应关系;对各待检测文档分别进行特性向量提取,得到各待检测文档的第一特征向量集;利用第一特征向量集得到各待检测文档与实体关系集合的关联关系从多个待检测文档中选出目标业务的目标文档;将目标文档划分成多个关联片段,按照实体关系集合的各三元组对关联片段进行关系映射抽取,得到与各三元组关联的多个片段数据,得到目标业务的片段数据集。可以解决文档关系抽取的效率和准确率低的技术问题。