摘要
本发明涉及一种集成实体解析与KNN查询的高效查询方法,包括以下步骤:S1、数据集准备及数据分片;S2、创建区域树索引;S3、基于区域树索引的实体解析;S4、基于区域树索引的KNN查询。本发明将扩展数据集分解为几个较小的子集,并应用区域树索引对每个较小的子集执行实体解析,这就相应地减少了对物理设备的配置要求,使解析过程快速有效。本发明中使用的KNN查询处理算法,其查询结果是不同的聚类或其代表,因而能够实现高效、准确的KNN查询,避免了传统KNN查询因重复数据导致的结果偏差问题,可适用于大数据环境下的复杂查询场景。