摘要
本发明公开了一种基于信息摘要算法比对的合规关键词筛查方法、装置、系统及介质,通过对待筛查文本进行分词处理,将连续的文本序列分割成多个具有独立语义的文本片段;再生成每个文本片段对应的信息摘要值;基于信息摘要值,构建待筛查文本的摘要向量,摘要向量的每个维度对应一个文本片段的信息摘要值;将待筛查文本的摘要向量与关键词摘要索引表中的值进行快速比对,输出筛查结果。本发明大幅提高海量文本中合规关键词筛查的效率,减少系统资源占用,降低处理时间延迟,确保系统流畅运行。增强对关键词语义变体的识别能力,提高筛查准确性,最大程度降低不合规信息的漏检率。