一种基于上下文语义理解的动态敏感信息过滤系统及方法

申请号：CN202510829701

申请日期：2025-06-20

公开号：CN120781840A

公开日期：2025-10-14

类型：发明专利

摘要

本发明公开一种基于上下文语义理解的动态敏感信息过滤系统及方法,涉及信息安全与自然语言处理技术领域；包括：步骤1：创建动态敏感信息过滤系统，步骤2：通过文本预处理模块对输入文本进行清洗、结构化和标准化处理，步骤3：通过语义特征提取模块利用深度学习模型捕捉预处理后的文本数据的深层语义特征，构建上下文关联的语义表示空间，步骤4：通过敏感信息识别模块基于语义特征进行多层次敏感信息检测，识别敏感内容的类型、位置及风险等级；步骤5：通过动态更新模块进行知识库和模型能力的在线迭代，应对敏感信息类型的动态变化，步骤6：通过结果输出模块对检测到的敏感信息进行安全处置，输出过滤结果并提供审计追溯能力，步骤7：通过反馈机制模块根据用户反馈和人工审核形成系统优化闭环，用于持续提升检测准确率和适应性。

技术关键词

上下文语义理解敏感信息过滤方法敏感信息过滤系统敏感信息识别语义特征提取文本动态更新输出模块序列标注模型深度学习模型实体多层次跨层特征标签体系风险预训练模型阈值算法