一种基于上下文语义理解的动态敏感信息过滤系统及方法
申请号:CN202510829701
申请日期:2025-06-20
公开号:CN120781840A
公开日期:2025-10-14
类型:发明专利
摘要
本发明公开一种基于上下文语义理解的动态敏感信息过滤系统及方法,涉及信息安全与自然语言处理技术领域;包括:步骤1:创建动态敏感信息过滤系统,步骤2:通过文本预处理模块对输入文本进行清洗、结构化和标准化处理,步骤3:通过语义特征提取模块利用深度学习模型捕捉预处理后的文本数据的深层语义特征,构建上下文关联的语义表示空间,步骤4:通过敏感信息识别模块基于语义特征进行多层次敏感信息检测,识别敏感内容的类型、位置及风险等级;步骤5:通过动态更新模块进行知识库和模型能力的在线迭代,应对敏感信息类型的动态变化,步骤6:通过结果输出模块对检测到的敏感信息进行安全处置,输出过滤结果并提供审计追溯能力,步骤7:通过反馈机制模块根据用户反馈和人工审核形成系统优化闭环,用于持续提升检测准确率和适应性。
技术关键词
上下文语义理解
敏感信息过滤方法
敏感信息过滤系统
敏感信息识别
语义特征提取
文本
动态更新
输出模块
序列标注模型
深度学习模型
实体
多层次
跨层特征
标签体系
风险
预训练模型
阈值算法