一种基于预训练模型和混合模型架构的敏感信息处理方法及系统

申请号：CN202510238647

申请日期：2025-02-28

公开号：CN120162835A

公开日期：2025-06-17

类型：发明专利

摘要

本发明公开了一种基于预训练模型和混合模型架构的敏感信息处理方法及系统，涉及数据安全与隐私保护技术领域。包括：S1.数据集构建；S2.数据集预处理；S3.数据划分；S4.模型构建和训练；S5.定位敏感信息；S6.遗忘敏感信息。本发明在模型性能上，非结构化敏感信息文本识别模型采用词汇级别和字符级别标记化处理及特征增强，显著增强了对敏感信息的识别能力，同时提高了模型对不同非结构化文本的适应性；在数据安全与隐私保护层面，基于梯度信息关键区域分析确定文本中的敏感实体擦除区域，实现敏感信息的精确遗忘，避免过度遗忘，保障数据安全合规。

技术关键词

敏感信息处理方法文本识别模型预训练模型实体信息模块非结构化文本解码器隐私保护技术保障数据安全输入端信息处理系统序列模板处理单元训练集标签

系统为您推荐了相关专利信息

一种基于科研项目的知识产权管理系统

布局管理系统关系抽取模型关键点模块

数据校验方法、装置、计算机设备、存储介质及程序产品

校验规则边缘检测模型数据校验方法校验系统项目

一种用于老年慢病检测的风险评估稳定方法

稳定方法医学知识图谱生成知识图谱矩阵注意力机制

基于多模态大语言模型对特定行业进行关系抽取的方法

语义知识库大语言模型实体关系文本

基于数值模拟的筏板建筑物浆液球抬升方法和系统

建筑物模型抬升方法监测点球形实体