摘要
本发明涉及信息安全技术领域,具体涉及一种基于多模态与隐写检测的敏感信息检测技术及系统,首先通过防格式篡改模块,利用文件头部信息和二进制数据分析,验证文件真实类型,防止格式伪装攻击;敏感数据检测模块采用DistilBERT和LSTM结构,对文本进行预处理,提取文本嵌入,并通过双向LSTM与Attention机制挖掘文本特征,最终精准判定文本是否包含敏感信息;联合内容与文件隐写检测模块融合卷积神经网络与多模态学习,针对不同数据类型采用相应模型进行隐写信息检测,并通过多模态神经网络整合结果,运用多模态反馈和跨模态推理机制提升检测准确性;本发明有效增强了敏感信息检测的准确性、全面性和系统适应性。