基于频繁项提取和双层自编码器的未知协议聚类方法及系统
申请号:CN202411726208
申请日期:2024-11-28
公开号:CN119544571B
公开日期:2025-11-04
类型:发明专利
摘要
本发明涉及信息安全技术领域,特别涉及一种基于频繁项提取和双层自编码器的未知协议聚类方法及系统,通过预处理过程将原始数据从比特形式转换成字节形式后截取前32字节,然后对预处理后的数据逐字节进行频繁项统计,分别得到每一字节的频繁项频率和频繁项个数;利用频率自编码器和数量自编码器分别对频繁项频率较大和频繁项个数较大的字节进行特征提取;将频率自编码器提取出的特征进行粗聚类得到粗聚类标签,将粗聚类标签和数量自编码器提取出的特征合并并进行聚类得到最终的细聚类标签。本发明既能保留协议级聚类的同时,能够实现类别级的聚类,计算量小,在确保聚类的实时性的同时,能够有效解决未知协议聚类的欠分问题,提高聚类的性能。
技术关键词
协议
关键字
聚类方法
数据
频率
标签
编码器结构
邻居
特征提取模块
核心
信息安全技术
元素
聚类系统
可读存储介质
轮廓系数
邻域
中间层
聚类算法