一种基于多特征融合和自注意力编码器神经网络的源代码漏洞分类检测方法

申请号：CN202410876664

申请日期：2024-07-02

公开号：CN118761058A

公开日期：2024-10-11

类型：发明专利

摘要

本发明涉及源代码漏洞检测技术领域，公开了一种基于多特征融合和自注意力编码器神经网络的源代码漏洞分类检测方法，通过特定切点对PDG图结构进行前后向切片，从而得到切片子图；根据标签比例决定重复切片最终的标签为是否有漏洞；生成增强切片；规划化和分词；生成增强切片的向量表征；生成PDG图结构的介中心性编码和Node2Vec编码；将增强切片的向量表征以及PDG图结构的中心性编码和Node2Vec编码聚合作为训练数据，训练设计的基于自注意力机制的典型Transformer编码器架构漏洞检测模型；对漏洞数据集进行预测，完成漏洞类型的检测，起到了有效地融合了代码的语法、语义和文本信息，提高了漏洞检测率的效果。

技术关键词

分类检测方法注意力编码器切片编码器架构语句注意力机制节点标签生成代码代码分析工具漏洞检测技术典型分词嵌入方法多层感知机序列语义