基于预训练代码语言模型和卷积神经网络的漏洞检测方法
申请号:CN202411459493
申请日期:2024-10-18
公开号:CN119442246B
公开日期:2025-10-10
类型:发明专利
摘要
本发明涉及漏洞检测技术领域,为基于预训练代码语言模型和卷积神经网络的漏洞检测方法,包含以下步骤S1、获取漏洞数据集,对漏洞数据集进行预处理,构建模型训练数据集。S2、根据模型训练数据集的源代码获取数据传播链和代码token序列,对数据传播链和token序列进行嵌入得到源代码对应的嵌入向量;S3、构建漏洞检测模型,对漏洞检测模型进行训练得到训练好的漏洞检测模型;S4、通过训练好的漏洞检测模型输出待检测的源代码是否存在漏洞。本发明构建基于预训练代码语言模型和卷积神经网络的漏洞检测模型,采用了数据传播链和代码token序列作为模型输入,可以学习到源代码的语义信息和结构信息,捕获关键的漏洞特征,提高了漏洞检测的准确性和有效性。
技术关键词
漏洞检测方法
卷积神经网络模块
序列
判断源代码
数据
广度优先搜索算法
变量
漏洞检测技术
多头注意力机制
样本
前馈神经网络
抽象语法树
漏洞特征
对源代码
节点
关系
标签
有效性
结点