一种针对长脚本文件的恶意代码智能检测方法

申请号：CN202411121897

申请日期：2024-08-15

公开号：CN119026124A

公开日期：2024-11-26

类型：发明专利

摘要

本发明公开了一种针对长脚本文件的恶意代码智能检测方法，包括如下步骤：获取待检测文件的预处理后的代码数据包括token代码段序列和opcode操作码序列；将token代码段序列输入至代码段分类模型中，得到代码段分类结果；将opcode操作码序列输入至操作码分类模型中，得到操作码分类结果；响应于代码段分类结果和操作码分类结果均不为WebShell文件，则认定代码数据非恶意代码；反之则认定代码数据为恶意代码。本发明基于预训练语言模型的代码段分类模型和操作码分类模型分别对token代码段序列和opcode操作码序列进行检测，显著扩大了现有WebShell检测方法的适用范围，一定程度上提高了检测准确度和应对木马免杀方法的能力。

技术关键词

学习器智能检测方法切片序列训练集 WebShell检测方法脚本数据代码特征关系解码器预训练语言模型免杀方法编码器分类方法线性变换器标识符文本