摘要
本发明公开了一种针对长脚本文件的恶意代码智能检测方法,包括如下步骤:获取待检测文件的预处理后的代码数据包括token代码段序列和opcode操作码序列;将token代码段序列输入至代码段分类模型中,得到代码段分类结果;将opcode操作码序列输入至操作码分类模型中,得到操作码分类结果;响应于代码段分类结果和操作码分类结果均不为WebShell文件,则认定代码数据非恶意代码;反之则认定代码数据为恶意代码。本发明基于预训练语言模型的代码段分类模型和操作码分类模型分别对token代码段序列和opcode操作码序列进行检测,显著扩大了现有WebShell检测方法的适用范围,一定程度上提高了检测准确度和应对木马免杀方法的能力。