摘要
本发明公开了一种Web攻击检测大模型的构建方法及系统。该方法使得大语言模型可以对常见Web攻击实现高效和高准确率检测,并且在保证检测准确率的前提下降低模型训练和推理所需的硬件资源需求。首先数据准备和处理模块根据预设的范式对web请求样本进行提取,然后预期检测结果和解释性分析模块根据提取的Web请求样本得到预期检测结果和解释性分析结果,然后指令微调数据集构造模块根据提取后的web请求样本、预期检测结果和解释性分析结果构造微调数据集,最后大模型量化微调模块根据微调策略和指令微调数据集,对中文大模型进行微调训练,得到Web攻击检测大模型。该方法使用了4‑bit量化的微调方法,可在保证高准确率检测的基础上,降低模型的训练和部署成本。