摘要
本发明公开了一种思维链数据集的生成方法、装置、设备及存储介质,该方法采用大语言模型基于第一预设提示词集合对攻击样本数据进行处理,得到初始推理结果;将初始推理结果与预设标注结果进行对比得到第一比较结果;在第一比较结果一致时,基于初始推理结果得到标准化思维链;在第一比较结果不一致时,基于目标修正推理结果得到标准化思维链,其中,目标修正推理结果是基于第二预设提示词集合得到的;在思维链数据集中加入标准化思维链。也就是说,本申请采用大语言模型基于第一预设提示词集合和第二预设提示词集合对攻击样本数据进行处理,得到包含攻击行为和攻击过程的网络安全数据集,进而为安全大模型的训练提供更高质量的训练集。