一种思维链数据集的生成方法、装置、设备及存储介质

申请号：CN202510847016

申请日期：2025-06-23

公开号：CN120706564A

公开日期：2025-09-26

类型：发明专利

摘要

本发明公开了一种思维链数据集的生成方法、装置、设备及存储介质，该方法采用大语言模型基于第一预设提示词集合对攻击样本数据进行处理，得到初始推理结果；将初始推理结果与预设标注结果进行对比得到第一比较结果；在第一比较结果一致时，基于初始推理结果得到标准化思维链；在第一比较结果不一致时，基于目标修正推理结果得到标准化思维链，其中，目标修正推理结果是基于第二预设提示词集合得到的；在思维链数据集中加入标准化思维链。也就是说，本申请采用大语言模型基于第一预设提示词集合和第二预设提示词集合对攻击样本数据进行处理，得到包含攻击行为和攻击过程的网络安全数据集，进而为安全大模型的训练提供更高质量的训练集。

技术关键词

大语言模型样本生成方法动态时间规整算法关联分析算法重命名方法网络安全数据时间同步协议去重算法存储程序指令可读存储介质格式框架生成装置自然语言语义模块存储器计算机