一种思维链数据集的生成方法、装置、设备及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种思维链数据集的生成方法、装置、设备及存储介质
申请号:CN202510847016
申请日期:2025-06-23
公开号:CN120706564A
公开日期:2025-09-26
类型:发明专利
摘要
本发明公开了一种思维链数据集的生成方法、装置、设备及存储介质,该方法采用大语言模型基于第一预设提示词集合对攻击样本数据进行处理,得到初始推理结果;将初始推理结果与预设标注结果进行对比得到第一比较结果;在第一比较结果一致时,基于初始推理结果得到标准化思维链;在第一比较结果不一致时,基于目标修正推理结果得到标准化思维链,其中,目标修正推理结果是基于第二预设提示词集合得到的;在思维链数据集中加入标准化思维链。也就是说,本申请采用大语言模型基于第一预设提示词集合和第二预设提示词集合对攻击样本数据进行处理,得到包含攻击行为和攻击过程的网络安全数据集,进而为安全大模型的训练提供更高质量的训练集。
技术关键词
大语言模型 样本 生成方法 动态时间规整算法 关联分析算法 重命名方法 网络安全数据 时间同步协议 去重算法 存储程序指令 可读存储介质 格式 框架 生成装置 自然语言 语义 模块 存储器 计算机