摘要
本公开提供了一种智能合约漏洞数据集构建方法,可以应用于智能合约安全技术领域。该方法包括:获取原始合约代码;对原始合约代码进行预处理,得到预处理的合约代码;调研并确定漏洞类型以及对应的漏洞定义;基于漏洞类型以及漏洞定义设计每种漏洞类型的模型提示词;以及基于模型提示词、预处理的合约代码以及漏洞数量,利用大语言模型生成带有漏洞的合约代码,得到智能合约漏洞数据集,其中,大语言模型通过在大规模文本数据上进行预训练,具有丰富的语言知识和代码模式,能够生成高质量的文本和代码。本公开还提供了一种智能合约漏洞数据集构建装置、设备和存储介质。