一种基于大语言模型的Python库模糊测试驱动生成方法
申请号:CN202411735070
申请日期:2024-11-29
公开号:CN119670094A
公开日期:2025-03-21
类型:发明专利
摘要
本发明聚焦于模糊测试领域,具体内容涉及到利用大语言模型智能化辅助模糊测试驱动代码生成。为Python库代码模糊测试提供一种利用大语言模型的方便快捷、自动化、结合测试函数和样本代码的模糊测试驱动代码生成方法。本发明方法包括:通过静态分析工具进行Python库源码分析和驱动代码样本信息提取,获得测试函数和样本代码的数据集;构建包含驱动样例代码、生成任务说明、变异策略简介、测试函数信息集合、驱动样本代码、代码规范化说明的提示词工程结构,按照样本数量生成零样本、少样本、思维链提示;搭建大语言模型代理端,将提示词以HTTP/HTTPS报文方式传送给开源、闭源大语言模型,进行模糊测试驱动代码的推理生成;在获得驱动代码后,对未通过试运行测试的模糊测试驱动代码进行多轮生成、筛选,最终获得待漏洞挖掘的模糊测试驱动代码集合;利用已经获得的模糊测试驱动代码集合对测试函数进行漏洞挖掘,并将结果保存至数据库以待分析。
技术关键词
大语言模型
驱动生成方法
样本
漏洞
变异策略
分析工具
代码生成方法
生成测试数据
报文
覆盖率
复杂度
阶段
令牌
参数
标志
格式
模板
端口
基础