颤抖吧，Bug！OpenAI放出GPT-5「夜行神兽」，命中92%漏洞

8483点击 2025-10-31 15:34

刚刚，OpenAI推出了使用GPT-5寻找和修复安全漏洞的智能体Aardvark。

目前，Aardvark还处于beta测试阶段。

OpenAI称，Aardvark开创了「防御者优先」的新范式：作为自主安全研究智能体，随代码不断演化，为团队提供持续保护（continuous protection）。

OpenAI表示新智能体实战效果出色：

在标准代码库的基准测试中，Aardvark对已知漏洞与人工植入漏洞的识别率达到92%。

通过早期漏洞捕捉、实战化利用验证及清晰修复方案，在不拖慢创新节奏的前提下，Aardvark能强化安全体系。

OpenAI坚信安全能力应该普惠共享，将在持续完善后逐步扩大服务范围。

有意思的是，Aardvark是夜行性的非洲食蚁熊，一种几乎完全以蚂蚁和白蚁为食的独居生物！

它夜间独自吃蚂蚁和白蚁，就像这个GPT-5智能体独自异步解决bug一样。（bug原义是指「小虫」，但在计算机领域，它特指程序或系统中的错误、缺陷或漏洞。）

颤抖吧，Bug！OpenAI放出GPT-5「夜行神兽」，命中92%漏洞

食蚁熊，（学名：Orycteropus afer），又称土豚、土猪，是管齿目土豚科现存的唯一物种，属土豚属，是活化石动物。

这个名字一语双关，一改OpenAI过去命名风格，让人怀疑：不会是GPT-5命名的吧？

颤抖吧，Bug！OpenAI放出GPT-5「夜行神兽」，命中92%漏洞

Aardvark的工作原理

Aardvark可不间断地分析源代码仓库，识别漏洞、评估可利用性、划分严重等级，并提出针对性修复方案。

工作原理是监控代码库的提交与变更，在识别漏洞的同时分析其潜在利用方式，并自动提供修复建议。

与传统依赖模糊测试或软件成分分析等程序分析技术不同，Aardvark运用大语言模型的推理能力与工具调用功能，从而理解代码行为并定位漏洞。

它如同人类安全研究员般进行漏洞挖掘：通过阅读代码、分析逻辑、编写运行测试、使用工具链等综合手段完成安全检测。

颤抖吧，Bug！OpenAI放出GPT-5「夜行神兽」，命中92%漏洞

Aardvark采用多阶段流程实现漏洞的识别、解析与修复——

分析阶段：首先对完整代码库进行全面分析，生成反映项目安全目标与设计架构的威胁模型。

提交commit扫描：比对提交的代码变更与完整代码库及威胁模型，实时检测新增漏洞。在首次接入仓库时，Aardvark会扫描历史记录以识别现存问题，并以逐步解析方式说明发现的漏洞，为人工审核提供带标注的代码。

验证阶段：发现潜在漏洞后，系统会在隔离的沙箱环境中尝试触发漏洞以确认其可利用性。Aardvark会详细描述验证步骤，确保向用户反馈精准可靠、低误报率的分析结果。

修复阶段：Aardvark与OpenAI Codex协同工作，为每个已识别的漏洞生成经Aardvark扫描验证的修复补丁。这些补丁附在检测报告中供人工审核，支持一键高效修复。

不过，某AI安全测试智能体初创公司首席执行官Daniel Knight有个问题：

既然OpenAI在开发编程智能体Codex，为什么他们写的代码会不安全呢？

颤抖吧，Bug！OpenAI放出GPT-5「夜行神兽」，命中92%漏洞

AI再次解放生产力

AI工程师saen表示这个用例真是完美——

寻找漏洞需要系统性的推理和上下文理解，这恰好是推理模型的强项：AI能思考100多倍的情景，绝对能发现人类遗漏的边缘情况。

颤抖吧，Bug！OpenAI放出GPT-5「夜行神兽」，命中92%漏洞

此外，Aardvark无缝集成GitHub、Codex及现有工作流程，和开发者协作，既能保障开发效率，又能提供清晰可行的安全洞察。

在整个工作流程，中间就有一个人工审核的步骤，之后还有一个。

人类并没有被排除在外，而是被定位为质量把关的角色。

安全工程师可以松一口气：

与大多数人的看法不同，Aardvark实际上要求在修复程序运行之前，必须由人工进行验证。

这是一种生产力放大器，而不是替代品。

所以，安全工程师不用担心Aardvark，而应该担心的是是否能够跟上这些智能体的工作速度。这才是真正的限制。

在两个月前，安全研究人员Efi Weiss也进行了相关研究。

颤抖吧，Bug！OpenAI放出GPT-5「夜行神兽」，命中92%漏洞

他们搭建的系统采用多阶段流水线：

(1) 分析CVE通告与代码补丁；

(2) 生成既包含漏洞的测试应用又包含利用代码；

(3) 通过对比漏洞版与已补丁版进行测试来验证利用代码，剔除误报。

颤抖吧，Bug！OpenAI放出GPT-5「夜行神兽」，命中92%漏洞

将这一流程规模化后，AI可以每天处理130+条CVE信息流，而且比人类研究员更快且更具成本效益。

安全智能体崛起

软件正在吃掉世界，但AI吃掉软件。

大概8年前，黄仁勋如此预测。

颤抖吧，Bug！OpenAI放出GPT-5「夜行神兽」，命中92%漏洞

软件漏洞已成为企业、基础设施乃至社会面临的系统性风险。

仅2024年，公共漏洞和暴露（CVE， Common Vulnerabilities and Exposures）数量就超过4万例，年增长率高达38%。

颤抖吧，Bug！OpenAI放出GPT-5「夜行神兽」，命中92%漏洞

测试表明，只要提交约1.2%的代码就会引入缺陷——这些微小变更可能引发巨大后果。

而威胁更大、对策更少的「零日漏洞」，其价格已从「豪车」飙升至「豪宅」的水平👇：

颤抖吧，Bug！OpenAI放出GPT-5「夜行神兽」，命中92%漏洞

2015-2022年各类漏洞利用程序平均价格对比分析

由此可见，利用/发现危险软件漏洞远非易事。

而AI作为一种软件，也存在安全问题，比如，AI浏览器普遍面临「提示词注入」攻击，ChatGPT Atlas已「惨遭毒手」：

颤抖吧，Bug！OpenAI放出GPT-5「夜行神兽」，命中92%漏洞

AI时代，信息安全日益重要。

众所周知，软件漏洞历来是开发者最头疼的问题，即便借助传统自动化手段（如模糊测试），发现和修复漏洞依旧费时费力。

随着AI在漏洞发现领域不断取得突破，单靠人类开发者将难以跟上节奏。

为什么安全智能体Aardvark 重要？

普通企业很难雇到足够的安全专家；
每年都有数万漏洞被公开；
Aardvark能24小时不停地「巡逻」代码库，提前发现问题；
它不仅找安全漏洞，还能发现逻辑错误或隐私风险并自动修复。

Aardvark已持续运行数月，同时服务于OpenAI内部代码库及外部alpha合作伙伴。

在OpenAI内部，它成功发现了多个具有实际意义的安全漏洞，有效增强了公司的安全防御能力。合作伙伴特别肯定了其分析深度——Aardvark能精准识别仅在某些复杂条件下才会触发的隐蔽问题。

本月初，基于Gemini Deep Think，谷歌DeepMind打造出一个能自主调试并修复复杂漏洞的AI智能体CodeMender。

为了实现这一目标，CodeMender智能体配备了一套强大的工具，使其在修改代码前能够进行深入推理，并在修改后自动进行验证，确保修复是正确的，且不会引入新的问题或导致功能回退。

颤抖吧，Bug！OpenAI放出GPT-5「夜行神兽」，命中92%漏洞

AI，或将彻底改变网络安全竞争格局。

参考资料：

https://deepmind.google/discover/blog/introducing-codemender-an-ai-agent-for-code-security/

https://substack.com/home/post/p-170458299

https://x.com/imxiaohu/status/1984061183301972339

文章来自于微信公众号 “新智元”，作者 “新智元”

关键词: AI新闻 , OpenAI Aardvark , Aardvark , OpenAI , AI找bug

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。
项目地址：https://github.com/browser-use/browser-use

AI工作流

【开源免费】字节工作流产品扣子两大核心业务：Coze Studio（扣子开发平台）和 Coze Loop（扣子罗盘）全面开源，而且采用的是 Apache 2.0 许可证，支持商用！
项目地址：https://github.com/coze-dev/coze-studio

【开源免费】n8n是一个可以自定义工作流的AI项目，它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址：https://github.com/n8n-io/n8n
在线使用：https://n8n.io/（付费）

【开源免费】DB-GPT是一个AI原生数据应用开发框架，它提供开发多模型管理（SMMF）、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL（智能体工作流编排）等多种技术能力，让围绕数据库构建大模型应用更简单、更方便。
项目地址：https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file


【开源免费】VectorVein是一个不需要任何编程基础，任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤，并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址：https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用：https://vectorvein.ai/（付费）

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法，编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词，进而高质量的帮助用户通过AI解决问题。
项目地址：https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用：https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0