刚刚,OpenAI最强编程智能体上线ChatGPT

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
刚刚,OpenAI最强编程智能体上线ChatGPT
6576点击    2025-05-17 18:04

昨天,OpenAI CEO 奥特曼预告了一项新研究,吊足了所有人的胃口。


刚刚,OpenAI最强编程智能体上线ChatGPT


就在刚刚,谜底揭晓!OpenAI 宣布,在 ChatGPT 中引入了 Codex 的研究预览版。


Codex 是一个云端软件工程智能体,可以并行处理多项任务,包括编写功能、解答代码库相关问题、修复 bug 以及提交拉取请求以供审核等。


并且,每个任务都在其专属的云沙盒环境中运行,并预加载代码库。


刚刚,OpenAI最强编程智能体上线ChatGPT


Codex 背后的模型是 codex-1,它是 OpenAI o3 的一个版本,专门针对软件工程进行了优化。


它使用强化学习在各种环境中针对真实编程任务进行训练,生成的代码能够高度反映人类的风格和 PR 偏好,精确遵循指令,


并可以迭代运行测试,直到获得合格结果。


自今天开始,ChatGPT Pro、Team 和 Enterprise 用户即可使用 Codex,Plus 和 Edu 用户也很快可以上线使用。


刚刚,OpenAI最强编程智能体上线ChatGPT


对于 OpenAI 的新智能体产品,大家的反应似乎非常兴奋。有人表示自己被震撼到了,迫不及待想要体验一番。十年前学习编程时,绝对想不到这会成为可能。


刚刚,OpenAI最强编程智能体上线ChatGPT


也有人认为,Codex 这个云原生的智能体实际上可以自行构建、修复并交付功能,感觉就像软件开始了大规模自我编写。


刚刚,OpenAI最强编程智能体上线ChatGPT


还有人现身说法,在经过对 Codex 大量测试后发现,当它正常运作时,几乎更擅长「模拟」代码正在做什么以及看起来是什么样子。


刚刚,OpenAI最强编程智能体上线ChatGPT


接下来,我们先看一下官方示例,Codex 可以并行处理多项任务:


刚刚,OpenAI最强编程智能体上线ChatGPT


比如要求 Codex「找出尽可能多的 topos 和语法错误并进行修复」,它会检查代码库的可维护性和 bugs:


刚刚,OpenAI最强编程智能体上线ChatGPT


修复文件名中含有特殊字符的 /diff 错误:


刚刚,OpenAI最强编程智能体上线ChatGPT


创建并使用 DEFAULT_ALCATRAZ_TIMEOUT 常量:


刚刚,OpenAI最强编程智能体上线ChatGPT


Codex 工作原理


从今天开始,用户可以通过 ChatGPT 侧边栏访问 Codex,输入 prompt 并点击 "编写代码" 按钮即可执行新的编程任务。


若需针对代码库提问,可点击 "Ask"。每项任务均在独立隔离的环境中处理,该环境已预加载用户的代码库。


Codex 具备读写文件的能力,并可运行包括测试框架、代码检查器和类型检查器在内的各类命令。


任务完成时间通常为 1 至 30 分钟(视复杂度而定),用户可实时查看 Codex 的处理进度。


任务完成后,Codex 会将其修改提交至专属环境。通过终端日志引用和测试输出记录,Codex 为所有操作提供可验证的证据链,便于用户追溯任务执行全过程。


用户还可审阅结果、要求进一步修改、创建 GitHub 拉取请求或直接将变更集成至本地环境。在产品中,用户可将 Codex 环境配置为无限接近实际开发环境。


刚刚,OpenAI最强编程智能体上线ChatGPT


Codex 可遵循代码库中的 AGENTS.md 文件执行操作。


这类文本文件(类似 README.md)用于指导 Codex 如何浏览代码库、运行哪些测试命令,以及如何遵循项目标准规范。


与人类开发者类似,当获得配置好的开发环境、可靠的测试方案和清晰的文档时,Codex 智能体能发挥最佳效能。


在编码评估和内部基准测试中,即便没有 AGENTS.md 文件或定制脚手架,codex-1 也展现出强劲性能。


刚刚,OpenAI最强编程智能体上线ChatGPT


构建安全可靠的智能体


在设计 Codex 时,OpenAI 优先考虑安全性和透明度,以便用户能够验证其输出。用户可以通过引用、终端日志和测试结果来检查 Codex 的工作。


刚刚,OpenAI最强编程智能体上线ChatGPT


刚刚,OpenAI最强编程智能体上线ChatGPT


与 o3 相比,codex-1 始终能够生成更清晰的 patch,以便立即进行人工审核并集成到标准工作流程中。


刚刚,OpenAI最强编程智能体上线ChatGPT


Codex 与 o3 对比:


刚刚,OpenAI最强编程智能体上线ChatGPT



刚刚,OpenAI最强编程智能体上线ChatGPT


OpenAI 表示,Codex 智能体完全运行于云端的安全隔离容器中。任务执行期间将禁用互联网访问,确保智能体仅能交互以下内容:


通过 GitHub 仓库明确提供的代码、用户通过设置脚本配置的预安装依赖项以及该智能体无法访问任何外部网站、API 或其他服务。


Codex 定价如何?


Codex 用起来贵不贵?


OpenAI 表,从今天开始,将向全球范围内的 ChatGPT Pro、Enterprise 和 Team 用户开放 Codex。


在接下来的几周内,用户可以免费畅享 Codex,探索它的各项功能。此后,他们将推出限速访问和灵活的按需付费选项,供用户购买额外使用量。


对于使用 codex-mini-latest 进行开发的用户,该模型可通过 Responses API 调用,定价为:


  • 输入 tokens:每 100 万 $1.50输出 tokens:每 100 万 $6


此外,OpenAI 表示,Codex 仍处于早期开发阶段。作为研究预览版,它目前尚不具备某些功能,


例如:前端工作所需的图像输入支持,在 Codex 运行过程中实时调整智能体的能力。


此外,远程智能体的执行速度比交互式编辑慢,这可能需要一定的适应时间。不过,随着时间推移,与 Codex 智能体的协作将越来越像与同事的异步协作。


最后 OpenAI 表示,未来计划推出更具交互性和灵活性的智能体工作流。


未来,编程也许真会变的越来越简单。


参考链接:https://openai.com/index/introducing-codex/


文章来自于微信公众号“机器之心”,作者 :机器之心编辑部


刚刚,OpenAI最强编程智能体上线ChatGPT

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

4
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0