挑战Claude Code?OpenAI Codex发布月将至,今先揭秘智能体循环
挑战Claude Code?OpenAI Codex发布月将至,今先揭秘智能体循环刚刚,OpenAI CEO 山姆・奥特曼发了一条推文:「从下周开始的接下来一个月,我们将会发布很多与 Codex 相关的激动人心的东西。」他尤其强调了网络安全这个主题。
刚刚,OpenAI CEO 山姆・奥特曼发了一条推文:「从下周开始的接下来一个月,我们将会发布很多与 Codex 相关的激动人心的东西。」他尤其强调了网络安全这个主题。
AI 创业两年,我们在一直思考一个问题:到底 AI 能够给现实生活中的普通人带来什么? 一方面新概念层出不穷,但大部分概念身边没有几个人能听懂。另一方面,AI 的叙事都在讲替代人工、降本增效——似乎
最近 AI 编程界最火的事情,就是怎么把各种 coding 模型卷到极致了。
在当前的AI Research浪潮中,Autonomous Agents已经改变了我们获取信息的方式——从被动接收到主动检索。
Agent很好,但要做好工具调用能才能跑得通。
随着大模型在单点推理上日益逼近 PhD 水平,Agent 领域迎来了新的分水岭:短程任务表现惊艳,长程任务却显乏力。为精准评估大模型的多模态理解与复杂问题解决能力,红杉中国在两周内连续发布两篇论文,旨在通过构建更科学的评估基准,预判技术演进的未来方向。
Claude Skill 很火,甚至已经超越 MCP 了,如今各家的 cli 客户端基本也都支持,扣子、MiniMax 的 agent 产品也都上架了类 Skill 的产品。而且不仅仅是对普通用户有用,从开发者视角来看,通用 Agent 内核,只靠 Skills 设计,也能低成本创造具有通用 AI 智能上限的垂直 Agent 应用。
今天的 Agent,在一个独立的、短时间任务上的表现已经很不错了。
这两天都在研究 ralph,一个你睡觉时,都能不眠不休替你干需求、榨干任何 Coding Agent 的工具。
曾经那些将需求、设计与代码强行割裂的流水线,正在快速消融。