实测丨全新的「扣子编程」,全新的 Vibe Infra
实测丨全新的「扣子编程」,全新的 Vibe Infra老粉都知道,咱们特工宇宙和扣子团队有多熟悉。
老粉都知道,咱们特工宇宙和扣子团队有多熟悉。
MiniMax最新旗舰级Coding & Agent模型M2.1,刚刚对外发布了。这一次,它直接甩出了一份硬核成绩单,在衡量多语言软件工程能力的Multi-SWE-bench榜单中,以仅10B的激活参数拿下了49.4%的成绩,超越了Claude Sonnet 4.5等国际顶尖竞品,拿下全球SOTA。
2025倒计时,新SOTA模型涌现没有放缓迹象。一夜之间,编程SOTA模型易主,而且上线即开源,依然来自中国大模型公司——智谱AI,GLM-4.7。
编程初创公司Lovable在销售额翻三倍后,以66亿美元的估值获得了3.3亿美元的新融资,正值对于能够加速软件开发的人工智能工具的需求激增。Lovable首席执行官在周五的彭博电视节目中表示,自上轮融资六个月以来,公司收入“增长了三倍以上”。他拒绝透露具体数字。
即将过去的、我们无比熟悉的 2025 年,被称为是 Agent 的元年。
2025年就要结束了,原来真正的高手,隐藏在「民间」!不是谷歌、不是OpenAI,是Anthropic王者编程模型Claude Opus 4.5。在METR最新公布报告称,Claude Opus 4.5已能够持续自主编码「长达5小时不崩」。
他独自承担了一个复杂的 TypeScript 微服务项目的改造工作。为了让老板同意,他当场拍着胸脯保证六个月内完成。随后,他转身将 Claude Code 调教成得力助手,协助自己管理与重写工作。为此,他每月花费 200 美元(约 1422 元)开通 Max 20x 套餐,将原本约 10 万行的项目重构为 30~40 万行规模。
最近两天,一款名为《青椒模拟器》的小游戏突然火了,好玩程度一整个把人震撼住了。游戏时间以学年为单位推进。一开始,每个人的起点都差不多:职称未定、资源有限、热情尚存,他们会招募团队新成员、申请项目、处理学生遇到的问题、中间还会有各种各样的事务来让你选择,你的每个决定都会影响着之后的评级。
GPT-5.2-Codex,深夜突袭! 它是OpenAI迄今为止,最强的AI智能体编程模型,专为复杂、真实世界软件工程而打造。 从名字可以看出,GPT-5.2-Codex基于GPT-5.2进一步优化版本,它在多项能力上实现了关键改进:
谷歌在2025年底甩出「王炸」:Gemini 3 Flash! 这款模型彻底打破了「快就一定笨、强就一定贵」的定律,以3倍于前代的速度实现「零延迟」响应,甚至在编程和逻辑推理上反超了Pro级大哥。