Claude Opus 4.1火速发布!坐稳编程之王,官方:马上还有大更新

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
Claude Opus 4.1火速发布!坐稳编程之王,官方:马上还有大更新
7675点击    2025-08-06 10:22

还是Claude痛快,Claude Opus 4.1前脚曝光,今天这就正式发了。


编程性能再次突破天花板,超越Claude Opus 4,拿下SOTA。


此外在Agent任务和推理方面进一步升级。


但加量不加价,定价和Claude Opus 4一样


Claude Opus 4.1火速发布!坐稳编程之王,官方:马上还有大更新


官方说计划在未来几周对模型进行更大规模升级与改进,看来真就只是一次小更新,替代Opus 4。


Claude Opus 4.1火速发布!坐稳编程之王,官方:马上还有大更新


实测用它做一个俄罗斯方块小游戏,提示词是“build the tetris game”,表现很稳。


Claude Opus 4.1火速发布!坐稳编程之王,官方:马上还有大更新


有人觉得,Anthropic可能本来不想发模型,但是奈何GPT-5/Gemini-3的消息太多,为了保持市场竞争力所以先更新一波。


Claude Opus 4.1火速发布!坐稳编程之王,官方:马上还有大更新


值得一提的是,Claude Opus 4.1这篇发布blog虽然简短,但是里面的心机可不老少——秀性能提升、秀客户关系、还变相证明自家模型真实好用。


现在的硅谷AI圈,真有意思哇。


Claude Opus 4.1火速发布!坐稳编程之王,官方:马上还有大更新


明晒模型性能,暗秀客户关系


Anthropic首先晒了大家最关心的模型编程能力。


在SWE-bench上,Opus 4.1超越Opus 4、Gemini 2.5 Pro、o3,将性能提升至74.5%,拿下新SOTA。


同时还提升了深度研究和数据分析的技能,特别是在细节追踪和Agent检索方面。


Claude Opus 4.1火速发布!坐稳编程之王,官方:马上还有大更新


其次,他们还找来客户做背书,邀请他们分享了内测中觉得Opus 4.1印象深刻的能力。既能体现自家模型在真实场景中好用,也暗暗秀了一把自己的客户订单。


根据GitHub给出的三方结果,Opus 4.1各个方面都较Opus 4有所改进,特别是在跨文件重构代码上,提升明显。


Rakuten Group(日本乐天株式会社)表示,Opus 4.1很擅长在大型代码库中精准定位、修复bug,且不需要进行不必要的调整、也不会产生新的bug,他们团队很喜欢在日常任务中使用这一功能。


Windsurf则表示,在初级开发基准测试中,Opus4到Opus 4.1的提升,和此前Sonnet 3.7到Sonnet 4的提升一样大。


这里插一句,因为亚历山大·王带团跳槽Meta,Windsurf剩余团队去向不明期间,Anthropic还断供了Windsurf一段时间,这应该是因为当时OpenAI要收购Windsurf。


如今随着Windsurf被Cognition收购,这种封锁已经解除,借着此次模型升级,Anthropic也算是亮明“大家还是好伙伴”的态度。


Claude Opus 4.1火速发布!坐稳编程之王,官方:马上还有大更新


至于为啥找这么多客户来背书……前段时间GPT-5被泄露可不只有ChatGPT这边,还包括Cursor等合作平台,是故意的还是不小心不知道,但是OpenAI和谁合作大家都清楚了。Anthropic也想晒客户关系,也很正常。


最后,这篇Blog很简短,官方也明说就是小升级。


这种文风更受开发者们喜爱,毕竟隔壁的大忽悠实在是emmm……太能拉高大家预期了。


Claude Opus 4.1火速发布!坐稳编程之王,官方:马上还有大更新


不管是有意还是无意,Anthropic都和最近一直炒GPT-5热度的OpenAI形成鲜明对比,谁现在更加技术本色,大家想必也心中有选择。


以及Opus 4.1的System Card也一同发布,其中表明Opus 4.1是对Opus 4的进一步调整,模型的核心尺寸或训练方法都没有变化


同时Anthropic也公布了Opus 4.1的更多相关指标。


比如Opus 4.1的无害回复回应率更高,如果开启推理,指标已经能达到99.06%。


Claude Opus 4.1火速发布!坐稳编程之王,官方:马上还有大更新


更多内容大家可在System Card中进一步查看。


最后,Claude Opus 4.1已面向所有付费用户开放,包括Claude Code;也可以通过API、Amazon Bedrock和Vertex AI上使用,定价和Claude Opus 4一样。


Blog:https://www.anthropic.com/news/claude-opus-4-1


System Card:https://assets.anthropic.com/m/4c024b86c698d3d4/original/Claude-4-1-System-Card.pdf



文章来自微信公众号 “ 量子位 ”,作者 明敏

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

2
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0