Claude终于认了！降智坐实，越聊越傻，3个bug全曝光

8986点击 2026-04-24 15:51

感谢OpenAI（doge）。

就在GPT-5.5发布的前后脚，Claude招了：

模型降智属实，所有使用额度均已重置。

嘴硬了一个多月，这降智bug终于从A社自己嘴里蹦出来了：

推理等级偷偷从「高」调成「中」
缓存bug导致每轮对话都清空思考记录
一句25词限制的提示词砸了输出质量

三个bug叠在一起，Claude使用体验全面拉垮。

只能还好说友商今天及时给上了一波压力，教育用户终究不可取。

Claude终于认了！降智坐实，越聊越傻，3个bug全曝光

不过，说归说，更新bug当然是好事。就是这时间也太巧了，GPT-5.5刚发，Claude就开始「认怂」。

难不成是5.5帮忙debug的？

Dario啊，你该不会真的是故意让Claude变笨，好在GPT-5.5放出来的时候找画面的吧？

Claude终于认了！降智坐实，越聊越傻，3个bug全曝光

Bug实锤了，一共三个

先说一句，这已经不是第一次了。

去年8月，Anthropic刚发过一次类似的降智postmortem，当时影响的是Opus 4.0和4.1，官方说辞也是「我们从未有意降低模型质量」。

这次新postmortem的标题叫「A postmortem of three recent issues」。recent，意思也很明白。

不是刚刚，是最近。

Claude终于认了！降智坐实，越聊越傻，3个bug全曝光

之所以「最近」，是因为Claude降智这事儿，社区已经嚷嚷吵了很久了。

十多天前，AMD AI组高级总监Stella Laurenzo就在GitHub上发了一份硬核审计报告，覆盖6852份会话文件、17871个思考块、超过23万次工具调用。

Claude终于认了！降智坐实，越聊越傻，3个bug全曝光

分析结果显示，从2月份开始，模型的推理深度出现了断崖式下滑。

更细节的发现是，Claude开始陷入reasoning loops，而且有明显的倾向去选「最简单的修复」而不是正确的修复。

BridgeMind的BridgeBench测试也在同期炸锅，Opus 4.6准确率从83.3%掉到68.3%，排名从第2跌到第10。

Claude终于认了！降智坐实，越聊越傻，3个bug全曝光

虽然后来被研究者批评方法论有问题，前后测试的任务数量根本不一样，但「Claude变蠢了」的叙事已经传开了。

网友甚至造了个新词，AI shrinkflation，AI缩水通胀。同样的价格，你拿到的是稀释过的产品。

换句话说，大伙买到了A社的「儿童套餐」。

但没办法，当时Claude确实是打遍天下无敌手，不少用户边骂边用，没啥脾气。

直到GPT-5.5发了，A社终于坐不住，在官方博客上发了一篇postmortem，把过去两个月的「降智」拆成三条独立问题：

偷偷降了推理等级。

3月4日，Claude Code的默认推理从high调成了medium，理由是high模式下延迟太高。但界面上还是显示「high」。用户以为自己在用满血版，实际拿到的是降档货。一个多月后才回滚。

越聊越傻。

3月26日上了个缓存优化，本意是会话空闲超过一小时后清掉旧的思考记录。结果代码有bug，清除变成了每一轮都执行。

Claude继续干活，但逐渐忘了自己为什么要干这件事。健忘、重复、工具调用乱飞，就是这个bug的症状。

而且因为思考记录被反复清，每次请求都缓存未命中，token消耗反而飙升。花了15天才修好。

一句提示词砸了输出质量。

4月16日，系统提示里加了一条「工具调用之间文字不超过25个词，最终回复不超过100个词」。

Opus 4.6和4.7都掉了3%性能，四天后回滚。

三个问题影响不同用户群，在不同时间段生效。叠加起来的效果就是整个Claude Code在持续、不均匀地变差，但谁也说不清到底哪里不对。

官方推特上，ClaudeDevs发总结，Claude之父Boris Cherny也亲自下场回复，并预告Opus 4.7的bug也正在de了。

Claude终于认了！降智坐实，越聊越傻，3个bug全曝光

但问题是，光有bug不够解释这两个月发生的一切。

四月里，A社的骚操作一箩筐

把时间线拉开看，四月其实是A社连续三拳打在自己脸上。

4月4日，Anthropic封禁了OpenClaw等第三方agentic工具通过Pro/Max订阅运行。想继续用？去走API按token付费。

4月21日，官方定价页悄悄把Pro plan里的Claude Code去掉了，支持文档也从「Pro或Max plan」改成了「只有Max plan」。

被网友抓包后，Head of Growth Amol Avasare出来说这只是2%新用户的A/B测试。但问题是公开页面是全站更新的，口径完全对不上。几小时后灰头土脸地回滚。

连起来算一笔账。Pro用户20/月，年费240。要继续用Claude Code，得升到Max 5x，100/月起步，年费1200。五倍。Max 20x是2400，十倍。中间没有过渡档。

注意，这里单位是美元。

4月23日，就是今天，postmortem上线，补偿是重置使用额度。

有网友不客气地指出，上周Opus 4.7发布时就已经重置过一次了，所以这次的「补偿」其实就是一次正常的周期重置。

三件事连起来，味道就不是bug了，是成本焦虑全面爆发。

网友不买账

综上种种，对于Claude，网友的反应也开始分化。

有人觉得出bug可以理解，postmortem写得也算透明。Boris在HN一条一条回复，这比大多数公司做得好。

Claude终于认了！降智坐实，越聊越傻，3个bug全曝光

但更多人在算另一笔账。

这两个月里，所有正式渠道一声不吭。

只有几个员工在X上零星回复用户，而且被批评为「随机时间随机回复」，完全不成体系。

Claude终于认了！降智坐实，越聊越傻，3个bug全曝光

还有人质疑「缓存优化」的真正动机。清除思考记录的触发时间恰好卡在缓存过期的节点上，有人觉得这不是为了降延迟，是为了省成本。

同期Anthropic还对一小部分Pro用户做了A/B测试，悄悄给了不同的产品配置，信任又挨了一刀。

Claude终于认了！降智坐实，越聊越傻，3个bug全曝光

补偿措施是重置使用额度。有人不客气地指出，上周Opus 4.7发布时就已经重置过一次了。

BridgeMind的BridgeBench测试也在这段时间炸了锅，显示Opus 4.6准确率从83.3%掉到68.3%，排名从第2跌到第10。

虽然后来被研究者批评方法论有问题，前后测试的任务数量根本不一样，但「Claude变蠢了」的叙事已经传开了。

正如一位网友说的，不能把所有鸡蛋放在一个模型公司里。

Claude终于认了！降智坐实，越聊越傻，3个bug全曝光

One more thing

HN评论区里一个有意思的现象，不少人在聊自己的「迁移经历」。

有人说二月份就「下意识地」转去了Codex，直到现在才意识到大概是被Claude变差给逼的。

Claude终于认了！降智坐实，越聊越傻，3个bug全曝光

也有人说GPT-5.4已经比Opus4.6好了。

Claude终于认了！降智坐实，越聊越傻，3个bug全曝光

还有人在用MiniMax做补充，40美金4500条消息一个5小时周期，还能看到完整思考过程。

Claude终于认了！降智坐实，越聊越傻，3个bug全曝光

半年前「写代码就用Claude」几乎是共识。

现在Codex有400万活跃用户，GPT-5.5主打的就是编码和计算机操作能力，连OpenAI的人都直接说这个模型能当「参谋长」用。

Claude不是变差了。是别人变好了，而它在最不该出问题的时候出了问题。

留给Anthropic修bug和重建信任的窗口，比两个月前窄了不少。

GPT-5.5已经发布，DeepSeek V4俨然就位。

Claude终于认了！降智坐实，越聊越傻，3个bug全曝光

Gemini快来吧！就差你了。

参考链接

[1]https://www.anthropic.com/engineering/april-23-postmortem

[2]https://news.ycombinator.com/item?id=47878905

文章来自于微信公众号 "量子位"，作者 "量子位"

AI新闻 Claude Claude降智人工智能

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法，编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词，进而高质量的帮助用户通过AI解决问题。
项目地址：https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用：https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0