Claude Opus 4.6差评如潮!思考深度暴跌67%,AMD总监6852次日志打脸

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
Claude Opus 4.6差评如潮!思考深度暴跌67%,AMD总监6852次日志打脸
10029点击    2026-04-10 09:44

过去Claude粉丝如今直呼「垃圾!20倍价格的Max计划,却连基本规划模式都激活不了,这波操作让所有人看清:智能是可以随时被回收的体验。


Claude偷偷降智,终于被发现了!


从今年2月前后,不少Claude用户明显感觉产品「变了」,怨声载道:看似没有系统故障,但输出更浅、更急于给出修改结果,简单的任务也会多次失败。


Claude Opus 4.6差评如潮!思考深度暴跌67%,AMD总监6852次日志打脸


同时,过去几乎不出现的stop hook违规提示也开始显著增多,token飙升。


你的第一反应是什么?就像崩溃的网友Capital-Run-1080一样:「一定是我自己的问题。」


你开始反思:是不是我的提示词(Prompt)写得不够好?是不是我的工作流变了?


在无数个技术论坛里,当用户抱怨AI变笨时,官方的默认回复永远是高高在上的那句——「请检查您的设置」。


微妙的是Anthropic的态度: 一直假装无事,没吭声,直到有人晒出数据:Claude的「思考深度」下降了67%!


Claude Opus 4.6差评如潮!思考深度暴跌67%,AMD总监6852次日志打脸


刚刚,更大的曝料来了:Claude Opus 4.6疑是大翻车,20倍价格却性能倒退,根本无法激活对应计划模式!


Claude Opus 4.6差评如潮!思考深度暴跌67%,AMD总监6852次日志打脸


你以为你在购买一张通往未来AGI的船票,实际上,船长为了省油,偷偷关掉了雷达。


Claude降智

6852次日志里的铁证


几天前,一记重锤砸碎了这种「大厂PUA」。


在GitHub上,AMD的AI总监Stella Laurenzo直接甩出了近三个月内6852次真实会话的监测日志,终于用数据量化了开发者们几周以来的感受。


结论很直接:「对复杂的工程任务而言,Claude已经不能用了。」


Claude Opus 4.6差评如潮!思考深度暴跌67%,AMD总监6852次日志打脸


AMD换了供应商。


数据证明,Claude Code的确降智了:


  • 2月底思考深度已崩盘67%,随后Anthropic向用户隐藏了推理过程。


  • 代码阅读次数从6.6次/编辑骤降至2.0次,Claude在接触你的文件前就停止了研究。


  • 3月8日后「懒惰钩子」触发173次,此前从未触发过。


  • API成本因重试暴增80倍,因为浅层思考导致持续输出错误、中断和重试。


Claude Opus 4.6差评如潮!思考深度暴跌67%,AMD总监6852次日志打脸


一个连代码都不愿看全的AI,你敢把核心工程托付给它吗?


Claude Opus 4.6差评如潮!思考深度暴跌67%,AMD总监6852次日志打脸


它不再是那个「谋定而后动」的智者,而沦为了一个急于打卡下班的「赛博油条」。


这也是为什么很多开发者这次彻底破防。


因为他们发现,自己不是在用AI提效,而是在给一个不肯认真读题的模型,反复交学费。


复杂任务最怕的,就是半懂不懂地乱改。


这被称之为「AI缩水」——价格不变,但推理能力明显缩水。


即便是200美元的Claude Code Opus 4.6 Max 20X,也中招了!


两年来,Claude Code第一次识别不出来原生的规划模式(Plan Mode),甚至不知道如何激活该模式。


被指出实现得一团糟后,一个项目被它重写了两次 。之后,Claude Code连自己内置的 Plan Mode 工具都不认识.


让惨遭「赛博鬼打墙」的用户,十分失望,不仅怀疑:花最高20倍的价格到底买来了什么?


显然,没买了智能计算、甚至没买来准确的代码补全,最后连连基本的能力都已经崩溃了。


这位过去的Claude Code的粉丝,彻底转黑粉了,直骂:


(现在的Claude)简直是垃圾。标准低到我已经在看Hugging Face的替代方案了。


Claude Opus 4.6差评如潮!思考深度暴跌67%,AMD总监6852次日志打脸


Anthropic意在何方?


问题来了,Anthropic到底有没有动过什么Claude?


微妙的地方,就在这里。


如果官方死咬「完全没变」,这件事反而简单。


可现在,Anthropic回应里确认了两件很关键的事。


2月9日,「自适应思考」(adaptive thinking)默认引入。


3月3日,Opus4.6默认思考等级effort被调到「中级」(medium)。


Claude Opus 4.6差评如潮!思考深度暴跌67%,AMD总监6852次日志打脸


Anthropic给出的说法很体面:


这是在智能、延迟、成本之间,找到一个「甜蜜点」(sweet spot)。


听起来很合理,也很像所有大厂最擅长的那种话术——


不是降级,是优化。不是缩水,是平衡。


可对重度用户来说,他们听懂的只有一句话:默认值,真的被改了。


而默认值,才是这个AI时代真正的权力中心。


因为绝大多数人,不会天天盯着性能曲线,不会每次手动切高,也不会拿着版本记录和行为日志逐项核对。


他们买的,不是某个看不见的参数,买的是一种稳定预期。


昨天,你用这个模型,能把复杂仓库摸透。今天你打开它,也理所当然以为它还是那样。


结果,名字没变。界面没变。价格没变。变的,是后台那只你看不见的手。


再往深一层看,这件事真正吓人的,还不是Claude一个模型,而是它像一个提前泄露的行业趋势。


今天,所有大模型公司都在算三笔账:


第一笔,延迟。用户嫌慢。


第二笔,成本。推理太贵。


第三笔,吞吐。服务更多人。


这三笔账,只要同时压过来,平台就一定会产生一种冲动——


在用户不敏感的地方,偷偷收一点「脑力税」——


把默认思考调浅一点。把深入阅读压缩一点。把多轮推理收窄一点。


平均看,也许更划算。报表上,也许更漂亮。


可对那些把AI当生产工具的人来说,天塌了。


因为复杂工作最值钱的,从来不是「输出速度」,是质量,是「先理解,再动手」的那段沉默。


那几秒、几十秒,甚至几百个Token的审慎,才是质量真正站得住的地方。


一旦这段沉默被平台拿去换利润,用户拿到的就不再是同一个东西。


它还能说话,还能写代码,甚至还更流畅。


但你已经不敢把关键任务交给它了。


这就像一辆车,发动机还在响,方向盘也能转,油门踩下去也还能冲。


只是刹车,悄悄薄了一层。


登上船了,才发现是泰坦尼克号


最要命的是,未来真正昂贵的AI服务,不是宣传页上跑分多漂亮,而是你下次把重要任务扔给它时,不会先吸一口凉气。


所以,Claude这次捅破的,不只是Anthropic的一层窗户纸。


它把整个行业一个最不愿意被问的问题,硬生生拖到了台前:


如果默认thinking effort、推理预算、思考可见性会直接影响结果质量, AI 公司凭什么可以悄悄改?


如果这种改动会让用户多花几十倍成本返工,需不需要明确公告?需不需要稳定档位承诺?


今天,Claude Code身上发生的事,像一记很响的耳光。


它打醒的,不只是Anthropic的用户,而是所有正在把工作、判断、时间,越来越深地交给大模型的人。


我们以为自己买的是一张通往未来的船票。


后来才发现,船还在开,灯也亮着。只是船长为了省油,已经悄悄关掉了雷达,而你不知道冰山在何处!


Claude Opus 4.6差评如潮!思考深度暴跌67%,AMD总监6852次日志打脸


而真正该害怕的,不是这一艘船,是整个行业,都开始觉得这么干很正常。


如果一个模型可以在你毫无察觉时被调低思考深度,那么你买下的从来不是智能,而是一种随时可能被回收的体验。


这,才是Claude「降智门」最冷的地方。


在4月8日,Anthropic关闭了Github上的issue,但没有解释到底解决了什么。


参考资料:

https://github.com/anthropics/claude-code/issues/42796

https://news.ycombinator.com/item?id=47660925

https://x.com/om_patel5/status/2041971334553727076


文章来自于"新智元",作者 "KingHZ"。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

2
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0