实锤!GPT-5.5「降智」被抓,OpenAI官方文档认了

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
实锤!GPT-5.5「降智」被抓,OpenAI官方文档认了
8174点击    2026-05-27 23:48

ChatGPT又被爆「降智」了!


就在这两天,𝕏上率先炸锅。


网友Lisan al Gaib发现,GPT-5.5用了一两个小时后突然变傻,每个请求都是秒回,质量断崖式下跌。


但界面上显示的,依然还是「GPT-5.5 Extended Thinking」。


也就是说,思考的标签还挂着,但思考本身已经消失了。


实锤!GPT-5.5「降智」被抓,OpenAI官方文档认了


200美元/月,买了个「薛定谔的模型」


OpenAI开发者论坛上,一篇投诉帖同步爆了。


Agentify.sh表示,GPT-5.5用着用着会突然丧失遵循指令的能力。


眼瞧着它兴冲冲地宣布「修好了」,结果代码质量差到引发大面积回退。


之前5.5-med就能轻松搞定的UI任务,现在连最简单的改动都搞不定。


升到5.5-high,没用。再升到xhigh,还是不行。


而且xhigh以前能跑好几个小时,现在明显缩短了。


实锤!GPT-5.5「降智」被抓,OpenAI官方文档认了


帖子一出,回复区瞬间炸了。


有人直接退回了5.4。


有人用的是xhigh最高档,但「跟上周比明显拉胯,长任务频繁出错,完全不遵循工作流」。


有人反映更离谱的情况,「简单查询也要转很久,你打断它纠正方向,它直接无视你,继续按之前错误的计划走」。


没错,所有人都在描述同一个现象——GPT的脑子,不知道什么时候被偷偷换掉了。


GPT-5.5目前的表现跟5.3差不多,毫不夸张。头几天还惊艳得不行,现在完全找不到当初那个模型的影子了。


实锤!GPT-5.5「降智」被抓,OpenAI官方文档认了


不是错觉,OpenAI自己白纸黑字写着


为了验证,Lisan al Gaib专门做了一个对比测试。


同一个账号,ChatGPT端用Extended Thinking跑出来的全是垃圾,转头到Codex端用xhigh,立刻恢复正常。


用他的原话说就是,Codex「简直比这玩意儿聪明40亿倍」。


实锤!GPT-5.5「降智」被抓,OpenAI官方文档认了


开发者Andrew Curran则想了个妙招——直接问模型「你的训练数据截止日期是什么?」


模型回答,August 2025。


问题是,GPT-5.5 Thinking的截止日期是12月。8月,是Instant版本的截止日期!


也就是说,他选的是Thinking,系统实际给他跑的是Instant


界面上模型标签一个字都没变,但背后的模型已经被偷偷换掉了……


实锤!GPT-5.5「降智」被抓,OpenAI官方文档认了


搞笑的是,这次OpenAI竟然在自己的帮助文档里替用户做了实锤。


根据OpenAI Help Center的官方说明,Plus用户每3小时最多发送160条GPT-5.5消息。


用完之后,系统会静默切换到mini模型,直到额度重置


实锤!GPT-5.5「降智」被抓,OpenAI官方文档认了


注意「静默」两个字。


没有弹窗提示,没有模型标签变化,没有任何视觉反馈。


你还以为自己在用旗舰模型,对面已经悄悄换成了mini。


Pro用户也别高兴太早。


Heavy思考模式,那个Pro独享的最高推理档位,在服务器负载高的时候,同样会被容量限流。同样没有预警。


换句话说,200美元/月的Pro订阅,买到的是一个随时可能被「偷梁换柱」的服务。


实锤!GPT-5.5「降智」被抓,OpenAI官方文档认了


而这种「标签没变,脑子换了」的操作,在Codex端更早就被人抓包了。


今年2月,GitHub上出现了一个issue,一个Pro用户用trace命令抓到,自己请求的是GPT-5.3 Codex,实际返回的模型是GPT-5.2。


连5.2 Codex都不是,是更低的基础版5.2。


实锤!GPT-5.5「降智」被抓,OpenAI官方文档认了


他贴出了复现命令:


RUST_LOG='codex_api::sse::responses=trace' codex exec --skip-git-repo-check -s read-only -m 'gpt-5.3-codex' 'hi' 2>&1 >/dev/null | rg -o --replace '$1' '"model":"([^"]+)"' | head -n1


输出:gpt-5.2-2025-12-11
预期:gpt-5.3-codex


多个Pro用户在同一个issue下确认了同样的降级。


而且这种降级是「粘性的」,不会自己恢复,也没有任何解释。


实锤!GPT-5.5「降智」被抓,OpenAI官方文档认了


甚至,在4月GPT-5.5发布当天,还有用户报告Fast模式的速度跟Standard差不多,但计费还是按Fast来的。


简单任务跑了7分49秒,正常应该5-6分钟。


实锤!GPT-5.5「降智」被抓,OpenAI官方文档认了


实锤!GPT-5.5「降智」被抓,OpenAI官方文档认了


OpenAI承认了,然后就没有然后了


5月15日,OpenAI的status页面出现了一条记录。


GPT5.5 Performance Degradation,我们正在调查部分用户反映的GPT-5.5性能下降问题。


5月17日,状态更新为「已解决」。


但从论坛帖子的时间线来看,5月24-26日的降智投诉比5月15日那波更猛。


要么「解决」了的问题又回来了,要么压根就没真正解决。


实锤!GPT-5.5「降智」被抓,OpenAI官方文档认了


每次升级都是一次「降智争议」


然各家都会遇到「模型变蠢」的吐槽,但OpenAI从GPT-5到GPT-5.5的每个更新,一次都没缺席


每一次OpenAI都说在调查,每一次都说已解决,然后下一个版本继续。


2025年8月,GPT-5首发。Reddit的热帖标题直接就是「GPT-5太烂了」。用户投诉短回复、更多拒绝、更少人格感。


OpenAI被迫紧急恢复GPT-4o选项。奥特曼在Reddit AMA上亲自承认「比我们预期的颠簸」。


实锤!GPT-5.5「降智」被抓,OpenAI官方文档认了


2025年12月,GPT-5.2。翻译质量倒退,编造不存在的API,拒绝执行5.1能轻松完成的风格指令。


2026年2月,GPT-5.3-Codex。Pro用户被静默降级到5.2,trace命令实锤。


2026年3月,GPT-5.4。OpenAI社区论坛出现「GPT-5.4在Codex里明显退化了」帖子,网友回复全部确认。


2026年5月初,GPT-5.5 Instant上线。回复长度缩短30%,emoji几乎消失。网友总结:精度提升了,但温度消失了。


实锤!GPT-5.5「降智」被抓,OpenAI官方文档认了


2026年5月下旬,也就是现在。Thinking模式的降智投诉再次爆发。


Lisan al Gaib透露,自从GPT-5发布时他带头打了那场ChatGPT Plus额度争夺战之后,「每周都会收到这样的私信」。


最新一条是有人求他帮忙把xhigh/heavy thinking要回来。


实锤!GPT-5.5「降智」被抓,OpenAI官方文档认了


跑分最强的那天,是发布日


chatgptdisaster.com整理了1087条经过验证的用户投诉,其中一类被反复提到的场景叫「路由层失灵」,UI显示GPT-5.5 Pro,输出完全是另一个档次的东西。


用户描述了一个可复现的模式,长会话后模型开始「完全无视你说的话」,但模型选择器上还挂着顶配标签。


实锤!GPT-5.5「降智」被抓,OpenAI官方文档认了


最荒诞的注脚是,Plus用户160条/3小时用完后自动切换mini的机制,在OpenAI官方文档里被描述为一项「功能」


为什么会这样?Lisan al Gaib分析认为,答案就两个字,省钱。


算力与盈利能力的紧缩正影响着每一个人。处处精打细算,不放过任何省钱的机会。


实锤!GPT-5.5「降智」被抓,OpenAI官方文档认了


然而,就在GPT-5.5用户集体投诉的同一周,GPT-5.6的身影已经出现在了Codex后台日志里。


内部代号iris-alpha,150万Token上下文,Polymarket给出的6月发布概率超过85%。


一边是5.5用户连基础体验都保不住,一边是5.6已经在后台悄悄跑真实流量。


这就是2026年的ASI竞赛。


造新模型的速度越来越快,但让旧模型好好跑完一个会话却越来越难。


跑分最强的那一天永远是发布日,之后每一天都是薛定谔的GPT。


实锤!GPT-5.5「降智」被抓,OpenAI官方文档认了


参考资料:


https://x.com/scaling01/status/2058643470357590058?s=20


文章来自于微信公众号 "新智元",作者 "新智元"

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。

在线使用:https://ffa.chat/