GPT-5.6首批实测来了！精准狙击Mythos

10842点击 2026-06-10 16:07

刚刚，Anthropic放出藏了俩月的大杀器——Claude Fable 5和Mythos 5，无异于扔下一枚炸弹。

现在压力直接给到OpenAI。

同一时间，GPT-5.6也泄露了。

上周开始，OpenAI已测试内部代号为kepler和kindle的两个新检查点。kindle-alpha被曝已选为发布候选。

GPT-5.6首批实测来了！精准狙击Mythos

GPT-5.6的内部测试版本，开始在海外开发者和泄露圈里被疯狂实测。代号、候选版本、跑分体感，全被翻了出来。

GPT-5.6首批实测来了！精准狙击Mythos

无论是争抢IPO，还是旗舰模型撞车，两家「你递表我也递表」「你发新模型我也发新模型」。

纯纯是打得不可开交。

但问题是，GPT-5.6真的能打过Mythos吗？？

GPT-5.6首批实测来了！精准狙击Mythos

GPT-5.6浮出水面

截至目前，OpenAI对GPT-5.6还是零官宣，尚未正式发布。

不过，海外不少网友已经对还没公开的「内部检查点」做了探针测试。

所谓检查点（checkpoint），就是模型在训练过程中某个时间点存下的一份参数快照。

OpenAI内部会存很多份，横向比较，再从里面挑一个认为「够好、可以拿去发」的版本，这个版本就叫发布候选版（RC）。

从上周开始，OpenAI内部正在测两个新检查点，代号分别是kindle和kepler。其中kindle-alpha被选为发布候选版。

GPT-5.6首批实测来了！精准狙击Mythos

从流出的体感来看，GPT-5.6这次最被反复提及的升级，是前端/UI生成。

网友Pankaj Kumar的说法是，kindle-alpha的前端生成能力大幅提升，不需要复杂的提示词或额外技巧，就能直接产出更强的界面输出。

GPT-5.6首批实测来了！精准狙击Mythos

此外，它的视觉能力也很能打，在图像理解和图像引用类任务上表现不错，整体在推理、编码、UI生成上都有明显改善。

这是网友Chris实测kindle的效果，使用medium档位：

GPT-5.6首批实测来了！精准狙击Mythos

而这是另一位网友此前在非推理版本Joule上实测的效果：

GPT-5.6首批实测来了！精准狙击Mythos

可以看出前者精美很多。

但网友Leo拿同一个prompt、在xhigh档位上分别实测了kepler和kindle两个版本。

发现kindle比起kepler，反而还退步了。

GPT-5.6首批实测来了！精准狙击Mythos

嗯…这效果确实很难评。

他甚至判断，OpenAI很可能还会继续打磨，不排除最后弃用kindle这个候选版。

最新消息是，kindle已被移出Arena，出现了一个新模型Levi。

有网友猜测Levi也可能是GPT-5.6内部版本的一个代号，并对比了它和GPT-5.5的前端能力：

GPT-5.6首批实测来了！精准狙击Mythos

可以看出Levi的前端也挺能打的，风格清爽简约，富有高级感，细节处理也很到位。

不过有网友调查后发现，Levi可能来自Meta，而非GPT-5.6。

GPT-5.6首批实测来了！精准狙击Mythos

那么，GPT-5.6究竟能打过Mythos吗？

网友mark_k声称，GPT-5.6「在多个agentic coding基准上击败Mythos」。

GPT-5.6首批实测来了！精准狙击Mythos

但目前来看，更有说服力的是前面展示的网友Leo的实测。他认为GPT-5.6的情况不容乐观：

kindle相比kepler是退步。以它目前的形态，会被Mythos轻松击败。

6月，上演御三家「速度与激情」

6月，夏天来了，大模型圈也是火热起来了。

海外AI御三家的模型发布时间全撞在了一起：Fable 5、Gemini 3.5 Pro、GPT-5.6，上演了一出「生死时速」。

而且打的是同一批能力——推理、智能体、编码、前端生成。

有意思的是，三家虽然都把节点压在6月，但到现在真正把卷子交上来的，只有A社一家。

Gemini 3.5 Pro在5月19日的谷歌I/O大会上亮相，主打200万token上下文和Deep Think推理。

但还未正式上线，官方定于6月正式可用。

GPT-5.6，消息传出是本月晚些时候发布。

这也给OpenAI的处境添了一层张力：对手已经把分数贴出来了，内部可能还在为该交哪一版RC纠结。

但除了跑分，定价也是一个重要因素。

Fable 5和Mythos 5统一定价为每百万输入Token10美元、每百万输出Token50美元。

约为现有Opus的两倍。

如果GPT-5.6在能力上和Mythos打平甚至略输，但价格便宜得多，那它在真实采用率上还是有可能扳回一城的~

目前，OpenAI还未有任何官方公告，真正的对决要等GPT-5.6正式版和Fable正面跑分那一刻——

这个月内大概率见分晓，敬请期待吧~

参考链接：

[1]https://x.com/mark_k/status/2063922897341567488?s=20

[2]https://x.com/AiBattle_/status/2064078302394917157?s=20

[3]https://x.com/pankajkumar_dev/status/2063272015214354908?s=20

[4]https://x.com/synthwavedd/status/2063245096951160865?s=20

[5]https://x.com/ChrissGPT/status/2063135842906808579?s=20

[6]https://x.com/koltregaskes/status/2062806155139912164?s=20

文章来自于"量子位"，作者 "听雨"。

关键词: AI新闻 , GPT-5.6 , openai , 人工智能

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。
项目地址：https://github.com/browser-use/browser-use

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法，编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词，进而高质量的帮助用户通过AI解决问题。
项目地址：https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用：https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0