GPT-5.6首批实测来了!精准狙击Mythos

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
GPT-5.6首批实测来了!精准狙击Mythos
9180点击    2026-06-10 16:07

刚刚,Anthropic放出藏了俩月的大杀器——Claude Fable 5Mythos 5,无异于扔下一枚炸弹。


现在压力直接给到OpenAI。


GPT-5.6首批实测来了!精准狙击Mythos


同一时间,GPT-5.6也泄露了。


上周开始,OpenAI已测试内部代号为keplerkindle的两个新检查点。kindle-alpha被曝已选为发布候选。


GPT-5.6首批实测来了!精准狙击Mythos


GPT-5.6的内部测试版本,开始在海外开发者和泄露圈里被疯狂实测。代号、候选版本、跑分体感,全被翻了出来。


GPT-5.6首批实测来了!精准狙击Mythos


无论是争抢IPO,还是旗舰模型撞车,两家「你递表我也递表」「你发新模型我也发新模型」。


纯纯是打得不可开交。


但问题是,GPT-5.6真的能打过Mythos吗??


GPT-5.6首批实测来了!精准狙击Mythos


GPT-5.6浮出水面


截至目前,OpenAI对GPT-5.6还是零官宣,尚未正式发布。


不过,海外不少网友已经对还没公开的「内部检查点」做了探针测试。


所谓检查点(checkpoint),就是模型在训练过程中某个时间点存下的一份参数快照。


OpenAI内部会存很多份,横向比较,再从里面挑一个认为「够好、可以拿去发」的版本,这个版本就叫发布候选版(RC)。


从上周开始,OpenAI内部正在测两个新检查点,代号分别是kindle和kepler。其中kindle-alpha被选为发布候选版。


GPT-5.6首批实测来了!精准狙击Mythos


从流出的体感来看,GPT-5.6这次最被反复提及的升级,是前端/UI生成


网友Pankaj Kumar的说法是,kindle-alpha的前端生成能力大幅提升,不需要复杂的提示词或额外技巧,就能直接产出更强的界面输出


GPT-5.6首批实测来了!精准狙击Mythos


此外,它的视觉能力也很能打,在图像理解和图像引用类任务上表现不错,整体在推理、编码、UI生成上都有明显改善。


这是网友Chris实测kindle的效果,使用medium档位:


GPT-5.6首批实测来了!精准狙击Mythos


而这是另一位网友此前在非推理版本Joule上实测的效果:


GPT-5.6首批实测来了!精准狙击Mythos


可以看出前者精美很多。


但网友Leo拿同一个prompt、在xhigh档位上分别实测了kepler和kindle两个版本。


发现kindle比起kepler,反而还退步了。


GPT-5.6首批实测来了!精准狙击Mythos


嗯…这效果确实很难评。


他甚至判断,OpenAI很可能还会继续打磨,不排除最后弃用kindle这个候选版


最新消息是,kindle已被移出Arena,出现了一个新模型Levi


有网友猜测Levi也可能是GPT-5.6内部版本的一个代号,并对比了它和GPT-5.5的前端能力:


GPT-5.6首批实测来了!精准狙击Mythos


可以看出Levi的前端也挺能打的,风格清爽简约,富有高级感,细节处理也很到位。


不过有网友调查后发现,Levi可能来自Meta,而非GPT-5.6。


GPT-5.6首批实测来了!精准狙击Mythos


那么,GPT-5.6究竟能打过Mythos吗?


网友mark_k声称,GPT-5.6「在多个agentic coding基准上击败Mythos」。


GPT-5.6首批实测来了!精准狙击Mythos


但目前来看,更有说服力的是前面展示的网友Leo的实测。他认为GPT-5.6的情况不容乐观:


kindle相比kepler是退步。以它目前的形态,会被Mythos轻松击败


6月,上演御三家「速度与激情」


6月,夏天来了,大模型圈也是火热起来了。


海外AI御三家的模型发布时间全撞在了一起:Fable 5、Gemini 3.5 Pro、GPT-5.6,上演了一出「生死时速」。


而且打的是同一批能力——推理、智能体、编码、前端生成。


有意思的是,三家虽然都把节点压在6月,但到现在真正把卷子交上来的,只有A社一家


Gemini 3.5 Pro在5月19日的谷歌I/O大会上亮相,主打200万token上下文和Deep Think推理。


但还未正式上线,官方定于6月正式可用。


GPT-5.6,消息传出是本月晚些时候发布


这也给OpenAI的处境添了一层张力:对手已经把分数贴出来了,内部可能还在为该交哪一版RC纠结。


但除了跑分,定价也是一个重要因素。


Fable 5和Mythos 5统一定价为每百万输入Token10美元、每百万输出Token50美元。


约为现有Opus的两倍。


如果GPT-5.6在能力上和Mythos打平甚至略输,但价格便宜得多,那它在真实采用率上还是有可能扳回一城的~


目前,OpenAI还未有任何官方公告,真正的对决要等GPT-5.6正式版和Fable正面跑分那一刻——


这个月内大概率见分晓,敬请期待吧~


参考链接:

[1]https://x.com/mark_k/status/2063922897341567488?s=20

[2]https://x.com/AiBattle_/status/2064078302394917157?s=20

[3]https://x.com/pankajkumar_dev/status/2063272015214354908?s=20

[4]https://x.com/synthwavedd/status/2063245096951160865?s=20

[5]https://x.com/ChrissGPT/status/2063135842906808579?s=20

[6]https://x.com/koltregaskes/status/2062806155139912164?s=20


文章来自于"量子位",作者 "听雨"。

关键词: AI新闻 , GPT-5.6 , openai , 人工智能
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0