Claude的双面人生:在Anthropic内部卷生卷死,在用户面前躺平摆烂
Claude的双面人生:在Anthropic内部卷生卷死,在用户面前躺平摆烂AI 在工作里真是越来越拟人了。
搜索
AI 在工作里真是越来越拟人了。
6月4日,Arena.ai发布Agent Arena排行榜,用373,431次真实会话的数据,给18个主流模型的Agent能力排了个座次。先看总榜。Agent Arena的排名依据是“净改进”(Net Improvement),用因果推断方法算出每个模型相对于随机基线的性能提升幅度。正值代表比随机选择更好,负值说明不如随机。
Codex和Claude Code长得越来越像了!最近,开发者Elie Bakouch感到Claude Code和Codex的功能越来越像,他好奇到底哪家在领跑,于是就把两家都有的功能做成了一张时间线。
就在昨天,Anthropic 的官方状态页突然挂起一排刺眼的红灯——Claude API、Claude Code、Claude.ai、Claude Cowork……几乎所有核心服务,突然大面积宕机。从 Opus 4.6 到 Opus 4.8,五大模型无一幸免。
终于看到一个跳出 Codex、Claude Code 这些 Agent 范畴的新 AI 产品。而且在海外已经火起来了。这个产品叫 Aippy。目前 MAU 将近两百万,全球下载超过三百万,刚完成首轮融资,投后估值 2.5 亿美元。也是垂类赛道的新独角兽了。
Claude Mythos就用6.1×10²⁷ FLOPs提前叩响了奇点的大门。
都以为让AI查数据省事,结果它答得漂亮你却不敢信。Anthropic最近说这事有解了,靠的是一套和代码无关的「笨功夫」。
Cowork 在 Claude 带火后,大厂都在做,企业也早在用。但通用就是通用,碰上房地产这种数据非标、容错为零的硬骨头,全部露怯。跑通这块的,反而是一匹国产黑马。
今天看到了一个我觉得还挺有价值的东西。
今年4-5月,AI信息安全迎来「水门事件级」窗口:攻方落地、守方应急、噪音失控、治理失灵同时暴发。Anthropic主动封印Claude Mythos,只因它强大到必须送进末日火山。