AI资讯新闻榜单内容搜索-模型

千问 3.5：0.8 元的顶级模型，我找不到它的对手

我正对着镜子站立，举起一只手。在我的视野中，这只手出现在镜子画面的左侧。请问在现实中，我举起的是哪只手？答案应该是：左手。一道堪比「9.11 ＞ 9.8」的 AI 陷阱题。前两天，我拿它测了一

来自主题: AI产品测评

6203 点击 2026-02-24 09:12

奥特曼：人类吃 20 年饭不如训练 AI，全网炸了，网友：你再说一遍？

奥特曼又又又又口出狂言了。在印度 Express Adda 的论坛上，Sam Altman 聊了很多 AI 话题，从 AGI 到中美 AI 竞争，再到数据中心用水问题。但最火的那段，是他回应 AI 能耗批评时说的：「人们总谈训练 AI 模型需要多少能源……但训练人类也需要大量能源，得花 20 年时间，消耗那么多食物，才能变聪明。」

来自主题: AI资讯

9900 点击 2026-02-23 22:49

AI 生图模型的「刻板印象」已经到达了一个很抽象的地步

马上春节假期都结束了，不知道大家有没有人被家里催婚 😭 我这几天一直躺在屋里，为了躲避惨无人道的亲戚催婚，睡得昏天暗地，睡觉、刷抖音、刷 X、刷小红书、吃饭、睡觉，闭环了。就在昨天，我日常刷抖音的时

来自主题: AI资讯

8595 点击 2026-02-23 19:18

MiniMax 成为 Token 调用第一后，模型厂商必须面对的 AgentOS 现实

作为目前全球最主要的大模型 API 聚合网关之一，OpenRouter 的 Token 调用量在 2026 年 1 月下旬出现了明显跃升。自 1 月 26 日当周开始，平台 Token 周增量首次突破 1.5T，这一幅度在过去的调用曲线中并不常见。时间点同样值得玩味——这一轮增长几乎与 OpenClaw 的迅速传播高度重合。人们开始发现，OpenClaw 简直就是 Token 碎纸机。

来自主题: AI资讯

8958 点击 2026-02-23 19:13

GLM-5 技术报告全解读｜a16z：“最好的开源模型”

a16z 昨天发了一张图，把 GLM-5 和 Claude Opus 4.6 并排标注在 Artificial Analysis Intelligence Index 的时间线上。原文的说法是： A proprietary model (Claude Opus 4.6) is still the 'most intelligent,' but the gap between

来自主题: AI技术研报

9957 点击 2026-02-22 23:06

5 亿 ARR的Cursor，已经没人讨论它了？

最近Cursor 发布了 Composer 1.5。这一版把强化学习规模扩大了 20 倍，后训练计算量甚至超过了基座模型的预训练投入。还加了 thinking tokens 和自我摘要机制，让模型能在复杂编程任务里做更深度的推理。

来自主题: AI资讯

9628 点击 2026-02-22 11:39

训练奖励太稀疏？港中文联合美团给Agent加上「过程分」

在很多大模型和 Agent 的训练里，最常见的一种做法就是只看结果：最后答案对了就给奖励，错了就当 0 分。在单轮问答里，这样「只看结果」还勉强能用；可一旦换成 Agent 这种要多轮对话、搜索、刷

来自主题: AI技术研报

8342 点击 2026-02-22 11:29

ICLR 2026 | 阿里高德发布SpatialGenEval，揭秘谁才是真正的文生图大师

来自阿里高德的一篇最新 ICLR 2026 中稿论文《Everything in Its Place: Benchmarking Spatial Intelligence of Text-to-Image Models》提出了面向文生图空间智能的系统性评估基准 SpatialGenEval，旨在通过长文本、高信息密度的 T2I prompt 设计，以及围绕空间感知

来自主题: AI技术研报

9640 点击 2026-02-22 11:17

Gemini 3.1 Pro 曝光，能力翻倍价格不变，谷歌想重新定义 AI 竞争规则

当地时间 2 月 19 日，Google 曝光 Gemini 3.1 Pro 最新模型。在 ARC-AGI-2 这个公认的推理基准测试中，Gemini 3.1 Pro 拿到了 77.1% 的分数。什么概念？它的前辈 Gemini 3 Pro 只有 31.1%，就连专门用来「深度思考」的 Gemini 3 Deep Think 也只有 45.1%。

来自主题: AI资讯

8518 点击 2026-02-20 13:53

医疗AI大洗牌！斯坦福、普林斯顿发布首个医学世界模型MedOS

医疗AI终于走出了「只会聊天」的舒适区。今天，斯坦福与普林斯顿联手NVIDIA发布MedOS。这不是一个单纯的手术机器人，而是全球首个通用医疗具身世界模型。从临床诊断到治疗，从外科手术到药物研发，MedOS正在让AI真正读懂「生老病死」的物理现实。

来自主题: AI资讯

8455 点击 2026-02-20 13:37