AI资讯新闻榜单内容搜索-思维链

OpenAI测谎13款大模型：Claude 3.7封神，GPT-5.2近乎失控！

OpenAI的最新研究揭示了一个反直觉的真相：越强大的推理模型，越管不住自己的「脑子」。在CoT-Control套件测试的13款前沿模型中，DeepSeek R1控制自身思维链的成功率仅为0.1%，Claude Sonnet 4.5也只有2.7%。

来自主题: AI资讯

8941 点击 2026-03-09 15:08

伴随多模态大模型的发展，GUI Agent正成为人机交互的新范式。

来自主题: AI技术研报

8373 点击 2026-03-04 13:43

大模型的思维链越长，推理能力就越强？谷歌Say No——token数量和推理质量，真没啥正相关，因为token和token还不一样，有些纯凑数，深度思考token才真有用。新研究抛弃字数论，甩出衡量模型推理质量的全新标准DTR，专门揪模型是在真思考还是水字数。

来自主题: AI技术研报

8410 点击 2026-02-25 14:32

等效参数量仅0.3B，内存占用仅600MB，更适合端侧部署还带思维链的模型来了。腾讯混元最新推出面向消费级硬件场景的“极小”模型HY-1.8B-2Bit，体量甚至比常用的一些手机应用还小。

来自主题: AI技术研报

6815 点击 2026-02-10 14:28

LaST₀团队投稿量子位 | 公众号 QbitAI 近日，至简动力、北京大学、香港中文大学、北京人形机器人创新中心提出了一种名为LaST₀的全新隐空间推理VLA模型，在基于Transformer混

来自主题: AI技术研报

6397 点击 2026-02-08 11:50

什么样的思维链，能「教会」学生更好地推理？

来自主题: AI技术研报

9597 点击 2026-01-28 10:15

在 LLM 时代，思维链（ CoT）已成为解锁模型复杂推理能力的关键钥匙。然而，CoT 的冗长问题一直困扰着研究者——中间推理步骤和解码操作带来了巨大的计算开销和显存占用，严重制约了模型的推理效率。

来自主题: AI技术研报

7417 点击 2026-01-27 16:17

1月10日，在蓝驰创投举办的第五期不鸣创业营中，Kimi总裁张予彤分享了在AI浪潮奔涌的当下，创业者如何思考决策，以及如何应对各种波动与变化。

来自主题: AI资讯

6733 点击 2026-01-26 10:21

不讲武德！游戏圈这回真是被AI抄家了。（doge）

来自主题: AI技术研报

9742 点击 2026-01-21 10:41

近年来，大语言模型在算术、逻辑、多模态理解等任务上之所以取得显著进展，很大程度上依赖于思维链（CoT）技术。所谓 CoT，就是让模型在给出最终答案前，先生成一系列类似「解题步骤」的中间推理。这种方式

来自主题: AI技术研报

6231 点击 2026-01-10 17:00