AI资讯新闻榜单内容搜索-Thinker

3B小模型，编程得分比肩Opus 4.5，神秘模型引发热议，原是国产

最近几天，一个 3B 的小模型在 X 上火了，因为在一些难度可验证的推理任务上（比如编程），它进入了 Gemini 3 Pro、GPT-5 high、Claude Opus 4.5、GLM-5、Kimi K2.5 等前沿模型的性能区间，而它的体积远小于这些模型。

来自主题: AI技术研报

10470 点击 2026-06-18 15:30

画数独、烧蜡烛都不翻车了？浙大&阿里让AI先三思再下笔｜ACL 2026

当下视觉生成正陷入一个能力错位困境—— 扩散模型的像素画质已接近完美，但一遇到需要逻辑推理的生成任务就频频翻车。

来自主题: AI技术研报

6134 点击 2026-05-26 14:58

ICML 2026｜首个视觉语言模型并行思考框架，一文解析内在机制

当前，测试时扩展范式普遍致力于增加推理长度。然而，已有研究表明，随着推理长度的持续增长，以垂直扩展为核心的计算范式容易陷入探索僵化等问题。因此，从另一维度拓展推理的宽度显得尤为重要。K2.5、Step3-VL 和 LongCat-Flash-Thinking 等模型已在推理宽度方面开展了有益的探索。

来自主题: AI技术研报

8732 点击 2026-05-25 09:49

不卷速度卷验证，陈天桥MiroMind精准预测15天后黄金价格

一睁眼！陈天桥带队的大模型黑马MiroMind再度满血归来—— 正式发布新一代重型推理智能体：MiroThinker-1.7和MiroThinker-H1。

来自主题: AI资讯

6248 点击 2026-03-16 15:11

CVPR 2026｜清华联合美团推出3DThinker，首个用3D意象思考的工作

大家是否有这样的感觉？给定几张场景中拍摄的图片，往往能够在脑海中想象出这个场景的三维布局，然而当前的多模态大模型还停留于纯文本或者 2D 视觉的推理表示，限制了图像中隐含几何结构的表达能力。

来自主题: AI技术研报

8969 点击 2026-03-11 09:25

ICLR2026 Oral | 当情感识别不再是分类题：EmotionThinker 让 SpeechLLM 学会“解释情绪”

SpeechLLM 是否具备像人类一样解释 “为什么” 做出情绪判断的能力？为此，研究团队提出了EmotionThinker—— 首个面向可解释情感推理（Explainable Emotion Reasoning）的强化学习框架，尝试将 SER 从 “分类任务” 提升为 “多模态证据驱动的推理任务”。

来自主题: AI技术研报

9126 点击 2026-02-25 14:28

美团又上新模型，8个Thinker齐开工，能顶个诸葛亮？

美团也重磅更新自家模型 ——LongCat-Flash-Thinking-2601。这是一款强大高效的大规模推理模型，拥有 5600 亿个参数，基于创新的 MoE 架构构建。该模型引入了强大的重思考模式（Heavy Thinking Mode），能够同时启动 8 路思考并最终总结出一个更全面、更可靠的结论。目前重思考模式已在 LongCat AI 平台正式上线，人人均可体验。

来自主题: AI资讯

10375 点击 2026-01-16 14:35