AI资讯新闻榜单内容搜索-推理模型

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 推理模型

DeepSeek V3“小版本升级”实测堪比V3.5，非推理模型也有“啊哈时刻”，7米甘蔗过2米门想通了

DeepSeek V3“小版本升级”实测堪比V3.5，非推理模型也有“啊哈时刻”，7米甘蔗过2米门想通了

DeepSeek V3“小版本升级”实测堪比V3.5，非推理模型也有“啊哈时刻”，7米甘蔗过2米门想通了

DeepSeek V3升级了，新版本V3-0324。

来自主题: AI资讯

4406 点击 2025-03-25 10:41

谷歌大型推理模型曝光！击败Claude-3.7-Thinking

谷歌大型推理模型曝光！击败Claude-3.7-Thinking

谷歌大型推理模型曝光！击败Claude-3.7-Thinking

哎！最近推特上的网友在LMSYS Arena 发现了个泄漏的大模型 Nebula，效果据说特别好，打败了o1、o3mini、Claude3.7 Thinking等等模型：网友们通过询问和分析 API，发现这似乎是谷歌正在秘密演练的新推理模型！推测可能是 Google Gemini 2.0 Pro Thinking：

来自主题: AI资讯

8478 点击 2025-03-24 14:41

给R1开八倍速，实测腾讯正式上线的T1推理模型，留给GPT5和o3的时间不多了

给R1开八倍速，实测腾讯正式上线的T1推理模型，留给GPT5和o3的时间不多了

给R1开八倍速，实测腾讯正式上线的T1推理模型，留给GPT5和o3的时间不多了

我发现对于 o1、R1 等推理模型们大家是又爱又恨，

来自主题: AI资讯

10146 点击 2025-03-24 10:20

腾讯押注非Transformer！推理模型混合Mamba也能搞，深度思考也能秒回

腾讯押注非Transformer！推理模型混合Mamba也能搞，深度思考也能秒回

腾讯押注非Transformer！推理模型混合Mamba也能搞，深度思考也能秒回

首个基于混合Mamba架构的超大型推理模型来了！就在刚刚，腾讯宣布推出自研深度思考模型混元T1正式版，并同步在腾讯云官网上线。对标o1、DeepSeek R1之外，值得关注的是，混元T1正式版采用的是Hybrid-Mamba-Transformer融合模式——

来自主题: AI资讯

10644 点击 2025-03-22 11:12

全球首个工业界多模态推理模型开源！38B硬刚DeepSeek-R1，训练秘籍全公开

全球首个工业界多模态推理模型开源！38B硬刚DeepSeek-R1，训练秘籍全公开

全球首个工业界多模态推理模型开源！38B硬刚DeepSeek-R1，训练秘籍全公开

全球首个开源多模态推理大模型来了！38B参数模型性能直逼DeepSeek-R1，同尺寸上横扫多项SOTA。而这家中国公司之所以选择无偿将技术思路开源，正是希望同DeepSeek一样，打造开源界的技术影响力。

来自主题: AI技术研报

10860 点击 2025-03-18 19:19

单个4090就能跑，Mistral开源多模态小模型，开发者：用来构建推理模型足够香

单个4090就能跑，Mistral开源多模态小模型，开发者：用来构建推理模型足够香

单个4090就能跑，Mistral开源多模态小模型，开发者：用来构建推理模型足够香

多模态，性能超 GPT-4o Mini、Gemma 3，还能在单个 RTX 4090 上运行，这个小模型值得一试。

来自主题: AI资讯

5913 点击 2025-03-18 19:11

AI进入推理模型时代，一文带你读懂思维链

AI进入推理模型时代，一文带你读懂思维链

AI进入推理模型时代，一文带你读懂思维链

近段时间，推理模型 DeepSeek R1 可说是 AI 领域的头号话题。用过的都知道，该模型在输出最终回答之前，会先输出一段思维链内容。这样做可以提升最终答案的准确性。

来自主题: AI技术研报

9123 点击 2025-03-16 14:53

AI大佬曼宁转赞，MetaGPT团队首提「Atom of Thoughts」，原子化思考让4o-mini暴打推理模型？

AI大佬曼宁转赞，MetaGPT团队首提「Atom of Thoughts」，原子化思考让4o-mini暴打推理模型？

AI大佬曼宁转赞，MetaGPT团队首提「Atom of Thoughts」，原子化思考让4o-mini暴打推理模型？

大语言模型（LLM）近年来凭借训练时扩展（train-time scaling）取得了显著性能提升。然而，随着模型规模和数据量的瓶颈显现，测试时扩展（test-time scaling）成为进一步释放潜力的新方向。

来自主题: AI技术研报

8254 点击 2025-03-16 12:42

“谷歌版DeepSeek”接入机器人，思维链解锁折纸系鞋带技能，推理模型代入物理世界

“谷歌版DeepSeek”接入机器人，思维链解锁折纸系鞋带技能，推理模型代入物理世界

“谷歌版DeepSeek”接入机器人，思维链解锁折纸系鞋带技能，推理模型代入物理世界

谷歌把推理大模型带入物理世界，机器人可以一边思考一边动作了!

来自主题: AI资讯

5870 点击 2025-03-13 15:30

自动调整推理链长度，SCoT来了！为激发推理能力研究还提出了一个新架构

自动调整推理链长度，SCoT来了！为激发推理能力研究还提出了一个新架构

自动调整推理链长度，SCoT来了！为激发推理能力研究还提出了一个新架构

不怕推理模型简单问题过度思考了，能动态调整CoT的新推理范式SCoT来了！

来自主题: AI技术研报

7833 点击 2025-03-13 14:58

上一页当前第12页,共20页下一页