AI资讯新闻榜单内容搜索-R1

新版DeepSeek R1你得这样用，太爽啦~

哈喽，大家好，我是袋鼠帝昨天下午下班后，DeepSeek R1更新了然而他们就只是悄悄在微信群里面发布了这个消息。

来自主题: AI资讯

9488 点击 2025-05-29 11:50

刚刚，新版DeepSeek-R1正式开源！直逼o3编程强到离谱，一手实测来了

新版DeepSeek-R1重磅开源，凌晨已放出权重！此次模型性能几乎与o4-mini（Medium）相当，编程实测超越Claude 4 Sonnet。网友纷纷惊叹：开源又一次胜利了。

来自主题: AI资讯

8235 点击 2025-05-29 11:44

大风起兮云飞扬：Agent, o3幻觉, 刷榜, 大厂布局深意… | 南乔的月度观察

近半年来，OpenAI 形象开始变得灰暗：团队骨干相继离职引发猜疑、组织转型遭受口诛笔伐、GPT-4.5/Sora 等模型表现不及预期，还有被 DeepSeek R1 打破的叙事神话……

来自主题: AI资讯

12075 点击 2025-05-29 10:56

DeepSeek-R1 发布，性能对标 OpenAI o1 正式版，实测编程性能直逼claude 4

今天，我们正式发布 DeepSeek-R1，并同步开源模型权重。DeepSeek-R1 遵循 MIT License，允许用户通过蒸馏技术借助 R1 训练其他模型。DeepSeek-R1 上线API，对用户开放思维链输出，通过设置 `model='deepseek-reasoner'` 即可调用。

来自主题: AI资讯

10364 点击 2025-05-28 21:49

5%参数比肩DeepSeek满血R1！北大“小”模型靠分合蒸馏，打破推理成本下限

只用5%的参数，数学和代码能力竟然超越满血DeepSeek？

来自主题: AI资讯

9846 点击 2025-05-27 12:45

CoT推理大溃败？哈佛华人揭秘：LLM一思考，立刻就「失智」

DeepSeek-R1火了，推理模型火了，思维链（Chain-of-Thought，CoT）火了！

来自主题: AI技术研报

9387 点击 2025-05-21 15:28

DeepSeek们越来越聪明，却也越来越不听话了。

在今年，DeepSeek R1火了之后。

来自主题: AI资讯

7092 点击 2025-05-20 10:44

可靠的Agent该用哪个模型，LLM多轮对话中的「迷失」现象 |微软最新

微软最近与Salesforce Research联合发布了一篇名为《Lost in Conversation》的研究，说当前最先进的LLM在多轮对话中表现会大幅下降，平均降幅高达39%。这一现象被称为对话中的"迷失"。文章分析了各大模型（包括Claude 3.7-Sonnet、Deepseek-R1等）在多轮对话中的表现差异，还解析了模型"迷失"的根本原因及有效缓解策略。

来自主题: AI技术研报

9507 点击 2025-05-20 10:16

英伟达新“桌面超算”800GB大内存，满血DeepSeek R1能装1个半

英伟达官宣新办公室落户中国台湾省台北市，但居然是从太空飞下来的吗？

来自主题: AI资讯

8533 点击 2025-05-19 17:31

「边思考、边搜索、边写作」WebThinker开启AI搜索&研究新纪元！

大型推理模型（如 OpenAI-o1、DeepSeek-R1）展现了强大的推理能力，但其静态知识限制了在复杂知识密集型任务及全面报告生成中的表现。为应对此挑战，深度研究智能体 WebThinker 赋予 LRM 在推理中自主搜索网络、导航网页及撰写报告的能力。

来自主题: AI技术研报

8667 点击 2025-05-16 11:04