AI资讯新闻榜单内容搜索-deepseek

快手Klear-Reasoner登顶8B模型榜首，GPPO算法双效强化稳定性与探索能力！

在大语言模型的竞争中，数学与代码推理能力已经成为最硬核的“分水岭”。从 OpenAI 最早将 RLHF 引入大模型训练，到 DeepSeek 提出 GRPO 算法，我们见证了强化学习在推理模型领域的巨大潜力。

来自主题: AI技术研报

8305 点击 2025-08-22 17:23

软件+硬件的全链路国产 AI 体系来了？这几天，不论国内国外，人们都在关注 DeepSeek 发布的 V3.1 新模型。

来自主题: AI资讯

8236 点击 2025-08-22 15:55

DeepSeek-V3.1官宣了，作为首款「混合推理」模型，将开启智能体新时代。新模型共有671B参数，编码实力碾压DeepSeek-R1、Claude 4 Opus，登顶编程开源第一。

来自主题: AI资讯

9523 点击 2025-08-22 11:52

大模型“世子之争”，果然暗潮汹涌（doge）。这不“手机内存不够”怎么办，如果你问问DeepSeek老师：你和豆包删一个你删谁？

来自主题: AI资讯

7390 点击 2025-08-21 16:48

自从 GPT-5 发布后，DeepSeek 创始人梁文锋就成了 AI 圈最「忙」的人。

来自主题: AI产品测评

10841 点击 2025-08-21 11:38

DeepSeek V3.1和V3相比，到底有什么不同？官方说的模模糊糊，就提到了上下文长度拓展至128K和支持多种张量格式，但别急，我们已经上手实测，为你奉上更多新鲜信息。

来自主题: AI产品测评

11440 点击 2025-08-21 10:49

昨晚睡不着，我把四份最新AI纪要摊床上，越看越像四盘菜：Kimi那盘是精算师凉面，DeepSeek端上战略家佛跳墙，ChatGPT递来脱口秀炸酱面，Gemini则摆好外交官寿司。

来自主题: AI资讯

9101 点击 2025-08-21 10:09

DeepSeek V3.1新版正式上线，上下文128k，编程实力碾压Claude 4 Opus，成本低至1美元。在昨晚，DeepSeek官方悄然上线了全新的V3.1版本，上下文长度拓展到128k。本次开源的V3.1模型拥有685B参数，支持多种精度格式，从BF16到FP8。

来自主题: AI资讯

8576 点击 2025-08-20 12:56

没等到Deepseek R2，DeepSeek悄悄更新了V 3.1。官方群放出的消息就提了一点，上下文长度拓展至128K。128K也是GPT-4o这一代模型的处理Token的长度。因此一开始，鲸哥以为从V3升级到V 3.1，以为是不大的升级，鲸哥体验下来还有惊喜。

来自主题: AI资讯

10129 点击 2025-08-20 03:37

AI能像科幻电影中的先知一样预测未来吗？一个名为「Prophet Arena」的全新基准测试，正通过预测真实世界事件来评估AI的「预言」能力。

来自主题: AI资讯

8659 点击 2025-08-18 19:05