AI资讯新闻榜单内容搜索-deepseek

直逼DeepSeek-R1-32B，碾压李飞飞s1！UC伯克利等开源全新SOTA推理模型

近日，斯坦福、UC伯克利等多机构联手发布了开源推理新SOTA——OpenThinker-32B，性能直逼DeepSeek-R1-32B。其成功秘诀在于数据规模化、严格验证和模型扩展。

来自主题: AI技术研报

6147 点击 2025-02-14 11:09

大模型不再是“力大飞砖”。

来自主题: AI资讯

9294 点击 2025-02-14 10:59

破除“AI迷信”

来自主题: AI资讯

7273 点击 2025-02-14 10:39

一个简单的笑脸😀可能远不止这么简单？最近，AI大神Karpathy发现，一个😀竟然占用了多达53个token！这背后隐藏着Unicode编码的哪些秘密？如何利用这些「隐形字符」在文本中嵌入、传递甚至「隐藏」任意数据。更有趣的是，这种「数据隐藏术」甚至能对AI模型进行「提示注入」！

来自主题: AI技术研报

6087 点击 2025-02-14 10:21

最近，DeepSeek 很热，是个好 AI，但不是每个人都能用上。

来自主题: AI资讯

8083 点击 2025-02-14 10:11

奥特曼回应一切，OpenAI路线图全曝光。GPT-4.5数周发布，成为GPT系最后一个非推理模型。GPT-5将整合o系和GPT系，打造成一个全能系统。最令人兴奋的是，所有人皆可免费用上GPT-5。

来自主题: AI技术研报

7551 点击 2025-02-13 16:19

为AI大模型“氪金”的年轻人，从来没有忠诚度。

来自主题: AI资讯

7295 点击 2025-02-13 15:32

这项尝试只用到了 R1 模型和基本验证器，没有针对 R1 的工具，没有对专有的英伟达代码进行微调。其实根据 DeepSeek 介绍，R1 的编码能力不算顶尖。

来自主题: AI技术研报

7041 点击 2025-02-13 15:18

只要99美元，DeepSeek教程带回家。

来自主题: AI资讯

6738 点击 2025-02-13 14:32

【新智元导读】仅凭测试时Scaling，1B模型竟完胜405B！多机构联手巧妙应用计算最优TTS策略，不仅0.5B模型在数学任务上碾压GPT-4o，7B模型更是力压o1、DeepSeek R1这样的顶尖选手。

来自主题: AI技术研报

6935 点击 2025-02-13 14:18