AI资讯新闻榜单内容搜索-H800

DeepSeek研究员1200行代码复刻vLLM，H800硬件实测性能反超原版

仅用不到1200行代码，实现最小化且完全可读的vLLM！DeepSeek研究员俞星凯搞了个开源项目引得大伙拍手叫绝。项目名为Nano-vLLM（纳米级-vLLM），有三大特点：快速离线推理：推理速度可与vLLM相媲美

来自主题: AI技术研报

8257 点击 2025-06-13 15:41

秘塔AI推出“极速”模型，400 tokens/s，你搜索，我秒回

是的，秘塔AI搜索推出了全新“极速”模型。通过在GPU上进行kernel fusion，以及在CPU上进行动态编译优化，我们在单张H800 GPU上实现了最高400 tokens/秒的响应速度，大部分问题2秒内就能答完。

来自主题: AI资讯

10581 点击 2025-05-27 09:45

360智脑开源Light-R1！1000美元数学上首次从零超越DeepSeek-R1-Distill

2025 年 3 月 4 日，360 智脑开源了 Light-R1-32B 模型，以及全部训练数据、代码。仅需 12 台 H800 上 6 小时即可训练完成，从没有长思维链的 Qwen2.5-32B-Instruct 出发，仅使用 7 万条数学数据训练，得到 Light-R1-32B

来自主题: AI技术研报

5892 点击 2025-03-06 11:13

DeepSeek开源放大招：FlashMLA让H800算力狂飙！曝光低成本秘笈

DeepSeek开源周第一天就放大招！FlashMLA强势登场，这是专为英伟达Hopper GPU打造MLA解码内核。注意，DeepSeek训练成本极低的两大关键，一个是MoE，另一个就是MLA。

来自主题: AI资讯

9797 点击 2025-02-24 10:57

成就DeepSeek奇迹的芯片，敲响英伟达警钟

过去两周，DeepSeek已经成为了全球的热点。尤其是在西方世界，这个来自于中国的生成式人工智能系统引发了广泛讨论。

来自主题: AI资讯

6690 点击 2025-02-05 11:54

清华翟季冬：DeepSeek 百倍算力效能背后的系统革命 | 智者访谈

2025 年伊始，全球 AI 业界被 DeepSeek 刷屏。当 OpenAI 宣布 5000 亿美元的「星际之门」计划，Meta 在建规模超 130 万 GPU 的数据中心时，这个来自中国的团队打破了大模型军备竞赛的既定逻辑：用 2048 张 H800 GPU，两个月训练出了一个媲美全球顶尖水平的模型。

来自主题: AI资讯

6745 点击 2025-01-30 14:58