比英伟达工程师还熟练!DeepSeek R1+测试时Scaling自动优化GPU内核
比英伟达工程师还熟练!DeepSeek R1+测试时Scaling自动优化GPU内核英伟达巧妙地将DeepSeek-R1与推理时扩展相结合,构建了全新工作流程,自动优化生成GPU内核,取得了令人瞩目的成果。
英伟达巧妙地将DeepSeek-R1与推理时扩展相结合,构建了全新工作流程,自动优化生成GPU内核,取得了令人瞩目的成果。
自一月以来, DeepSeek 在 AI 领域引发了极大的热度,也出现了大量分析文章。其中来自 Leonis Capital 于 2.6 发表于 Substack 上的文章:「DeepSeek: A Technical and Strategic Analysis for VCs and Startups」
蒸馏模型的性能可以量化估算了。
三星发布Galaxy S25系列,强调AI功能和数据安全。
不知道是不是因为今年是禧年(天主教圣年,会有重大宗教活动)的缘故,不少宗教类 App 近期频频出现在笔者视野中,既有白鲸出海之前关注过的 Hallow,也有不少新面孔。
史上最大规模视觉语言数据集:1000亿图像-文本对!
脑机接口技术炙手可热,马斯克的Neuralink更是吸引了全球目光。然而其侵入式方案的风险不容忽视。Meta AI则另辟蹊径,近日推出了非侵入式的Brain2Qwerty深度学习模型,它能通过分析脑电图或脑磁图「读」出人们在键盘上输入的文字。
距离被替代还有一段距离。
【新智元导读】仅凭测试时Scaling,1B模型竟完胜405B!多机构联手巧妙应用计算最优TTS策略,不仅0.5B模型在数学任务上碾压GPT-4o,7B模型更是力压o1、DeepSeek R1这样的顶尖选手。
席卷全球的 DeepSeek 依然是科技圈最大的话题,连 San Altman 都承认每天醒来都会担忧。因此本周在巴黎举办的 AI 行动峰会聚光灯稍显黯淡,但这里依然汇聚了全球大量重要的头脑。