刚刚,DeepSeek开源FlashMLA,推理加速核心技术,Star量飞涨中
刚刚,DeepSeek开源FlashMLA,推理加速核心技术,Star量飞涨中上周五,DeepSeek 发推说本周将是开源周(OpenSourceWeek),并将连续开源五个软件库。第一个项目,果然与推理加速有关。北京时间周一上午 9 点,刚一上班(同时是硅谷即将下班的时候),DeepSeek 兑现了自己的诺言,开源了一款用于 Hopper GPU 的高效型 MLA 解码核:FlashMLA。
上周五,DeepSeek 发推说本周将是开源周(OpenSourceWeek),并将连续开源五个软件库。第一个项目,果然与推理加速有关。北京时间周一上午 9 点,刚一上班(同时是硅谷即将下班的时候),DeepSeek 兑现了自己的诺言,开源了一款用于 Hopper GPU 的高效型 MLA 解码核:FlashMLA。
多位接近字节的人士对硅星人透露,字节的AI核心部门Seed正在快速调整定位和调兵遣将。刚刚从谷歌加入字节跳动的AI大牛、参与了Gemini开发的Google Fellow吴永辉博士,将成为Seed新的负责人,替换原LLM团队及Seed总负责人朱文佳,团队内部正在梳理调整汇报关系。
有人预料到DeepSeek能引爆全球吗?至少,DeepSeek-V3发布前,在大模型战场前线“卖铲子”的袁进辉心里也是打鼓的。
人工智能众包工作初创公司Invisible Technologies取得了巨大成功。而今,其创始人正拿它当作抵押进行借款,好买断其风投支持者的股份。
四万字深聊DeepSeek!2025年1月底在媒体聚集的达沃斯论坛上,微软CEO Satya Nadella以及Scale AI创始人Alexandr Wang的发言直接将DeepSeek推到风口浪尖...
DeepSeek 在海内外搅起的惊涛巨浪,余波仍在汹涌。当中国大模型撕开硅谷的防线之后,在预设中总是落后半拍的中国 AI 军团,这次竟完成了一次反向技术输出,引发了全球范围内复现 DeepSeek 的热潮。
前两天我也连更两篇,写了怎么用硅基流动的API、秘塔联网搜索调用R1。虽然这俩体验起来都很不错,可很多人还是觉得DeepSeek官方版的最好,就想用官方的,确实这也没毛病。但是DeepSeek官方那边,这两天当然还是很卡。
当我们惊叹于Deepseek的妙语连珠时,是否正目睹硅基系统对人类语言本源的复刻?那在服务器集群中奔流的矩阵运算,与人脑皮层间跳跃的神经电波,究竟共享着怎样的“语言密码”?
我前几天也一直在写DeepSeek的使用教程,想选出尽量最简单最好上手的方式让大家都能舒服的体验这波热潮。但是我发现,自第一天干崩硅基流动、第二天干崩秘塔AI搜索后,涌现出来的三方平台越来越多了,写不完,根本写不完。
一位哥大辍学生,正在颠覆6000亿美元广告行业!只用几分钟,一句提示,爆款AI就能生成、复刻大牌广告,还获得了OpenAI、Pika等硅谷大佬的鼎力支持。