AI资讯新闻榜单内容搜索-DeepSeek开源

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: DeepSeek开源
DeepSeek第五弹炸裂收官!开源全新并行文件系统,榨干SSD全部带宽

DeepSeek第五弹炸裂收官!开源全新并行文件系统,榨干SSD全部带宽

DeepSeek第五弹炸裂收官!开源全新并行文件系统,榨干SSD全部带宽

DeepSeek开源周,今日正式收官!内容依旧惊喜且重磅,直接公开了V3和R1训练推理过程中用到的文件系统。Fire-Flyer文件系统(简称3FS,第三个F代表File),一种利用现代SSD和RDMA网络的全部带宽的并行文件系统;

来自主题: AI资讯
9070 点击    2025-02-28 10:59
一文详解:DeepSeek 第四天开源的模型设计套件

一文详解:DeepSeek 第四天开源的模型设计套件

一文详解:DeepSeek 第四天开源的模型设计套件

第四天,DeepSee发布包括三个主要项目: DualPipe- 一种用于 V3/R1 训练的双向流水线并行算法,实现计算和通信完全重叠; EPLB(Expert Parallelism Load Balancer) - 专为 V3/R1 设计的专家并行负载均衡器; Profile-data- 分析 V3/R1 中计算与通信重叠的性能数据集。

来自主题: AI技术研报
9952 点击    2025-02-27 12:16
DeepSeek今日连开3源!针对优化的并行策略,梁文峰本人参与开发

DeepSeek今日连开3源!针对优化的并行策略,梁文峰本人参与开发

DeepSeek今日连开3源!针对优化的并行策略,梁文峰本人参与开发

按时整活!DeepSeek开源周第四天,直接痛快「1日3连发」,且全都围绕一个主题:优化并行策略。

来自主题: AI技术研报
9077 点击    2025-02-27 11:28
DeepSeek开源通用矩阵乘法库,300行代码加速V3、R1,R2被曝五月前问世

DeepSeek开源通用矩阵乘法库,300行代码加速V3、R1,R2被曝五月前问世

DeepSeek开源通用矩阵乘法库,300行代码加速V3、R1,R2被曝五月前问世

DeepSeek 的开源周已经进行到了第三天(前两天报道见文末「相关阅读」)。今天开源的项目名叫 DeepGEMM,是一款支持密集型和专家混合(MoE)GEMM 的 FP8 GEMM 库,为 V3/R1 的训练和推理提供了支持,在 Hopper GPU 上可以达到 1350+ FP8 TFLOPS 的计算性能。

来自主题: AI资讯
8545 点击    2025-02-26 10:58
一文详解DeepSeek开源的FlashMLA,他们才是真正的“源神”

一文详解DeepSeek开源的FlashMLA,他们才是真正的“源神”

一文详解DeepSeek开源的FlashMLA,他们才是真正的“源神”

刚刚,万众瞩目的DeepSeek,开源了他们第一天的项目。FlashMLA是一款面向Hopper GPU的高效MLA解码内核,并针对可变长度序列的服务场景进行了优化。

来自主题: AI资讯
9280 点击    2025-02-24 11:28
DeepSeek开源放大招:FlashMLA让H800算力狂飙!曝光低成本秘笈

DeepSeek开源放大招:FlashMLA让H800算力狂飙!曝光低成本秘笈

DeepSeek开源放大招:FlashMLA让H800算力狂飙!曝光低成本秘笈

DeepSeek开源周第一天就放大招!FlashMLA强势登场,这是专为英伟达Hopper GPU打造MLA解码内核。注意,DeepSeek训练成本极低的两大关键,一个是MoE,另一个就是MLA。

来自主题: AI资讯
10162 点击    2025-02-24 10:57
刚刚,DeepSeek开源FlashMLA,推理加速核心技术,Star量飞涨中

刚刚,DeepSeek开源FlashMLA,推理加速核心技术,Star量飞涨中

刚刚,DeepSeek开源FlashMLA,推理加速核心技术,Star量飞涨中

上周五,DeepSeek 发推说本周将是开源周(OpenSourceWeek),并将连续开源五个软件库。第一个项目,果然与推理加速有关。北京时间周一上午 9 点,刚一上班(同时是硅谷即将下班的时候),DeepSeek 兑现了自己的诺言,开源了一款用于 Hopper GPU 的高效型 MLA 解码核:FlashMLA。

来自主题: AI资讯
9384 点击    2025-02-24 10:26