AI资讯新闻榜单内容搜索-FP8

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: FP8

智源：FlagOS完成DeepSeekV4八款芯片Day0 适配，实现三重技术突破

智源：FlagOS完成DeepSeekV4八款芯片Day0 适配，实现三重技术突破

智源：FlagOS完成DeepSeekV4八款芯片Day0 适配，实现三重技术突破

由智源研究院牵头研发的众智 FlagOS 第一时间对两个“巨无霸”模型进行全量适配，已经完成 DeepSeek-V4-Flash 在8款以上 AI 芯片上的全量适配与推理部署，包括海光、沐曦、华为昇腾、摩尔线程（FP8）、昆仑芯、平头哥真武、天数、英伟达（FP8）等芯片。FlagOS 同时正在推进 DeepSeek-V4-Pro 模型在多个芯片的迁移适配，晚些时间开源出来，敬请期待。

来自主题: AI资讯

9441 点击 2026-04-24 16:23

“FP8 精度”如何赋能国产AI?

“FP8 精度”如何赋能国产AI?

“FP8 精度”如何赋能国产AI?

当前AI大模型（LLM）训练与推理对算力的巨大需求，以及传统计算精度（如FP16/BF16）面临的功耗、内存带宽和计算效率瓶颈。

来自主题: AI技术研报

7875 点击 2025-09-02 12:47

DeepSeek-V3.1适配下一代国产芯片引爆市场，大模型这次和哪些国产芯一起“自主可控”？

DeepSeek-V3.1适配下一代国产芯片引爆市场，大模型这次和哪些国产芯一起“自主可控”？

DeepSeek-V3.1适配下一代国产芯片引爆市场，大模型这次和哪些国产芯一起“自主可控”？

DeepSeek发布DeepSeek-V3.1，使用的UE8M0 FP8 Scale针对下一代国产芯片设计

来自主题: AI资讯

9441 点击 2025-09-02 12:05

DeepSeek刚提到FP8，英伟达就把FP4精度推向预训练，更快、更便宜

DeepSeek刚提到FP8，英伟达就把FP4精度推向预训练，更快、更便宜

DeepSeek刚提到FP8，英伟达就把FP4精度推向预训练，更快、更便宜

前些天，DeepSeek 在发布 DeepSeek V3.1 的文章评论区中，提及了 UE8M0 FP8 的量化设计，声称是针对即将发布的下一代国产芯片设计。

来自主题: AI资讯

9107 点击 2025-08-28 15:40

DeepSeek一句话让国产芯片集体暴涨！背后的UE8M0 FP8到底是个啥

DeepSeek一句话让国产芯片集体暴涨！背后的UE8M0 FP8到底是个啥

DeepSeek一句话让国产芯片集体暴涨！背后的UE8M0 FP8到底是个啥

DeepSeek V3.1发布后，一则官方留言让整个AI圈都轰动了，新的架构、下一代国产芯片，总共短短不到20个字，却蕴含了巨大信息量。

来自主题: AI资讯

8574 点击 2025-08-22 18:54

Cursor为Blackwell从零构建MXFP8内核，MoE层提速3.5倍，端到端训练提速1.5倍

Cursor为Blackwell从零构建MXFP8内核，MoE层提速3.5倍，端到端训练提速1.5倍

Cursor为Blackwell从零构建MXFP8内核，MoE层提速3.5倍，端到端训练提速1.5倍

在构建更强大的 AI 模型的这场竞赛中，传统路径很简单：升级到最新最强大的硬件。但 Cursor 发现释放下一代 GPU 的真正潜力远非即插即用那么简单。

来自主题: AI资讯

8990 点击 2025-08-22 17:59

DeepSeek V3.1 Base突袭上线！击败Claude 4编程爆表，全网在蹲R2和V4

DeepSeek V3.1 Base突袭上线！击败Claude 4编程爆表，全网在蹲R2和V4

DeepSeek V3.1 Base突袭上线！击败Claude 4编程爆表，全网在蹲R2和V4

DeepSeek V3.1新版正式上线，上下文128k，编程实力碾压Claude 4 Opus，成本低至1美元。在昨晚，DeepSeek官方悄然上线了全新的V3.1版本，上下文长度拓展到128k。本次开源的V3.1模型拥有685B参数，支持多种精度格式，从BF16到FP8。

来自主题: AI资讯

8960 点击 2025-08-20 12:56

凌晨！通义千问更新Qwen3旗舰模型，通用能力与长文本处理显著提升！

凌晨！通义千问更新Qwen3旗舰模型，通用能力与长文本处理显著提升！

凌晨！通义千问更新Qwen3旗舰模型，通用能力与长文本处理显著提升！

昨晚凌晨，通义千问团队宣布，已对其旗舰模型 Qwen3 进行升级，并推出非思考模式（Non-thinking）的更新版本：Qwen3-235B-A22B-Instruct-2507-FP8。此次更新旨在提升模型的综合能力

来自主题: AI资讯

11459 点击 2025-07-22 09:30

Transformer+Mamba黄金组合！长文推理性能飙升3倍，性能还更强

Transformer+Mamba黄金组合！长文推理性能飙升3倍，性能还更强

Transformer+Mamba黄金组合！长文推理性能飙升3倍，性能还更强

Nemotron-H模型混合了Transformer和Mamba架构，使长文本推理速度提升3倍，同时还能保持高性能，开源版本包括8B和56B尺寸。训练过程采用FP8训练和压缩技术，进一步提高了20%推理速度

来自主题: AI产品测评

10420 点击 2025-04-20 20:47

毅伯智算优化满血版一体机TORA3000性能：提升至最高吞吐量7442TPS

毅伯智算优化满血版一体机TORA3000性能：提升至最高吞吐量7442TPS

毅伯智算优化满血版一体机TORA3000性能：提升至最高吞吐量7442TPS

毅伯智算TORA3000性能超H20 1.8倍，FP8优化降本增效。

来自主题: AI资讯

9228 点击 2025-03-24 14:37

上一页当前第1页,共2页下一页