AI资讯新闻榜单内容搜索-B200

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: B200
妈妈再也不用担心延迟了!斯坦福手搓Llama超级内核,推理仅需0.00068秒

妈妈再也不用担心延迟了!斯坦福手搓Llama超级内核,推理仅需0.00068秒

妈妈再也不用担心延迟了!斯坦福手搓Llama超级内核,推理仅需0.00068秒

斯坦福Hazy实验室推出新一代低延迟推理引擎「Megakernel」,将Llama-1B模型前向传播完整融合进单一GPU内核,实现推理时间低于1毫秒。在B200上每次推理仅需680微秒,比vLLM快3.5倍。

来自主题: AI技术研报
7822 点击    2025-05-30 12:36
英伟达AI工厂:人类历史酝酿12000年的绝对必然

英伟达AI工厂:人类历史酝酿12000年的绝对必然

英伟达AI工厂:人类历史酝酿12000年的绝对必然

人类进化12000年,只为等AI觉醒?黄仁勋宣布「AI工厂时代」正式到来!从农业到工业再到AI革命,英伟达如何用算力推动历史巨轮?未来,每家公司都将有一个专属的超级智能工厂。并全览目前最先进的GB200 NVL72的详细参数。

来自主题: AI资讯
7779 点击    2025-04-13 10:20
谷歌最强AI芯片狙击英伟达B200,性能狂飙3600倍!谷歌版MCP一统AI智能体宇宙

谷歌最强AI芯片狙击英伟达B200,性能狂飙3600倍!谷歌版MCP一统AI智能体宇宙

谷歌最强AI芯片狙击英伟达B200,性能狂飙3600倍!谷歌版MCP一统AI智能体宇宙

谷歌重磅发布第七代TPU Ironwood,专为推理设计,性能较从初代飙升3600倍,可与英伟达B200一较高下。不仅如此,谷歌还带来了Veo 2等多款模型全新升级,就连「谷歌版」MCP协议也公布了。

来自主题: AI资讯
8885 点击    2025-04-10 10:21
英伟达下场,首次优化DeepSeek-R1!B200性能狂飙25倍,碾压H100

英伟达下场,首次优化DeepSeek-R1!B200性能狂飙25倍,碾压H100

英伟达下场,首次优化DeepSeek-R1!B200性能狂飙25倍,碾压H100

最近,英伟达开源了首个在Blackwell架构上优化的DeepSeek-R1,实现了推理速度提升25倍,和每token成本降低20倍的惊人成果。同时,DeepSeek连续开源多个英伟达GPU优化项目,共同探索模型性能极限。

来自主题: AI技术研报
9287 点击    2025-02-27 16:33
英伟达年终核弹!全新B300为o1推理大模型打造,RTX5090也曝光了

英伟达年终核弹!全新B300为o1推理大模型打造,RTX5090也曝光了

英伟达年终核弹!全新B300为o1推理大模型打造,RTX5090也曝光了

GPU新核弹B300,以及附带CPU的超级芯片GB300。 高算力,在产品层面上相比B200在FLOPS上提高50% 大显存,从192GB提升到288GB,也是提高了50%。

来自主题: AI资讯
6794 点击    2024-12-26 16:00
全球最强GPU订单曝光,TOP 1微软一年买爆近50万块!xAI晒首批GB200提前过年

全球最强GPU订单曝光,TOP 1微软一年买爆近50万块!xAI晒首批GB200提前过年

全球最强GPU订单曝光,TOP 1微软一年买爆近50万块!xAI晒首批GB200提前过年

2024年英伟达GPU全球最大买家,竟是微软?购买总量将近50万块,超所有竞争对手近两倍。xAI已开心晒出首批发货的GB200 NVL72,喜滋滋的像是提前过年了。囤的GPU越多,模型就会越好吗?来不及解释了,赶紧上车,车门焊死!

来自主题: AI资讯
7255 点击    2024-12-19 14:08