AI资讯新闻榜单内容搜索-显卡

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 显卡
有钱买卡还不够,10万卡H100集群有多难搭?一文解析算力集群技术要点

有钱买卡还不够,10万卡H100集群有多难搭?一文解析算力集群技术要点

有钱买卡还不够,10万卡H100集群有多难搭?一文解析算力集群技术要点

在英伟达市值猛涨、各家科技巨头囤芯片的热潮中,我们往往会忽视GPU芯片是如何转变为数据中心算力的。最近,一篇SemiAnalysis的技术文章就深入解读了10万卡H100集群的构建过程。

来自主题: AI资讯
6712 点击    2024-06-23 19:25
2.5%KV缓存保持大模型90%性能,大模型金字塔式信息汇聚模式探秘|开源

2.5%KV缓存保持大模型90%性能,大模型金字塔式信息汇聚模式探秘|开源

2.5%KV缓存保持大模型90%性能,大模型金字塔式信息汇聚模式探秘|开源

用KV缓存加速大模型的显存瓶颈,终于迎来突破。 北大、威斯康辛-麦迪逊、微软等联合团队提出了全新的缓存分配方案,只用2.5%的KV cache,就能保持大模型90%的性能。 这下再也不用担心KV占用的显存容量过高,导致显卡不够用了。

来自主题: AI技术研报
5794 点击    2024-06-13 21:21
英伟达开卷价格!最新Blackwell GPU架构/成本揭秘,彰显老黄的「仁慈」

英伟达开卷价格!最新Blackwell GPU架构/成本揭秘,彰显老黄的「仁慈」

英伟达开卷价格!最新Blackwell GPU架构/成本揭秘,彰显老黄的「仁慈」

【新智元导读】老黄新GPU深夜炸场,超高规格的背后也付出了不小的代价,小编带大家深入了解一下新架构的硬件细节和成本,新显卡的售价究竟高不高?英伟达也不得不开始卷了

来自主题: AI技术研报
6641 点击    2024-04-02 15:54
老黄再曝惊人语录:LLM幻觉有解,AGI五年内必来!

老黄再曝惊人语录:LLM幻觉有解,AGI五年内必来!

老黄再曝惊人语录:LLM幻觉有解,AGI五年内必来!

AGI竞赛,正在大科技公司之间紧锣密鼓地展开,作为万亿显卡帝国掌舵人的老黄自然也不会缺席。在最近举办的GTC 2024上,老黄发表了自己对于AGI以及幻觉问题的看法。

来自主题: AI资讯
6676 点击    2024-03-21 10:12
Meta公布Llama 3训练集群细节!储备60万块H100迎接AGI

Meta公布Llama 3训练集群细节!储备60万块H100迎接AGI

Meta公布Llama 3训练集群细节!储备60万块H100迎接AGI

LLM开源从Infra做起!Meta公布了自己训练Llama 3的H100集群细节,看来Llama 3快来了。

来自主题: AI技术研报
3470 点击    2024-03-15 12:25
英伟达发了个有点弱的端侧模型,却想喊话大家举手投降

英伟达发了个有点弱的端侧模型,却想喊话大家举手投降

英伟达发了个有点弱的端侧模型,却想喊话大家举手投降

英伟达在2024年2月14号的时候推出了这么一个产品,叫做Chat with RTX。顾名思义,就是和英伟达的显卡聊天。简单来说Chat with RTX是一个本地部署的大语言模型工具,可以实现和大语言模型对话,还支持处理多种文件类型,用户可以与其进行文本、PDF、Word文档等多种格式内容的交互。

来自主题: AI资讯
7157 点击    2024-02-27 14:14