AI资讯新闻榜单内容搜索-训练集群

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 训练集群
华为版《黑客帝国》首次亮相:训推复杂AI前先“彩排”,小时级预演万卡集群

华为版《黑客帝国》首次亮相:训推复杂AI前先“彩排”,小时级预演万卡集群

华为版《黑客帝国》首次亮相:训推复杂AI前先“彩排”,小时级预演万卡集群

就在刚刚,华为首次亮相了一套“虚”的技术—— 数字化风洞,一个在正式训推复杂AI模型之前,可以在电脑中“彩排”的虚拟环境平台

来自主题: AI资讯
7085 点击    2025-06-11 14:41
惊掉下巴!被字节起诉800万实习生,拿下NeurIPS 2024最佳论文

惊掉下巴!被字节起诉800万实习生,拿下NeurIPS 2024最佳论文

惊掉下巴!被字节起诉800万实习生,拿下NeurIPS 2024最佳论文

太戏剧了!攻击字节训练集群的实习生,居然刚刚获得了NeurIPS 2024最佳论文奖?虽然看起来像爽文剧情,但这位高材生接下来的路,应该是难走了。

来自主题: AI资讯
7292 点击    2024-12-04 10:27
万卡集群的AI数据中心,到底是如何运作的?

万卡集群的AI数据中心,到底是如何运作的?

万卡集群的AI数据中心,到底是如何运作的?

2024年7月22日凌晨,xAI创始人Elon Musk在推特上正式宣布,在凌晨4:20分正式启动了世界上最强的AI训练集群。 这个训练集群建设在美国田纳西州孟菲斯市,集合了10 万个液冷H100芯片。

来自主题: AI资讯
2794 点击    2024-11-08 09:56
2030年,Scaling Law会到达极限吗?GPT-6能出来吗?

2030年,Scaling Law会到达极限吗?GPT-6能出来吗?

2030年,Scaling Law会到达极限吗?GPT-6能出来吗?

9 月 2 日,马斯克发文称,其人工智能公司 xAI 的团队上线了一台被称为「Colossus」的训练集群,总共有 100000 个英伟达的 H100 GPU。

来自主题: AI资讯
4090 点击    2024-09-08 10:50
马斯克的超级AI巨兽Colossus震撼登场

马斯克的超级AI巨兽Colossus震撼登场

马斯克的超级AI巨兽Colossus震撼登场

马斯克又搞出了一个超级厉害的东西——人工智能训练集群Colossus!

来自主题: AI资讯
9624 点击    2024-09-05 16:07
Llama3训练每3小时崩一次?豆包大模型、港大团队为脆皮万卡训练提效

Llama3训练每3小时崩一次?豆包大模型、港大团队为脆皮万卡训练提效

Llama3训练每3小时崩一次?豆包大模型、港大团队为脆皮万卡训练提效

伴随大模型迭代速度越来越快,训练集群规模越来越大,高频率的软硬件故障已经成为阻碍训练效率进一步提高的痛点,检查点(Checkpoint)系统在训练过程中负责状态的存储和恢复,已经成为克服训练故障、保障训练进度和提高训练效率的关键。

来自主题: AI资讯
5357 点击    2024-08-08 18:53
1.6万块H100训Llama 3.1,每3小时故障1次!罪魁祸首竟是GPU和HBM3显存

1.6万块H100训Llama 3.1,每3小时故障1次!罪魁祸首竟是GPU和HBM3显存

1.6万块H100训Llama 3.1,每3小时故障1次!罪魁祸首竟是GPU和HBM3显存

在Meta的Llama 3.1训练过程中,其运行的1.6万个GPU训练集群每3小时就会出现一次故障,意外故障中的半数都是由英伟达H100 GPU和HBM3内存故障造成的。

来自主题: AI技术研报
9623 点击    2024-07-29 20:16
OpenAI把微软电网搞崩!GPT-6被曝25年发布,训练刷爆10万张H100

OpenAI把微软电网搞崩!GPT-6被曝25年发布,训练刷爆10万张H100

OpenAI把微软电网搞崩!GPT-6被曝25年发布,训练刷爆10万张H100

【新智元导读】GPT-5还未发布,GPT-6已经在路上了?微软工程师曝出,为GPT-6搭建10万个H100训练集群,整个电网却被搞崩。通往AGI大关,还需要破解电力难题。

来自主题: AI技术研报
5539 点击    2024-03-27 15:57
Meta公布Llama 3训练集群细节!储备60万块H100迎接AGI

Meta公布Llama 3训练集群细节!储备60万块H100迎接AGI

Meta公布Llama 3训练集群细节!储备60万块H100迎接AGI

LLM开源从Infra做起!Meta公布了自己训练Llama 3的H100集群细节,看来Llama 3快来了。

来自主题: AI技术研报
3337 点击    2024-03-15 12:25