AI资讯新闻榜单内容搜索-训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 训练
Meta宣布全新训推一体加速器:完全集成PyTorch 2,性能3倍提升

Meta宣布全新训推一体加速器:完全集成PyTorch 2,性能3倍提升

Meta宣布全新训推一体加速器:完全集成PyTorch 2,性能3倍提升

Meta 正在不遗余力地想要在生成式 AI 领域赶上竞争对手,目标是投入数十亿美元用于 AI 研究。这些巨资一部分用于招募 AI 研究员。但更大的一部分用于开发硬件,特别是用于运行和训练 Meta AI 模型的芯片

来自主题: AI资讯
5803 点击    2024-04-11 21:07
为什么要纯C语言手搓GPT-2,Karpathy回应网友质疑

为什么要纯C语言手搓GPT-2,Karpathy回应网友质疑

为什么要纯C语言手搓GPT-2,Karpathy回应网友质疑

一个仅用 1000 行代码即可在 CPU/fp32 上实现 GPT-2 训练的项目「llm.c」

来自主题: AI资讯
7253 点击    2024-04-11 20:53
“梗王”大模型,靠讲笑话登上CVPR | 中山大学

“梗王”大模型,靠讲笑话登上CVPR | 中山大学

“梗王”大模型,靠讲笑话登上CVPR | 中山大学

谁能想到,只是让大模型讲笑话,论文竟入选了顶会CVPR!

来自主题: AI资讯
10380 点击    2024-04-11 17:20
ZOMI酱:从艺术生到大模型训练专家

ZOMI酱:从艺术生到大模型训练专家

ZOMI酱:从艺术生到大模型训练专家

技术阿甘在不停奔跑。

来自主题: AI资讯
9160 点击    2024-04-11 16:15
OpenAI创始大神手搓千行C代码训练GPT,附PyTorch迁移教程

OpenAI创始大神手搓千行C代码训练GPT,附PyTorch迁移教程

OpenAI创始大神手搓千行C代码训练GPT,附PyTorch迁移教程

纯C语言训练GPT,1000行代码搞定!,不用现成的深度学习框架,纯手搓。 发布仅几个小时,已经揽星2.3k。

来自主题: AI资讯
7968 点击    2024-04-11 10:18
Llama架构比不上GPT2?神奇token提升10倍记忆?

Llama架构比不上GPT2?神奇token提升10倍记忆?

Llama架构比不上GPT2?神奇token提升10倍记忆?

近日,朱泽园 (Meta AI) 和李远志 (MBZUAI) 的最新研究《语言模型物理学 Part 3.3:知识的 Scaling Laws》用海量实验(50,000 条任务,总计 4,200,000 GPU 小时)总结了 12 条定律,为 LLM 在不同条件下的知识容量提供了较为精确的计量方法。

来自主题: AI资讯
6468 点击    2024-04-10 19:11
7B超越百亿级,北大开源aiXcoder-7B最强代码大模型,企业部署最佳选择

7B超越百亿级,北大开源aiXcoder-7B最强代码大模型,企业部署最佳选择

7B超越百亿级,北大开源aiXcoder-7B最强代码大模型,企业部署最佳选择

对代码大模型而言,比能做编程题更重要的,是看是能不能适用于企业级项目开发,是看在实际软件开发场景中用得顺不顺手、成本高不高、能否精准契合业务需求,后者才是开发者关心的硬实力。

来自主题: AI资讯
7474 点击    2024-04-10 17:50