AI资讯新闻榜单内容搜索-

Meta微软发关键财报，市场都在问DeepSeek

科技巨头Meta和微软相继公布了各自截至12月31日的最新季度财报。

来自主题: AI资讯

6996 点击 2025-01-31 12:56

ModernBERT 为我们带来了哪些启示？

当谷歌在 2018 年推出 BERT 模型时，恐怕没有料到这个 3.4 亿参数的模型会成为自然语言处理领域的奠基之作。

来自主题: AI技术研报

9639 点击 2025-01-31 12:34

Fullmoon 可以在完全断网的情况下在苹果手机上使用AI 大语言模型

1月13日Mainframe公司发布了可以离线运行在苹果系统（Mac，iPad，iPhone）的本地大语言模型fullmoon: local intelligence

来自主题: AI资讯

7824 点击 2025-01-30 18:05

诺奖得主DeepMind CEO德米斯：年底首批AI新药即将进入临床，已在开发超越o1的推理系统

近日，在《金融时报》主编 Roula Khalaf 的最新采访中，谷歌 DeepMind 的 CEO、2024 年诺贝尔化学奖得主 Demis Hassabis 放出了一连串重磅消息

来自主题: AI资讯

8311 点击 2025-01-30 15:45

大模型训练开销还能更小！微软推出首个FP4训练框架，训练效果与BF16相当

首个FP4精度的大模型训练框架来了，来自微软研究院！

来自主题: AI技术研报

9018 点击 2025-01-30 15:11

清华翟季冬：DeepSeek 百倍算力效能背后的系统革命 | 智者访谈

2025 年伊始，全球 AI 业界被 DeepSeek 刷屏。当 OpenAI 宣布 5000 亿美元的「星际之门」计划，Meta 在建规模超 130 万 GPU 的数据中心时，这个来自中国的团队打破了大模型军备竞赛的既定逻辑：用 2048 张 H800 GPU，两个月训练出了一个媲美全球顶尖水平的模型。

来自主题: AI资讯

7709 点击 2025-01-30 14:58