AI资讯新闻榜单内容搜索-Muon

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Muon
正交化之外是什么?微软等提出ARO优化器:训练提速1/3,揭示矩阵优化新「蓝海」

正交化之外是什么?微软等提出ARO优化器:训练提速1/3,揭示矩阵优化新「蓝海」

正交化之外是什么?微软等提出ARO优化器:训练提速1/3,揭示矩阵优化新「蓝海」

如果你在过去一年关注过大模型训练的技术,大概率听过 Muon 这个名字 —— 这个在月之暗面 K2 模型的相关讨论中走红的优化器,被视为是可能挑战 Adam 的新秀。它的思路很直接:对动量矩阵进行正交化,让各个奇异方向上的更新速率一致,提升训练效率。

来自主题: AI技术研报
6080 点击    2026-03-10 14:31
小成本DeepSeek和Kimi,正攻破奥特曼的「算力护城河」

小成本DeepSeek和Kimi,正攻破奥特曼的「算力护城河」

小成本DeepSeek和Kimi,正攻破奥特曼的「算力护城河」

2025年前盛行的闭源+重资本范式正被DeepSeek-R1与月之暗面Kimi K2 Thinking改写,二者以数百万美元成本、开源权重,凭MoE与MuonClip等优化,在SWE-Bench与BrowseComp等基准追平或超越GPT-5,并以更低API价格与本地部署撬动市场预期,促使行业从砸钱堆料转向以架构创新与稳定训练为核心的高效路线。

来自主题: AI资讯
10290 点击    2025-11-10 09:19
仅凭一篇博客,他成功入职OpenAI!核心技术或用于GPT-5训练

仅凭一篇博客,他成功入职OpenAI!核心技术或用于GPT-5训练

仅凭一篇博客,他成功入职OpenAI!核心技术或用于GPT-5训练

未中顶会,没有发表arXiv,一篇博客却成为OpenAI速通票。天才科学家Keller Jordan仅凭Muon优化器博客加入OpenAI。甚至,它可能被用于训练下一代超级模型GPT-5。

来自主题: AI资讯
9317 点击    2025-06-16 17:22
开源赛道太挤了!月之暗面开源新版Muon优化器

开源赛道太挤了!月之暗面开源新版Muon优化器

开源赛道太挤了!月之暗面开源新版Muon优化器

省一半算力跑出2倍效果,月之暗面开源优化器Muon,同预算下全面领先。

来自主题: AI技术研报
8270 点击    2025-02-24 13:56