AI资讯新闻榜单内容搜索-模型训练

正交化之外是什么？微软等提出ARO优化器：训练提速1/3，揭示矩阵优化新「蓝海」

如果你在过去一年关注过大模型训练的技术，大概率听过 Muon 这个名字 —— 这个在月之暗面 K2 模型的相关讨论中走红的优化器，被视为是可能挑战 Adam 的新秀。它的思路很直接：对动量矩阵进行正交化，让各个奇异方向上的更新速率一致，提升训练效率。

来自主题: AI技术研报

6273 点击 2026-03-10 14:31

从训练到推理的「瘦身」演进：首篇高效扩散语言模型（dLLM）深度综述

在生成式 AI 的浪潮中，自回归（Autoregressive, AR）模型凭借其卓越的性能占据了统治地位。然而，其「从左到右」逐个预测 Token 的串行机制，天生限制了并行生成的可能性。

来自主题: AI技术研报

6470 点击 2026-03-10 14:29

ICLR 2026｜早于DeepSeek Engram，STEM已重构Transformer「记忆」

近年来，随着大语言模型规模与知识密度不断提升，研究者开始重新思考一个更本质的问题：模型中的参数应如何被组织，才能更高效地充当「记忆」。

来自主题: AI技术研报

8270 点击 2026-03-10 09:31

LeCun团队新论文：模仿人类智能搞AI，照猫画虎死胡同

AI圈追逐多年的通用人工智能（AGI），可能从一开始就走偏了。

来自主题: AI技术研报

7956 点击 2026-03-10 09:30

ICLR2026 Oral | 北大彭一杰团队提出高效优化新范式，递归似然比梯度优化器赋能扩散模型后训练

在 AI 视觉生成领域，扩散模型（DM）凭借其强大的高保真数据生成能力，已成为图像合成、视频生成等多模态任务的核心框架。然而，预训练后的扩散模型如何高效适配下游应用需求，一直是行业面临的关键挑战。

来自主题: AI技术研报

7816 点击 2026-03-10 09:30

反直觉！扩散模型「跨界」复原: 只用卧室模型，竟能复原人脸

自扩散模型提出以来，它不仅在图像、视频和音频生成方面取得了优异效果，也正逐渐成为解决图像复原、超分辨率、去模糊等逆问题的重要工具。

来自主题: AI技术研报

9670 点击 2026-03-10 09:29

刚刚，蚂蚁投了“最美产品经理”，造AI魔镜，前vivo宝马高管入局

智东西3月9日消息，近日，由前vivo与理想汽车产品负责人宋紫薇创立的薇光点亮完成超1亿元人民币的Pre-A轮融资。此轮融资由由红杉中国、蓝驰创投联合领投，蚂蚁战投、鼎晖投资、鞍羽资本跟投，老股东九合创投持续追投，所筹资金将重点用于人才梯队建设、新型智能硬件研发、垂类模型训练及时尚Agent关键应用场景落地。

来自主题: AI资讯

7837 点击 2026-03-09 21:36