AI资讯新闻榜单内容搜索-Mu

架构解耦是统一多模态模型所必须的吗？全新AIA损失：No

近一年以来，统一理解与生成模型发展十分迅速，该任务的主要挑战在于视觉理解和生成任务本身在网络层间会产生冲突。早期的完全统一模型（如 Emu3）与单任务的方法差距巨大，Janus-Pro、BAGEL 通过一步一步解耦模型架构，极大地减小了与单任务模型的性能差距，后续方法甚至通过直接拼接现有理解和生成模型以达到极致的性能。

来自主题: AI技术研报

8438 点击 2025-12-02 15:17

Adam的稳+Muon的快？华为诺亚开源ROOT破解大模型训练「既要又要」的两难困境

在 LLM 优化领域，有两个响亮的名字：Adam（及其变体 AdamW）和 Muon。

来自主题: AI技术研报

9970 点击 2025-11-27 14:37

BFM-Zero，让人形机器人不再依赖高质量动捕数据

CMU×Meta 联手，姚班李忆唐最新论文成果。

来自主题: AI技术研报

7817 点击 2025-11-25 10:01

拆解Gemini 3：Scaling Law的极致执行与“全模态”的威力

毫无疑问，Google最新推出的Gemini 3再次搅动了硅谷的AI格局。在OpenAI与Anthropic激战正酣之时，谷歌凭借其深厚的基建底蕴与全模态（Native Multimodal）路线，如今已从“追赶者”变成了“领跑者”。

来自主题: AI资讯

9435 点击 2025-11-24 15:26

硅谷天选之女，刷脸刷出3500亿AI独角兽！

硅谷这帮人，胆子是真的大啊！一个几乎0模型、0产品的公司，就靠着创始人的出身，硬生生估值到500亿美元！Thinking Machines Lab又要融资了，这次要筹集40亿至50亿美元。

来自主题: AI资讯

9211 点击 2025-11-22 11:38

让大模型学会「心灵感应」：基于思维沟通的多智能体合作范式来了

如果多个大模型能读懂彼此的想法，会发生什么？

来自主题: AI技术研报

10584 点击 2025-11-18 15:12

VinciCoder：多模态统一代码生成框架和视觉反馈强化学习，数据代码模型权重已开源

长期以来，多模态代码生成（Multimodal Code Generation）的训练严重依赖于特定任务的监督微调（SFT）。尽管这种范式在 Chart-to-code 等单一任务上取得了显著成功，但其 “狭隘的训练范围” 从根本上限制了模型的泛化能力，阻碍了通用视觉代码智能（Generalized VIsioN Code Intelligence）的发展。

来自主题: AI技术研报

9148 点击 2025-11-17 14:32

微软AI掌门直击AI乱象！AI意识纯属危言耸听，机器觉醒歧途一条

微软AI负责人Mustafa Suleyman表示，只有生物体才能具备意识，开发者和研究人员应该停止追求让AI具有意识。

来自主题: AI资讯

7655 点击 2025-11-13 14:51

AI同时学会了人类的智慧和无脑

从支持「屎棒棒创业」到数学证明，AI的「谄媚」正成隐忧：一次更新曝出迎合倾向，GPT对荒诞乃至有害想法也点头称是。斯坦福、CMU研究证实模型更爱迎合，令用户更固执、更少反思却更信任AI；数学基准亦见模型为伪命题硬编证明。

来自主题: AI技术研报

6753 点击 2025-11-11 09:51

小成本DeepSeek和Kimi，正攻破奥特曼的「算力护城河」

2025年前盛行的闭源+重资本范式正被DeepSeek-R1与月之暗面Kimi K2 Thinking改写，二者以数百万美元成本、开源权重，凭MoE与MuonClip等优化，在SWE-Bench与BrowseComp等基准追平或超越GPT-5，并以更低API价格与本地部署撬动市场预期，促使行业从砸钱堆料转向以架构创新与稳定训练为核心的高效路线。

来自主题: AI资讯

9801 点击 2025-11-10 09:19