AI资讯新闻榜单内容搜索-模型训练

AI大佬曼宁转赞，MetaGPT团队首提「Atom of Thoughts」，原子化思考让4o-mini暴打推理模型？

大语言模型（LLM）近年来凭借训练时扩展（train-time scaling）取得了显著性能提升。然而，随着模型规模和数据量的瓶颈显现，测试时扩展（test-time scaling）成为进一步释放潜力的新方向。

来自主题: AI技术研报

8854 点击 2025-03-16 12:42

何恺明LeCun联手：Transformer不要归一化了，论文已入选CVPR2025。

来自主题: AI技术研报

11242 点击 2025-03-15 17:12

机器人怎样感知世界？

来自主题: AI技术研报

10037 点击 2025-03-15 16:18

让机器人轻松学习复杂技能有新框架了！

来自主题: AI技术研报

7102 点击 2025-03-15 16:05

大模型架构研究进展太快，数据却快要不够用了，其中问题数据又尤其缺乏。

来自主题: AI技术研报

9142 点击 2025-03-15 15:39

「压缩即智能」。这并不是一个新想法，著名 AI 研究科学家、OpenAI 与 SSI 联合创始人 Ilya Sutskever 就曾表达过类似的观点。

来自主题: AI技术研报

8401 点击 2025-03-15 15:28

当前，视觉语言模型（VLMs）的能力边界不断被突破，但大多数评测基准仍聚焦于复杂知识推理或专业场景。本文提出全新视角：如果一项能力对人类而言是 “无需思考” 的本能，但对 AI 却是巨大挑战，它是否才是 VLMs 亟待突破的核心瓶颈？

来自主题: AI技术研报

7572 点击 2025-03-15 15:05

今年，CVPR共有13008份有效投稿并进入评审流程，其中2878篇被录用，最终录用率为22.1%。

来自主题: AI技术研报

8343 点击 2025-03-15 14:50

Transformer架构迎来历史性突破！刚刚，何恺明LeCun、清华姚班刘壮联手，用9行代码砍掉了Transformer「标配」归一化层，创造了性能不减反增的奇迹。

来自主题: AI技术研报

8196 点击 2025-03-15 14:11

在 Sora 引爆世界模型技术革命的当下，3D 场景作为物理世界的数字基座，正成为构建动态可交互 AI 系统的关键基础设施。当前，单张图像生成三维资产的技术突破，已为三维内容生产提供了 "从想象到三维" 的原子能力。

来自主题: AI技术研报

8853 点击 2025-03-14 15:40