AI资讯新闻榜单内容搜索-LLM

谁是Adam？NeurIPS 2025审稿爆年度最大笑话！Hinton也曾被拒稿

LLM真是把审稿人害惨了！NeurIPS 2025评审结果公，全网都被「谁是Adam」爆梗淹没。更离谱的是，有人的审稿建议中，残留了AI提示的痕迹。

来自主题: AI资讯

10347 点击 2025-07-28 16:17

ACL 2025｜驱动LLM强大的过程级奖励模型（PRMs）正遭遇「信任危机」？

近年来，大型语言模型（LLMs）在复杂推理任务中展现出惊人的能力，这在很大程度上得益于过程级奖励模型（PRMs）的赋能。PRMs 作为 LLMs 进行多步推理和决策的关键「幕后功臣」，负责评估推理过程的每一步，以引导模型的学习方向。

来自主题: AI技术研报

7620 点击 2025-07-28 10:49

手机AGI助手还有多远？移动智能体复合长程任务测试基准与调度系统发布

多模态大模型 (MLLM) 驱动的 OS 智能体在单屏动作落实（如 ScreenSpot）、短链操作任务（如 AndroidControl）上展现出突出的表现，标志着端侧任务自动化的初步成熟。

来自主题: AI技术研报

8255 点击 2025-07-27 13:01

大模型“天梯赛”来了，让Agent在Kaggle真实任务中进化｜佐治亚理工、斯坦福开源

当前最强大的大语言模型（LLM）虽然代码能力飞速发展，但在解决真实、复杂的机器学习工程（MLE）任务时，仍像是在进行一场“闭卷考试”。它们可以在单次尝试中生成代码，却无法模拟人类工程师那样，在反复的实验、调试、反馈和优化中寻找最优解的真实工作流。

来自主题: AI技术研报

7559 点击 2025-07-27 12:43

斯坦福大模型推理课免费了，谷歌推理团队创始人主讲

如何理解大模型推理能力？现在有来自谷歌DeepMind推理负责人Denny Zhou的分享了。就是那位和清华姚班马腾宇等人证明了只要思维链足够长，Transformer就能解决任何问题的Google Brain推理团队创建者。 Denny Zhou围绕大模型推理过程和方法，在斯坦福大学CS25上讲了一堂“LLM推理”课。

来自主题: AI资讯

7693 点击 2025-07-25 16:57