AI资讯新闻榜单内容搜索-LLM

谷歌DeepMind&CMU：过去引导LLM规划的方法是错的？用GRASE-DC改进。ICLR2025

当您的Agent需要规划多步骤操作以达成目标时，比如游戏策略制定或旅行安排优化等等，传统规划方法往往需要复杂的搜索算法和多轮提示，计算成本高昂且效率不佳。来自Google DeepMind和CMU的研究者提出了一个简单却非常烧脑的问题：我们是否一直在用错误的方式选择示例来引导LLM学习规划？

来自主题: AI技术研报

11209 点击 2025-05-09 11:58

突破多模态奖励瓶颈！中科院清华快手联合提出R1-Reward，用强化学习赋予模型长期推理能力

多模态奖励模型（MRMs）在提升多模态大语言模型（MLLMs）的表现中起着至关重要的作用：

来自主题: AI技术研报

10153 点击 2025-05-09 11:51

尤雨溪宣布：Vue 生态正式引入 AI！

在前端开发领域，Vue 框架一直以其易用性和灵活性受到广大开发者的喜爱。而如今，Vue 生态在人工智能（AI）领域的应用上又迈出了重要的一步。尤雨溪近日宣布，Vue、Vite 和 Rolldown 的文档网站均已添加了llms.txt文件，这一举措旨在让大型语言模型（LLM）更方便地理解这些前端技术。

来自主题: AI资讯

10943 点击 2025-05-08 09:38

ICML 2025 Spotlight｜华为诺亚提出端侧大模型新架构MoLE，内存搬运代价降低1000倍

Mixture-of-Experts（MoE）在推理时仅激活每个 token 所需的一小部分专家，凭借其稀疏激活的特点，已成为当前 LLM 中的主流架构。然而，MoE 虽然显著降低了推理时的计算量，但整体参数规模依然大于同等性能的 Dense 模型，因此在显存资源极为受限的端侧部署场景中，仍然面临较大挑战。

来自主题: AI技术研报

8612 点击 2025-05-07 09:30