AI资讯新闻榜单内容搜索-框架

长序列推理不再卡顿！北大华为KV缓存管理框架实现4.7倍推理加速

北大华为联手推出KV cache管理新方式，推理速度比前SOTA提升4.7倍！大模型处理长序列时，KV cache的内存占用随序列长度线性增长，已成为制约模型部署的严峻瓶颈。

来自主题: AI技术研报

6928 点击 2025-10-22 14:52

在3D内容创作领域，如何像玩乐高一样，自由生成、编辑和组合对象的各个部件，一直是一个核心挑战。香港大学、VAST、哈尔滨工业大学及浙江大学的研究者们联手，推出了一个名为 OmniPart 的全新框架，巧妙地解决了这一难题。该研究已被计算机图形学顶会 SIGGRAPH Asia 2025 接收。

来自主题: AI技术研报

6348 点击 2025-10-22 14:48

在人工智能的广阔世界里，我们早已习惯了LLM智能体在各种任务中大放异彩。但有没有那么一瞬间，你觉得这些AI“牛马”还是缺了点什么？

来自主题: AI技术研报

9199 点击 2025-10-22 12:13

UC Berkeley、UW、AI2 等机构联合团队最新工作提出：在恰当的训练范式下，强化学习（RL）不仅能「打磨」已有能力，更能逼出「全新算法」级的推理模式。他们构建了一个专门验证这一命题的测试框架 DELTA，并观察到从「零奖励」到接近100%突破式跃迁的「RL grokking」现象。

来自主题: AI技术研报

7997 点击 2025-10-22 11:33

不再依赖人工设计，让模型真正学会管理记忆。

来自主题: AI技术研报

8422 点击 2025-10-21 10:25

在机器人学习领域，提升基于生成式模型的控制策略（Policy）的性能通常意味着投入巨额成本进行额外的数据采集和模型训练，这极大地限制了机器人能力的快速迭代与升级。面对模型性能的瓶颈，如何在不增加训练负担的情况下，进一步挖掘并增强现有策略的潜力？

来自主题: AI技术研报

7648 点击 2025-10-20 14:52

该研究首次提出了含可移动物体的 3D 场景中，基于文本的人 - 物交互生成任务，并构建了大规模数据集与创新方法框架，在多个评测指标上均取得了领先效果。

来自主题: AI技术研报

7213 点击 2025-10-20 14:40

1.58bit量化，内存仅需1/10，但表现不输FP16？微软最新推出的蒸馏框架BitNet Distillation（简称BitDistill），实现了几乎无性能损失的模型量化。

来自主题: AI技术研报

6378 点击 2025-10-20 14:35

麻省理工学院最新研究预示着人类距离能够自主学习的AI又迈出了关键一步。该研究推出了一种全新的自适应大模型框架「SEAL」，让模型从「被动学习者」变为「主动进化者」。

来自主题: AI技术研报

6783 点击 2025-10-19 12:39

在代码层面，大语言模型已经能够写出正确而优雅的程序。但在机器学习工程场景中，它离真正“打赢比赛”仍有不小差距。

来自主题: AI技术研报

8399 点击 2025-10-19 12:10