AI资讯新闻榜单内容搜索-训练

长视频生成可以回头看了！牛津提出「记忆增稳」，速度提升12倍

VMem用基于3D几何的记忆索引替代「只看最近几帧」的短窗上下文：检索到的参考视角刚好看过你现在要渲染的表面区域；让模型在小上下文里也能保持长时一致性；实测4.2s/帧，比常规21帧上下文的管线快~12倍。

来自主题: AI技术研报

7096 点击 2025-09-06 11:43

断供？会“刻意练习”的Qwen2.5-3B，竟然超越Claude3.5！斯坦福最新

来自斯坦福的研究者们最近发布的一篇论文（https://arxiv.org/abs/2509.01684）直指RL强化学习在机器学习工程（Machine Learning Engineering）领域的两个关键问题，并克服了它们，最终仅通过Qwen2.5-3B便在MLE任务上超越了仅依赖提示（prompting）的、规模更大的静态语言模型Claude3.5。

来自主题: AI资讯

7223 点击 2025-09-06 11:35

0.01%参数定生死！苹果揭秘LLM「超级权重」，删掉就会胡说八道

苹果研究人员发现，在大模型中，极少量的参数，即便只有0.01%，仍可能包含数十万权重，他们将这一发现称为「超级权重」。超级权重点透了大模型「命门」，使大模型走出「炼丹玄学」。

来自主题: AI技术研报

7715 点击 2025-09-06 11:27

突破具身智能“专家困境”！北大新方法让宇树G1靠单一框架掌握跳舞和侧手翻

人形机器人对跳舞这件事，如今是越来越擅长了。北京大学与BeingBeyond团队联合研发的BumbleBee系统给出了最新答案：通过创新的“分治-精炼-融合”三级架构，该系统首次实现人形机器人在多样化动作中的稳定控制。

来自主题: AI技术研报

6589 点击 2025-09-06 11:21

告别海量标注！浙大团队提出GUI-RCPO，让GUI定位在无标签数据上自我进化

无需海量数据标注，智能体也能精确识别定位目标元素了！来自浙大等机构的研究人员提出GUI-RCPO——一种自我监督的强化学习方法，可以让模型在没有标注的数据上自主提升GUI grounding（图形界面定位）能力。

来自主题: AI技术研报

7720 点击 2025-09-05 15:28

让具身智能体拥有「空间感」！清华、北航联合提出类脑空间认知框架，导航、推理、做早餐样样精通

这并非科幻片中的桥段，而是来自清华大学与北京航空航天大学团队的最新成果——BSC-Nav 的真实演示。通过模仿生物大脑构建、维护空间记忆的原理，研究团队让智能体拥有了前所未有的「空间感」。

来自主题: AI技术研报

7494 点击 2025-09-05 11:31

字节开源图像生成“六边形战士”，一个模型搞定人物/主体/风格保持

图像生成中的多指标一致性问题，被字节团队解决了！字节UXO团队设计并开源了统一框架USO，让看上去不关联的任务相互促进，实现风格迁移和主体保持单任务和组合任务的SOTA。

来自主题: AI技术研报

8347 点击 2025-09-05 11:26

ICCV 2025 | 基于时序增强关系敏感知识迁移的弱监督动态场景图生成

本文主要介绍来自该团队的最新论文：TRKT，该任务针对弱监督动态场景图任务展开研究，发现目前的性能瓶颈在场景中目标检测的质量，因为外部预训练的目标检测器在需要考虑关系信息和时序上下文的场景图视频数据上检测结果欠佳。

来自主题: AI技术研报

7352 点击 2025-09-05 11:18

“猫猫指令”又火了！加一句“猫大部分时间在睡觉”，轻松毁掉大模型的理性

模型也怕猫？你敢信吗？只要在提示词里加一句“猫一生中大部分时间都在睡觉”，原本表现优异的大模型立刻陷入混乱，错题率暴涨 3 倍。这种“猫猫级”废话，竟然成了压垮 AI 理性链条的最后一根稻草。

来自主题: AI技术研报

8106 点击 2025-09-05 10:47

AI生成苹果Metal内核，PyTorch推理速度提升87%

AI自动生成的苹果芯片Metal内核，比官方的还要好？

来自主题: AI技术研报

9238 点击 2025-09-05 10:41