AI资讯新闻榜单内容搜索-上下文

大模型能“原地”改参数了！字节Seed&北大新论文：测试时推理无需加层重训练

字节Seed最新研究，让大模型能“原地改参数”了。既不用改模型结构，也不用重新训练，还跑得很快。具体是这么个情况。智能体时代嘛，大家都知道模型们面对的任务开始变得越来越复杂、上下文越来越长。

来自主题: AI技术研报

9057 点击 2026-04-11 10:25

视频生成不再「断片」：OneStory给模型装上「选择性记忆」，跨镜头讲故事人物场景始终如一丨CVPR'26

最近，来自Meta与University of Copenhagen的研究者提出了OneStory: Coherent Multi-Shot Video Generation with Adaptive Memory（收录于CVPR 2026）。这项工作聚焦于一个核心问题：如何在生成多镜头视频时，有效保留长程跨镜头上下文，从而实现更强的叙事一致性。

来自主题: AI技术研报

7526 点击 2026-04-10 15:36

15个模板复制粘贴，让同一个AI聪明十倍：上下文工程实战手册

Nav Toor 的上一篇上下文工程文章火了——上百万人阅读，上千人私信他同一个问题："道理我都懂了，但我到底该打什么字？"

来自主题: AI技术研报

8448 点击 2026-04-10 08:37

Mac用户可以在oMLX中使用TurboQuant了，搭配Gemma-4-31B，谷歌全家桶实测很能打！

对本地部署玩家，尤其是Mac用户来说，长上下文推理最大的痛点往往不是“模型不够聪明”，而是稍微多用点上下文，统一内存就被撑爆了”，这一点在最近的Gemma-4 31B的部署中尤为明显，在同等上下文的情况，显存占用比Qwen3.5-27B高约一倍不止，直接劝退了不少人。但好消息是，谷歌近期提出的TurboQuant KV缓存量化算法，正是为了解决这个痛点而生。

来自主题: AI技术研报

9073 点击 2026-04-09 09:47