AI资讯新闻榜单内容搜索-上下文

官宣，Milvus开源语义高亮模型：告别饱和检索，帮RAG、agent剪枝80%上下文

RAG与agent用到深水区，一定会遇到这个问题：明明架构很完美，私有数据也做了接入，但项目上线三天，不但token账单爆了，模型输出结果也似乎总差点意思。

来自主题: AI技术研报

10528 点击 2026-01-15 09:19

不用额外缓存！英伟达开源大模型记忆压缩方案，128K上下文提速2.7倍

提高大模型记忆这块儿，美国大模型开源王者——英伟达也出招了。

来自主题: AI技术研报

9542 点击 2026-01-14 15:29

把RoPE扔掉，AI更能看懂长上下文！Transformer作者团队开源大模型预训练新方法

针对大模型长文本处理难题，Transformer架构的核心作者之一Llion Jones领导的研究团队开源了一项新技术DroPE。

来自主题: AI资讯

9035 点击 2026-01-14 10:49

让钉钉A1成为了我的记忆外挂，充分实行了我的上下文工程

家人们，大概是从去年下半年上下文工程这个概念火了之后，我开始有意识的进行一些碎片化的记录。

来自主题: AI资讯

6961 点击 2026-01-14 10:04

美团龙猫LongCat技术升级！新注意力机制解码速度快10倍，还能处理1M超长文本

256K文本预加载提速超50%，还解锁了1M上下文窗口。

来自主题: AI技术研报

10464 点击 2026-01-13 16:10

看完 Manus、Cursor 分享后的最大收获：避免 Context 的过度工程化才是关键

最近，Cursor 也发表了一篇文章《Dynamic context discovery》，分享了他们是怎么做上下文管理的。结合 Manus、Cursor 这两家 Agent 领域头部团队的思路，我们整理了如何做好上下文工程的一些关键要点。

来自主题: AI资讯

9716 点击 2026-01-10 10:48

Transformer已死？DeepMind正在押注另一条AGI路线

借鉴人类联想记忆，嵌套学习让AI在运行中构建抽象结构，超越Transformer的局限。谷歌团队强调：优化器与架构互为上下文，协同进化才能实现真正持续学习。这篇论文或成经典，开启AI从被动训练到主动进化的大门。

来自主题: AI技术研报

10720 点击 2026-01-09 11:24

检索做大，生成做轻：CMU团队系统评测RAG的语料与模型权衡

在检索增强生成中，扩大生成模型规模往往能提升准确率，但也会显著抬高推理成本与部署门槛。CMU 团队在固定提示模板、上下文组织方式与证据预算，并保持检索与解码设置不变的前提下，系统比较了生成模型规模与检索语料规模的联合效应，发现扩充检索语料能够稳定增强 RAG，并在多项开放域问答基准上让小中型模型在更大语料下达到甚至超过更大模型在较小语料下的表现，同时在更高语料规模处呈现清晰的边际收益递减。

来自主题: AI技术研报

8769 点击 2026-01-06 09:30

MIT发现让AI变聪明的秘密，竟然和人类一模一样

你有没有发现，你让AI读一篇长文章，结果它读着读着就忘了前面的内容？你让它处理一份超长的文档，结果它给出来的答案，牛头不对马嘴？这个现象，学术界有个专门的名词，叫做上下文腐化。这也是目前AI的通病：大模型的记忆力太差了，文章越长，模型越傻！

来自主题: AI技术研报

10197 点击 2026-01-04 16:53

MIT团队推出递归语言模型！不改架构、不扩窗口，上下文处理能力扩展百倍

新年伊始，MIT CSAIL 的一纸论文在学术圈引发了不小的讨论。Alex L． Zhang 、 Tim Kraska 与 Omar Khattab 三位研究者在 arXiv 上发布了一篇题为《Recursive Language Models》的论文，提出了所谓“递归语言模型”（Recursive Language Models，简称 RLM）的推理策略。

来自主题: AI技术研报

7710 点击 2026-01-04 14:51