AI资讯新闻榜单内容搜索-上下文

RAG不会过时，但你需要这10个上下文处理技巧|Context Engineering系列一

RAG效果不及预期，试试这10个上下文处理优化技巧。对大部分开发者来说，搭一个RAG或者agent不难，怎么把它优化成生产可用的状态最难。在这个过程中，检索效率、准确性、成本、响应速度，都是重点关注问题。

来自主题: AI技术研报

9154 点击 2025-11-29 10:03

RAG效果要提升，先搞定高质量Context Pruning

Context Pruning如何结合rerank，优化RAG上下文？

来自主题: AI技术研报

10075 点击 2025-11-28 10:05

狙击Gemini 3！OpenAI发布GPT-5.1-Codex-Max

Gemini 3力压全场，OpenAI坐不住了。发布Codex新版本——GPT-5.1-Codex-Max，突破上下文窗口限制，实现跨越数百万token的长时间连续工作，最长超过24小时的那种。

来自主题: AI资讯

9833 点击 2025-11-20 20:29

NeurIPS 2025 | 上下文元学习实现不微调跨被试脑活动预测

人类高级视觉皮层在个体间存在显著的功能差异，而构建大脑编码模型（brain encoding models）—— 即能够从视觉刺激（如图像）预测人脑神经响应的计算模型 —— 是理解人类视觉系统如何表征世界的关键。传统视觉编码模型通常需要为每个新被试采集大量数据（数千张图像对应的脑活动），成本高昂且难以推广。

来自主题: AI技术研报

11172 点击 2025-11-19 15:21

从《塞尔达传说》理解 Agent 的上下文工程：Claude Skills 还是被低估了

Claude 近期发布的 Skills 功能很火，不少开发者都在尝试、试用。

来自主题: AI技术研报

11461 点击 2025-11-19 09:31

上下文工程：为什么你的 AI Agent 总是“断片”？

AI Agent 在处理复杂任务时经常“掉链子”。你刚告诉它的信息，它很快就忘了。给它的工具越多，它反而越混乱。这不是个例。

来自主题: AI技术研报

11804 点击 2025-11-18 16:11

Memory和RAG的区别在哪？用「上下文工程」做出个性化 AI（谷歌白皮书精读）

谷歌在第三天发布了《上下文工程：会话与记忆》(Context Engineering: Sessions & Memory) 白皮书。文中开篇指出，LLM模型本身是无状态的 (stateless)。如果要构建有状态的（stateful）和个性化的 AI，关键在于上下文工程。

来自主题: AI技术研报

8337 点击 2025-11-14 10:22

用155万模拟视频给模型上课！GVE模型一次学会9种视频检索技能

当前视频检索研究正陷入一个闭环困境：以MSRVTT为代表的窄域基准，长期主导模型在粗粒度文本查询上的优化，导致训练数据有偏、模型能力受限，难以应对真实世界中细粒度、长上下文、多模态组合等复杂检索需求。

来自主题: AI技术研报

6748 点击 2025-11-14 09:41

与DeepSeek-OCR不谋而合，NeurIPS论文提出让LLM像人一样读长文本

在处理短文本时，大语言模型（LLM）已经表现出惊人的理解和生成能力。但现实世界中的许多任务 —— 如长文档理解、复杂问答、检索增强生成（RAG）等 —— 都需要模型处理成千上万甚至几十万长度的上下文。

来自主题: AI技术研报

7777 点击 2025-11-10 15:12

终结Transformer统治！清华姚班校友出手，剑指AI「灾难性遗忘」

大模型「灾难性遗忘」问题或将迎来突破。近日，NeurIPS 2025收录了谷歌研究院的一篇论文，其中提出一种全新的「嵌套学习（Nested Learning）」架构。实验中基于该框架的「Hope」模型在语言建模与长上下文记忆任务中超越Transformer模型，这意味着大模型正迈向具备自我改进能力的新阶段。

来自主题: AI技术研报

8710 点击 2025-11-10 09:56