AI资讯新闻榜单内容搜索-上下文

X上63万人围观的Traning-Free GRPO：把GRPO搬进上下文空间学习

年初的 DeepSeek-R1，带来了大模型强化学习（RL）的火爆。无论是数学推理、工具调用，还是多智能体协作，GRPO（Group Relative Policy Optimization）都成了最常见的 RL 算法。

来自主题: AI技术研报

6544 点击 2025-10-23 11:41

轻量高效，即插即用：Video-RAG为长视频理解带来新范式

尽管视觉语言模型（LVLMs）在图像与短视频理解中已取得显著进展，但在处理长时序、复杂语义的视频内容时仍面临巨大挑战 —— 上下文长度限制、跨模态对齐困难、计算成本高昂等问题制约着其实际应用。针对这一难题，厦门大学、罗切斯特大学与南京大学联合提出了一种轻量高效、无需微调的创新框架 ——Video-RAG。

来自主题: AI技术研报

6985 点击 2025-10-22 14:57

硅谷一线创业者内部研讨：为什么只有 5%的 AI Agent 落地成功，他们做对了什么？

来自硅谷一线 AI 创业者的数据：95% 的 AI Agent 在生产环境都部署失败了。「不是因为模型本身不够智能，而是因为围绕它们搭建的脚手架，上下文工程、安全性、记忆设计都还远没有到位。」「大多数创始人以为自己在打造 AI 产品，但实际上他们构建的是上下文选择系统。」

来自主题: AI资讯

6888 点击 2025-10-21 16:02

长上下文窗口、Agent崛起，RAG已死？

在技术飞速更新迭代的今天，每隔一段时间就会出现「XX 已死」的论调。「搜索已死」、「Prompt 已死」的余音未散，如今矛头又直指 RAG。

来自主题: AI资讯

7121 点击 2025-10-20 15:03

是RAG已死，还是RAG Anything，All in RAG？

每隔一阵子，总有人宣告“RAG已死”：上下文越来越长、端到端多模态模型越来越强，好像不再需要检索与证据拼装。但真正落地到复杂文档与可溯源场景，你会发现死掉的只是“只切文本的旧RAG”。

来自主题: AI技术研报

6670 点击 2025-10-20 12:08

Agent长程搜索的两大痛点被打通了！中科院 DeepMiner用32k跑近百轮，开源领先逼近闭源

中科院的这篇工作解决了“深度搜索智能体”（deep search agents），两个实打实的工程痛点，一个是问题本身不够难导致模型不必真正思考，另一个是上下文被工具长文本迅速挤爆导致过程提前夭折，研究者直面挑战，从数据和系统两端同时重塑训练与推理流程，让复杂推理既有用又能跑得起来。

来自主题: AI资讯

7689 点击 2025-10-19 12:21

递归语言模型登场！MIT华人新作爆火，扩展模型上下文便宜又简单

目前，所有主流 LLM 都有一个固定的上下文窗口（如 200k, 1M tokens）。一旦输入超过这个限制，模型就无法处理。即使在窗口内，当上下文变得非常长时，模型的性能也会急剧下降，这种现象被称为「上下文腐烂」（Context Rot）：模型会「忘记」开头的信息，或者整体推理能力下降。

来自主题: AI资讯

7129 点击 2025-10-17 16:12

NTU等联合提出A-MemGuard：为AI记忆上锁，投毒攻击成功率暴降95%

在AI智能体日益依赖记忆系统的时代，一种新型攻击悄然兴起：记忆投毒。A-MemGuard作为首个专为LLM Agent记忆模块设计的防御框架，通过共识验证和双重记忆结构，巧妙化解上下文依赖与自我强化错误循环的难题，让AI从被动受害者转为主动守护者，成功率高达95%以上。

来自主题: AI技术研报

7373 点击 2025-10-16 14:51

「微调已死」再添筹码，谷歌扩展AI自我进化范式，成功经验与失败教训双向学习

这几天，关于「微调已死」的言论吸引了学术圈的广泛关注。一篇来自斯坦福大学、SambaNova、UC 伯克利的论文提出了一种名为 Agentic Context Engineering（智能体 / 主动式上下文工程）的技术，让语言模型无需微调也能实现自我提升！

来自主题: AI技术研报

8104 点击 2025-10-15 12:14

第二代InfLLM开源，同尺寸快三倍！零参数，可训练稀疏注意力

InfLLM-V2是一种可高效处理长文本的稀疏注意力模型，仅需少量长文本数据即可训练，且性能接近传统稠密模型。通过动态切换短长文本处理模式，显著提升长上下文任务的效率与质量。从短到长低成本「无缝切换」，预填充与解码双阶段加速，释放长上下文的真正生产力。

来自主题: AI技术研报

8461 点击 2025-10-13 11:55