AI资讯新闻榜单内容搜索-上下文

英伟达开源发布最新AI模型！引入突破性专家混合架构，推理性能超越Qwen3和GPT，百万token上下文，模型数据集全开源！

就在刚刚，英伟达正式开源发布了其新一代AI模型：NVIDIA Nemotron 3。Nemotron 3 系列由三种型号组成：Nano、Super 和 Ultra。官方介绍其具备强大的智能体、推理和对话能力。

来自主题: AI技术研报

9771 点击 2025-12-16 17:21

告别「手搓Prompt」，前美团高管创业，要让物理世界直接成为AI提示词

正如奥特曼执意打造硬件，试图打破手机屏束缚，要让 AI 感受物理世界；Looki 的诞生也源于同样的渴望：补齐大模型「感官智能」的最后拼图，将现实场景实时转化为上下文，驱动人机交互从「被动问答」进化为「主动共鸣」。

来自主题: AI资讯

10803 点击 2025-12-16 17:20

国产多模态AI再开源！实测截图转网页、搜图购物，价格减半

原生工具调用、128K上下文，图文创作仍有短板。

来自主题: AI技术研报

11345 点击 2025-12-10 10:51

谷歌秀肌肉了：披露Gemini 3.0为啥过目不忘越用越好用，Titans的惊喜度+Miras框架

最近，Google Research 发布了一篇 Blog《Titans + MIRAS：帮助人工智能拥有长期记忆》。它们允许 AI 模型在运行过程中更新其核心内存，从而更快地工作并处理海量上下文。

来自主题: AI技术研报

10485 点击 2025-12-08 14:41

LLM强化学习不稳定之谜，被Qwen团队从「一阶近似」视角解开

如今，强化学习（RL）已成为提升大语言模型（LLM）复杂推理与解题能力的关键技术范式，而稳定的训练过程对于成功扩展 RL 至关重要。由于语言具有强烈的上下文属性，LLM 的 RL 通常依赖序列级奖励 —— 即根据完整生成序列给一个标量分数。

来自主题: AI技术研报

6126 点击 2025-12-08 10:27

谷歌新架构突破Transformer超长上下文瓶颈！Hinton灵魂拷问：后悔Open吗？

两项关于大模型新架构的研究一口气在NeurIPS 2025上发布，通过“测试时训练”机制，能在推理阶段将上下文窗口扩展至200万token。两项新成果分别是：Titans：兼具RNN速度和Transformer性能的全新架构；MIRAS：Titans背后的核心理论框架。

来自主题: AI技术研报

7910 点击 2025-12-06 11:10

全面战胜ReAct！斯坦福全新智能体推理框架，性能提升112.5%

斯坦福和MIT的研究团队推出了一种新的AI智能体推理框架ReCAP，在长上下文任务中全面超越了现有的主流框架ReAct，性能提升显著。ReCAP通过独特的递归树结构和三大机制，解决了大语言模型在复杂任务中常见的目标漂移、上下文断层和成本爆炸等问题。

来自主题: AI技术研报

10497 点击 2025-12-02 15:20

深入AI Agent内核: Google gemini-cli 源码深度解构

随着大语言模型与开发工具链的深度融合，命令行终端正被重塑为开发者的AI协作界面。本文以 Google gemini-cli 为范本，通过源码解构，系统性分析其 Agent 内核、ReAct 工作流、工具调用与上下文管理等核心模块的实现原理。为希望构建终端 Agent 的开发者，提供工程实现的系统化参考。

来自主题: AI技术研报

8880 点击 2025-12-01 16:15

RAG不会过时，但你需要这10个上下文处理技巧|Context Engineering系列一

RAG效果不及预期，试试这10个上下文处理优化技巧。对大部分开发者来说，搭一个RAG或者agent不难，怎么把它优化成生产可用的状态最难。在这个过程中，检索效率、准确性、成本、响应速度，都是重点关注问题。

来自主题: AI技术研报

8610 点击 2025-11-29 10:03

RAG效果要提升，先搞定高质量Context Pruning

Context Pruning如何结合rerank，优化RAG上下文？

来自主题: AI技术研报

9524 点击 2025-11-28 10:05