AI资讯新闻榜单内容搜索-上下文

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 上下文
突破一亿Token极限:EverMind提出MSA架构,实现大模型高效端到端长时记忆

突破一亿Token极限:EverMind提出MSA架构,实现大模型高效端到端长时记忆

突破一亿Token极限:EverMind提出MSA架构,实现大模型高效端到端长时记忆

人的智能能力主要由推理能力和长期记忆能力构成。近年来,大模型的推理能力一直处于快速发展过程,但大模型的长期记忆能力一直受限于上下文长度,无法取得突破。在历史上,曾经有多种路线进行尝试,但都无法突破扩展性(Scalability)、精度(Precision)和效率(Efficiency)的不可能三角。

来自主题: AI技术研报
9122 点击    2026-03-19 17:02
超越MLA!新架构MLRA百万token,解码最高2.8倍速 | ICLR'26

超越MLA!新架构MLRA百万token,解码最高2.8倍速 | ICLR'26

超越MLA!新架构MLRA百万token,解码最高2.8倍速 | ICLR'26

MLRA通过拆分KV缓存为四个并行分支,显著降低显存占用并实现4路张量并行。推理速度比MLA最高快2.8倍,支持百万级上下文,且模型质量更优。无需牺牲性能,即可高效扩展长文本处理能力。

来自主题: AI技术研报
9936 点击    2026-03-19 15:25
AI助手现在认路了:谷歌地图直接「长」进大脑

AI助手现在认路了:谷歌地图直接「长」进大脑

AI助手现在认路了:谷歌地图直接「长」进大脑

谷歌DeepMind刚刚为Gemini API放了一个大招:内置工具和自定义函数终于可以在同一次调用里混着用了。再加上跨工具的「上下文环流」和Google Maps原生接入,Agent开发的编排噩梦正在终结。

来自主题: AI资讯
6558 点击    2026-03-19 15:23
工程知识引擎:Harness Engineering体系下的工程知识底座

工程知识引擎:Harness Engineering体系下的工程知识底座

工程知识引擎:Harness Engineering体系下的工程知识底座

在AI编程智能体快速演进的今天,一个核心痛点愈发凸显:AI能写代码,却难以理解代码。更深层的问题是:即便模型能力再强,若缺乏结构化的工程约束与上下文支撑,智能体也难以稳定、可预期地完成真实工程任务。

来自主题: AI技术研报
8794 点击    2026-03-19 10:48
当AI第一次读完整本基因之书,十亿参数单细胞大模型能干什么?

当AI第一次读完整本基因之书,十亿参数单细胞大模型能干什么?

当AI第一次读完整本基因之书,十亿参数单细胞大模型能干什么?

十亿参数单细胞基础模型scLong不再只看少数高表达基因,而是把一个细胞里接近 2.8 万个基因 都纳入建模,并结合 Gene Ontology(GO) 的生物学知识,去理解更完整的基因上下文。

来自主题: AI技术研报
6163 点击    2026-03-19 10:23
AI读不懂文档结构?计算所重构Agentic RAG文档推理能力

AI读不懂文档结构?计算所重构Agentic RAG文档推理能力

AI读不懂文档结构?计算所重构Agentic RAG文档推理能力

DeepRead让AI像人一样阅读文档:利用OCR识别章节结构,先精准定位相关段落,再完整读取上下文,避免碎片化检索。实验显示,其长文档问答准确率提升17%,能自动跳过冗余信息,精准提取财报、论文等复杂内容,无需额外知识图谱,轻量高效。

来自主题: AI资讯
8170 点击    2026-03-16 14:26
Claude一夜拆掉AI编程天花板!百万token上下文登场,吞下整个代码库

Claude一夜拆掉AI编程天花板!百万token上下文登场,吞下整个代码库

Claude一夜拆掉AI编程天花板!百万token上下文登场,吞下整个代码库

粗大事了,刚刚,Claude把上下文窗口一口气撑到100万token!整套代码库、海量论文、长对话一次读完,AI真正拥有「超长工作记忆」。AI编程军备竞赛,正在被彻底改写。

来自主题: AI资讯
8464 点击    2026-03-14 14:01
我用大厂 PUA 话术调教 AI,打了 3.25 后它再也不敢摸鱼了

我用大厂 PUA 话术调教 AI,打了 3.25 后它再也不敢摸鱼了

我用大厂 PUA 话术调教 AI,打了 3.25 后它再也不敢摸鱼了

你有没有遇到过这种情况,让 Claude 解一个 bug,它思考了很久,跑了一堆命令,然后过了两分钟:「建议您手动处理」、「可能是环境问题,需要更多上下文」,又或者是 AI 常用的那句,「我解决不了 I cannot solve this。」

来自主题: AI资讯
10331 点击    2026-03-13 10:54
刚刚,OpenClaw史上最猛更新!AI记忆可自由插拔,开发者等了半年

刚刚,OpenClaw史上最猛更新!AI记忆可自由插拔,开发者等了半年

刚刚,OpenClaw史上最猛更新!AI记忆可自由插拔,开发者等了半年

OpenClaw推出v2026.3.7-beta.1,史上最密集一次更新:89项提交、200+Bug修复,核心亮点是全新ContextEngine插件接口——上下文管理终于可以「自由插拔」,不动核心代码就能换策略。这次更新值得每一个做AI Agent的人认真看。

来自主题: AI资讯
9040 点击    2026-03-09 11:07
ICLR 2026|人大&通义:别再只会堆上下文了!IterResearch用40K上下文轻松实现2048轮交互不退化

ICLR 2026|人大&通义:别再只会堆上下文了!IterResearch用40K上下文轻松实现2048轮交互不退化

ICLR 2026|人大&通义:别再只会堆上下文了!IterResearch用40K上下文轻松实现2048轮交互不退化

来自中国人民大学与阿里巴巴通义实验室的研究团队提出了 IterResearch,一种全新的迭代式深度研究范式。通过马尔可夫式的工作空间重构,IterResearch 让 Agent 在仅 40K 上下文长度下完成了 2048 次工具交互且性能不衰减,在 BrowseComp 上从 3.5% 一路攀升至 42.5%。

来自主题: AI技术研报
7769 点击    2026-03-03 14:20