AI资讯新闻榜单内容搜索-上下文

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 上下文
阶跃发布Step 3.7 Flash:一款为「烧钱时代」准备的Agent模型

阶跃发布Step 3.7 Flash:一款为「烧钱时代」准备的Agent模型

阶跃发布Step 3.7 Flash:一款为「烧钱时代」准备的Agent模型

继 Step 3.5 Flash 后,阶跃星辰最近又推出新一代高效率 Flash 开源模型 ——Step 3.7 Flash。该模型最大特点就是多(模)、快(速)、好(用)、省(钱)。总参数 196B,采用稀疏 MoE 架构,推理激活参数仅 11B,配备 1.88B ViT 视觉编码器,推理速度最高 400 TPS,支持 256K 上下文。

来自主题: AI资讯
9325 点击    2026-05-29 17:06
Claude Code首发「自愈」功能! 一锤砸碎开发者6大噩梦

Claude Code首发「自愈」功能! 一锤砸碎开发者6大噩梦

Claude Code首发「自愈」功能! 一锤砸碎开发者6大噩梦

刚刚,Claude Code迎来史上最大规模底层升级!Anthropic直击开发者最痛的6大顽疾:终端闪烁、思考假死、玄学报错、上下文死锁、连接不稳、会话崩溃。一夜之间,AI编程工具从「聪明外挂」进化为「可靠伙伴」。

来自主题: AI资讯
9838 点击    2026-05-28 21:01
AI公司烧不起Token了!国产Agent杀出,逼近Opus 4.6还免费

AI公司烧不起Token了!国产Agent杀出,逼近Opus 4.6还免费

AI公司烧不起Token了!国产Agent杀出,逼近Opus 4.6还免费

4个月烧光全年AI预算,天价Token账单正在屠杀硅谷!今天,高性能Agent模型SkyClaw-v1.0出世,性能直逼Opus 4.6、DeepSeek V4 Pro,百万上下文性价比拉满。

来自主题: AI资讯
9254 点击    2026-05-26 14:56
YC 今年最想投的两个赛道,被这个开源项目同时干了

YC 今年最想投的两个赛道,被这个开源项目同时干了

YC 今年最想投的两个赛道,被这个开源项目同时干了

Ashpreet 现在是 Agno 的创始人,以前在 Airbnb、Facebook 做过工程。Scout 是 Agno 新推出的开源项目,定位是「上下文智能体」——一个能在 Slack、Google Drive、Linear 里自由穿梭、替你把碎片化知识拼起来的 AI Agent。

来自主题: AI资讯
8756 点击    2026-05-26 10:20
你的AI Agent越用越蠢?港中大、浙大戳破「记忆」的谎言

你的AI Agent越用越蠢?港中大、浙大戳破「记忆」的谎言

你的AI Agent越用越蠢?港中大、浙大戳破「记忆」的谎言

你是否在使用Agent工作或者写代码时,总感觉上下文不够用?或者感觉反复使用Agent时并没有变得更聪明?感觉目前的记忆方案仍然不够用?今日,香港中文大学联合浙江大学发布的一篇论文关注了这个问题,并引起了学术界广泛讨论:你以为Agent在「记忆」,其实只是在记备忘录。

来自主题: AI技术研报
8706 点击    2026-05-19 15:00
OpenAI 放出 12 个 Codex 官方案例:这次不是看功能,是照着做

OpenAI 放出 12 个 Codex 官方案例:这次不是看功能,是照着做

OpenAI 放出 12 个 Codex 官方案例:这次不是看功能,是照着做

12 个官方场景把 Codex 的用法摊开:从代码审查到 PPT、数据分析和游戏开发,核心是把规则、上下文和验收方式交给 AI。OpenAI 给 Codex 新放出来的,不像一个普通功能页。

来自主题: AI资讯
8896 点击    2026-05-11 22:31
Claude Code 每条请求暗藏一行「有毒」header,52K 上下文推理被拖慢 5 倍!NVIDIA 一个 flag 修好了

Claude Code 每条请求暗藏一行「有毒」header,52K 上下文推理被拖慢 5 倍!NVIDIA 一个 flag 修好了

Claude Code 每条请求暗藏一行「有毒」header,52K 上下文推理被拖慢 5 倍!NVIDIA 一个 flag 修好了

NVIDIA Dynamo 团队发现,Claude Code 向自定义端点发送请求时,prompt 最前面会带一行 session-specific billing header。这行 header 每个 session 都变,导致 52K token 的稳定前缀在 KV cache 中无法复用——TTFT 从 168ms 飙到 912ms。Dynamo 加了一个 `

来自主题: AI资讯
10455 点击    2026-05-11 11:01
深度拆解:AI 智能体 Harness 的构造【译】

深度拆解:AI 智能体 Harness 的构造【译】

深度拆解:AI 智能体 Harness 的构造【译】

本文将深入探讨 Anthropic、OpenAI、Perplexity 和 LangChain 究竟在开发什么。我们将聊聊编排循环、工具、记忆、上下文管理,以及那些将“无状态”的大语言模型(LLM)转变为全能智能体(Agent)的底层机制。

来自主题: AI技术研报
8272 点击    2026-05-11 09:02