AI资讯新闻榜单内容搜索-token

主流AI IDE的token成本爆炸？试试登上GitHub日榜的Claude Context！

欢迎大家尝试前不久GitHub的日榜榜首项目——Claude Context。通过在AI coding场景引入混合检索，Claude Context相比使用grep的原生 Claude Code 能大幅提升检索精度和效率，减少约 40% 的不必要Token 消耗。

来自主题: AI资讯

7781 点击 2026-04-25 13:32

2秒钟转写5分钟音频！国产新语音模型拿下多项SOTA，定价骤减90%

阶跃星辰今日发布新一代自动语音识别模型StepAudio 2.5 ASR。该模型面向语音转写与长音频处理场景，在架构上引入Multi-Token Prediction（多Token预测）以提升推理效率，并通过扩展上下文窗口强化长内容识别能力。

来自主题: AI资讯

9618 点击 2026-04-25 10:22

首篇「Attention Sink」综述：从利用、理解到消除，Transformer中的注意力「汇聚」全景解析

几乎所有 Transformer 都在做一件反常的事：把大量注意力集中到少数几个特定 Token 上。这不是 bug，而是 Transformer 固有的「注意力汇聚」（Attention Sink）。首篇系统性综述，带你从利用、理解到消除，全面掌握这一核心现象。

来自主题: AI技术研报

8818 点击 2026-04-24 09:14

1/10 消耗、0.1美元定价，开发者和中小企业的“省钱模型”来了

4月22日，蚂蚁百灵正式推出Ling-2.6-flash Instruct模型。该模型总参数量为104B，激活参数仅7.4B，核心主打高“Token 效率（Token Efficiency）”。API定价方面，Ling-2.6-flash输入每百万tokens定价0.1美元，输出 0.3 美元。目前，Ling-2.6-flash API已在OpenRouter及百灵tbox平台上线。

来自主题: AI资讯

7963 点击 2026-04-23 17:09