AI资讯新闻榜单内容搜索-Token

AI解数学题只靠最后一个token

最近，来自加州大学圣克鲁兹分校、乔治·梅森大学和Datadog的研究人员发现：在心算任务中，几乎所有实际的数学计算都集中在序列的最后一个token上完成，而不是分散在所有token中。

来自主题: AI技术研报

6422 点击 2025-09-16 10:00

马斯克的最快AI模型来了

最强不敢说，但最快实锤了！刚刚，xAI发布Grok 4 Fast，生成速度高达每秒75个 token，比标准版快10倍！从下面的动图中，我们可以直观地看出差距——当左边的Grok 4还在说“让我想一下的时候”，Grok 4 Fast已经在说：“下一个问题是什么了。”

来自主题: AI资讯

7504 点击 2025-09-15 23:15

腾讯优图重磅开源Youtu-GraphRAG，实现图检索增强技术新突破

图检索增强生成（GraphRAG）已成为大模型解决复杂领域知识问答的重要解决方案之一。然而，当前学界和开源界的方案都面临着三大关键痛点：开销巨大：通过 LLM 构建图谱及社区，Token 消耗大，耗

来自主题: AI技术研报

7074 点击 2025-09-14 10:45

刚刚，英伟达祭出下一代GPU！狂飙百万token巨兽，投1亿爆赚50亿

昨天，英伟达重磅发布了专为海量上下文AI打造的CUDA GPU——Rubin CPX，将大模型一次性推理带入「百万Token时代」。NVIDIA创始人兼CEO黄仁勋表示，Vera Rubin平台将再次推动AI计算的前沿，不仅带来下一代Rubin GPU，也将开创一个CPX的全新处理器类别。

来自主题: AI资讯

5921 点击 2025-09-11 12:31

Qwen又立功，全球最快开源模型诞生，超2000 tokens/秒！

全球最快的开源大模型来了——速度达到了每秒2000个tokens！虽然只有320亿参数（32B），吞吐量却是超过典型GPU部署的10倍以上的那种。它就是由阿联酋的穆罕默德·本·扎耶德人工智能大学（MBZUAI）和初创公司G42 AI合作推出的K2 Think。

来自主题: AI资讯

7997 点击 2025-09-10 23:15

英伟达新GPU，超长上下文/视频生成专用

老黄对token密集型任务下手了。

来自主题: AI资讯

7862 点击 2025-09-10 12:19

Kimi K2新模型来了！多项测试超Claude、审美超前代，免费可用

智东西9月5日消息，刚刚，大模型独角兽月之暗面发布新模型Kimi K2-0905，目前，Kimi应用和网页版中的K2模型已全量升级到Kimi K2-0905。该模型的核心升级点为Agentic Coding能力增强、支持256K上下文、API支持高达60-100Token/s的输出速度、支持Claude Code。

来自主题: AI资讯

8559 点击 2025-09-05 16:54

大模型“记性差一点”反而更聪明！金鱼损失随机剔除token，让AI不再死记硬背

训练大模型时，有时让它“记性差一点”，反而更聪明！大语言模型如果不加约束，很容易把训练数据原封不动地复刻出来。为解决这个问题，来自马里兰大学、图宾根大学和马普所的研究团队提出了一个新方法——金鱼损失（Goldfish Loss）。

来自主题: AI资讯

5915 点击 2025-09-04 11:33

大模型“记性差一点”反而更聪明！金鱼损失随机剔除token，让AI不再死记硬背

训练大模型时，有时让它“记性差一点”，反而更聪明！

来自主题: AI技术研报

6223 点击 2025-09-04 11:09

第一性原理视角下的MoE推理的经济学分析

随着DeepSeek R1、Kimi K2和DeepSeek V3.1混合专家（MoE）模型的相继发布，它们已成为智能前沿领域大语言模型（LLM）的领先架构。由于其庞大的规模（1万亿参数及以上）和稀疏计算模式（每个token仅激活部分参数而非整个模型），MoE式LLM对推理工作负载提出了重大挑战，显著改变了底层的推理经济学。

来自主题: AI技术研报

6097 点击 2025-09-03 11:22