AI资讯新闻榜单内容搜索-Tokens

大模型价格战逆转？深扒17家厂商最新定价，竟有超7成在涨价

DeepSeek涨价了。智东西8月23日报道，8月21日，DeepSeek在其公众号官宣了DeepSeek-V3.1的正式发布，还宣布自9月6日起，DeepSeek将执行新价格表，取消了今年2月底推出的夜间优惠，推理与非推理API统一定价，输出价格调整至12元/百万tokens。这一决定，让使用DeepSeek API的最低价格较过去上升了50%。

来自主题: AI资讯

9373 点击 2025-08-25 12:29

GPT-5系统提示词被曝，足足15000 tokens！

疑似GPT-5的系统提示词，在GitHub上被曝光了！我们把这份系统提示词里的关键指令梳理成了一个「用户可见效果 ↔ 内部要求」对照表，大家可以对比看一下

来自主题: AI资讯

12467 点击 2025-08-25 09:26

开源扩散大模型首次跑赢自回归！上交大联手UCSD推出D2F，吞吐量达LLaMA3的2.5倍

在大语言模型（LLMs）领域，自回归（AR）范式长期占据主导地位，但其逐 token 生成也带来了固有的推理效率瓶颈。此前，谷歌的 Gemini Diffusion 和字节的 Seed Diffusion 以每秒千余 Tokens 的惊人吞吐量，向业界展现了扩散大语言模型（dLLMs）在推理速度上的巨大潜力。

来自主题: AI技术研报

7785 点击 2025-08-18 17:20

字节Seed发布扩散语言模型，推理速度达2146 tokens/s，比同规模自回归快5.4倍

用扩散模型写代码，不仅像开了倍速，改起来还特别灵活！字节Seed最新发布扩散语言模型Seed Diffusion Preview，这款模型主要聚焦于代码生成领域，它的特别之处在于采用了离散状态扩散技术，在推理速度上表现出色。

来自主题: AI资讯

7317 点击 2025-08-01 16:04

国产GPU跑满血DeepSeek，已经可以100 tokens/s了！

放眼当下，到底哪个芯片跑满血DeepSeek是最快的？答案很意外——不是你以为的英伟达，而是一家国产GPU。因为现在它的速度，已经直接来到了100 tokens/s！

来自主题: AI资讯

6883 点击 2025-07-27 14:04

「Tokens是胡扯」，Mamba作者抛出颠覆性观点，揭露Transformer深层缺陷

「Tokenization（分词）是 Transformer 模型为弥补自身缺陷不得不戴上的枷锁。」

来自主题: AI技术研报

6419 点击 2025-07-10 13:16

重塑AI记忆边界：MemOS开源！时序推理较OpenAI提升159%

大模型记忆管理和优化框架是当前各大厂商争相优化的热点方向，MemOS 相比现有 OpenAI 的全局记忆在大模型记忆评测集上呈现出显著的提升，平均准确性提升超过 38.97%，Tokens 的开销进一步降低 60.95%，一举登顶记忆管理的 SOTA 框架，特别是在考验框架时序建模与检索能力的时序推理任务上，提升比例更是达到了 159%，相当震撼！

来自主题: AI技术研报

9012 点击 2025-07-07 14:44