AI资讯新闻榜单内容搜索-tokens

ChatGPT到底学了多少「污言秽语」？清华团队首提大语言模型中文语料污染治理技术

如果我们的教科书里包含大量的污言秽语，那么我们能学好语言吗？这种荒唐的问题却出现在最先进 ChatGPT 系列模型的学习过程中。

来自主题: AI技术研报

8804 点击 2025-08-26 12:11

大模型价格战逆转？深扒17家厂商最新定价，竟有超7成在涨价

DeepSeek涨价了。智东西8月23日报道，8月21日，DeepSeek在其公众号官宣了DeepSeek-V3.1的正式发布，还宣布自9月6日起，DeepSeek将执行新价格表，取消了今年2月底推出的夜间优惠，推理与非推理API统一定价，输出价格调整至12元/百万tokens。这一决定，让使用DeepSeek API的最低价格较过去上升了50%。

来自主题: AI资讯

10739 点击 2025-08-25 12:29

GPT-5系统提示词被曝，足足15000 tokens！

疑似GPT-5的系统提示词，在GitHub上被曝光了！我们把这份系统提示词里的关键指令梳理成了一个「用户可见效果 ↔ 内部要求」对照表，大家可以对比看一下

来自主题: AI资讯

18011 点击 2025-08-25 09:26

开源扩散大模型首次跑赢自回归！上交大联手UCSD推出D2F，吞吐量达LLaMA3的2.5倍

在大语言模型（LLMs）领域，自回归（AR）范式长期占据主导地位，但其逐 token 生成也带来了固有的推理效率瓶颈。此前，谷歌的 Gemini Diffusion 和字节的 Seed Diffusion 以每秒千余 Tokens 的惊人吞吐量，向业界展现了扩散大语言模型（dLLMs）在推理速度上的巨大潜力。

来自主题: AI技术研报

8783 点击 2025-08-18 17:20

字节Seed发布扩散语言模型，推理速度达2146 tokens/s，比同规模自回归快5.4倍

用扩散模型写代码，不仅像开了倍速，改起来还特别灵活！字节Seed最新发布扩散语言模型Seed Diffusion Preview，这款模型主要聚焦于代码生成领域，它的特别之处在于采用了离散状态扩散技术，在推理速度上表现出色。

来自主题: AI资讯

8167 点击 2025-08-01 16:04

国产GPU跑满血DeepSeek，已经可以100 tokens/s了！

放眼当下，到底哪个芯片跑满血DeepSeek是最快的？答案很意外——不是你以为的英伟达，而是一家国产GPU。因为现在它的速度，已经直接来到了100 tokens/s！

来自主题: AI资讯

7838 点击 2025-07-27 14:04

「Tokens是胡扯」，Mamba作者抛出颠覆性观点，揭露Transformer深层缺陷

「Tokenization（分词）是 Transformer 模型为弥补自身缺陷不得不戴上的枷锁。」

来自主题: AI技术研报

7360 点击 2025-07-10 13:16

重塑AI记忆边界：MemOS开源！时序推理较OpenAI提升159%

大模型记忆管理和优化框架是当前各大厂商争相优化的热点方向，MemOS 相比现有 OpenAI 的全局记忆在大模型记忆评测集上呈现出显著的提升，平均准确性提升超过 38.97%，Tokens 的开销进一步降低 60.95%，一举登顶记忆管理的 SOTA 框架，特别是在考验框架时序建模与检索能力的时序推理任务上，提升比例更是达到了 159%，相当震撼！

来自主题: AI技术研报

10059 点击 2025-07-07 14:44

DeepSeek用户慎入！体验完这款百万Tokens新"源神"，我怕你回不去了【附5个神仙用法】

最近，我的AI交流群和别的一些AI群都炸锅了，话题的焦点是MiniMax-M1

来自主题: AI产品测评

12084 点击 2025-06-18 11:27

想知道你的LLM API被过度收费了吗？隐藏的Tokens终于可以被审计了

近年来，大型语言模型（LLM）在处理复杂任务方面取得了显著进展，尤其体现在多步推理、工具调用以及多智能体协作等高级应用中。这些能力的提升，往往依赖于模型内部一系列复杂的「思考」过程或 Agentic System 中的 Agent 间频繁信息交互。

来自主题: AI技术研报

8932 点击 2025-06-18 11:05