突发!Deepseek最新模型被外网爆出恶性Bug??

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
突发!Deepseek最新模型被外网爆出恶性Bug??
8044点击    2025-08-26 10:14

一早起来,看到群里炸了锅!


主角是我们备受期待的 DeepSeek V3.1 模型。


有用户反馈,该模型在生成文本时,会毫无征兆地随机插入“极”这个汉字(繁体简体都会)


突发!Deepseek最新模型被外网爆出恶性Bug??


根据相关讨论帖,有人去做了复现:


这个“极”字 bug 最初是在火山引擎、chutes 等第三方 API 平台上被发现的。


突发!Deepseek最新模型被外网爆出恶性Bug??


当开发者们像往常一样调用模型进行代码生成、数据处理等任务时,冷不丁地就会在输出结果中看到一个「极」字,导致代码编译失败、JSON 格式错乱,让人哭笑不得。


起初,大家普遍猜测这可能是第三方服务商在模型量化、部署配置或硬件上的差异导致的。


然而,经过热心网友们的进一步测试,发现 DeepSeek 的官方 Playground 也同样无法幸免,只是出现问题的概率相对较低。


问题根源猜想:


有技术大神深入分析后发现,这个「极」字在模型中的 token ID 是 2577,而我们常用的省略号(...)的 token ID 是 2576,两者紧密相邻。


突发!Deepseek最新模型被外网爆出恶性Bug??


大家猜测问题根源可能有两个:


1. 数据集“污染” :


可能是在数据清洗阶段,有些包含特殊或错误字符的数据没有被彻底过滤。


2.模型“偷懒” :


模型在训练时可能找到了某种“捷径”,在某些情况下会错误地选择相邻的 token。


更令人头疼的是,一旦这个 bug 被触发,模型在后续的对话中似乎会“上瘾”,「极」字的出现频率会显著增加,严重影响了模型的可用性。


影响范围:


目前来看,这个 bug 对于需要高精度、结构化输出的场景是致命的,比如:


代码生成 :随机插入的汉字会让代码无法通过编译。


API 调用 :破坏 JSON 或其他结构化数据的格式。


学术写作 :影响文章的严谨性和专业性。


写在最后:


这个 bug 的出现,无疑给 DeepSeek V3.1 的使用者们带来了不小的困扰。


希望 DeepSeek 官方能够尽快注意到这个问题,并发布紧急修复。


PS:图4️⃣是外国贴吧里的讨论帖,目前无法确认是不是同一批人的反馈。


突发!Deepseek最新模型被外网爆出恶性Bug??


文章来自微信公众号 “ 01Founder ”

AITNT-国内领先的一站式人工智能新闻资讯网站