刚刚,Anthropic深夜大点名,这三家中国公司进行蒸馏攻击?!

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
刚刚,Anthropic深夜大点名,这三家中国公司进行蒸馏攻击?!
8227点击    2026-02-24 09:17

刚刚,


Anthropic 发推称,DeepSeekMoonshot AIMiniMax三家国内的 AI 公司对Claude进行大规模的蒸馏攻击。


OK, A 社你真的很讨厌中国公司了。


刚刚,Anthropic深夜大点名,这三家中国公司进行蒸馏攻击?!


Anthropic 指控推文


简单说就是:这三家公司用大量假账号,疯狂地向 Claude 提问,然后拿 Claude 的回答去训练自己的模型。


而根据 Anthropic 的统计,蒸馏攻击超过 1600 万次对话,大约有 2.4 万个虚假账号。


他们甚至为此写了一篇博文:


https://www.anthropic.com/news/detecting-and-preventing-distillation-attacks0


什么是"蒸馏攻击"?


概念定义与原理解析


OK,其实,我一开始也不知道。


因为我只知道蒸馏和攻击,真的很少见到蒸馏攻击这个说法。


根据 Anthropic 的定义,所说的蒸馏攻击其实就是这几家公司都大规模的在用假账号、代理服务来访问 Claude,试图提取 Claude 的能力,比如推理工具调用写代码等等。


三家公司分别干了啥?


具体操作手法披露


根据 Anthropic 的官方发文来看,


DeepSeek 进行了超过 15 万次对话


DeepSeek 的操作比较"精"。他们主要薅的是 Claude 的三个能力:


  • 推理能力:让 Claude 做各种复杂推理任务
  • 奖励模型数据:让 Claude 当"评委",给答案打分,生成强化学习训练数据
  • 审查规避:让 Claude 生成"政治安全"的替代回答


最骚的一个操作是什么呢?


他们让 Claude "回忆"自己的推理过程,一步一步写出来——这等于直接白嫖了高质量的Chain-of-Thought训练数据。


还有一个细节:Anthropic 说他们发现了一些 prompt,是让 Claude 生成审查安全版本的回答。


比如关于领导人、威权主义的敏感话题,DeepSeek 似乎想用这些数据来训练自己的模型,让它学会避开这类话题。


Anthropic 甚至通过请求元数据,追溯到了 DeepSeek 实验室里的具体研究人员。


月之暗面(Moonshot/Kimi):340 万次对话


月之暗面的胃口更大,主攻 Claude 的四个方向:


  • Agent推理和工具调用
  • 代码和数据分析
  • 计算机使用的能力
  • 计算机视觉


他们用了几百个假账号,走了多条访问路径,让整个行动看起来不像是一个有组织的操作。


但 Anthropic 还是通过请求元数据把他们给认出来了——元数据直接匹配上了月之暗面高管的公开资料。


后期月之暗面还升级了策略,试图直接提取和还原 Claude 的推理轨迹。


MiniMax:1300 万次对话


MiniMax 是三家里规模最大的,1300 万次对话,主要薅 Agent 编程和工具编排能力。


Anthropic 是在 MiniMax 的蒸馏行动还在进行中的时候抓到他们的——甚至是在 MiniMax 还没发布用这些数据训练的新模型之前。


这意味着 Anthropic 完整地看到了整个蒸馏攻击的生命周期:从数据生成到模型发布。


还有一个细节是,当 Anthropic 在 MiniMax 的蒸馏行动期间发布了新模型后,MiniMax 在 24 小时内就调转了近一半的流量,去薅新模型的能力。


他们是怎么绕过限制的?


代理服务与九头蛇集群


大家知道,Anthropic 出于国家安全考虑,不在中国提供 Claude 的商业访问。


那这些公司怎么用上 Claude 的?


答案是:代理服务商。


这些代理商运营着所谓的九头蛇集群架构——一个庞大的假账号网络,把流量分散到 Anthropic 的API和各种第三方云平台上。


一个代理网络同时管理着超过 2 万个假账号,还把蒸馏流量和正常客户的请求混在一起,增加检测难度。


砍掉一个账号?马上冒出一个新的。


为什么 Anthropic 这么紧张?


安全护栏与出口管制


原因有两个:


第一,安全护栏没了。


Anthropic 花了大量精力给 Claude 加上安全限制,防止模型被用来开发生化武器、搞网络攻击之类的。但通过蒸馏出来的模型,这些安全护栏大概率是没有的。


也就是说,危险的能力扩散了,但保护措施被扒光了。


如果这些蒸馏模型再被开源……那后果就更难控制了。


第二,出口管制被架空了。


我觉得这才是最主要的。。


美国搞芯片出口管制,本质上就是想维持 AI 领域的领先优势。但如果中国公司可以通过蒸馏直接抄作业,那出口管制的效果就大打折扣。


更讽刺的是,这些公司通过蒸馏取得的进步,反而被外界解读为"出口管制没用,人家照样能创新"。


但事实是,这些"创新"很大程度上依赖于从美国模型中提取的能力。


Anthropic 打算怎么办?


反制措施与行业协同


Anthropic 列出了几个方向:


  1. 检测系统:建了好几个分类器和行为指纹系统,专门识别 API 流量中的蒸馏模式
  2. 情报共享:和其他 AI 公司、云服务商、相关政府部门共享技术指标
  3. 加强准入:收紧了教育账号、安全研究项目、初创企业等最容易被利用的注册通道
  4. 反制措施:在产品、API 和模型层面开发防护手段,降低蒸馏输出的可用性,同时不影响正常用户体验


但 Anthropic 也承认:靠一家公司解决不了这个问题。


这需要整个行业、云服务商和政策制定者的协同行动。


文章来自于微信公众号 "BubbleBrain",作者 "BubbleBrain"

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

2
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0