美Anthropic指控-深度求索(DeepSeek)、月之暗面(Moonshot AI)和稀宇科技(MiniMax)——对Claude模型进行大规模“模型蒸馏”

[复制链接]
发表于 2026-2-24 17:11:50 | 显示全部楼层 |阅读模式
根据多家媒体报道,美国人工智能公司Anthropic在2026年2月23日发布博客文章,指控三家中国人工智能企业——深度求索(DeepSeek)、月之暗面(Moonshot AI)和稀宇科技(MiniMax)——对其Claude模型进行了大规模的所谓“模型蒸馏”,以增强自身AI能力。

以下是该事件的详细情况梳理:

### Anthropic的核心指控

Anthropic称,这三家中国公司涉嫌违反其服务条款及地域访问限制,通过搭建大规模虚假账号网络,对Claude模型实施了有组织的、大规模的数据提取。

| **被指控企业** | **指控的交互量** | **指控重点提取的能力** |
| :--- | :--- | :--- |
| **深度求索 (DeepSeek)** | 约15万次 | 多任务推理能力、“思维链”(chain-of-thought)数据、为政策敏感问题生成替代答案。 |
| **月之暗面 (Moonshot AI)** | 超340万次 | 智能体推理、工具调用、复杂代码编写与数据分析能力。 |
| **稀宇科技 (MiniMax)** | 超1300万次 | 智能体编码、工具使用与任务编排能力。Anthropic特别指出,在其发布新版模型后的24小时内,MiniMax就将近一半的流量转向新系统,以捕获最新功能。 |

**“工业化规模”的操作手法**:
Anthropic威胁情报主管称,这些企业建立了约**2.4万个虚假账户**,通过代理服务绕开封锁,与Claude模型累计发起超过**1600万次交互**。他们采用了被称为 **“九头蛇集群”(hydra cluster)的分布式架构**,将恶意流量与正常请求混合以规避检测,显示出高度的组织性。

### 什么是“模型蒸馏”?

- **技术定义**:“模型蒸馏”本身是一项合法的AI技术,通常指利用一个性能强大的“教师模型”来指导一个更小、更高效的“学生模型”学习,从而在降低计算成本的同时,尽可能保留核心能力。
- **指控的滥用行为**:Anthropic认为,这些中国公司将该技术用于不正当竞争,即通过大规模提取Claude模型的输出结果来训练自己的模型,旨在以极低的成本快速缩短与领先AI模型的差距。

### 行业反响与争议

- **美方担忧**:Anthropic的指控加剧了美国AI行业对“蒸馏攻击”的担忧,认为这可能威胁到美国的技术领先地位和**。该公司在报告中警告,通过非法蒸馏获得的模型可能缺乏原模型的安全防护机制。Anthropic也借此事件重申对高端AI芯片出口管制的支持。此前,OpenAI也已向美国议员发出过类似警告。
- **企业回应**:截至报道发布,深度求索、月之暗面和稀宇科技均未对Anthropic的指控作出公开回应。
- **舆论质疑与“双重标准”讨论**:该指控在科技界引发了广泛讨论,特别是关于“双重标准”的质疑。
    - **马斯克的评论**:xAI创始人埃隆·马斯克在社交媒体上发文嘲讽Anthropic:“他们(中国企业)怎么敢偷Anthropic从人类程序员那里偷来的东西?”。他指的是Anthropic自身也曾因使用受版权保护的书籍和软件开发者数据训练模型而卷入法律纠纷并支付了巨额和解金。
    - **技术边界模糊**:有观点认为,在高质量训练数据日益稀缺的背景下,合成数据与蒸馏技术的边界本就模糊。批评者指出,Anthropic的做法有“自己蒸馏就是合法,别人蒸馏就是非法”之嫌。
    - **指控**化**:也有分析认为,Anthropic将商业竞争问题拔高到**层面,并刻意与芯片出口管制挂钩,是为遏制竞争对手寻找借口,可能加剧全球AI领域的割裂。



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

登录后关闭弹窗

登录参与点评抽奖  加入IT实名职场社区
去登录
快速回复 返回顶部 返回列表