为了防中国模型,硅谷三巨头连“复仇者联盟”都整出来了?

marsbit发布于2026-04-22更新于2026-04-22

文章摘要

硅谷AI巨头OpenAI、Anthropic和谷歌罕见组成“前沿模型论坛”,联手打击“对抗性蒸馏行为”,矛头直指中国AI公司。此前,Anthropic指控DeepSeek、月之暗面和MiniMax通过大量调用API(如Claude交互超1600万次)获取模型输出数据,用于训练自家模型,OpenAI也指控DeepSeek“违规复制功能”。 蒸馏技术”指通过模仿顶级模型的输出和逻辑,以较低成本快速提升自身模型性能,但巨头认为此类“对抗性蒸馏侵犯商业利益、存在安全风险(如规避红队测试)”,因此联合反制。然而,中方企业如DeepSeek此前已声明其数据来源合法,未使用合成数据。 此事也引发行业双重标准争议:马斯克和李开复均批评Anthropic等巨头自身也曾涉数据侵权纠纷。目前,蒸馏行为的合法性与边界仍处灰色地带,巨头行动既出于商业竞争,也掺杂政治与安全考量。

前段时间,硅谷 AI 御三家 OpenAI 、 Anthropic 和谷歌十分罕见地,组成了”复仇者联盟“。

根据彭博社的报道,平时恨不得卷死对方的哥仨,现在正通过一个”前沿模型论坛“分享信息,目的很明确,就是要联手揪出那些对抗性蒸馏行为

不明白这个所谓的“对抗性蒸馏行为”是啥,没关系,但世超想说,这一次,明显是冲着国内大模型来的。

如果把时间线往回拉到今年 2 月份,冲突其实就已经摆上了台面。

当时, Anthropic 甩出了一份调查报告,公开点名 DeepSeek、月之暗面和 MiniMax,说这三家公司弄了大概 2.4 万个欺诈账户,跟 Claude 交互超过 1600 万次,然后把套出来的精华数据全拿去训练自家的模型去了。

在这份报告里,每家公司进行蒸馏的规模有多大、行动目标是啥,都写得一清二楚。

就比如阵仗最大的 MiniMax ,一家就发起了超 1300 万次交互,而且跟得很紧, Anthropic 新模型刚发布,他们就重新调整了流量方向。

DeepSeek蒸馏的规模相对小,只有超过 15 万次的交互,但专门盯着思维链下手。

当然,把这些交互行为定义为“对抗性蒸馏”,纯属 Anthropic 的一面之词,因为没法儿证明人家用你的数据去训练模型了。

不过,因为蒸馏破防的还不只 Anthropic 一家。

差不多时间,OpenAI 也跑到美国国会那边告御状,指控 DeepSeek 通过模型蒸馏技术,违规复制了他们的产品功能。

所以世超觉着,这次三家联手可能是要动真格的了。

不过,在聊“反蒸馏”之前,我们可能得先弄清楚,这个让巨头们如坐针毡的“蒸馏”,到底是个啥技术?

其实这玩意儿也没那么玄乎,大家都知道,模型训练费算力、费数据还费时间,而蒸馏的逻辑是,即使你手头的资源有限,只要找到一个名师带带你,同样能在短时间内,训练出一个跟老师有七八成像的学霸。

核心在于学习“软标签”,也就是大模型输出的概率分布。

放在三年前,当时的 API 环境比现在宽松得多,名师不仅给你答案,还会吐出概率分布,方便搞科研。

但后面不知道咋回事儿,模型大厂们都纷纷把门焊死了,像 OpenAI 他们家的 API 就规定只能看到前 5 个概率最高的词。

所以蒸馏的思路就变成了黑盒蒸馏、思维链蒸馏,包括 Anthropic 、 OpenAI 口中的蒸馏攻击,很多说的都是思维、逻辑上的模仿。

这种蒸馏方式,就需要大量地调用API。

具体操作上,你得写个脚本没日没夜地向老师提问,不光要拿到标准答案,还要看老师是怎么回答问题的,中间转了几个弯、避开了哪些坑,然后再把这些名师教案打包回家,反手喂给自家的模型。

用较低的成本,快速复刻顶级模型的能力,这就是蒸馏。

换句话说,硅谷 AI 三巨头是在指责,咱们国内的模型厂商偷师。

但仔细一想,这事儿又处处透着诡异。

因为不管是结盟,还是公开指控,目前看下来都是他们几家巨头在那自说自话。

整个事情看下来让人不得不怀疑,他们口中的“对抗性”蒸馏到底是不是一个伪命题,以及,合法蒸馏和对抗性蒸馏的界限又在哪里?

蒸馏这项技术在圈子里算不上什么行业机密,不过咱们大多数普通人接触到这个词,大概率还是因为去年初 DeepSeek 发布 R1 ,顺带吃瓜吃到的。

当时 R1 模型刚炸场不久,微软和 OpenAI 就针对 DeepSeek 展开了调查,说是怀疑它非法窃取了 OpenAI 的数据来训练模型。

话里话外都在点草,咱家孩子考试成绩突然逆天,是因为抄了他们的答案。

可能因为 R1 正式露面前,有用户在跟 DeepSeek V3 对话的时候,发现了一个很离谱的现象,如果你问它“你是什么模型”,它有时会回答自己是 ChatGPT 。。。所以才引来了不少外界的猜疑。

但这事儿, DeepSeek 后面专门在论文的补充材料里作了解释,说是 DeepSeek-V3-Base 的预训练数据完全来自互联网,没有刻意使用合成数据。

打那之后,蒸馏在业内就一直颇受争议。

理论上,蒸馏是一项合法的技术, 一些模型公司也会自己蒸馏模型给企业客户去做定制。

但“对抗性蒸馏”,也就是用户利用服务或输出开发竞争模型,在 OpenAI 、 Anthropic 等公司的用户使用条款里,是普遍被禁止的。

理由很简单,你开发一个顶级模型,大把大把地往里烧钱、烧卡,如果竞争对手只花了几十万美金调用 API ,就能偷学走七八分,这跟直接从你兜里抢钱没区别。

为了保证自己的领先地位和商业利润,巨头们心里不平衡,想把这道门焊死,也是人之常情。

除此之外,在 Anthropic 的那份调查报告里,也提到了反蒸馏的另外一层考量。

正常情况下,模型在发布之前都要进行红队测试来评估风险,目的就是为了建立一套安全护栏,防止模型教人制造生物武器、编写恶意代码又或者是搞点种族歧视的言论。

问题在于,蒸馏不会蒸这些。

这就导致了非法蒸馏出来的模型,很可能成为一个隐患。

所以世超觉着,这次三巨头跳出来联合抵制,虽然有商业竞争上的私心,但在技术风险上确实也说得通。

但话又说回来, Anthropic 的这份报告把蒸馏抬到了威胁国家安全的角度,在时间点上,又很值得揣摩。

就在报告发出来的前脚,Anthropic正因为开不开后门的事情,跟五角大楼闹得很僵。

所以一个猜测,当时他们选择在 CEO 赶去五角大楼谈判的前一天,发出来这么一份强调国家安全的报告,有没有可能是想争取一点谈判空间?

当然了,后续大家伙儿也都知道,没谈拢。

讽刺的地方在于,这些举着反蒸馏、反抄袭大旗的巨头们,因为大肆在互联网上抓数据,也没少被官司找上门。

一向看热闹不嫌事大的马斯克,在 Anthropic 的调查报告发出来没多久,直接在 X 上嘲讽开大。说 Anthropic 才是那个大规模盗取数据、还为此赔了数十亿美金的惯犯。

包括零一万物CEO李开复也跳出来说,因为作品侵权,Anthropic 还欠他3000美金。

抓别人的作品来训练数据的时候,你管那叫“人类知识共享”,现在轮到别人来学你了,你就管这叫“工业级攻击”了?

说白了,到底算不算偷,怎么才算偷?在大模型领域里还属于一片灰色地带。

别闹到最后,整成全员恶人了。

本文来自微信公众号“差评X.PIN”,作者:西西,编辑:江江&面线

相关问答

Q硅谷AI三巨头OpenAI、Anthropic和谷歌组成的“复仇者联盟”主要目的是什么?

A它们通过“前沿模型论坛”分享信息,联手揪出“对抗性蒸馏行为”,防止竞争对手通过大量API交互获取模型核心数据来训练自家模型。

Q什么是“对抗性蒸馏行为”?

A“对抗性蒸馏行为”指用户利用服务或输出开发竞争模型的行为,具体表现为通过大量调用API(如超过千万次交互)获取顶级模型的思维链、逻辑和概率分布等数据,用于快速低成本训练相似能力的模型,这被巨头视为威胁商业利益和安全的行为。

QAnthropic在报告中点名了哪些中国公司?指控内容是什么?

AAnthropic点名了DeepSeek、月之暗面和MiniMax三家公司,指控它们通过约2.4万个欺诈账户与Claude交互超过1600万次,并将获取的数据用于训练自家模型,其中MiniMax交互超1300万次,DeepSeek则专注于思维链蒸馏。

Q蒸馏技术的核心原理是什么?为什么巨头要限制它?

A蒸馏技术的核心是通过学习大模型输出的“软标签”(概率分布)或思维链,用较低成本和算力快速复刻顶级模型的能力。巨头限制它是因为担心竞争对手仅花费少量API调用成本就能窃取多年投入的研发成果,损害商业利润,并可能绕过安全护栏导致模型风险。

Q文章中提到Anthropic和OpenAI在数据使用上存在什么争议?

AAnthropic和OpenAI被指控在抓取互联网数据训练模型时存在“双标”行为:它们自身因大规模数据抓取面临侵权诉讼(如Anthropic被马斯克嘲讽为“惯犯”,李开复索赔3000美金),却将中国公司的蒸馏行为定义为“工业级攻击”,引发了对灰色地带数据使用标准的质疑。

你可能也喜欢

交易

现货
合约

热门文章

如何购买S

欢迎来到HTX.com!我们已经让购买Sonic(S)变得简单而便捷。跟随我们的逐步指南,放心开始您的加密货币之旅。第一步:创建您的HTX账户使用您的电子邮件、手机号码注册一个免费账户在HTX上。体验无忧的注册过程并解锁所有平台功能。立即注册第二步:前往买币页面,选择您的支付方式信用卡/借记卡购买:使用您的Visa或Mastercard即时购买Sonic(S)。余额购买:使用您HTX账户余额中的资金进行无缝交易。第三方购买:探索诸如Google Pay或Apple Pay等流行支付方法以增加便利性。C2C购买:在HTX平台上直接与其他用户交易。HTX场外交易台(OTC)购买:为大量交易者提供个性化服务和竞争性汇率。第三步:存储您的Sonic(S)购买完您的Sonic(S)后,将其存储在您的HTX账户钱包中。您也可以通过区块链转账将其发送到其他地方或者用于交易其他加密货币。第四步:交易Sonic(S)在HTX的现货市场轻松交易Sonic(S)。访问您的账户,选择您的交易对,执行您的交易,并实时监控。HTX为初学者和经验丰富的交易者提供了友好的用户体验。

2.0k人学过发布于 2025.01.15更新于 2025.03.21

如何购买S

相关讨论

欢迎来到HTX社区。在这里,您可以了解最新的平台发展动态并获得专业的市场意见。以下是用户对S(S)币价的意见。

活动图片