为了防中国模型，硅谷三巨头连“复仇者联盟”都整出来了？

marsbit发布于2026-04-22更新于2026-04-22

文章摘要

硅谷AI巨头OpenAI、Anthropic和谷歌罕见组成“前沿模型论坛”，联手打击“对抗性蒸馏行为”，矛头直指中国AI公司。此前，Anthropic指控DeepSeek、月之暗面和MiniMax通过大量调用API（如Claude交互超1600万次）获取模型输出数据，用于训练自家模型，OpenAI也指控DeepSeek“违规复制功能”。蒸馏技术”指通过模仿顶级模型的输出和逻辑，以较低成本快速提升自身模型性能，但巨头认为此类“对抗性蒸馏侵犯商业利益、存在安全风险（如规避红队测试）”，因此联合反制。然而，中方企业如DeepSeek此前已声明其数据来源合法，未使用合成数据。此事也引发行业双重标准争议：马斯克和李开复均批评Anthropic等巨头自身也曾涉数据侵权纠纷。目前，蒸馏行为的合法性与边界仍处灰色地带，巨头行动既出于商业竞争，也掺杂政治与安全考量。

前段时间,硅谷 AI 御三家 OpenAI 、 Anthropic 和谷歌十分罕见地,组成了”复仇者联盟“。

根据彭博社的报道,平时恨不得卷死对方的哥仨,现在正通过一个”前沿模型论坛“分享信息,目的很明确,就是要联手揪出那些对抗性蒸馏行为。

不明白这个所谓的“对抗性蒸馏行为”是啥,没关系,但世超想说,这一次,明显是冲着国内大模型来的。

如果把时间线往回拉到今年 2 月份,冲突其实就已经摆上了台面。

当时, Anthropic 甩出了一份调查报告,公开点名 DeepSeek、月之暗面和 MiniMax,说这三家公司弄了大概 2.4 万个欺诈账户,跟 Claude 交互超过 1600 万次,然后把套出来的精华数据全拿去训练自家的模型去了。

在这份报告里,每家公司进行蒸馏的规模有多大、行动目标是啥,都写得一清二楚。

就比如阵仗最大的 MiniMax ,一家就发起了超 1300 万次交互,而且跟得很紧, Anthropic 新模型刚发布,他们就重新调整了流量方向。

DeepSeek蒸馏的规模相对小,只有超过 15 万次的交互,但专门盯着思维链下手。

当然,把这些交互行为定义为“对抗性蒸馏”,纯属 Anthropic 的一面之词,因为没法儿证明人家用你的数据去训练模型了。

不过,因为蒸馏破防的还不只 Anthropic 一家。

差不多时间,OpenAI 也跑到美国国会那边告御状,指控 DeepSeek 通过模型蒸馏技术,违规复制了他们的产品功能。

所以世超觉着,这次三家联手可能是要动真格的了。

不过,在聊“反蒸馏”之前,我们可能得先弄清楚,这个让巨头们如坐针毡的“蒸馏”,到底是个啥技术?

其实这玩意儿也没那么玄乎,大家都知道,模型训练费算力、费数据还费时间,而蒸馏的逻辑是,即使你手头的资源有限,只要找到一个名师带带你,同样能在短时间内,训练出一个跟老师有七八成像的学霸。

核心在于学习“软标签”,也就是大模型输出的概率分布。

放在三年前,当时的 API 环境比现在宽松得多,名师不仅给你答案,还会吐出概率分布,方便搞科研。

但后面不知道咋回事儿,模型大厂们都纷纷把门焊死了,像 OpenAI 他们家的 API 就规定只能看到前 5 个概率最高的词。

所以蒸馏的思路就变成了黑盒蒸馏、思维链蒸馏,包括 Anthropic 、 OpenAI 口中的蒸馏攻击,很多说的都是思维、逻辑上的模仿。

这种蒸馏方式,就需要大量地调用API。

具体操作上,你得写个脚本没日没夜地向老师提问,不光要拿到标准答案,还要看老师是怎么回答问题的,中间转了几个弯、避开了哪些坑,然后再把这些名师教案打包回家,反手喂给自家的模型。

用较低的成本,快速复刻顶级模型的能力,这就是蒸馏。

换句话说,硅谷 AI 三巨头是在指责,咱们国内的模型厂商偷师。

但仔细一想,这事儿又处处透着诡异。

因为不管是结盟,还是公开指控,目前看下来都是他们几家巨头在那自说自话。

整个事情看下来让人不得不怀疑,他们口中的“对抗性”蒸馏到底是不是一个伪命题,以及,合法蒸馏和对抗性蒸馏的界限又在哪里?

蒸馏这项技术在圈子里算不上什么行业机密,不过咱们大多数普通人接触到这个词,大概率还是因为去年初 DeepSeek 发布 R1 ,顺带吃瓜吃到的。

当时 R1 模型刚炸场不久,微软和 OpenAI 就针对 DeepSeek 展开了调查,说是怀疑它非法窃取了 OpenAI 的数据来训练模型。

话里话外都在点草,咱家孩子考试成绩突然逆天,是因为抄了他们的答案。

可能因为 R1 正式露面前,有用户在跟 DeepSeek V3 对话的时候,发现了一个很离谱的现象,如果你问它“你是什么模型”,它有时会回答自己是 ChatGPT 。。。所以才引来了不少外界的猜疑。

但这事儿, DeepSeek 后面专门在论文的补充材料里作了解释,说是 DeepSeek-V3-Base 的预训练数据完全来自互联网,没有刻意使用合成数据。

打那之后,蒸馏在业内就一直颇受争议。

理论上,蒸馏是一项合法的技术, 一些模型公司也会自己蒸馏模型给企业客户去做定制。

但“对抗性蒸馏”,也就是用户利用服务或输出开发竞争模型,在 OpenAI 、 Anthropic 等公司的用户使用条款里,是普遍被禁止的。

理由很简单,你开发一个顶级模型,大把大把地往里烧钱、烧卡,如果竞争对手只花了几十万美金调用 API ,就能偷学走七八分,这跟直接从你兜里抢钱没区别。

为了保证自己的领先地位和商业利润,巨头们心里不平衡,想把这道门焊死,也是人之常情。

除此之外,在 Anthropic 的那份调查报告里,也提到了反蒸馏的另外一层考量。

正常情况下,模型在发布之前都要进行红队测试来评估风险,目的就是为了建立一套安全护栏,防止模型教人制造生物武器、编写恶意代码又或者是搞点种族歧视的言论。

问题在于,蒸馏不会蒸这些。

这就导致了非法蒸馏出来的模型,很可能成为一个隐患。

所以世超觉着,这次三巨头跳出来联合抵制,虽然有商业竞争上的私心,但在技术风险上确实也说得通。

但话又说回来, Anthropic 的这份报告把蒸馏抬到了威胁国家安全的角度,在时间点上,又很值得揣摩。

就在报告发出来的前脚,Anthropic正因为开不开后门的事情,跟五角大楼闹得很僵。

所以一个猜测,当时他们选择在 CEO 赶去五角大楼谈判的前一天,发出来这么一份强调国家安全的报告,有没有可能是想争取一点谈判空间?

当然了,后续大家伙儿也都知道,没谈拢。

讽刺的地方在于,这些举着反蒸馏、反抄袭大旗的巨头们,因为大肆在互联网上抓数据,也没少被官司找上门。

一向看热闹不嫌事大的马斯克,在 Anthropic 的调查报告发出来没多久,直接在 X 上嘲讽开大。说 Anthropic 才是那个大规模盗取数据、还为此赔了数十亿美金的惯犯。

包括零一万物CEO李开复也跳出来说,因为作品侵权,Anthropic 还欠他3000美金。

抓别人的作品来训练数据的时候,你管那叫“人类知识共享”,现在轮到别人来学你了,你就管这叫“工业级攻击”了?

说白了,到底算不算偷,怎么才算偷?在大模型领域里还属于一片灰色地带。

别闹到最后,整成全员恶人了。

本文来自微信公众号“差评X.PIN”,作者:西西,编辑:江江&面线

你可能也喜欢

STRC优先股价格仍低于面值，策略集团股息维持在12%

Strategy公司的优先股STRC在7月份价格持续低于其100美元的面值，但公司宣布8月股息将维持12%不变，不会上调。董事长Michael Saylor通过社交媒体确认了这一消息，并继续将STRC宣传为增加收入的工具。8月将是股息改为半月支付后的第二个月。 STRC股价在7月有所回升，月底收于89.46美元，全月上涨5.42%，但交易量低于日均水平。公司CEO重申，管理层的目标是让STRC股价最终达到99-100美元区间，但未给出具体时间表。尽管公司第二季度因比特币持仓未实现亏损而录得巨额净亏损，但已建立37.5亿美元的现金储备，以支持其BTC货币化计划下的优先股派息。该储备足以支付超过两年的优先股股息和利息义务。公司近期已折价回购了部分STRC优先股，并计划在股价低于面值时继续回购。

cointelegraph4分钟前

cointelegraph4分钟前

比特币提现仍在继续：Coldcard冷钱包8年存储终成空

硬件钱包Coldcard遭黑客攻击，导致大量资金从易受攻击设备中被持续转出。据Galaxy Research数据，截至2026年8月2日，已有4585个地址被盗，损失总额达1367.05 BTC（约合8860万美元），远超7月30日最初报告的594.5 BTC。大部分被盗资金仍停留在攻击者地址。问题根源并非固件，而是设备生成的种子短语存在漏洞。2021年3月起，因程序员错误集成libNgU库，设备从使用STM32硬件随机数生成器转为使用软件生成器Yasmarang，该生成器由公开可获取的芯片序列号和计时器状态初始化，导致生成的种子短语可在离线状态下被暴力破解。即使固件后续已更新，只要用户未将资金转移至基于新种子短语生成的新地址，旧钱包就始终处于风险中。受影响的设备包括特定固件版本的Mk2/Mk3、Mk4/Mk5及Q系列。仅当种子短语是通过至少50次独立掷骰子或强唯一性BIP-39密码短语创建时方可幸免。官方建议受影响用户立即在已修复的固件上生成新种子短语并转移资产。报道提及一位39岁投资者的案例，他因该漏洞损失了2 BTC（约13万美元）。他多年来通过体力劳动积攒比特币，将其视为在制裁和高通胀国家中的财务保障与提前退休的途径。此次事件使他的长期持有策略和“冷存储”信心遭受重击，他因此决定彻底退出加密货币领域。从历史数据看，随机数生成器缺陷并非首例，类似问题曾导致巨额损失。此次事件警示，即使离线存储也未必绝对安全，其安全性高度依赖于底层硬件和算法的可靠性。

cryptonews.ru9分钟前

cryptonews.ru9分钟前

韩国15种山寨币交易量呈现爆发式增长！

韩国主要加密货币交易所Upbit和Bithumb上部分山寨币交易量出现显著增长。过去24小时内，最受欢迎的山寨币总交易额达到约3.477亿美元。其中，MetaDAO（META）交易量居首，仅在Upbit上的单日交易额就达6584万美元，占该交易所现货总交易量的12.39%。Euler（EUL）以4765万美元的总交易额位居第二，XRP以3811万美元位列第三，持续受到韩国投资者关注。其他交易量靠前的山寨币包括ThunderCore（TT）、Babylon（BABY）、Geodnet（GEOD）、Hyperlane（HYPER）、Momentum（MMT）、Ondo（ONDO）、柴犬币（SHIB）等。本文提供的信息不构成投资建议。

cryptonews.ru1小时前

cryptonews.ru1小时前

唐纳德·特朗普的公司再度出售大批比特币！

据报道，与美国总统唐纳德·特朗普的媒体公司Trump Media & Technology Group相关的地址，疑似向加密货币交易所CryptoCom转移了约2628枚比特币，价值约1.65亿美元。此前有分析称，该公司总计购买了11542枚比特币，平均成本为每枚11.85万美元。据称，2026年至今，相关地址已转出约7281枚比特币，目前仍持有约4261枚。 Trump Media在比特币投资上的已实现和未实现损失总额估计约为5.55亿美元。不过，将比特币转移至交易所并不一定意味着出售资产，也可能是为了托管、流动性管理或其他财务操作。目前尚无法确定其具体意图，但从冷钱包向中心化交易所转移通常被视为潜在的出售行为。 *本文不构成投资建议。

cryptonews.ru3小时前

cryptonews.ru3小时前

帕克·刘易斯解释为何比特币仍是最佳货币

知名比特币分析师帕克·刘易斯在访谈中批评了某些上市公司以“数字信贷”形式销售永续优先股的营销策略，认为这从根本上扭曲了比特币的本质。他指出，比特币在算法层面不具备法币收益性，承诺定期分红主要依赖牛市吸引新投资者来维持，风险极高。刘易斯引用数据说明此类衍生品的巨大风险：全球信贷市场规模达300万亿美元，而永续优先股市场仅约1万亿美元，这表明机构有意规避这种无还款期限的资产，将风险转嫁给信息不足的散户。针对“比特币波动性太大”的常见观点，他认为波动性是这一供应量严格受限的新资产被大规模采用过程中的自然数学结果。新人入场需出更高价从早期持有者手中购买，导致价格剧烈波动。他建议投资者直接持有比特币，这比投资MicroStrategy等公司发行的衍生品更安全。投资者将焦点从直接持有加密货币转向公司衍生品，会忽视法币急速贬值的真正威胁。刘易斯以自创的“肋眼牛排指数”为例，指出其本地超市一款牛排价格从2020年的19.99美元涨至37.99美元，反映年化约12-13%的真实通胀，远超官方平滑后的CPI数据。在全球通胀环境下，最明智、保守且安全的策略仍是直接持有比特币并完全掌控私钥。追逐加密货币国库股等公司工具的收益只会叠加隐性系统风险，而理解去中心化货币的本质才能有效保护财富免受宏观经济动荡影响。

cryptonews.ru3小时前