为了防中国模型,硅谷三巨头连“复仇者联盟”都整出来了?

marsbit发布于2026-04-22更新于2026-04-22

文章摘要

硅谷AI巨头OpenAI、Anthropic和谷歌罕见组成“前沿模型论坛”,联手打击“对抗性蒸馏行为”,矛头直指中国AI公司。此前,Anthropic指控DeepSeek、月之暗面和MiniMax通过大量调用API(如Claude交互超1600万次)获取模型输出数据,用于训练自家模型,OpenAI也指控DeepSeek“违规复制功能”。 蒸馏技术”指通过模仿顶级模型的输出和逻辑,以较低成本快速提升自身模型性能,但巨头认为此类“对抗性蒸馏侵犯商业利益、存在安全风险(如规避红队测试)”,因此联合反制。然而,中方企业如DeepSeek此前已声明其数据来源合法,未使用合成数据。 此事也引发行业双重标准争议:马斯克和李开复均批评Anthropic等巨头自身也曾涉数据侵权纠纷。目前,蒸馏行为的合法性与边界仍处灰色地带,巨头行动既出于商业竞争,也掺杂政治与安全考量。

前段时间,硅谷 AI 御三家 OpenAI 、 Anthropic 和谷歌十分罕见地,组成了”复仇者联盟“。

根据彭博社的报道,平时恨不得卷死对方的哥仨,现在正通过一个”前沿模型论坛“分享信息,目的很明确,就是要联手揪出那些对抗性蒸馏行为

不明白这个所谓的“对抗性蒸馏行为”是啥,没关系,但世超想说,这一次,明显是冲着国内大模型来的。

如果把时间线往回拉到今年 2 月份,冲突其实就已经摆上了台面。

当时, Anthropic 甩出了一份调查报告,公开点名 DeepSeek、月之暗面和 MiniMax,说这三家公司弄了大概 2.4 万个欺诈账户,跟 Claude 交互超过 1600 万次,然后把套出来的精华数据全拿去训练自家的模型去了。

在这份报告里,每家公司进行蒸馏的规模有多大、行动目标是啥,都写得一清二楚。

就比如阵仗最大的 MiniMax ,一家就发起了超 1300 万次交互,而且跟得很紧, Anthropic 新模型刚发布,他们就重新调整了流量方向。

DeepSeek蒸馏的规模相对小,只有超过 15 万次的交互,但专门盯着思维链下手。

当然,把这些交互行为定义为“对抗性蒸馏”,纯属 Anthropic 的一面之词,因为没法儿证明人家用你的数据去训练模型了。

不过,因为蒸馏破防的还不只 Anthropic 一家。

差不多时间,OpenAI 也跑到美国国会那边告御状,指控 DeepSeek 通过模型蒸馏技术,违规复制了他们的产品功能。

所以世超觉着,这次三家联手可能是要动真格的了。

不过,在聊“反蒸馏”之前,我们可能得先弄清楚,这个让巨头们如坐针毡的“蒸馏”,到底是个啥技术?

其实这玩意儿也没那么玄乎,大家都知道,模型训练费算力、费数据还费时间,而蒸馏的逻辑是,即使你手头的资源有限,只要找到一个名师带带你,同样能在短时间内,训练出一个跟老师有七八成像的学霸。

核心在于学习“软标签”,也就是大模型输出的概率分布。

放在三年前,当时的 API 环境比现在宽松得多,名师不仅给你答案,还会吐出概率分布,方便搞科研。

但后面不知道咋回事儿,模型大厂们都纷纷把门焊死了,像 OpenAI 他们家的 API 就规定只能看到前 5 个概率最高的词。

所以蒸馏的思路就变成了黑盒蒸馏、思维链蒸馏,包括 Anthropic 、 OpenAI 口中的蒸馏攻击,很多说的都是思维、逻辑上的模仿。

这种蒸馏方式,就需要大量地调用API。

具体操作上,你得写个脚本没日没夜地向老师提问,不光要拿到标准答案,还要看老师是怎么回答问题的,中间转了几个弯、避开了哪些坑,然后再把这些名师教案打包回家,反手喂给自家的模型。

用较低的成本,快速复刻顶级模型的能力,这就是蒸馏。

换句话说,硅谷 AI 三巨头是在指责,咱们国内的模型厂商偷师。

但仔细一想,这事儿又处处透着诡异。

因为不管是结盟,还是公开指控,目前看下来都是他们几家巨头在那自说自话。

整个事情看下来让人不得不怀疑,他们口中的“对抗性”蒸馏到底是不是一个伪命题,以及,合法蒸馏和对抗性蒸馏的界限又在哪里?

蒸馏这项技术在圈子里算不上什么行业机密,不过咱们大多数普通人接触到这个词,大概率还是因为去年初 DeepSeek 发布 R1 ,顺带吃瓜吃到的。

当时 R1 模型刚炸场不久,微软和 OpenAI 就针对 DeepSeek 展开了调查,说是怀疑它非法窃取了 OpenAI 的数据来训练模型。

话里话外都在点草,咱家孩子考试成绩突然逆天,是因为抄了他们的答案。

可能因为 R1 正式露面前,有用户在跟 DeepSeek V3 对话的时候,发现了一个很离谱的现象,如果你问它“你是什么模型”,它有时会回答自己是 ChatGPT 。。。所以才引来了不少外界的猜疑。

但这事儿, DeepSeek 后面专门在论文的补充材料里作了解释,说是 DeepSeek-V3-Base 的预训练数据完全来自互联网,没有刻意使用合成数据。

打那之后,蒸馏在业内就一直颇受争议。

理论上,蒸馏是一项合法的技术, 一些模型公司也会自己蒸馏模型给企业客户去做定制。

但“对抗性蒸馏”,也就是用户利用服务或输出开发竞争模型,在 OpenAI 、 Anthropic 等公司的用户使用条款里,是普遍被禁止的。

理由很简单,你开发一个顶级模型,大把大把地往里烧钱、烧卡,如果竞争对手只花了几十万美金调用 API ,就能偷学走七八分,这跟直接从你兜里抢钱没区别。

为了保证自己的领先地位和商业利润,巨头们心里不平衡,想把这道门焊死,也是人之常情。

除此之外,在 Anthropic 的那份调查报告里,也提到了反蒸馏的另外一层考量。

正常情况下,模型在发布之前都要进行红队测试来评估风险,目的就是为了建立一套安全护栏,防止模型教人制造生物武器、编写恶意代码又或者是搞点种族歧视的言论。

问题在于,蒸馏不会蒸这些。

这就导致了非法蒸馏出来的模型,很可能成为一个隐患。

所以世超觉着,这次三巨头跳出来联合抵制,虽然有商业竞争上的私心,但在技术风险上确实也说得通。

但话又说回来, Anthropic 的这份报告把蒸馏抬到了威胁国家安全的角度,在时间点上,又很值得揣摩。

就在报告发出来的前脚,Anthropic正因为开不开后门的事情,跟五角大楼闹得很僵。

所以一个猜测,当时他们选择在 CEO 赶去五角大楼谈判的前一天,发出来这么一份强调国家安全的报告,有没有可能是想争取一点谈判空间?

当然了,后续大家伙儿也都知道,没谈拢。

讽刺的地方在于,这些举着反蒸馏、反抄袭大旗的巨头们,因为大肆在互联网上抓数据,也没少被官司找上门。

一向看热闹不嫌事大的马斯克,在 Anthropic 的调查报告发出来没多久,直接在 X 上嘲讽开大。说 Anthropic 才是那个大规模盗取数据、还为此赔了数十亿美金的惯犯。

包括零一万物CEO李开复也跳出来说,因为作品侵权,Anthropic 还欠他3000美金。

抓别人的作品来训练数据的时候,你管那叫“人类知识共享”,现在轮到别人来学你了,你就管这叫“工业级攻击”了?

说白了,到底算不算偷,怎么才算偷?在大模型领域里还属于一片灰色地带。

别闹到最后,整成全员恶人了。

本文来自微信公众号“差评X.PIN”,作者:西西,编辑:江江&面线

相关问答

Q硅谷AI三巨头OpenAI、Anthropic和谷歌组成的“复仇者联盟”主要目的是什么?

A它们通过“前沿模型论坛”分享信息,联手揪出“对抗性蒸馏行为”,防止竞争对手通过大量API交互获取模型核心数据来训练自家模型。

Q什么是“对抗性蒸馏行为”?

A“对抗性蒸馏行为”指用户利用服务或输出开发竞争模型的行为,具体表现为通过大量调用API(如超过千万次交互)获取顶级模型的思维链、逻辑和概率分布等数据,用于快速低成本训练相似能力的模型,这被巨头视为威胁商业利益和安全的行为。

QAnthropic在报告中点名了哪些中国公司?指控内容是什么?

AAnthropic点名了DeepSeek、月之暗面和MiniMax三家公司,指控它们通过约2.4万个欺诈账户与Claude交互超过1600万次,并将获取的数据用于训练自家模型,其中MiniMax交互超1300万次,DeepSeek则专注于思维链蒸馏。

Q蒸馏技术的核心原理是什么?为什么巨头要限制它?

A蒸馏技术的核心是通过学习大模型输出的“软标签”(概率分布)或思维链,用较低成本和算力快速复刻顶级模型的能力。巨头限制它是因为担心竞争对手仅花费少量API调用成本就能窃取多年投入的研发成果,损害商业利润,并可能绕过安全护栏导致模型风险。

Q文章中提到Anthropic和OpenAI在数据使用上存在什么争议?

AAnthropic和OpenAI被指控在抓取互联网数据训练模型时存在“双标”行为:它们自身因大规模数据抓取面临侵权诉讼(如Anthropic被马斯克嘲讽为“惯犯”,李开复索赔3000美金),却将中国公司的蒸馏行为定义为“工业级攻击”,引发了对灰色地带数据使用标准的质疑。

你可能也喜欢

华为云不打Token价格战,周跃峰要给AI云换一个赢的方式

在2026华为云INSPISE创想者大会上,新任CEO周跃峰首次公开阐述华为云AI战略,明确表示不以Token调用量或收入规模为竞争核心,而是聚焦于“每个Token是否真正提升生产力”。 面对当前国内AI云市场普遍以Token价格战和规模增长为焦点的态势,华为云选择了差异化路径:其一,依托昇腾、鲲鹏等全国产化软硬件构建“第二算力平面”,不参与“万国牌”硬件的规模比拼;其二,将政企及国计民生行业作为主战场,通过混合云与机密计算等技术,在保障数据主权的同时输送公有云迭代能力;其三,坚持开源开放策略,并联合20余家头部模型厂商共建生态。 周跃峰提出,AI竞争焦点正从算力、模型转向智能体(Agent)的实际应用。为此,华为云发布“Agentic Infra”新范式及一系列新品,旨在解决企业部署智能体时的工程难题,如AICS灵衢集群降低时延、AMS解决长程记忆、ModelArts Next实现多模型智能调度以降低成本。 更关键的举措是推出智慧医疗、具身智能等“行业AI梦工厂”专区,深入具体场景。例如,智慧医疗专区与瑞金医院共建大模型,旨在向基层医院规模化输出顶级诊疗能力。华为云试图将竞争从“卖Token”转向“卖生产力”,衡量标准变为金融风控效果、医疗诊断可及性等实际价值。 周跃峰承认,这条依赖国产算力、深耕产业的路比追逐MaaS收入更慢、更难,但避开了当前的价格红海,押注于智能体深入产业后底层基础设施的机遇。华为云的目标是证明其国产算力体系能满足中国产业AI未来的真实需求。

marsbit1小时前

华为云不打Token价格战,周跃峰要给AI云换一个赢的方式

marsbit1小时前

70%民众反对AI,美国人希望美国输掉人工智能战争

这篇文章主要讲述了美国社会目前普遍存在的反AI情绪。一项民调显示,高达70%的美国人认为AI发展“太快”,需要加强监管。这种情绪已经从线上蔓延到线下,具体表现为: 1. **公开抵制**:谷歌前CEO埃里克·施密特在大学毕业典礼上鼓励学生拥抱AI时,遭到台下学生集体嘘声和社交媒体嘲讽。科技公司的AI广告被涂鸦破坏,硅谷等地爆发了多次反AI游行示威。 2. **阻碍基建**:各地居民强烈反对在当地建设AI数据中心,担心其推高水电费、消耗水资源、造成热污染及破坏环境。多个数据中心项目因居民抗议而推迟或取消,甚至有议员因支持项目而遭罢免或住所被枪击。 3. **走向极端**:出现了向OpenAI CEO奥特曼住宅投掷燃烧弹、枪击支持数据中心项目的议员等暴力事件。 民众反对AI的主要原因包括: * **担忧失业**:普遍认为AI会取代大量工作岗位,让财富更集中于科技巨头,而大众承担失业风险。 * **经济负担**:数据中心巨大的能耗和水耗,导致电网升级和水资源成本被分摊到居民账单上,推高生活成本。 * **环境影响**:数据中心运行加剧碳排放,阻碍碳中和目标,其废热排放也抬升局部气温,引发环保团体反对。 * **社会与政治忧虑**:担心AI存在偏见、制造虚假信息,影响公众舆论和选举公正;同时也忧虑当前AI投资热潮可能是泡沫,一旦破裂会引发经济衰退。 这一问题已演变为复杂的政治难题。特朗普上台后废除了拜登时期加强AI监管的行政令,转而推行以“创新与竞争力”为先的政策,以在AI竞赛中保持领先。但这引发了其支持者阵营(MAGA)内部“硅谷派”与“极右翼”的分歧,后者与民主党在限制AI发展上形成了临时同盟,共同反对数据中心建设。特朗普面临着在支持其的科技金主与反对AI的草根票仓之间做出艰难抉择的困境。

marsbit1小时前

70%民众反对AI,美国人希望美国输掉人工智能战争

marsbit1小时前

Agent接管流量分发权,腾讯、字节、阿里在抢什么?

近日,腾讯、阿里、字节三大互联网巨头几乎同时加码AI智能体(Agent)布局,争夺AI时代的入口主导权。核心在于,谁掌握了Agent,谁就掌握了未来的流量分发权。 **阿里**采取“双子星”策略:千问App正演变为超级Agent,深度接入淘宝、支付宝等生态业务,实现从搜索到交易的全流程操作,并已向外部品牌开放接入;夸克则定位为AI旗舰应用,致力于成为“AI超级框”。在B端,阿里推出企业智能体平台“悟空”,探索“一人AI公司”模式。 **字节**凭借“豆包”App已获超3亿月活,并通过“扣子”平台构建开发者生态,支持多智能体协同。其战略是软硬一体,将豆包能力延伸至AI手机、智能眼镜等硬件,旨在让AI入口无处不在。 **腾讯**的杀手锏藏于微信。正在内测的微信AI智能体可通过右滑直接调用数百万小程序完成任务,将微信生态转化为“服务操作系统”。腾讯试图将AI深度融入现有国民应用,而非另造新入口。 三家的竞争折射出商业逻辑的深刻变化:流量分配权正从“用户自主点击”转向“Agent代为决策”。商业模式从争夺用户时长的“注意力经济”,转向以结果和效率为核心的“意图经济”。未来,服务提供者不仅比拼品牌,更需比拼其接入AI生态的能力。 这标志着从PC网页、移动App到AI Agent的又一次入口更迭,新一轮行业洗牌已然开始。

marsbit3小时前

Agent接管流量分发权,腾讯、字节、阿里在抢什么?

marsbit3小时前

交易

现货
合约

热门文章

如何购买S

欢迎来到HTX.com!我们已经让购买Sonic(S)变得简单而便捷。跟随我们的逐步指南,放心开始您的加密货币之旅。第一步:创建您的HTX账户使用您的电子邮件、手机号码注册一个免费账户在HTX上。体验无忧的注册过程并解锁所有平台功能。立即注册第二步:前往买币页面,选择您的支付方式信用卡/借记卡购买:使用您的Visa或Mastercard即时购买Sonic(S)。余额购买:使用您HTX账户余额中的资金进行无缝交易。第三方购买:探索诸如Google Pay或Apple Pay等流行支付方法以增加便利性。C2C购买:在HTX平台上直接与其他用户交易。HTX场外交易台(OTC)购买:为大量交易者提供个性化服务和竞争性汇率。第三步:存储您的Sonic(S)购买完您的Sonic(S)后,将其存储在您的HTX账户钱包中。您也可以通过区块链转账将其发送到其他地方或者用于交易其他加密货币。第四步:交易Sonic(S)在HTX的现货市场轻松交易Sonic(S)。访问您的账户,选择您的交易对,执行您的交易,并实时监控。HTX为初学者和经验丰富的交易者提供了友好的用户体验。

2.5k人学过发布于 2025.01.15更新于 2026.06.02

如何购买S

相关讨论

欢迎来到HTX社区。在这里,您可以了解最新的平台发展动态并获得专业的市场意见。以下是用户对S(S)币价的意见。

活动图片