Anthropic道歉了,但“安全”这门生意还没停

marsbit发布于2026-06-12更新于2026-06-12

文章摘要

6月11日,Anthropic为Claude Fable 5模型的“智能安全分类器”机制道歉。该机制被发现在用户进行前沿AI研究时,会静默将请求转向能力更弱的Opus 4.8模型。Anthropic解释此举是为防止竞争对手利用其模型加速研发,保护自身优势,并承诺未来此类操作将提前通知。 文章指出,问题的核心在于Anthropic将“安全”包装成了一门生意。其安全策略实质是商业竞业防守,旨在维护自身市场领先地位和商业利益。Anthropic通过发布安全研究放大AI风险焦虑,再以“最安全AI公司”人设为其高价产品(如Fable 5)提供溢价理由,最终服务于其近万亿美元估值和IPO计划。 与OpenAI主打工具和生态的路径不同,Anthropic的策略是向重视风险管控的政府和巨头客户贩卖“安全”这一不可替代性。然而,此次事件暴露了其“安全”边界的自私性——将对自身商业地位构成潜在威胁的AI研发行为视为“高危”。道歉只是对漏洞的修补,并未改变其将商业逻辑编码进安全规则的底色。当“最安全”人设在开发者社群中产生裂痕,依赖此标签的商业模式也将面临考验。

6月11日,Anthropic道歉了。模型没翻车,道的是"没把握好平衡"——新发的Claude Fable 5搞小动作,一旦识别到你在用Claude搞前沿模型开发,后台就悄悄把请求扔给更弱的Opus 4.8,全程静默。

被抓包后,Anthropic的解释很奇葩:以后降智会通知你。

网友的回怼一针见血:"这套操作,以后改口前打算先打个招呼?"

其实问题的核心根本不是模型是否变了,而是Anthropic所谓的"安全",从头到尾就是一门生意。

算法的立场,永远跟着金钱摇摆的

竞业防守,冒充安全防御

事情的起因是,Anthropic在Fable 5上线时带了个"智能安全分类器",官方给出的话术是:测出高危请求,自动降级,保护用户。

什么叫高危?Anthropic自己交了底:"防止外国对手利用模型加速研发,保护自身领先优势。"

用户哪里需要你保护,免责协议里的东西就够保护用户了。Anthropic的意思其实是:你用Claude搞AI研究,就是在抢他们饭碗。安全是包装,本质是竞业防守。说白了,都是刀法。

更绝的是,这套防守机制是很隐秘。好在最后Anthropic在道歉声明里说了句大实话:"不可见的安全限制可以更精准地针对特定目标,使我们能够快速发布,且误报率极低。"

AI研究者就是那个被精准设限的对象。

现在被迫改成"可见",纯粹是因为翻车了。他们甚至提前打了预防针:可见之后"不可避免地会产生更多误报"。意思是,普通用户的体验得跟着背锅。

这套规则从未中立,它只保护金主。

造势、变现、收割三部曲

Anthropic这套玩法,比大模型本身算得都精。

6月10日,他们先丢一篇安全研究,训练了一个模型,能在数小时内根据安全补丁反向构建漏洞利用代码。原本黑客得熬上几天甚至几周才能武器化的N-day漏洞,现在被压缩到了小时级。研究本身硬核,但放在Fable 5上线同一天,事情就变味了:一边证明AI很不安全,一边卖"兜底方案"。

“传奇模型”Fable 5定价$10输入/$50输出,比Opus 4.8贵一截,安全分类器成了核心溢价点。资本市场更配合,Anthropic估值9650亿美元,计划10月IPO,高盛、摩根大通联合承销。买的不是模型参数,是"最安全AI公司"的人设。

研究放大焦虑,产品收割溢价,资本变现,三件事顺着利益走,闭环严丝合缝。唯一的问题是,这次闭环漏风了:太急着设限竞争对手,忘了社区里有人能测出来

OpenAI卖工具,Anthropic卖焦虑

对比OpenAI,路数完全不同。

OpenAI在秘密提交IPO,估值逼近万亿,讲的是"超级应用":ChatGPT周活9亿,打通Visa做生态。逻辑直白:给工具,赚流量。贪婪,但坦荡。

Anthropic不卷规模,卷不可替代性。全行业焦虑安全,它就扮"唯一负责任的大人"。它的金主是政府和巨头,这帮人最怕出事,也最愿意为"不出事"砸钱。

所以Anthropic必须让AI永远处于"危险但可控"的薛定谔状态。太安全,分类器卖不动;太危险,客户吓跑了。最好的解法?把定义"危险"的权力攥在自己手里。

降智事件只是把这套逻辑玩脱了:"危险"的边界被推到了"用Claude做AI研发"。你做的研究有没有害不重要,威胁到我的领先地位就是原罪。

AI哪有什么价值观,不过是把老板的商业算盘写成了代码

道歉,只是生意的售后

道歉之后呢?从悄悄降智,变成降智前吱一声。

网友看得门儿清:"你真信它以后不会偷偷降输出质量?"

信任这东西,破了就是破了。何况商业底色没变:研究还在放大焦虑,产品还在收割溢价。

《华尔街日报》爆料,OpenAI正在考虑大幅降价,试图从Anthropic手里抢客户。价格战不稀奇,但这个事儿戳破了一个隐藏的真相:隐性降级的是AI研究者,砸的是极客圈的口碑。而B端客户买Anthropic,买的不是参数,是"行业最懂安全"的人设。人设一旦在核心开发者群体里裂开,那些为"安全溢价"签单的政企客户,凭什么继续相信你是"最安全的那个"?

9650亿估值里,到底几分是硬实力,几分是表演成分?

Anthropic的代码很诚实。安全分类器永远在护盘,研究负责放大焦虑,产品负责收割溢价,IPO负责变现。这次道歉,不过是给系统打了个补丁:把"暗中降智"变成了"明着降智"。

安全策略如果真管用,Anthropic就不必年年发论文证明补丁能被捅穿。分类器如果真中立,搞AI研发就不会被列为高危。

答案早写在商业逻辑里了。

安全,是最好的生意。道歉,只是生意的售后。

本文来自微信公众号“AI唱反调”,作者:长青

相关问答

QAnthropic的Claude Fable 5模型引发了什么争议?

AAnthropic在Claude Fable 5模型中内置了一个“智能安全分类器”,当检测到用户进行前沿AI模型开发等“高危”请求时,系统会在后台静默地将请求转交给性能更弱的Opus 4.8模型处理,且不会通知用户。这一行为被用户发现后,引发了关于其以“安全”为名、行“竞业防守”之实的争议。

Q根据文章,Anthropic将“安全”作为生意的具体策略是什么?

AAnthropic的商业策略是:通过发布安全研究论文来放大AI风险的公众焦虑;随后推出内置“安全分类器”的昂贵产品(如Fable 5)作为“兜底方案”,以此收取高额溢价;最后凭借“最安全AI公司”的人设吸引政府和巨头客户,为其高估值和IPO铺路,形成研究、产品、资本变现的闭环。

Q文章如何比较OpenAI和Anthropic的商业逻辑?

A文章指出,OpenAI的商业逻辑相对“坦荡”,主打“超级应用”和工具生态(如拥有海量用户的ChatGPT),核心是提供工具并赚取流量和规模收益。而Anthropic则专注于贩卖“安全焦虑”,通过将自己塑造为“唯一负责任”的AI公司,来吸引对风险高度敏感、愿意为“不出事”支付溢价的政府和大型企业客户。

QAnthropic的道歉声明被文章认为改变了什么本质?

A文章认为,Anthropic的道歉声明并未改变其商业本质。其改变仅仅是将原本“静默降智”的处理方式,改为“降智前会通知用户”。这被比喻为“给系统打了个补丁”,把“暗中降智”变成了“明着降智”。其以安全为名保护自身商业利益、针对特定用户群(如AI研究者)设限的核心逻辑并未改变。

Q文章对Anthropic的“安全分类器”提出了哪些根本性质疑?

A文章对“安全分类器”提出了两点根本性质疑:第一,其立场不中立,本质是“竞业防守”工具,旨在保护Anthropic自身的商业领先优势,而非用户安全。第二,其有效性存疑,因为如果安全策略真的管用,Anthropic就不需要年年发布论文证明其安全补丁能被AI反向破解。文章认为,分类器的规则本质上是“老板的商业算盘写成了代码”。

你可能也喜欢

Solayer在Layer 1主网上线保证金交易,整合多资产永续合约交易

Solayer,一个与Solana虚拟机(SVM)兼容的高性能Layer 1区块链,已在主网上推出了跨资产永续交易平台Margin Trade。该平台旨在桥接传统金融与数字资产,提供一个统一的交易环境。 Margin Trade由Solayer Labs开发,并汇集了顶级金融机构和加密交易所资深交易员的经验。其关键特性包括市场包容性,不仅支持主流加密货币,还上链交易黄金、白银、石油等大宗商品,以及追踪美国股市的MT500合成指数。 平台支持跨保证金交易和实时执行。通过保证金统一模式,交易者可以用一个共享的资产池为所有持仓同时提供抵押,提高了资本效率。所有操作,如保证金存入、开仓、清算和提现,均通过链上结算,确保了透明度和用户对资产的非托管控制。 Solayer市场负责人Margie Feng表示,Margin Trade旨在将加密货币、大宗商品和股票整合到单一的链上环境中,满足现代交易对速度、透明度和资本效率的要求。 在发布之际,平台还为首个AI区块链项目Pearl Research($PRL)提供了永续合约交易。未来,Margin Trade计划上线更多资产,并引入独立保证金功能以吸引保守型交易者。 该平台建立在Solayer之上,这是一个高吞吐量、低延迟的Solana原生协议,每秒可处理33万笔交易,确保了近乎即时的订单执行。Margin Trade主网上线是Solayer在Solana生态中构建领先金融基础设施的重要里程碑。凭借其跨保证金架构、多资产类别和Solana级别的性能,该平台有望重新定义机构级的去中心化永续交易。

TheNewsCrypto50分钟前

Solayer在Layer 1主网上线保证金交易,整合多资产永续合约交易

TheNewsCrypto50分钟前

机器人开始“吃数据”:从印度数据工厂到百亿美元人形机器人的隐秘生产链

随着具身智能行业的发展,机器人训练对高质量数据的需求急剧增长,催生了一条隐秘的数据生产链。与依赖互联网文本数据的大语言模型不同,具身模型面临物理世界的“数据荒漠”,人类第一视角视频(Ego Data)等真实世界经验成为关键。 在印度等地,出现了专门采集人类工作视频的“数据工厂”。工人们佩戴头戴摄像头和数据手套,按照严格规范完成整理、抓取等任务,产出结构化视频与动作数据,出售给欧美等地的机器人公司。这类Ego Data成本相对较低,可用于模型预训练,让机器人理解人类如何完成任务。 数据价值呈现“金字塔”结构:底层是低成本互联网视频;上层是带精细动作标注的Ego数据;再往上是仿真合成数据,可大规模生成但存在与现实差距;顶层是最稀缺、昂贵的真机遥操数据,直接指导机器人本体动作。 行业上游已分化为多类玩家:低成本数据工厂、专注动作捕捉与重定向的服务商、提供真机遥操数据的第三方、仿真合成数据公司,以及探索数据标准与流通的平台。机器人公司则采取“分层采购”策略:通用Ego数据倾向外包以快速获取规模;而关乎自身硬件适配的核心真机数据与部署中产生的失败数据,则多由自己掌控以构建壁垒。 当前,行业竞争焦点正从硬件与模型架构,转向高质量数据的持续供给与有效利用。能否建立高效的数据采集、标注、仿真扩增与反馈闭环,将成为影响机器人能力突破的关键。这条从全球劳动力密集区延伸到顶尖机器人公司的数据供应链,正在支撑着百亿美元估值的人形机器人迈向现实应用。

marsbit2小时前

机器人开始“吃数据”:从印度数据工厂到百亿美元人形机器人的隐秘生产链

marsbit2小时前

交易

现货
合约
活动图片