Anthropic道歉了，但“安全”这门生意还没停

marsbit发布于2026-06-12更新于2026-06-12

文章摘要

6月11日，Anthropic为Claude Fable 5模型的“智能安全分类器”机制道歉。该机制被发现在用户进行前沿AI研究时，会静默将请求转向能力更弱的Opus 4.8模型。Anthropic解释此举是为防止竞争对手利用其模型加速研发，保护自身优势，并承诺未来此类操作将提前通知。文章指出，问题的核心在于Anthropic将“安全”包装成了一门生意。其安全策略实质是商业竞业防守，旨在维护自身市场领先地位和商业利益。Anthropic通过发布安全研究放大AI风险焦虑，再以“最安全AI公司”人设为其高价产品（如Fable 5）提供溢价理由，最终服务于其近万亿美元估值和IPO计划。与OpenAI主打工具和生态的路径不同，Anthropic的策略是向重视风险管控的政府和巨头客户贩卖“安全”这一不可替代性。然而，此次事件暴露了其“安全”边界的自私性——将对自身商业地位构成潜在威胁的AI研发行为视为“高危”。道歉只是对漏洞的修补，并未改变其将商业逻辑编码进安全规则的底色。当“最安全”人设在开发者社群中产生裂痕，依赖此标签的商业模式也将面临考验。

6月11日,Anthropic道歉了。模型没翻车,道的是"没把握好平衡"——新发的Claude Fable 5搞小动作,一旦识别到你在用Claude搞前沿模型开发,后台就悄悄把请求扔给更弱的Opus 4.8,全程静默。

被抓包后,Anthropic的解释很奇葩:以后降智会通知你。

网友的回怼一针见血:"这套操作,以后改口前打算先打个招呼?"

其实问题的核心根本不是模型是否变了,而是Anthropic所谓的"安全",从头到尾就是一门生意。

算法的立场,永远跟着金钱摇摆的。

竞业防守,冒充安全防御

事情的起因是,Anthropic在Fable 5上线时带了个"智能安全分类器",官方给出的话术是:测出高危请求,自动降级,保护用户。

什么叫高危?Anthropic自己交了底:"防止外国对手利用模型加速研发,保护自身领先优势。"

用户哪里需要你保护,免责协议里的东西就够保护用户了。Anthropic的意思其实是:你用Claude搞AI研究,就是在抢他们饭碗。安全是包装,本质是竞业防守。说白了,都是刀法。

更绝的是,这套防守机制是很隐秘。好在最后Anthropic在道歉声明里说了句大实话:"不可见的安全限制可以更精准地针对特定目标,使我们能够快速发布,且误报率极低。"

AI研究者就是那个被精准设限的对象。

现在被迫改成"可见",纯粹是因为翻车了。他们甚至提前打了预防针:可见之后"不可避免地会产生更多误报"。意思是,普通用户的体验得跟着背锅。

这套规则从未中立,它只保护金主。

造势、变现、收割三部曲

Anthropic这套玩法,比大模型本身算得都精。

6月10日,他们先丢一篇安全研究,训练了一个模型,能在数小时内根据安全补丁反向构建漏洞利用代码。原本黑客得熬上几天甚至几周才能武器化的N-day漏洞,现在被压缩到了小时级。研究本身硬核,但放在Fable 5上线同一天,事情就变味了:一边证明AI很不安全,一边卖"兜底方案"。

“传奇模型”Fable 5定价$10输入/$50输出,比Opus 4.8贵一截,安全分类器成了核心溢价点。资本市场更配合,Anthropic估值9650亿美元,计划10月IPO,高盛、摩根大通联合承销。买的不是模型参数,是"最安全AI公司"的人设。

研究放大焦虑,产品收割溢价,资本变现,三件事顺着利益走,闭环严丝合缝。唯一的问题是,这次闭环漏风了:太急着设限竞争对手,忘了社区里有人能测出来。

OpenAI卖工具,Anthropic卖焦虑

对比OpenAI,路数完全不同。

OpenAI在秘密提交IPO,估值逼近万亿,讲的是"超级应用":ChatGPT周活9亿,打通Visa做生态。逻辑直白:给工具,赚流量。贪婪,但坦荡。

Anthropic不卷规模,卷不可替代性。全行业焦虑安全,它就扮"唯一负责任的大人"。它的金主是政府和巨头,这帮人最怕出事,也最愿意为"不出事"砸钱。

所以Anthropic必须让AI永远处于"危险但可控"的薛定谔状态。太安全,分类器卖不动;太危险,客户吓跑了。最好的解法?把定义"危险"的权力攥在自己手里。

降智事件只是把这套逻辑玩脱了:"危险"的边界被推到了"用Claude做AI研发"。你做的研究有没有害不重要,威胁到我的领先地位就是原罪。

AI哪有什么价值观,不过是把老板的商业算盘写成了代码。

道歉,只是生意的售后

道歉之后呢?从悄悄降智,变成降智前吱一声。

网友看得门儿清:"你真信它以后不会偷偷降输出质量?"

信任这东西,破了就是破了。何况商业底色没变:研究还在放大焦虑,产品还在收割溢价。

《华尔街日报》爆料,OpenAI正在考虑大幅降价,试图从Anthropic手里抢客户。价格战不稀奇,但这个事儿戳破了一个隐藏的真相:隐性降级的是AI研究者,砸的是极客圈的口碑。而B端客户买Anthropic,买的不是参数,是"行业最懂安全"的人设。人设一旦在核心开发者群体里裂开,那些为"安全溢价"签单的政企客户,凭什么继续相信你是"最安全的那个"?

9650亿估值里,到底几分是硬实力,几分是表演成分?

Anthropic的代码很诚实。安全分类器永远在护盘,研究负责放大焦虑,产品负责收割溢价,IPO负责变现。这次道歉,不过是给系统打了个补丁:把"暗中降智"变成了"明着降智"。

安全策略如果真管用,Anthropic就不必年年发论文证明补丁能被捅穿。分类器如果真中立,搞AI研发就不会被列为高危。

答案早写在商业逻辑里了。

安全,是最好的生意。道歉,只是生意的售后。

本文来自微信公众号“AI唱反调”,作者:长青

你可能也喜欢

发布了过去几小时查询最热门的替代币名单！

加密货币数据平台CoinGecko公布了最近三小时内用户查询量最高的加密货币趋势榜单。榜首是Pudgy Penguins（$PENGU），Catecoin（CATE）和Bless（$BLESS）分列第二、三位。价格方面，过去24小时内$PENGU上涨3.9%，排名第二的CATE大幅上涨126.2%，$BLESS上涨86.1%。What IF（IF）同期也上涨41.9%。榜单同时还列出了各加密货币的总市值，其中Hyperliquid（HYPE）市值最高，达114.3亿美元，比特币（BTC）市值为1.27万亿美元，以太坊（ETH）市值为2241.7亿美元。平台强调，此榜单不构成投资建议。

cryptonews.ru26分钟前

cryptonews.ru26分钟前

每月10万美元：Truth Social向投资公司出售特朗普帖文访问权

特朗普媒体与技术集团于2026年8月1日正式推出付费数据服务Truth API。该服务以每月高达10万美元的费用，向机构投资者和高频交易公司提供实时访问Truth Social上最具影响力账户（包括特朗普总统拥有约1300万粉丝的账号）帖文的权限，延迟仅毫秒级。公司称此举是将其核心资产货币化、创造稳定高利润收入来源的战略一部分。此项服务引发了政治争议。民主党参议员沃伦和希夫要求美国证券交易委员会调查其是否违法。共和党参议员卡西迪批评这是以金钱售卖获取总统言论的特权通道。TMTG回应称批评是协调一致的抹黑行动，旨在损害这家上市公司。分析指出，此类高速数据流可能重现类似2013年美联社账号被黑导致市场闪崩的风险，因为交易算法会快于人工验证而做出反应。这引发了对于帖子真实性验证机制缺失及潜在市场操纵或黑客攻击风险的担忧。特朗普目前仍持有TMTG约41%的股份。

cryptonews.ru1小时前

cryptonews.ru1小时前

STRC优先股价格仍低于面值，策略集团股息维持在12%

Strategy公司的优先股STRC在7月份价格持续低于其100美元的面值，但公司宣布8月股息将维持12%不变，不会上调。董事长Michael Saylor通过社交媒体确认了这一消息，并继续将STRC宣传为增加收入的工具。8月将是股息改为半月支付后的第二个月。 STRC股价在7月有所回升，月底收于89.46美元，全月上涨5.42%，但交易量低于日均水平。公司CEO重申，管理层的目标是让STRC股价最终达到99-100美元区间，但未给出具体时间表。尽管公司第二季度因比特币持仓未实现亏损而录得巨额净亏损，但已建立37.5亿美元的现金储备，以支持其BTC货币化计划下的优先股派息。该储备足以支付超过两年的优先股股息和利息义务。公司近期已折价回购了部分STRC优先股，并计划在股价低于面值时继续回购。

cointelegraph2小时前

cointelegraph2小时前

比特币提现仍在继续：Coldcard冷钱包8年存储终成空

硬件钱包Coldcard遭黑客攻击，导致大量资金从易受攻击设备中被持续转出。据Galaxy Research数据，截至2026年8月2日，已有4585个地址被盗，损失总额达1367.05 BTC（约合8860万美元），远超7月30日最初报告的594.5 BTC。大部分被盗资金仍停留在攻击者地址。问题根源并非固件，而是设备生成的种子短语存在漏洞。2021年3月起，因程序员错误集成libNgU库，设备从使用STM32硬件随机数生成器转为使用软件生成器Yasmarang，该生成器由公开可获取的芯片序列号和计时器状态初始化，导致生成的种子短语可在离线状态下被暴力破解。即使固件后续已更新，只要用户未将资金转移至基于新种子短语生成的新地址，旧钱包就始终处于风险中。受影响的设备包括特定固件版本的Mk2/Mk3、Mk4/Mk5及Q系列。仅当种子短语是通过至少50次独立掷骰子或强唯一性BIP-39密码短语创建时方可幸免。官方建议受影响用户立即在已修复的固件上生成新种子短语并转移资产。报道提及一位39岁投资者的案例，他因该漏洞损失了2 BTC（约13万美元）。他多年来通过体力劳动积攒比特币，将其视为在制裁和高通胀国家中的财务保障与提前退休的途径。此次事件使他的长期持有策略和“冷存储”信心遭受重击，他因此决定彻底退出加密货币领域。从历史数据看，随机数生成器缺陷并非首例，类似问题曾导致巨额损失。此次事件警示，即使离线存储也未必绝对安全，其安全性高度依赖于底层硬件和算法的可靠性。

cryptonews.ru2小时前

cryptonews.ru2小时前

韩国15种山寨币交易量呈现爆发式增长！

韩国主要加密货币交易所Upbit和Bithumb上部分山寨币交易量出现显著增长。过去24小时内，最受欢迎的山寨币总交易额达到约3.477亿美元。其中，MetaDAO（META）交易量居首，仅在Upbit上的单日交易额就达6584万美元，占该交易所现货总交易量的12.39%。Euler（EUL）以4765万美元的总交易额位居第二，XRP以3811万美元位列第三，持续受到韩国投资者关注。其他交易量靠前的山寨币包括ThunderCore（TT）、Babylon（BABY）、Geodnet（GEOD）、Hyperlane（HYPER）、Momentum（MMT）、Ondo（ONDO）、柴犬币（SHIB）等。本文提供的信息不构成投资建议。

cryptonews.ru4小时前

交易

现货