Anthropic 发了“最强模型”，但大多数人用不上

marsbit發佈於 2026-06-10更新於 2026-06-10

文章摘要

Anthropic于6月发布了号称“最强”的Fable 5和Mythos 5模型。它们在软件工程、长任务执行等多项基准测试中得分领先。但此次发布的核心策略是“分级开放”：两个模型共享同一底层，Mythos 5因具有强大的网络安全漏洞挖掘能力，仅限少数安全伙伴使用；面向普通用户的Fable 5则在检测到网络安全、生物化学等敏感请求时，会自动降级至旧版模型响应，以确保安全。模型能力提升显著，尤其在代码生成的质量和工程实用性上突破明显。然而，其自动降级机制在实际使用中可能因界限保守而影响体验。同时，Anthropic调整了商业模式，Fable 5不仅API定价翻倍（输入10美元/百万Token），并将从6月23日起移出订阅套餐，需用户额外按量付费。这被视为在IPO前筛选高价值用户、强化定价权的举措。与此相对，国产模型正大幅降价以争夺市场。行业呈现出分化趋势：通用模型价格日趋平民化，而顶尖的前沿模型因供给紧张和针对高需求场景（如专业编程），其溢价可能长期存在。这意味着最强的AI能力，正变得越来越并非人人可用且用得起的服务。

4月,Anthropic推出Mythos模型预览版。这个模型没有面向公众开放,因为在测试中它展现出极强的网络安全与漏洞挖掘能力,能自主发现数千个高危零日漏洞,一旦流出,容易被用于恶意攻击。

为了把这种能力锁定在防御场景内,Anthropic推出了玻璃翼计划(Project Glasswing),仅向苹果、谷歌、微软等12家核心安全伙伴及40余家关键基础设施提供商开放访问权限,并全程受控使用。

先锁起来再发布,这套操作本身就制造了话题。

两个月后,北京时间6月10日凌晨,Anthropic正式推出Fable 5和Mythos 5。

从跑分来看,它们几乎在所有基准测试中拿到了最高分,尤其在软件工程和长任务执行上,与其他模型拉开了明显差距。

但围绕这个模型的讨论,很快就不止于它有多强。

Fable 5和Mythos 5实际上共享同一个底层模型。区别在于,Fable 5面向普通用户,Mythos 5则继续锁在受信任的安全合作伙伴手中。同一个模型,两套规则,面向两个群体,这在Anthropic的产品线里是第一次。

而且,普通用户拿到的也并非完整版本。Anthropic在Fable 5外层加了一道安全分类器,一旦请求触及网络安全、生物化学、模型蒸馏等敏感方向,系统会自动切换到能力更弱的上代模型Opus 4.8响应。

定价同样值得注意,输入10美元、输出50美元/百万Token,官方称约为Opus 4.8的两倍。6月23日起,Fable 5还将从Pro、Max等订阅计划中移出,用户想继续使用,需要额外消耗credits。

这套组合拳拆开来看很合理。能力太强所以做安全限制,成本更高所以提价,风险敏感所以分级发布。但放到一起,释放的信号就变得微妙了。这和过去几年大模型公司拼速度、拼开放的竞争逻辑不同,各家都在想办法让自家模型触达更多用户,而Anthropic选择主动收窄入口,把限制变成了产品策略的一部分。

那么,这个号称前所未有的“最强模型”,是被神化了吗?

01.能力提升明显,自动降级成争议

分级归分级,先看实力到底如何。

软件工程是Anthropic这次更新的核心亮点。在SWE-Bench Pro测试中,Fable 5拿到80.3%的成绩。这个测试主要是看模型能不能在真实的GitHub仓库里定位bug、理解上下文、写出能用的修复代码,80.3%意味着每5个真实工程问题,Fable 5能解决4个。

在Terminal-Bench 2.1榜单上,Fable 5得分88.0%,超过了Open AI的Codex CLI。值得注意的是,Fable 5是通用模型,Codex CLI是专为编程场景打造的垂直工具,二者的差距更能体现其编程实力。

但真正能看出差距的是FrontierCode Diamond,这项测试考察模型的产出的代码能不能达到生产级代码库的质量标准。Fable 5拿到29.3%,Opus 4.8只有13.4%,GPT-5.5只有5.7%。三个数据均来自Anthropic官方公布,GPT-5.5的数据为其内部测试结果。

过去几年,AI模型写代码的能力一直在进步,但长期卡在一个瓶颈上:代码能跑,但不好维护;能够通过基准测试,但落地真实项目中仍会问题频发。

Fable 5在这个维度上的突破,说明Anthropic这次升级的不只是解题能力,而是把模型往真正的工程交付方向推进。

程序员李夏告诉「AIX财经」,AI生成代码很容易出现上下文不连贯的问题,初期能精准理解需求,长时间任务中容易遗忘信息,后期维护成本很高。

在他看来,Fable 5在长任务里的逻辑连贯性有明显进步,同类编码任务可一次性完成,准确率更高。不过,Fable 5相比Opus4.8生成速度较慢,思考链更长,整体响应速度有所下降。

视觉能力也有提升。Anthropic称,Fable 5能从复杂科学图表中提取精确数字,也能根据网页截图直接重建应用源码。官方还演示了实操案例,Fable 5只靠游戏画面截图就通关《宝可梦火红》,不需要搭配辅助工具。前代模型做类似任务时,还需要配备复杂的辅助系统。

长上下文和记忆方面,官方给出的说法是,任务越长越复杂,Fable 5的优势越明显。

此外,生命科学是另一个被重点提及的方向。Anthropic透露基于Mythos 5搭建的单细胞数据分析模型,覆盖138个物种,性能优于《Science》近期刊发的同类型模型,参数量却仅为后者的百分之一。

单从跑分成绩来看,综合能力确实上了一个台阶。

再来看看跑分之外。

Fable 5搭载了一套安全分类器,只要用户请求涉及网络安全、生物化学或模型蒸馏方向,系统会自动切换为Opus 4.8来响应,并告知用户发生了模型降级。官方表示,超过95%的日常对话不会触发,写作、编程、分析等任务大多不受影响。不过,实际体验可能因使用场景有所差异。

在实际使用中,这条界限实际上很容易被触发。李夏提到,他想在国内Mac上体验苹果Siri AI的功能,需要修改一些系统级的序列号参数,Fable 5直接拒绝了操作。目前,分类器设定比较保守,存在误判,官方称后续会持续调整。

但Anthropic还披露了另一层限制,对于大模型开发相关的请求,比如构建预训练流水线、设计分布式训练基础设施等,模型会在后台主动降低输出质量,且不会告知用户。

综合来看,Fable 5在各项硬指标上确实有了进步,但自动降级机制在一定程度上会影响使用体验。

02.最强模型,不是人人用得上

Anthropic这次的模型升级,用同一个底层模型,包装成了两款产品,面向两类群体。

Mythos 5留在玻璃翼计划的框架内,只面向苹果、谷歌、微软等12家核心安全伙伴及40余家关键基础设施提供商开放,网络安全和生物方向的限制被解除,Fable 5则面向C端订阅用户。

后续Anthropic还计划向经过审核的研究人员开放一个生物方向的受信通道,提供去掉了生物和化学限制的Fable 5版本。

这涉及到过去大模型行业没有面对过的问题,当模型能力足够自主发现漏洞,全量发布就变成了一种风险。

图源 / pexels

这解释了Fable 5和Mythos 5为什么要拆成两个版本。过去模型分级靠参数,大小之间是能力差距,现在同参数的模型也要分级,分的是信任门槛。

独立开发者展波认为,从安全角度来看这个逻辑很合理。Mythos级别的漏洞挖掘能力如果不加限制地开放给个人,会大幅降低攻击成本,容易被滥用于恶意攻击。先锁住、再逐步放开受信访问,是目前最稳妥的路径。

但安全只解释了为什么要分层。另一个问题在于,能用上Fable 5的普通用户,是不是都从中获益?

从Anthropic发布的跑分和案例来看,这一轮升级,优先服务的是程序员和工程团队。

展波用Fable 5协助优化了自己用Rust编写的解释型语言项目。在同等Web服务场景下,他将其与基于Python的FastAPI和基于Node.js的Hono做了对比。使用Fable 5的解释器驻留内存仅9.8MB,而FastAPI 和Hono分别为43.3MB和63.0MB,吞吐和延迟指标同样领先。

他认为同样一个任务,用Fable 5可能很快就完成,且效果更好。相比于价格,开发者更看重产出质量。只要模型能显著提升项目效果,高价是可以接受的。

李夏也提到,对程序员来说,模型生成质量和收入正相关。产出质量越高,提效越明显,回报越大。模型能力的提升可以直接换算成项目质量和时间节省,付费意愿自然会更强。

但换一个使用场景,结论就不一样了。

AI博主徐子龙以他的日常使用为例,他的日常工作分为写代码、做数据分析和写论文。他认为目前的大模型代码能力过剩,文字能力欠佳。对于科研工作者、内容创作者、法律和金融从业者等群体来说,对AI的核心需求集中在中文理解、长文写作和文档处理上。

展波提到,现在的趋势不是用户在挑模型,是模型在挑用户。编程重度用户被高端模型筛选出来,日常轻度用户被推向更有性价比的替代品。这说明,AI不再是一个普惠工具,而是一层层筛出不同支付能力和使用强度的用户。

即便是最强模型,也要在有需求的人手中才能物有所值。

03.用不起AI的时代,要来了吗?

Fable 5的API定价是输入10美元、输出50美元每百万Token,是Opus 4.8的两倍,也是目前全球公开可用的前沿模型中最贵的。

主流大模型API价格对比

但真正值得关注的不是价格翻了一倍,是付费方式变了。

Fable 5上线后,Pro、Max、Team等订阅用户可以免费使用两周。6月23日起,模型将从订阅计划中移出,继续使用需要额外购买credits,按API费率结算。订阅期内使用Fable 5,消耗的用量额度也是Opus 4.8的两倍。

先免费试用再移出订阅,也是在释放一种信号,把用户从固定月费推向按量计费。订阅制的好处是确定性,用户知道每月花多少钱;按量计费对平台更有利,用得多收得多,用户的花费上限被打开了。说白了,Anthropic想告诉用户:最先进的东西,本来就不该是包月的。

这个转变发生的时间点也值得注意。6月1日,Anthropic刚刚向SEC秘密提交了IPO招股书,估值达到9650亿美元,目标最早今年10月上市。从年初到5月底,Anthropic的年化收入从90亿美元增长至470亿美元,其中Claude Code贡献超过25亿美元,企业客户贡献了绝大部分收入。

一个即将上市的公司,需要向资本市场证明营收增长能力和定价权。把最强模型从固定订阅中拆出来、引导高价值用户按量付费,从财务叙事上看逻辑是通的。

而国产模型正在做完全相反的事。

5月底,DeepSeek宣布V4-Pro API永久降价75%。小米紧随其后,MiMo-V2.5-Pro降幅高达99%,价格几乎对齐DeepSeek。

一边是DeepSeek把价格打到地板,一边是Anthropic把天花板往上抬,不同玩家有不同的打法。

国产模型的降价一方面是技术红利的释放,底层架构发生了变化,省下的空间被用来换更大的市场。

Anthropic的逻辑正好反过来。它不需要靠低价抢市场,高价本身也是筛选器,把愿意为前沿能力付费的高价值用户留下来。

徐子龙认为未来AI会越来越贵,因为需求的扩张远远大于供给的扩张,算力涉及到电、芯片、模型训练,增长速度太慢。AI算力未来会像5G一样成为基础设施,但和5G不同,算力的供给远比带宽紧张,价格也就相应的增长。

从商业模式上看,AI行业正在出现类似云计算早期的分层结构。底层是高度标准化、价格趋近于零的通用能力,谁都能调用,靠走量变现;顶层是少数厂商把持的前沿能力,定价权集中,靠客单价变现。通用能力的价格会被持续压低,但前沿能力的溢价将长期存在。

从能力分级到付费分层,AI行业正在复制云计算走过的路。便宜的模型越来越多,最好的模型越来越贵。

*应受访者要求,文中李夏为化名。

本文来自微信公众号“AIX财经”,作者:雷晶,编辑:金玙璠

你可能也喜歡

AI 投资人的 2026 焦虑：当模型吞噬一切，创业公司的护城河还剩什么？

本文探讨了AI投资人面对大模型快速进步时产生的“2026焦虑”：当模型能力持续超越人类，除了巨头如Anthropic和英伟达，创业公司的护城河还剩下什么？文章指出，真正的护城河并不在于公开的基准测试成绩，而存在于那些“不可训练”的领域。模型在可衡量、可优化的任务上（如标准编码测试）进步神速，正使许多表层应用变得商品化。然而，许多工作的核心价值是私有的、难以衡量的：例如理解一个公司陈旧的特定代码库、改变律师的工作流程、或获得医生对诊断工具的信任。这些价值建立于长期的系统集成、领域专精、客户关系以及责任承担之上，无法通过基准测试反映，也无法被更聪明的模型快速复制。因此，创业公司的机会在于深入特定垂直领域，做“不起眼的翻译”工作：将客户的私有现实（数据、流程、习惯）与AI能力相结合，并在此过程中定义该领域“什么是好结果”。这需要时间积累信任、处理复杂集成，并承担最终责任。虽然通用能力在商品化，但在私有、前沿且正确性难以公开验证的角落，依托深度集成的专业应用仍能建立持久的壁垒。未来的价值将不断滑向这些模型本身无法直接触及的地方。

marsbit25 分鐘前

marsbit25 分鐘前

三年新高砸碎降息梦，谁在借 CPI 清洗巨鲸筹码？

北京时间6月10日，美国公布2026年5月CPI数据，同比上涨4.2%，创三年新高，主要由地缘冲突推高的能源价格驱动。数据令市场对美联储年内降息的预期大幅降温，甚至开始出现加息的讨论。报告显示，能源价格环比上涨3.9%，贡献了整体通胀涨幅的60%以上。不过，核心CPI环比增速放缓至0.2%，显示潜在通胀压力尚未全面失控。多数机构认为，这强化了“高利率维持更久”的预期，但距离重启加息周期尚有距离。作为典型风险资产，加密市场和美股均承压。比特币价格在6.1万至6.2万美元区间震荡，现货ETF持续净流出，市场经历了显著的去杠杆化。分析指出，虽然市场杠杆已重置，估值指标处于低位，但真正的需求复苏尚未出现。美股方面，尽管面临压力，部分投行仍维持乐观，认为盈利增长是主要动力，但同时也承认通胀环境已发生变化，股票与债券的相关性可能上升，给传统投资组合带来挑战。市场焦点转向美联储6月会议，这将是对新任主席沃十的一次重要考验。

Foresight News46 分鐘前

Foresight News46 分鐘前

从未失手的以太坊指标再次发出信号，本次指向700美元

以太坊（ETH）价格目前徘徊在约1,606美元，正尝试巩固在去年4月以来的低位，月度跌幅达31%，较历史高点4,945美元下跌近70%。分析师Ali Martinez指出，曾成功预测前两次市场底部的Delta Price指标目前指向708美元，暗示若熊市持续，ETH可能还需从当前水平再跌56%，较历史高点累计下跌约85%。短期关键水平方面，Martinez此前强调周线图上的1,850美元为重要关口，失守后跌势加速；下行目标1,560美元已在周末被跌破（ETH曾跌至1,500美元）。若跌势延续，下一重要支撑位在1,070美元，即多年区间的下轨。要扭转看跌趋势，以太坊需满足两个条件：首先收复200周简单移动平均线（约2,500美元），然后有效突破50周简单移动平均线（约3,100美元）。目前市场卖压持续，两者均未接近实现。

bitcoinist57 分鐘前

bitcoinist57 分鐘前

特朗普加密帝国：一场23亿美元的财富转移实验

2026年6月，路透社调查揭示特朗普家族重返白宫后，通过四大加密业务（World Liberty Financial、$TRUMP迷因币、American Bitcoin及ALT5 Sigma/AI Financial）累计获利约23亿美元，而同期参与投资者总体浮亏也接近23亿美元。这些业务涉足不同领域，但核心逻辑均非技术创新，而是将特朗普的政治影响力与话题效应转化为金融资产进行变现。特朗普过去曾公开批评加密货币，但随着加密行业政治影响力上升及市场情绪助推，其立场转变，并被塑造为“加密总统”。家族以此为核心资产，构建商业网络。其中，World Liberty Financial（WLFI）是最重要的盈利来源，通过发行锁仓治理代币和高比例销售分成，为家族创造约16亿美元收益，投资者却因流动性受限和价格下跌承受损失。$TRUMP迷因币则直接金融化特朗普品牌，家族通过预留代币获利超6亿美元，而代币价格后期暴跌使高位接盘散户严重亏损。American Bitcoin作为矿业公司，因“特朗普概念”获得高估值，但基本面无法支撑，股价回落令投资者受损。ALT5 Sigma更名为AI Financial后，叠加AI、加密和特朗普概念，股价经历资本狂欢后因实际增长不足而回调。这四个项目遵循共同模式：利用政治品牌建立信任与关注，通过媒体放大情绪，吸引资金进入后，家族通过股权、代币销售等方式实现收益变现，而市场投资者承担后端风险。特朗普家族成功完成了一次大规模的品牌变现，但对于投资者而言，这再次警示：基于情绪、名人效应而非基本面的投资，往往风险巨大。这场23亿美元的财富转移实验，成为政治影响力、资本市场与投资心理相互作用的现实一课。

marsbit1 小時前

marsbit1 小時前

CFTC拟立预测市场新规，重新定义哪些事件能上、谁能参与

美国商品期货交易委员会（CFTC）近日发布一项拟议规则，计划对预测市场中的事件合约建立新的审查框架。该提案旨在明确哪些事件可以被“金融化”为可交易合约，哪些可能因涉及恐怖主义、战争、暗杀或违法行为而被禁止，以防止其损害公共利益。 CFTC并未采取一刀切的禁止清单方式，而是提议对具体合约进行个案审查。监管重点在于区分“预测风险影响”和“预测伤害发生”，后者更容易触碰底线。例如，直接预测恐怖袭击的合约可能被禁，而预测受地缘局势影响的商业数据（如原油运输量）则可能被允许。对于交易量庞大的体育预测市场，提案释放了相对积极的信号。基于比赛胜负、比分、赛季表现等整体结果的合约，因具备价格发现功能，有望获得合规空间。但涉及球员伤病、裁判判罚、未成年人赛事等更易被操纵或诱导不当行为的细分市场，将面临严格审查。提案的核心关切在于防范内幕交易和市场操纵。预测市场的独特风险在于，某些事件的结局可能由少数知情者决定，如果他们参与交易，市场公平性将遭破坏。近期已出现多起涉嫌利用内幕信息（如军方行动、公司内部数据）进行交易的案例。然而，争议远未结束。美国多州监管机构和博彩业认为，体育预测合约本质上是体育博彩，应受州级博彩法规管辖，而非绕过这些规定成为CFTC监管的全国性金融产品。这预示着联邦与州之间的监管权之争将继续。总体而言，CFTC的提案标志着预测市场从粗放扩张迈向更制度化的新阶段。未来，行业的增长将更依赖于证明其市场的公平性、结算透明度和风险可控性，使其运作更接近传统金融市场。

marsbit1 小時前

marsbit1 小時前

交易

現貨

合約

Anthropic 发了“最强模型”，但大多数人用不上

文章摘要

01.能力提升明显,自动降级成争议

02.最强模型,不是人人用得上

03.用不起AI的时代,要来了吗?

相關問答

你可能也喜歡

AI 投资人的 2026 焦虑：当模型吞噬一切，创业公司的护城河还剩什么？

三年新高砸碎降息梦，谁在借 CPI 清洗巨鲸筹码？

从未失手的以太坊指标再次发出信号，本次指向700美元

特朗普加密帝国：一场23亿美元的财富转移实验

CFTC拟立预测市场新规，重新定义哪些事件能上、谁能参与

交易

熱門文章

如何購買PEOPLE

相關討論

熱門問答

熱門分類

熱門標籤