Anthropic 发了“最强模型”,但大多数人用不上

marsbit發佈於 2026-06-10更新於 2026-06-10

文章摘要

Anthropic于6月发布了号称“最强”的Fable 5和Mythos 5模型。它们在软件工程、长任务执行等多项基准测试中得分领先。但此次发布的核心策略是“分级开放”:两个模型共享同一底层,Mythos 5因具有强大的网络安全漏洞挖掘能力,仅限少数安全伙伴使用;面向普通用户的Fable 5则在检测到网络安全、生物化学等敏感请求时,会自动降级至旧版模型响应,以确保安全。 模型能力提升显著,尤其在代码生成的质量和工程实用性上突破明显。然而,其自动降级机制在实际使用中可能因界限保守而影响体验。同时,Anthropic调整了商业模式,Fable 5不仅API定价翻倍(输入10美元/百万Token),并将从6月23日起移出订阅套餐,需用户额外按量付费。这被视为在IPO前筛选高价值用户、强化定价权的举措。 与此相对,国产模型正大幅降价以争夺市场。行业呈现出分化趋势:通用模型价格日趋平民化,而顶尖的前沿模型因供给紧张和针对高需求场景(如专业编程),其溢价可能长期存在。这意味着最强的AI能力,正变得越来越并非人人可用且用得起的服务。

4月,Anthropic推出Mythos模型预览版。这个模型没有面向公众开放,因为在测试中它展现出极强的网络安全与漏洞挖掘能力,能自主发现数千个高危零日漏洞,一旦流出,容易被用于恶意攻击。

为了把这种能力锁定在防御场景内,Anthropic推出了玻璃翼计划(Project Glasswing),仅向苹果、谷歌、微软等12家核心安全伙伴及40余家关键基础设施提供商开放访问权限,并全程受控使用。

先锁起来再发布,这套操作本身就制造了话题。

两个月后,北京时间6月10日凌晨,Anthropic正式推出Fable 5和Mythos 5。

从跑分来看,它们几乎在所有基准测试中拿到了最高分,尤其在软件工程和长任务执行上,与其他模型拉开了明显差距。

但围绕这个模型的讨论,很快就不止于它有多强。

Fable 5和Mythos 5实际上共享同一个底层模型。区别在于,Fable 5面向普通用户,Mythos 5则继续锁在受信任的安全合作伙伴手中。同一个模型,两套规则,面向两个群体,这在Anthropic的产品线里是第一次。

而且,普通用户拿到的也并非完整版本。Anthropic在Fable 5外层加了一道安全分类器,一旦请求触及网络安全、生物化学、模型蒸馏等敏感方向,系统会自动切换到能力更弱的上代模型Opus 4.8响应。

定价同样值得注意,输入10美元、输出50美元/百万Token,官方称约为Opus 4.8的两倍。6月23日起,Fable 5还将从Pro、Max等订阅计划中移出,用户想继续使用,需要额外消耗credits。

这套组合拳拆开来看很合理。能力太强所以做安全限制,成本更高所以提价,风险敏感所以分级发布。但放到一起,释放的信号就变得微妙了。这和过去几年大模型公司拼速度、拼开放的竞争逻辑不同,各家都在想办法让自家模型触达更多用户,而Anthropic选择主动收窄入口,把限制变成了产品策略的一部分。

那么,这个号称前所未有的“最强模型”,是被神化了吗?

01.能力提升明显,自动降级成争议

分级归分级,先看实力到底如何。

软件工程是Anthropic这次更新的核心亮点。在SWE-Bench Pro测试中,Fable 5拿到80.3%的成绩。这个测试主要是看模型能不能在真实的GitHub仓库里定位bug、理解上下文、写出能用的修复代码,80.3%意味着每5个真实工程问题,Fable 5能解决4个。

在Terminal-Bench 2.1榜单上,Fable 5得分88.0%,超过了Open AI的Codex CLI。值得注意的是,Fable 5是通用模型,Codex CLI是专为编程场景打造的垂直工具,二者的差距更能体现其编程实力。

但真正能看出差距的是FrontierCode Diamond,这项测试考察模型的产出的代码能不能达到生产级代码库的质量标准。Fable 5拿到29.3%,Opus 4.8只有13.4%,GPT-5.5只有5.7%。三个数据均来自Anthropic官方公布,GPT-5.5的数据为其内部测试结果。

过去几年,AI模型写代码的能力一直在进步,但长期卡在一个瓶颈上:代码能跑,但不好维护;能够通过基准测试,但落地真实项目中仍会问题频发。

Fable 5在这个维度上的突破,说明Anthropic这次升级的不只是解题能力,而是把模型往真正的工程交付方向推进。

程序员李夏告诉「AIX财经」,AI生成代码很容易出现上下文不连贯的问题,初期能精准理解需求,长时间任务中容易遗忘信息,后期维护成本很高。

在他看来,Fable 5在长任务里的逻辑连贯性有明显进步,同类编码任务可一次性完成,准确率更高。不过,Fable 5相比Opus4.8生成速度较慢,思考链更长,整体响应速度有所下降。

视觉能力也有提升。Anthropic称,Fable 5能从复杂科学图表中提取精确数字,也能根据网页截图直接重建应用源码。官方还演示了实操案例,Fable 5只靠游戏画面截图就通关《宝可梦火红》,不需要搭配辅助工具。前代模型做类似任务时,还需要配备复杂的辅助系统。

长上下文和记忆方面,官方给出的说法是,任务越长越复杂,Fable 5的优势越明显。

此外,生命科学是另一个被重点提及的方向。Anthropic透露基于Mythos 5搭建的单细胞数据分析模型,覆盖138个物种,性能优于《Science》近期刊发的同类型模型,参数量却仅为后者的百分之一。

单从跑分成绩来看,综合能力确实上了一个台阶。

再来看看跑分之外。

Fable 5搭载了一套安全分类器,只要用户请求涉及网络安全、生物化学或模型蒸馏方向,系统会自动切换为Opus 4.8来响应,并告知用户发生了模型降级。官方表示,超过95%的日常对话不会触发,写作、编程、分析等任务大多不受影响。不过,实际体验可能因使用场景有所差异。

在实际使用中,这条界限实际上很容易被触发。李夏提到,他想在国内Mac上体验苹果Siri AI的功能,需要修改一些系统级的序列号参数,Fable 5直接拒绝了操作。目前,分类器设定比较保守,存在误判,官方称后续会持续调整。

但Anthropic还披露了另一层限制,对于大模型开发相关的请求,比如构建预训练流水线、设计分布式训练基础设施等,模型会在后台主动降低输出质量,且不会告知用户。

综合来看,Fable 5在各项硬指标上确实有了进步,但自动降级机制在一定程度上会影响使用体验。

02.最强模型,不是人人用得上

Anthropic这次的模型升级,用同一个底层模型,包装成了两款产品,面向两类群体。

Mythos 5留在玻璃翼计划的框架内,只面向苹果、谷歌、微软等12家核心安全伙伴及40余家关键基础设施提供商开放,网络安全和生物方向的限制被解除,Fable 5则面向C端订阅用户。

后续Anthropic还计划向经过审核的研究人员开放一个生物方向的受信通道,提供去掉了生物和化学限制的Fable 5版本。

这涉及到过去大模型行业没有面对过的问题,当模型能力足够自主发现漏洞,全量发布就变成了一种风险。

图源 / pexels

这解释了Fable 5和Mythos 5为什么要拆成两个版本。过去模型分级靠参数,大小之间是能力差距,现在同参数的模型也要分级,分的是信任门槛。

独立开发者展波认为,从安全角度来看这个逻辑很合理。Mythos级别的漏洞挖掘能力如果不加限制地开放给个人,会大幅降低攻击成本,容易被滥用于恶意攻击。先锁住、再逐步放开受信访问,是目前最稳妥的路径。

但安全只解释了为什么要分层。另一个问题在于,能用上Fable 5的普通用户,是不是都从中获益?

从Anthropic发布的跑分和案例来看,这一轮升级,优先服务的是程序员和工程团队。

展波用Fable 5协助优化了自己用Rust编写的解释型语言项目。在同等Web服务场景下,他将其与基于Python的FastAPI和基于Node.js的Hono做了对比。使用Fable 5的解释器驻留内存仅9.8MB,而FastAPI 和Hono分别为43.3MB和63.0MB,吞吐和延迟指标同样领先。

他认为同样一个任务,用Fable 5可能很快就完成,且效果更好。相比于价格,开发者更看重产出质量。只要模型能显著提升项目效果,高价是可以接受的。

李夏也提到,对程序员来说,模型生成质量和收入正相关。产出质量越高,提效越明显,回报越大。模型能力的提升可以直接换算成项目质量和时间节省,付费意愿自然会更强。

但换一个使用场景,结论就不一样了。

AI博主徐子龙以他的日常使用为例,他的日常工作分为写代码、做数据分析和写论文。他认为目前的大模型代码能力过剩,文字能力欠佳。对于科研工作者、内容创作者、法律和金融从业者等群体来说,对AI的核心需求集中在中文理解、长文写作和文档处理上。

展波提到,现在的趋势不是用户在挑模型,是模型在挑用户。编程重度用户被高端模型筛选出来,日常轻度用户被推向更有性价比的替代品。这说明,AI不再是一个普惠工具,而是一层层筛出不同支付能力和使用强度的用户。

即便是最强模型,也要在有需求的人手中才能物有所值。

03.用不起AI的时代,要来了吗?

Fable 5的API定价是输入10美元、输出50美元每百万Token,是Opus 4.8的两倍,也是目前全球公开可用的前沿模型中最贵的。

主流大模型API价格对比

但真正值得关注的不是价格翻了一倍,是付费方式变了。

Fable 5上线后,Pro、Max、Team等订阅用户可以免费使用两周。6月23日起,模型将从订阅计划中移出,继续使用需要额外购买credits,按API费率结算。订阅期内使用Fable 5,消耗的用量额度也是Opus 4.8的两倍。

先免费试用再移出订阅,也是在释放一种信号,把用户从固定月费推向按量计费。订阅制的好处是确定性,用户知道每月花多少钱;按量计费对平台更有利,用得多收得多,用户的花费上限被打开了。说白了,Anthropic想告诉用户:最先进的东西,本来就不该是包月的。

这个转变发生的时间点也值得注意。6月1日,Anthropic刚刚向SEC秘密提交了IPO招股书,估值达到9650亿美元,目标最早今年10月上市。从年初到5月底,Anthropic的年化收入从90亿美元增长至470亿美元,其中Claude Code贡献超过25亿美元,企业客户贡献了绝大部分收入。

一个即将上市的公司,需要向资本市场证明营收增长能力和定价权。把最强模型从固定订阅中拆出来、引导高价值用户按量付费,从财务叙事上看逻辑是通的。

而国产模型正在做完全相反的事。

5月底,DeepSeek宣布V4-Pro API永久降价75%。小米紧随其后,MiMo-V2.5-Pro降幅高达99%,价格几乎对齐DeepSeek。

一边是DeepSeek把价格打到地板,一边是Anthropic把天花板往上抬,不同玩家有不同的打法。

国产模型的降价一方面是技术红利的释放,底层架构发生了变化,省下的空间被用来换更大的市场。

Anthropic的逻辑正好反过来。它不需要靠低价抢市场,高价本身也是筛选器,把愿意为前沿能力付费的高价值用户留下来。

徐子龙认为未来AI会越来越贵,因为需求的扩张远远大于供给的扩张,算力涉及到电、芯片、模型训练,增长速度太慢。AI算力未来会像5G一样成为基础设施,但和5G不同,算力的供给远比带宽紧张,价格也就相应的增长。

从商业模式上看,AI行业正在出现类似云计算早期的分层结构。底层是高度标准化、价格趋近于零的通用能力,谁都能调用,靠走量变现;顶层是少数厂商把持的前沿能力,定价权集中,靠客单价变现。通用能力的价格会被持续压低,但前沿能力的溢价将长期存在。

从能力分级到付费分层,AI行业正在复制云计算走过的路。便宜的模型越来越多,最好的模型越来越贵。

*应受访者要求,文中李夏为化名。

本文来自微信公众号“AIX财经”,作者:雷晶,编辑:金玙璠

相關問答

QAnthropic新发布的Fable 5和Mythos 5模型在能力上的主要升级亮点是什么?

A主要亮点在于软件工程和长任务执行能力的显著提升。例如,在SWE-Bench Pro测试中解决了80.3%的真实工程问题,在FrontierCode Diamond测试中其代码质量远超前代模型和竞品。此外,视觉能力(如从图表提取数据、根据截图重建源码)和生命科学方向的能力也有显著进步。

Q为什么Anthropic要将Fable 5和Mythos 5分开为两个版本?这两个版本的主要区别是什么?

A分开的主要原因是为了安全。Mythos模型在测试中展现出极强的网络安全与漏洞挖掘能力,为避免被恶意利用,Anthropic通过“玻璃翼计划”将其访问权限限制在少数受信任的安全伙伴和关键基础设施提供商手中。Fable 5则面向普通用户,但外层加装了安全分类器,当请求涉及网络安全、生物化学等敏感方向时,会自动降级到能力更弱的上代模型Opus 4.8来响应。两者共享同一底层模型,区别在于访问权限和风险控制。

QFable 5的定价策略有什么特点?这对普通用户意味着什么?

AFable 5的API定价为输入10美元、输出50美元/百万Token,约为前代Opus 4.8的两倍,是目前全球公开可用的前沿模型中最贵的。此外,从6月23日起,它将从Pro、Max等订阅计划中移出,用户想继续使用需要额外购买credits按量计费。这意味着,对于追求顶级AI能力的用户(如重度开发者),使用成本将显著上升,模型正通过高价筛选出高价值、高支付意愿的用户群。

Q文章中提到国产模型和Anthropic在定价策略上走向了相反的方向,具体表现是什么?

A国产模型如DeepSeek和小米正在大幅降价以扩大市场份额,例如DeepSeek V4-Pro API永久降价75%。而Anthropic则将最先进的Fable 5模型提价并移出固定订阅套餐,引导用户按使用量付费。这反映出不同的市场策略:国产模型通过释放技术红利和降低价格来抢占市场;而Anthropic则通过维持高价,服务于愿意为前沿能力支付溢价的特定高端用户和企业客户,以强化其财务表现和市场定位。

Q根据文章,AI行业的商业模式未来可能如何发展?

A文章认为AI行业正在复制云计算早期的分层结构。底层将出现大量高度标准化、价格趋近于零的通用AI能力,靠走量变现。而顶层则由少数厂商把持最前沿、能力最强的模型,这些模型将维持高溢价,主要面向高价值的企业客户和重度专业用户,靠客单价变现。因此,未来可能会出现“便宜的模型越来越多,最好的模型越来越贵”的局面。

你可能也喜歡

特朗普加密帝国:一场23亿美元的财富转移实验

2026年6月,路透社调查揭示特朗普家族重返白宫后,通过四大加密业务(World Liberty Financial、$TRUMP迷因币、American Bitcoin及ALT5 Sigma/AI Financial)累计获利约23亿美元,而同期参与投资者总体浮亏也接近23亿美元。这些业务涉足不同领域,但核心逻辑均非技术创新,而是将特朗普的政治影响力与话题效应转化为金融资产进行变现。 特朗普过去曾公开批评加密货币,但随着加密行业政治影响力上升及市场情绪助推,其立场转变,并被塑造为“加密总统”。家族以此为核心资产,构建商业网络。 其中,World Liberty Financial(WLFI)是最重要的盈利来源,通过发行锁仓治理代币和高比例销售分成,为家族创造约16亿美元收益,投资者却因流动性受限和价格下跌承受损失。$TRUMP迷因币则直接金融化特朗普品牌,家族通过预留代币获利超6亿美元,而代币价格后期暴跌使高位接盘散户严重亏损。American Bitcoin作为矿业公司,因“特朗普概念”获得高估值,但基本面无法支撑,股价回落令投资者受损。ALT5 Sigma更名为AI Financial后,叠加AI、加密和特朗普概念,股价经历资本狂欢后因实际增长不足而回调。 这四个项目遵循共同模式:利用政治品牌建立信任与关注,通过媒体放大情绪,吸引资金进入后,家族通过股权、代币销售等方式实现收益变现,而市场投资者承担后端风险。 特朗普家族成功完成了一次大规模的品牌变现,但对于投资者而言,这再次警示:基于情绪、名人效应而非基本面的投资,往往风险巨大。这场23亿美元的财富转移实验,成为政治影响力、资本市场与投资心理相互作用的现实一课。

marsbit1 小時前

特朗普加密帝国:一场23亿美元的财富转移实验

marsbit1 小時前

CFTC拟立预测市场新规,重新定义哪些事件能上、谁能参与

美国商品期货交易委员会(CFTC)近日发布一项拟议规则,计划对预测市场中的事件合约建立新的审查框架。该提案旨在明确哪些事件可以被“金融化”为可交易合约,哪些可能因涉及恐怖主义、战争、暗杀或违法行为而被禁止,以防止其损害公共利益。 CFTC并未采取一刀切的禁止清单方式,而是提议对具体合约进行个案审查。监管重点在于区分“预测风险影响”和“预测伤害发生”,后者更容易触碰底线。例如,直接预测恐怖袭击的合约可能被禁,而预测受地缘局势影响的商业数据(如原油运输量)则可能被允许。 对于交易量庞大的体育预测市场,提案释放了相对积极的信号。基于比赛胜负、比分、赛季表现等整体结果的合约,因具备价格发现功能,有望获得合规空间。但涉及球员伤病、裁判判罚、未成年人赛事等更易被操纵或诱导不当行为的细分市场,将面临严格审查。 提案的核心关切在于防范内幕交易和市场操纵。预测市场的独特风险在于,某些事件的结局可能由少数知情者决定,如果他们参与交易,市场公平性将遭破坏。近期已出现多起涉嫌利用内幕信息(如军方行动、公司内部数据)进行交易的案例。 然而,争议远未结束。美国多州监管机构和博彩业认为,体育预测合约本质上是体育博彩,应受州级博彩法规管辖,而非绕过这些规定成为CFTC监管的全国性金融产品。这预示着联邦与州之间的监管权之争将继续。 总体而言,CFTC的提案标志着预测市场从粗放扩张迈向更制度化的新阶段。未来,行业的增长将更依赖于证明其市场的公平性、结算透明度和风险可控性,使其运作更接近传统金融市场。

marsbit1 小時前

CFTC拟立预测市场新规,重新定义哪些事件能上、谁能参与

marsbit1 小時前

交易

現貨
合約

熱門文章

如何購買PEOPLE

歡迎來到HTX.com!在這裡,購買ConstitutionDAO (PEOPLE)變得簡單而便捷。跟隨我們的逐步指南,放心開始您的加密貨幣之旅。第一步:創建您的HTX帳戶使用您的 Email、手機號碼在HTX註冊一個免費帳戶。體驗無憂的註冊過程並解鎖所有平台功能。立即註冊第二步:前往買幣頁面,選擇您的支付方式信用卡/金融卡購買:使用您的Visa或Mastercard即時購買ConstitutionDAO (PEOPLE)。餘額購買:使用您HTX帳戶餘額中的資金進行無縫交易。第三方購買:探索諸如Google Pay或Apple Pay等流行支付方式以增加便利性。C2C購買:在HTX平台上直接與其他用戶交易。HTX 場外交易 (OTC) 購買:為大量交易者提供個性化服務和競爭性匯率。第三步:存儲您的ConstitutionDAO (PEOPLE)購買ConstitutionDAO (PEOPLE)後,將其存儲在您的HTX帳戶中。您也可以透過區塊鏈轉帳將其發送到其他地址或者用於交易其他加密貨幣。第四步:交易ConstitutionDAO (PEOPLE)在HTX的現貨市場輕鬆交易ConstitutionDAO (PEOPLE)。前往您的帳戶,選擇交易對,執行交易,並即時監控。HTX為初學者和經驗豐富的交易者提供了友好的用戶體驗。

783 人學過發佈於 2024.12.12更新於 2026.06.02

如何購買PEOPLE

相關討論

歡迎來到 HTX 社群。在這裡,您可以了解最新的平台發展動態並獲得專業的市場意見。 以下是用戶對 PEOPLE (PEOPLE)幣價的意見。

活动图片