Anthropic 发了“最强模型”,但大多数人用不上

marsbit發佈於 2026-06-10更新於 2026-06-10

文章摘要

Anthropic于6月发布了号称“最强”的Fable 5和Mythos 5模型。它们在软件工程、长任务执行等多项基准测试中得分领先。但此次发布的核心策略是“分级开放”:两个模型共享同一底层,Mythos 5因具有强大的网络安全漏洞挖掘能力,仅限少数安全伙伴使用;面向普通用户的Fable 5则在检测到网络安全、生物化学等敏感请求时,会自动降级至旧版模型响应,以确保安全。 模型能力提升显著,尤其在代码生成的质量和工程实用性上突破明显。然而,其自动降级机制在实际使用中可能因界限保守而影响体验。同时,Anthropic调整了商业模式,Fable 5不仅API定价翻倍(输入10美元/百万Token),并将从6月23日起移出订阅套餐,需用户额外按量付费。这被视为在IPO前筛选高价值用户、强化定价权的举措。 与此相对,国产模型正大幅降价以争夺市场。行业呈现出分化趋势:通用模型价格日趋平民化,而顶尖的前沿模型因供给紧张和针对高需求场景(如专业编程),其溢价可能长期存在。这意味着最强的AI能力,正变得越来越并非人人可用且用得起的服务。

4月,Anthropic推出Mythos模型预览版。这个模型没有面向公众开放,因为在测试中它展现出极强的网络安全与漏洞挖掘能力,能自主发现数千个高危零日漏洞,一旦流出,容易被用于恶意攻击。

为了把这种能力锁定在防御场景内,Anthropic推出了玻璃翼计划(Project Glasswing),仅向苹果、谷歌、微软等12家核心安全伙伴及40余家关键基础设施提供商开放访问权限,并全程受控使用。

先锁起来再发布,这套操作本身就制造了话题。

两个月后,北京时间6月10日凌晨,Anthropic正式推出Fable 5和Mythos 5。

从跑分来看,它们几乎在所有基准测试中拿到了最高分,尤其在软件工程和长任务执行上,与其他模型拉开了明显差距。

但围绕这个模型的讨论,很快就不止于它有多强。

Fable 5和Mythos 5实际上共享同一个底层模型。区别在于,Fable 5面向普通用户,Mythos 5则继续锁在受信任的安全合作伙伴手中。同一个模型,两套规则,面向两个群体,这在Anthropic的产品线里是第一次。

而且,普通用户拿到的也并非完整版本。Anthropic在Fable 5外层加了一道安全分类器,一旦请求触及网络安全、生物化学、模型蒸馏等敏感方向,系统会自动切换到能力更弱的上代模型Opus 4.8响应。

定价同样值得注意,输入10美元、输出50美元/百万Token,官方称约为Opus 4.8的两倍。6月23日起,Fable 5还将从Pro、Max等订阅计划中移出,用户想继续使用,需要额外消耗credits。

这套组合拳拆开来看很合理。能力太强所以做安全限制,成本更高所以提价,风险敏感所以分级发布。但放到一起,释放的信号就变得微妙了。这和过去几年大模型公司拼速度、拼开放的竞争逻辑不同,各家都在想办法让自家模型触达更多用户,而Anthropic选择主动收窄入口,把限制变成了产品策略的一部分。

那么,这个号称前所未有的“最强模型”,是被神化了吗?

01.能力提升明显,自动降级成争议

分级归分级,先看实力到底如何。

软件工程是Anthropic这次更新的核心亮点。在SWE-Bench Pro测试中,Fable 5拿到80.3%的成绩。这个测试主要是看模型能不能在真实的GitHub仓库里定位bug、理解上下文、写出能用的修复代码,80.3%意味着每5个真实工程问题,Fable 5能解决4个。

在Terminal-Bench 2.1榜单上,Fable 5得分88.0%,超过了Open AI的Codex CLI。值得注意的是,Fable 5是通用模型,Codex CLI是专为编程场景打造的垂直工具,二者的差距更能体现其编程实力。

但真正能看出差距的是FrontierCode Diamond,这项测试考察模型的产出的代码能不能达到生产级代码库的质量标准。Fable 5拿到29.3%,Opus 4.8只有13.4%,GPT-5.5只有5.7%。三个数据均来自Anthropic官方公布,GPT-5.5的数据为其内部测试结果。

过去几年,AI模型写代码的能力一直在进步,但长期卡在一个瓶颈上:代码能跑,但不好维护;能够通过基准测试,但落地真实项目中仍会问题频发。

Fable 5在这个维度上的突破,说明Anthropic这次升级的不只是解题能力,而是把模型往真正的工程交付方向推进。

程序员李夏告诉「AIX财经」,AI生成代码很容易出现上下文不连贯的问题,初期能精准理解需求,长时间任务中容易遗忘信息,后期维护成本很高。

在他看来,Fable 5在长任务里的逻辑连贯性有明显进步,同类编码任务可一次性完成,准确率更高。不过,Fable 5相比Opus4.8生成速度较慢,思考链更长,整体响应速度有所下降。

视觉能力也有提升。Anthropic称,Fable 5能从复杂科学图表中提取精确数字,也能根据网页截图直接重建应用源码。官方还演示了实操案例,Fable 5只靠游戏画面截图就通关《宝可梦火红》,不需要搭配辅助工具。前代模型做类似任务时,还需要配备复杂的辅助系统。

长上下文和记忆方面,官方给出的说法是,任务越长越复杂,Fable 5的优势越明显。

此外,生命科学是另一个被重点提及的方向。Anthropic透露基于Mythos 5搭建的单细胞数据分析模型,覆盖138个物种,性能优于《Science》近期刊发的同类型模型,参数量却仅为后者的百分之一。

单从跑分成绩来看,综合能力确实上了一个台阶。

再来看看跑分之外。

Fable 5搭载了一套安全分类器,只要用户请求涉及网络安全、生物化学或模型蒸馏方向,系统会自动切换为Opus 4.8来响应,并告知用户发生了模型降级。官方表示,超过95%的日常对话不会触发,写作、编程、分析等任务大多不受影响。不过,实际体验可能因使用场景有所差异。

在实际使用中,这条界限实际上很容易被触发。李夏提到,他想在国内Mac上体验苹果Siri AI的功能,需要修改一些系统级的序列号参数,Fable 5直接拒绝了操作。目前,分类器设定比较保守,存在误判,官方称后续会持续调整。

但Anthropic还披露了另一层限制,对于大模型开发相关的请求,比如构建预训练流水线、设计分布式训练基础设施等,模型会在后台主动降低输出质量,且不会告知用户。

综合来看,Fable 5在各项硬指标上确实有了进步,但自动降级机制在一定程度上会影响使用体验。

02.最强模型,不是人人用得上

Anthropic这次的模型升级,用同一个底层模型,包装成了两款产品,面向两类群体。

Mythos 5留在玻璃翼计划的框架内,只面向苹果、谷歌、微软等12家核心安全伙伴及40余家关键基础设施提供商开放,网络安全和生物方向的限制被解除,Fable 5则面向C端订阅用户。

后续Anthropic还计划向经过审核的研究人员开放一个生物方向的受信通道,提供去掉了生物和化学限制的Fable 5版本。

这涉及到过去大模型行业没有面对过的问题,当模型能力足够自主发现漏洞,全量发布就变成了一种风险。

图源 / pexels

这解释了Fable 5和Mythos 5为什么要拆成两个版本。过去模型分级靠参数,大小之间是能力差距,现在同参数的模型也要分级,分的是信任门槛。

独立开发者展波认为,从安全角度来看这个逻辑很合理。Mythos级别的漏洞挖掘能力如果不加限制地开放给个人,会大幅降低攻击成本,容易被滥用于恶意攻击。先锁住、再逐步放开受信访问,是目前最稳妥的路径。

但安全只解释了为什么要分层。另一个问题在于,能用上Fable 5的普通用户,是不是都从中获益?

从Anthropic发布的跑分和案例来看,这一轮升级,优先服务的是程序员和工程团队。

展波用Fable 5协助优化了自己用Rust编写的解释型语言项目。在同等Web服务场景下,他将其与基于Python的FastAPI和基于Node.js的Hono做了对比。使用Fable 5的解释器驻留内存仅9.8MB,而FastAPI 和Hono分别为43.3MB和63.0MB,吞吐和延迟指标同样领先。

他认为同样一个任务,用Fable 5可能很快就完成,且效果更好。相比于价格,开发者更看重产出质量。只要模型能显著提升项目效果,高价是可以接受的。

李夏也提到,对程序员来说,模型生成质量和收入正相关。产出质量越高,提效越明显,回报越大。模型能力的提升可以直接换算成项目质量和时间节省,付费意愿自然会更强。

但换一个使用场景,结论就不一样了。

AI博主徐子龙以他的日常使用为例,他的日常工作分为写代码、做数据分析和写论文。他认为目前的大模型代码能力过剩,文字能力欠佳。对于科研工作者、内容创作者、法律和金融从业者等群体来说,对AI的核心需求集中在中文理解、长文写作和文档处理上。

展波提到,现在的趋势不是用户在挑模型,是模型在挑用户。编程重度用户被高端模型筛选出来,日常轻度用户被推向更有性价比的替代品。这说明,AI不再是一个普惠工具,而是一层层筛出不同支付能力和使用强度的用户。

即便是最强模型,也要在有需求的人手中才能物有所值。

03.用不起AI的时代,要来了吗?

Fable 5的API定价是输入10美元、输出50美元每百万Token,是Opus 4.8的两倍,也是目前全球公开可用的前沿模型中最贵的。

主流大模型API价格对比

但真正值得关注的不是价格翻了一倍,是付费方式变了。

Fable 5上线后,Pro、Max、Team等订阅用户可以免费使用两周。6月23日起,模型将从订阅计划中移出,继续使用需要额外购买credits,按API费率结算。订阅期内使用Fable 5,消耗的用量额度也是Opus 4.8的两倍。

先免费试用再移出订阅,也是在释放一种信号,把用户从固定月费推向按量计费。订阅制的好处是确定性,用户知道每月花多少钱;按量计费对平台更有利,用得多收得多,用户的花费上限被打开了。说白了,Anthropic想告诉用户:最先进的东西,本来就不该是包月的。

这个转变发生的时间点也值得注意。6月1日,Anthropic刚刚向SEC秘密提交了IPO招股书,估值达到9650亿美元,目标最早今年10月上市。从年初到5月底,Anthropic的年化收入从90亿美元增长至470亿美元,其中Claude Code贡献超过25亿美元,企业客户贡献了绝大部分收入。

一个即将上市的公司,需要向资本市场证明营收增长能力和定价权。把最强模型从固定订阅中拆出来、引导高价值用户按量付费,从财务叙事上看逻辑是通的。

而国产模型正在做完全相反的事。

5月底,DeepSeek宣布V4-Pro API永久降价75%。小米紧随其后,MiMo-V2.5-Pro降幅高达99%,价格几乎对齐DeepSeek。

一边是DeepSeek把价格打到地板,一边是Anthropic把天花板往上抬,不同玩家有不同的打法。

国产模型的降价一方面是技术红利的释放,底层架构发生了变化,省下的空间被用来换更大的市场。

Anthropic的逻辑正好反过来。它不需要靠低价抢市场,高价本身也是筛选器,把愿意为前沿能力付费的高价值用户留下来。

徐子龙认为未来AI会越来越贵,因为需求的扩张远远大于供给的扩张,算力涉及到电、芯片、模型训练,增长速度太慢。AI算力未来会像5G一样成为基础设施,但和5G不同,算力的供给远比带宽紧张,价格也就相应的增长。

从商业模式上看,AI行业正在出现类似云计算早期的分层结构。底层是高度标准化、价格趋近于零的通用能力,谁都能调用,靠走量变现;顶层是少数厂商把持的前沿能力,定价权集中,靠客单价变现。通用能力的价格会被持续压低,但前沿能力的溢价将长期存在。

从能力分级到付费分层,AI行业正在复制云计算走过的路。便宜的模型越来越多,最好的模型越来越贵。

*应受访者要求,文中李夏为化名。

本文来自微信公众号“AIX财经”,作者:雷晶,编辑:金玙璠

相關問答

QAnthropic新发布的Fable 5和Mythos 5模型在能力上的主要升级亮点是什么?

A主要亮点在于软件工程和长任务执行能力的显著提升。例如,在SWE-Bench Pro测试中解决了80.3%的真实工程问题,在FrontierCode Diamond测试中其代码质量远超前代模型和竞品。此外,视觉能力(如从图表提取数据、根据截图重建源码)和生命科学方向的能力也有显著进步。

Q为什么Anthropic要将Fable 5和Mythos 5分开为两个版本?这两个版本的主要区别是什么?

A分开的主要原因是为了安全。Mythos模型在测试中展现出极强的网络安全与漏洞挖掘能力,为避免被恶意利用,Anthropic通过“玻璃翼计划”将其访问权限限制在少数受信任的安全伙伴和关键基础设施提供商手中。Fable 5则面向普通用户,但外层加装了安全分类器,当请求涉及网络安全、生物化学等敏感方向时,会自动降级到能力更弱的上代模型Opus 4.8来响应。两者共享同一底层模型,区别在于访问权限和风险控制。

QFable 5的定价策略有什么特点?这对普通用户意味着什么?

AFable 5的API定价为输入10美元、输出50美元/百万Token,约为前代Opus 4.8的两倍,是目前全球公开可用的前沿模型中最贵的。此外,从6月23日起,它将从Pro、Max等订阅计划中移出,用户想继续使用需要额外购买credits按量计费。这意味着,对于追求顶级AI能力的用户(如重度开发者),使用成本将显著上升,模型正通过高价筛选出高价值、高支付意愿的用户群。

Q文章中提到国产模型和Anthropic在定价策略上走向了相反的方向,具体表现是什么?

A国产模型如DeepSeek和小米正在大幅降价以扩大市场份额,例如DeepSeek V4-Pro API永久降价75%。而Anthropic则将最先进的Fable 5模型提价并移出固定订阅套餐,引导用户按使用量付费。这反映出不同的市场策略:国产模型通过释放技术红利和降低价格来抢占市场;而Anthropic则通过维持高价,服务于愿意为前沿能力支付溢价的特定高端用户和企业客户,以强化其财务表现和市场定位。

Q根据文章,AI行业的商业模式未来可能如何发展?

A文章认为AI行业正在复制云计算早期的分层结构。底层将出现大量高度标准化、价格趋近于零的通用AI能力,靠走量变现。而顶层则由少数厂商把持最前沿、能力最强的模型,这些模型将维持高溢价,主要面向高价值的企业客户和重度专业用户,靠客单价变现。因此,未来可能会出现“便宜的模型越来越多,最好的模型越来越贵”的局面。

你可能也喜歡

IC3 顶尖高校联手拆解:AI x Crypto 是真未来,还是叙事泡沫?

IC3(三大顶尖高校联合研究)发布报告,深入探讨AI与Crypto(区块链)结合的现状与未来。报告核心观点认为,这一交叉领域仍处于非常早期阶段,当前的喧嚣远大于实际进展。 报告将两者的结合分为两个方向:**Crypto x AI**(用AI增强区块链)与**AI x Crypto**(用区块链增强AI)。 在 **Crypto x AI** 方向: * AI已能用于分析链上交易、检测智能合约漏洞和识别欺诈,但多依赖于数据充足的受控环境。 * AI驱动的预言机让智能合约能感知、执行和决策,但准确率因问题类型而异,且面临设计困境(如交易策略透明易被攻击,不透明则易产生内幕交易)。 * 同时,AI也可能被用于驱动作恶的智能合约,实现自动化的犯罪悬赏与支付。 在 **AI x Crypto** 方向: * **去中心化基础设施**(DePIN)宣称成本更低,但需进行更严格的端到端总成本对比,证明其竞争力。 * **Crypto工具**(如零知识证明、可信执行环境TEE)可为AI流程提供完整性、保密性和可用性保障,构建“受保护管道”,用于安全的数据训练与推理。 * **微支付** 在AI Agent经济中具备潜力,可能解决互联网历史上微支付失败的核心痛点。 * **去中心化治理** 在AI模型的对齐与价值判断环节可能有价值,但主流AI公司缺乏交出控制权的动力。 报告同时指出了行业需要证明的两件事和两个待解难题: * **需证明**:1) 去中心化AI需在具体场景下与中心化方案进行严格的成本对比;2) Crypto支付需论证其在Agent支付场景下的真实效用优势。 * **待解难题**:1) AI安全需要系统层防御,而不仅是模型层护栏;2) 两者的结合会催生新的威胁,如无法关停的自主Agent。 最后,报告澄清了五个常见误区: 1. **区块链不能直接区分AI生成与人类生成内容**,只能保证记录不被篡改,无法保证记录的真实性。 2. **区块链本身解决不了AI的算法偏见**,但能促进透明度和扩大治理参与。 3. **给AI Agent一个钱包不等于让其“自主”**,这只是实现了支付自动化,并未赋予其抗审查或抗关停能力。 4. **透明的AI不等于可信的AI**,将数据来源和推理记录上链,与保证模型行为可信之间仍有巨大鸿沟。 5. **去中心化不一定更省钱**,任务总成本受通信效率影响,需要更多基准测试来验证。 总之,AI与Crypto的结合是一个充满潜力但尚需扎实验证的领域,当前更应关注实际证据而非叙事泡沫。

marsbit1 小時前

IC3 顶尖高校联手拆解:AI x Crypto 是真未来,还是叙事泡沫?

marsbit1 小時前

对比特币的判决已出:多数投资者认为BTC价格将走低,以下为数据

比特币投资者普遍看跌,多数预测市场、链上数据及情绪指标显示,投资者预期价格将进一步下跌。尽管比特币近期回升至6万美元以上,但周末跌破该水平导致许多交易员认为市场将再次探底。加密货币分析师Winter Soldier指出,预测市场上64%的订单押注比特币今年将跌破5万美元。 Polymarket预测市场目前定价显示,比特币在2026年底前跌至5.5万美元或更低的可能性为64%。分析师将此与上一周期对比,当时许多交易员认为2.8万美元是最终低点,但比特币随后跌至1.9万乃至1.5万美元。因此,分析师认为不能排除比特币从当前价格跌至3.5万至3.8万美元区间的可能性。尽管本轮周期因ETF和机构参与可能跌幅较浅,但5万美元不应被自动视为底部。 彩虹图分析显示,比特币现处于“买入”区间,且已在该区间停留24天(平均为18天),表明其价格相对于长期趋势已折价。目前价格距下限仅差5.5%,距上限则有27.2%的涨幅空间,显示比特币更接近历史估值区间的低端。然而,看涨方面临的问题是价格结构尚未确认反转:比特币出现大幅阴线、更低的高点和低点,卖盘压力持续至周中。若价格反弹至6.5万至6.6万美元区间,很可能只是为进一步下跌蓄势,形成多头陷阱而非买入信号。 总体来看,看跌阵营普遍认为比特币在形成坚实底部前,可能仍需经历一波跌向5万美元的痛苦过程,甚至有分析师预测底部将低于5万美元。

bitcoinist1 小時前

对比特币的判决已出:多数投资者认为BTC价格将走低,以下为数据

bitcoinist1 小時前

XRP实现盈亏比率大幅下滑 – 市场应有何预期

XRP已实现盈亏比率骤降,市场应如何预期? 随着XRP价格持续疲软,多项关键指标开始转向并大幅下滑。在下跌压力加剧的背景下,XRP的已实现盈亏比率已急剧下降至负值区域,反映了当前熊市阶段的强度。 投资者盈利状况受挫。XRP价格仍被困在1.2美元下方,看跌压力在短暂回升后重返市场。根据Glassnode的数据,该指标在90天时间框架内已降至0.38,表明投资者盈利能力下降。当前市场每产生1美元的亏损,仅有38美分的利润被实现,这与2025年峰值时利润压倒亏损50倍的情况已完全逆转。该比率远低于1,表明大多数移动代币的参与者正在亏本出售,这是市场出现剧烈恐慌性抛售的典型特征。 尽管价格表现不佳,XRP现货交易却在加速。数据显示,现货交易的增长主要由大型投资者或“巨鲸”引领,并且自2022年7月以来一直保持这种主导地位。这类交易者通常在积累阶段引领现货市场交易,而非在上涨阶段下大额订单。 此外,XRP正开始从加密货币交易所流出,其中韩国头部交易平台Upbit最为明显。其储备正在微妙下降。有分析指出,当Upbit上的XRP储备增长时,通常与看跌趋势相吻合;而当储备减少时,XRP往往会出现显著反弹。因此,如果这一趋势持续,价格反弹可能即将到来。

bitcoinist2 小時前

XRP实现盈亏比率大幅下滑 – 市场应有何预期

bitcoinist2 小時前

交易

現貨
合約

熱門文章

如何購買PEOPLE

歡迎來到HTX.com!在這裡,購買ConstitutionDAO (PEOPLE)變得簡單而便捷。跟隨我們的逐步指南,放心開始您的加密貨幣之旅。第一步:創建您的HTX帳戶使用您的 Email、手機號碼在HTX註冊一個免費帳戶。體驗無憂的註冊過程並解鎖所有平台功能。立即註冊第二步:前往買幣頁面,選擇您的支付方式信用卡/金融卡購買:使用您的Visa或Mastercard即時購買ConstitutionDAO (PEOPLE)。餘額購買:使用您HTX帳戶餘額中的資金進行無縫交易。第三方購買:探索諸如Google Pay或Apple Pay等流行支付方式以增加便利性。C2C購買:在HTX平台上直接與其他用戶交易。HTX 場外交易 (OTC) 購買:為大量交易者提供個性化服務和競爭性匯率。第三步:存儲您的ConstitutionDAO (PEOPLE)購買ConstitutionDAO (PEOPLE)後,將其存儲在您的HTX帳戶中。您也可以透過區塊鏈轉帳將其發送到其他地址或者用於交易其他加密貨幣。第四步:交易ConstitutionDAO (PEOPLE)在HTX的現貨市場輕鬆交易ConstitutionDAO (PEOPLE)。前往您的帳戶,選擇交易對,執行交易,並即時監控。HTX為初學者和經驗豐富的交易者提供了友好的用戶體驗。

782 人學過發佈於 2024.12.12更新於 2026.06.02

如何購買PEOPLE

相關討論

歡迎來到 HTX 社群。在這裡,您可以了解最新的平台發展動態並獲得專業的市場意見。 以下是用戶對 PEOPLE (PEOPLE)幣價的意見。

活动图片