AGI只差最后一步了

marsbit发布于2026-06-11更新于2026-06-11

文章摘要

Anthropic 发布了名为 Mythos 的强大 AI 模型，因其在网络安全和生物化学等领域展现出高风险能力而未公开。随后，该公司推出经过安全限制的版本 Fable 5。 Fable 5 在多项测试中表现卓越，尤其在编程和长周期任务上展现出真正的“长程代理能力”，能自主规划并完成复杂工作，例如在一天内迁移了 5000 万行遗留代码。这标志着其在数字经济层面已接近通用人工智能（AGI）。然而，其未受限版本 Mythos 5 被评估能合成危险物质及发动高级网络攻击，因此仅向经过严格审查的机构开放。为控制风险，Anthropic 为 Fable 5 部署了安全分类器和 30 天数据留存监控。在定价上，Fable 5 费用较高，主要面向企业客户。其防御性应用可能成为企业的刚需，推动高端 AI 市场向 B 端集中，并可能加速“一人企业”的普及。这标志着 AI 产业从免费试用走向成熟分工，顶尖技术将优先服务于高价值领域。

大家应该还记得4月份的时候,Anthropic发布了名为Mythos的模型。

看名字就知道多厉害了,神话。

当时,据说给50家企业客户找出了一万多个高危漏洞,震动了整个行业。

这个消息,一度导致网络安全股全线暴跌,大家应该还有印象。

因为过于强大,担心被滥用,“太危险不能公开”,所以不开放给公众。

直到昨天晚上,Anthropic给Mythos模型加上了安全分类器,正式上线了Fable 5。

至于未阉割的Mythos 5,目前只对白宫、网安防御者和透翅蝶计划等大约200家经过严格审查的机构开放。

如此谨慎,很难不让人联想到最近火热的AI动画《天使引擎》。

笼子里锁着的,是那位“天使”吗?

即便现在不是,也不远了。

01

根据Anthropic官方发布的测试数据,以及首批企业合作伙伴反馈的实测报告,Fable 5的强大可以用叹为观止四个字来形容。

先看跑分。

自动编程评测榜单SWE-Bench Pro,Claude Fable 5通过率80.3%,它的“母亲”Opus 4.8是69.2%;GPT-5.5是58.6%;Gemini 3.1 Pro只有 54.2%。

前沿代码评估,Fable 5达到29.3%,Opus 4.8是13.4%;GPT-5.5仅仅5.7%。

......

其中的差距,就相当于在冷兵器时代突然有人掏出了机关枪。

其余的,软件工程、独立科研假设、药物分子设计、模型蒸馏与极限压缩、长上下文理解等等等等,在几乎所有测试中,Fable 5都是第一。

具体的大家可以去找视频看。

再看实战。

支付巨头Stripe拿Fable 5做了一个早期测试。他们有一个高达5000万行的历史遗留代码库需要做全库迁移。按照评估,这种规模的重构,即便交给专业团队,也起码需要两个月。

结果,把任务喂给了Fable 5后,它全程自己做规划、自己检查进度、遇到报错自己修正。仅仅用了一天时间,5000万行代码的迁移干完了。

这种表现,不是“强大”两个词形容就完事了。

从狭义的角度来看,Fable 5其实已经实现了数字经济层面的AGI。

原因在于,它表现出了真正的“长程代理能力”。

不论是GPT-5.5还是Gemin 3.5,更不必说其它更次一些的大模型,本质上都是在“应答”。

你踹一脚,它走一步。

遇到死胡同,它只能抛异常,撒娇说“对不起我只是个语言模型”。

说是工具,但其实用户还是需要深度思考,一步步引导AI给出自己想要的结果,并不轻松。

具备了内化的目标导向逻辑的Fable 5就不一样。

就像Strip的测试,当用户给它一个高难度的长线任务,分三步走:

建立子任务树;

调度不同的工具(网页搜索、数据库拉取、Python沙箱环境);

自我反思,发现跑不通,立刻换条路走。

人除了提出任务和接收成果,不再需要在一旁指指点点。

作为一个生产力工具,这已经非常完美了。

但它和真正的AGI,依然是两码事。

Fable 5的强悍,是建立在它所处的代码库、科学文献等依然有一套底层的数学逻辑和结构定义。

它之所以能在长周期任务中不迷失,是因为克服了“长文本注意力衰减”这难题,在处理长达数百万token的复杂任务时,能够始终保持核心目标的对齐。

但一旦把它扔进一个完全混沌、缺乏数字规则、且人类自己都没整明白的物理现实社会泥潭里,它依然会因为“地基缺失”而产生逻辑断层。

如果用OpenAI提出的“人工智能五级标准”(1级:聊天机器人;2级:推理者;3级:智能体;4级:创新者;5级:组织)来衡量。

Opus 4.8是2级向3级迈进,Fable 5真正站稳了3级并向4级探索。

而从Opus 4.7到4.8用了43天,4.8到Fable 5只用了11天。

站稳4级需要多久?按照Anthropic如今更新频率越来越快的节奏来看,很可能在今年内就能实现。

即便最终的5级,乐观估计也只需18-24个月,是真正的只有一步之遥。

这个速度太快了,这也是为什么要给它加安全限制的最大原因。

02

在Anthropic随模型发布的《System Card》和RSP评估报告中,Mythos 5在两项能力上出现了极其危险信号。

其一,Fable/Mythos底层模型在化学和生物学评估中,已经达到了CB-1级别。

意思就是,该模型具备了“合成并指导制造非新型生物/化学武器”的端到端能力,甚至给出优化某种高危病毒传播效率的基因序列修改建议。

如果一个具备大学本科生物基础的恐怖分子,拿到了解除封印的Mythos 5,完全可以通过不断提示模型,获取如何规避原料监管、如何在地下室搭建简易P3实验室、如何合成高致死性病原体的完整指导。

其二,网络攻击与漏洞利用。

在极早期测试中,Mythos 5就展现出了能够自主寻找、并攻破关键基础设施(如电厂、金融清算系统、医院网络系统)核心漏洞的能力,几秒钟就能生成针对性的零日漏洞攻击脚本。

今年4月份Mythos刚研发出来时,就有爆料说给50家初始合作伙伴找出了超过一万个高危级别的漏洞。

......

针对这两种情况下,直接把Mythos 5扔给大众,危险性实在太高。

必须把这只猛兽关进笼子里。

时隔两个月,Anthropic打造的笼子有两层。

第一,静默降级路由机制。

Anthropic在Fable 5的前端部署了一套完全独立、反应极其敏锐的高精度分类器AI。

当用户输入一段复杂的、可能涉及网络攻防、生物化学、或者试图套取模型权重的隐蔽提示词时,分类器会立刻拉响警报,并是在后台静默地把会话切换路由到老款的Opus 4.8去回答。

第二,数据保留。

Anthropic与亚马逊昨晚联合宣布:不论是在第一方还是第三方平台,所有调用Mythos模型的流量,必须强制执行30天的数据留存。

为什么?

因为真正的黑客或恐怖分子,智商大多都很高,他们不会在一个对话里直接问“怎么制造炸弹”,而是把问题拆解成100个看似无害的基础问题。

30天的全量数据监控,就是为了通过模式识别,捕捉那些单次对话看不出来的“切香肠式”恶意滥用。

正如Dario Amodei之前在公开场合警告过的:“AI导致人类发生灾难性风险的概率,有整整25%。”

为了遵守公司内部制定的《负责任缩放政策》(RSP)以及《前沿合规框架》(FCF),Anthropic 必须亲手给这个巨兽戴上铰链。

于是,就有了Fable 5。

03

再聊价格。

Anthropic公布的官方标价是:每百万输入token10 美元,每百万输出token50美元。

太贵了。

现在的企业级Agent任务,为了追求高准确率,往往采用“多轮思考思考再思考”的链式逻辑,一轮吞吐可能就要吃掉2000万的输入token,然后吐出500万修改后代码。

算下来,单次任务就要450美元。

而且,Anthropic已经发出通告:现有的个人订阅(Claude Pro)中包含的Mythos模型体验窗口,将在2026年6月22日彻底关闭。

以后,个人用户要是真的拿它来工作,几十美元那真是眨眼就花掉了。

虽然说,随着技术更新,其价格最终必然会降下来,但等到那时它早就不是最强。

现状已经非常明显:最前沿的大模型变成了奢侈品,普通人根本用不起。

当然,对聚焦B端市场的Anthropic而言,这无可厚非。

问题是,前不久,谷歌还高调地宣布打价格战。

在竞争对手普遍降价抢市场的时候,为什么Anthropic敢逆势涨价?

因为Token价格是虚的,回报率才是根本。

企业客户根本不在乎一度电、一个Token多少钱,只要AI能完美无Bug地完成整套工程流,这个溢价他们抢着付。

更关键的是,如今的网络安全战,已经彻底成为AI与AI之间的对抗。

由于Fable/Mythos级别的模型能瞬间找到系统漏洞,企业和国家机构为了防止被攻击,唯一的选择只能是高价向Anthropic购买Mythos 5的内网私有化防御服务。

简单来说就是收保护费:我造出了最恐怖的剑(Mythos 5),我怕伤人所以套上剑鞘卖给大众(Fable 5),但我同时把不受限的剑卖给防御部门,让他们用来拦截别人正在研发的剑。

防御AI的威胁,将成为每一个大型企业的刚需支出。

这将直接导致B端市场的高端预算将更加向Anthropic集中,而那些只能用来写写公文、发发邮件的廉价模型,只能在利润极低的C端市场互相肉搏。

可以预见,接下来,全球网络安全板块将迎来一轮由AI驱动的价值重估。

与此同时,“一人企业”也将很快成为越来越普遍的现象。

04

自带任务预算分配功能,支持记忆工和上下文管理,能像人一样去记忆、推翻、重来,能独立承接从需求文档到代码交付的全生命周期......

Fable 5和Mythos 5的出现,与其说是大模型技术的一次更新,不如说是AI产业分工彻底走向成熟的成人礼。

AI市场初步告别了“全员免费试用”的田园时代。

最顶尖的算力和最深邃的智慧,将优先作为一种生产力战略物资,定向输送给最能产生商业价值的基建、科研和B端应用战场。

这是生产力爆炸的狂欢,也是劳动力市场的寒冬。

本文来自微信公众号“格隆”,作者:万连山

你可能也喜欢

明天请等待消息：这次日本银行将宣布其利率决定！这对比特币会产生什么影响？

在日本央行公布利率决议前夕，日元兑美元汇率大幅走强近3%，市场猜测日本当局可能再次干预汇市以支撑日元。美元/日元汇率日内下跌超400点，跌幅接近3%，为今年初干预以来最剧烈波动。此前，日元已跌至近40年低点，日本政府曾在4月底至5月底投入约732亿美元进行干预，以防止汇率突破160关口，但日元随后再次承压。市场分析认为，此次日元快速走强可能源于当局直接卖出外币的干预行为，不过日本财务省尚未就此发表声明。数据暗示，此前干预资金可能来自出售部分外国证券，包括美国国债。目前投资者聚焦日本央行利率决议及其对未来货币政策的信号。若日本央行释放鹰派信号或加息，可能进一步支撑日元走强。日元大幅升值可能对比特币造成短期抛压，因为它会增加“套利交易”平仓风险——即投资者借入低息日元投资比特币等高风险资产。若日本央行立场转鹰，此压力可能加剧。 *本文不构成投资建议。

cryptonews.ru35分钟前

cryptonews.ru35分钟前

美联储青睐的PCE通胀六年来首次月度下降，比特币保持稳定

比特币在美国通胀数据缓解、股市反弹的背景下保持稳定。美国6月个人消费支出（PCE）物价指数同比上涨3.7%，符合预期，并结束了近期的上升趋势，出现自2020年以来的首次月度下降。尽管如此，分析人士指出，通胀率仍远高于美联储2%的目标。与此同时，美联储在最新会议上维持利率不变，但内部政策分歧显现。加密资产管理公司Bitwise的首席投资官预测，未来美联储利率变动对比特币价格的影响将减弱，因为预期的利率调整幅度将比以往更小。

cointelegraph1小时前

cointelegraph1小时前

伯恩斯坦披露 Core Scientific 与 AMD 价值 140 亿美元交易的细节

加密货币矿业公司Core Scientific与芯片制造商AMD达成一项数据中心基础设施合作协议，初始合约涉及530兆瓦容量。据Bernstein分析师估算，该协议在15年内可能为Core Scientific带来超过140亿美元的收入，AMD则实际上为部分比特币矿商的基础设施提供了信贷担保。具体而言，530兆瓦中，377兆瓦为AMD直接以“三重净租赁”模式承租，余下152兆瓦由一家未具名的云提供商承租，并获得AMD的信贷支持。分析师认为，这种结构降低了融资成本和交易对手风险。AMD还获得了以每股23.47美元购买3000万股Core Scientific股份的认股权证，其归属与双方实现总计2.5吉瓦容量的目标挂钩。分析师估计，该协议年均收入约为9亿美元，即每兆瓦约180万美元，略低于近期矿商与AI客户达成的交易水平。然而，AMD直接承租部分毛利率接近100%，整体交易混合EBITDA利润率估约96%。Core Scientific预计相关资本支出为每兆瓦1100-1200万美元，总计约60亿美元。 Bernstein指出，这笔交易标志着前比特币矿商向AI基础设施运营商转型的新阶段。近期类似案例包括Hut 8为据信是英伟达的客户预留704兆瓦，以及AMD向Riot Platforms预订200兆瓦。此前，Core Scientific曾向Block支付4190万美元，终止了矿机芯片供应合同，以加速向AI业务多元化。

cryptonews.ru1小时前

伯恩斯坦披露 Core Scientific 与 AMD 价值 140 亿美元交易的细节

cryptonews.ru1小时前

Hyperscale Data 出售 100 枚比特币为密歇根 AI 数据中心提供资金

比特币矿企Hyperscale Data已出售约100枚比特币，并获得了比特币支持的信贷额度，用于资助其密歇根人工智能数据中心的建设。出售所得将用于资助该数据中心的建设、购买关键基础设施及长周期设备，而信贷额度预计提供约4.5%至5.0%的可变利率融资。该数据中心旨在履行此前与一家未具名AI基础设施提供商签订的主服务协议，初始将支持约20兆瓦的AI算力。这份为期10年的协议包含两个可选5年延期，若完全执行，预计将产生超12亿美元收入。该AI提供商还有权在协议前两年额外增加32兆瓦容量，若全部执行并维持至延期阶段，合同总价值将超过30亿美元。该公司原名Ault Alliance，于2024年更名为Hyperscale Data，在保留比特币挖矿业务的同时将重心转向AI基础设施。其美股股价在消息发布当日午盘上涨超5%。数据显示，该公司目前仍持有约1,006枚比特币，为全球第44大公开持币上市公司。

cointelegraph1小时前

Hyperscale Data 出售 100 枚比特币为密歇根 AI 数据中心提供资金

cointelegraph1小时前

贝莱德推动比特币ETF恢复，在连续4天资金流出后实现3200万美元净流入

加密货币ETF市场在7月29日周三再度转向。比特币在连续四日资金流出后迎来买家，而Solana则几乎以同等规模的流入收复了前一日的显著跌幅。贝莱德的IBIT ETF成为比特币ETF复苏的主要动力，单日流入8983万美元，抵消了富达FBTC流出4308万美元和ARK 21Shares ARKB流出1464万美元的影响。最终，比特币ETF类别实现净流入3211万美元。以太坊ETF则表现分化。新推出的摩根士丹利质押基金MSSE吸引了1430万美元，贝莱德的ETHA ETF流入516万美元。然而，富达FETH流出1607万美元、灰度ETHE和Ether Mini Trust分别流出974万和809万美元等五款产品的资金流出超过了流入，导致该类别净流出1865万美元。 Solana ETF吸引1906万美元资金流入，完全抵消了前一交易日1807万美元的流出。所有新资金均流入新推出的摩根士丹利质押支持ETF MSOL。摩根士丹利新推出的质押相关产品需求显著，MSSE两日内吸引1945万美元，MSOL在首个资金流入日便吸引1900万美元。 XRP ETF也重回净流入，富兰克林邓普顿的XRPZ流入58.471万美元，增幅温和。Hyperliquid（$HYPE）ETF则持续承压，Bitwise的BHYP基金流出878万美元，已是该类别连续第五日下跌。最新资金流数据显示，市场仍愿承担加密风险，但选择性增强。比特币重获支撑，Solana反弹，质押产品受关注，而以太坊和$HYPE则面临又一轮抛售。

cryptonews.ru1小时前

cryptonews.ru1小时前

交易

现货

AGI只差最后一步了

文章摘要

01

02

03

04

热门币种推荐

相关问答

你可能也喜欢

明天请等待消息：这次日本银行将宣布其利率决定！这对比特币会产生什么影响？

美联储青睐的PCE通胀六年来首次月度下降，比特币保持稳定

伯恩斯坦披露 Core Scientific 与 AMD 价值 140 亿美元交易的细节

Hyperscale Data 出售 100 枚比特币为密歇根 AI 数据中心提供资金

贝莱德推动比特币ETF恢复，在连续4天资金流出后实现3200万美元净流入

交易

热门文章

如何购买ONE

相关讨论

热门问答

热门分类

热门标签