Anthropic 高喊狼（AGI）来了，是为了人类还是IPO？

marsbit发布于2026-06-05更新于2026-06-05

文章摘要

Anthropic发布题为《当AI自我构建时》的长文，探讨AI“递归自我改进”的潜在可能。文章指出，Claude已深度参与自身研发：截至2026年5月，公司代码库80%以上的代码由Claude编写；在开放式复杂工程任务中，Claude成功率半年内提升50个百分点；它还能进行代码审查、优化训练代码（实现52倍加速），并在某些研究任务中表现优于人类研究员。 Anthropic展示了AI在研发中的参与度演进：从人类主导，到AI辅助，再到AI智能体自主编码与协作。公司警告，若AI进入“闭合回路”实现自我持续改进，将带来重大风险，因此呼吁社会考虑建立前沿AI开发的减速或暂停机制，以协调技术进步与安全对齐。然而，文章发布时间点恰逢Anthropic筹备IPO，其论述也被视为一种市场叙事：强调Claude不仅是产品，更是驱动公司研发飞轮的核心工具，通过加速自身迭代（模型更新周期已缩短至42天）来构建竞争壁垒。此前OpenAI也在政策文件中提及AI自我改进的早期迹象，但Anthropic通过具体数据突出了自身在该路径上的领先地位，既警示风险，也展示了技术实力。

文 | 字母AI

Anthropic昨晚发布了一篇长文，标题为《When AI builds itself》（当AI自我构建时），听起来像是阿西莫夫的某本科幻小说，主题也确实是一个很科幻的概念：recursive self-improvement（递归自我改进）。

简单说，过去是人类研究员写代码、跑实验、训练模型，然后把AI做得更强。可如果AI自己开始参与设计、训练、测试、优化自己的后继版本，那么AI进步的速度就不再只是由人类推动，可能开始由AI“自我进化”。

为此，Anthropic发出呼吁：

“我们认为，如果世界能够选择放缓或暂时中止前沿AI的开发，让社会结构和对齐研究跟上技术进步，这对世界大有裨益。”

这句话听起来像安全警告，但放在Anthropic准备IPO的时间点上，它也很难不被看作另一种叙事预演：Claude实在太好用了，甚至开始自己创造下一代Claude了。

新的风暴已经出现

为了说明AI正在越来越多地参与AI研发本身。Anthropic拿出了大量内部数据。

比如，截至2026年5月，Anthropic合并进代码库的代码中，超过80%由Claude编写。而在Claude Code发布之前，这个数字还仅是个位数。

到2026年第二季度，按Anthropic的统计，工程师每天合并的代码量已经比2024年高出约8倍。

比代码量更值得注意的是，Claude正在处理更开放的工程问题。

Anthropic在文中说，过去一年里，员工纠正Claude、把Claude拉回正轨，或者中途接手任务的频率一直在下降。这个变化不只发生在简单任务上，也发生在最复杂的开放任务上。

所谓开放任务，就是没有明确说明书的问题。比如系统崩了、训练任务挂了，工程师自己一开始也不知道答案长什么样，只能一边排查一边判断。

这类任务过去最依赖人的经验，而在那些最开放的任务里，Claude的成功率到2026年5月已经达到76%，六个月内提高了50个百分点。

不只是写代码，Anthropic还用Claude做代码审查，检查bug、安全漏洞和其他缺陷，他们回溯分析发现，如果过去每次代码变更都经过Claude自动审查，大约三分之一导致claude.ai线上事故的bug，本可以在上线前被拦下来。

更进一步，Claude已经开始参与研究流程。

Anthropic有一个固定测试：给Claude一段训练小模型的代码，让它在不改错结果的前提下，想办法把代码跑得更快。2025年5月，Claude Opus 4大概能跑出3倍加速；到了2026年4月，Claude Mythos Preview已经把这个数字推到了约52倍。

Anthropic还提到一个开放式AI安全研究案例。他们把一个问题交给Claude驱动的智能体：一个较弱模型能不能可靠监督一个更强模型？

这个过程需要提出假设、测试假设、和并行智能体共享发现、反复迭代。

两位人类研究员花了一周时间，弥合了大约23%的差距；而Claude在累计约800小时、约1.8万美元算力消耗下，弥合了97%。

这项结果当然有局限，问题是人类选的，评分标准也是人类定的，结果也没有完全迁移到生产规模模型上。但它仍然说明，Claude已经可以在一个人类设定好方向的研究框架里，自己设计实验、自己执行、自己迭代。

另外，在人类研究员“走错路”的时候，Claude还能给出更好的下一步判断。

Anthropic找了129个内部Claude Code研究会话，这些会话里，人类研究员和Claude一起解决开放式研究问题。Anthropic挑出其中一些“人类后来证明绕了弯路”的节点，然后把这个节点之前的上下文给不同版本的Claude，看它会建议下一步怎么做。再由另一个知道完整会话结局的Claude judge来判断：模型建议和人类当时的选择，哪个更好。

结果表明，在那些人类研究员已经被事后证明有改进空间的节点上，Claude越来越能提出更好的下一步。

过去，AI模型的进步主要靠人类研究员和工程师推动。人类决定做什么实验、写代码，训练模型、推动AI的功能迭代。

现在，这条链条里越来越多的环节，开始被Claude接走。

Anthropic给出了一个很直观的阶段表：

2021到2023年，Anthropic和普通科技公司没什么区别，都是人类在笔记本电脑上写代码、写文档。

2023到2025年，聊天机器人开始进入工作流。工程师让模型生成代码片段，再复制到编辑器里。

2025到2026年，编程智能体出现，Claude开始能自主编写和修改代码，有时甚至能独立完成整个文件。

到了今天，智能体已经可以自己运行代码，还能把长达数小时的工作委派给其他智能体。

再往后，就是Anthropic真正担心的那个阶段：闭合回路。

如果这一天到来，Claude的后续版本，就可能由Claude自身持续改进——这就是recursive self-improvement，递归自我改进。

Anthropic在文中说得很谨慎：我们还没有走到那一步，递归自我改进也不是必然发生。但它依然在强调，通往那一步的路径，已经开始变得可见。

所以Anthropic才会在文章最后谈到减速，甚至暂停。它的意思不是现在所有AI公司立刻停工，而是说，如果未来AI自我改进风险继续上升，前沿实验室需要一套协调、可验证的减速机制。

换句话讲，“奇点”就要到了，人类必须加以控制。

势不可挡的Claude

如果只看表面，这是一篇非常具有前瞻意识的安全文档。Anthropic在讲递归自我改进，讲AI可能越来越快地改进自己，讲人类社会需要提前准备减速和暂停机制。

但放在Anthropic准备IPO的时间点上，这篇文章就有了另一层意思。

某种意义上，A厂最近的动态很像班上那种欠儿欠儿的优等生——它确实有能耐，但也确实很装。

它想说的不只是“我们有一个很强的Claude”，比这更前一步，它想说“Claude正在帮助我们制造更强的Claude”。

如果Anthropic只是卖一个模型或者卖一个工具，它就很难彻底摆脱横向比较：Anthropic有Claude，OpenAI有GPT；Anthropic有Claude Code，OpenAI有Codex；Anthropic抢企业客户，OpenAI也抢企业客户。两家公司的竞争非常胶着，就看谁能向市场讲出更大的故事。

需要注意的是，就在3天前，OpenAI前脚在一份关于前沿AI治理的文件里写道：

“我们也在今天的系统中看到了递归自我改进的早期迹象：AI的发展本身正在被AI加速。

这将加剧开发者和国家之间的竞争压力，并带来现有机构无法应对的治理挑战。”

3天后，Anthropic后脚就说：Claude通往递归自我改进的路径，已经开始变得可见。

要是Claude真如它所期待的那样发展，就不是普通产品叙事了，它会变成一个研发飞轮。

Claude写代码、跑实验、优化训练流程，再反过来减少Anthropic自己产品里的事故……一旦这套系统跑起来，Claude就不只是Anthropic的一个产品，也是Anthropic的重要生产工具。

用户看到的是Claude这个产品，企业客户买的是Claude的能力，但Anthropic真正想让资本市场注意的是：Claude已经嵌入了前沿模型研发的底层流程，它被放到了Anthropic的发动机舱里。

资本市场最喜欢听飞轮的故事，像聚宝盆一样财源滚滚：更强的Claude让Anthropic的工程师能合并更多代码，更多代码让产品和基础设施迭代更快，更快的迭代让研究员能跑更多实验，更多实验又反过来帮助下一代Claude变强。下一代Claude变强后，再继续加速Anthropic的研发。

Claude的迭代速度也在支撑这个飞轮。从公开发布时间看，2023年到2025年初，Claude的主要模型更新大多是三四个月一轮，但在进入Claude 4之后，Anthropic的模型更新明显变密。

Claude 4在2025年5月发布，Opus 4.1在8月发布，Sonnet 4.5在9月发布，Haiku 4.5在10月发布，Opus 4.5在11月发布。

到了2026年，Opus 4.6在2月5日发布，Sonnet 4.6在2月17日发布，Opus 4.7在4月15日发布，Opus 4.8在5月28日发布。Opus 4.7到Opus 4.8，只隔了42天。

Anthropic表面上是在说“这件事可能很危险，我们要提前准备刹车”，但它同时也在暗示：“我们已经看见油门踩下去之后会发生什么。”

IPO叙事的微妙之处就在于此。它一边把风险讲得很重，一边也把自己的技术位置抬得很高。

不是所有AI公司都有资格讨论递归自我改进，你得先让外界相信，你的AI已经进入了AI研发流程，才有资格说这件事可能需要全球协调。

OpenAI：怎么可以这样？

前面提到，就在Anthropic发这篇长文之前，OpenAI刚刚把递归自我改进摆上了桌。

但两家公司的讲法很不一样。

OpenAI那篇《Democratic Governance of Frontier AI》，是一份写给华盛顿的政策蓝图，它关心的不是“模型怎么变强”，而是当前沿AI继续往前冲，该如何加以约束。

那篇报告里面提到的大多内容不太适合加以赘述，唯独一句话关键：OpenAI说，今天的系统中，已经可以看到递归自我改进的早期迹象。

这句话和Anthropic这篇长文，其实指向同一个方向。

只不过OpenAI在讲制度，Anthropic在讲自己。

OpenAI的意思是：AI发展太快，现有治理结构可能跟不上，所以需要一套新的规则。

而Anthropic直接把那个系统亮了出来，告诉市场：Claude已经进入了我们的研发流程，所以我们看见了AI自我加速的路径。

这一手玩得很高明，感觉OpenAI内部指不定已经开始蛐蛐了——这简直是剽窃创意！明明是我们先来的！

开个玩笑，不过OpenAI确实需要加把劲了，快点把GPT 5.6抬上来吧。

你可能也喜欢

比特币「反弹结束」，正式进入熊市后期？

比特币近期下跌13%，价格回落至关键成本均线区间，市场呈现熊市后期特征。已实现盈亏比大幅下滑，显示亏损交易主导市场，82k美元的反弹被确认为熊市反弹而非趋势转折。每日已实现亏损激增至13.5亿美元，长期持有者开始割肉，供应再分配进程加速但尚未完成。价格在美国现货ETF平均成本价83k美元附近受阻，该位置成为强阻力位，ETF投资者重回浮亏状态。现货市场卖压加剧，订单流显著偏向卖方，需求疲软。衍生品市场方面，尽管价格波动，隐含波动率持续压缩，但波动率风险溢价扩大，期权市场仍为下行风险定价。宏观上，美国经济数据强劲，加息预期升温，金融条件收紧，比特币面临宏观逆风。链上数据显示，短期持有者成本基础已跌破关键均值，新买家承压。整体来看，市场在盈利能力、投资者情绪和需求层面均显疲态，在出现明确的现货需求复苏和抛压缓解信号前，可能继续在熊市结构中盘整或下行。

Foresight News12分钟前

Foresight News12分钟前

MSTR 与 STRC 的「死亡螺旋」风险有多大？

MicroStrategy（MSTR）近期出售32枚比特币引发市场担忧，其股价及旗下永续优先股STRC价格均出现下跌。文章分析了MSTR、比特币（BTC）与STRC深度绑定的结构，并与已崩溃的LUNA-UST算法稳定币系统进行比较。核心结论是，尽管MSTR-STRC结构与LUNA-UST在表面上有相似之处（如价格锚定、高收益和潜在的螺旋下跌风险），但两者存在根本差异。STRC的价格稳定依赖于股息率调整和公司信用，而非UST那种直接影响LUNA供给的算法机制。STRC持有人在公司破产时对剩余资产拥有优先追索权，这提供了价格下限支撑，与UST可归零不同。此外，MSTR支付股息的能力依赖于其通过增发股票等方式持续融资，而非UST那种依赖外部协议收益的模式。目前，MicroStrategy的美元储备仅能支撑约6个月的利息和股息支出，未来融资能力高度依赖市场对比特币的信心以及其股价表现。文章指出，只要比特币价格不跌破约2.63万美元，优先股股东本金损失风险较低；且公司净杠杆率仅11%，因债务导致破产的概率很小。未来六个月被视为关键期。若比特币市场能在此期间触底回暖，MicroStrategy或能通过健康去杠杆重启其资本运作引擎。总体来看，MSTR-STRC发生类似LUNA-UST那种灾难性“死亡螺旋”的概率极低，但其可持续性仍取决于市场信心和未来半年的融资环境。

Foresight News30分钟前

Foresight News30分钟前

Strategy到底有多少债务？有没有可能暴雷？

截至2026年6月3日，微策略持有84.3万枚比特币，市值约531亿美元。但其债务结构复杂，背负67亿美元可转债和155亿美元永续优先股，年化付息义务高达17.12亿美元。其中仅STRC优先股规模就达85亿美元，年股息支出近10亿美元，远超公司软件业务约5亿美元的年收入。 2026年5月，微策略以平均77,135美元的价格出售了32枚比特币，打破了其“永不卖币”的承诺，引发市场对其现金流压力的担忧。公司债务管理的核心依赖于mNAV（股价对比特币净资产价值的溢价）维持高位，从而通过发行股票或优先股融资。如果mNAV溢价消失或比特币长期滞涨，其融资能力将枯竭，可能被迫持续卖币付息。尽管面临付息压力，但微策略持有的比特币并未用作任何债务抵押，不存在强制清算风险。最坏情况下，公司每年需出售约2.7万枚比特币（占持仓3.2%）来支付利息，对市场实际抛压有限。微策略的本质已从单纯持有比特币转变为一家以比特币为底层资产、通过复杂金融工具进行融资和付息的“私人比特币银行”。其长期可持续性依赖于比特币持续上涨、mNAV保持溢价以及优先股融资渠道畅通这三个关键条件。短期来看，公司现金储备仍能覆盖数月付息义务，暂无暴雷风险，但2027年将是其债务到期兑付的关键观察窗口。

marsbit41分钟前

marsbit41分钟前

比特币表现大幅落后于美光科技，投资者偏爱半导体行业敞口

在经历了长时间的价格低迷后，比特币（BTC）正濒临跌破63,000美元关口，与其126,000美元的历史高点相比已大幅回落。数据显示，其表现已显著落后于股市中的部分资产，特别是半导体股票。以美光科技（Micron Technology）为例，尽管比特币常被视为当代最佳投资品之一，但当前市场表现已远逊于该半导体巨头。报告指出，比特币相对于美光科技的汇率已暴跌超过95%。这一差距反映了投资者资金正转向人工智能（AI）和半导体等“新经济”基础设施领域，表明全球资本正在发生深度轮动。与此同时，比特币的横盘表现正在影响投资者行为。链上数据显示，过去一周，持有10至10,000 BTC的“鲸鱼”和“鲨鱼”地址已减持超过24,602枚BTC（降幅约18%），这可能意味着市场进入高度谨慎阶段。相反，持有不足0.01 BTC的小额交易者却在持续买入，同期增持超过61枚BTC。这种大额持有者抛售而小额持有者吸筹的现象，被认为是值得关注的市场底部信号。有市场专家将2026年称为“加密货币萧条年”，但也认为这可能是行情转变的一年，加密货币最终可能成为与股票相对的逆向投资选择。关键是需要跟随数据指标，洞察市场真正的动向。

bitcoinist44分钟前

bitcoinist44分钟前

Coinbase 冻结与诈骗活动相关的300万美元加密货币，瞄准加密货币犯罪

美国司法部联合多国执法机构及私营企业，在近期协调开展的“破坏周”行动中，打击东南亚诈骗网络。Coinbase作为合作方，冻结了与诈骗活动相关的超300万美元加密货币。此次行动由美国司法部诈骗中心打击工作组牵头，集合了Meta、微软、SpaceX旗下Starlink等科技公司，以及金融、通信机构。行动成果包括捣毁相关服务器、干扰超140万个社交媒体与电邮账户、泰国警方实施逮捕等。诈骗手段以“杀猪盘”和投资欺诈为主，规模持续扩大。FBI数据显示，2025年与加密货币及AI相关的诈骗造成超110亿美元损失。今年4月，工作组已冻结超7.01亿美元涉投资诈骗的加密资产，打击行动亦扩展至迪拜、阿尔巴尼亚等地。 Coinbase指出，区块链为调查提供了永久交易记录，反驳了加密货币仅为犯罪工具的观点。官方策略侧重于持续打击诈骗基础设施，包括网站、通信渠道、服务器和资金流，旨在瓦解诈骗网络的运作能力。

bitcoinist1小时前

bitcoinist1小时前

交易

现货

合约

Anthropic 高喊狼（AGI）来了，是为了人类还是IPO？

文章摘要

新的风暴已经出现

势不可挡的Claude

OpenAI：怎么可以这样？

相关问答

你可能也喜欢

比特币「反弹结束」，正式进入熊市后期？

MSTR 与 STRC 的「死亡螺旋」风险有多大？

Strategy到底有多少债务？有没有可能暴雷？

比特币表现大幅落后于美光科技，投资者偏爱半导体行业敞口

Coinbase 冻结与诈骗活动相关的300万美元加密货币，瞄准加密货币犯罪

交易

热门文章

如何购买NIGHT

热币学习周3：“UNIfication”治理提案截止12月25日，NIGHT或为 Cardano 2026 增长催化剂

相关讨论

热门问答

热门分类

热门标签