Anthropic 高喊狼(AGI)来了,是为了人类还是IPO?

marsbitDipublikasikan tanggal 2026-06-05Terakhir diperbarui pada 2026-06-05

Abstrak

Anthropic发布题为《当AI自我构建时》的长文,探讨AI“递归自我改进”的潜在可能。文章指出,Claude已深度参与自身研发:截至2026年5月,公司代码库80%以上的代码由Claude编写;在开放式复杂工程任务中,Claude成功率半年内提升50个百分点;它还能进行代码审查、优化训练代码(实现52倍加速),并在某些研究任务中表现优于人类研究员。 Anthropic展示了AI在研发中的参与度演进:从人类主导,到AI辅助,再到AI智能体自主编码与协作。公司警告,若AI进入“闭合回路”实现自我持续改进,将带来重大风险,因此呼吁社会考虑建立前沿AI开发的减速或暂停机制,以协调技术进步与安全对齐。 然而,文章发布时间点恰逢Anthropic筹备IPO,其论述也被视为一种市场叙事:强调Claude不仅是产品,更是驱动公司研发飞轮的核心工具,通过加速自身迭代(模型更新周期已缩短至42天)来构建竞争壁垒。此前OpenAI也在政策文件中提及AI自我改进的早期迹象,但Anthropic通过具体数据突出了自身在该路径上的领先地位,既警示风险,也展示了技术实力。

文 | 字母AI

Anthropic昨晚发布了一篇长文,标题为《When AI builds itself》(当AI自我构建时),听起来像是阿西莫夫的某本科幻小说,主题也确实是一个很科幻的概念:recursive self-improvement(递归自我改进)。

简单说,过去是人类研究员写代码、跑实验、训练模型,然后把AI做得更强。可如果AI自己开始参与设计、训练、测试、优化自己的后继版本,那么AI进步的速度就不再只是由人类推动,可能开始由AI“自我进化”。

为此,Anthropic发出呼吁:

“我们认为,如果世界能够选择放缓或暂时中止前沿AI的开发,让社会结构和对齐研究跟上技术进步,这对世界大有裨益。”

这句话听起来像安全警告,但放在Anthropic准备IPO的时间点上,它也很难不被看作另一种叙事预演:Claude实在太好用了,甚至开始自己创造下一代Claude了。

新的风暴已经出现

为了说明AI正在越来越多地参与AI研发本身。Anthropic拿出了大量内部数据。

比如,截至2026年5月,Anthropic合并进代码库的代码中,超过80%由Claude编写。而在Claude Code发布之前,这个数字还仅是个位数。

到2026年第二季度,按Anthropic的统计,工程师每天合并的代码量已经比2024年高出约8倍。

比代码量更值得注意的是,Claude正在处理更开放的工程问题。

Anthropic在文中说,过去一年里,员工纠正Claude、把Claude拉回正轨,或者中途接手任务的频率一直在下降。这个变化不只发生在简单任务上,也发生在最复杂的开放任务上。

所谓开放任务,就是没有明确说明书的问题。比如系统崩了、训练任务挂了,工程师自己一开始也不知道答案长什么样,只能一边排查一边判断。

这类任务过去最依赖人的经验,而在那些最开放的任务里,Claude的成功率到2026年5月已经达到76%,六个月内提高了50个百分点。

不只是写代码,Anthropic还用Claude做代码审查,检查bug、安全漏洞和其他缺陷,他们回溯分析发现,如果过去每次代码变更都经过Claude自动审查,大约三分之一导致claude.ai线上事故的bug,本可以在上线前被拦下来。

更进一步,Claude已经开始参与研究流程。

Anthropic有一个固定测试:给Claude一段训练小模型的代码,让它在不改错结果的前提下,想办法把代码跑得更快。2025年5月,Claude Opus 4大概能跑出3倍加速;到了2026年4月,Claude Mythos Preview已经把这个数字推到了约52倍。

Anthropic还提到一个开放式AI安全研究案例。他们把一个问题交给Claude驱动的智能体:一个较弱模型能不能可靠监督一个更强模型?

这个过程需要提出假设、测试假设、和并行智能体共享发现、反复迭代。

两位人类研究员花了一周时间,弥合了大约23%的差距;而Claude在累计约800小时、约1.8万美元算力消耗下,弥合了97%。

这项结果当然有局限,问题是人类选的,评分标准也是人类定的,结果也没有完全迁移到生产规模模型上。但它仍然说明,Claude已经可以在一个人类设定好方向的研究框架里,自己设计实验、自己执行、自己迭代。

另外,在人类研究员“走错路”的时候,Claude还能给出更好的下一步判断。

Anthropic找了129个内部Claude Code研究会话,这些会话里,人类研究员和Claude一起解决开放式研究问题。Anthropic挑出其中一些“人类后来证明绕了弯路”的节点,然后把这个节点之前的上下文给不同版本的Claude,看它会建议下一步怎么做。再由另一个知道完整会话结局的Claude judge来判断:模型建议和人类当时的选择,哪个更好。

结果表明,在那些人类研究员已经被事后证明有改进空间的节点上,Claude越来越能提出更好的下一步。

过去,AI模型的进步主要靠人类研究员和工程师推动。人类决定做什么实验、写代码,训练模型、推动AI的功能迭代。

现在,这条链条里越来越多的环节,开始被Claude接走。

Anthropic给出了一个很直观的阶段表:

2021到2023年,Anthropic和普通科技公司没什么区别,都是人类在笔记本电脑上写代码、写文档。

2023到2025年,聊天机器人开始进入工作流。工程师让模型生成代码片段,再复制到编辑器里。

2025到2026年,编程智能体出现,Claude开始能自主编写和修改代码,有时甚至能独立完成整个文件。

到了今天,智能体已经可以自己运行代码,还能把长达数小时的工作委派给其他智能体。

再往后,就是Anthropic真正担心的那个阶段:闭合回路

如果这一天到来,Claude的后续版本,就可能由Claude自身持续改进——这就是recursive self-improvement,递归自我改进。

Anthropic在文中说得很谨慎:我们还没有走到那一步,递归自我改进也不是必然发生。但它依然在强调,通往那一步的路径,已经开始变得可见。

所以Anthropic才会在文章最后谈到减速,甚至暂停。它的意思不是现在所有AI公司立刻停工,而是说,如果未来AI自我改进风险继续上升,前沿实验室需要一套协调、可验证的减速机制。

换句话讲,“奇点”就要到了,人类必须加以控制。

势不可挡的Claude

如果只看表面,这是一篇非常具有前瞻意识的安全文档。Anthropic在讲递归自我改进,讲AI可能越来越快地改进自己,讲人类社会需要提前准备减速和暂停机制。

但放在Anthropic准备IPO的时间点上,这篇文章就有了另一层意思。

某种意义上,A厂最近的动态很像班上那种欠儿欠儿的优等生——它确实有能耐,但也确实很装。

它想说的不只是“我们有一个很强的Claude”,比这更前一步,它想说“Claude正在帮助我们制造更强的Claude”。

如果Anthropic只是卖一个模型或者卖一个工具,它就很难彻底摆脱横向比较:Anthropic有Claude,OpenAI有GPT;Anthropic有Claude Code,OpenAI有Codex;Anthropic抢企业客户,OpenAI也抢企业客户。两家公司的竞争非常胶着,就看谁能向市场讲出更大的故事。

需要注意的是,就在3天前,OpenAI前脚在一份关于前沿AI治理的文件里写道:

“我们也在今天的系统中看到了递归自我改进的早期迹象:AI的发展本身正在被AI加速。

这将加剧开发者和国家之间的竞争压力,并带来现有机构无法应对的治理挑战。”

3天后,Anthropic后脚就说:Claude通往递归自我改进的路径,已经开始变得可见。

要是Claude真如它所期待的那样发展,就不是普通产品叙事了,它会变成一个研发飞轮。

Claude写代码、跑实验、优化训练流程,再反过来减少Anthropic自己产品里的事故……一旦这套系统跑起来,Claude就不只是Anthropic的一个产品,也是Anthropic的重要生产工具。

用户看到的是Claude这个产品,企业客户买的是Claude的能力,但Anthropic真正想让资本市场注意的是:Claude已经嵌入了前沿模型研发的底层流程,它被放到了Anthropic的发动机舱里。

资本市场最喜欢听飞轮的故事,像聚宝盆一样财源滚滚:更强的Claude让Anthropic的工程师能合并更多代码,更多代码让产品和基础设施迭代更快,更快的迭代让研究员能跑更多实验,更多实验又反过来帮助下一代Claude变强。下一代Claude变强后,再继续加速Anthropic的研发。

Claude的迭代速度也在支撑这个飞轮。从公开发布时间看,2023年到2025年初,Claude的主要模型更新大多是三四个月一轮,但在进入Claude 4之后,Anthropic的模型更新明显变密。

Claude 4在2025年5月发布,Opus 4.1在8月发布,Sonnet 4.5在9月发布,Haiku 4.5在10月发布,Opus 4.5在11月发布。

到了2026年,Opus 4.6在2月5日发布,Sonnet 4.6在2月17日发布,Opus 4.7在4月15日发布,Opus 4.8在5月28日发布。Opus 4.7到Opus 4.8,只隔了42天。

Anthropic表面上是在说“这件事可能很危险,我们要提前准备刹车”,但它同时也在暗示:“我们已经看见油门踩下去之后会发生什么。”

IPO叙事的微妙之处就在于此。它一边把风险讲得很重,一边也把自己的技术位置抬得很高。

不是所有AI公司都有资格讨论递归自我改进,你得先让外界相信,你的AI已经进入了AI研发流程,才有资格说这件事可能需要全球协调。

OpenAI:怎么可以这样?

前面提到,就在Anthropic发这篇长文之前,OpenAI刚刚把递归自我改进摆上了桌。

但两家公司的讲法很不一样。

OpenAI那篇《Democratic Governance of Frontier AI》,是一份写给华盛顿的政策蓝图,它关心的不是“模型怎么变强”,而是当前沿AI继续往前冲,该如何加以约束。

那篇报告里面提到的大多内容不太适合加以赘述,唯独一句话关键:OpenAI说,今天的系统中,已经可以看到递归自我改进的早期迹象。

这句话和Anthropic这篇长文,其实指向同一个方向。

只不过OpenAI在讲制度,Anthropic在讲自己。

OpenAI的意思是:AI发展太快,现有治理结构可能跟不上,所以需要一套新的规则。

而Anthropic直接把那个系统亮了出来,告诉市场:Claude已经进入了我们的研发流程,所以我们看见了AI自我加速的路径。

这一手玩得很高明,感觉OpenAI内部指不定已经开始蛐蛐了——这简直是剽窃创意!明明是我们先来的!

开个玩笑,不过OpenAI确实需要加把劲了,快点把GPT 5.6抬上来吧。

Pertanyaan Terkait

QAnthropic在文章中提到的“递归自我改进”是什么概念?

A“递归自我改进”指的是AI系统能够主动参与到自身后续版本的设计、训练、测试和优化过程中,从而可能实现AI自我进化,而非仅依靠人类研究员的推动。Anthropic在文章中表明,他们看到Claude正在向这个方向发展,但尚未实现。

Q根据文章,Claude在Anthropic内部代码开发中扮演了什么角色?有什么具体数据支持?

A根据文章,Claude已成为Anthropic代码开发的核心工具。具体数据包括:截至2026年5月,Anthropic代码库中超过80%的代码由Claude编写;工程师每日合并的代码量比2024年高出约8倍;在最开放的工程问题上,Claude在2026年5月的成功率已达到76%,在六个月内提高了50个百分点。

QAnthropic发表这篇关于AI“递归自我改进”文章的背后,可能有什么商业意图?

A文章分析认为,Anthropic在准备IPO的时间点发表此文,除了探讨AI安全风险,也是一种商业叙事策略。其意图在于向资本市场展示Claude不仅是一个强大的AI产品,更已深度嵌入其自身研发流程,形成了一个加速AI进步的“飞轮”,从而提升了公司的技术壁垒和长期价值预期。

QOpenAI和Anthropic对“递归自我改进”的讨论有何不同?

A文章指出,两家公司讨论的侧重点不同。OpenAI在其政策蓝图中,主要从宏观治理角度出发,指出递归自我改进的早期迹象带来了现有机构难以应对的治理挑战,呼吁建立新规则。而Anthropic则更侧重于展示自家Claude系统的实际能力与数据,以此来强调他们正亲身经历并目睹这条技术路径,从而提升自身的行业话语权和市场叙事地位。

QAnthropic文章中提到的“闭合回路”阶段意味着什么?

A“闭合回路”是Anthropic描绘的、比当前阶段更进一步的未来场景。它意味着Claude的后续版本将能够完全由Claude自身持续地、自动化地进行改进和迭代,即实现完全的“递归自我改进”。文章强调他们尚未走到那一步,但通往该阶段的路径已变得可见,因此需要提前为潜在的风险和治理挑战做好准备。

Bacaan Terkait

43 Menit Trump: Narasi Pemimpin Kuat Tak Terkendali, Perang Media Memanas

Presiden AS Donald Trump kembali muncul di depan publik setelah menghilang lebih dari seminggu, dalam konferensi pers selama 43 menit yang dimaksudkan untuk menunjukkan kendali. Namun, pidatonya justru menyimpang ke topik-topik seperti kolam refleksi, perbandingan jumlah massa dengan Martin Luther King, serta serangan terhadap jurnalis, lawan politik, dan sejumlah kota AS. Ia menandatangani perintah eksekutif yang menghapus perlindungan jabatan bagi ribuan pegawai federal senior, berpotensi memperkuat loyalitas pribadi di atas profesionalisme. Trump secara pribadi menyerang jurnalis CNN, Kaitlan Collins, menyebutnya "penuh kebencian". Artikel ini menyoroti tekanan pada media independen, mengutip pemecatan veteran CBS Scott Pelley yang menolak campur tangan editorial untuk menyenangkan pemerintahan. Penulis menekankan pentingnya mendukung jurnalis dan media independen sebagai penjaga fakta publik ketika media arus utama menghadapi tekanan politik dan komersial. Aktivitas tiba-tiba diakhiri secara mendadak oleh stafnya, meninggalkan kesan kepanikan. Sementara itu, di tengah kekhawatiran tentang kesehatannya dan perang di Iran, empat anggota Partai Republik di DPR mendukung resolusi yang menuntut penghentian perang, menunjukkan retakan dalam dukungan partainya. Artikel ini menggambarkan penampilan Trump sebagai pertunjukan politik yang penuh kecemasan, yang mencerminkan ketegangan institusional AS: perluasan kekuasaan pribadi, pelemahan birokrasi, erosi kepercayaan media, dan penyusutan ruang fakta publik.

marsbit4j yang lalu

43 Menit Trump: Narasi Pemimpin Kuat Tak Terkendali, Perang Media Memanas

marsbit4j yang lalu

Kalshi, MTS, dan Ambisi A16Z

**Ringkasan Artikel: Kalshi, MTS, dan Ambisi a16z** Pasar prediksi (prediction market) menjadi bidang yang menarik perhatian investor, komunitas kripto, dan media pada 2025. Meski memiliki daya tarik bisnis seperti arbitrase regulasi dan potensi fee transaksi tinggi, nilai mendasarnya terletak pada kemampuannya memberikan **"rasa keberadaan" (sense of presence)**. Artikel ini menelusuri evolusi ide pasar prediksi, dari konsep Friedrich Hayek tentang pasar sebagai pengumpul pengetahuan tersebar, hingga mekanisme insentif Robin Hanson (LMSR). Namun, diskusi filosofis ini menemukan relevansi baru ketika a16z (Andreessen Horowitz) berinvestasi pada **Kalshi**, sebuah platform pasar prediksi yang kini bernilai $220 miliar. Bagi a16z, Kalshi bukan sekadar platform taruhan. Ia adalah **media baru** yang memungkinkan orang terlibat secara aktif dalam peristiwa dunia. Dengan menggunakan uang sungguhan untuk "memprediksi" hasil suatu peristiwa (politik, cuaca, berita), pengguna merasa menjadi **pengamat super** yang berpartisipasi, bukan sekadar penonton pasif. Hal ini mengatasi rasa ketidakberdayaan di era modern. Kalshi, dengan volume dan data transaksi nyata, berpotensi memberikan otoritas final atas **kebenaran** dan **pentingnya** suatu peristiwa. Ini selaras dengan ambisi a16z membangun kekaisaran media baru, seperti yang terlihat pada **MTS (Monitoring The Situation)**, media yang melakukan siaran langsung 24/7 untuk "menguasai linimasa". Kombinasi antara narasi media yang intens (seperti MTS) dan legitimasi data nyata dari pasar prediksi (Kalshi) menciptakan **medan distorsi realitas** yang kuat. Kalshi bernilai tinggi karena kemampuannya mempengaruhi persepsi publik secara halus, misalnya melalui probabilitas hasil pemilu yang diperdagangkan, sesuatu yang jarang dimiliki perusahaan swasta. Inilah inti dari ambisi media baru a16z.

marsbit5j yang lalu

Kalshi, MTS, dan Ambisi A16Z

marsbit5j yang lalu

Terbaru: Veteran Chip OpenAI Bergabung dengan Anthropic

Pelaku industri OpenAI, Clive Chan, yang dikenal sebagai karyawan nomor dua di tim perangkat keras dan terlibat dalam proyek chip buatan OpenAI, mengumumkan telah bergabung dengan Anthropic. Ia menyebut tim chip OpenAI memiliki kepadatan bakat yang luar biasa, namun dorongan untuk "mendaki gunung baru dari dasar" membawanya ke Anthropic. Chan terkesan dengan bakat, nilai, dan ambisi tim Anthropic, serta merasakan intensitas kerja yang tinggi sejak hari pertama. Ketika ditanya tentang kemajuan chip buatan OpenAI, Chan merujuk pada blog kolaborasi antara OpenAI dan Broadcom yang dirilis Oktober 2025. Menurut blog tersebut, sistem akselerator AI buatan OpenAI dengan total skala 10GW ini menargetkan penyebaran dimulai pada paruh kedua 2026, dengan pengiriman rak pertama direncanakan pada waktu tersebut. Proyek diperkirakan berlanjut hingga akhir 2029. Chan, lulusan Universitas Waterloo tahun 2021, memiliki pengalaman kerja di Google, SpaceX, Tesla (tim infrastruktur Autopilot), dan QuEra sebelum bergabung dengan OpenAI pada Januari 2024. Kepindahannya ke Anthropic disambut oleh karyawan Anthropic lainnya dan menjadi bahan komentar netizen yang menyoroti tren perpindahan bakat antara kedua perusahaan AI terkemuka ini. Sebelumnya, pada Mei, salah satu pendiri OpenAI, Andrej Karpathy, juga bergabung dengan Anthropic. Anthropic baru-baru ini mengumumkan pendanaan H senilai $650 miliar, dengan valuasi pasca-pendanaan mencapai $9,65 triliun, mendekati klub bernilai triliunan dolar. Arus bakat antara OpenAI dan Anthropic terus berlanjut, menegaskan pentingnya talenta sebagai aset inti dalam persaingan AI mutakhir.

marsbit5j yang lalu

Terbaru: Veteran Chip OpenAI Bergabung dengan Anthropic

marsbit5j yang lalu

Ambisi Kalshi, MTS, dan a16z

Pasar prediksi menjadi bidang yang menarik pada tahun 2025, menghubungkan investor dolar, komunitas kripto, dan media. Artikel ini mengeksplorasi esensi pasar prediksi dan keselarasannya dengan visi "Media Baru" a16z. Pemikiran pasar prediksi berakar dari konsep Hayek tentang penggunaan pengetahuan tersebar dalam masyarakat, yang kemudian dikembangkan oleh Robin Hanson dengan mekanisme insentif LMSR-nya. Namun, diskusi filosofis ini menemukan relevansi barunya ketika a16z berinvestasi di Kalshi, sebuah platform pasar prediksi yang valuasinya melonjak. a16z melihat nilai inti Kalshi dan pasar prediksi terletak pada penyediaan "rasa kehadiran" atau keterlibatan. Dalam dunia di mana individu sering merasa terasing dari peristiwa, pasar prediksi menawarkan cara untuk terlibat secara aktif dengan "mempertaruhkan" pandangan seseorang tentang masa depan. Keterlibatan finansial ini mengubah peserta dari pengamat pasif menjadi "pengamat super" yang merasa terhubung dan memiliki agensi. Konsep "Media Baru" a16z adalah sistem komunikasi berkecepatan tinggi yang bertujuan mendominasi narasi secara instan. Contohnya adalah MTS, media yang menyiarkan berita penting secara real-time. Namun, kekuatan sebenarnya terletak pada otoritas yang dihasilkan pasar prediksi seperti Kalshi. Harga yang dibentuk oleh uang sungguhan memberikan klaim kebenaran dan kepentingan yang sulit disangkal, menciptakan semacam "medan distorsi realitas". Inilah yang menjelaskan valuasi tinggi Kalshi: kemampuannya yang langka untuk memengaruhi persepsi realitas sebagai sebuah perusahaan swasta, menjadikannya batu penjuru penting dalam ambisi kekaisaran media baru a16z.

链捕手6j yang lalu

Ambisi Kalshi, MTS, dan a16z

链捕手6j yang lalu

Trading

Spot
Futures

Artikel Populer

Cara Membeli NIGHT

Selamat datang di HTX.com! Kami telah membuat pembelian Midnight (NIGHT) menjadi mudah dan nyaman. Ikuti panduan langkah demi langkah kami untuk memulai perjalanan kripto Anda.Langkah 1: Buat Akun HTX AndaGunakan alamat email atau nomor ponsel Anda untuk mendaftar akun gratis di HTX. Rasakan perjalanan pendaftaran yang mudah dan buka semua fitur.Dapatkan Akun SayaLangkah 2: Buka Beli Kripto, lalu Pilih Metode Pembayaran AndaKartu Kredit/Debit: Gunakan Visa atau Mastercard Anda untuk membeli Midnight (NIGHT) secara instan.Saldo: Gunakan dana dari saldo akun HTX Anda untuk melakukan trading dengan lancar.Pihak Ketiga: Kami telah menambahkan metode pembayaran populer seperti Google Pay dan Apple Pay untuk meningkatkan kenyamanan.P2P: Lakukan trading langsung dengan pengguna lain di HTX.Over-the-Counter (OTC): Kami menawarkan layanan yang dibuat khusus dan kurs yang kompetitif bagi para trader.Langkah 3: Simpan Midnight (NIGHT) AndaSetelah melakukan pembelian, simpan Midnight (NIGHT) di akun HTX Anda. Selain itu, Anda dapat mengirimkannya ke tempat lain melalui transfer blockchain atau menggunakannya untuk memperdagangkan mata uang kripto lainnya.Langkah 4: Lakukan trading Midnight (NIGHT)Lakukan trading Midnight (NIGHT) dengan mudah di pasar spot HTX. Cukup akses akun Anda, pilih pasangan perdagangan, jalankan trading, lalu pantau secara real-time. Kami menawarkan pengalaman yang ramah pengguna baik untuk pemula maupun trader berpengalaman.

591 Total TayanganDipublikasikan pada 2025.12.08Diperbarui pada 2026.06.02

Cara Membeli NIGHT

Diskusi

Selamat datang di Komunitas HTX. Di sini, Anda bisa terus mendapatkan informasi terbaru tentang perkembangan platform terkini dan mendapatkan akses ke wawasan pasar profesional. Pendapat pengguna mengenai harga NIGHT (NIGHT) disajikan di bawah ini.

活动图片