Oleh | Huruf AI
Anthropic semalam merilis sebuah artikel panjang berjudul "When AI builds itself" (Ketika AI Membangun Dirinya Sendiri), terdengar seperti novel fiksi ilmiah karya Asimov, dan memang tema utamanya adalah konsep yang sangat fiksi ilmiah: recursive self-improvement (perbaikan diri rekursif).
Singkatnya, dulu peneliti manusia yang menulis kode, menjalankan eksperimen, melatih model, lalu membuat AI menjadi lebih kuat. Namun, jika AI mulai berpartisipasi dalam merancang, melatih, menguji, mengoptimalkan versi penerusnya sendiri, maka kecepatan kemajuan AI tidak lagi hanya didorong oleh manusia, tetapi mungkin mulai 'berevolusi sendiri' oleh AI.
Untuk itu, Anthropic mengeluarkan seruan:
"Kami percaya, jika dunia dapat memilih untuk memperlambat atau menghentikan sementara pengembangan AI terdepan, sehingga struktur sosial dan penelitian keselarasan (alignment) dapat mengikuti kemajuan teknologi, hal ini akan sangat bermanfaat bagi dunia."
Kalimat ini terdengar seperti peringatan keamanan, tetapi ditempatkan pada titik waktu ketika Anthropic bersiap untuk IPO, sulit untuk tidak melihatnya sebagai narasi lain yang sedang dipersiapkan: Claude sangat bagus, bahkan mulai menciptakan Claude generasi berikutnya sendiri.
Badai Baru Telah Muncul
Untuk menggambarkan AI yang semakin banyak terlibat dalam pengembangan AI itu sendiri, Anthropic mengeluarkan banyak data internal.
Misalnya, hingga Mei 2026, lebih dari 80% kode yang digabungkan ke dalam repositori kode Anthropic ditulis oleh Claude. Sebelum Claude Code dirilis, angka ini masih satu digit.
Pada kuartal kedua 2026, menurut statistik Anthropic, jumlah kode yang digabungkan oleh insinyur setiap hari sudah sekitar 8 kali lebih tinggi dibandingkan tahun 2024.
Yang lebih penting dari jumlah kode adalah, Claude sedang menangani masalah rekayasa yang lebih terbuka.
Anthropic mengatakan dalam artikelnya bahwa dalam setahun terakhir, frekuensi karyawan memperbaiki Claude, menarik Claude kembali ke jalur yang benar, atau mengambil alih tugas di tengah jalan terus menurun. Perubahan ini tidak hanya terjadi pada tugas sederhana, tetapi juga pada tugas terbuka yang paling kompleks.
Tugas terbuka yang dimaksud adalah masalah tanpa instruksi manual yang jelas. Misalnya, sistem rusak, tugas pelatihan gagal, insinyur sendiri awalnya juga tidak tahu seperti apa jawabannya, hanya bisa memeriksa sambil menilai.
Jenis tugas seperti ini sebelumnya paling bergantung pada pengalaman manusia, dan di antara tugas-tugas yang paling terbuka itu, tingkat keberhasilan Claude mencapai 76% pada Mei 2026, meningkat 50 persen dalam enam bulan.
Bukan hanya menulis kode, Anthropic juga menggunakan Claude untuk melakukan tinjauan kode (code review), memeriksa bug, kerentanan keamanan, dan cacat lainnya. Analisis mereka menemukan bahwa, jika setiap perubahan kode di masa lalu telah melalui tinjauan otomatis oleh Claude, sekitar sepertiga bug yang menyebabkan insiden di claude.ai dapat dicegah sebelum dirilis.
Lebih jauh lagi, Claude telah mulai terlibat dalam proses penelitian.
Anthropic memiliki tes tetap: memberikan Claude sebuah kode untuk melatih model kecil, memintanya untuk membuat kode berjalan lebih cepat tanpa mengubah hasil yang salah. Pada Mei 2025, Claude Opus 4 dapat menghasilkan percepatan sekitar 3 kali; pada April 2026, Claude Mythos Preview telah mendorong angka ini menjadi sekitar 52 kali.
Anthropic juga menyebutkan sebuah studi kasus penelitian keamanan AI terbuka. Mereka memberikan masalah kepada agen yang digerakkan oleh Claude: bisakah model yang lebih lemah mengawasi model yang lebih kuat secara andal?
Proses ini memerlukan pembuatan hipotesis, pengujian hipotesis, berbagi temuan dengan agen paralel, dan iterasi berulang.
Dua peneliti manusia menghabiskan waktu satu minggu, menutup sekitar 23% dari kesenjangan; sedangkan Claude, dengan konsumsi daya komputasi kumulatif sekitar 800 jam, sekitar $18.000, menutup 97%.
Hasil ini tentu memiliki keterbatasan, masalahnya dipilih manusia, standar penilaian juga ditentukan manusia, dan hasilnya juga belum sepenuhnya dimigrasikan ke model skala produksi. Namun, ini tetap menunjukkan bahwa Claude sudah dapat, dalam kerangka penelitian yang telah ditentukan arahnya oleh manusia, merancang eksperimen sendiri, mengeksekusinya sendiri, dan melakukan iterasi sendiri.
Selain itu, ketika peneliti manusia "salah jalan", Claude juga dapat memberikan penilaian langkah selanjutnya yang lebih baik.
Anthropic mengambil 129 sesi penelitian internal Claude Code, di mana peneliti manusia dan Claude bersama-sama memecahkan masalah penelitian terbuka. Anthropic memilih beberapa titik "di mana manusia kemudian terbukti berputar-putar", lalu memberikan konteks sebelum titik tersebut ke berbagai versi Claude, melihat saran apa yang akan diberikan. Kemudian, Claude judge lain yang tahu akhir sesi lengkap akan menilai: saran model atau pilihan manusia pada saat itu, mana yang lebih baik.
Hasilnya menunjukkan, di titik-titik di mana peneliti manusia kemudian terbukti memiliki ruang untuk perbaikan, Claude semakin mampu memberikan saran langkah selanjutnya yang lebih baik.
Dulu, kemajuan model AI terutama didorong oleh peneliti dan insinyur manusia. Manusia memutuskan eksperimen apa yang dilakukan, menulis kode, melatih model, dan mendorong iterasi fungsi AI.
Sekarang, semakin banyak mata rantai dalam rantai ini yang mulai diambil alih oleh Claude.
Anthropic memberikan tabel tahapan yang sangat jelas:
2021 hingga 2023, Anthropic tidak berbeda dengan perusahaan teknologi biasa, semuanya adalah manusia yang menulis kode, menulis dokumen di laptop.
2023 hingga 2025, chatbot mulai masuk ke alur kerja. Insinyur meminta model untuk menghasilkan potongan kode, lalu menyalinnya ke editor.
2025 hingga 2026, agen pemrograman muncul. Claude mulai dapat menulis dan memodifikasi kode secara mandiri, terkadang bahkan dapat menyelesaikan seluruh file secara independen.
Hari ini, agen sudah dapat menjalankan kode sendiri, dan bahkan dapat mendelegasikan pekerjaan berjam-jam kepada agen lain.
Ke depan, adalah tahap yang benar-benar dikhawatirkan oleh Anthropic: sirkuit tertutup (closed loop).
Jika hari itu tiba, versi Claude selanjutnya mungkin akan terus-menerus diperbaiki oleh Claude itu sendiri — inilah recursive self-improvement, perbaikan diri rekursif.
Anthropic dalam artikelnya berkata dengan sangat hati-hati: Kami belum sampai ke tahap itu, dan perbaikan diri rekursif juga tidak terjadi secara pasti. Namun, mereka tetap menekankan bahwa jalur menuju langkah itu sudah mulai terlihat.
Itulah sebabnya Anthropic membahas perlambatan, bahkan penangguhan, di akhir artikel. Maksudnya bukan semua perusahaan AI berhenti bekerja sekarang, tetapi jika risiko perbaikan diri AI di masa depan terus meningkat, laboratorium terdepan perlu mekanisme perlambatan yang terkoordinasi dan dapat diverifikasi.
Dengan kata lain, "singularitas" akan segera tiba, manusia harus mengendalikannya.
Claude yang Tak Terbendung
Jika hanya melihat permukaan, ini adalah dokumen keamanan yang sangat visioner. Anthropic membicarakan perbaikan diri rekursif, AI yang mungkin semakin cepat memperbaiki dirinya sendiri, dan kebutuhan masyarakat manusia untuk mempersiapkan mekanisme perlambatan dan penangguhan lebih awal.
Namun, ditempatkan pada titik waktu ketika Anthropic bersiap untuk IPO, artikel ini memiliki arti lain.
Dalam arti tertentu, gerakan terkini Anthropic mirip dengan siswa berprestasi yang sedikit sombong di kelas — dia memang punya kemampuan, tapi juga agak pamer.
Yang ingin disampaikan bukan hanya "kami punya Claude yang sangat kuat", tetapi lebih dari itu, mereka ingin mengatakan "Claude sedang membantu kami membuat Claude yang lebih kuat".
Jika Anthropic hanya menjual model atau alat, sulit untuk sepenuhnya lepas dari perbandingan horizontal: Anthropic punya Claude, OpenAI punya GPT; Anthropic punya Claude Code, OpenAI punya Codex; Anthropic merebut pelanggan perusahaan, OpenAI juga merebut pelanggan perusahaan. Persaingan kedua perusahaan sangat ketat, lihat saja siapa yang bisa menceritakan kisah yang lebih besar ke pasar.
Perlu dicatat, tepat 3 hari lalu, OpenAI di dokumen tentang tata kelola AI terdepan menulis:
"Kami juga melihat tanda-tanda awal perbaikan diri rekursif dalam sistem hari ini: Pengembangan AI itu sendiri sedang dipercepat oleh AI.
Ini akan memperburuk tekanan kompetisi antar pengembang dan negara, dan menimbulkan tantangan tata kelola yang tidak dapat diatasi oleh lembaga yang ada."
3 hari kemudian, Anthropic mengatakan: Jalur Claude menuju perbaikan diri rekursif, sudah mulai terlihat.
Jika Claude benar-benar berkembang seperti yang diharapkan, ini bukan lagi narasi produk biasa, ini akan menjadi roda penggerak (flywheel) penelitian dan pengembangan.
Claude menulis kode, menjalankan eksperimen, mengoptimalkan alur pelatihan, yang pada gilirannya mengurangi insiden dalam produk Anthropic sendiri... Begitu sistem ini berjalan, Claude bukan hanya produk Anthropic, tetapi juga alat produksi penting Anthropic.
Pengguna melihat produk Claude, pelanggan perusahaan membeli kemampuan Claude, tetapi yang benar-benar ingin diperhatikan Anthropic oleh pasar modal adalah: Claude telah tertanam dalam proses dasar pengembangan model terdepan, ia telah ditempatkan di ruang mesin Anthropic.
Pasar modal paling suka mendengar kisah roda penggerak, seperti mangkuk harta karun yang menghasilkan uang terus-menerus: Claude yang lebih kuat memungkinkan insinyur Anthropic menggabungkan lebih banyak kode, lebih banyak kode mempercepat iterasi produk dan infrastruktur, iterasi yang lebih cepat memungkinkan peneliti menjalankan lebih banyak eksperimen, lebih banyak eksperimen pada gilirannya membantu Claude generasi berikutnya menjadi lebih kuat. Claude generasi berikutnya yang lebih kuat kemudian terus mempercepat penelitian dan pengembangan Anthropic.
Kecepatan iterasi Claude juga mendukung roda penggerak ini. Dari waktu rilis publik, dari tahun 2023 hingga awal 2025, pembaruan model utama Claude kebanyakan dalam siklus tiga atau empat bulan, tetapi setelah masuk ke Claude 4, pembaruan model Anthropic jelas menjadi lebih sering.
Claude 4 dirilis pada Mei 2025, Opus 4.1 dirilis pada Agustus, Sonnet 4.5 pada September, Haiku 4.5 pada Oktober, Opus 4.5 pada November.
Pada tahun 2026, Opus 4.6 dirilis pada 5 Februari, Sonnet 4.6 pada 17 Februari, Opus 4.7 pada 15 April, Opus 4.8 pada 28 Mei. Dari Opus 4.7 ke Opus 4.8, hanya berselang 42 hari.
Di permukaan, Anthropic mengatakan "hal ini mungkin sangat berbahaya, kami harus mempersiapkan rem lebih awal", tetapi secara bersamaan juga mengisyaratkan: "Kami telah melihat apa yang akan terjadi setelah pedal gas diinjak."
Kehalusan narasi IPO terletak di sini. Di satu sisi mereka menceritakan risikonya dengan sangat serius, di sisi lain juga mengangkat posisi teknologi mereka sendiri sangat tinggi.
Tidak semua perusahaan AI memiliki kualifikasi untuk membahas perbaikan diri rekursif, Anda harus terlebih dahulu membuat pihak luar percaya bahwa AI Anda telah masuk ke dalam proses pengembangan AI, baru berhak mengatakan bahwa hal ini mungkin memerlukan koordinasi global.
OpenAI: Bagaimana bisa seperti ini?
Seperti disebutkan sebelumnya, tepat sebelum Anthropic mempublikasikan artikel panjang ini, OpenAI baru saja menempatkan perbaikan diri rekursif di atas meja.
Tetapi cara kedua perusahaan menyampaikannya sangat berbeda.
Artikel OpenAI yang berjudul "Democratic Governance of Frontier AI", adalah cetak biru kebijakan yang ditujukan untuk Washington, perhatiannya bukan pada "bagaimana model menjadi lebih kuat", tetapi pada bagaimana membatasi AI terdepan ketika terus maju.
Kebanyakan isi laporan itu tidak terlalu cocok untuk dijelaskan secara panjang lebar, kecuali satu kalimat kunci: OpenAI mengatakan, dalam sistem hari ini, tanda-tanda awal perbaikan diri rekursif sudah dapat dilihat.
Kalimat ini dan artikel panjang Anthropic ini sebenarnya menunjuk ke arah yang sama.
Hanya saja OpenAI berbicara tentang sistem, Anthropic berbicara tentang diri mereka sendiri.
Maksud OpenAI adalah: Pengembangan AI terlalu cepat, struktur tata kelola yang ada mungkin tidak dapat mengikuti, sehingga diperlukan seperangkat aturan baru.
Sementara Anthropic langsung menunjukkan sistem itu, memberi tahu pasar: Claude telah masuk ke dalam proses penelitian dan pengembangan kami, jadi kami melihat jalur percepatan diri AI.
Ini adalah langkah yang sangat cerdik, rasanya di dalam OpenAI mungkin sudah mulai bergumam — ini benar-benar plagiat ide! Kami yang lebih dulu!
Bercanda, tetapi OpenAI memang perlu berusaha lebih keras, cepat angkat GPT 5.6 ke atas panggung.












