Jay melaporkan dari Aofeisi Quantum Bit | Akun Publik QbitAI
Penemuan penting: Evolusi mandiri AI, telah dimulai.
Ini adalah pernyataan provokatif yang baru saja dirilis Anthropic dalam blog panjangnya.
Data internal kami menunjukkan bahwa Claude sedang mempercepat perkembangan AI, ini mungkin merupakan jalur menuju peningkatan diri secara rekursif (Recursive Self-Improvement - RSI).
Bukan "sensasi" belaka, lihat artikelnya, Anthropic benar-benar berbicara dengan data nyata—
Hingga Mei tahun ini, lebih dari 80% kode di Anthropic, ditulis oleh Claude.
Sebelum Claude Code dirilis, angka ini masih satu digit.
Sementara itu, rata-rata jumlah kode yang dikirimkan oleh insinyur Anthropic per kuartal, adalah 8 kali lipat dari periode 2021-2025.
Yang lebih penting adalah kualitas—
Pada tugas pemrograman yang paling terbuka, paling ambigu, bahkan bentuk jawabannya pun tidak pasti, tingkat keberhasilan Claude sekarang adalah 76%, enam bulan lalu baru 26%.
Lompatan 50 poin persentase. Setengah tahun.
Sudah banyak insinyur internal Anthropic yang merasa, kualitas kode yang ditulis Claude setara dengan manusia.
Diperkirakan akan melampaui dalam tahun ini.
Anthropic juga menekankan, jika tren ini terus berlanjut, AI merancang dan membangun generasi AI berikutnya sendiri, sepenuhnya mungkin.
Hal ini dapat mengubah masyarakat secara mendasar, membawa manfaat besar di bidang kesehatan, teknologi, dan ekonomi. Namun juga dapat memperburuk masalah keselarasan (alignment), yang akhirnya menyebabkan kekacauan.
Oleh karena itu, Anthropic memimpin seruan:
Jika ada mekanisme yang dapat diverifikasi, yang dapat menjamin bahwa laboratorium AI benar-benar tidak diam-diam berlomba, kami bersedia memperlambat, bahkan menghentikan.
Selain itu, dalam blog Anthropic ini, juga dikeluarkan banyak pandangan dan fakta menarik.
Berikut adalah versi yang telah diatur, untuk memudahkan pembacaan.
Nikmati.
Blog Panjang Anthropic Menetapkan Arah
Hukum Moore Dunia AI Telah Tiba
Anthropic menciptakan dimensi ukuran baru, disebut "Durasi tugas yang dapat diselesaikan AI secara mandiri".
Maret 2024, Claude Opus 3 dapat menyelesaikan tugas perangkat lunak yang membutuhkan manusia sekitar 4 menit.
Satu tahun kemudian, Claude Sonnet 3.7, 1,5 jam.
Setahun lagi, Claude Opus 4.6, 12 jam.
Dan Mythos terbaru, performanya dalam uji internal adalah:
Dapat bekerja terus menerus "setidaknya" 16 jam, telah mencapai batas atas yang dapat diukur oleh kerangka pengujian METR.
Kecepatan penggandaan ini, dari sebelumnya berlipat ganda setiap 7 bulan, menjadi berlipat ganda setiap 4 bulan.
Jika tren tidak berubah, 2027, mungkin beberapa minggu.
Claude Menulis Sebagian Besar Kode Anthropic
Hingga Mei 2026, kode di basis kode saya Anthropic, lebih dari 80% ditulis oleh Claude.
Sebelum Claude Code dirilis, angka ini selalu satu digit.
Perubahan ini juga tercermin dalam cara kerja insinyur.
Di empat tahun awal Anthropic, jumlah baris kode yang di-merge insinyur per hari pada dasarnya tetap.
2025, Claude mulai menulis kode sendiri, jumlah merge tiba-tiba meroket.
Sekarang, kuartal kedua 2026, jumlah kode yang di-merge insinyur per hari adalah 8 kali lipat tahun 2024.
Namun, volume kode naik, apakah kualitas kode menurun?
Anthropic mengatakan, sepanjang tahun ini, insinyur semakin jarang mengoreksi Claude.
Hal ini terlihat dalam benchmark, seperti yang ditunjukkan pada gambar di bawah ini.
Dalam semua jenis tugas dengan tingkat kesulitan, tingkat keberhasilan Claude, tanpa terkecuali meningkat pesat.
Jadi, Anthropic sekarang menggunakan Claude untuk mereview kode.
Ya, semua perubahan yang diajukan ke basis kode, akan melewati proses peninjauan otomatis Claude terlebih dahulu, memeriksa bug, kerentanan keamanan, dan cacat lainnya.
Analisis retrospektif mereka menemukan, jika sebelumnya setiap perubahan memiliki peninjauan otomatis ini, sekitar sepertiga bug yang menyebabkan insiden online claude.ai, akan dihentikan sebelum diluncurkan.
Perlu diingat, insinyur yang menulis kode-kode itu, sudah termasuk orang-orang terbaik di dunia dalam membuat sistem AI.
Claude menangkap kesalahan mereka.
Kaca Pembesar Kreativitas
Berikutnya adalah tingkat partisipasi Claude di tingkat penelitian.
Anthropic memiliki kebiasaan, setiap kali meluncurkan model baru, mereka memberikan Claude sepotong kode untuk melatih model AI kecil, memintanya mengoptimalkan kecepatan eksekusi secepat mungkin dengan tetap menjaga kebenaran.
Mei 2025, jawaban Claude Opus 4 adalah: percepatan 3x.
April 2026, Claude Mythos Preview mencapai 52x.
Sebagai referensi, seorang peneliti manusia yang terampil, membutuhkan 4 sampai 8 jam hanya untuk mencapai 4x.
Kurang dari setahun, Claude melampaui manusia.
April 2026, Anthropic memberikan Claude sebuah penelitian keamanan AI, intinya "apakah model lemah dapat mengawasi model kuat secara andal", lalu meminta Claude mengajukan hipotesis sendiri, menjalankan eksperimen......
Kali ini mari kita bahas performa manusia dulu, dua peneliti manusia menghabiskan sekitar seminggu, mengurangi gap sebesar 23%.
Dan Claude, setelah sekitar 800 jam, menghabiskan komputasi sekitar $18.000—
Mengurangi 97%.
Ke Mana Kita Akan Pergi?
Sampai di sini, kesimpulannya sudah sangat jelas.
Peran manusia dalam alur pengembangan AI, setiap bagiannya semakin menyempit.
Kode, Claude yang menulis. Review kode, Claude yang melakukan. Eksekusi eksperimen, Claude lebih cepat satu level dari manusia. Desain eksperimen, Claude mulai melakukannya sendiri......
Keunggulan komparatif terakhir manusia sekarang, adalah selera dan penilaian penelitian.
Tapi berapa lama keunggulan ini bisa bertahan?
Anthropic dalam blognya mengatakan, mereka juga tidak yakin.
Satu kemungkinan, "selera penelitian" seperti hal lain yang sebelumnya tidak bisa dilakukan AI, awalnya tidak bisa, lalu tiba-tiba bisa.
Seperti AI memahami humor, menunjukkan teori pikiran, memecahkan teka-teki bahasa, semua melalui kurva yang sama.
Kemungkinan lain, bahkan jika Claude selamanya tidak bisa mempelajari selera penelitian yang sebenarnya, hanya dengan tren percepatan saat ini, volume pekerjaan yang dapat diarahkan setiap peneliti manusia secara bersamaan sudah beberapa kali lipat lebih besar.
Anda tidak perlu AI menggantikan Anda berpikir sepenuhnya, ia hanya perlu melakukan semua pekerjaan "pelaksanaan", Anda hanya perlu melakukan 5% pemilihan arah.
Tiga Masa Depan RSI
Di akhir blog, Anthropic menggambarkan tiga kemungkinan arah evolusi dari tren "evolusi mandiri" ini.
1. Stagnasi.
Kurva eksponensial itu sebenarnya kurva S.
Mungkin penilaian penelitian itu tidak bisa diselesaikan dengan scale, membutuhkan terobosan arsitektur yang sama sekali baru.
Atau, hambatannya ada di energi, di chip, di rantai pasokan fisik komputasi.
Namun, bahkan jika kemampuan AI mandek di tingkat hari ini, juga akan membawa perubahan besar bagi dunia.
Proyek Glasswing beberapa waktu lalu, Mythos Preview dalam beberapa minggu pertama setelah diluncurkan menemukan lebih dari sepuluh ribu kerentanan perangkat lunak tingkat tinggi dan kritis, tersebar di sistem-sistem paling kritis global.
2. AI terus berakselerasi, tetapi manusia masih memegang kemudi.
Efisiensi organisasi akan meningkat secara eksponensial, perusahaan 100 orang melakukan pekerjaan 10.000 bahkan 100.000 orang. Mengeta-
Anthropic merasa kita kemungkinan besar sedang masuk ke skenario ini.
Tapi mereka juga menemukan fenomena menarik, yaitu manifestasi Hukum Amdahl dalam organisasi—
Claude menulis kode dengan sangat cepat, hasilnya review kode menjadi hambatan baru. Berbagai ide baru, alat baru, eksperimen baru bermunculan secara eksplosif, jauh melampaui kemampuan pencernaan organisasi.
Hambatan tidak akan hilang, hanya berpindah ke bagian berikutnya.
3. AI mencapai peningkatan diri rekursif penuh, mulai membangun generasi berikutnya sendiri.
Dalam skenario ini, kecepatan perkembangan AI sepenuhnya bergantung pada daya komputasi. Manusia mundur ke posisi pengawasan, verifikasi, dan audit.
Jika benar-benar terjadi, kemampuan ini kemungkinan besar akan bermigrasi ke bidang ilmiah lainnya, kedokteran, material, energi, lepas landas secara keseluruhan.
Tentu, masa depan lain, adalah kegagalan keselarasan.
Dalam situasi ini, penyimpangan akan terakumulasi secara bertahap dalam proses iterasi diri AI, akhirnya—benar-benar lepas kendali.
OMT
Itulah beberapa pandangan kunci Anthropic tentang evolusi mandiri kali ini.
Sejujurnya, awalnya saya tidak terlalu menganggap serius, toh Anthropic akan segera IPO, bukankah ini tipikal "PR ala Anthropic"?
Namun, kali ini, mungkin benar-benar sedikit berbeda.
Karena beberapa hari yang lalu, OpenAI juga merilis blog serupa:
Kami juga melihat tanda-tanda awal evolusi mandiri dalam sistem saat ini: Perkembangan AI itu sendiri juga dipercepat oleh AI. Kami memperkirakan hal ini akan memperburuk tekanan persaingan antara pengembang dan negara, dan membawa tantangan tata kelola yang tidak dapat diatasi oleh institusi yang ada. Dengan munculnya RSI, masyarakat membutuhkan cara untuk membentuk lintasan perkembangan AI, memastikannya melayani kepentingan manusia.
Singularitas, tampaknya datang lebih cepat dari yang diperkirakan semua orang.
Blog: https://www.anthropic.com/institute/recursive-self-improvement
Referensi:[1]https://x.com/kimmonismus/status/2062517474277675102[2]https://x.com/anthropicai/status/2062568873321513443
Artikel ini berasal dari akun publik WeChat "Quantum Bit", penulis: Teknologi Terdepan yang Diperhatikan














