Kata "rekursi", baru-baru ini tiba-tiba menjadi populer di kalangan AI.
Dua perusahaan rintisan langsung menggunakan kata ini sebagai nama perusahaan mereka, banyak laboratorium mulai memasukkan singkatan tiga huruf bernama RSI ke dalam roadmap, yaitu nama Inggris dari rekursif—recursive self-improvement (peningkatan diri rekursif). Seperti AGI, RSI sedang menjadi kode rahasia industri yang membuat orang bersemangat sekaligus cemas, meskipun definisinya belum sepenuhnya disepakati.
(Sumber: X)
Apa itu RSI? Secara sederhana, ini adalah membiarkan AI melatih dirinya sendiri. Dalam dunia teknologi, RSI selalu dipandang sebagai salah satu tanda utama kemajuan kecerdasan buatan, setara dengan memori, penalaran, dan multimodal. Satu-satunya batasan adalah daya komputasi, manusia di dalamnya bukan lagi faktor yang diperlukan, bahkan bukan lagi pembantu.
Terdengar seperti fiksi ilmiah, atau terdengar berbahaya? Tapi jika dipikirkan dengan dingin, ini bukanlah demam pertama di industri AI. Dari AlphaGo pada 2016 hingga ChatGPT pada 2023, hingga perlombaan parameter model besar di berbagai perusahaan hari ini, sifat alami industri AI adalah mengejar hal "yang mengubah segalanya" berikutnya. Menurut pandangan Lei Keji AGI (ID: leikejiagi), RSI mungkin akan menjadi pesta pora berikutnya.
RSI Populer: Ketika AI Bisa Membangun Diri Sendiri Melalui 'Rekursi'
Pada Mei tahun ini, peneliti AI terkenal Richard Socher dengan gemilang mendirikan sebuah perusahaan baru bernama Recursive Superintelligence, namanya langsung adalah RSI.
Dia menyatakan: "Tujuan inti kami adalah membangun kecerdasan super peningkatan diri rekursif yang sesungguhnya, seluruh proses perancangan, implementasi, dan verifikasi penelitian, selesai secara otomatis."
Kasus lain yang lebih sering dibicarakan oleh kalangan dalam adalah proyek bernama Auto-Research yang digerakkan oleh Andrej Karpathy: menggunakan kluster agen untuk melatih model bahasa, membiarkan model melakukan tugas penelitian sederhana sendiri, memperbaiki dirinya sendiri.
Sumber: github
Andrej Karpathy juga adalah seorang figur legendaris, dia meninggalkan karya keras di Tesla untuk mobil otonom, di OpenAI untuk GPT. Sekarang dia menganggap RSI sebagai pemberhentian berikutnya untuk di-all in, dan dia melakukannya dengan cara yang terbuka dan transparan, ini juga menunjukkan bahwa dia benar-benar percaya hal ini bisa dilakukan.
Yang menarik, dia sangat terbuka tentang proyek ini, secara berkala memperbarui kemajuan di Twitter, kodenya juga diunggah ke repositori publik GitHub. Tentu saja, Andrej Karpathy sendiri juga mengatakan, pekerjaan saat ini masih dalam iterasi model kecil tingkat GPT-2, "belum menjadi penelitian terobosan (untuk sementara)", tetapi ini sudah cukup untuk menggerakkan sejumlah besar peneliti untuk mengikuti.
Yang lebih penting, Andrej Karpathy baru-baru ini bergabung dengan tim pra-pelatihan Anthropic. Anthropic punya Claude, Karpathy punya metodologi auto-research ini, keduanya digabungkan, model besar + siklus pelatihan mandiri, begitu berjalan lancar, ini bukan lagi sekadar main-main kecil tingkat GPT-2.
Sumber: haimagazine
Perusahaan lain bernama Adaption meluncurkan alat bernama AutoScientist, tujuannya adalah mengotomatisasi proses pelatihan model terdepan. Logikanya sama dengan auto-researchers milik Andrej Karpathy, melatih agen untuk melakukan peningkatan bertahap. Hanya saja ambisi Adaption lebih besar, ingin langsung menangani siklus penutupan pelatihan seluruh model terdepan berukuran penuh.
Keduanya sebenarnya mewakili dua jalur: Andrej Karpayahsy dari dasar memverifikasi blok demi blok, sambil open source sambil mengumpulkan energi di komunitas; Adaption langsung menargetkan skenario pelatihan model besar komersial, keinginan untuk mencapai hasil lebih kuat. Dua jalan mana yang lebih dulu berhasil, pengaruhnya terhadap seluruh industri akan sangat berbeda.
CEO Google Menuangkan Air Dingin: Kami Belum Sampai ke Tahap Itu
Tentang RSI, para pemimpin besar di dunia AI juga memiliki pendapat yang beragam.
CEO Google Sundar Pichai bulan lalu dalam sebuah podcast, dengan kata-kata yang cukup hati-hati mengakui kenyataan: "(RSI) adalah sebuah kontinum, kami memang semua sedang maju. Tapi jika sesuai dengan cara orang menggambarkan RSI, itu mewakili akselerasi level berikutnya, akan ada banyak dampak, tetapi kami belum sampai ke tahap itu."
Meskipun demikian, deskripsi "kontinum" di sini, telah mengandung banyak hal yang membuat orang merenung dengan cemas.
Pada Januari tahun ini, seorang programmer yang memimpin pengembangan Claude Code di Anthropic mengakui, hampir 100% kode di tim adalah ditulis oleh Claude Code, ini adalah AI yang secara harfiah menulis dirinya sendiri. Bukan AI membantu insinyur menulis kode, tetapi alat AI sampai batas tertentu sudah menggantikan insinyur menulis kode mereka sendiri.
Sumber: Anthropic
Anthropic memiliki survei internal tentang versi pratinjau Mythos: dari 18 insinyur, 5 orang berpikir, jika sistem pendukungnya diperbaiki lagi, versi Mythos ini bisa menggantikan seorang insinyur L4, yaitu programmer menengah yang bisa mengambil proyek kompleks secara mandiri, tidak memerlukan pengawasan real-time.
Tapi kekurangannya juga ditulis dengan jelas: "Kelemahan utama yang dilaporkan Claude antara lain: tugas yang samar dengan siklus manajemen ke atas, memahami prioritas organisasi, selera, verifikasi, kepatuhan instruksi, dan epistemologi." Artinya, yang lemah justru hal-hal yang didorong sendiri, dan dorongan diri adalah fondasi RSI.
Yang menarik, Georgetown Center for Security and Emerging Technology (CSET) tahun lalu mengumpulkan sekelompok ahli khusus untuk meneliti RSI. Kelompok ahli ini saat evaluasi menunjukkan perpecahan yang jelas, sebagian orang mengantisipasi akan segera menyambut 'ledakan kecerdasan super', sebagian lain mengantisipasi kemajuan akan lebih lambat, akhirnya akan mencapai periode bottleneck tertentu.
Tapi mereka memiliki satu konsensus: rekursi, membuat masa depan menjadi sangat sulit diprediksi.
Untuk itu, sebuah artikel oleh peneliti METR Ajeya Cotra, membongkar proses RSI menjadi beberapa tonggak sejarah, saya pikir ini adalah kerangka analisis yang paling mudah digunakan saat ini.
Tingkat pertama disebut 'cukup' (adequacy): setelah manusia sepenuhnya dihapus, sistem masih bisa melakukan penelitian—meskipun tidak sebaik manusia, tetapi bisa berjalan.
Tingkat kedua disebut 'setara' (parity): penelitian yang diselesaikan secara mandiri oleh AI, kualitasnya setara dengan penelitian yang diselesaikan secara mandiri oleh manusia.
Yang ketiga disebut 'melampaui' (supremacy): kinerja sistem mandiri AI, melampaui sistem kolaborasi manusia dan AI.
Agak mirip dengan L2, 3, 4, 5 dalam mengemudi otonom. Penilaian Ajeya Cotra adalah: kita sudah sangat dekat dengan tingkat pertama. Tapi kapan tingkat kedua akan datang, dia tidak memberikan jadwal, tetapi dia memberikan penalaran yang sangat jelas, begitu tingkat kedua tiba, akselerasi selanjutnya akan jauh melampaui masa lalu, "dalam waktu satu tahun mungkin akan melesat ke tingkat ketiga."
Kenapa secepat ini? Karena pada saat mencapai tingkat kedua, AI menjadi tim penelitian yang tidak perlu tidur, tidak perlu rapat, tidak perlu menyelaraskan KPI. Ia bisa mencoba, mengubah, mencoba lagi selama 24 jam nonstop. Sedangkan manusia melakukan penelitian, seefisien apapun orangnya, waktu kerja mendalam yang efektif sehari hanya beberapa jam, di tengahnya masih diselipi banyak gangguan dan biaya komunikasi, begitu bottleneck ini tidak ada, akselerasinya naik secara drastis.
Tidak Ada yang Menyebut RSI di Dalam Negeri, Tapi DeepSeek dkk. Sudah Menyentuh Ujungnya
Di atas membahas banyak kemajuan dari luar negeri, Anda mungkin bertanya: bagaimana dengan di dalam negeri?
Jujur saja, produsen dalam negeri jarang menyebut RSI secara terbuka, perusahaan AI luar negeri bisa menulis "kecerdasan super rekursif" ke dalam misi perusahaan, hal seperti ini di dalam negeri hampir tidak terbayangkan. Tapi jika bicara tentang membiarkan AI memperbaiki dirinya sendiri, produsen dalam negeri sebenarnya sudah menyentuh ujungnya di jalur yang berbeda dengan diam-diam.
Contoh paling khas adalah DeepSeek. Mereka menghabiskan uang satu tingkat lebih sedikit daripada OpenAI, tetapi dalam banyak tugas penalaran sudah bisa bertarung langsung. Ini berkat optimalisasi efisiensi algoritma yang ekstrem—arsitektur MoE, kompresi parameter aktivasi yang ekstrem, penghalusan rekayasa strategi pelatihan.
Meskipun ini tidak banyak hubungannya dengan RSI, tetapi ini adalah jalan dengan metode yang lebih cerdas, menggantikan kekuatan kasar menumpuk daya komputasi. Dan jalan ini, kebetulan adalah logika inti RSI: membiarkan model menemukan jalur yang lebih cerdas dalam iterasi.
Di sisi Baidu Wenxin, pembelajaran penguatan yang mendorong model mengoptimalkan diri sendiri sudah menjadi operasi rutin. Meskipun tidak menggunakan nama RSI, tetapi melakukan hal yang sama: membiarkan model terus-menerus memperbaiki diri melalui siklus umpan balik mandiri pada tugas tertentu. Dari sudut pandang ini, produsen dalam negeri bukan tidak melakukan RSI, hanya mereka sudah mengubah beberapa bagian RSI menjadi praktik rekayasa sehari-hari, hanya tidak menyematkan nama ini.
(Sumber: gemini generate)
Tentu, kesenjangan juga ada secara objektif. Kepadatan talenta OpenAI dan Anthropic, saat ini masih belum bisa disamai oleh perusahaan mana pun di dalam negeri, ini berarti dalam eksplorasi RSI, untuk saat ini masih dalam status mengikuti.
Tapi pengalaman sejarah menunjukkan kepada kita, kecepatan mengejar produsen dalam negeri setelah "jalur pipeline jelas" seringkali menakjubkan. Kerangka RSI sedang dibongkar semakin jelas oleh para ahli luar negeri, kode Karpathy juga terbuka di GitHub, begitu jalur yang dapat direplikasi berhasil dilalui, kemampuan kontrol biaya dan kepadatan skenario implementasi pemain dalam negeri, akan menjadi variabel yang sangat diremehkan pasar.
Tapi pada saat yang sama, kita juga harus menuangkan sedikit air dingin dengan tepat. Faktanya, data yang dihasilkan sendiri oleh AI, digunakan untuk melatih AI versi berikutnya, kualitasnya akan menurun. Logika RSI adalah AI menghasilkan data yang baik, lalu menggunakan data ini untuk melatih AI generasi berikutnya, membuat AI generasi berikutnya lebih kuat.
Sedangkan kenyataannya mungkin sebaliknya, dalam data yang dihasilkan AI seringkali tercampur halusinasi, bias, degradasi kualitas miliknya sendiri, data bekas ini diberikan ke versi berikutnya, versi berikutnya menghasilkan barang bekas tingkat tiga yang lebih buruk, setelah beberapa siklus seluruh sistem akan runtuh, seperti mesin fotokopi yang terus-menerus memfotokopi salinan, sampai salinan kesepuluh wajahnya sudah buram.
Dunia akademis menyebut ini keruntuhan model, sudah ada makalah yang memverifikasi fenomena ini benar-benar ada.
Selain itu, lingkungan ideal yang dibutuhkan RSI, tidak ada sama sekali di dunia nyata. Sistem ini agar bisa berjalan, dua prasyarat tidak boleh kurang: daya komputasi tak terbatas, ekosistem penelitian kolaboratif global yang terbuka.
Sedangkan kenyataannya biaya melatih satu model terdepan sudah mencapai tingkat miliaran, kapasitas chip terbatas, energi terbatas, data berkualitas juga semakin sedikit, kontrol ekspor dan dekopling teknologi sedang memotong penelitian AI menjadi beberapa lingkaran yang tidak saling terhubung, orang dan barang tidak bisa mengalir, bahkan syarat dasar ini saja tidak lengkap, jangan bicara tentang RSI.
RSI bukan lagi sekadar masalah teknologi, ia membutuhkan dunia yang cukup terbuka, dan apakah prasyarat ini bisa terbentuk, kalangan teknologi benar-benar tidak bisa memutuskannya.
Ditulis di Akhir
Terakhir, saya akan mengatakan sebuah observasi yang menurut saya menarik: seluruh industri dalam lima tahun terakhir, pertama-tama pra-pelatihan skala besar menarik orang ke dalam 'pemujaan parameter', kemudian RLHF (Reinforcement Learning from Human Feedback) membuat orang percaya 'nilai dapat disetel', sekarang RSI sedang menceritakan kisah 'mesin menyelesaikan seluruh rantai penelitian dan pengembangan sendiri'. Setiap langkah membuat manusia mundur selangkah, bukan keluar dari industri, tetapi keluar dari rantai keputusan.
Meskipun cara mundur seperti ini belum tentu buruk, tetapi itu tidak dapat dibalik. Begitu suatu bagian diambil alih oleh otomatisasi, intuisi, pengalaman, penilaian manusia di bagian itu perlahan-lahan menurun, seperti setelah tidak menggunakan GPS Anda akan menemukan kemampuan mengenal jalan memang memburuk.
Sampai saat itu, kita bahkan mungkin tidak benar-benar memahami bagaimana alat itu dibuat.











