Guntur bergema di dunia AI!
Anthropic mengeluarkan peringatan kepada seluruh umat manusia: Hentikan penelitian AI!
Data internal Anthropic menunjukkan, AI sedang mempercepat perkembangan AI itu sendiri, jalan menuju peningkatan diri secara rekursif mungkin telah muncul.
Dengan kata lain, AI sedang mendekati titik kritis "membuat dirinya sendiri".
Proses ini lebih cepat dari yang diperkirakan Anthropic, sehingga Anthropic menyerukan untuk memperlambat atau menghentikan penelitian AI.
Sementara itu, Yann Dubois, pemimpin tim pasca-pelatihan OpenAI, dalam wawancara terbarunya memberikan perspektif yang lebih mikroskopis namun sama-sama menggugah pikiran:
Evolusi AI Bukanlah Tiba-tiba Menjadi Jenius, Melainkan Baru Saja Melampaui Garis Kelayakan!
Dalam wawancara terbarunya, ia mengungkapkan beberapa perspektif internal:
Pertumbuhan kemampuan AI bersifat linear, kontinu, namun "kegunaan" yang dialami pengguna adalah diskrit, melompat-lompat.
Karena sebelum mencapai "ambang keandalan" tertentu, AI hanyalah mainan yang bisa memperagakan trik; begitu melampaui titik itu, ia menjadi karyawan yang bisa diberi tanggung jawab pekerjaan, dan akan mempercepat dirinya sendiri.
Ambang batas ini, OpenAI baru melampauinya sekitar Desember tahun lalu.
Selain itu, Yann Dubois mengemukakan pernyataan kontra-intuitif: pembangunan AI lebih mirip "Kerajinan Tangan (Craft)" daripada "Ilmu Pengetahuan".
Wawasan ini sangat menarik: di bidang yang paling menekankan daya komputasi keras ini, yang akhirnya menang justru adalah "flare (intuisi/ilham)" mirip alkimia.
Dia juga mengemukakan "bonus AI kilometer terakhir".
Jika sekarang semua model dibekukan, hanya mengandalkan pembuatan aplikasi vertikal (Harness), sebenarnya kita sudah bisa mewujudkan AGI.
Kendala bukan pada otak model, melainkan pada "izin, koneksi, dan data". Ini langsung menyiram air dingin pada pengembang yang masih ragu-ragu, sekaligus menunjukkan lokasi tambang emas.
Ambang Keandalan Telah Terlampaui, AI Mempercepat Dirinya Sendiri
Beberapa minggu terakhir, dunia AI ramai terus: GPT5.5 dirilis, Claude Mythos juga keluar.
Terutama di bidang keamanan siber, agen AI menulis kode, rasanya benar-benar berubah dengan cepat, kemajuan AI memberi kesan seperti tiba-tiba "melompat besar".
Pernyataan Dubois cukup tegas: peningkatan kemampuan sebenarnya cukup kontinu, alasan semua orang merasa seperti naik roket adalah karena ada pemisah "ambang keandalan".
Sebelum ambang batas itu terlampaui, AI seperti magang yang cerdas tapi suka membuat masalah: bisa menulis, menghitung, memberi ide, tapi Anda tidak berani benar-benar menyerahkan pekerjaan padanya.
Setelah ambang batas itu terlampaui, barulah Anda berani membuatnya "benar-benar bekerja".
Dia menilai OpenAI mungkin melampaui garis ini sekitar "Desember tahun lalu", sehingga muncul "loncatan bertahap" yang dirasakan dunia luar.
Yang lebih menarik adalah alasan lapisan kedua: ketika model cukup bagus, ia justru akan mempercepat penelitian dan pengembangan itu sendiri.
Inilah hal yang paling dikhawatirkan Anthropic.
Dubois menyebutkan, terutama dalam skenario pemrograman, peneliti sendiri setiap hari menulis kode, begitu model menjadi lebih kuat, itu sama saja semua anggota tim mendapat partner yang tidak tidur — bisa membantu peneliti menyiapkan rantai alat, juga bisa "membesarkan AI dengan AI" saat melatih model generasi berikutnya.
Sekali sirkuit akselerasi mulai berputar, ia akan berputar semakin cepat, tidak aneh jika beberapa bulan terakhir "semakin kuat".
Ini juga terjadi di internal Anthropic, pada kuartal kedua 2026, kontribusi kode per orang per kuartal sudah 8 kali lipat dari kuartal pertama 2024.
Kekuatan pendorong ketiga, berasal dari "transformasi dan peningkatan" pembelajaran penguatan (RL).
Awalnya model penalaran seperti o1, terutama berfokus pada tugas-tugas dengan "imbalan yang dapat diverifikasi" — soal matematika, kompetisi pemrograman, karena benar salah jelas, imbalan mudah didefinisikan.
Tapi setahun terakhir, mereka memindahkan alat-alat yang dilatih dalam kompetisi itu ke skenario kerja yang lebih nyata dan lebih kabur: tidak hanya mengoptimalkan "soal dengan jawaban standar", tetapi mengoptimalkan "hal yang benar-benar berguna menurut pengguna".
Satu kalimat: dari peserta yang mengerjakan soal latihan, mulai berevolusi menjadi pekerja kantoran.
Insinyur AI Bukanlah Ilmuwan, AI "Dibesarkan"
Tapi begitu memasuki dunia nyata, masalah pun muncul: bagaimana meningkatkan keandalannya?
Dubois memberikan "model probabilitas" yang sangat gamblang:
Karena sekarang banyak sistem agen AI (agentic), Anda bisa kasar saja membayangkannya sebagai "setiap dua menit ada kemungkinan tertentu melakukan kesalahan"; semakin lama waktu berjalan, probabilitas jawaban akhir salah semakin tinggi.
Jadi yang disebut "meningkatkan keandalan" pada dasarnya adalah terus menekan "tingkat kesalahan per dua menit" ini.
Ini adalah masalah keras yang melekat pada agen AI.
Ini juga menjelaskan mengapa Dubois mengatakan, pembangunan AI lebih mirip "pekerjaan kerajinan tangan", tidak seperti "eksperimen ilmiah" di buku pelajaran.
Alur realitas seringkali: pertama mengandalkan pengalaman, intuisi, coba-coba berulang kali untuk membuat sesuatu, bahkan dengan sedikit rasa "alkimia"; setelah benar-benar bisa berjalan, benar-benar berguna, baru kembali melengkapi penjelasan dan metodologi yang lebih ilmiah.
Dia juga menyebutkan sebuah potongan kecil yang cukup membalikkan—
Saat ChatGPT pertama kali mengumumkan menggunakan RL, reaksi pertamanya adalah "Terlalu rumit kan, menggunakan fine-tuning terawasi (SFT) sudah cukup", ini juga persis alur pemikiran yang ingin dia verifikasi saat membuat Alpaca di Stanford.
Tapi kenyataannya kemudian menunjukkan, begitu skala model melampaui level tertentu, RL benar-benar akan "tiba-tiba mulai berguna", hanya saja harganya tidak murah — mengambil sampel banyak jawaban, menilai mana yang benar, mana yang salah, daya komputasi dan rekayasa sistem sangat mahal.
Harness Bidang Vertikal Telah Mencapai AGI
Berbicara tentang "menarik AI ke realitas", tidak bisa lepas dari kata yang paling sering disebutkan di kalangan startup belakangan ini: Harness (sistem penyusunan).
Ada yang menganggapnya sebagai "rangka luar" agen AI, ada juga yang meragukannya cepat atau lambat akan "dimakan" oleh model.
Sikap Dubois sangat realistis:
Jangka pendek, Harness untuk skenario vertikal sangat berharga, bisa mendorong keandalan dari 80% ke 85%.
Tapi syaratnya Anda harus menerima: model terus menjadi lebih kuat, Harness juga harus terus-menerus disesuaikan ulang.
Membuat "Harness umum" yang stabil jangka panjang dan berlaku di mana-mana, dia pikir pada dasarnya tidak bisa berjalan.
Bahkan dia melontarkan penilaian yang sangat "provokatif": jika hari ini model yang ada "dibekukan", hanya mengasah Harness dengan serius dan melatih di sekitarnya, banyak orang di berbagai bidang mungkin akan "merasakan dengan jelas aroma kecerdasan buatan umum (AGI)".
Kilometer Terakhir
Tapi yang benar-benar membuat Dubois bersemangat sekaligus mengerutkan kening, adalah masalah lama yang sulit ini: "pembelajaran berkelanjutan (continual learning)".
Tiga tahun lalu saat ChatGPT baru populer, dia dan teman bahkan serius mendiskusikan apakah akan startup membuat memori personalisasi dan pembelajaran berkelanjutan.
Saat itu mereka merasa "dalam 6 bulan OpenAI akan menyelesaikannya", sehingga tidak jadi dibuat; tiga tahun kemudian dia sendiri sudah masuk OpenAI, tetapi mendapati masalah ini masih belum benar-benar terpecahkan.
Kekikukan model sekarang adalah: hari pertama diterjunkan ke perusahaan, mungkin lebih berguna daripada kebanyakan karyawan baru (titik awal tinggi); tapi setelahnya pada dasarnya "tetap sama", karena ia tidak akan di lingkungan tertentu semakin mengerti Anda, semakin efisien bekerja.
Kurva belajar manusia naik ke atas, tapi garis AI ini mudah menjadi datar.
Membengkokkan kurva AI dari "datar" menjadi "terus naik", Dubois pikir akan menjadi salah satu masalah terpenting berikutnya.
Jadi, apakah startup masih punya ruang untuk membuat aplikasi vertikal?
Jawaban Dubois sangat tegas: tidak hanya ada, tapi sangat besar.
Karena hambatan sebenarnya seringkali bukan "apakah model cukup pintar", melainkan kilometer terakhir — bagaimana memberi izin, bagaimana menghubungkan data, bagaimana menghubungkan konektor, bagaimana menanamkannya ke dalam proses bisnis spesifik.
Model besar terbang setinggi apa pun di langit, jika tidak mendarat hanya bisa jadi kembang api; sementara menariknya ke tanah, membuatnya mendapat kunci yang seharusnya, membuka pintu yang seharusnya, justru menjadi pekerjaan keras dan melelahkan yang paling berharga.
Referensi:
https://x.com/Potatoloogs/status/2062494654885749126
https://www.youtube.com/watch?v=DhD1zZ8w8Mw&t=3s
Artikel ini berasal dari akun resmi WeChat "New Zhiyuan", penulis: ASI Revelation


















