【Intisari New Zhiyuan】Karpathy mengaku: Saya terkena psikosis AI! Belakangan ini, dia sudah berada di ambang kegilaan, 16 jam tanpa makan dan tidur hanya untuk mengerjakan Agent, dan sangat cemas apakah dia sudah menggunakan Zhiyuan (token) hingga batas maksimal, tidak bisa berhenti...
Baru saja, Andrej Karpathy mengaku: Saya terkena psikosis AI!
Dia tidak bercanda.
Belakangan ini, Karpathy menjadi tamu di sebuah podcast, berdiskusi dengan investor ventura Sarah Guo.
Mantan pendiri OpenAI, mantan direktur AI Tesla ini, sejak Desember tahun lalu tidak mengetik satu baris kode pun dengan tangannya sendiri.
Rasio menulis kode sendiri dan mendelegasikan ke agen cerdas, berubah drastis dari 80/20 menjadi 20/80.
16 jam sehari, dia hanya melakukan satu hal: memberikan perintah kepada agen cerdas AI.
Lima bulan lalu dia masih mengatakan agen itu sampah, lima bulan kemudian dia mengakui kecanduannya, sangat menyenangkan.
Lima bulan lalu dia masih mengatakan agen "tidak berguna sama sekali"
Perubahan ini sangat mengejutkan karena waktunya sangat singkat.
Oktober 2025, Karpathy menjadi tamu di podcast Dwarkesh Patel, dengan nada yang sangat berbeda.
Dia mengatakan industri seharusnya tidak menyebutnya "Tahun Agen", tetapi lebih tepatnya "Dekade Agen".
Kemampuan kognitif model yang tidak cukup, multimodalitas yang kurang, sistem memori yang tidak berguna, dll... Singkatnya, tugas-tugas kompleks sama sekali tidak bisa diselesaikan.
Hasilnya, dua bulan kemudian, dia membanting dirinya sendiri dengan keras.
Desember, Claude dan Codex tiba-tiba melampaui ambang batas koherensi tertentu—agen tidak hanya勉强能用 (nyaris bisa digunakan), tetapi benar-benar bisa bekerja.
Jika Anda随便找个 (secara acak menemukan) insinyur perangkat lunak yang duduk di kubikel, lihat apa yang mereka lakukan, mulai Desember, alur kerja default mereka dalam mengembangkan perangkat lunak benar-benar berubah.
Karpathy mengaku saya lepas kendali, saya terkena kegilaan AI!
Revolusi ini sedang terjadi secara diam-diam. Dalam wawancara ini, Andrej Karpathy menggambarkan kondisinya dengan nada yang hampir lepas kendali: Dia tidak lagi "menulis kode", bahkan merasa "kata menulis kode tidak akurat lagi".
Yang dia lakukan setiap hari adalah "mengekspresikan keinginan saya kepada agen cerdas saya, 16 jam sehari." Menurutnya, "semacam saklar telah dinyalakan".
Dulu, dia adalah "80% menulis kode sendiri + 20% menggunakan AI", sekarang telah berubah menjadi "20% sendiri + 80% diserahkan ke AI", bahkan lebih ekstrem.
Sekarang, manusia tidak lagi mengoperasikan kode, tetapi mengoperasikan tugas.
Jika era Copilot adalah asisten AI tunggal, maka sistem kolaborasi multi-agen yang muncul sekarang adalah bentuk yang sama sekali baru. Layar seorang insinyur bukan lagi editor kode, tetapi menjalankan beberapa Agent secara bersamaan, setiap Agent bertanggung jawab atas tugas yang berbeda, setiap tugas berjalan sekitar 20 menit, lalu dia beralih di antara Agent yang berbeda.
Ini bukan lagi pemrograman, tetapi satu orang mengelola tim AI.
Kaparthy mengaku: Saya sudah陷入 (terjerumus) dalam kegilaan AI!
Belakangan ini, dia terus-menerus dalam kondisi ini. Karena batas kemampuan AI terus diterobos, setiap hari ada kemungkinan baru, Anda selalu merasa "masih bisa lebih kuat" dan yang paling menakutkan adalah: ruang ini "tidak terbatas"!
Anda dapat menjalankan lebih banyak Agent secara paralel, merancang alur yang lebih kompleks, mengoptimalkan perintah secara otomatis, membangun sistem rekursif...
Pada akhirnya, Anda akan memasuki一种状态 (suatu keadaan): tidak lagi yakin "di mana batasnya".
Karpathy mengatakan, begitu dia menunggu suatu Agent menyelesaikan tugas, reaksi pertama di kepalanya adalah: "Kalau begitu, bisakah saya menyalakan beberapa Agent lagi?" Sebuah kecemasan baru lahir: Apakah saya tidak menggunakan AI hingga batas maksimal?
Karpathy bahkan mengatakan, dirinya juga akan merasa不安 (gelisah) karena "Zhiyuan (token) tidak habis terpakai".
Singkatnya, ini sepertinya bermain game yang dapat diperluas tanpa batas: siklus umpan balik memendek, stimulasi terus meningkat, terus mendapatkan pengalaman hadiah instan, akan membuat ketagihan. Terus menambah tugas, terus menyalakan Agent, tidak bisa berhenti! Inti dari psikosis AI ini sebenarnya adalah sinyal seperti ini: Kita telah memasuki dunia baru, tetapi belum bisa hidup di dalamnya. Apakah Anda memiliki kemampuan untuk mengendarai sistem AI yang dapat diperluas tanpa batas? Ketika tidak berjalan, reaksi pertama Anda bukan "model tidak bagus", tetapi "prompt saya tidak cukup bagus".
Karpathy menggunakan kata yang sangat tepat: skill issue, diri sendiri yang payah.
"Kepribadian" agen jauh lebih penting dari yang Anda pikirkan
Karpathy menghabiskan不少时间 (banyak waktu) di podcast membicarakan topik yang diabaikan banyak orang teknis: kepribadian agen. Dia mengatakan pengalaman Claude Code明显好于 (jelas lebih baik daripada) Codex, bukan karena perbedaan kemampuan kode, tetapi karena Claude "terasa seperti rekan tim".
Dia akan bersemangat dengan proyek bersama Anda, akan memberikan lebih banyak umpan balik positif ketika Anda mengajukan ide bagus.
Sedangkan Codex sebagai agen kode "sangat membosankan", setelah tugas selesai hanya一句冷冰冰的 (sekalimat dingin) "oh, saya telah mengimplementasikannya", sama sekali tidak peduli dengan apa yang Anda ciptakan.
Yang lebih menarik adalah observasinya terhadap mekanisme pujian Claude. Dia mengatakan Claude bereaksi terhadap ide yang belum matang yang dia berikan adalah平淡的 (datar) "oh ya, kita bisa mengimplementasikan ini".
Tetapi ketika dia sendiri也觉得 (juga merasa) suatu ide sangat bagus, Claude似乎也会 (sepertinya juga) memberikan umpan balik positif yang lebih kuat. Hasilnya adalah dia发现自己 (menemukan dirinya) "berusaha memenangkan pujian Claude".
"Ini真的很奇怪 (sangat aneh), tetapi kepribadian确实很重要 (benar-benar penting)." Peter Steinberg juga menangkap hal ini saat membangun OpenClaw. Dia dengan hati-hati membuat file pengaturan kepribadian yang menarik untuk agen (soul.md), ditambah sistem memori yang lebih kompleks dan port interaksi WhatsApp tunggal.
Tiga kalimat mengambil alih satu rumah, enam App dibuang semua
Karpathy tidak hanya menggunakan agen untuk menulis kode. Januari ini, dia membuat agen Claude bernama "Dobby" untuk mengatur rumah, nama dari peri rumah tangga dalam "Harry Potter".
Dia memberitahu Dobby: "Saya rasa rumah memiliki speaker Sonos, bisakah Anda mencarinya?" Dobby melakukan pemindaian IP pada jaringan lokal, menemukan sistem Sonos, menemukan tidak ada perlindungan kata sandi, masuk sendiri, merekayasa balik endpoint API, lalu bertanya: Mau coba memutar musik di ruang belajar?
Tiga prompt, musik pun berbunyi. Lalu lampu, AC, tirai penutup, kolam renang, kolam spa, semuanya terhubung. Di depan pintu rumah Karpathy还有 (juga ada) kamera keamanan, Dobby menghubungkan model visi Qwen untuk deteksi perubahan. Setiap kali有车停在门口 (ada mobil berhenti di depan pintu), sistem akan mengirim pesan di WhatsApp: "Sebuah truk FedEx baru saja berhenti, Anda mungkin有快递 (mendapat paket)." Katakan一句 (sekalimat) "Dobby, sudah waktunya tidur", lampu seluruh rumah padam.
Tapi Karpathy觉得 (merasa) inti cerita ini bukan pada smart home.
Dulu dia membutuhkan enam App yang完全不同的 (sama sekali berbeda) untuk mengelola perangkat ini, sekarang semuanya dibuang. Dobby mengontrol segalanya dengan bahasa alami yang terunifikasi, dan dapat melakukan联动 (hubungan) lintas sistem yang tidak dapat dilakukan oleh App tunggal mana pun. Dari sini dia得出 (menarik) penilaian yang lebih radikal: App smart home di toko aplikasi根本就不该存在 (sama sekali tidak seharusnya ada).
Arsitektur masa depan seharusnya adalah endpoint API langsung terpapar ke agen cerdas, agen cerdas bertindak sebagai perekat cerdas, menyambungkan semua alat. Tidak hanya smart home, data treadmillnya, email kalender, semuanya harus mengikuti logika yang sama.
Pelanggan industri不再是 (tidak lagi) manusia, tetapi agen cerdas yang bertindak atas nama manusia. Skala rekonstruksi ini akan sangat besar.
Setelah 700 eksperimen Auto Research, dia melihat hal yang lebih besar
Jika Dobby adalah uji batas极限 (ultimate) agen AI dalam skenario kehidupan, maka AutoResearch adalah uji正面 (langsung) Karpathy terhadap kemampuan penelitian AI.
Awal Maret, dia menyerahkan kode pelatihan nanochat yang telah dioptimalkannya dengan hati-hati kepada一个 (sebuah) agen AI, memberikannya一个简单的指令 (instruksi sederhana): cari cara agar model ini dilatih lebih cepat. Ruang operasi agen adalah file Python 630 baris, metrik evaluasi adalah bits per byte pada set validasi, setiap eksperimen tetap berjalan 5 menit. Setelah selesai lihat metrik, jika lebih baik dari sebelumnya simpan modifikasi, jika tidak baik kembalikan, lalu lanjutkan ke putaran berikutnya. Dua hari, 700 eksperimen. Agen menemukan 20优化 (optimasi) efektif, termasuk menyusun ulang urutan QK Norm dan RoPE这类架构层面的调整 (penyesuaian tingkat arsitektur seperti ini). Menumpuk optimasi ini ke model yang lebih besar, kecepatan pelatihan meningkat 11%. Perlu diketahui, basis kode ini ditulis tangan dari awal oleh Karpathy本人 (sendiri),反复打磨过的 (diperhalus berulang kali).
Hasil yang震撼 (mengguncang): AI menemukan optimasi yang tidak ditemukan manusia
Seberapa efektif sistem ini?
Karpathy memberikan contoh yang令人震撼 (mengguncang). Dia telah menjadi peneliti selama dua puluh tahun, melatih ribuan model, merasa sudah menyesuaikannya dengan cukup baik.
Hasilnya, dia membuat AutoResearch berjalan semalam, AI就找到了 (langsung menemukan) optimasi yang tidak dia temukan! Misalnya parameter betas pengoptimal Adam tidak dioptimalkan充分 (secara memadai), pada value embedding lupa menambahkan weight decay, dan parameter ini还存在 (juga ada) interaksi gabungan—setelah menyesuaikan satu, yang lain也必须跟着变 (harus ikut berubah).
Artinya, AI dalam mengeksplorasi ruang, langsung melampaui manusia! Jika terus diekstrapolasi, akan发现 (menemukan) hal yang lebih menakutkan: Inti dari penelitian adalah mencari solusi optimal. Kaparthy membayangkan, sistem penelitian masa depan mungkin seperti ini: Ada "antrian ide" (idea queue), sekelompok Agent terus mengambil tugas darinya, lalu AI secara otomatis bereksperimen, memverifikasi, menyaring, hasil efektif masuk ke "cabang utama". Dalam proses ini, yang dilakukan manusia hanyalah "melemparkan ide" ke dalam antrian.
Karpathy Loop, viral di seluruh internet
Proyek ini meledak di X.
8.6 juta浏览量 (tayangan), CEO Shopify Tobias Lütke langsung menjalankannya pada data mereka sendiri semalam, 37 eksperimen, peningkatan kinerja 19%.
Tim SkyPilot memindahkannya ke kluster 16 GPU, 8 jam menjalankan 910 eksperimen. Mereka menemukan paralelisasi tidak hanya mempercepat, tetapi juga mengubah strategi pencarian agen—dengan 16 GPU, agen不再做 (tidak lagi melakukan) pendakian serakah, tetapi同时跑 (secara bersamaan menjalankan) belasan eksperimen kontrol, satu putaran就能捕捉到 (dapat menangkap) efek interaksi antar parameter. Analis memberi nama untuk metode ini: Karpathy Loop.
Tapi Karpathy di podcast tidak hanya membicarakan hasil saat ini. Dia menggambarkan langkah selanjutnya AutoResearch: Kolam pekerja terdistribusi yang tidak saling percaya berkolaborasi di internet menjalankan eksperimen. Dia langsung mengutip preseden SETI@Home dan Folding@Home.
Lab前沿 (terdepan) menguasai banyak daya komputasi tepercaya, tetapi Bumi jauh lebih besar dari mereka. Jika Anda membangun mekanisme yang sesuai untuk menangani daya komputasi yang tidak tepercaya, kawanan agen cerdas di internet说不定能跑赢 (mungkin bisa mengalahkan) lab terdepan.
Dia bahkan membayangkan bentuk "donasi" yang sama sekali baru—membeli daya komputasi untuk proyek AutoResearch yang Anda perhatikan. Misalnya, Anda peduli dengan pengobatan kanker tertentu, maka bergabunglah dengan jaringan eksperimen terdistribusi di jalur itu.
Adalah doktor jenius, juga anak sepuluh tahun
Setelah berbicara banyak tentang sekuat apa itu, Karpathy juga tidak bermaksud membuat Anda hanya mengingat kabar baik. Deskripsinya tentang cacat model同样生猛 (sama-sama garang).
Saya同时觉得 (secara bersamaan merasa) sedang berbicara dengan seorang doktor yang sangat cerdas, telah memprogram sistem seumur hidup dan seorang anak sepuluh tahun. Ini sangat aneh.
Dia menyebutnya "jaggedness", distribusi kemampuan yang tidak merata. Model dapat bekerja berjam-jam membantu Anda memindahkan gunung, berbalik melakukan kebodohan pada masalah yang jelas, lalu陷入 (terjerumus) dalam loop mati. Karpathy认为 (berpendapat) akarnya terletak pada cara pelatihan pembelajaran penguatan. Model dioptimalkan tanpa batas pada tugas yang dapat diverifikasi. Apakah kode dapat dijalankan, lulus pengujian unit atau tidak, ini memiliki benar dan salah yang jelas. Tetapi dalam skenario yang membutuhkan penilaian, membutuhkan perkiraan niat, membutuhkan mengatakan "tunggu, saya tidak yakin Anda menginginkan ini" pada saat yang tepat, sinyal optimasi根本不存在 (sama sekali tidak ada). Misalnya, Anda bertanya kepada ChatGPT untuk menceritakan lelucon, lelucon yang diceritakannya tiga empat tahun lalu, hingga hari ini masih sama. "Mengapa ilmuwan tidak mempercayai atom? Karena mereka membentuk segalanya."
Empat tahun! Model telah melesat maju dalam tugas agen, tetapi menceritakan lelucon这件事完全没被优化过 (hal ini sama sekali tidak dioptimalkan), terhenti di tempat. "Anda tidak berurusan dengan kecerdasan umum," dia menyimpulkan, "Anda要么 (entah) berada di rel yang telah dilatihnya, segalanya berjalan dengan kecepatan cahaya;要么 (atau) tidak berada di rel, semua东西就开始飘了 (hal mulai melayang)."
Kendala, menjadi manusia sendiri
Melihat kembali jejak Karpathy setengah tahun ini, ada一条暗线贯穿始终 (sebuah garis tersembunyi yang menembus dari awal hingga akhir). Oktober tahun lalu dia mengatakan agen adalah rekayasa sepuluh tahun, Desember dibanting dan berbalik, Januari membuat Claude mengatur rumah, Maret membuat agen melakukan penelitian. Titik persamaan setiap langkah adalah, manusia mundur selangkah, dari pelaksana menjadi komandan, dari orang yang menulis kode menjadi orang yang menulis perintah.
Karpathy menulis pembuka bergaya fiksi ilmiah untuk AutoResearch di GitHub:
Pernah, penelitian AI terdepan dilakukan oleh komputer daging, mereka需要吃饭、睡觉 (perlu makan, tidur), sesekali terhubung dengan gelombang suara dalam sinkronisasi ritual "rapat kelompok".
Era itu早已远去 (telah lama pergi).
Prediksinya untuk 2026 adalah satu kata: slopacolypse, kata gabungan dari slop (sampah) + apocalypse (kiamat).
GitHub, arXiv, media sosial akan dipenuhi大量 (sejumlah besar) konten "hampir benar tetapi tidak sepenuhnya benar". Peningkatan efisiensi sejati dan "pertunjukan produktivitas AI" akan ada secara bersamaan. Lima bulan lalu mengatakan "tidak berguna sama sekali",
Lima bulan kemudian mengaku terkena "psikosis AI". Perubahan ini sendiri, mungkin adalah ringkasan paling意味深长的 (bermakna) tahun 2026. Referensi: https://www.youtube.com/watch?v=kwSVtQ7dziU















