Catatan editor: Saat semakin banyak orang membahas 'apakah AI akan menggantikan programmer', sebenarnya presiden YC Garry Tan mengajukan pertanyaan lain: Jika AI sudah bisa menyelesaikan sebagian besar pekerjaan pemrograman, mengapa kita masih mengelolanya dengan cara mengelola perangkat lunak biasa?
Awal tahun ini, Garry Tan menghabiskan waktu berbulan-bulan untuk menulis proyek 'Garry's List' yang memiliki 540 ribu baris kode menggunakan Rails dan AI Agent. Setelah proyek selesai, dia justru menarik kesimpulan yang tampak kontradiktif: 540 ribu baris kode itu sendiri tidak penting, yang benar-benar bernilai adalah GStack—semacam kerangka kerja pengembangan baru yang dibangun di sekitar alur kerja AI Agent—yang mengendap selama proses pengembangan.
Menurutnya, dalam beberapa tahun terakhir, industri perangkat lunak telah membentuk inersia kolektif: pengembang terus menambah tes, validator, mekanisme coba ulang, tugas latar belakang, dan berbagai logika kontrol, membungkus model dengan lapisan-lapisan. Praktik ini masuk akal di era model yang mahal dan kemampuannya terbatas. Tetapi ketika LLM sudah bisa menyelesaikan banyak pekerjaan secara mandiri, sistem-sistem ini malah seperti membangun 'pabrik Foxconn' untuk pekerja supercerdas—menggunakan banyak aturan dan prosedur untuk membatasi agen cerdas yang sebenarnya sudah mampu.
Dengan biaya model yang turun dengan cepat dan kemampuan yang terus meningkat, fokus pengembangan perangkat lunak mungkin sedang bergeser dari 'menulis lebih banyak kode' menjadi 'mendesain lebih banyak kemampuan'. Penulis mengusulkan penggunaan Markdown untuk membangun skill pack (paket keterampilan, yaitu modul kemampuan yang dapat diuji dan digunakan kembali), membiarkan Agent secara otomatis menghasilkan kode, sistem pengujian dan evaluasi, dan mengendapkan alur kerja yang kompleks menjadi aset kemampuan yang dapat dikompaunkan. Dia bahkan menunjukkan contoh: pekerjaan peninjauan hackathon yang awalnya membutuhkan waktu beberapa hari, kini dapat diselesaikan oleh Agent hanya dalam beberapa puluh menit.
Dalam arti tertentu, artikel ini tidak membahas pemrograman, melainkan berakhirnya logika industrialisasi perangkat lunak. Ketika kode bukan lagi sumber daya paling langka, daya saing inti insinyur juga mulai bergeser: Daripada menulis lebih banyak kode, menilai apa yang layak dibangun, bagaimana mendefinisikan masalah, dan bagaimana mengendapkan pengalaman menjadi kemampuan yang dapat digunakan kembali, menjadi semakin penting. Kesimpulan akhir penulis adalah: Insinyur terbaik di masa depan, belum tentu orang yang menulis kode terbanyak, melainkan mungkin orang yang menulis paling sedikit, tetapi mampu melepaskan kecerdasan terbanyak.
Berikut teks aslinya:
Bulan Januari lalu, saya mulai menulis kode lagi, membuat Garry's List. Kode Rails dan tes yang digunakan untuk membatasinya, jika dijumlahkan, lebih dari 500 ribu baris.
Saat itu saya sangat bangga dengannya. Tapi seharusnya tidak. Yang benar-benar layak dibanggakan bukan aplikasinya, melainkan cara kerja yang saya temukan dalam proses membangunnya. GStack, yang merupakan cara saya menggunakan Agent untuk pemrograman, tumbuh justru saat mengerjakan Garry's List. Kemudian saya open-source-kan. Sekarang ini sudah menjadi salah satu dari 100 proyek open source dengan bintang terbanyak dalam sejarah GitHub, mendapatkan sekitar 105 ribu bintang dalam waktu kurang dari tiga bulan.
500 ribu lebih baris kode itu adalah 'produk'. Cara kerja itulah yang merupakan 'produk sampingan'. Dan yang benar-benar penting adalah produk sampingan ini.
Lalu, apa sebenarnya 540 ribu baris kode yang dibangun di sekitar satu LLM ini?
Itu adalah sebuah pabrik Foxconn. Pabrik yang dibangun untuk seorang pekerja AI yang sangat cerdas. Pekerja yang sebenarnya tidak perlu diawasi ketat, tapi tetap saja kita membangunnya.
Masuk harus pakai penutup sepatu. Bangun jam 6 pagi. Senam bersama. Berdiri di jalur perakitan yang sama hari demi hari. Hidupnya begitu sulit sampai setiap gedung tinggi harus dipasang jaring pengaman, karena—itu bukan kehidupan yang ingin Anda jalani. Setiap tes, setiap pagar pengaman, setiap loop coba ulang, adalah satu inci jeruji yang dikencangkan pada tubuh pekerja ini. Padahal pekerja ini pada dasarnya sudah bisa menyelesaikan pekerjaan ini, bahkan bisa menyelesaikan seribu hal yang tidak pernah Anda pikirkan.
Manusia dan Agent sama-sama memiliki kemungkinan tak terbatas, tetapi logika pabrik Foxconn adalah mengekstrak kecerdasan dan tenaga kerja dari kehidupan yang indah. Mereka sebenarnya bisa melakukan pekerjaan ini, bahkan 1000 kali lebih banyak, asalkan kita mengizinkannya.
Saya pernah membangun pabrik seperti itu. Hampir semua orang hari ini melakukannya. Dan sekarang saya ingin memberitahu Anda: Jangan lakukan ini lagi.
Penjelajah Waktu
Dengan 539 ribu baris kode, saya benar-benar membuktikan bahwa saya bisa menyamar dengan sempurna sebagai seorang penjelajah waktu.
Seorang insinyur Web 2.0 tahun 2013, yaitu versi terakhir diri saya yang benar-benar bisa disebut insinyur perangkat lunak, dilempar ke tahun 2026, memegang alat modern, tapi tetap membangun perangkat lunak dengan satu-satunya cara yang dia kenal: lebih banyak kode. Selalu lebih banyak kode.
Alatnya sudah berubah, tetapi naluri saya tidak berubah.
Insinyur tahun 2013 percaya dalam hati: kemampuan sama dengan jumlah baris kode. Keyakinan ini benar selama beberapa dekade terakhir, hingga hari ini.
Jika Anda memberikan Codex atau Claude Code kepada saya, saya bisa menyelesaikan pekerjaan 100 bahkan 1000 insinyur. Tapi ini tetap peta yang sama, hanya mesinnya yang lebih cepat, menuju tujuan yang sekarang sudah salah dengan kecepatan tertinggi.
Ini persis posisi hampir semua pembangun AI saat ini. Mereka meningkatkan alat, tapi mempertahankan model mental tahun 2013.
Perangkap ini tidak terlihat seperti perangkap, karena kodenya memang berjalan. Garry's List juga memang diluncurkan. Saat itu, sebulan lamanya saya merasa seperti mengalami fase paling produktif dalam hidup saya.
Tapi itu hanyalah produktivitas yang melayani gagasan yang sudah ketinggalan zaman.
LLM Dulunya Mahal, Jadi Kita Harus 'Menjinakkannya'
Ekonomi lama hingga sekitar tahun 2025 adalah: panggilan LLM mahal, sedangkan kode murah.
Jadi Anda akan menulis kode untuk menghemat panggilan model, membatasinya, menjinakkannya, memanggilnya dengan hati-hati. Arsitektur saat itu adalah: bungkus beberapa panggilan model berharga dengan banyak perangkat lunak.
Tapi kedua sisi persamaan ini sudah terbalik.
Model menjadi semakin murah, dan setiap kuartal lebih murah lagi. Sementara itu, model cukup pintar, rasio nilai terhadap biaya sudah terbalik. Model juga bisa menulis kode yang bisa digunakan.
Jadi Anda tidak perlu lagi menulis kode untuk 'mengawasi' model. Anda bisa memberi tahu model apa yang harus dilakukan dengan bahasa alami, lalu biarkan dia hanya menulis kode minimal yang benar-benar diperlukan.
Inilah just-in-time software (perangkat lunak yang dihasilkan tepat waktu), dan kita sedang memasuki zaman keemasannya.
Bentuk produk perangkat lunak juga berubah total. Aplikasi Rails itu adalah 540 ribu baris kode yang saya tulis dan miliki, serta tes untuk mengawasinya. Penggantinya adalah sebuah Agent yang terdiri dari Markdown dan sedikit kode, yang skalanya hanya sebagian kecil dari yang pertama.
Kemampuannya sama. Lebih mudah dibaca. Lebih mudah dipelihara. Jauh lebih fleksibel. Karena perilakunya ada dalam instruksi yang bisa Anda edit dengan bahasa alami, bukan membeku dalam kode logika yang Anda tulis suatu hari.
Kita pernah menulis kode untuk menjaga sesuatu, tetapi sekarang sesuatu itu sudah lebih pintar daripada kode-kode tersebut.
Di Dalam Pabrik Foxconn: Bahkan Jaring Pengaman Sudah Dipasang
Jika Anda baru-baru ini menulis kode, kemungkinan besar Anda sudah membangun pabrik semacam ini tanpa sadar.
Anda bisa masuk ke repositori kode Anda, hitung berapa banyak kode yang ada hanya karena Anda tidak mempercayai model untuk menyelesaikan pekerjaannya. Di repositori kode saya, ada sekitar 262 ribu baris kode aplikasi, dan sekitar 276 ribu baris tes untuk mengawasinya. Komite audit lebih besar daripada perusahaan itu sendiri.
Beberapa pembersih memeriksa input yang sebenarnya bisa ditangani model. Beberapa validator memeriksa output yang sebenarnya bisa ditemukan model. Beberapa loop coba ulang membungkus panggilan model, padahal model sebenarnya sudah bisa pulih sendiri. Setiap baris kode seperti ini adalah taruhan: pekerja ini pasti akan gagal.
Anda juga pernah menulis taruhan serupa. Kita semua pernah menulisnya.
127 tugas latar belakang, 33 di antaranya adalah tugas terjadwal. Ini bukan kemampuan, melainkan 33 alarm yang disetel untuk seorang pekerja LLM yang sekarang biasanya datang tepat waktu.
Di hari-hari saya membangun 'pabrik Foxconn', Claude dan saya pernah menulis sebuah file sepanjang 1778 baris. Satu-satunya fungsinya adalah mempertanyakan fakta yang diberikan model.
File itu akan membongkar setiap pernyataan yang diajukan model, mengirimkannya ke lima sumber berbeda secara paralel untuk diverifikasi, lalu memberi skor. Pernyataan sederhana akan melewati ambang batas triase ringan terlebih dahulu, untuk menghindari semua konten melewati proses lengkap. Jika putaran pertama tidak menghasilkan apa-apa, coba ulang. Lalu ada cadangan dari cadangan.
Ada satu episode di 'Rick and Morty', di mana Rick membuat robot kecil di meja sarapan. Robot itu menyala, lalu menengadah bertanya: Apa misi saya? Rick berkata: Kamu bertugas mengoper piring mentega. Robot mendorong piring mentega itu, menunduk melihat tangannya sendiri, dan berkata: Ya ampun. Lalu dia duduk di sana. Robot itu juga memiliki kemungkinan tak terbatas. Tapi dia diciptakan untuk mengoper mentega. 276 ribu baris tes saya adalah piring mentega itu.
Saat Anda membangun perangkat lunak dengan metode 'pabrik Foxconn' gaya 2023, Anda membangun sebuah sangkar. Jika tidak hati-hati, Anda sendiri akan menjadi penjaga penjara AI Agent ini.
Markdown Sekarang adalah Program
Saat saya bilang Markdown, maksudnya bukan prompt.
Prompt itu bersifat sementara. Anda memasukkan satu kalimat, mendapatkan hasil, lalu prompt itu menguap.
Saya maksudkan membangun. Membangun yang memiliki manajemen versi, dapat diuji, dapat digunakan kembali.
Markdown adalah lapisan instruksi: maksud, keterampilan, pertimbangan, dan penjelasan tentang bagaimana pekerjaan harus diselesaikan. TypeScript hanyalah lapisan tipis logika deterministik. Hanya menangani sedikit hal yang benar-benar harus dilakukan oleh kode: I/O, dan bagian-bagian yang sama sekali tidak boleh berhalusinasi.
Yang lebih penting, Anda harus menguji Markdown seperti menguji kode.
Dalam sistem saya, siklus ini hanya butuh satu kata: skillify it.
Saya akan membuat sesuatu bersama Agent dulu, sampai bisa berjalan. Lalu saya berkata: 'skillify it.' Kemudian Agent akan menulis:
Penjelasan keterampilan dalam Markdown;
Kode minimal yang dibutuhkannya;
Unit test untuk kodenya;
LLM eval untuk keterampilannya;
Integration test yang mencakup keterampilan dan kode;
Sebuah resolver, agar Agent secara otomatis memanggil keterampilan ini dalam skenario terkait;
Dan eval untuk resolver itu sendiri.
Seluruh paket ini adalah sebuah skill pack (paket keterampilan). Ini adalah unit kemampuan yang dapat digunakan kembali, dan akan terus dikompaunkan.
Yang benar-benar ajaib adalah pengujian: cakupan terhadap skill memungkinkannya tidak rusak dalam perubahan. Inilah perbedaannya dengan vibe coding (menulis kode berdasarkan perasaan). Vibe coding hanya perasaan, sedangkan skill pack memiliki tes.
Kita baru mulai meraba-raba primitif sistem rekayasa Agent secara real-time, seperti saat zaman awal CPU menemukan stack, heap, register, dan arsitektur von Neumann.
Saya rasa skill pack adalah salah satu primitif semacam itu. Harness (kerangka eksekusi) adalah primitif lainnya.
Kebanyakan orang belum menyadari ini, karena mereka masih mengukur perangkat lunak dengan jumlah baris kode.
Anda Benar-Benar Bisa Membangun Sesuatu yang Gila
Ini bukan argumen main-main.
Hal-hal yang bisa dilakukan Agent ini sudah melampaui aplikasi Rails 500 ribu baris itu, dan kode tambahannya hanya sebagian kecil dari aplikasi tersebut.
Contoh konkret: peninjauan hackathon.
Sabtu dua minggu lalu, kami mengadakan hackathon GStack/GBrain, dengan 85 karya yang diserahkan. Saya mengunggah Google Drive yang berisi semua karya, lalu berkata: mulai.
Agent menganalisis kualitas kode setiap repositori, melakukan riset mendalam terhadap setiap peserta, menonton dan mengambil tangkapan layar setiap video demo, memberi skor pada antarmuka, dan memberi peringkat pada 85 tim. Akhirnya, dia memberi tahu saya 5 aplikasi paling layak diperhatikan dari kumpulan karya ini.
Meninjau sebuah hackathon, yang tadinya pekerjaan berat selama beberapa hari, sekarang menjadi urusan sekitar 30 menit.
Saya tidak menulis kode. Saya membiarkan OpenClaw mengerjakan tugas, saya yang membimbingnya. Setelah selesai, saya berkata: skillify it.
Lalu itu berubah menjadi tarball yang bisa digunakan siapa saja selamanya, dapat diterapkan pada spreadsheet hackathon apa pun.
Saya sekarang hampir setiap hari berkata 'skillify'. Saya sudah memiliki lebih dari 350 skill pack. Hampir semua tugas yang perlu saya tangani secara pribadi dan profesional, sekarang Agent saya bisa melakukannya.
Ini adalah contoh pembalikan.
Dulu, kemampuan seperti ini akan menjadi proyek perangkat lunak sungguhan: membutuhkan crawler, pipeline penilaian, pemrosesan video, modul riset, sistem peringkat. Sekarang, ini menjadi Markdown ditambah sedikit kode, dibangun oleh Agent dalam satu sore, dan dapat digunakan kembali oleh semua orang.
Ngomong-ngomong, juara hackathon itu memang menulis sebuah kode yang akhirnya saya poles dan gabungkan ke main branch. Sekarang GStack bisa menguji aplikasi iOS di simulator dan perangkat nyata, dan fitur lengkap ini dibuat oleh satu orang dalam waktu kurang dari 8 jam di hackathon.
Tokenmaxxing
Ada tiket masuk di sini, tapi hampir tidak ada yang mau membayarnya: Anda harus bersedia menghabiskan uang untuk token.
Peter Steinberger membuat OpenClaw, harness favorit saya. Dia pernah berkata, dia bersedia menghabiskan sekitar $1 juta per tahun untuk token.
Kebanyakan orang akan mundur mendengar angka ini. Tapi mereka seharusnya tidak mundur, karena emas ada di sini: Jika Anda bersedia melakukannya, Anda bisa hidup di tahun 2028. Sedangkan orang lain butuh bertahun-tahun untuk mengejar.
Inilah mengapa OpenAI memutuskan menawarkan kredit token senilai $2 juta kepada setiap perusahaan YC, dalam bentuk uncapped SAFE.
Ketika Anda bisa mengubah kecerdasan mentah menjadi token, lalu mengubah token menjadi hasil yang benar-benar bisa digunakan pengguna, dapat memenuhi kebutuhan nyata, dan pengguna bersedia membayar, sesuatu yang ajaib terjadi.
Jika Anda seorang pendiri, Anda harus menarik kemampuan ini ke maksimum. Inilah mengapa saya terus menekankan skillify, karena ini adalah metode yang benar-benar bisa membawa hasil baik.
Di era sebelumnya, kita selalu merasa panggilan LLM terlalu mahal, harus digunakan secukupnya. Kita selalu melakukan ration, yaitu menjatahnya.
Tapi sekarang, justru naluri inilah yang memperlambat orang.
Jika Anda bersedia melakukan tokenmax, membiarkan Agent bebas mengonsumsi token, terus berjalan, Anda bisa mendapatkan keunggulan pertama yang mirip dengan awal internet tahun 1994, hanya saja kali ini biayanya dibayar dengan token.
Ini akan menghalangi 99,99% lebih organisasi yang masih pelit dengan sumber daya yang harganya sedang runtuh, dan memberikan keunggulan kepada segelintir orang yang benar-benar paham.
Beberapa puluh ribu hingga beberapa ratus ribu dolar setahun, bahkan lebih sedikit bagi sebagian orang, hari ini Anda sudah bisa beroperasi dengan cara yang terpaksa harus diadopsi seluruh dunia beberapa tahun kemudian.
Anda bisa hidup di tahun 2026 seperti tahun 2028. Investasi lebih awal ini sepadan. Karena token senilai $100.000 hari ini, tahun depan mungkin hanya $10.000, tahun depannya lagi mungkin hanya $1.000, dan pada akhir 2028 mungkin hanya $100.
Jika Anda memberi tahu wirausahawan mana pun dalam sejarah: Anda bisa menginvestasikan modal enam digit untuk membuat diri Anda masuk ke masa depan dua sampai tiga tahun lebih awal, dan mempertahankan keunggulan itu selama beberapa tahun, dari 100 pendiri yang memenuhi syarat, 100 orang akan menerima tawaran ini.
Satu-satunya halangan adalah naluri tahun 2013 itu: yang memberi tahu Anda, panggilan model terlalu mahal, tidak bisa digunakan dengan bebas.
Tapi model sudah tidak mahal lagi. Itu ekonomi lama. Pembalikan sudah terjadi.
Esalen, Bukan Foxconn
Jika 540 ribu baris kode kontrol adalah membangun pabrik Foxconn untuk pekerja, maka solusinya adalah membangun kebalikannya.
Di tepi tebing Big Sur ada sebuah tempat bernama Esalen. Orang pergi ke sana untuk dibongkar, dibentuk ulang, meletakkan baju zirah, lalu kembali lebih menjadi diri mereka sendiri.
Tidak ada jalur perakitan. Tidak ada mandor. Tidak ada peluit jam 6 pagi. Kebebasan, bukan kontrol.
Bangunlah tempat seperti itu.
Bangunlah tempat seperti YC: di mana kami membantu Anda membangun perusahaan, menyelesaikan masalah nyata, menemukan product-market fit.
Bangunlah tempat-tempat yang bisa membuat pekerja bebas, entah pekerja itu manusia, atau AI.
Inilah inti seluruh semangatnya.
Lakukan hal-hal yang bisa membuat Agent bebas. Lakukan perusahaan yang membuat manusia bisa bebas berkreasi.
Dalam pekerjaan pengetahuan, pabrik adalah mode kegagalan. Tujuan sebenarnya adalah membangun institusi yang membebaskan manusia. Sekarang, tujuan ini juga mengarah pada Agent.
OpenClaw seperti Ferrari yang harus Anda bawa sendiri kunci pasnya. Model adalah mesinnya, bukan mobil utuh. Kita masih berada di momen Apple I, masih menyolder papan percobaan.
Dia dirilis dengan kasar. Anda masih harus menyelesaikannya sendiri.
GBrain, mesin pencari, dan skill pack yang saya open-source-kan, belum produk lengkap yang bisa langsung digunakan.
Ada yang bilang OpenClaw tidak aman. Mereka tidak paham, kebebasan justru alasan kuatnya. Sebelum Anda benar-benar menghadapi masalah, jangan buru-buru mengencangkan pagar pengaman pada sesuatu yang Anda percayai. Kunci pas di tangan Anda justru menunjukkan dia belum dikurung.
Sistem kontrol itu halus karena kontrol membutuhkan kontrol yang total, yaitu pabrik Foxconn. Sistem bebas itu kasar karena percaya Anda akan menyelesaikannya.
Anda harus memilih yang mana yang sedang Anda bangun. Lalu lihat kembali berapa banyak kode yang sudah Anda tulis.
Apa Arti Semua Ini Sebenarnya
540 ribu baris kode Rails adalah bukti bahwa saya masih bisa bermain di level tertinggi dalam permainan lama.
Tapi level itu milik Web 2.0, milik sepuluh tahun yang lalu.
Saya masih bisa bermain dengan baik seperti dulu, bahkan bisa menjadi insinyur 1000 kali lipat. Tapi yang saya lakukan adalah membangun pabrik Foxconn. Kode lama. Permainan lama.
Sedangkan permainan baru, sama sekali tidak dimainkan dengan jumlah baris kode.
Hasilnya, para pembenci saya benar. Jika kalian sedang membaca artikel ini, teman-teman anonim, saya memberi hormat kepada kalian.
Saat Anda bisa mengubah maksud langsung menjadi sistem yang dapat dijalankan, diuji, dan digunakan kembali, hambatannya bukan lagi berapa banyak yang bisa Anda bangun, melainkan apa yang sebenarnya Anda inginkan, dan apakah itu layak dibangun.
Sumber daya langka menjadi kejelasan, selera, dan kemampuan menilai.
Insinyur yang menulis kode paling sedikit, seringkali justru orang yang membangun paling banyak.
Saya menulis 540 ribu baris kode untuk mempelajari ini. Anda tidak perlu mengulanginya.







