Catatan Editor: Ketika AI Agent bergerak dari Prompt sekali pakai dan vibe coding ke tahap alur kerja yang lebih kompleks, pertanyaan yang benar-benar penting bukan lagi "Apakah model dapat menyelesaikan tugas?", melainkan "Apakah kita dapat mengendapkan kemampuan AI menjadi aset proses yang dapat digunakan kembali dan terakumulasi?".
Artikel ini, berangkat dari GBrain milik Garry Tan, merangkum lima bentuk inti yang secara bertahap ditemukan oleh banyak orang saat menggunakan alat Agent seperti Codex, Claude Code, Hermes: Skills yang dapat diparameterisasi, kerangka eksekusi ringan Thin Harness, Resolvers yang bertanggung jawab untuk routing, lapisan eksekusi yang membedakan penilaian model dengan kode deterministik, serta Memory yang digunakan untuk mengakumulasi konteks jangka panjang.
Modul-modul ini digabungkan bersama mengarah pada suatu jenis "kemampuan proses" yang baru: mengubah pengalaman menjadi alur kerja, mengabstraksikan tugas menjadi parameter, menyerahkan aturan stabil kepada kode, menyerahkan penilaian dan sintesis kepada model, dan terus mengendapkan melalui lapisan memori. Dibandingkan dengan aplikasi atau prompt yang dihasilkan sekali pakai, sistem semacam ini lebih sulit untuk direplikasi, dan lebih mungkin menjadi dasar bagi individu, tim kecil, bahkan perusahaan untuk membentuk keunggulan kompetitif jangka panjang di era AI.
Berikut adalah teks aslinya:
Saya menghabiskan waktu untuk mempelajari GBrain milik Garry Tan. Sebagai seseorang yang berlatar belakang non-teknis dan tidak bekerja di industri modal ventura, saya ingin menyaring beberapa struktur bentuk universal yang saya lihat di dalamnya, serta hal-hal yang benar-benar menarik.
Saya percaya, banyak orang secara bertahap mulai menyatu pada sekumpulan struktur inti yang sama. Mereka kira-kira dapat diringkas menjadi 5 bentuk, yang juga mewakili arah evolusi alami dalam cara penggunaan alat AI berbentuk agen cerdas seperti Codex, Claude Code, Hermes, OpenClaw.
Bacaan terkait: "Thin Harness, Fat Skill: Sumber Sebenarnya Produktivitas AI 100x"
Skills: Dari SOP hingga "Pemanggilan Metode"
Skills hampir merupakan titik awal paling alami bagi semua orang. Bahkan tanpa ada yang mengingatkan, pengguna secara naluriah akan membangunnya, karena bentuknya sangat familiar. Awalnya saya memahaminya sebagai sejenis SOP, yaitu alur kerja standar untuk menyelesaikan sesuatu. Pengguna menyediakan "apa yang harus dilakukan", Skill menyediakan "bagaimana melakukannya".
Pemahaman Tan adalah, Skill lebih mirip dengan "pemanggilan metode". Dalam pemrograman, pemanggilan metode merujuk pada penggunaan parameter untuk memanggil suatu alur program. Kode yang sama akan berjalan setiap kali, yang berubah adalah parameternya: data apa, masalah apa, tujuan apa. Misalnya, fungsi process_invoice yang sama dapat memproses setiap faktur di sistem, bukan hanya yang awalnya ditulis untuk faktur tertentu itu.
Skill memiliki struktur serupa. Sebuah Skill bernama /investigate mungkin berisi tujuh langkah tetap, ketujuh langkah ini tidak akan berubah. Yang berubah adalah parameternya: TARGET (siapa atau apa objek investigasi), QUESTION (apa yang ingin Anda pahami), DATASET (di mana mencari informasi). Arahkan ke kasus whistleblower industri medis, ia berperan seperti analis penelitian; arahkan ke dokumen pengajuan SEC, ia berperan seperti penyelidik hukum. File yang sama, tujuh langkah yang sama, perbedaannya disediakan oleh dunia luar.
Ini berbeda dengan SOP tradisional. Kebanyakan SOP ditulis untuk posisi atau tugas tertentu, seperti "memproses hutang usaha". Setiap skenario penggunaan sesuai dengan satu set alur kerja. Sedangkan abstraksi Skill lebih tinggi, alur kerja yang sama dapat menangani satu jenis masalah. Sebuah Skill yang dirancang dengan baik dapat menyelesaikan pekerjaan puluhan SOP, karena informasi kasus konkret dipisahkan dari dokumen dan dialihkan ke parameter. Secara praktis, beberapa Skill lebih mirip SOP, sementara yang lain lebih mirip pemanggilan metode.
Thin Harness: Model adalah Kecerdasan, Harness adalah Tangan dan Kaki
Model, seperti Opus, GPT-5.5, adalah kecerdasan mentah; Harness, seperti Claude Code, Codex CLI, Hermes, OpenClaw, adalah kerangka eksekusi yang membuat model benar-benar "memiliki tangan dan kaki". Mereka bertanggung jawab untuk eksekusi berulang, membaca/menulis file, mengelola konteks, menegakkan batasan keamanan. Kode intinya hanya sekitar 200 baris.
Garry menyebutkan, kesalahan yang dilakukan kebanyakan orang adalah terus memasukkan lebih banyak hal ke dalam Harness, saya sendiri juga demikian. Saya akhirnya mengakumulasi 100 definisi alat, serta banyak server MCP. Hasilnya, jendela konteks dipenuhi dengan penjelasan alat yang tidak diperlukan oleh tugas saat ini. Model mulai bingung alat mana yang harus digunakan, latensi meningkat, akurasi turun, dan akhirnya terbentuk apa yang disebut "konteks korupsi".
Resolvers: Menggunakan Tabel Routing untuk Menyelesaikan Konteks Korupsi
Cara mengatasi konteks korupsi adalah dengan membuat tabel routing. Fungsi Resolver adalah memetakan dengan jelas "jenis tugas X yang baru masuk" ke "harus memanggil Skill Y". Ketika Anda hanya memiliki 5 Skill, Anda tidak memerlukan Resolver; tetapi ketika Anda memiliki 100 Skill, berbagai deskripsi menjadi kabur, dan model sangat mudah tidak dapat memanggil Skill yang benar pada waktu yang tepat. Resolver menggunakan aturan eksplisit sebagai pengganti pencocokan pola yang samar.
Tan juga menjalankan mekanisme serupa Resolver untuk file: tabel routing independen yang digunakan untuk menentukan di mana lokasi dalam sistem file yang seharusnya menjadi tujuan output suatu Skill. Ini adalah struktur "audit-routing" yang sama, diterapkan pada masalah lain. Dengan demikian, output akan stabil masuk ke folder yang benar, bukan ditempatkan di lokasi yang diduga sementara oleh model.
Skillify adalah pemikiran pendukung lainnya darinya: ini adalah set siklus kualitas untuk mengubah Skill sekali pakai menjadi infrastruktur yang dapat digunakan kembali jangka panjang. Alur 10 langkah yang dijelaskan Tan meliputi: definisi kontrak, penggunaan kode deterministik di tempat yang sesuai, pengujian unit, pengujian integrasi, evaluasi LLM-as-judge, entri Resolver, skrip audit, pemeriksaan Skill mana yang tidak memiliki jalur panggilan, serta pengujian asap ujung ke ujung. Standar ujinya sederhana: jika Anda harus menanyakan pertanyaan yang sama kepada model dua kali, itu adalah kegagalan.
Latent vs. Deterministic: Penilaian Diserahkan ke Model, Tugas Deterministik Diserahkan ke Kode
Perlu benar-benar membedakan pekerjaan mana yang harus diserahkan kepada LLM, dan mana yang harus diserahkan kepada sistem deterministik. LLM unggul dalam penilaian, sintesis, pengenalan pola, dan membaca makna tersirat; tetapi tidak unggul dalam aritmatika, optimasi kombinasi, juga tidak cocok untuk menangani tugas apa pun yang membutuhkan jawaban yang sama setiap kali diberikan. LLM pada dasarnya probabilistik, ketika solusi deterministik dapat menyelesaikan masalah, seharusnya tidak menggunakan LLM.
Kebanyakan orang dengan latar belakang non-teknis cenderung meremehkan nilai lapisan deterministik. Reaksi default kebanyakan orang adalah melemparkan semua hal ke model. Tetapi jika sesuatu dapat diselesaikan dengan cara deterministik, maka hampir pasti harus dilakukan seperti itu. Dan Anda tidak perlu menjadi programmer sendiri, karena model dapat menuliskan kode untuk Anda. Yang benar-benar perlu dilatih adalah disiplin: setiap kali bertanya pada diri sendiri, apakah hal ini dapat diselesaikan dengan stabil dan biaya rendah menggunakan kode? Jika jawabannya ya, suruh model menuliskan kode tersebut.
Memory: Membuat Sistem Benar-benar Dapat Diakumulasi
Agar sistem berguna, ia harus memiliki semacam bentuk memori. Saya belum yakin apa bentuk yang paling tepat, saat ini banyak orang juga membangun dengan cara berbeda: vektor embedding, kesamaan semantik, grafik pengetahuan, penyimpanan campuran, dll. Cara Tan sama dengan saya: hanya sebuah folder markdown.
Strukturnya adalah: satu halaman per orang, satu halaman per perusahaan, satu halaman per konsep. Di bagian atas setiap halaman adalah "Kesimpulan Terpercaya Saat Ini", yaitu penilaian sintesis yang terus ditulis ulang dan diperbarui seiring bukti baru; bagian bawah adalah garis waktu yang hanya ditambahkan, tidak ditimpa.
Memilih markdown membawa beberapa hasil. Pertama, file itu sendiri adalah catatan utama sistem, bukan semacam hasil ekspor. Anda dapat membukanya di VS Code, mengeditnya secara manual, dan Agent akan secara otomatis membaca perubahan ini. Kedua, hubungan bertipe, seperti works_at, invested_in, founded, attended, advises, akan secara otomatis diekstraksi melalui ekspresi reguler setiap kali ditulis, sehingga grafik pengetahuan dapat terhubung sendiri tanpa menghabiskan token. Skema spesifik ini sangat cocok untuk pekerjaannya, tetapi bagi orang lain, mungkin perlu disesuaikan kembali sesuai dengan profesi dan skenario bisnis mereka sendiri.
Selain itu, ada detektor sinyal yang berjalan di latar belakang. Seseorang disebutkan sekali, halaman stub akan dibuat; jika dia disebutkan di tiga sumber berbeda, pemicu pelengkapan informasi web akan diaktifkan; setelah satu pertemuan berakhir, alur lengkap akan dijalankan. "Siklus mimpi" malam hari akan memindai percakapan, melengkapi informasi entitas yang kedaluwarsa, dan memperbaiki referensi yang gagal. Lapisan dasarnya adalah teks, semua hal di atasnya murah dan dapat dikombinasikan.
Tentu saja ada lebih banyak detail di lapisan bawah, tetapi saya percaya, ini adalah garis besar yang paling penting, dan pada tingkat yang cukup besar, mereka bersifat universal.
Saya sendiri sebenarnya telah membangun sekitar setengah dari arsitektur semacam ini. Dulu belum mencapai skala yang mengharuskan pengenalan Resolver sungguhan, tetapi sekarang sudah sampai tahap itu, jadi saya baru saja melakukan sedikit refaktor, membuat sistem saya tidak bergantung pada model tertentu, dan membangun Resolver di dalamnya. Bagian kunci yang saat ini belum saya bangun adalah detektor sinyal yang berjalan otomatis di latar belakang dan siklus mimpi malam hari, yaitu mekanisme pelengkapan dan pengaturan informasi otomatis, ini adalah bagian yang ingin saya coba tambahkan selanjutnya.
Saya menduga, bahwa pembangun yang berbeda sedang menyatu ke struktur serupa, itu sendiri adalah sebuah sinyal: bentuk ini meskipun belum tentu cocok untuk semua orang, tetapi secara keseluruhan kemungkinan besar berguna. Meskipun detail implementasi spesifik akan memiliki perbedaan penting, struktur keseluruhan ini semakin banyak ditemukan secara independen oleh orang-orang.
Pertanyaan yang akhir-akhir ini selalu saya tanyakan pada diri sendiri adalah: Bagaimana menggunakan AI untuk membangun keunggulan kompetitif yang berkelanjutan?
Semua orang sangat antusias dengan aplikasi vibe-coded dan prompt sekali pakai, itu tentu sangat keren. Saya sendiri awalnya juga mulai bermain seperti itu, dan karena itu terjun ke dalamnya. Tetapi apa pun yang dapat dibangun melalui prompt sekali pakai, harga ekuilibriumnya pada akhirnya akan turun ke biaya token yang dibutuhkan untuk membangunnya, yaitu beberapa sen.
Misalnya, seseorang menyalin MyFitnessPal, menjualnya dengan setengah harga dan menghasilkan 1 juta dolar, itu tentu sangat hebat. Tetapi segera akan ada orang lain yang menyalinnya lagi, dan menjual dengan harga lebih rendah. Siklus ini akan terus berlanjut, hingga ruang keuntungan benar-benar terkompresi.
Hal yang benar-benar berkelanjutan adalah semacam "kemampuan proses". Menggunakan kerangka "7 Powers" dari Hamilton Helmer, arsitektur di atas sebenarnya menyiratkan kekuatan proses.
"7 Powers" mengusulkan bahwa perusahaan dapat mempertahankan tingkat profitabilitas di atas rata-rata pasar dalam jangka panjang karena memiliki salah satu dari tujuh kekuatan struktural ini. Setiap keunggulan yang tidak berakar pada kekuatan-kekuatan ini pada akhirnya akan terkikis oleh persaingan.
Bagi usaha kecil-menengah dan perusahaan rintisan, lima dari tujuh kekuatan Helmer pada dasarnya adalah pintu tertutup. Ekonomi skala membutuhkan skala; efek jaringan dan biaya peralihan dapat dibangun, tetapi memerlukan basis pengguna yang besar terlebih dahulu; sumber daya eksklusif biasanya berarti paten atau aset serupa, yang tidak dimiliki oleh kebanyakan perusahaan; membangun merek biasanya membutuhkan waktu sepuluh tahun, tidak bisa jalan pintas.
Dua yang tersisa adalah anti-posisi dan kemampuan proses.
Anti-posisi mengacu pada model bisnis yang tidak dapat ditiru oleh raksasa yang ada, karena begitu meniru, akan merugikan bisnis mereka sendiri yang sudah ada. Peluang semacam ini terkadang ada, tetapi tidak selalu tersedia.
Jadi, jalur paling realistis tersisa pada kemampuan proses. Dan sistem AI yang dirancang dengan baik, justru adalah alat yang dapat menghasilkan kemampuan proses.
Ini pada dasarnya adalah pekerjaan yang sama dengan membangun SOP berkualitas tinggi atau perangkat lunak berpemilik yang dikembangkan sendiri: proses dikodekan, kasus diparameterisasi, sistem deterministik dasar cepat dan andal, lapisan memori terus menerima hal-hal yang dipelajari di masa lalu. Ini memperbesar "layanan yang diproduktifkan": Anda dapat memberikan layanan atau produk tertentu dengan biaya lebih rendah atau kualitas lebih tinggi, karena seluruh pekerjaan telah terstruktur.
Bayangkan seorang akuntan membangun sistem seperti ini. Lapisan memori adalah sebuah folder, setiap klien memiliki file markdown, yang berisi kesimpulan terpercaya saat ini, seperti struktur entitas, posisi pajak tahunan, audit yang sedang berlangsung, serta garis waktu yang mencatat pertemuan, keputusan, dan perubahan yang terjadi.
Dia memiliki beberapa Skill, seperti /year-end-review, /quarterly-estimate, /audit-prep. Alur kerja yang sama dapat dieksekusi dengan parameter yang berbeda untuk klien yang berbeda.
Dia juga memiliki lapisan deterministik, termasuk formulir pajak, tabel depresiasi, dokumen IRS, riwayat formulir pajak klien, dll.
Ditambah dengan mekanisme mirip pengaturan log atau siklus mimpi. Misalnya, sistem secara otomatis menemukan di malam hari bahwa alokasi K-1 seorang mitra turun 40% tanpa perubahan strategi; atau memperhatikan bahwa struktur pengurangan kantor rumah tangga seorang klien dapat dimigrasikan ke klien lain, strukturnya dapat digunakan kembali, tetapi identitas dan privasi tetap di tempat asal.
Dengan demikian, dia dapat mengenakan sedikit premi, melayani lebih banyak klien per tahun, dan pesaing sulit meniru, karena struktur ini tidak muncul begitu saja setelah dia sukses, melainkan terakumulasi secara terus-menerus sejak awal.
Di permukaan, alat ini hanyalah folder markdown. Tetapi setiap baris dalam setiap file di dalamnya, di baliknya berasal dari banyak pengujian, pembangunan, dan iterasi yang disengaja. Yang benar-benar membentuk penghalang kompetitif bukanlah file itu sendiri, melainkan kemampuan proses yang dibawa oleh file-file tersebut.






