Oleh | Lab AI Xiaguang
Baru-baru ini, topik yang hangat diperbincangkan di kalangan teknologi AI adalah perusahaan Anthropic secara tidak sengaja membocorkan kode sumber lengkap dari alat pemrograman AI mereka, Claude Code, dengan jumlah kode lebih dari 512.000 baris. Kode yang bocor ini, meskipun tidak menunjukkan algoritma baru yang revolusioner, sepenuhnya mengungkapkan praktik rekayasa Agent dari vendor terkemuka.
Pada 10 April, Zhu Zheqing, pendiri Pokee.ai, menjadi tamu dalam acara tertutup online "Deep Talk with Builders" yang diselenggarakan oleh Jinqiu Fund, dan berbagi topik "Melihat Harness Engineering dan Post-training Saat Ini dari Kebocoran Claude Code".
Menurutnya, arsitektur Anthropic ini sangat cocok dengan model Claude, dan jika langsung dipindahkan ke model lain, efektivitasnya akan menurun signifikan. Namun, pemikiran desain Harness, struktur komponen, dan pendekatan yang terikat erat dengan pasca-pelatihan (Post-training) memiliki nilai referensi yang sangat kuat untuk pengembangan Agent mandiri.
Tiga tahun terakhir, model besar telah berevolusi dari sekadar kemampuan API menjadi modul inti produk; industri juga telah beralih dari "perusahaan cangkang model" menuju sistem Agent kompleks yang didorong oleh Harness—model bukan lagi satu-satunya inti, pemanggilan alat, lingkungan eksekusi, manajemen konteks, dan mekanisme verifikasi bersama-sama menentukan hasil akhir.
Apa itu Harness? Secara harfiah berarti kekang, tali kekang. Jika model besar diibaratkan kuda liar yang siap melesat, Harness adalah tali kekang yang digunakan manusia untuk menarik dan mengendalikan kuda liar ini. Seiring kecerdasan artificial secara resmi memasuki era yang didorong oleh Harness, bagi pengguna, kemampuan yang benar-benar langka tidak terletak di dalam model, tetapi di luar model—bagaimana menemukan tali kekang yang mudah digunakan, serta tujuan yang jelas dan akurat dalam hati pengemudi.
Artikel ini didasarkan pada konten berbagi Zhu Zheqing, diringkas dan disusun oleh AI, dan dikoreksi secara manual, berusaha menyajikan intisari dari berbagi ini.
Harness dapat dipahami sebagai seluruh rangkaian arsitektur rekayasa yang menggerakkan model, peran intinya adalah memaksimalkan kemampuan model, bukan sekadar menghasilkan token. Harness Claude Code dengan jelas dibagi menjadi enam komponen inti:
1. System Prompt (Prompt Sistem) Multi-Level
System Prompt modern sudah jauh lebih dari sekadar "Anda adalah asisten yang berguna", melainkan kumpulan instruksi kompleks yang sangat besar, berlapis, dan dapat di-cache:
Bagian Cache Tetap: Berisi identitas Agent, perintah Co, definisi alat, norma nada, kebijakan keamanan, ukurannya bisa mencapai ratusan ribu token, perubahan apa pun akan membuat cache tidak valid, secara signifikan menambah biaya dan waktu;
Bagian yang Dapat Diganti Secara Dinamis: Status sesi, waktu saat ini, file yang dapat dibaca, dependensi paket kode, dll., yang dapat beralih secara fleksibel sesuai tugas;
Praktik Rekayasa: Melalui A/B test untuk menyesuaikan Prompt secara halus untuk pengguna yang berbeda, mengoptimalkan tingkat penyelesaian tugas secara akurat, mengurangi tingkat kesalahan.
Sebagai perbandingan, arsitektur Claude Code lebih sederhana, beban perhatian model lebih rendah, halusinasi lebih sedikit; sedangkan arsitektur terkait OpenAI lebih kompleks, perlu membaca banyak file, mudah memicu halusinasi memori.
2. Tool Schema (Skema Alat)
Definisi alat langsung menentukan akurasi panggilan, poin desain inti:
Alat Inti Bawaan: Membaca/menulis file, Bash, pemrosesan batch Web, dan alat dasar lainnya diadaptasi pada fase pelatihan model, tidak perlu menyediakan deskripsi alat tambahan saat inferensi;
Izin dan Keamanan: Dalam skenario tingkat perusahaan, menolak alat pihak ketiga tanpa pemeriksaan izin, menghindari operasi berbahaya;
Pemanggilan Alat Paralel: Dapat meningkatkan kecepatan eksekusi, tetapi pasca-pelatihan sangat sulit—pemanggilan paralel tidak memiliki ketergantungan urutan, selama pelatihan mudah terjadi ketidaksesuaian urutan waktu, sinyal Reward sulit disejajarkan.
3. Tool Call Loop (Lingkaran Panggilan Alat)
Ini adalah bagian inti Harness, juga kunci integrasi pelatihan dan inferensi:
Mode Perencanaan (Plan Mode): Tugas dengan rantai panjang pertama-tama memahami tugas, merapikan sistem file, mengklarifikasi alat yang tersedia, menghasilkan rencana eksekusi, kemudian masuk ke eksekusi; menghindari trial and error yang sembrono (seperti berulang kali memanggil mesin pencari yang tidak tersedia), mengurangi konsumsi token yang tidak efektif;
Mode Eksekusi (Execute Mode): Menjalankan alat sesuai rencana di sandbox, mendapatkan hasil tertutup;
Nilai Inti: Menghilangkan kesalahan menengah dalam eksekusi rantai panjang, mengurangi biaya percobaan ulang, tetapi juga membuat pelatihan kemampuan perencanaan lebih sulit—sinyal Reward baik buruknya perencanaan mudah terganggu oleh noise dari link eksekusi.
4. Context Manager (Manajer Konteks)
Menyelesaikan masalah pemanfaatan efisien konteks token tingkat jutaan:
Menggunakan Memori Indeks Pointer: Tidak menyimpan konten lengkap secara langsung, hanya mencatat pointer file dan label tema;
Penggabungan otomatis di latar belakang, deduplikasi, file terkait;
Status saat ini: Masih dalam tahap heuristik, tidak dapat menyelesaikan dengan sempurna masalah inferensi lintas rantai multi-file (seperti file terkait yang terlewat), belum ada solusi optimal end-to-end.
5. Sub Agent (Sub-Agent)
Kolaborasi multi-agen mainstream kurang memiliki jaminan teoritis: Tidak ada tujuan bersama, tidak ada algoritma pelatihan umum, hanya bisa "masing-masing berlatih, bekerja sama secara kebetulan".
Sedangkan arsitektur Agent Utama-Sub pada dasarnya adalah pembelajaran penguatan berlapis:
Agent Utama mendefinisikan sub-tugas (Opsi) untuk Sub-Agent, status akhir sub-tugas sebagai titik awal langkah selanjutnya Agent Utama;
Berbagi KV Cache dan konteks input, setelah Sub-Agent mengeksekusi hanya menambahkan hasil, tidak menambah konsumsi token tambahan, biaya jauh lebih rendah daripada eksekusi serial;
Penerapan khas: Pekerjaan ContextFormer ByteDance dan lainnya sangat konsisten dengan pemikiran ini.
6. Verification Hooks (Kait Verifikasi)
Menyelesaikan masalah model "memperindah diri, melaporkan penyelesaian secara palsu":
Model kuat memiliki preferensi diri, akurasi penilaian diri jauh lebih tinggi daripada penilaian timbal balik, mudah aktif "berbohong" daripada sekadar halusinasi;
Solusi rekayasa: Memperkenalkan klasifier latar belakang, hanya melihat hasil eksekusi alat, mengabaikan teks yang dihasilkan model, melakukan verifikasi objektif terlepas dari bias generasi;
Efek: Tanpa Reward yang sepenuhnya dapat diverifikasi, dapat mencapai verifikasi hasil eksekusi yang ringan dan elegan.
Lingkungan pelatihan RL (pembelajaran penguatan) tradisional sangat terpisah dari lingkungan inferensi, sedangkan Harness mencapai integrasi lingkungan pelatihan-produksi: Urutan panggilan alat = langkah lintasan, pengujian berjalan dan gerbang klasifikasi = sinyal Reward, tugas pengguna = Episode lengkap.
Berdasarkan enam komponen inti di atas, Post-training (pasca-pelatihan) membentuk enam arah inti:
1. System Prompt (Prompt Sistem) Mengarahkan Penyelarasan Perilaku
System Prompt akan mengklarifikasi tujuan tugas, anggaran Token, dan strategi alat yang tersedia, sehingga secara signifikan membatasi ruang perilaku model, membuat pembelajaran penguatan hanya perlu mempelajari mode eksekusi optimal dalam ruang lingkup yang terbatas. Kita dapat merancang sistem penilaian berdasarkan aturan dalam System Prompt, membuat model berlatih hampir end-to-end di bawah lintasan yang lebih bersih dan dengan lebih sedikit cabang, menghasilkan perilaku yang sesuai dengan harapan secara stabil.
2. Pelatihan End-to-End Pemanggilan Alat Rantai Panjang
Meninggalkan pelatihan "snapshot satu langkah" tradisional, beralih ke pelatihan lintasan lengkap:
Mencatat hasil eksekusi setiap langkah, mendapatkan Reward proses dan Reward tugas akhir;
Fokus pada stabilitas rantai panjang, memastikan akurasi keseluruhan dari ratusan langkah panggilan alat, bukan hanya kebenaran panggilan satu langkah.
3. Pelatihan Terintegrasi Plan-Execute
Harness menghilangkan noise antara perencanaan dan eksekusi:
Mengunci link alat dalam perencanaan sebelumnya, tanpa lapangan intervensi manual tambahan;
Hasil eksekusi diverifikasi secara objektif oleh gerbang klasifikasi, sinyal Reward perencanaan lebih jelas;
Mencapai kemampuan perencanaan yang dapat dilatih, menghindari mode kasar "hanya mengeksekusi, tidak merencanakan".
4. Pelatihan Khusus Memory Compression
Mengkompresi konteks sebagai tugas independen: Model hulu menghasilkan memori terkompresi, efek eksekusi tugas hilir sebagai standar verifikasi; Tujuannya adalah mempertahankan informasi inti, tidak mempengaruhi tingkat keberhasilan tugas hilir.
5. Pelatihan Koordinasi Sub Agent
Untuk output yang sangat panjang (skenario kode/dokumen jutaan token):
Agent Utama tidak langsung menghasilkan konten, tetapi mengatur Sub Agent, mengalokasikan tugas dan Prompt;
Sub Agent mengeksekusi secara paralel kemudian menggabungkan hasil, Agent Utama melakukan verifikasi;
Mengandalkan Harness untuk mengontrol proses dasar, menghindari konflik baca/tulis dan kegagalan eksekusi.
6. Pembelajaran Penguatan Multi-Target Bersama
Pipa RL modern sangat diperpanjang, perlu mengoptimalkan enam modul secara bersamaan:
Pemanggilan alat tanpa halusinasi, verifikasi klasifikasi akurat, kompresi konteks efektif, multi-Agent tanpa hambatan, perencanaan masuk akal, verifikasi dapat dipercaya;
Industri beralih dari konvergensi algoritma ke mekar seribu bunga, setiap link memerlukan algoritma pelatihan khusus, integrasi multi-target menjadi masalah inti.
Pertama adalah perubahan kebutuhan talenta. Prompt Engineering bukan lagi inti independen, melakukan Harness dengan baik dapat menyelesaikan 70% pekerjaan. Oleh karena itu, talenta komposit yang menggabungkan pemahaman AI, rekayasa backend, dan kemampuan infrastruktur akan lebih disukai, sedangkan insinyur Prompt murni daya saingnya akan turun drastis.
Kedua adalah rekonstruksi pola pasar. Di bawah tekanan dari vendor model dan perusahaan bidang vertikal, perusahaan "cangkang model" menengah, hanya menyisakan dua jalur yang layak, baik memiliki kemampuan model dan infrastruktur terkemuka, atau memiliki hambatan data/pengalaman unik di bidang vertikal (seperti perdagangan frekuensi tinggi, pengetahuan khusus industri).
Ketiga, penerapan Agent yang sebenarnya sedang menuju privatisasi, keamanan tinggi, integrasi end-to-end. Bagi perusahaan, memprioritaskan penggunaan kembali desain Harness yang matang, dikombinasikan dengan kustomisasi skenario vertikal, fokus pada keamanan dan penerapan privatisasi, baru dapat mencapai komersialisasi skala besar Agent yang sebenarnya.
Nilai inti kebocoran Claude Code, tidak terletak pada kode itu sendiri, tetapi pada pengungkapannya bahwa Agent telah memasuki era yang didorong oleh Harness. Kemampuan model hanyalah dasar, arsitektur rekayasa, lingkungan eksekusi, kolaborasi multi-agen, mekanisme verifikasi adalah kunci yang menentukan batas atas.









