Penulis: xiyu
Ingin menggunakan Claude Opus 4.6 tapi tidak ingin tagihan meledak di akhir bulan? Artikel ini membantu memotong 60-85% biaya.
一、Token Terpakai untuk Apa?
Anda pikir token hanya "ucapan Anda + balasan AI"? Kenyataannya jauh lebih dari itu.
Biaya tersembunyi setiap percakapan:
-
System Prompt (~3000-5000 tokens): Instruksi inti OpenClaw, tidak bisa diubah
-
Inject file konteks (~3000-14000 tokens): AGENTS.md, SOUL.md, MEMORY.md, dll., dibawa setiap percakapan — ini adalah biaya tersembunyi terbesar
-
Riwayat pesan: Semakin lama semakin panjang
-
Input Anda + output AI: Inilah yang Anda kira "seluruhnya"
Sebuah "Bagaimana cuaca hari ini?" yang sederhana, sebenarnya menghabiskan 8000-15000 input tokens. Dihitung dengan Opus, hanya konteks saja sudah menghabiskan $0.12-0.22.
Cron lebih kejam: Setiap pemicu = percakapan baru = menyuntikkan ulang semua konteks. Sebuah cron yang berjalan setiap 15 menit, 96 kali sehari, di Opus menghabiskan $10-20 sehari.
Heartbeat sama: Intinya juga panggilan percakapan, semakin pendek intervalnya semakin boros uang.
二、Stratifikasi Model: Sonnet untuk Sehari-hari, Opus untuk Hal Penting
Cara hemat pertama, efeknya paling dahsyat. Harga Sonnet sekitar 1/5 Opus, 80% tugas sehari-hari sudah cukup.
markdown
Kata Kunci:
Tolong bantu saya ubah model default OpenClaw ke Claude Sonnet,
hanya gunakan Opus saat perlu analisis mendalam atau kreasi.
Kebutuhan spesifik:
1) Setel model default ke Sonnet
2) Tugas cron default gunakan Sonnet
3) Hanya tugas menulis, analisis mendalam yang ditentukan menggunakan Opus
Skenario Opus: Menulis artikel panjang, kode kompleks, penalaran multi-langkah, tugas kreatif
Skenario Sonnet: Obrolan santai sehari-hari, tanya jawab sederhana, pemeriksaan cron, heartbeat, operasi file, terjemahan
Hasil tes: Setelah beralih, biaya bulanan turun 65%, pengalaman hampir tidak berbeda.
三、Perampingan Konteks: Potong Konsumen Token Tersembunyi
"Noise dasar" setiap panggilan bisa 3000-14000 tokens. Merampingkan file injeksi adalah optimasi dengan nilai terbaik.
markdown
Kata Kunci:
Bantu saya merampingkan file konteks OpenClaw untuk menghemat token.
Termasuk: 1) Hapus bagian yang tidak perlu di AGENTS.md (aturan grup chat, TTS, fungsi tidak terpakai), kompres hingga 800 tokens
2) Sederhanakan SOUL.md menjadi poin-poin ringkas, 300-500 tokens
3) Bersihkan informasi kedaluwarsa di MEMORY.md, kendalikan dalam 2000 tokens
4) Periksa konfigurasi workspaceFiles, hapus file injeksi yang tidak perlu
Aturan praktis: Setiap pengurangan 1000 tokens injeksi, dengan asumsi 100 panggilan Opus per hari, hemat sekitar $45 per bulan.
四、Optimasi Cron: Pembunuh Biaya Tersembunyi
markdown
Kata Kunci: Bantu saya mengoptimalkan tugas cron OpenClaw untuk menghemat token.
Tolong:
1) Daftar semua tugas cron beserta frekuensi dan modelnya
2) Turunkan semua tugas non-kreasi ke Sonnet
3) Gabungkan tugas dalam periode waktu yang sama (misal beberapa pemeriksaan jadi satu)
4) Kurangi frekuensi tinggi yang tidak perlu (pemeriksaan sistem dari 10 menit jadi 30 menit, pemeriksaan versi dari 3 kali/hari jadi 1 kali/hari)
5) Konfigurasi delivery untuk pemberitahuan sesuai permintaan, tidak kirim pesan jika normal
Prinsip inti: Bukan semakin sering semakin baik, kebanyakan kebutuhan "real-time" adalah kebutuhan palsu. Menggabungkan 5 pemeriksaan independen menjadi 1 panggilan, hemat 75% biaya injeksi konteks.
五、Optimasi Heartbeat
markdown
Kata Kunci: Bantu saya optimalkan konfigurasi heartbeat OpenClaw:
1) Atur interval jam kerja menjadi 45-60 menit
2) Setel periode sunyi 23:00-08:00
3) Sederhanakan HEARTBEAT.md hingga jumlah baris minimal
4) Gabungkan tugas pemeriksaan yang tersebar ke heartbeat untuk dieksekusi secara batch
六、Pencarian Presisi: Gunakan qmd Hemat 90% Input Token
Saat agen mencari materi, defaultnya "baca teks lengkap" — sebuah file 500 baris 3000-5000 tokens, tetapi hanya butuh 10 baris di dalamnya. 90% input token terbuang.
qmd adalah alat pencarian semantik lokal, membangun indeks teks lengkap + vektor, memungkinkan agen menemukan paragraf secara tepat daripada membaca seluruh file. Semua perhitungan lokal, nol biaya API.
Digunakan dengan mq (Mini Query): Pratinjau struktur direktori, ekstraksi paragraf presisi, pencarian kata kunci — hanya membaca 10-30 baris yang dibutuhkan setiap kali.
markdown
Kata Kunci:
Bantu saya konfigurasi pencarian basis pengetahuan qmd untuk menghemat token.
Alamat Github: https://github.com/tobi/qmd
Perlu:
1) Instal qmd
2) Buat indeks untuk direktori kerja
3) Tambahkan aturan pencarian di AGENTS.md, paksa agen prioritaskan pencarian qmd/mq daripada langsung read teks lengkap
4) Atur pembaruan indeks terjadwal
Efek tes: Setiap kali mencari materi dari 15000 tokens turun ke 1500 tokens, berkurang 90%.
Perbedaan dengan memorySearch: memorySearch mengatur "kenangan" (MEMORY.md), qmd mengatur "mencari materi" (basis pengetahuan kustom), tidak saling mempengaruhi.
七、Pilihan Memory Search
markdown
Kata Kunci: Bantu saya konfigurasi memorySearch OpenClaw.
Jika file memori saya tidak banyak (puluhan md),
rekomendasikan embedding lokal atau Voyage AI?
Jelaskan perbedaan biaya dan kualitas pencarian masing-masing.
Kesimpulan sederhana: File memori sedikit gunakan embedding lokal (nol biaya), kebutuhan multibahasa tinggi atau file banyak gunakan Voyage AI (gratis 200 juta token per akun).
八、Daftar Konfigurasi Ultimate
markdown
Kata Kunci:
Tolong bantu saya optimalkan konfigurasi OpenClaw sekali waktu untuk menghemat token semaksimal mungkin, jalankan sesuai daftar berikut:
Ubah model default ke Sonnet, hanya simpan tugas kreasi/analisis menggunakan Opus
Sederhanakan AGENTS.md / SOUL.md / MEMORY.md
Turunkan semua tugas cron ke Sonnet + gabungkan + turunkan frekuensi
Interval Heartbeat 45 menit + sunyi malam hari
Konfigurasi pencarian presisi qmd pengganti pembacaan teks lengkap
workspaceFiles hanya simpan file yang diperlukan
File memori disederhanakan secara berkala, MEMORY.md dikendalikan dalam 2000 tokens
Konfigurasi Sekali, Untung Jangka Panjang:
1. Stratifikasi Model — Sonnet sehari-hari, Opus kunci, hemat 60-80%
2. Perampingan Konteks — File ringkas + pencarian presisi qmd, hemat 30-90% input token
3. Kurangi Panggilan — Gabungkan cron, perpanjang heartbeat, aktifkan periode sunyi
Sonnet 4 sudah sangat kuat, untuk penggunaan sehari-hari tidak terasa bedanya. Saat benar-benar butuh Opus, tinggal beralih.
Berdasarkan pengalaman praktis sistem multi-agent, data merupakan nilai estimasi yang dianonimkan.






