Panduan Utama Menghemat Token OpenClaw: Gunakan Model Terkuat, Habiskan Paling Sedikit Uang/Termasuk Kata Kunci

marsbitDipublikasikan tanggal 2026-02-11Terakhir diperbarui pada 2026-02-11

Abstrak

Panduan untuk menghemat token OpenClaw: Gunakan model terkuat dengan biaya minimal. Token tidak hanya digunakan untuk percakapan, tetapi juga untuk system prompt, injeksi file konteks, dan riwayat pesan. Untuk menghemat 60-85% biaya, gunakan model Claude Sonnet untuk tugas sehari-hari dan reservasikan Claude Opus hanya untuk analisis mendalam atau penulisan. Optimalkan dengan memangkas file konteks (AGENTS.md, SOUL.md, MEMORY.md), gabungkan dan kurangi frekuensi tugas cron, atur interval heartbeat menjadi 45-60 menit, dan gunakan qmd untuk pencarian semantik guna menghindari pembacaan file. Konfigurasi ini dapat mengurangi token input hingga 90% dan secara signifikan memotong biaya bulanan.

Penulis: xiyu

Ingin menggunakan Claude Opus 4.6 tapi tidak ingin tagihan meledak di akhir bulan? Artikel ini membantu memotong 60-85% biaya.

一、Token Terpakai untuk Apa?

Anda pikir token hanya "ucapan Anda + balasan AI"? Kenyataannya jauh lebih dari itu.

Biaya tersembunyi setiap percakapan:

  • System Prompt (~3000-5000 tokens): Instruksi inti OpenClaw, tidak bisa diubah

  • Inject file konteks (~3000-14000 tokens): AGENTS.md, SOUL.md, MEMORY.md, dll., dibawa setiap percakapan — ini adalah biaya tersembunyi terbesar

  • Riwayat pesan: Semakin lama semakin panjang

  • Input Anda + output AI: Inilah yang Anda kira "seluruhnya"

Sebuah "Bagaimana cuaca hari ini?" yang sederhana, sebenarnya menghabiskan 8000-15000 input tokens. Dihitung dengan Opus, hanya konteks saja sudah menghabiskan $0.12-0.22.

Cron lebih kejam: Setiap pemicu = percakapan baru = menyuntikkan ulang semua konteks. Sebuah cron yang berjalan setiap 15 menit, 96 kali sehari, di Opus menghabiskan $10-20 sehari.

Heartbeat sama: Intinya juga panggilan percakapan, semakin pendek intervalnya semakin boros uang.

二、Stratifikasi Model: Sonnet untuk Sehari-hari, Opus untuk Hal Penting

Cara hemat pertama, efeknya paling dahsyat. Harga Sonnet sekitar 1/5 Opus, 80% tugas sehari-hari sudah cukup.

markdown

Kata Kunci:

Tolong bantu saya ubah model default OpenClaw ke Claude Sonnet,

hanya gunakan Opus saat perlu analisis mendalam atau kreasi.

Kebutuhan spesifik:

1) Setel model default ke Sonnet

2) Tugas cron default gunakan Sonnet

3) Hanya tugas menulis, analisis mendalam yang ditentukan menggunakan Opus

Skenario Opus: Menulis artikel panjang, kode kompleks, penalaran multi-langkah, tugas kreatif

Skenario Sonnet: Obrolan santai sehari-hari, tanya jawab sederhana, pemeriksaan cron, heartbeat, operasi file, terjemahan

Hasil tes: Setelah beralih, biaya bulanan turun 65%, pengalaman hampir tidak berbeda.

三、Perampingan Konteks: Potong Konsumen Token Tersembunyi

"Noise dasar" setiap panggilan bisa 3000-14000 tokens. Merampingkan file injeksi adalah optimasi dengan nilai terbaik.

markdown

Kata Kunci:

Bantu saya merampingkan file konteks OpenClaw untuk menghemat token.

Termasuk: 1) Hapus bagian yang tidak perlu di AGENTS.md (aturan grup chat, TTS, fungsi tidak terpakai), kompres hingga 800 tokens

2) Sederhanakan SOUL.md menjadi poin-poin ringkas, 300-500 tokens

3) Bersihkan informasi kedaluwarsa di MEMORY.md, kendalikan dalam 2000 tokens

4) Periksa konfigurasi workspaceFiles, hapus file injeksi yang tidak perlu

Aturan praktis: Setiap pengurangan 1000 tokens injeksi, dengan asumsi 100 panggilan Opus per hari, hemat sekitar $45 per bulan.

四、Optimasi Cron: Pembunuh Biaya Tersembunyi

markdown

Kata Kunci: Bantu saya mengoptimalkan tugas cron OpenClaw untuk menghemat token.

Tolong:

1) Daftar semua tugas cron beserta frekuensi dan modelnya

2) Turunkan semua tugas non-kreasi ke Sonnet

3) Gabungkan tugas dalam periode waktu yang sama (misal beberapa pemeriksaan jadi satu)

4) Kurangi frekuensi tinggi yang tidak perlu (pemeriksaan sistem dari 10 menit jadi 30 menit, pemeriksaan versi dari 3 kali/hari jadi 1 kali/hari)

5) Konfigurasi delivery untuk pemberitahuan sesuai permintaan, tidak kirim pesan jika normal

Prinsip inti: Bukan semakin sering semakin baik, kebanyakan kebutuhan "real-time" adalah kebutuhan palsu. Menggabungkan 5 pemeriksaan independen menjadi 1 panggilan, hemat 75% biaya injeksi konteks.

五、Optimasi Heartbeat

markdown

Kata Kunci: Bantu saya optimalkan konfigurasi heartbeat OpenClaw:

1) Atur interval jam kerja menjadi 45-60 menit

2) Setel periode sunyi 23:00-08:00

3) Sederhanakan HEARTBEAT.md hingga jumlah baris minimal

4) Gabungkan tugas pemeriksaan yang tersebar ke heartbeat untuk dieksekusi secara batch

六、Pencarian Presisi: Gunakan qmd Hemat 90% Input Token

Saat agen mencari materi, defaultnya "baca teks lengkap" — sebuah file 500 baris 3000-5000 tokens, tetapi hanya butuh 10 baris di dalamnya. 90% input token terbuang.

qmd adalah alat pencarian semantik lokal, membangun indeks teks lengkap + vektor, memungkinkan agen menemukan paragraf secara tepat daripada membaca seluruh file. Semua perhitungan lokal, nol biaya API.

Digunakan dengan mq (Mini Query): Pratinjau struktur direktori, ekstraksi paragraf presisi, pencarian kata kunci — hanya membaca 10-30 baris yang dibutuhkan setiap kali.

markdown

Kata Kunci:

Bantu saya konfigurasi pencarian basis pengetahuan qmd untuk menghemat token.

Alamat Github: https://github.com/tobi/qmd

Perlu:

1) Instal qmd

2) Buat indeks untuk direktori kerja

3) Tambahkan aturan pencarian di AGENTS.md, paksa agen prioritaskan pencarian qmd/mq daripada langsung read teks lengkap

4) Atur pembaruan indeks terjadwal

Efek tes: Setiap kali mencari materi dari 15000 tokens turun ke 1500 tokens, berkurang 90%.

Perbedaan dengan memorySearch: memorySearch mengatur "kenangan" (MEMORY.md), qmd mengatur "mencari materi" (basis pengetahuan kustom), tidak saling mempengaruhi.

七、Pilihan Memory Search

markdown

Kata Kunci: Bantu saya konfigurasi memorySearch OpenClaw.

Jika file memori saya tidak banyak (puluhan md),

rekomendasikan embedding lokal atau Voyage AI?

Jelaskan perbedaan biaya dan kualitas pencarian masing-masing.

Kesimpulan sederhana: File memori sedikit gunakan embedding lokal (nol biaya), kebutuhan multibahasa tinggi atau file banyak gunakan Voyage AI (gratis 200 juta token per akun).

八、Daftar Konfigurasi Ultimate

markdown

Kata Kunci:

Tolong bantu saya optimalkan konfigurasi OpenClaw sekali waktu untuk menghemat token semaksimal mungkin, jalankan sesuai daftar berikut:

Ubah model default ke Sonnet, hanya simpan tugas kreasi/analisis menggunakan Opus

Sederhanakan AGENTS.md / SOUL.md / MEMORY.md

Turunkan semua tugas cron ke Sonnet + gabungkan + turunkan frekuensi

Interval Heartbeat 45 menit + sunyi malam hari

Konfigurasi pencarian presisi qmd pengganti pembacaan teks lengkap

workspaceFiles hanya simpan file yang diperlukan

File memori disederhanakan secara berkala, MEMORY.md dikendalikan dalam 2000 tokens

Konfigurasi Sekali, Untung Jangka Panjang:

1. Stratifikasi Model — Sonnet sehari-hari, Opus kunci, hemat 60-80%

2. Perampingan Konteks — File ringkas + pencarian presisi qmd, hemat 30-90% input token

3. Kurangi Panggilan — Gabungkan cron, perpanjang heartbeat, aktifkan periode sunyi

Sonnet 4 sudah sangat kuat, untuk penggunaan sehari-hari tidak terasa bedanya. Saat benar-benar butuh Opus, tinggal beralih.

Berdasarkan pengalaman praktis sistem multi-agent, data merupakan nilai estimasi yang dianonimkan.

Kripto yang Sedang Tren

Pertanyaan Terkait

QApa saja biaya tersembunyi dalam penggunaan token OpenClaw yang sering tidak disadari?

ABiaya tersembunyi meliputi System Prompt (3000-5000 token), injeksi file konteks seperti AGENTS.md dan SOUL.md (3000-14000 token), riwayat percakapan yang semakin panjang, serta input pengguna dan output AI. Bahkan pertanyaan sederhana seperti 'Bagaimana cuaca hari ini?' dapat menghabiskan 8000-15000 token input.

QBagaimana strategi penghematan token terbesar yang direkomendasikan dalam artikel ini?

AStrategi terbesar adalah model分层 (model layering): menggunakan Claude Sonnet untuk tugas sehari-hari (80% lebih murah daripada Opus) dan hanya beralih ke Claude Opus untuk analisis mendalam atau tugas kreatif. Ini dapat mengurangi biaya bulanan hingga 65% tanpa perbedaan pengalaman yang signifikan.

QApa itu qmd dan bagaimana cara kerjanya menghemat hingga 90% token input?

Aqmd adalah alat pencarian semantik lokal yang membuat indeks vektor dari file. Alat ini memungkinkan agen untuk secara tepat menemukan dan membaca hanya paragraf yang relevan (10-30 baris) alih-alih membaca seluruh file (yang bisa mencapai 3000-5000 token). Karena berjalan secara lokal, tidak ada biaya API tambahan.

QBagaimana cara mengoptimalkan tugas cron untuk menghemat token?

AOptimalkan cron dengan: 1) Menurunkan semua tugas non-kreatif ke model Sonnet, 2) Menggabungkan tugas yang berjalan dalam periode yang sama, 3) Mengurangi frekuensi yang tidak perlu (misalnya, dari pengecekan setiap 10 menit menjadi 30 menit), 4) Mengatur pengiriman notifikasi hanya saat diperlukan (delivery on-demand).

QApa perbedaan utama antara memorySearch lokal dan Voyage AI?

AMemorySearch lokal adalah pilihan tanpa biaya (zero cost) yang cocok jika file memori sedikit (beberapa puluh file .md). Voyage AI menawarkan kualitas retrieval yang lebih baik untuk kebutuhan multibahasa atau jika file sangat banyak, dengan kuota gratis 200 juta token per akun.

Bacaan Terkait

Ethereum Turun 45% Sejak Awal Tahun – Lalu Mengapa SharpLink dan Paus Masih Membeli?

Meskipun harga Ethereum (ETH) turun 20-45% sejak awal tahun, minat institusional terhadap aset kriptu terkemuka ini tetap kuat. SharpLink, setelah jeda delapan bulan, kembali membeli 5.000 ETH senilai sekitar $7,88 juta, diikuti penambahan 26.324 LSETH senilai $45,54 juta. Total kepemilikannya kini mencapai 876.285 ETH, menunjukkan keyakinan pada utilitas jangka panjang dan pendapatan staking Ethereum, meski menghadapi kerugian belum terealisasi hampir $1,71 miliar. Tren akumulasi ini juga tercermin pada aktivitas "paus" (whale), dengan satu dompet baru mengakumulasi 18.361 ETH senilai $28,9 juta dalam sembilan hari terakhir, menandakan persiapan untuk pergerakan harga di masa depan. Namun, kepercayaan yang kembali bangun ini belum sepenuhnya tercermin dalam permintaan institusional yang lebih luas. ETF Spot Ethereum justru mencatat arus keluar bersih, dengan penarikan $12,85 juta pada 26 Juni. Meski demikian, total aset yang dipegang penerbit ETF masih signifikan, senilai lebih dari $8,38 miliar, yang mengindikasikan penyesuaian posisi berkelanjutan daripada pelepasan total. Pada intinya, akumulasi oleh treasury perusahaan dan paus mendukung prospek jangka panjang Ethereum, tetapi pemulihan berkelanjutan masih bergantung pada membaiknya sentimen pasar dan arus masuk ETF yang lebih kuat untuk mengimbangi tekanan penjualan institusional yang masih ada.

ambcrypto3j yang lalu

Ethereum Turun 45% Sejak Awal Tahun – Lalu Mengapa SharpLink dan Paus Masih Membeli?

ambcrypto3j yang lalu

Baru Saja, DeepSeek V4 Perbarui DSpark, Kecepatan Inference Meningkat 80%

Baru-baru ini, DeepSeek V4 diperbarui dengan framework *Speculative Decoding* baru bernama **DSpark**, yang diklaim meningkatkan kecepatan inferensi hingga 80%. Pembaruan ini, yang juga disertai open-sourcing framework **DeepSpec**, berfokus pada optimasi teknikal dan peningkatan performa, bukan perubahan arsitektur model inti. DSpark mengimplementasikan **Semi-Autoregressive Generation** untuk menjaga throughput tinggi dan meningkatkan akurasi token yang dihasilkan oleh model draf (*draft model*). Inovasi utamanya adalah **Confidence-Scheduled Verification**, yaitu sistem penjadwalan yang cerdas dan adaptif. Sistem ini menggunakan *Confidence Head* untuk memperkirakan probabilitas penerimaan setiap token kandidat dan secara dinamis menyesuaikan panjang verifikasi berdasarkan beban kerja sistem (*hardware-aware*), sehingga mengalokasikan daya komputasi hanya ke token yang paling potensial. Dalam pengujian di berbagai domain (penalaran matematika, generasi kode, percakapan), DSpark menunjukkan peningkatan signifikan dibandingkan model *state-of-the-art* seperti Eagle3 dan DFlash. Pada kondisi *throughput* yang setara, DSpark meningkatkan kecepatan respons pengguna sebesar 57%-85% untuk model DeepSeek-V4 Flash dan Pro. DeepSpec, yang dirilis bersamaan, adalah *codebase* lengkap untuk melatih dan mengevaluasi model draf *speculative decoding*. Framework ini menyediakan pipeline standar (persiapan data, pelatihan, evaluasi) dan mendukung beberapa algoritma (DSpark, DFlash, Eagle3) serta model target (Qwen3, Gemma), memudahkan peneliti dan insinyur untuk mengembangkan dan menerapkan teknik percepatan inferensi pada model bahasa besar mereka sendiri.

marsbit5j yang lalu

Baru Saja, DeepSeek V4 Perbarui DSpark, Kecepatan Inference Meningkat 80%

marsbit5j yang lalu

Ternyata Beginilah Cara Karpathy Menggunakan Claude?

Sejak bergabung dengan Anthropic, aktivitas Andrej Karpathy di komunitas terbuka berkurang drastis. Baru-baru ini, sebuah dokumen bernama CLAUDE.md yang diklaim sebagai panduan penggunaan Claude milik Karpathy beredar di komunitas. Isinya berisi sejumlah prinsip ketat untuk memandu AI dalam menulis kode, yang bertujuan mengurangi kesalahan umum model bahasa besar (LLM). Prinsip-prinsip utama mencakup: 1) **Baca dahulu sebelum menulis** – pahami struktur dan gaya kode proyek yang ada. 2) **Berpikir sebelum menulis kode** – klarifikasi asumsi, pertimbangkan trade-off, dan uraikan rencana. 3) **Tetap sederhana** – hindari desain berlebihan, abstraksi prematur, dan fleksibilitas yang tidak diperlukan. 4) **Modifikasi terarah** – lakukan perubahan minimal yang sesuai dengan gaya kode asli, jangan melakukan reformatting atau pembersihan yang tidak relevan. 5) **Verifikasi dan uji** – pastikan kode berfungsi seperti yang diharapkan dengan pengujian yang tepat. 6) **Debug secara sistematis** – jangan menebak, selidiki akar masalahnya. 7) **Hati-hati dengan dependensi** – hindari menambah dependensi yang tidak perlu. 8) **Komunikasi yang jelas** – jelaskan apa yang dilakukan dan alasannya. Dokumen ini juga menyoroti pola kegagalan umum seperti abstraksi yang salah, "optimistic path", dan "halusinasi pengetahuan". Meskipun keaslian dokumen ini diragukan, isinya sangat selaras dengan pemikiran Karpathy yang telah banyak mengkritik kelemahan LLM dalam pemrograman. Prinsip-prinsip ini, yang juga telah dijadikan template populer di GitHub, dianggap dapat meningkatkan efektivitas dan mengurangi kesalahan saat menggunakan asisten AI seperti Claude untuk pengembangan perangkat lunak.

marsbit6j yang lalu

Ternyata Beginilah Cara Karpathy Menggunakan Claude?

marsbit6j yang lalu

Riset BIT: Halving 2028 Bukanlah Akhir, Perombakan Sejati Industri Pertambangan Bitcoin Baru Dimulai

Industri penambangan Bitcoin sedang mengalami penyesuaian struktural paling kompleks sejak kelahiran protokolnya. Meski harga Bitcoin bertahan di sekitar $61.000 dan hash rate global mendekati 1 ZH/s (hampir rekor tertinggi), profitabilitas penambang terus memburuk. Beberapa indikator—seperti biaya produksi, pendapatan dari biaya transaksi, ekspansi hash rate, dan anggaran keamanan industri—menunjukkan bahwa sektor ini beroperasi di ambang titik impas. Pengurangan hadiah blok (halving) 2028 diprediksi akan mempercepat proses konsolidasi ini. Masalah utamanya bukan hanya berasal dari penurunan subsidi blok pasca-halving, tetapi juga transisi yang belum tuntas ke model pendapatan berbasis biaya transaksi. Banyak perusahaan penambangan kini beralih dari sekadar memproduksi Bitcoin menjadi operator infrastruktur, operator energi, dan penyedia infrastruktur komputasi untuk AI/HPC. Dengan demikian, fokus kompetisi bergeser dari ekspansi hash rate menuju peningkatan model bisnis. Data menunjukkan bahwa dengan harga Bitcoin sekitar $61.000, pendapatan teoritis harian penambang seharusnya sekitar $78 juta, namun kenyataannya hanya sekitar $33 juta—terjadi selisih sekitar 136%. Pendapatan dari biaya transaksi juga rendah, hanya sekitar $220.000 per hari, jauh di bawah perkiraan historis sebesar $9,7 juta. Biaya listrik sendiri menyerap 71,5% dari total pendapatan industri pada tahun 2025. Setelah halving 2028, biaya produksi dasar Bitcoin diproyeksikan naik menjadi sekitar $93.289, yang akan mendorong konsolidasi industri ke perusahaan-perusahaan besar dengan modal kuat dan pendapatan yang terdiversifikasi. Masa depan industri ini terletak pada transformasi dari bisnis "penambangan" murni menjadi bisnis "infrastruktur", yang mengandalkan sumber pendapatan lain seperti manajemen energi dan layanan hosting komputasi AI/HPC. Bagi investor, pertanyaan kuncinya adalah perusahaan mana yang dapat berhasil bertransformasi dan membangun keunggulan kompetitif yang lebih tangguh dalam lanskap baru ini.

marsbit6j yang lalu

Riset BIT: Halving 2028 Bukanlah Akhir, Perombakan Sejati Industri Pertambangan Bitcoin Baru Dimulai

marsbit6j yang lalu

Trading

Spot

Artikel Populer

Cara Membeli T

Selamat datang di HTX.com! Kami telah membuat pembelian Threshold Network Token (T) menjadi mudah dan nyaman. Ikuti panduan langkah demi langkah kami untuk memulai perjalanan kripto Anda.Langkah 1: Buat Akun HTX AndaGunakan alamat email atau nomor ponsel Anda untuk mendaftar akun gratis di HTX. Rasakan perjalanan pendaftaran yang mudah dan buka semua fitur.Dapatkan Akun SayaLangkah 2: Buka Beli Kripto, lalu Pilih Metode Pembayaran AndaKartu Kredit/Debit: Gunakan Visa atau Mastercard Anda untuk membeli Threshold Network Token (T) secara instan.Saldo: Gunakan dana dari saldo akun HTX Anda untuk melakukan trading dengan lancar.Pihak Ketiga: Kami telah menambahkan metode pembayaran populer seperti Google Pay dan Apple Pay untuk meningkatkan kenyamanan.P2P: Lakukan trading langsung dengan pengguna lain di HTX.Over-the-Counter (OTC): Kami menawarkan layanan yang dibuat khusus dan kurs yang kompetitif bagi para trader.Langkah 3: Simpan Threshold Network Token (T) AndaSetelah melakukan pembelian, simpan Threshold Network Token (T) di akun HTX Anda. Selain itu, Anda dapat mengirimkannya ke tempat lain melalui transfer blockchain atau menggunakannya untuk memperdagangkan mata uang kripto lainnya.Langkah 4: Lakukan trading Threshold Network Token (T)Lakukan trading Threshold Network Token (T) dengan mudah di pasar spot HTX. Cukup akses akun Anda, pilih pasangan perdagangan, jalankan trading, lalu pantau secara real-time. Kami menawarkan pengalaman yang ramah pengguna baik untuk pemula maupun trader berpengalaman.

906 Total TayanganDipublikasikan pada 2024.12.10Diperbarui pada 2026.06.02

Cara Membeli T

Diskusi

Selamat datang di Komunitas HTX. Di sini, Anda bisa terus mendapatkan informasi terbaru tentang perkembangan platform terkini dan mendapatkan akses ke wawasan pasar profesional. Pendapat pengguna mengenai harga T (T) disajikan di bawah ini.

活动图片