Panduan Utama Menghemat Token OpenClaw: Gunakan Model Terkuat, Habiskan Paling Sedikit Uang/Termasuk Kata Kunci

marsbitDipublikasikan tanggal 2026-02-11Terakhir diperbarui pada 2026-02-11

Abstrak

Panduan untuk menghemat token OpenClaw: Gunakan model terkuat dengan biaya minimal. Token tidak hanya digunakan untuk percakapan, tetapi juga untuk system prompt, injeksi file konteks, dan riwayat pesan. Untuk menghemat 60-85% biaya, gunakan model Claude Sonnet untuk tugas sehari-hari dan reservasikan Claude Opus hanya untuk analisis mendalam atau penulisan. Optimalkan dengan memangkas file konteks (AGENTS.md, SOUL.md, MEMORY.md), gabungkan dan kurangi frekuensi tugas cron, atur interval heartbeat menjadi 45-60 menit, dan gunakan qmd untuk pencarian semantik guna menghindari pembacaan file. Konfigurasi ini dapat mengurangi token input hingga 90% dan secara signifikan memotong biaya bulanan.

Penulis: xiyu

Ingin menggunakan Claude Opus 4.6 tapi tidak ingin tagihan meledak di akhir bulan? Artikel ini membantu memotong 60-85% biaya.

一、Token Terpakai untuk Apa?

Anda pikir token hanya "ucapan Anda + balasan AI"? Kenyataannya jauh lebih dari itu.

Biaya tersembunyi setiap percakapan:

  • System Prompt (~3000-5000 tokens): Instruksi inti OpenClaw, tidak bisa diubah

  • Inject file konteks (~3000-14000 tokens): AGENTS.md, SOUL.md, MEMORY.md, dll., dibawa setiap percakapan — ini adalah biaya tersembunyi terbesar

  • Riwayat pesan: Semakin lama semakin panjang

  • Input Anda + output AI: Inilah yang Anda kira "seluruhnya"

Sebuah "Bagaimana cuaca hari ini?" yang sederhana, sebenarnya menghabiskan 8000-15000 input tokens. Dihitung dengan Opus, hanya konteks saja sudah menghabiskan $0.12-0.22.

Cron lebih kejam: Setiap pemicu = percakapan baru = menyuntikkan ulang semua konteks. Sebuah cron yang berjalan setiap 15 menit, 96 kali sehari, di Opus menghabiskan $10-20 sehari.

Heartbeat sama: Intinya juga panggilan percakapan, semakin pendek intervalnya semakin boros uang.

二、Stratifikasi Model: Sonnet untuk Sehari-hari, Opus untuk Hal Penting

Cara hemat pertama, efeknya paling dahsyat. Harga Sonnet sekitar 1/5 Opus, 80% tugas sehari-hari sudah cukup.

markdown

Kata Kunci:

Tolong bantu saya ubah model default OpenClaw ke Claude Sonnet,

hanya gunakan Opus saat perlu analisis mendalam atau kreasi.

Kebutuhan spesifik:

1) Setel model default ke Sonnet

2) Tugas cron default gunakan Sonnet

3) Hanya tugas menulis, analisis mendalam yang ditentukan menggunakan Opus

Skenario Opus: Menulis artikel panjang, kode kompleks, penalaran multi-langkah, tugas kreatif

Skenario Sonnet: Obrolan santai sehari-hari, tanya jawab sederhana, pemeriksaan cron, heartbeat, operasi file, terjemahan

Hasil tes: Setelah beralih, biaya bulanan turun 65%, pengalaman hampir tidak berbeda.

三、Perampingan Konteks: Potong Konsumen Token Tersembunyi

"Noise dasar" setiap panggilan bisa 3000-14000 tokens. Merampingkan file injeksi adalah optimasi dengan nilai terbaik.

markdown

Kata Kunci:

Bantu saya merampingkan file konteks OpenClaw untuk menghemat token.

Termasuk: 1) Hapus bagian yang tidak perlu di AGENTS.md (aturan grup chat, TTS, fungsi tidak terpakai), kompres hingga 800 tokens

2) Sederhanakan SOUL.md menjadi poin-poin ringkas, 300-500 tokens

3) Bersihkan informasi kedaluwarsa di MEMORY.md, kendalikan dalam 2000 tokens

4) Periksa konfigurasi workspaceFiles, hapus file injeksi yang tidak perlu

Aturan praktis: Setiap pengurangan 1000 tokens injeksi, dengan asumsi 100 panggilan Opus per hari, hemat sekitar $45 per bulan.

四、Optimasi Cron: Pembunuh Biaya Tersembunyi

markdown

Kata Kunci: Bantu saya mengoptimalkan tugas cron OpenClaw untuk menghemat token.

Tolong:

1) Daftar semua tugas cron beserta frekuensi dan modelnya

2) Turunkan semua tugas non-kreasi ke Sonnet

3) Gabungkan tugas dalam periode waktu yang sama (misal beberapa pemeriksaan jadi satu)

4) Kurangi frekuensi tinggi yang tidak perlu (pemeriksaan sistem dari 10 menit jadi 30 menit, pemeriksaan versi dari 3 kali/hari jadi 1 kali/hari)

5) Konfigurasi delivery untuk pemberitahuan sesuai permintaan, tidak kirim pesan jika normal

Prinsip inti: Bukan semakin sering semakin baik, kebanyakan kebutuhan "real-time" adalah kebutuhan palsu. Menggabungkan 5 pemeriksaan independen menjadi 1 panggilan, hemat 75% biaya injeksi konteks.

五、Optimasi Heartbeat

markdown

Kata Kunci: Bantu saya optimalkan konfigurasi heartbeat OpenClaw:

1) Atur interval jam kerja menjadi 45-60 menit

2) Setel periode sunyi 23:00-08:00

3) Sederhanakan HEARTBEAT.md hingga jumlah baris minimal

4) Gabungkan tugas pemeriksaan yang tersebar ke heartbeat untuk dieksekusi secara batch

六、Pencarian Presisi: Gunakan qmd Hemat 90% Input Token

Saat agen mencari materi, defaultnya "baca teks lengkap" — sebuah file 500 baris 3000-5000 tokens, tetapi hanya butuh 10 baris di dalamnya. 90% input token terbuang.

qmd adalah alat pencarian semantik lokal, membangun indeks teks lengkap + vektor, memungkinkan agen menemukan paragraf secara tepat daripada membaca seluruh file. Semua perhitungan lokal, nol biaya API.

Digunakan dengan mq (Mini Query): Pratinjau struktur direktori, ekstraksi paragraf presisi, pencarian kata kunci — hanya membaca 10-30 baris yang dibutuhkan setiap kali.

markdown

Kata Kunci:

Bantu saya konfigurasi pencarian basis pengetahuan qmd untuk menghemat token.

Alamat Github: https://github.com/tobi/qmd

Perlu:

1) Instal qmd

2) Buat indeks untuk direktori kerja

3) Tambahkan aturan pencarian di AGENTS.md, paksa agen prioritaskan pencarian qmd/mq daripada langsung read teks lengkap

4) Atur pembaruan indeks terjadwal

Efek tes: Setiap kali mencari materi dari 15000 tokens turun ke 1500 tokens, berkurang 90%.

Perbedaan dengan memorySearch: memorySearch mengatur "kenangan" (MEMORY.md), qmd mengatur "mencari materi" (basis pengetahuan kustom), tidak saling mempengaruhi.

七、Pilihan Memory Search

markdown

Kata Kunci: Bantu saya konfigurasi memorySearch OpenClaw.

Jika file memori saya tidak banyak (puluhan md),

rekomendasikan embedding lokal atau Voyage AI?

Jelaskan perbedaan biaya dan kualitas pencarian masing-masing.

Kesimpulan sederhana: File memori sedikit gunakan embedding lokal (nol biaya), kebutuhan multibahasa tinggi atau file banyak gunakan Voyage AI (gratis 200 juta token per akun).

八、Daftar Konfigurasi Ultimate

markdown

Kata Kunci:

Tolong bantu saya optimalkan konfigurasi OpenClaw sekali waktu untuk menghemat token semaksimal mungkin, jalankan sesuai daftar berikut:

Ubah model default ke Sonnet, hanya simpan tugas kreasi/analisis menggunakan Opus

Sederhanakan AGENTS.md / SOUL.md / MEMORY.md

Turunkan semua tugas cron ke Sonnet + gabungkan + turunkan frekuensi

Interval Heartbeat 45 menit + sunyi malam hari

Konfigurasi pencarian presisi qmd pengganti pembacaan teks lengkap

workspaceFiles hanya simpan file yang diperlukan

File memori disederhanakan secara berkala, MEMORY.md dikendalikan dalam 2000 tokens

Konfigurasi Sekali, Untung Jangka Panjang:

1. Stratifikasi Model — Sonnet sehari-hari, Opus kunci, hemat 60-80%

2. Perampingan Konteks — File ringkas + pencarian presisi qmd, hemat 30-90% input token

3. Kurangi Panggilan — Gabungkan cron, perpanjang heartbeat, aktifkan periode sunyi

Sonnet 4 sudah sangat kuat, untuk penggunaan sehari-hari tidak terasa bedanya. Saat benar-benar butuh Opus, tinggal beralih.

Berdasarkan pengalaman praktis sistem multi-agent, data merupakan nilai estimasi yang dianonimkan.

Pertanyaan Terkait

QApa saja biaya tersembunyi dalam penggunaan token OpenClaw yang sering tidak disadari?

ABiaya tersembunyi meliputi System Prompt (3000-5000 token), injeksi file konteks seperti AGENTS.md dan SOUL.md (3000-14000 token), riwayat percakapan yang semakin panjang, serta input pengguna dan output AI. Bahkan pertanyaan sederhana seperti 'Bagaimana cuaca hari ini?' dapat menghabiskan 8000-15000 token input.

QBagaimana strategi penghematan token terbesar yang direkomendasikan dalam artikel ini?

AStrategi terbesar adalah model分层 (model layering): menggunakan Claude Sonnet untuk tugas sehari-hari (80% lebih murah daripada Opus) dan hanya beralih ke Claude Opus untuk analisis mendalam atau tugas kreatif. Ini dapat mengurangi biaya bulanan hingga 65% tanpa perbedaan pengalaman yang signifikan.

QApa itu qmd dan bagaimana cara kerjanya menghemat hingga 90% token input?

Aqmd adalah alat pencarian semantik lokal yang membuat indeks vektor dari file. Alat ini memungkinkan agen untuk secara tepat menemukan dan membaca hanya paragraf yang relevan (10-30 baris) alih-alih membaca seluruh file (yang bisa mencapai 3000-5000 token). Karena berjalan secara lokal, tidak ada biaya API tambahan.

QBagaimana cara mengoptimalkan tugas cron untuk menghemat token?

AOptimalkan cron dengan: 1) Menurunkan semua tugas non-kreatif ke model Sonnet, 2) Menggabungkan tugas yang berjalan dalam periode yang sama, 3) Mengurangi frekuensi yang tidak perlu (misalnya, dari pengecekan setiap 10 menit menjadi 30 menit), 4) Mengatur pengiriman notifikasi hanya saat diperlukan (delivery on-demand).

QApa perbedaan utama antara memorySearch lokal dan Voyage AI?

AMemorySearch lokal adalah pilihan tanpa biaya (zero cost) yang cocok jika file memori sedikit (beberapa puluh file .md). Voyage AI menawarkan kualitas retrieval yang lebih baik untuk kebutuhan multibahasa atau jika file sangat banyak, dengan kuota gratis 200 juta token per akun.

Bacaan Terkait

Ketika Penjual Sekop Juga Harus Pinjam Uang untuk Beli Sekop: Pasar Saham AI AS Kehilangan Triliunan dalam Seminggu, Pasar Mulai 'Membanderol' Tagihan AI

Minggu lalu, pasar saham AI AS mengalami penurunan drastis meskipun banyak perusahaan melaporkan rekor pendapatan. Saham seperti Broadcom dan Oracle anjlok setelah laporan kuartalan, meskipun angka penjualan dan pesanan mereka sangat kuat. Indeks Nasdaq juga jatuh 4% pada 5 Juni. Masalahnya bukan pada pendapatan, tetapi pada cara mencapainya. Pasar mulai mempertanyakan biaya besar yang diperlukan untuk infrastruktur AI. Oracle, misalnya, memiliki arus kas bebas negatif dan berencana mengumpulkan dana $40 miliar lagi, meskipun baru saja mengumpulkan hampir $500 miliar. Broadcom melihat margin menurun karena meningkatnya penjualan chip AI. Rantai pendanaan untuk balapan AI ini semakin tegang. Alphabet, yang memiliki cadangan tunai besar, masih melakukan pendanaan ekuitas $84,75 miliar. Perusahaan dari penyedia chip hingga lab AI seperti OpenAI dan Anthropic bergantung pada pembiayaan eksternal. Namun, banyak pesanan besar (seperti >50% pesanan Oracle) hanya berasal dari segelintir lab AI yang belum profitabel ini, menciptakan titik tekanan konsentrasi risiko. Intinya, pasar tidak lagi hanya menghargai pertumbuhan, tetapi mulai memeriksa siapa yang membayar tagihan AI yang sangat besar dan bagaimana caranya. IPO SpaceX yang akan datang menjadi uji tekanan berikutnya bagi rantai pendanaan ini.

marsbit19m yang lalu

Ketika Penjual Sekop Juga Harus Pinjam Uang untuk Beli Sekop: Pasar Saham AI AS Kehilangan Triliunan dalam Seminggu, Pasar Mulai 'Membanderol' Tagihan AI

marsbit19m yang lalu

Doubao Berbayar Lebih Mahal dari GPT, Sementara DeepSeek Justru Potong Harga Drastis, Siapa yang Akan Menang?

Penulis: Think AI, Aaron Industri AI menyaksikan perkembangan yang kontras. Doubao (ByteDance) mengonfirmasi akan mulai berbayar pada akhir Juni, dengan harga tinggi - versi Pro bahkan melebihi ChatGPT Plus. Sebaliknya, DeepSeek justru mengumumkan penurunan harga permanen pada akhir Mei, menurunkan harga API-nya menjadi seperempat harga asli, menciptakan rekor harga global baru. Reaksi pengguna pun bertolak belakang: Doubao mendapat banyak kritik, sementara DeepSeek dipuji. Kedua perusahaan ini mengambil strategi berbeda. Doubao, dengan basis pengguna C-nya yang besar (345 juta MAU), memulai langkah berbayar untuk menutupi biaya komputasi yang sangat besar dari 120+ triliun Token harian. Sementara DeepSeek (130 juta MAU) fokus pada pasar B dan menurunkan harga berkat inovasi arsitektur yang memangkas konsumsi daya komputasi, otonomi daya komputasi lokal, dan optimalisasi teknik, membangun parit pertahanan di pasar bisnis. Kedua perusahaan masih dalam fase kerugian. Dibandingkan dengan model berlangganan OpenAI, Anthropic menunjukkan jalur berbeda dengan meraih profitabilitas melalui pendapatan korporat (80%+). Kunci utamanya adalah AI harus tertanam dalam alur kerja nyata untuk menghemat biaya tenaga kerja, bukan sekadar obrolan. AI akan mencapai ROI nyata baik melalui ekosistem produktivitas C seperti Doubao, atau platform agen B seperti DeepSeek. DeepSeek baru saja mengumpulkan pendanaan $70 miliar, memperkuat posisinya. Pemenang akhirnya adalah pemain yang berhasil mengubah AI menjadi ROI yang nyata. Komersialisasi AI masih dalam tahap awal.

marsbit26m yang lalu

Doubao Berbayar Lebih Mahal dari GPT, Sementara DeepSeek Justru Potong Harga Drastis, Siapa yang Akan Menang?

marsbit26m yang lalu

Janji Tahun Besar IPO Kripto? Hanya Satu yang Tercatat dalam Setengah Tahun, dan Sudah Jatuh 70%

**Ringkasan:** Meski tahun 2026 dijuluki sebagai "tahun IPO crypto", kenyataannya sangat berbeda. Sementara SpaceX bersiap meluncurkan IPO terbesar dalam sejarah (valuasi $1.75 triliun), pipa IPO perusahaan crypto justru membeku. BitGo, satu-satunya perusahaan crypto yang berhasil IPO tahun ini, kinerjanya buruk. Sahamnya telah anjlok sekitar 70% dari harga penawaran awal. Hal ini menjadi peringatan bagi perusahaan lain yang mengantre. Kraken, yang sebelumnya menargetkan IPO kuartal pertama, telah membekukan rencananya. Valuasinya dilaporkan menyusut 33% dalam lima bulan. Consensys (induk MetaMask) menunda IPO setidaknya hingga musim gugur, sementara Bitpanda kemungkinan besar akan melewatkan tenggat waktu IPO semester pertamanya. Pasar crypto sendiri sedang lesu, dengan Bitcoin jatuh di bawah $60,000 untuk pertama kalinya tahun ini. Likuiditas tersedot oleh IPO raksasa seperti SpaceX dan sektor AI. Ada tenggat waktu politik yang mendesak: pemilihan pertengahan jabatan AS pada November dapat mengubah lanskap regulasi. Banyak perusahaan crypto awalnya menargetkan IPO sebelum pemilihan untuk memanfaatkan kepastian kebijakan saat ini. Dengan kondisi pasar yang lemah dan contoh kegagalan BitGo, perusahaan-perusahaan crypto kini lebih memilih menunggu daripada terburu-buru membuka buku keuangan mereka kepada publik. Jendela peluang IPO crypto tahun ini tampaknya akan menutup, kecuali jika ada perbaikan signifikan dalam likuiditas dan sentimen pasar setelah IPO SpaceX.

marsbit39m yang lalu

Janji Tahun Besar IPO Kripto? Hanya Satu yang Tercatat dalam Setengah Tahun, dan Sudah Jatuh 70%

marsbit39m yang lalu

Di Balik "Pabrik AI" Musk dan Huang, Perang "Perampasan Air Tawar" Tak Terlihat Telah Dimulai

Anda mungkin tidak menyadari bahwa setiap kali Anda meminta ChatGPT menulis laporan mingguan 100 kata atau Claude memperbaiki beberapa baris kode, sekitar 500 ml air tawar murni (setara dengan satu botol air mineral) akan menguap menjadi uap putih dari pipa pendingin di suatu tempat di Bumi. Laporan terbaru dari United Nations University (UNU) mengungkap biaya lingkungan global AI yang mengkhawatirkan: pada 2030, konsumsi air tahunan infrastruktur AI diperkirakan mencapai 9,3 triliun liter—cukup untuk memenuhi kebutuhan air dasar 1,3 miliar penduduk dunia selama setahun. Mengapa AI menjadi "raksasa peminum air"? Jawabannya terletak pada sistem pendingin pusat data. Lebih dari 70% pusat data global menggunakan sistem pendingin evaporatif, di mana sekitar 80% air yang digunakan untuk mendinginkan chip berdaya tinggi seperti GPU NVIDIA Blackwell menguap ke atmosfer dan tidak dapat didaur ulang secara lokal. Contoh nyata: Pelatihan GPT-4 sekali saja menghabiskan sekitar 600 juta liter air bersih. Konsumsi air Google telah melampaui 81 miliar galon per tahun, sementara Microsoft menghadapi protes warga Iowa karena pusat datanya bersaing merebut air tanah dengan lahan pertanian. Konflik memuncak di Memphis, Tennessee, pada 2026. Kluster superkomputer Colossus milik xAI (Elon Musk), yang dibangun dalam 122 hari, memompa 1 juta galon air minum warga per hari dari aquifer lokal. Tekanan publik memaksa xAI membangun pabrik daur ulang air senilai $80 juta untuk menggunakan air limbah sebagai pengganti. Menanggapi kritik, CEO Microsoft Satya Nadella mempromosikan sistem pendingin "loop tertutup tanpa air" yang diklaim hampir tidak mengonsumsi air. Namun, sistem ini meningkatkan konsumsi listrik 20-30%, mengalihkan jejak air secara tidak langsung ke pembangkit listrik. Bagi industri AI China, krisis air ini menjadi peringatan sekaligus peluang. Strategi "Perhitungan Timur-Datanya Barat" memanfaatkan geografi seperti Guizhou dan Mongolia Dalam untuk lokasi pusat data. Kunci utamanya adalah rekonstruksi komputasi hybrid: kecerdasan di tepi (edge AI) seperti pada perangkat rumah pintar dan robot embodied, yang dapat menangani 90% tugas secara lokal dengan chip hemat daya, mengurangi ketergantungan pada komputasi awan yang boros air dan energi. Perang memperebutkan air tawar ini memaksa AI global menghadapi batasan fisik Bumi. Masa depan AI akan ditentukan oleh kemampuannya beradaptasi dengan sumber daya yang terbatas, bukan hanya oleh peningkatan daya komputasi.

marsbit1j yang lalu

Di Balik "Pabrik AI" Musk dan Huang, Perang "Perampasan Air Tawar" Tak Terlihat Telah Dimulai

marsbit1j yang lalu

Trading

Spot
Futures

Artikel Populer

Cara Membeli T

Selamat datang di HTX.com! Kami telah membuat pembelian Threshold Network Token (T) menjadi mudah dan nyaman. Ikuti panduan langkah demi langkah kami untuk memulai perjalanan kripto Anda.Langkah 1: Buat Akun HTX AndaGunakan alamat email atau nomor ponsel Anda untuk mendaftar akun gratis di HTX. Rasakan perjalanan pendaftaran yang mudah dan buka semua fitur.Dapatkan Akun SayaLangkah 2: Buka Beli Kripto, lalu Pilih Metode Pembayaran AndaKartu Kredit/Debit: Gunakan Visa atau Mastercard Anda untuk membeli Threshold Network Token (T) secara instan.Saldo: Gunakan dana dari saldo akun HTX Anda untuk melakukan trading dengan lancar.Pihak Ketiga: Kami telah menambahkan metode pembayaran populer seperti Google Pay dan Apple Pay untuk meningkatkan kenyamanan.P2P: Lakukan trading langsung dengan pengguna lain di HTX.Over-the-Counter (OTC): Kami menawarkan layanan yang dibuat khusus dan kurs yang kompetitif bagi para trader.Langkah 3: Simpan Threshold Network Token (T) AndaSetelah melakukan pembelian, simpan Threshold Network Token (T) di akun HTX Anda. Selain itu, Anda dapat mengirimkannya ke tempat lain melalui transfer blockchain atau menggunakannya untuk memperdagangkan mata uang kripto lainnya.Langkah 4: Lakukan trading Threshold Network Token (T)Lakukan trading Threshold Network Token (T) dengan mudah di pasar spot HTX. Cukup akses akun Anda, pilih pasangan perdagangan, jalankan trading, lalu pantau secara real-time. Kami menawarkan pengalaman yang ramah pengguna baik untuk pemula maupun trader berpengalaman.

885 Total TayanganDipublikasikan pada 2024.12.10Diperbarui pada 2026.06.02

Cara Membeli T

Diskusi

Selamat datang di Komunitas HTX. Di sini, Anda bisa terus mendapatkan informasi terbaru tentang perkembangan platform terkini dan mendapatkan akses ke wawasan pasar profesional. Pendapat pengguna mengenai harga T (T) disajikan di bawah ini.

活动图片