Judul Asli: Bursa Kripto Terbesar AS Diam-diam Beralih ke Model AI China, Menghemat Separuh Biaya
Penulis Asli: Catatan Tangan AI
Data yang Membuat Silicon Valley Gelisah
Baru-baru ini, CEO Coinbase, bursa kripto terbesar di Amerika Serikat, Brian Armstrong, mengucapkan satu kalimat yang menggegerkan kalangan teknologi:
"Kami beralih ke model AI China yaitu GLM 5.2 dan Kimi 2.7, pengeluaran AI langsung dipotong setengah."
Dipangkas setengah? Apakah penggunaan juga menurun?
Sebaliknya. Penggunaan token Coinbase terus meningkat.
Menghemat uang sementara penggunaan lebih banyak, inilah yang benar-benar membuat OpenAI dan Anthropic tidak bisa duduk tenang.
Bagaimana Caranya? Tiga Strategi Penghematan Biaya
Coinbase tidak sekadar mengganti dengan model yang lebih murah. Mereka membangun sistem "penghematan biaya" yang lengkap:
Jurusan Pertama: Tidak Terikat Satu Model, Biarkan Sistem Memilih Sendiri
Coinbase membuat sistem perutean otomatis. Setiap kali permintaan masuk, sistem akan secara otomatis memilih model yang paling sesuai berdasarkan jenis tugas, harga, dan kondisi cache.
Tidak semua tugas membutuhkan model termahal. Terjemahan sederhana pakai yang murah, penalaran kompleks pakai yang bagus—seperti Anda tidak akan mengendarai mobil sport untuk belanja ke bawah rumah.
Jurusan Kedua: Meningkatkan Tingkat Cache Hit dari 5% ke 60%
Ini adalah jurusan yang paling keras. Dengan mengoptimalkan strategi caching, Coinbase meningkatkan tingkat cache hit dari 5% menjadi 60%.
Sederhananya, 60% permintaan dapat menggunakan kembali hasil perhitungan sebelumnya, yang secara signifikan mengurangi biaya aktual setiap panggilan. Hanya dengan optimalisasi ini saja, sudah menghemat biaya yang besar.
Jurusan Ketiga: Context Engineering (Rekayasa Konteks)
Coinbase mengharuskan pengembang untuk menyederhanakan konteks, memulai sesi baru untuk tugas baru, tidak menjejalkan terlalu banyak hal dalam satu percakapan.
Ini bukan malas, melainkan ilmu baru—di industri disebut Context Engineering. Anthropic dalam sebuah blog teknis dengan jelas menyatakan: Dalam mengelola agen AI, rekayasa konteks lebih efektif daripada rekayasa prompt (prompt engineering).
Singkatnya: Bukan membuat AI lebih pintar, tetapi memberi AI informasi yang lebih tepat.

▲ Semakin banyak perusahaan mulai berhemat dalam penggunaan model AI
Bukan Hanya Coinbase, Ini Adalah Tren
Coinbase bukan yang pertama mencobanya.
Lindy, sebuah perusahaan startup AI yang hanya beranggotakan 25 orang, CEO Flo Crivello langsung mengganti seluruh Claude dengan Deepseek. Ia memberi tahu CNBC: "Biaya AI telah melebihi biaya tenaga kerja, ini tidak berkelanjutan." Setelah berganti model, biaya "anjlok secara drastis", menghemat jutaan dolar.
Snowflake CEO Sridhar Ramaswamy melakukan uji perbandingan langsung: Dalam 103 tugas pengkodean, GLM-5.2 menyelesaikan 66%, Claude Opus 4.7 menyelesaikan 67%. Selisihnya? Hampir tidak ada.
Tetapi perbedaan harganya nyata:
Perbandingan Harga (per juta token)
- GLM-5.2: Input $1.40 / Output $4.40
- Claude Opus 4.7: Input $5 / Output $25
- GPT-5.5: Input $5 / Output $30
Harga output berbeda 5-7 kali lipat.
Barang Murah Tidak Berkualitas? Jangan Terburu-buru Menyimpulkan
Melihat di sini, Anda mungkin bertanya: Semurah ini, kualitasnya sama tidak?
Sejujurnya, tidak sepenuhnya sama, tetapi perbedaannya lebih kecil dari yang Anda kira.
Tes Snowflake menunjukkan bahwa GLM-5.2 memang kurang stabil dalam beberapa tugas—tingkat keberhasilan percobaan pertama 47.6%, lebih rendah dari Opus yang 53.7%. Dan GLM terkadang "memaksakan" arah yang salah: Dalam satu tugas, ia menghabiskan 24 menit dan memanggil alat sebanyak 411 kali, tapi tetap gagal. Opus dengan 49 panggilan, 9 menit sudah selesai.
Namun, dalam kebanyakan tugas, tingkat keberhasilan akhir keduanya hampir seimbang. Kuncinya adalah: Apakah Anda bersedia membayar 5 kali lipat lebih mahal untuk kestabilan beberapa persen itu?
Bagi banyak perusahaan, jawabannya semakin jelas: Tidak.

▲ Perbedaan harga model AI Timur-Barat sedang membentuk ulang lanskap industri
Apa Artinya Ini bagi Kita Orang Awam?
Anda mungkin berkata: Saya bukan Coinbase, apa hubungannya ini dengan saya?
Sebenarnya, tren ini memberi tiga implikasi langsung bagi cara Anda menggunakan AI:
1. Jangan Hanya Mengenal Satu Model
Banyak orang menggunakan AI hanya mengandalkan satu—entah ChatGPT atau Claude. Tapi pemain profesional sudah tidak melakukannya lagi. Menggunakan model yang berbeda untuk tugas yang berbeda adalah cara bermain dengan rasio biaya-manfaat tertinggi.
Pertanyaan sehari-hari pakai yang murah, menulis kode, analisis pakai yang bagus. Seperti makan, Anda tidak akan pergi ke restoran bintang Michelin setiap kali.
2. Caching dan Reuse Adalah Kunci Penghematan
Jika Anda sering menggunakan AI untuk hal serupa (misalnya menulis laporan mingguan setiap minggu, mengatur catatan setiap hari), belajar memanfaatkan cache dan template dapat secara signifikan mengurangi konsumsi.
3. Konteks yang Ringkas = Hasil yang Lebih Baik
Banyak orang berdialog dengan AI, ingin memasukkan semua latar belakang. Tapi faktanya membuktikan, memberi AI informasi yang lebih sedikit tapi lebih tepat, hasilnya justru lebih baik. Tugas baru, buka percakapan baru. Jangan biarkan AI mencari jawaban di tumpukan riwayat.
Perubahan yang Lebih Dalam: Model Penetapan Harga AI Sedang Dibentuk Ulang
Di balik gelombang "migrasi model" ini, adalah guncangan logika penetapan harga seluruh industri AI.
Valuasi tinggi OpenAI dan Anthropic dibangun berdasarkan asumsi "pendapatan terus tumbuh dengan kecepatan tinggi". Tetapi jika semakin banyak perusahaan seperti Coinbase, Lindy beralih ke alternatif yang lebih murah, asumsi ini tidak akan bertahan.
Dilaporkan, perang harga sudah mulai terjadi antara OpenAI dan Anthropic. Dalam seri GPT-5.6 yang baru dirilis OpenAI, model Terra lebih murah setengah dari GPT-5.5, Luna bahkan mengusung harga termurah.
Bagi pengguna, ini adalah hal yang baik. Semakin ketat persaingan, semakin rendah harganya, semakin banyak pilihan.
Ketika raksasa Amerika mulai menggunakan model China untuk berhemat, itu berarti persaingan AI bukan lagi lomba skor di laboratorium, melainkan pertarungan biaya sesungguhnya. Mampu melakukan hal yang sama dengan lebih sedikit uang, itulah kemampuan sesungguhnya.






