Perang Anggaran Token: AI Perusahaan Masuk ke 'Era Perhitungan'

marsbitDipublikasikan tanggal 2026-05-28Terakhir diperbarui pada 2026-05-28

Abstrak

Perang Anggaran Token: AI Perusahaan Masuki 'Era Pertanggungjawaban Biaya' Dua tahun terakhir, banyak perusahaan mendorong penggunaan AI untuk mengikuti tren. Namun, kini CEO dan CFO mulai mempertanyakan nilai riil dari setiap dolar yang dihabiskan untuk token AI. Perdebatan tentang anggaran token intinya bukan sekadar memotong tagihan, tetapi menilai ulang alokasi sumber daya kecerdasan. Fase pertama AI perusahaan membuktikan bahwa model dapat menyelesaikan pekerjaan. Fase berikutnya akan menentukan: pekerjaan mana yang benar-benar layak dibayar? Biaya inferensi AI kini menjadi biaya operasional berkelanjutan, bukan lagi anggaran eksperimen. Tagihan token yang tinggi bisa mencerminkan pekerjaan nyata, tetapi juga bisa berarti pemborosan karena prompt yang buruk, konteks yang tidak relevan, atau pemilihan model yang berlebihan. Utilitas token marjinal—nilai bisnis yang diciptakan per dolar tambahan biaya inferensi—menjadi angka kunci namun sulit dilihat. Penyebabnya antara lain ekor panjang percobaan ulang (retry), inflasi konteks yang meningkatkan biaya secara kuadratik, dan perutean yang tidak efisien ke model termahal. AI mengubah logika SaaS. Penggunaan SaaS mengindikasikan adopsi perangkat lunak, sementara penggunaan AI hanya menunjukkan "meteran berjalan", tanpa jaminan nilai. Perusahaan membutuhkan lapisan atribusi yang menghubungkan biaya token dengan hasil bisnis, seperti biaya per tiket layanan yang diselesaikan atau per klaim yang diproses. Mereka yang menguas...

Judul Asli:Token Budget Wars

Penulis Asli:Jaya Gupta

Kompilasi Asli:Peggy

Catatan Editor: AI perusahaan sedang bergeser dari 'apakah akan mengadopsi', menuju 'bagaimana menghitung biaya' .

Dua tahun terakhir, dorongan banyak perusahaan agar karyawan menggunakan AI, lebih banyak untuk mengikuti tren teknologi dan tekanan kompetitif. Namun ketika biaya inferensi AI berubah dari anggaran eksperimen menjadi pengeluaran operasional yang berkelanjutan, CEO dan CFO mulai menanyakan pertanyaan yang lebih realistis: Sebenarnya nilai apa yang diciptakan AI? Untuk setiap dolar biaya token, apa hasil nyata yang didapat?

Inilah inti dari "Token Budget Wars". Perang anggaran token ini bukan sekadar perusahaan ingin menekan tagihan AI, tetapi untuk menilai kembali bagian bisnis mana yang layak mendapat lebih banyak daya komputasi, tugas mana yang harus dialihkan ke model yang lebih murah, proses mana yang bisa diganti dengan outsourcing atau tenaga manusia, dan mana yang hanya konsumsi tidak efektif.

Hal paling patut diperhatikan dalam artikel ini adalah, volume penggunaan AI tidak sama dengan nilainya. Di era SaaS, volume penggunaan biasanya berarti perangkat lunak telah diadopsi; tetapi di era AI, konsumsi token hanya menunjukkan "meteran sedang berjalan". Alur kerja yang sama, karena perbedaan prompt, konteks, pilihan model, dan jumlah percobaan ulang, dapat menghasilkan perbedaan biaya hingga beberapa kali lipat. Tagihan yang membengkak bisa berarti AI benar-benar sedang bekerja, atau juga bisa berarti sistem sedang berjalan sia-sia.

Oleh karena itu, tahap berikutnya dari AI perusahaan, kuncinya bukan hanya kemampuan model, tetapi apakah biaya token dapat dikaitkan dengan hasil bisnis. Tahap pertama membuktikan AI dapat menyelesaikan pekerjaan; tahap kedua harus menjawab: apakah pekerjaan-pekerjaan ini benar-benar layak dibayar?

Berikut adalah teks asli:

AI Perusahaan Telah Bergerak dari "Apakah Akan Mengadopsi" ke "Bagaimana Mendistribusikan".

Di tingkat eksekutif perusahaan, "mata uang" baru adalah kemampuan Anda mengkuantifikasi ROI investasi AI. Setiap fungsi departemen ditanyai pertanyaan yang sama: Apa output Anda? Berapa biayanya? Dua tahun terakhir, para CEO sambil bangun pagi menonton Jim Cramer di CNBC (#bearish), sambil melihat pesaing mengumumkan peningkatan produktivitas, lalu meminta seluruh perusahaan untuk menggunakan AI. Yang sekarang benar-benar menciptakan tekanan adalah pertanyaan lanjutan itu: Tunjukkan bukti nilainya.

Claude dirilis pada November 2025, sementara saat itu anggaran tahunan 2026 sebagian besar perusahaan sudah ditetapkan. Pada kuartal pertama, volume penggunaan aktual perusahaan sudah jauh melampaui rencana semula. Biaya inferensi tidak lagi hanya sebuah pos anggaran untuk percobaan, tetapi berubah menjadi biaya operasional yang terjadi terus-menerus. Diikuti dengan itu, muncul pertanyaan baru: Di mana sebenarnya AI menciptakan nilai?

Pertanyaan ini sulit dijawab karena utilitas token tidak terkuantifikasi. Tagihan tidak dapat memberi tahu Anda, apakah pengeluaran ini menggantikan tenaga manusia, menciptakan pendapatan, mengurangi risiko, mempercepat proses, atau sekadar sekelompok insinyur yang gila menguras token demi peringkat (#metamates). Ketika pengeluarannya hanya ratusan ribu dolar, itu masih terlihat seperti sebuah eksperimen. Tetapi setelah melewati titik kritis tertentu, misalnya mencapai tujuh digit, itu berubah menjadi infrastruktur. Perbedaan teknis mulai berdampak nyata pada laporan laba rugi: alur kerja yang sama, input yang sama, biaya token untuk dua kali eksekusi bisa berbeda 5 sampai 10 kali lipat, sementara secara permukaan tidak tampak masalah apa pun. Dalam skala eksperimen, fluktuasi seperti ini sudah cukup mahal; tetapi begitu masuk ke skala infrastruktur, itu menjadi angka yang harus dijelaskan CFO kepada CEO.

Bisa disebut sebagai "utilitas marginal token": nilai bisnis yang diciptakan untuk setiap dolar tambahan biaya inferensi. Ini adalah angka yang benar-benar penting pada tahap penskalaan, dan juga angka yang saat ini tidak terlihat oleh kebanyakan perusahaan.

Pertanyaan di dewan direksi sedang bergeser dari "apakah AI berguna", menjadi "di mana sebenarnya AI memberikan leverage". Karena itulah, yang disebut perang anggaran token, pada dasarnya adalah perebutan hak alokasi token.

Dan perebutan kepemilikan token ini cepat memanas karena bertabrakan dengan naluri eksekutif yang telah berlangsung tiga puluh tahun: tim besar berarti posisi besar, ruang lingkup tanggung jawab besar, dan kekuasaan yang lebih besar. Dulu, tanda keberhasilan manajer senior yang terlihat adalah ukuran tim yang mereka kelola — bawahan langsung, bawahan tidak langsung, dan jumlah orang dalam struktur organisasi.

Tetapi ketika kecerdasan menjadi sumber daya langka, tanda baru adalah: berapa banyak kecerdasan yang bisa Anda alokasikan.

Pengeluaran AI pada dasarnya sedang bersaing dengan biaya tenaga kerja.

Kebanyakan proposal anggaran AI, pada dasarnya adalah salah satu dari tiga klaim: menggantikan tenaga kerja outsourcing, menggantikan tenaga kerja internal, atau menciptakan pendapatan baru.

Seorang karyawan punya gaji. Sebuah kontrak outsourcing BPO punya harga yang dihitung per tiket, klaim, faktur, atau peninjauan. Manusia bisa memahami satuan ukur ini. Tapi biaya inferensi lebih kompleks, karena biaya akhir penyelesaian sebuah tugas bergantung pada bagaimana sistem berjalan selama proses eksekusi. Sebuah tugas klaim yang memerlukan tiga kali percobaan ulang, koreksi manual, dan memanggil model terdepan, mungkin lebih mahal daripada tenaga outsourcing yang awalnya ingin digantikannya. Karena itulah, diskusi mulai beralih: Berapa biaya untuk menyelesaikan satu hasil? Misalnya biaya per tiket terselesaikan, per klaim diproses, per kontrak ditinjau, per faktur diselesaikan, per posisi yang dihindari untuk direkrut, per pelanggan yang dipertahankan, atau per konversi satu dolar pendapatan.

Para eksekutif sudah menyadari, BPO adalah tempat termudah untuk membangun patokan, karena pekerjaan ini memang sudah dihargai per "unit selesai". Sebaliknya, perbandingan antara karyawan internal dan AI jauh lebih sulit, karena karyawan melakukan banyak hal setiap hari, termasuk berselancar TikTok saat istirahat siang; peningkatan produktivitas sering kali tampak sebagai penghindaran perekrutan atau pelepasan kapasitas yang tersebar; dan manajer juga cenderung menolak pengurangan jumlah tim hanya berdasarkan otomatisasi parsial. BPO memberikan garis dasar yang terkuantifikasi untuk tim bisnis.

Ini berbeda dengan logika SaaS. SaaS pernah melatih perusahaan untuk melihat volume penggunaan sebagai indikator proksi nilai.

Tetapi AI meruntuhkan hal ini. Berapa banyak sumber daya inferensi yang dikonsumsi alur kerja yang sama bisa sangat bervariasi karena prompt, konteks yang diambil, model yang dipilih, alat yang dipanggil, jumlah percobaan ulang, dan apakah agent macet atau tidak. Satuan pada tagihan — token — stabil, tetapi volume kerja yang diwakilinya tidak stabil.

Lebih tepatnya: sinyal dan noise menggunakan satuan ukur yang sama. Kenaikan tagihan token bisa berarti pekerjaan nyata sedang diselesaikan; tetapi juga bisa berarti daya komputasi sedang terbuang percuma pada prompt yang buruk, konteks tidak relevan, pemanggilan alat tidak perlu, inferensi berulang, dan model yang kemampuannya berlebihan. Tagihan token dua perusahaan bisa persis sama, tetapi bisnis yang berjalan di baliknya sangat berbeda: satu sedang mengubah inferensi menjadi hasil, yang lainnya membayar untuk perjalanan tidak efektif, dan kedua situasi ini terlihat sama persis pada item tagihan.

Volume penggunaan SaaS memberi tahu Anda: perangkat lunak telah diadopsi. Volume penggunaan AI hanya memberi tahu Anda: meteran sedang berjalan. Itu tidak memberi tahu Anda, apakah perusahaan benar-benar berjalan atau tidak.

Mengapa Utilitas Marginal Token Sulit Dilihat?

Ada tiga alasan utama.

Pertama adalah ekor panjang percobaan ulang. Jika probabilitas sebuah agent menyelesaikan alur kerja dengan benar pada percobaan pertama adalah p, maka konsumsi token yang diharapkan per alur kerja terselesaikan kira-kira akan membesar sesuai T/p, di mana T adalah biaya dasar. Jika tingkat penyelesaian turun dari 90% menjadi 70%, biaya efektif per penyelesaian masalah akan meningkat sekitar 28%, bukan 20%, karena kegagalan menghasilkan efek gabungan. Dalam alur kerja perusahaan, input sering kali berantakan, dan kasus luar biasa juga penting. Kegagalan tidak hanya menurunkan akurasi, tetapi juga mengubah perhitungan ekonomi.

Kedua adalah inflasi konteks. Untuk operasi yang sangat bergantung pada mekanisme perhatian, biaya inferensi kira-kira tumbuh sesuai O(n2) seiring panjang konteks. Oleh karena itu, panjang konteks berlipat ganda, biaya inferensi kira-kira menjadi empat kali lipat. Setiap orang ingin model memiliki informasi yang cukup, jadi sistem cenderung memasok berlebihan: padahal lima dokumen sudah cukup, retrieval malah mengambil lima puluh; konektor langsung memasukkan seluruh utas email; agent terus berjalan membawa riwayat percakapan yang sudah lama kedaluwarsa.

Ketiga adalah perutean. Ketika tim tidak tahu model mana yang "cukup baik", secara default akan menggunakan model terkuat. Sebuah tugas klasifikasi dasar, mungkin berjalan pada model yang sama yang dirancang untuk penalaran kompleks. Ketika volume panggilan mencapai jutaan, apakah menyerahkan tugas sederhana ke model kecil, atau semua tugas ke model terdepan, sering kali menjadi perbedaan antara tagihan terkendali dan masalah tingkat dewan direksi.

Industri non-perangkat lunak akan merasakan rasa sakit ini dalam bentuk "transformasi". Perusahaan perangkat lunak akan melihat masalah ini lebih dulu, karena pekerjaan yang dioptimalkan sudah terinstrumentasi dengan baik. Tim rekayasa memiliki metrik PR, commit, deployment, insiden, waktu siklus, waktu perbaikan rata-rata, dan metrik-metrik ini terhubung dengan produk. Meski tidak sempurna, pekerjaan semacam ini lebih mudah diukur.

Perusahaan non-perangkat lunak akan merasakan masalah ini lebih dalam, karena pekerjaan mereka bersifat operasional. Misalnya klaim, underwriting, tiket layanan pelanggan, peninjauan kepatuhan, anomali rantai pasok, sengketa pembayaran. Atau, perusahaan yang memiliki aset dunia nyata juga akan menghadapi masalah yang sama. Alur kerja ini sebelumnya biasanya diukur dengan tenaga manusia, waktu siklus, tingkat pencapaian SLA, dan tingkat kesalahan, dan sering kali memiliki persyaratan lebih tinggi, perlu dapat dipertahankan dalam audit, bukan hanya benar dalam rata-rata. Satuan kerja dan satuan biaya tidak menggunakan bahasa yang sama, juga tidak berada di organisasi yang sama. Tim teknis bisa melihat konsumsi token, departemen bisnis bisa melihat perubahan alur kerja, tetapi menghubungkan keduanya memerlukan beberapa tim untuk terlebih dahulu menyepakati "sebenarnya mengukur apa".

Saya yakin, perusahaan perangkat lunak akan mengalami perang anggaran token sebagai masalah pengukuran produktivitas, yang juga sesuai dengan banyak "PHK AI" yang sebelumnya terjadi; sementara perusahaan non-perangkat lunak akan mengalaminya sebagai masalah transformasi.

Lapisan yang hilang adalah atribusi dari token ke hasil. Perusahaan memerlukan lapisan konversi yang menghubungkan pengeluaran inferensi dengan pekerjaan yang diselesaikan, hasil bisnis yang dihasilkan. Lapisan ini harus menjawab tiga pertanyaan: Berapa biaya sebenarnya dari alur kerja ini, termasuk percobaan ulang dan koreksi? Di jalur eksekusi agent, bagian mana yang benar-benar penting, dan mana yang hanya perjalanan tidak efektif? Apakah pekerjaan ini mengubah model operasional — misalnya setiap agen layanan pelanggan menangani lebih sedikit tiket, siklus klaim lebih singkat, anggaran BPO lebih kecil, perekrutan ditunda? Lapisan berikutnya adalah melakukan atribusi hasil dalam bahasa bisnis. Bukan sekadar mengatakan "alur kerja ini menghabiskan 2,13 dolar", tetapi mengatakan: klaim jenis ini lebih murah ditangani agent daripada BPO, tetapi jika polis memerlukan dokumen tambahan untuk kasus luar biasa, ekor panjang percobaan ulang akan menghancurkan kelayakan ekonominya.

Pengukuran akan menjadi ingatan. Untuk menghubungkan sebuah token dengan sebuah hasil, perusahaan harus menangkap semua yang terjadi di antaranya: apa yang dilihat agent, apa yang diambil, alat apa yang dipanggil, apa yang diabaikan, di mana melakukan percobaan ulang, kapan dikoreksi manual, aturan pengecualian mana yang berlaku, preseden mana yang berpengaruh, dan mengapa satu jalur berhasil sementara jalur lain gagal. Lapisan pengukuran harus merekam jejak keputusan, dan ini justru sesuatu yang hampir tidak pernah benar-benar dimiliki perusahaan sebelumnya. Sistem pencatatan bisa merekam apa yang terjadi, tetapi jarang bisa merekam mengapa. Misalnya, CRM bisa memberi tahu Anda sebuah deal ditunda, tetapi tidak bisa memberi tahu Anda penilaian yang tidak tertulis di balik prediksi penjualan.

Alasan keputusan adalah aset perusahaan yang paling mudah rusak, paling mudah hilang, karena ia ada di utas Slack, rantai email, rapat eskalasi, dan di kepala orang. Namun masalahnya, orang pergi, proses berubah.

AI mengubah ini, karena agent menghasilkan jejak. Setiap retrieval, pemanggilan alat, percobaan ulang, eskalasi, koreksi manual, dan keputusan akhir, akan menjadi bagian dari jalur dari konteks ke aksi hingga hasil. Awalnya, perusahaan akan menangkap jejak ini untuk membenarkan pengeluaran. Namun begitu jejak ini tertangkap, mereka akan menjadi lebih berharga daripada laporan biaya itu sendiri, karena mereka akan menjadi catatan permanen yang merekam bagaimana organisasi sebenarnya mengambil keputusan. (Ahem, context graph, meski akhir-akhir ini saya sudah benar-benar bosan mendengar kata ini.)

Lapisan alokasi adalah hadiah sesungguhnya. Jika inferensi menjadi sumber daya yang dibayar sesuai pemakaian dalam model operasional pelanggan, maka setiap dolar harus membuktikan dirinya layak dibelanjakan. Pemasok mana yang dapat menjelaskan kapan token berubah menjadi hasil, kapan tidak, dan mengapa?

Perusahaan tidak akan menyelesaikan hal ini sepenuhnya sendiri. Mereka akan membelinya sebagai sebuah transformasi. Perusahaan Fortune 500 sudah berulang kali memainkan naskah ini sebelumnya: kencangkan sabuk pengaman, rekrut McKinsey, rekrut setiap mantan karyawan Palantir di pasar, lalu dorong perubahan dari atas oleh CEO. Atribusi token ke hasil juga akan muncul dengan cara yang mirip dengan ERP, BI, dan transformasi digital: tiba sebagai sebuah "proyek" dengan dukungan eksekutif, didukung infrastruktur di bawahnya, dan akhirnya menjadi sumber fakta baru. Pendiri yang dapat melakukan hal ini akan membentuk tim pendiri yang berbeda jenis, dan mereka sendiri juga akan berbeda dari prototipe pengusaha tradisional.

Siapa yang menguasai atribusi token ke hasil, dia yang dapat membuat keputusan alokasi: alur kerja mana yang layak mendapat lebih banyak daya komputasi, mana yang harus dibatasi, mana yang harus dialihkan ke model lebih murah, mana yang terus dikerjakan manusia, mana yang dapat menggantikan BPO. Dan begitu Anda dapat membuat keputusan ini, Anda mengontrol aliran pengeluaran AI di dalam perusahaan, dan mendapatkan kepercayaan yang diperlukan untuk mendistribusikan sumber daya ini.

Tahap pertama AI perusahaan membuktikan: model dapat menyelesaikan pekerjaan. Tahap berikutnya akan menentukan: seberapa banyak pekerjaan ini yang benar-benar layak dibayar. Seperti kata Charlie Munger: Tunjukkan insentifnya, dan saya akan menunjukkan hasilnya kepada Anda.

Tautan Asli

Pertanyaan Terkait

QApa inti dari 'Token Budget Wars' yang dibahas dalam artikel?

AInti dari 'Token Budget Wars' adalah pergeseran fokus perusahaan AI dari sekedar mengadopsi teknologi AI ke tahap mengukur dan mengalokasikan biaya token secara efektif. Ini bukan hanya tentang menekan tagihan AI, tetapi tentang menilai kembali proses bisnis mana yang benar-benar layak mendapat investasi komputasi lebih, tugas mana yang bisa dialihkan ke model lebih murah, dan mana yang hanya pemborosan sumber daya.

QMengapa biaya token AI berbeda dengan ukuran nilai dalam SaaS?

ADalam SaaS, peningkatan penggunaan sering kali menunjukkan adopsi perangkat lunak yang sukses dan bernilai. Namun, dalam AI, konsumsi token hanya menunjukkan bahwa 'meteran sedang berjalan'. Tagihan yang sama bisa mencerminkan pekerjaan yang produktif atau pemborosan komputasi karena prompt yang buruk, konteks yang tidak relevan, atau pemilihan model yang berlebihan. Token tidak serta-merta sama dengan nilai bisnis yang tercipta.

QApa tiga faktor utama yang membuat 'utilitas marjinal token' sulit diukur?

ATiga faktor utama tersebut adalah: 1) **Ekor Panjang Percobaan Ulang**: Tingkat kegagalan agent meningkatkan biaya efektif per alur kerja karena efek komposit dari percobaan ulang. 2) **Inflasi Konteks**: Biaya inferensi meningkat drastis (sekitar kuadratik) dengan panjang konteks, dan sistem sering memasok informasi berlebihan. 3) **Perutean Model**: Kecenderungan menggunakan model terkuat untuk semua tugas, termasuk yang sederhana, yang sangat mahal saat dilakukan dalam skala besar.

QBagaimana perusahaan non-perangkat lunak akan merasakan 'perang anggaran token' dibandingkan perusahaan perangkat lunak?

APerusahaan perangkat lunak akan mengalami ini sebagai masalah pengukuran produktivitas internal, terkait dengan efisiensi tim engineering. Sementara itu, perusahaan non-perangkat lunak (seperti asuransi, logistik, layanan pelanggan) akan mengalaminya sebagai masalah transformasi bisnis yang lebih dalam. Mereka harus menghubungkan biaya token dengan hasil operasional nyata (seperti klaim yang diselesaikan, tiket dukungan) yang sebelumnya diukur dengan metrik berbeda dan sering melibatkan tenaga manusia atau outsourcing (BPO).

QApa yang dimaksud dengan 'lapisan atribusi' dan mengapa itu penting untuk fase selanjutnya AI perusahaan?

A'Lapisan atribusi' adalah lapisan yang menghubungkan pengeluaran token (biaya inferensi) dengan hasil bisnis yang nyata. Lapisan ini menjawab pertanyaan tentang biaya riil suatu alur kerja (termasuk percobaan ulang), bagian mana dari eksekusi agent yang penting, dan apakah pekerjaan itu mengubah model operasi (seperti mengurangi anggaran BPO). Dengan lapisan ini, perusahaan dapat membuat keputusan alokasi yang cerdas: alur kerja mana yang patut mendapat sumber daya lebih, mana yang harus dialihkan ke model lebih murah, atau mana yang tetap dikerjakan manusia. Menguasai atribusi ini berarti mengendalikan alokasi pengeluaran AI di dalam perusahaan.

Bacaan Terkait

Tiga Tahun Kemudian: Meninjau Kembali Penilaian Saya terhadap ChatGPT di Tahun 2023

Tiga tahun kemudian, pada Mei 2026, penulis meninjau kembali 20 prediksi tentang ChatGPT yang dibuatnya pada Maret 2023, menggunakan AI untuk mengevaluasi akurasinya berdasarkan data terbaru. Secara keseluruhan, arah dan mekanisme prediksi banyak yang tepat. Yang paling akurat adalah tentang RAG sebagai arsitektur standar, LUI (Antarmuka Pengguna Bahasa Alami) sebagai lapisan interaksi baru, munculnya "jaringan robot" (protokol untuk agen AI), dan kemampuan China mengejar ketertinggalan model AI besar. Prediksi bahwa ChatGPT bukan AGI namun langkah besar, tidak menyebabkan gelombang pengangguran massal, serta sifat uji Turing yang hanya mengukur persepsi juga pada dasarnya benar. Namun, prediksi dengan angka spesifik atau pernyataan mutlak sering meleset. Klaim bahwa GPT-4 memiliki 100 triliun parameter sepenuhnya salah. Pernyataan bahwa LLM "tidak mungkin" mengerjakan matematika murni terbantahkan dengan model penalaran yang memenangkan medali emas IMO. Estimasi biaya pelatihan model hanya $5-10 miliar juga jauh dari kenyataan, yang kini mencapai miliaran dolar untuk model terdepan. Beberapa prediksi keliru tentang distribusi dampak, seperti bahwa nilai akan berpindah ke lapisan aplikasi (nyatanya, penyedia chip seperti NVIDIA paling untung), atau bahwa AI akan "menghindari" masalah hak cipta (justru menimbulkan gugatan besar). Kesimpulan utama adalah: dalam memprediksi teknologi yang cepat berubah, mengidentifikasi arah dan mekanisme umumnya lebih bisa diandalkan daripada memberikan angka pasti atau pernyataan mutlak. Prediksi cenderung terlalu optimis tentang kecepatan perubahan jangka pendek, tetapi meremehkan besarnya perubahan jangka panjang. Penting juga untuk mempertimbangkan distribusi dampak, bukan hanya kesimpulan agregat. Pernyataan yang disertai batasan dan keraguan justru lebih tahan uji waktu. Beberapa pertanyaan mendasar masih belum terjawab setelah tiga tahun. Tinjauan ini berfungsi sebagai pelajaran untuk membuat prediksi yang lebih baik di tiga tahun mendatang.

marsbit1j yang lalu

Tiga Tahun Kemudian: Meninjau Kembali Penilaian Saya terhadap ChatGPT di Tahun 2023

marsbit1j yang lalu

Tiga Tahun Kemudian: Menilik Kembali Penilaian Saya terhadap ChatGPT pada 2023

Tiga tahun kemudian: Meninjau Kembali 20 Prediksi ChatGPT Saya pada 2023 Pada Maret 2023, penulis Wang Jianshuo membuat 20 prediksi intuitif tentang ChatGPT dan AI masa depan. Kini, di Mei 2026, sebuah sistem AI yang terdiri dari 41 agen menganalisis prediksi-prediksi tersebut berdasarkan data terkini. Hasilnya menunjukkan pola menarik. **Yang Terbukti Benar (Secara Umum):** * **RAG dan Arsitektur Pencarian (✅):** Solusi utama untuk pengetahuan dan halusinasi adalah dengan menambahkan "contekan" (RAG), bukan mengubah model. Arsitektur pencarian + LLM kini menjadi standar. * **LUI sebagai Benua Baru (🟢):** Antarmuka Pengguna Bahasa Alami (LUI) adalah lapisan interaksi baru yang besar, melahirkan industri agen dan protokol seperti MCP. * **Jaringan Robot dan Sistem Pengalamatan Baru (🟢):** Agen akan berkomunikasi otomatis dengan bahasa alami. Protokol seperti MCP dan ANP sedang mewujudkannya. * **Model Besar Tiongkok (🟢):** Model-model seperti DeepSeek dan Qwen telah mengejar ketertinggalan performa, meski dengan investasi lebih kecil. * **Tidak Ada Kesadaran, Tes Turing Hanya Ukur Penampilan (🟢):** AI tidak memiliki kesadaran. Tes Turing hanya mengukur ilusi kesadaran. * **Prediksi Lain yang Benar:** ChatGPT bukan AGI, tapi lompatan besar; gelombang pengangguran besar tidak terjadi; tahun besar untuk startup; momen "browser 1994" telah tiba. **Yang Kurang Tepat atau Salah:** * **Parameter GPT-4 (❌):** Prediksi 100 triliun parameter salah. Estimasi terbaru sekitar 1,8 triliun. * **Matematika di LLM (🟡):** Diagnosis bahwa matematika adalah kelemahan intrinsik dan memerlukan alat bantu benar. Namun, pernyataan "tidak mungkin" ditingkatkan terbukti salah, karena model kini bisa memenangkan medali emas Olimpiade Matematika Internasional (IMO). * **Penangkapan Nilai (🟡):** Aplikasi memang berkembang pesat, tetapi nilai terbesar justru ditangkap oleh lapisan komputasi (seperti Nvidia), bukan oleh pembuat model. * **Hak Cipta (🟡):** Konten AI sulit didaftarkan hak cipta, tetapi tidak serta-mata "menghindari" pelanggaran. Gugatan dan penyelesaian besar (misalnya, Anthropic $1,5 miliar) membuktikan risikonya. * **Biaya Model (🟡):** Prediksi "perang lokal" dengan biaya $5-10 miliar untuk model canggih terbukti salah. Biaya pelatihan model terdepan (seperti GPT-5) jauh lebih tinggi, sementara biaya kloning model terbuka justru bisa lebih murah. **Pola dan Pelajaran:** 1. **Arah dan mekanisme lebih dapat diandalkan daripada angka pasti dan pernyataan mutlak.** 2. **Cenderung terlalu optimis untuk jangka pendek (kecepatan), tetapi terlalu konservatif untuk jangka panjang (skala/dampak).** 3. **Kesalahan sering terjadi pada distribusi, bukan pada total.** Contoh: Tidak ada gelombang pengangguran masif, tetapi dampak berat dirasakan oleh lulusan baru. 4. **Pernyataan yang disertai batasan dan ruang ketidakpastian justru lebih tahan uji waktu.** 5. **Beberapa pertanyaan mendasar masih belum terjawab setelah tiga tahun.** Kesimpulannya, prediksi tentang arah besar dan mekanisme cenderung akurat, sementara prediksi spesifik tentang angka, kecepatan, dan distribusi dampak lebih sering meleset. Latihan ini lebih merupakan pelajaran dalam kerendahan hati dan penilaian yang bernuansa daripada sekadar penghitungan skor.

链捕手4j yang lalu

Tiga Tahun Kemudian: Menilik Kembali Penilaian Saya terhadap ChatGPT pada 2023

链捕手4j yang lalu

Peringatan Gelembung AI: Investasi AI Merupakan Pengembalian Negatif bagi Kebanyakan Raksasa Teknologi

Peringatan Gelembung AI: Investasi AI Membawa Pengembalian Negatif bagi Sebagian Besar Raksasa Teknologi Demam AI kini memasuki tahap pemeriksaan keuangan. Raksasa cloud seperti Microsoft, Alphabet, Amazon, Meta, dan Oracle berencana menginvestasikan ratusan miliar dolar ke pusat data AI dalam lima tahun ke depan. Namun, analisis terhadap proyeksi pendapatan dan pengeluaran modal (capex) hingga 2030 mengungkap masalah: tingkat pengembalian investasi implisit diperkirakan sangat negatif bagi semua perusahaan kecuali Amazon, bahkan dalam skenario optimis ekstrem. Ini menunjukkan bahwa jika tren saat ini berlanjut, boom AI bisa menjadi salah satu peristiwa perusakan nilai pemegang saham terbesar. Ada dua jalan keluar: pendapatan yang jauh melebihi ekspektasi saat ini, atau pengurangan rencana investasi. Jalan pertama tampaknya mustahil, karena membutuhkan tambahan pendapatan triliunan dolar. Jalan kedua—pemotongan investasi—akan berdampak luas, meruntuhkan harga saham perusahaan-perusahaan teknologi global dan dapat mendorong ekonomi AS ke resesi, mengingat 93% pertumbuhan PDB AS belakangan ini didorong oleh investasi teknologi. IPO perusahaan AI seperti OpenAI dan Anthropic tahun ini bisa menjadi mekanisme transfer risiko, memindahkan ketidakpastian dari pemilik awal kepada investor ritail dan dana pensiun. Sementara euphoria pemasaran mungkin bertahan hingga setelah IPO tahun 2026, tekanan matematika yang tak terelakkan mungkin memaksa raksasa cloud mengumumkan pemotongan investasi pada 2027 atau 2028, mirip dengan jeda tiga tahun antara peringatan "irrational exuberance" Alan Greenspan pada 1996 dan pecahnya gelembung dotcom pada 2000.

marsbit5j yang lalu

Peringatan Gelembung AI: Investasi AI Merupakan Pengembalian Negatif bagi Kebanyakan Raksasa Teknologi

marsbit5j yang lalu

Dari Token ke Tenaga Kerja Mesin: AI Sedang Berubah dari Alat Menjadi 'Pekerja'

Dari Token ke Tenaga Kerja Mesin: AI Berubah dari Alat Menjadi "Pekerja" AI mulai menulis kode, menangani tiket dukungan pelanggan, dan meninjau dokumen hukum. Artikel ini mengusulkan kerangka baru: komersialisasi AI sedang bergerak menuju "pasar tenaga kerja mesin". Dalam pasar ini, token hanyalah unit pengukuran, GPU adalah bahan baku, dan model adalah alat produksi. Objek yang benar-benar ditetapkan harganya dan diperdagangkan adalah kerja ekonomi yang diselesaikan langsung oleh perangkat lunak. Mekanisme penetapan harga AI akan berkembang dari token mentah, kemampuan model yang terstandarisasi, tenaga kerja yang terspesialisasi industri, hingga pasar hasil yang dapat diprogram. Di masa depan, perusahaan mungkin tidak lagi peduli model atau GPU mana yang menyelesaikan suatu tugas, tetapi lebih pada apakah tugas itu diselesaikan dalam batas latensi, akurasi, keandalan, dan biaya yang ditentukan. Implikasinya, dampak AI pada pasar tenaga kerja manusia tidak hanya sekadar penggantian. Saat mesin mengambil alih lebih banyak pekerjaan yang dapat distandardisasi dan diverifikasi, peran manusia mungkin bergeser ke pengawasan, penanggung jawab, manajemen konteks, dan keputusan akhir. Dalam beberapa kasus, penilaian manusia untuk 1% akhir justru menjadi lebih berharga karena dapat membuka kunci 99% otomatisasi skala besar. Pasar AI adalah pasar ekspansif. Ketika biaya kerja turun, permintaan tidak tetap. Jika interaksi dukungan pelanggan menjadi lebih murah, perusahaan dapat menawarkan layanan 24/7, menciptakan pasar interaksi pelanggan yang lebih besar. Persaingan tahap berikutnya di pasar AI mungkin bukan lagi sekadar pertarungan kemampuan model atau perang harga daya komputasi, tetapi tentang siapa yang dapat pertama kali menstandarisasi, memverifikasi, dan menetapkan harga "pekerjaan", akhirnya menjadikan tenaga kerja mesin sebagai faktor produksi baru yang dapat dibeli, diselesaikan, dan diperdagangkan.

marsbit5j yang lalu

Dari Token ke Tenaga Kerja Mesin: AI Sedang Berubah dari Alat Menjadi 'Pekerja'

marsbit5j yang lalu

Diskon 99% untuk MiMo Bukan Hanya Pemasaran! Luo Fuli Membantah Para Pengecam di X

**Ringkasan:** Xiaomi MiMo memotong harga API MiMo-V2.5 hingga **99%**, memicu spekulasi tentang perang harga atau strategi merugi. Luo Fuli, kepala MiMo, merespons dengan mempublikasikan blog teknis 5000 kata yang merinci **enam pilar teknikal** di balik potongan harga besar ini. Intinya, diskon 99% terutama untuk **Input (Cache Hit)** – bagian dimana pengguna membaca ulang konteks historis dalam percakapan panjang. Ini menjadi mungkin karena serangkaian optimasi teknikal yang mengubah biaya komputasi untuk bagian tersebut mendekati nol. **Enam Pilar Teknikal:** 1. **Arsitektur Hybrid SWA:** Menggunakan Sliding Window Attention di sebagian besar lapisan model, mengurangi volume **KVCache** (memori jangka pendek model) hingga **1/7**. 2. **Manajemen KVCache Dua Kolam:** Mengalokasikan memori secara terpisah untuk lapisan SWA dan Full Attention, benar-benar mewujudkan penghematan teoretis 1/7 dan meningkatkan jumlah pengguna yang dapat dilayani secara bersamaan. 3. **Prefix Cache yang Dioptimalkan:** Meningkatkan aturan pencocokan cache untuk arsitektur SWA, menghasilkan **tingkat keberhasilan cache 93-95%** untuk pembacaan ulang. Artinya, sebagian besar permintaan "baca ulang" tidak memerlukan komputasi GPU baru. 4. **Sistem Cache Terdistribusi GCache:** Menyimpan data cache di **SSD bawaan mesin GPU**, menghilangkan biaya penyimpanan cluster khusus dan memperpanjang masa hidup cache. 5. **Sistem Penjadwalan LLM-Router:** Mengarahkan permintaan secara cerdas berdasarkan kesamaan prefix dan panjang konteks, memprioritaskan permintaan yang menggunakan cache, meningkatkan efisiensi dan mengurangi latensi. 6. **Multi-Token Prediction (MTP):** Mengoptimalkan proses generasi output model, mempercepat pembuatan respons dan melengkapi pengurangan biaya di sisi input. **Kesimpulan:** Penurunan harga 99% bukanlah gimmick pemasaran atau strategi merugi, tetapi hasil dari **efisiensi sistemik rekayasa AI** yang telah divalidasi di lingkungan produksi. Rantai optimasi ini secara kumulatif mengurangi biaya komputasi per permintaan hingga lebih dari 95%, memungkinkan penurunan harga ekstrem sambil mempertahankan profitabilitas. Luo Fuli menekankan bahwa ini adalah masalah teknikal yang terwujud, bukan sekadar perang harga.

marsbit7j yang lalu

Diskon 99% untuk MiMo Bukan Hanya Pemasaran! Luo Fuli Membantah Para Pengecam di X

marsbit7j yang lalu

Trading

Spot
Futures

Artikel Populer

Cara Membeli ERA

Selamat datang di HTX.com! Kami telah membuat pembelian Caldera (ERA) menjadi mudah dan nyaman. Ikuti panduan langkah demi langkah kami untuk memulai perjalanan kripto Anda.Langkah 1: Buat Akun HTX AndaGunakan alamat email atau nomor ponsel Anda untuk mendaftar akun gratis di HTX. Rasakan perjalanan pendaftaran yang mudah dan buka semua fitur.Dapatkan Akun SayaLangkah 2: Buka Beli Kripto, lalu Pilih Metode Pembayaran AndaKartu Kredit/Debit: Gunakan Visa atau Mastercard Anda untuk membeli Caldera (ERA) secara instan.Saldo: Gunakan dana dari saldo akun HTX Anda untuk melakukan trading dengan lancar.Pihak Ketiga: Kami telah menambahkan metode pembayaran populer seperti Google Pay dan Apple Pay untuk meningkatkan kenyamanan.P2P: Lakukan trading langsung dengan pengguna lain di HTX.Over-the-Counter (OTC): Kami menawarkan layanan yang dibuat khusus dan kurs yang kompetitif bagi para trader.Langkah 3: Simpan Caldera (ERA) AndaSetelah melakukan pembelian, simpan Caldera (ERA) di akun HTX Anda. Selain itu, Anda dapat mengirimkannya ke tempat lain melalui transfer blockchain atau menggunakannya untuk memperdagangkan mata uang kripto lainnya.Langkah 4: Lakukan trading Caldera (ERA)Lakukan trading Caldera (ERA) dengan mudah di pasar spot HTX. Cukup akses akun Anda, pilih pasangan perdagangan, jalankan trading, lalu pantau secara real-time. Kami menawarkan pengalaman yang ramah pengguna baik untuk pemula maupun trader berpengalaman.

730 Total TayanganDipublikasikan pada 2025.07.17Diperbarui pada 2025.07.17

Cara Membeli ERA

Diskusi

Selamat datang di Komunitas HTX. Di sini, Anda bisa terus mendapatkan informasi terbaru tentang perkembangan platform terkini dan mendapatkan akses ke wawasan pasar profesional. Pendapat pengguna mengenai harga ERA (ERA) disajikan di bawah ini.

活动图片