Ketika Token Lebih Mahal daripada Manusia, 'Narasi AI' Menghadapi Masalah

marsbitDipublikasikan tanggal 2026-05-29Terakhir diperbarui pada 2026-05-29

Abstrak

Aliran uang perusahaan untuk AI menghadapi ujian ketat karena biaya token terus melonjak, namun nilai bisnis yang terukur sulit ditemukan. Eksekutif Uber dan Microsoft menyoroti kesenjangan antara peningkatan konsumsi token dan perbaikan produk nyata, menciptakan istilah "tokenmaxxing" untuk menggambarkan pemborosan. Data dari berbagai sumber memperlihatkan gambaran mengkhawatirkan: Uber menghabiskan anggaran Claude Code tahunan dalam empat bulan, dengan tagihan per engineer mencapai $2000 per bulan. Platform Entelligence.AI menemukan bahwa dari setiap $1 biaya token AI, hanya $0,18 yang menciptakan nilai bagi pengguna, sementara sisanya habis untuk memperbaiki bug, pengerjaan ulang, dan gesekan dalam tinjauan. Harga token sendiri telah naik sekitar 65% sejak akhir Februari. Para analis terbelah. Pandangan positif berargumen bahwa ini hanya fase transisi, dan konsumsi token akan bergeser ke metrik biaya-per-tindakan-efektif yang lebih sehat, didukung oleh tanda-tanda peningkatan produktivitas nyata. Pandangan skeptis, yang dipimpin oleh analis seperti Jim Covello dari Goldman Sachs, memperingatkan bahwa model saat ini tidak berkelanjutan. Hampir semua nilai dalam rantai pasokan AI mengalir ke perusahaan semikonduktor seperti Nvidia, sementara banyak perusahaan pengguna berjuang untuk melihat ROI. Penelitian MIT bahkan menunjukkan 95% investasi AI generatif memberi laba nol. Kekhawatiran lain adalah struktur pendanaan melingkar antara raksasa cloud (Microsoft, Google, dll.)...

Ditulis oleh: Bao Yilong

Sumber: Wallstreet Insights

Rasionalitas pengeluaran AI perusahaan sedang diuji dengan ketat. Konsumsi Token terus melonjak, namun nilai komersial yang dapat diukur sulit ditemukan.

Pada 22 Mei, COO Uber yang bernilai pasar lebih dari $2000 miliar, Andrew Macdonald, dalam sebuah podcast secara terbuka menyatakan bahwa hubungan antara pertumbuhan konsumsi token dan peningkatan substansial produk, "belum ada".

Macdonald menekankan, perusahaan semakin sulit memberikan justifikasi yang masuk akal untuk pengeluaran AI yang terus meningkat. Dia bahkan menciptakan istilah khusus untuk fenomena pemborosan di dalam tim teknik: "tokenmaxxing".

Sebelumnya, pada pertengahan Mei, Microsoft dengan alasan tagihan Token "tidak berkelanjutan", mulai memotong lisensi internal Claude Code.

Gabungan dua peristiwa ini memaksa pasar untuk serius memperhatikan variabel yang sebelumnya diabaikan ini. Tokenomics, yaitu ekonomi unit konsumsi Token dalam skala perusahaan, telah naik dari isu pinggiran menjadi pilar penopang utama dari seluruh wacana investasi AI.

Lima Set Data, Merangkai Gambaran Baru

Sejak April, beberapa set data berturut-turut mendarat, bersama-sama menguraikan gambaran yang mengkhawatirkan.

Pada April tahun ini, CTO Uber menyatakan secara terbuka bahwa perusahaan menghabiskan anggaran Claude Code untuk setahun dalam waktu empat bulan.

Dari 5000 insinyur, tingkat penggunaan bulanan berkisar antara 84% hingga 95%, dengan tagihan per orang per bulan bervariasi dari $150 hingga $2000. CTO tersebut dilaporkan menghabiskan token senilai $1200 dalam presentasi internal selama dua jam.

Macdonald menggambarkan reaksinya saat mengetahui angka ini sebagai "terkejut hingga tak bisa berkata-kata".

Di sisi Microsoft, menurut laporan newsletter Notepad oleh Tom Warren dari The Verge, Claude Code dengan cepat populer di kalangan insinyur internal Microsoft, namun model penagihan berbasis Token membuat pengeluaran skala besar menjadi tidak berkelanjutan, sehingga Microsoft segera mengambil langkah mengurangi lisensi terkait.

GitHub mengumumkan mulai 1 Juni, semua paket Copilot beralih dari langganan tetap ke pembayaran sesuai pemakaian.

Thread diskusi resmi mendapat hampir 900 suara tidak setuju, karena pengguna menghitung bahwa satu sesi pemrograman agen cerdas biasanya menghabiskan $30 hingga $40, yang berarti paket langganan $10 per bulan habis hanya dalam sekali penggunaan.

Platform produktivitas pengembang Entelligence.AI yang mengumpulkan data dari 2444 perusahaan menemukan:

  • Dari setiap $1 biaya Token AI yang diinvestasikan, hanya 18 sen yang menghasilkan nilai nyata yang menjangkau pengguna.
  • 44 sen digunakan untuk memperbaiki Bug yang diperkenalkan oleh AI itu sendiri; 27 sen mengalir ke pekerjaan ulang; 11 sen terkonsumsi oleh friksi dalam proses peninjauan.

Menurut Bloomberg Silicon Data LLM Token Expenditure Index, harga Token telah naik sekitar 65% sejak akhir Februari tahun ini, sementara harga perangkat lunak AI di AS selama setahun terakhir meningkat kumulatif 20% hingga 37%.

Perdebatan Bull vs Bear: Fakta Sama, Interpretasi Berbeda

Data yang sama, dalam kerangka analisis yang berbeda, mengarah pada kesimpulan yang bertolak belakang.

Pandangan bull berpendapat bahwa kekacauan saat ini hanyalah fase transisi yang menyakitkan menuju kesuksesan.

Menurut analisis Jim Schneider dari Goldman Sachs pada awal Mei, pada tahun 2030, AI agen akan mendorong pertumbuhan konsumsi token hingga 24 kali lipat, mencapai sekitar 120 triliun token per bulan, dan margin kotor penyedia layanan cloud hyperscale dan penyedia model akan berubah menjadi positif dalam 3 hingga 12 bulan ke depan.

Rich Privorotsky dari Goldman Sachs berpendapat bahwa kuartal pertama 2026 mungkin telah menjadi puncak "tokenmaxxing" sebagai KPI, industri sedang bergeser dari mengejar volume konsumsi ke dimensi pengukuran yang lebih sehat: "biaya per aksi efektif".

Penelitian ekonomi JPMorgan juga menemukan lonjakan pertumbuhan paket Python baru dan yang diperbarui di PyPI pada awal 2026, sementara tren ini tidak muncul saat ChatGPT diluncurkan pada 2022, menunjukkan peningkatan produktivitas nyata sedang terjadi.

Selain itu, Magnificent 7 saat ini diperdagangkan pada sekitar 20x PER ke depan, jauh lebih rendah dibandingkan puncak gelembung teknologi tahun 2000 (52x), Jepang 1989 (67x), atau era Nifty Fifty (34x). Dalam standar pengukuran gelembung sejarah, kondisi saat ini tidak membentuk gelembung.

Pandangan bear dijelaskan paling sistematis dalam laporan analis semikonduktor Goldman Sachs, Jim Covello, pada April.

Dia mencatat, hampir semua nilai dalam rantai pasok AI mengalir ke perusahaan semikonduktor, fenomena yang belum pernah terjadi sebelumnya dalam sejarah dan tidak berkelanjutan. Perusahaan chip seharusnya mendapat manfaat ketika pelanggan mereka diuntungkan, namun dalam siklus ini, kemakmuran mereka dicapai dengan mengorbankan konsumsi seluruh hulu rantai industri.

Laba bersih Nvidia telah tumbuh sekitar 20x sejak peluncuran ChatGPT; penyedia layanan cloud hyperscale telah menghabiskan arus kas operasi, beralih ke utang – penerbitan utang terkait pusat data tahun 2025 sekitar $182 miliar, dua kali lipat dari tahun 2024.

Penelitian MIT Nanda menunjukkan, 95% perusahaan yang berinvestasi di AI generatif mendapat pengembalian nol. Kesenjangan ini mungkin bisa bertahan untuk sementara, tetapi tidak bisa selamanya.

Kekhawatiran pada Struktur Pendanaan Sirkuler

Diskusi ini juga menyentuh lapisan yang lebih kompleks: siklus keuangan antara penyedia layanan cloud hyperscale dan lab AI.

Menurut dokumen pengungkapan perusahaan yang dikompilasi oleh The Information, OpenAI dan Anthropic secara kolektif menyumbang lebih dari setengah dari sekitar $2 triliun komitmen layanan cloud masa depan Microsoft, Oracle, Google, dan Amazon. Secara spesifik:

  • Dari backlog layanan cloud Microsoft senilai $627 miliar, $280 miliar terikat dengan OpenAI;
  • Dari bisnis pipeline Oracle senilai $553 miliar, 54% (sekitar $300 miliar) merupakan komitmen OpenAI;
  • Dari $467.6 miliar Google, Anthropic menyumbang 43% (sekitar $200 miliar);
  • Paparan Amazon juga mencapai 51% dari backlog-nya senilai $464 miliar.

Struktur pendanaan ini bersifat sirkuler endogen. Investasi Microsoft $13 miliar ke OpenAI sebagian besar direalisasikan dalam bentuk kredit Azure, yang digunakan OpenAI untuk membeli daya komputasi Azure, lalu Microsoft menghitungnya sebagai pendapatan cloud.

Penyedia layanan cloud hyperscale yang sama, sekaligus merupakan investor ekuitas lab AI dan pemasok layanan yang menagih tagihan komputasi.

Struktur ini juga tercermin dalam data laba. Alphabet mengumumkan laba kuartal pertama rekor $62.6 miliar, di mana sekitar $28.7 miliar, hampir setengahnya, berasal dari apresiasi nilai buku kepemilikan saham di Anthropic.

Dari laba kuartal pertama Amazon $30.3 miliar, $16.8 miliar merupakan keuntungan belum direalisasi sebelum pajak dari Anthropic, sementara arus kas bebasnya, karena belanja modal pusat data mencapai $44.2 miliar pada periode yang sama, anjlok 95% menjadi $1.2 miliar.

Keberlanjutan sistem ini bergantung pada kemampuan lab AI untuk terus mendapatkan pendanaan eksternal guna memenuhi komitmen komputasi awan, yang pada gilirannya bergantung pada kesediaan berkelanjutan klien perusahaan untuk membayar tagihan Token yang terus meningkat.

Dilaporkan, saat ini Anthropic menghabiskan biaya $3 untuk setiap $1 pendapatan. Begitu ritme pendanaan melambat, kredibilitas prediksi pendapatan cloud akan menurun, dan kelipatan valuasi vendor cloud hyperscale juga akan menghadapi tekanan penilaian ulang.

Rantai ini mentransmisikan dua arah, dan juga akan putus dua arah.

Ini Bukan 1999, tapi Masalahnya Nyata

Situasi saat ini tidak membentuk skenario gelembung klasik.

Dari sisi kelipatan valuasi, Magnificent 7 saat ini diperdagangkan sekitar 20x PER ke depan, jauh lebih rendah dari level puncak gelembung teknologi 2000 (52x), pasar Jepang 1989 (67x), atau era Nifty Fifty (34x).

Teknologi AI itu sendiri nyata. Bagi kelompok pengguna berat, data peningkatan produktivitas juga dapat diverifikasi. Pendapatan tahunan OpenAI sekitar $20 miliar, Anthropic sekitar $4.3 miliar, kedua laboratorium ini tidak akan hilang begitu saja.

Kini, biaya Token (pengeluaran komputasi) telah menjadi kunci penentu keberhasilan AI, padahal setengah tahun lalu, topik ini bahkan jarang dibicarakan.

Dulu, semua orang hanya peduli "apakah teknologinya berfungsi". Sekarang jawabannya jelas: dalam pekerjaan tertentu dan di mata orang tertentu, teknologi memang berfungsi.

Namun masalah baru muncul: bisakah uang yang dihemat perusahaan hilir dengan menggunakan AI, ditransmisikan tepat waktu ke atas, mengalahkan jendela valuasi yang diberikan pasar modal kepada lab AI dan raksasa cloud?

Mereka yang optimis terhadap AI percaya, selama teknologi terus matang, ROI perusahaan akan berubah menjadi positif dalam 1 hingga 1.5 tahun.

Mereka yang pesimis berpendapat, akan ada lebih banyak eksekutif seperti Macdonald yang mengeluh secara terbuka tentang rasio input-output AI yang terlalu rendah dan mulai memotong anggaran.

Kedua kemungkinan ini sedang terjadi, belum ada pemenangnya. Satu-satunya hal yang pasti adalah, kebohongan masa lalu yang mengatakan "selama konsumsi Token naik, berarti transformasi AI berhasil" telah runtuh.

Konsumsi token yang besar tidak sama dengan memiliki nilai komersial, dua gelembung ini pada akhirnya harus dihilangkan. Tagihan AI sudah jatuh tempo, tetapi siapa yang akan membayarnya? Saat ini masih belum diketahui.

Pertanyaan Terkait

QApa yang dimaksud dengan 'tokenmaxxing' menurut artikel ini, dan mengapa hal ini menjadi perhatian bagi perusahaan seperti Uber?

A'Tokenmaxxing' adalah istilah yang diciptakan oleh COO Uber, Andrew Macdonald, untuk menggambarkan fenomena pemborosan token AI di dalam tim teknik perusahaan. Hal ini menjadi perhatian karena biaya token yang terus meningkat sulit dijustifikasi dengan peningkatan nilai bisnis atau perbaikan produk yang nyata. Misalnya, CTO Uber menyebutkan bahwa anggaran tahunan untuk Claude Code habis dalam empat bulan, dengan tagihan per orang mencapai $2000 per bulan, menunjukkan inefisiensi yang signifikan.

QBerdasarkan data dari Entelligence.AI, bagaimana efisiensi penggunaan token AI di kalangan perusahaan?

ABerdasarkan data dari 2444 perusahaan yang dikumpulkan Entelligence.AI, dari setiap $1 yang dihabiskan untuk token AI, hanya 18 sen yang menghasilkan nilai nyata yang sampai ke pengguna. Sebanyak 44 sen digunakan untuk memperbaiki bug yang diperkenalkan oleh AI itu sendiri, 27 sen untuk pengerjaan ulang, dan 11 sen hilang karena gesekan dalam proses peninjauan. Ini menunjukkan bahwa efisiensi penggunaan token AI saat ini masih sangat rendah.

QApa argumen utama dari pihak 'bull' (optimis) dan 'bear' (pesimis) mengenai ekonomi token AI?

APihak optimis (bull) berargumen bahwa kekacauan saat ini hanyalah fase transisi. Mereka percaya bahwa konsumsi token akan tumbuh 24 kali lipat pada 2030, dan margin kotor penyedia layanan cloud serta model akan membaik dalam 3-12 bulan ke depan. Mereka juga melihat tanda-tanda peningkatan produktivitas nyata, seperti lonjakan paket Python baru. Pihak pesimis (bear) berargumen bahwa hampir semua nilai dalam rantai pasokan AI mengalir ke perusahaan semikonduktor (seperti Nvidia), yang tidak berkelanjutan. Mereka menunjukkan bahwa 95% perusahaan yang berinvestasi dalam AI generatif tidak mendapatkan pengembalian, dan cloud provider besar telah menghabiskan arus kas operasional mereka, beralih ke utang.

QApa yang dimaksud dengan 'struktur pendanaan sirkular' antara lab AI dan hyperscaler cloud, dan mengapa hal ini mengkhawatirkan?

AStruktur pendanaan sirkular mengacu pada hubungan di mana hyperscaler cloud (seperti Microsoft, Google) adalah investor ekuitas di lab AI (seperti OpenAI, Anthropic) dan juga penyedia layanan komputasi cloud yang dibayar oleh lab tersebut. Misalnya, investasi Microsoft di OpenAI sering dibayarkan dalam bentuk kredit Azure, yang kemudian digunakan OpenAI untuk membeli daya komputasi Azure, dan Microsoft mencatatnya sebagai pendapatan cloud. Kekhawatirannya adalah keberlanjutan sistem ini bergantung pada kemampuan lab AI untuk terus mendapatkan pendanaan eksternal untuk memenuhi komitmen cloud mereka, yang pada gilirannya bergantung pada kesediaan pelanggan perusahaan membayar tagihan token yang meningkat. Jika ritme pendanaan melambat, seluruh rantai bisa runtuh.

QMenurut kesimpulan artikel, apa masalah inti yang dihadapi oleh 'naratif AI' saat ini?

AMasalah intinya adalah bahwa biaya token (biaya komputasi) telah menjadi faktor penentu kesuksesan AI, menantang naratif sebelumnya yang hanya berfokus pada kemampuan teknologi. Teknologi AI terbukti berfungsi dan meningkatkan produktivitas bagi pengguna tertentu, tetapi efisiensi ekonomi dan Return on Investment (ROI) bagi perusahaan pengguna dipertanyakan. Konsumsi token yang besar tidak serta-merta sama dengan nilai bisnis yang sepadan. Artikel menyimpulkan bahwa 'tagihan AI telah jatuh tempo', tetapi masih belum jelas siapa yang akhirnya akan membayar biaya tinggi ini jika ROI tidak terwujud dalam waktu dekat, menciptakan ketidakpastian bagi lab AI, cloud provider, dan perusahaan pengguna.

Bacaan Terkait

Tiga Tahun Kemudian: Menilik Kembali Penilaian Saya terhadap ChatGPT pada 2023

Tiga tahun kemudian: Meninjau Kembali 20 Prediksi ChatGPT Saya pada 2023 Pada Maret 2023, penulis Wang Jianshuo membuat 20 prediksi intuitif tentang ChatGPT dan AI masa depan. Kini, di Mei 2026, sebuah sistem AI yang terdiri dari 41 agen menganalisis prediksi-prediksi tersebut berdasarkan data terkini. Hasilnya menunjukkan pola menarik. **Yang Terbukti Benar (Secara Umum):** * **RAG dan Arsitektur Pencarian (✅):** Solusi utama untuk pengetahuan dan halusinasi adalah dengan menambahkan "contekan" (RAG), bukan mengubah model. Arsitektur pencarian + LLM kini menjadi standar. * **LUI sebagai Benua Baru (🟢):** Antarmuka Pengguna Bahasa Alami (LUI) adalah lapisan interaksi baru yang besar, melahirkan industri agen dan protokol seperti MCP. * **Jaringan Robot dan Sistem Pengalamatan Baru (🟢):** Agen akan berkomunikasi otomatis dengan bahasa alami. Protokol seperti MCP dan ANP sedang mewujudkannya. * **Model Besar Tiongkok (🟢):** Model-model seperti DeepSeek dan Qwen telah mengejar ketertinggalan performa, meski dengan investasi lebih kecil. * **Tidak Ada Kesadaran, Tes Turing Hanya Ukur Penampilan (🟢):** AI tidak memiliki kesadaran. Tes Turing hanya mengukur ilusi kesadaran. * **Prediksi Lain yang Benar:** ChatGPT bukan AGI, tapi lompatan besar; gelombang pengangguran besar tidak terjadi; tahun besar untuk startup; momen "browser 1994" telah tiba. **Yang Kurang Tepat atau Salah:** * **Parameter GPT-4 (❌):** Prediksi 100 triliun parameter salah. Estimasi terbaru sekitar 1,8 triliun. * **Matematika di LLM (🟡):** Diagnosis bahwa matematika adalah kelemahan intrinsik dan memerlukan alat bantu benar. Namun, pernyataan "tidak mungkin" ditingkatkan terbukti salah, karena model kini bisa memenangkan medali emas Olimpiade Matematika Internasional (IMO). * **Penangkapan Nilai (🟡):** Aplikasi memang berkembang pesat, tetapi nilai terbesar justru ditangkap oleh lapisan komputasi (seperti Nvidia), bukan oleh pembuat model. * **Hak Cipta (🟡):** Konten AI sulit didaftarkan hak cipta, tetapi tidak serta-mata "menghindari" pelanggaran. Gugatan dan penyelesaian besar (misalnya, Anthropic $1,5 miliar) membuktikan risikonya. * **Biaya Model (🟡):** Prediksi "perang lokal" dengan biaya $5-10 miliar untuk model canggih terbukti salah. Biaya pelatihan model terdepan (seperti GPT-5) jauh lebih tinggi, sementara biaya kloning model terbuka justru bisa lebih murah. **Pola dan Pelajaran:** 1. **Arah dan mekanisme lebih dapat diandalkan daripada angka pasti dan pernyataan mutlak.** 2. **Cenderung terlalu optimis untuk jangka pendek (kecepatan), tetapi terlalu konservatif untuk jangka panjang (skala/dampak).** 3. **Kesalahan sering terjadi pada distribusi, bukan pada total.** Contoh: Tidak ada gelombang pengangguran masif, tetapi dampak berat dirasakan oleh lulusan baru. 4. **Pernyataan yang disertai batasan dan ruang ketidakpastian justru lebih tahan uji waktu.** 5. **Beberapa pertanyaan mendasar masih belum terjawab setelah tiga tahun.** Kesimpulannya, prediksi tentang arah besar dan mekanisme cenderung akurat, sementara prediksi spesifik tentang angka, kecepatan, dan distribusi dampak lebih sering meleset. Latihan ini lebih merupakan pelajaran dalam kerendahan hati dan penilaian yang bernuansa daripada sekadar penghitungan skor.

链捕手1j yang lalu

Tiga Tahun Kemudian: Menilik Kembali Penilaian Saya terhadap ChatGPT pada 2023

链捕手1j yang lalu

Peringatan Gelembung AI: Investasi AI Merupakan Pengembalian Negatif bagi Kebanyakan Raksasa Teknologi

Peringatan Gelembung AI: Investasi AI Membawa Pengembalian Negatif bagi Sebagian Besar Raksasa Teknologi Demam AI kini memasuki tahap pemeriksaan keuangan. Raksasa cloud seperti Microsoft, Alphabet, Amazon, Meta, dan Oracle berencana menginvestasikan ratusan miliar dolar ke pusat data AI dalam lima tahun ke depan. Namun, analisis terhadap proyeksi pendapatan dan pengeluaran modal (capex) hingga 2030 mengungkap masalah: tingkat pengembalian investasi implisit diperkirakan sangat negatif bagi semua perusahaan kecuali Amazon, bahkan dalam skenario optimis ekstrem. Ini menunjukkan bahwa jika tren saat ini berlanjut, boom AI bisa menjadi salah satu peristiwa perusakan nilai pemegang saham terbesar. Ada dua jalan keluar: pendapatan yang jauh melebihi ekspektasi saat ini, atau pengurangan rencana investasi. Jalan pertama tampaknya mustahil, karena membutuhkan tambahan pendapatan triliunan dolar. Jalan kedua—pemotongan investasi—akan berdampak luas, meruntuhkan harga saham perusahaan-perusahaan teknologi global dan dapat mendorong ekonomi AS ke resesi, mengingat 93% pertumbuhan PDB AS belakangan ini didorong oleh investasi teknologi. IPO perusahaan AI seperti OpenAI dan Anthropic tahun ini bisa menjadi mekanisme transfer risiko, memindahkan ketidakpastian dari pemilik awal kepada investor ritail dan dana pensiun. Sementara euphoria pemasaran mungkin bertahan hingga setelah IPO tahun 2026, tekanan matematika yang tak terelakkan mungkin memaksa raksasa cloud mengumumkan pemotongan investasi pada 2027 atau 2028, mirip dengan jeda tiga tahun antara peringatan "irrational exuberance" Alan Greenspan pada 1996 dan pecahnya gelembung dotcom pada 2000.

marsbit1j yang lalu

Peringatan Gelembung AI: Investasi AI Merupakan Pengembalian Negatif bagi Kebanyakan Raksasa Teknologi

marsbit1j yang lalu

Dari Token ke Tenaga Kerja Mesin: AI Sedang Berubah dari Alat Menjadi 'Pekerja'

Dari Token ke Tenaga Kerja Mesin: AI Berubah dari Alat Menjadi "Pekerja" AI mulai menulis kode, menangani tiket dukungan pelanggan, dan meninjau dokumen hukum. Artikel ini mengusulkan kerangka baru: komersialisasi AI sedang bergerak menuju "pasar tenaga kerja mesin". Dalam pasar ini, token hanyalah unit pengukuran, GPU adalah bahan baku, dan model adalah alat produksi. Objek yang benar-benar ditetapkan harganya dan diperdagangkan adalah kerja ekonomi yang diselesaikan langsung oleh perangkat lunak. Mekanisme penetapan harga AI akan berkembang dari token mentah, kemampuan model yang terstandarisasi, tenaga kerja yang terspesialisasi industri, hingga pasar hasil yang dapat diprogram. Di masa depan, perusahaan mungkin tidak lagi peduli model atau GPU mana yang menyelesaikan suatu tugas, tetapi lebih pada apakah tugas itu diselesaikan dalam batas latensi, akurasi, keandalan, dan biaya yang ditentukan. Implikasinya, dampak AI pada pasar tenaga kerja manusia tidak hanya sekadar penggantian. Saat mesin mengambil alih lebih banyak pekerjaan yang dapat distandardisasi dan diverifikasi, peran manusia mungkin bergeser ke pengawasan, penanggung jawab, manajemen konteks, dan keputusan akhir. Dalam beberapa kasus, penilaian manusia untuk 1% akhir justru menjadi lebih berharga karena dapat membuka kunci 99% otomatisasi skala besar. Pasar AI adalah pasar ekspansif. Ketika biaya kerja turun, permintaan tidak tetap. Jika interaksi dukungan pelanggan menjadi lebih murah, perusahaan dapat menawarkan layanan 24/7, menciptakan pasar interaksi pelanggan yang lebih besar. Persaingan tahap berikutnya di pasar AI mungkin bukan lagi sekadar pertarungan kemampuan model atau perang harga daya komputasi, tetapi tentang siapa yang dapat pertama kali menstandarisasi, memverifikasi, dan menetapkan harga "pekerjaan", akhirnya menjadikan tenaga kerja mesin sebagai faktor produksi baru yang dapat dibeli, diselesaikan, dan diperdagangkan.

marsbit2j yang lalu

Dari Token ke Tenaga Kerja Mesin: AI Sedang Berubah dari Alat Menjadi 'Pekerja'

marsbit2j yang lalu

Diskon 99% untuk MiMo Bukan Hanya Pemasaran! Luo Fuli Membantah Para Pengecam di X

**Ringkasan:** Xiaomi MiMo memotong harga API MiMo-V2.5 hingga **99%**, memicu spekulasi tentang perang harga atau strategi merugi. Luo Fuli, kepala MiMo, merespons dengan mempublikasikan blog teknis 5000 kata yang merinci **enam pilar teknikal** di balik potongan harga besar ini. Intinya, diskon 99% terutama untuk **Input (Cache Hit)** – bagian dimana pengguna membaca ulang konteks historis dalam percakapan panjang. Ini menjadi mungkin karena serangkaian optimasi teknikal yang mengubah biaya komputasi untuk bagian tersebut mendekati nol. **Enam Pilar Teknikal:** 1. **Arsitektur Hybrid SWA:** Menggunakan Sliding Window Attention di sebagian besar lapisan model, mengurangi volume **KVCache** (memori jangka pendek model) hingga **1/7**. 2. **Manajemen KVCache Dua Kolam:** Mengalokasikan memori secara terpisah untuk lapisan SWA dan Full Attention, benar-benar mewujudkan penghematan teoretis 1/7 dan meningkatkan jumlah pengguna yang dapat dilayani secara bersamaan. 3. **Prefix Cache yang Dioptimalkan:** Meningkatkan aturan pencocokan cache untuk arsitektur SWA, menghasilkan **tingkat keberhasilan cache 93-95%** untuk pembacaan ulang. Artinya, sebagian besar permintaan "baca ulang" tidak memerlukan komputasi GPU baru. 4. **Sistem Cache Terdistribusi GCache:** Menyimpan data cache di **SSD bawaan mesin GPU**, menghilangkan biaya penyimpanan cluster khusus dan memperpanjang masa hidup cache. 5. **Sistem Penjadwalan LLM-Router:** Mengarahkan permintaan secara cerdas berdasarkan kesamaan prefix dan panjang konteks, memprioritaskan permintaan yang menggunakan cache, meningkatkan efisiensi dan mengurangi latensi. 6. **Multi-Token Prediction (MTP):** Mengoptimalkan proses generasi output model, mempercepat pembuatan respons dan melengkapi pengurangan biaya di sisi input. **Kesimpulan:** Penurunan harga 99% bukanlah gimmick pemasaran atau strategi merugi, tetapi hasil dari **efisiensi sistemik rekayasa AI** yang telah divalidasi di lingkungan produksi. Rantai optimasi ini secara kumulatif mengurangi biaya komputasi per permintaan hingga lebih dari 95%, memungkinkan penurunan harga ekstrem sambil mempertahankan profitabilitas. Luo Fuli menekankan bahwa ini adalah masalah teknikal yang terwujud, bukan sekadar perang harga.

marsbit4j yang lalu

Diskon 99% untuk MiMo Bukan Hanya Pemasaran! Luo Fuli Membantah Para Pengecam di X

marsbit4j yang lalu

Rp 426 Triliun, "Tim Murni Tionghoa" Menopang Perusahaan Pemrograman AI dengan Valuasi Tertinggi di Dunia

Pada Mei 2025, Cognition AI, startup pengembangan AI yang didirikan oleh tiga pendiri berkebangsaan China pemenang Olimpiade Informatika, mengumumkan pendanaan baru senilai lebih dari $10 miliar, yang menaikkan valuasinya menjadi $26 miliar. Lonjakan valuasi ini, hanya dalam 8 bulan sejak valuasi $10,2 miliar sebelumnya, didorong oleh kepercayaan investor bahwa agen AI seperti "Devin" perusahaan mereka akan menjadi infrastruktur rekayasa perangkat lunak generasi berikutnya. Awalnya, Cognition menciptakan sensasi dengan meluncurkan Devin, yang dipasarkan sebagai "insinyur perangkat lunak AI" pertama yang dapat menangani tugas pengkodean secara mandiri. Namun, produk awal ini menuai kritik karena kinerja yang tidak konsisten dan harga yang tinggi. Untuk mengatasi kekurangan ini, Cognition melakukan pivoting strategis dengan mengakuisisi Windsurf, sebuah platform IDE berbasis AI, pada tahun 2025. Akuisisi ini memberi Cognition dua jalur produk: Devin untuk menangani tugas-tugas rekayasa asinkron yang dapat didelegasikan, dan Windsurf IDE sebagai alat bantu kolaboratif bagi pengembang dalam editor kode. Kombinasi ini terbukti sukses. Cognition melaporkan pertumbuhan penggunaan perusahaan lebih dari 10 kali lipat tahun ini, dengan run-rate pendapatan mencapai $492 juta dan pertumbuhan penggunaan bulanan Devin sebesar 50% selama enam bulan terakhir. Kliennya termasuk nama-nama besar seperti Goldman Sachs, NASA, dan Angkatan Darat AS. Intinya, valuasi $26 miliar ini mencerminkan keyakinan pasar bahwa Cognition, dengan strategi "dua kaki"nya, berada di posisi yang tepat untuk menangkap peluang adopsi AI berskala besar di sektor rekayasa perangkat lunak perusahaan, yang bergerak menuju sistem hybrid di mana manusia dan AI berkolaborasi.

marsbit4j yang lalu

Rp 426 Triliun, "Tim Murni Tionghoa" Menopang Perusahaan Pemrograman AI dengan Valuasi Tertinggi di Dunia

marsbit4j yang lalu

Trading

Spot
Futures

Artikel Populer

Cara Membeli PEOPLE

Selamat datang di HTX.com! Kami telah membuat pembelian ConstitutionDAO (PEOPLE) menjadi mudah dan nyaman. Ikuti panduan langkah demi langkah kami untuk memulai perjalanan kripto Anda.Langkah 1: Buat Akun HTX AndaGunakan alamat email atau nomor ponsel Anda untuk mendaftar akun gratis di HTX. Rasakan perjalanan pendaftaran yang mudah dan buka semua fitur.Dapatkan Akun SayaLangkah 2: Buka Beli Kripto, lalu Pilih Metode Pembayaran AndaKartu Kredit/Debit: Gunakan Visa atau Mastercard Anda untuk membeli ConstitutionDAO (PEOPLE) secara instan.Saldo: Gunakan dana dari saldo akun HTX Anda untuk melakukan trading dengan lancar.Pihak Ketiga: Kami telah menambahkan metode pembayaran populer seperti Google Pay dan Apple Pay untuk meningkatkan kenyamanan.P2P: Lakukan trading langsung dengan pengguna lain di HTX.Over-the-Counter (OTC): Kami menawarkan layanan yang dibuat khusus dan kurs yang kompetitif bagi para trader.Langkah 3: Simpan ConstitutionDAO (PEOPLE) AndaSetelah melakukan pembelian, simpan ConstitutionDAO (PEOPLE) di akun HTX Anda. Selain itu, Anda dapat mengirimkannya ke tempat lain melalui transfer blockchain atau menggunakannya untuk memperdagangkan mata uang kripto lainnya.Langkah 4: Lakukan trading ConstitutionDAO (PEOPLE)Lakukan trading ConstitutionDAO (PEOPLE) dengan mudah di pasar spot HTX. Cukup akses akun Anda, pilih pasangan perdagangan, jalankan trading, lalu pantau secara real-time. Kami menawarkan pengalaman yang ramah pengguna baik untuk pemula maupun trader berpengalaman.

629 Total TayanganDipublikasikan pada 2024.12.12Diperbarui pada 2025.03.21

Cara Membeli PEOPLE

Diskusi

Selamat datang di Komunitas HTX. Di sini, Anda bisa terus mendapatkan informasi terbaru tentang perkembangan platform terkini dan mendapatkan akses ke wawasan pasar profesional. Pendapat pengguna mengenai harga PEOPLE (PEOPLE) disajikan di bawah ini.

活动图片