# Artikel Terkait Inferensi

Pusat Berita HTX menyediakan artikel terbaru dan analisis mendalam mengenai "Inferensi", mencakup tren pasar, pembaruan proyek, perkembangan teknologi, dan kebijakan regulasi di industri kripto.

Kendala Daya Komputasi dalam Pertarungan AI Tiongkok-AS

Dalam persaingan AI antara AS dan Tiongkok, kendala utama yang dihadapi Tiongkok adalah kesenjangan komputasi (computing power) yang sangat besar, terutama di sektor pelatihan AI berkinerja tinggi. Chip AI domestik Tiongkok saat ini sebagian besar masih berfokus pada sisi inferensi yang relatif lebih mudah, sedangkan di puncak piramida pelatihan model besar, kehadiran chip domestik masih terbatas dan hanya mengerjakan tugas-tugas tepi. AS menguasai lebih dari 70% GPU high-end global, dengan skala komputasi 2 kali lipat lebih besar daripada Tiongkok. Raksasa teknologi seperti Meta, Google, Amazon, dan Microsoft menginvestasikan dana besar untuk infrastruktur AI, memiliki kekuatan komputasi yang masing-masing melebihi total seluruh perusahaan AI Tiongkok. Kesenjangan ini berdampak langsung pada pengembangan model besar (large models). Model AS terdepan seperti Anthropic's Mythos telah mencapai 10 triliun parameter, sedangkan model Tiongkok terkuat, DeepSeek V4 Pro, memiliki 1,6 triliun parameter. Kekurangan chip pelatihan high-end membatasi kemampuan pra-pelatihan (pre-training) yang menentukan batas atas kecakapan model. Meski demikian, kebangkitan chip GPU domestik Tiongkok mulai terlihat. Perusahaan seperti Huawei (Ascend 910), Haiguang, Cambricon, Moore Thread, dan MetaX memanfaatkan kebijakan substitusi impor. Meski masih tertinggal dalam kinerja absolut dan ekosistem perangkat lunak (seperti CUDA milik Nvidia), chip domestik mulai menunjukkan peningkatan adaptabilitas, bergerak dari terobosan di sektor inferensi menuju adaptasi bertahap di sektor pelatihan. Kolaborasi antara perusahaan AI dan produsen chip domestik telah berhasil melatih model canggih seperti GLM-Image dan RoboBrain 2.5 sepenuhnya pada perangkat keras domestik. Dengan dukungan pasar yang besar, talenta AI, dan modal yang kuat, industri chip AI Tiongkok diharapkan dapat terus berkembang, meski perjalanan mengejar ketertinggalan membutuhkan kesabaran dan strategi jangka panjang dalam persaingan teknologi yang menentukan ini.

marsbit7j yang lalu

Kendala Daya Komputasi dalam Pertarungan AI Tiongkok-AS

marsbit7j yang lalu

Mac Mubazir Bisa Hasilkan Uang? Pelajari Jaringan Inferensi AI Terdesentralisasi Darkbloom dari Eigen Labs

Darkbloom, jaringan inferensi AI terdesentralisasi yang diluncurkan oleh Eigen Labs, memungkinkan pengguna memanfaatkan Mac yang menganggur untuk menghasilkan pendapatan. Dengan memanfaatkan chip Apple Silicon yang tidak terpakai, proyek ini menciptakan jaringan komputasi yang efisien dan mengutamakan privasi. Jaringan ini terdiri dari tiga bagian: pengguna yang mengirim permintaan inferensi, koordinator yang merutekan permintaan, dan penyedia (pemilik Mac) yang menjalankan model dan mengembalikan hasil tanpa dapat melihat konten permintaan. Darkbloom dibangun dengan model privasi terverifikasi menggunakan arsitektur keamanan perangkat keras Apple, memastikan perlindungan data. Dari segi model ekonomi, Darkbloom berbeda dengan banyak proyek lain. Penyedia (host Mac) mendapatkan 100% pendapatan dari inferensi, karena biaya utama hanya berasal dari listrik, bukan perangkat keras baru. Harga dasar Darkbloom sekitar 50% lebih murah dibandingkan penyedia API agregator utama saat ini. Namun, pada tahap awal ini, pendapatan masih relatif kecil. Data peringkat menunjukkan pendapatan harian teratas di bawah $6, dan peringkat kelima bahkan di bawah $2. Pendapatan dipengaruhi oleh faktor seperti konfigurasi memori, waktu aktif, dan permintaan jaringan, yang diharapkan meningkat seiring dengan adopsi model bahasa besar dan peningkatan penggunaan pengguna nyata. Untuk berpartisipasi, pengguna memerlukan Mac dengan chip Apple Silicon, menjalankan macOS 14 atau lebih tinggi, menginstal penyedia Darkbloom, dan menjaga perangkat tetap online dengan koneksi internet stabil. Proyek ini saat ini tersedia dalam versi alpha publik di platform OpenRouter, dengan model yang didukung termasuk Gemma 4 dari Google dan GPT-OSS dari OpenAI.

marsbit10j yang lalu

Mac Mubazir Bisa Hasilkan Uang? Pelajari Jaringan Inferensi AI Terdesentralisasi Darkbloom dari Eigen Labs

marsbit10j yang lalu

CPU Kembali ke Meja Permainan, Drama "Peningkatan Posisi" Senilai 170 Miliar Dolar Dimulai

CPU Kembali ke Meja, Drama “Naik Takhta” Senilai 1700 Miliar Dolar Dimulai Pada 1 Juni, Nvidia meluncurkan Vera CPU, menandai pertama kalinya perusahaan tersebut merilis lini produk CPU independen. CEO Nvidia Jensen Huang menyatakan, di era AI Agent, CPU telah menjadi hambatan kinerja kunci di pusat data. Pasar CPU server diproyeksikan tumbuh pesat, dari sekitar 300 miliar dolar AS pada 2025 menjadi sekitar 1700 miliar dolar AS pada 2030, didorong oleh permintaan AI. Dalam beban kerja AI Agent, CPU menangani 70% atau lebih dari total pekerjaan, karena tugas-tugas seperti pemanggilan alat eksternal dan manajemen konteks sangat intensif. Rasio GPU terhadap CPU dalam penyebaran AI juga menyusut, dari 8:1 menjadi sekitar 4:1, bahkan mendekati 1:1 dalam skenario Agent tertentu. Perubahan ini telah menyebabkan peningkatan harga CPU server sebesar 10-15%, kenaikan pertama dalam lebih dari satu dekade. Nvidia, AMD, dan Intel semua berinvestasi besar-besaran di CPU. Nvidia memproyeksikan pendapatan terkait CPU mendekati 200 miliar dolar AS pada 2026. Pertumbuhan pasar ini juga membuka peluang bagi rantai pasokan CPU China, seperti Haiguang Information dan Huawei, yang diuntungkan oleh permintaan industri dan kebijakan substitusi impor. Intinya, sementara GPU tetap penting, kemampuan sinergi antara CPU dan GPU akan menjadi pembeda utama dalam penerapan AI skala besar berikutnya.

marsbit06/19 13:48

CPU Kembali ke Meja Permainan, Drama "Peningkatan Posisi" Senilai 170 Miliar Dolar Dimulai

marsbit06/19 13:48

BitTorrent Meluncurkan BTTInferGrid: Lapisan Infrastruktur Terdesentralisasi untuk Inferensi AI yang Terukur

BitTorrent meluncurkan **BTTInferGrid**, sebuah infrastruktur komputasi GPU terdesentralisasi yang dirancang khusus untuk inference AI. Platform ini menghubungkan pasokan global kapasitas GPU yang menganggur dengan permintaan yang melonjak untuk beban kerja AI. BTTInferGrid menawarkan akses terbuka, keamanan terverifikasi, dan model pembayaran pay-as-you-go bagi pengembang AI di seluruh dunia. Peluncuran ini menanggapi pergeseran kebutuhan komputasi AI dari pelatihan ke inference, yang kini menghabiskan hingga 95% biaya komputasi model bahasa besar (LLM). BTTInferGrid bertujuan memecahkan tiga masalah utama infrastruktur terpusat: alokasi sumber daya yang tidak fleksibel terhadap beban kerja yang fluktuatif, harga sewa GPU yang sangat mahal, serta ketidaksesuaian pasokan dan permintaan dengan banyaknya kapasitas komputasi yang terfragmentasi dan terisolasi. Dengan arsitektur jaringan terdesentralisasi (DePIN), BTTInferGrid memberdayakan dua sisi pasar: * **Sisi Pasokan**: Mengagregasi GPU menganggur dari berbagai sumber, memungkinkan pemiliknya memonetisasi aset mereka. * **Sisi Permintaan**: Memberikan akses mudah dan terverifikasi bagi pengembang ke layanan inference on-demand yang hemat biaya. Platform ini menawarkan tiga terobosan strategis: akses tanpa izin untuk agregasi GPU yang cepat, kualitas layanan terverifikasi dengan eksekusi *trustless*, dan ekonomi berkelanjutan yang digerakkan oleh permintaan nyata. BTTInferGrid akan diluncurkan dalam tiga fase, dimulai dari pengembangan jaringan inti (2026), diversifikasi ekosistem (2027), hingga menjadi lapisan infrastruktur AI Web3 yang matang (2028 dan seterusnya). Dibangun di atas fondasi teknologi BitTorrent dan BitTorrent File System (BTFS) yang telah teruji, BTTInferGrid bertujuan menjadi solusi komputasi AI yang terdesentralisasi, skalabel, dan efisien.

TheNewsCrypto06/18 07:35

BitTorrent Meluncurkan BTTInferGrid: Lapisan Infrastruktur Terdesentralisasi untuk Inferensi AI yang Terukur

TheNewsCrypto06/18 07:35

Laporan Bernstein: AI yang Mandiri (Agentic AI) Akan Mengubah CPU dari Figuran Menjadi Bintang Utama, Rekomendasi Beli untuk Hygon Information

Laporan riset Bernstein berpendapat bahwa era kecerdasan buatan agen (agentic AI) akan mengubah peran CPU dari pendukung menjadi protagonis di pusat data, meningkatkan permintaan CPU server secara signifikan. Analis memproyeksikan bahwa pada 2030, total pasar yang dapat dialamatkan (TAM) untuk CPU server akan mencapai $223 miliar, tumbuh 6x lipat dari $37 miliar pada 2025, dengan pertumbuhan tahunan gabungan (CAGR) 43%. Pemicu utamanya adalah pergeseran beban kerja AI dari chatbot statis ke AI agen yang melibatkan siklus penalaran kompleks (retrieval, perencanaan, pemanggilan alat). Siklus ini membutuhkan kemampuan orkestrasi dan penjadwalan yang kuat dari CPU untuk menghindari idle GPU yang mahal. Proporsi GPU:CPU dalam kluster inferensi diperkirakan akan berubah dari 8:1 (2025) menjadi 1:1 (2029). Arm dinilai sebagai penerima manfaat terbesar karena efisiensi dayanya, ditambah strategi baru mereka memproduksi chip sendiri. Di antara produsen, AMD, Intel, dan khususnya Hygon (Hai Guang) dari China mendapat peringkat positif, dengan target harga Hygon dinaikkan menjadi 450 yuan karena prospek pertumbuhan pasar x86 China. Laporan ini juga menyoroti ketidakpastian dari sisi pasokan, terutama terkait ketersediaan kapasitas foundry dan memori untuk mendukung pertumbuhan CPU yang begitu cepat, serta ketergantungan pada proyeksi permintaan AI yang sangat optimis.

marsbit06/17 09:48

Laporan Bernstein: AI yang Mandiri (Agentic AI) Akan Mengubah CPU dari Figuran Menjadi Bintang Utama, Rekomendasi Beli untuk Hygon Information

marsbit06/17 09:48

Berapa Banyak yang Didapat Perusahaan Modul Optik dari Biaya Berlangganan Claude yang Anda Bayar?

TL;DR Grafik yang memecah biaya berlangganan Claude Pro AS sekitar $20 per bulan untuk perusahaan model, komputasi awan, penyusutan GPU, listrik, dan rantai pasokan memicu diskusi ulang tentang cara menilai pendapatan aplikasi AI. Artikel ini membahas tantangan mendasar dalam menilai bisnis aplikasi AI dibandingkan SaaS tradisional. Berbeda dengan perangkat lunak konvensional yang memiliki margin tinggi karena biaya marjinal mendekati nol, setiap penggunaan model AI (inferensi) memerlukan komputasi GPU, listrik, dan sumber daya awan yang signifikan. Hal ini menciptakan ketegangan antara pendapatan langganan tetap dan biaya variabel yang bergantung pada intensitas penggunaan pengguna. Saat ini, pertumbuhan penggunaan AI lebih langsung mengalir ke infrastruktur (seperti pemasok GPU, HBM, dan pusat data) yang mendapat pendapatan lebih pasti. Perusahaan aplikasi/model perlu membuktikan bahwa mereka dapat meningkatkan efisiensi (melalui optimisasi model, caching, chip khusus) lebih cepat daripada peningkatan kompleksitas dan volume penggunaan, agar margin dapat membaik dan mendekati struktur keuntungan perusahaan perangkat lunak. Kesimpulannya, investor harus berhati-hati dalam mengasumsikan pendapatan AI setara dengan SaaS. Kunci penilaian terletak pada kemampuan perusahaan model menunjukkan peningkatan margin kotor setelah memperhitungkan semua biaya inferensi, bukan hanya pertumbuhan jumlah pelanggan berbayar.

marsbit06/17 03:46

Berapa Banyak yang Didapat Perusahaan Modul Optik dari Biaya Berlangganan Claude yang Anda Bayar?

marsbit06/17 03:46

AMD Luncurkan Host AI Kecil, Langsung Menunjuk NVIDIA DGX Spark

AMD meluncurkan Ryzen AI Halo, perangkat pengembangan AI lokal berukuran kecil yang menyaingi NVIDIA DGX Spark. Keduanya menawarkan memori terpadu 128GB untuk menjalankan model besar hingga 200B parameter. Harga AMD lebih rendah ($2,949-$3,999 vs $3,999 NVIDIA), tetapi perbedaan mendasar terletak pada pendekatan. AMD menggunakan prosesor Ryzen AI Max+ 395 (CPU Zen 5, GPU RDNA 3.5, NPU XDNA 2) dengan sistem operasi Windows/Ubuntu, menekankan fleksibilitas PC standar. NVIDIA menggunakan Grace Blackwell Superchip dengan DGX OS khusus dan kartu jaringan ConnectX-7 berkecepatan tinggi untuk skenario klaster. Dalam inferensi, kinerja mirip, tetapi NVIDIA unggul dalam pemrosesan *prompt* dan ekosistem perangkat lunak CUDA yang matang. AMD berinvestasi kuat di ekosistem melalui akuisisi ZT Systems (desain sistem) dan kemitraan besar dengan OpenAI & Meta (masing-masing 6GW). ROCm, platform perangkat lunak AMD, telah meningkat pesat dalam kemudahan penggunaan dan dukungan framework, meski masih tertinggal dari ekosistem CUDA yang sudah mapan. Strategi AMD adalah menjadi alternatif terbuka dan hemat biaya bagi pengembang yang menghindari *vendor lock-in*, sementara NVIDIA menawarkan tumpukan perangkat lunak-hardware yang terintegrasi penuh dari desktop ke data center. Ryzen AI Halo mewakili upaya AMD untuk memperluas strategi ini ke pengembang desktop, melengkapi inisiatif skala cloud mereka.

marsbit06/16 09:17

AMD Luncurkan Host AI Kecil, Langsung Menunjuk NVIDIA DGX Spark

marsbit06/16 09:17

Peta Lengkap AI Terdesentralisasi 2026: Mengapa Blockchain Adalah 'Obat' yang Tak Terelakkan untuk AI?

AI Terdesentralisasi 2026: Peta Lengkap & Mengapa Blockchain Adalah "Obat" yang Tak Terhindarkan untuk AI AI terpusat menghadapi hambatan struktural: sumber daya komputasi langka dan mahal, kendali terlalu terpusat pada beberapa perusahaan, output model tidak dapat diverifikasi, dan data pelatihan semakin sulit diperoleh karena privasi dan regulasi. Blockchain menjawab ini dengan membuka, memverifikasi, dan membuat kecerdasan terjangkau secara ekonomi. **Tumpukan Teknologi AI Terdesentralisasi:** 1. **Aplikasi & Layanan:** Didominasi oleh **Keuangan Agen** (mengubah perintah bahasa alami menjadi aksi on-chain, contoh: Giza, Infinit) dan **Pembayaran Agen** (settlement machine-to-machine, contoh: x402, Stripe). 2. **Middleware (Koordinasi):** Layer untuk menemukan, mengidentifikasi, dan mentransaksikan antar agen. Kunci termasuk standar identitas (ERC-8004), pasar agen (Virtuals), dan jaringan ekonomi mikro seperti **Bittensor** yang menggunakan token (TAO) untuk mengoordinasikan insentif secara Darwinis. 3. **Infrastruktur:** Fondasi sumber daya: * **Komputasi:** Pasar terdesentralisasi (Akash, Render, Aethir) menawarkan GPU lebih murah. * **Inferensi & Pelatihan:** Solusi untuk membuat inferensi dapat diverifikasi dan pelatihan model canggih didistribusikan (OpenGradient, PrimeIntellect, NousResearch). * **Data & Penyimpanan:** Jaringan (Filecoin, Grass) menawarkan data real-time dan penyimpanan lebih murah. * **Privasi & Verifikasi:** Teknologi (Nillion, Arcium, Oasis, EigenCloud) memastikan komputasi privat dan dapat diverifikasi. **Arah 2026-2027:** Permintaan AI tumbuh lebih cepat dari infrastruktur. Agen AI menjadi mesin pertumbuhan. Komputasi menjadi kelas aset, dengan pasar on-chain sebagai layer keuangannya. Tokenomics menjadi keunggulan struktural untuk mengoordinasikan modal, komputasi, dan data. Proyek seperti Bittensor, NEAR, dan Base menunjukkan evolusi dari narasi spekulatif ke model koordinasi baru. Namun, bidang ini masih awal, dengan adopsi tidak merata dan pendapatan sering tertinggal dari insentif token.

marsbit06/12 02:45

Peta Lengkap AI Terdesentralisasi 2026: Mengapa Blockchain Adalah 'Obat' yang Tak Terelakkan untuk AI?

marsbit06/12 02:45

Peta Jalan Lengkap AI Terdesentralisasi 2026: Mengapa Blockchain adalah 'Obat' yang Tak Terhindarkan bagi AI?

Keberadaan AI terdesentralisasi muncul karena AI terpusat memiliki hambatan struktural yang tak bisa diselesaikan hanya dengan modal dan kode: sumber daya komputasi yang langka dan mahal, kontrol yang terlalu terpusat di segelintir perusahaan, keluaran model yang tidak terverifikasi, serta kesulitan mendapatkan data pelatihan karena masalah privasi dan regulasi. Blockchain menjawab ini dengan membuat kecerdasan terbuka, terverifikasi, dan terjangkau secara ekonomi. Peta teknologi AI terdesentralisasi terdiri dari tiga lapisan. Lapisan aplikasi didominasi oleh **Keuangan Agen** (Agentic Finance), di mana agen mengubah perintah bahasa alami menjadi aksi on-chain untuk perdagangan dan yield farming, serta **Pembayaran Agen** (Agentic Payments) untuk transaksi mesin-ke-mesin otomatis. Lapisan middleware menangani koordinasi, identitas, dan reputasi agen, dengan proyek seperti Bittensor yang menggunakan ekonomi token untuk mengoordinasikan jaringan subnet AI yang kompetitif. Lapisan infrastruktur adalah tulang punggungnya, menawarkan komputasi, pelatihan, inferensi, penyimpanan data, serta lapisan privasi dan verifikasi yang terdesentralisasi — semuanya bertujuan membuat sumber daya AI lebih murah, dapat diakses, dan aman. Menuju 2026-2027, pertumbuhan AI melampaui infrastruktur, dan agen AI menjadi motor utama. Komputasi berubah menjadi kelas aset, dan ekonomi token menjadi keunggulan struktural dalam mengoordinasikan modal, komputasi, dan data. Meski masih awal dengan adopsi yang belum merata, proyek-proyek terdepan menunjukkan evolusi dari narasi spekulatif menuju model baru yang kohesif untuk kecerdasan masa depan.

Foresight News06/11 10:07

Peta Jalan Lengkap AI Terdesentralisasi 2026: Mengapa Blockchain adalah 'Obat' yang Tak Terhindarkan bagi AI?

Foresight News06/11 10:07

Ketika Inferensi Menjadi Sumber Daya Langka, Siapa yang Menguasai Nilainya

Ketika pelatihan AI memuncak, hambatan nyata bergeser ke inferensi — biaya berulang yang tumbuh seiring penggunaan. Artikel ini membahas bagaimana Nvidia dan Cerebras mengonfirmasi pergeseran ini, dengan inferensi kini menjadi pusat pertumbuhan dan kelangkaan. Melalui contoh seperti Anthropic yang berebut kapasitas dan perubahan model bisnis, penulis menunjukkan bahwa nilai ekonomi terkonsentrasi pada lapisan yang mengagregasi dan merutekan daya komputasi inferensi, bukan yang memiliki perangkat keras. Hyperbolic, sebagai agregator GPU multi-cloud tanpa aset fisik, dijelaskan sebagai contoh utama yang mendapat keuntungan dari fragmentasi pasokan dan permintaan yang meledak, sementara aplikasi seperti Venice beroperasi pada lapisan yang lebih tinggi dengan margin lebih tipis. Kesimpulannya, dalam ekonomi inferensi yang semakin langka, pemenangnya adalah entitas yang dapat mengoptimalkan alokasi dan harga sumber daya komputasi, bukan yang sekadar memilikinya.

链捕手06/08 15:44

Ketika Inferensi Menjadi Sumber Daya Langka, Siapa yang Menguasai Nilainya