# Artikel Terkait Inferensi

Pusat Berita HTX menyediakan artikel terbaru dan analisis mendalam mengenai "Inferensi", mencakup tren pasar, pembaruan proyek, perkembangan teknologi, dan kebijakan regulasi di industri kripto.

Tahun Pertama Inflasi Komputasi: Semakin Murah DeepSeek, Semakin Sulit Kenaikan Harga Ini Berhenti

Dimulai dengan paradoks: biaya inferensi AI turun 80% dalam 18 bulan, namun tiga raksasa cloud China (Alibaba Cloud, Baidu Intelligent Cloud, Tencent Cloud) justru menaikkan harga 20-30% secara bersamaan pada April 2026. Ini bukan sekadar "perang harga berakhir", melainkan permainan struktural yang dipicu oleh Paradoks Jevons: efisiensi model seperti DeepSeek-R1 membuat token lebih murah, tetapi memicu ledakan permintaan—khususnya dari Agent AI dan Reasoning Model yang mengonsumsi 10-50x lebih banyak token. Penyebab lain: DeepSeek membuka bobot model, tapi tidak membagikan rekayasa inferensi canggihnya. Cloud provider unggul dalam efisiensi inferensi (3-5x lebih cepat dari deployment mandiri), sehingga mereka menetapkan harga premium untuk keunggulan teknis tersebut. Empat raksasa bertindak berbeda: Alibaba fokus pada margin tinggi, Baidu menyaring pengguna "non-inti", Tengen mengejar ROI, sementara Volcano Engine (ByteDance) berstrategi merebut pangsa pasar dengan harga lebih rendah. Efek tak terduga: kenaikan harga justru mendorong perusahaan besar (dengan tagihan bulanan >3-5 juta RMB) untuk beralih ke solusi on-premise atau penyewa GPU alternatif. Faktor struktural—seperti lonjakan permintaan Reasoning AI, kendala pasokan GPU karena embargo AS, dan efek "price ratchet" di industri cloud—akan mempertahankan tren kenaikan harga hingga 2027-2028. Kunci bertahan? Efisiensi token: mengurangi konsumsi yang tidak perlu.

marsbitKemarin 01:22

Tahun Pertama Inflasi Komputasi: Semakin Murah DeepSeek, Semakin Sulit Kenaikan Harga Ini Berhenti

marsbitKemarin 01:22

DeepSeek yang Anda Tunggu, Sudah Berubah

Dalam 15 bulan terakhir, DeepSeek mengalami perlambatan signifikan dalam pembaruan versi besar model AI-nya, dengan DeepSeek V4 yang ditunggu-tunggu berulang kali ditunda. Menurut analisis, perlambatan ini terkait dengan beban strategis nasional untuk beralih ke komputasi otonom. Pada awal 2025, DeepSeek didorong untuk mengadopsi prosesor Huawei Ascend daripada terus mengandalkan Nvidia. Meskipun upaya adaptasi dengan chip Ascend 910C mengalami kendala teknis, DeepSeek dikabarkan terus berupaya melakukan migrasi penuh dari CUDA ke kerangka kerja CANN Huawei, dengan target mencapai substitusi seluruh rantai pelatihan dan inferensi menggunakan perangkat keras domestik. Proses adaptasi yang memakan waktu ini diduga mengalihkan sumber daya teknis yang besar, memperlambat iterasi model. Di sisi lain, DeepSeek mulai tertinggal dalam beberapa kemampuan inti. Pada awal 2026, kemampuan generasi kodenya dilaporkan telah terlampaui oleh Claude 4, dan kemampuannya dalam pemrosesan multimodal serta sistem Agent masih tertinggal di belakang OpenAI dan Google. Selain itu, perusahaan juga menghadapi tekanan dalam mempertahankan talenta inti, dengan sejumlah peneliti kunci hengkang karena tawaran yang lebih menggiurkan dari pesaing. V4 kemungkinan tidak akan menjadi model yang mendominasi performa, tetapi lebih sebagai pencapaian simbolis yang membuktikan bahwa model AI canggih China dapat berjalan pada ekosistem perangkat keras domestik. Jawaban V4 dianggap sangat penting untuk masa depan industri AI China.

marsbit2 hari yang lalu 10:35

DeepSeek yang Anda Tunggu, Sudah Berubah

marsbit2 hari yang lalu 10:35

AI Agent Mendapatkan KTP dan Dompet pada Hari yang Sama|Rewire Berita Pagi

Ringkasan Berita Teknologi Terkini: 1. **AI Agent Mendapat Identitas dan Dompet**: Sam Altman's World dan Coinbase meluncurkan integrasi verifikasi identitas dan pembayaran stablecoin untuk AI Agent dalam satu hari. World merilis AgentKit dengan autentikasi kriptografi, sementara Coinbase menghubungkan protokol pembayaran x402. Nvidia melengkapi ekosistem dengan Retail Agentic Commerce Blueprint, memungkinkan agent AI menangani proses dari pencarian hingga pembayaran. Ekonomi Agent diprediksi mencapai $3-5 triliun pada 2030. 2. **Dukungan Industri AI untuk Anthropic**: Empat asosiasi teknologi utama (didukung Google, OpenAI, Meta, dll.) membela Anthropic dalam sengketa dengan Pentagon mengenai pembatasan penggunaan AI untuk senjata otonom. Persidangan akan digelar 24 Maret. 3. **Kebijakan Fed di Tengah Perang Iran**: FOMC diperkirakan mempertahankan suku bunga 3.5%-3.75%. Konflik Iran mendorong kenaikan harga energi dan inflasi, mempengaruhi proyeksi suku bunga tahun ini. Ini menjadi konferensi pers kedua terakhir Powell sebagai ketua Fed. 4. **Nvidia Ubah Jaringan Telekomunikasi**: AI Grid architecture diluncurkan untuk mengubah infrastruktur telecom menjadi jaringan推理 terdistribusi, mengurangi biaya推理 76% dan meningkatkan efisiensi. 5. **Biaya Perang Iran Meningkat**: Operation Epic Fury menghabiskan $37 miliar dalam 100 jam pertama. Biaya total diperkirakan $40-95 miliar, berdampak pada harga pangan global. Konflik meluas ke 12 negara. **Berita Penting Lainnya**: - DLSS 5 dari Nvidia akan rilis pada 2026 dengan generasi AI grafis terbaru. - Jerman menggandakan kapasitas data center AI pada 2030 untuk kedaulatan digital. - Upvest (fintech Jerman) raised $125 juta untuk infrastruktur perbankan. - RUU crypto CLARITY Act tertunda di Senat AS. - 38% altcoin diperdagangkan di titik terendah, likuiditas terkonsentrasi di Bitcoin.

marsbit03/18 04:57

AI Agent Mendapatkan KTP dan Dompet pada Hari yang Sama|Rewire Berita Pagi

marsbit03/18 04:57

活动图片