# Artikel Terkait LLM

Pusat Berita HTX menyediakan artikel terbaru dan analisis mendalam mengenai "LLM", mencakup tren pasar, pembaruan proyek, perkembangan teknologi, dan kebijakan regulasi di industri kripto.

Dapatkah Alibaba Cloud Menulis Ulang Dirinya Sendiri?

Selama lima bulan terakhir, pendapatan MaaS Alibaba Cloud tumbuh 15 kali lipat, mencerminkan upaya transformasi mendalam. Dalam sebuah puncak acara, Alibaba Cloud mengumumkan penyelesaian peningkatan tumpukan penuh "chip-cloud-model-inferensi" yang ter-Agent-kan, meluncurkan situs web produk AI baru "Qianwen Cloud", server super-node dengan chip AI in-house "Zhenwu M890", dan model flagship terbaru Qwen3.7-Max. Menurut Liu Weiguang, Wakil Presiden Senior, mereka sedang membangun "pabrik AI terbesar di Tiongkok." Logika produksinya: chip sebagai bahan baku, cloud sebagai bengkel, model sebagai mesin, platform inferensi sebagai lini perakitan, dengan Token sebagai produk akhir. Inti transformasi ini adalah mengubah sistem yang selama 17 tahun dibangun untuk "manusia menggunakan cloud" menjadi sistem baru di mana "Agent mengonsumsi Token." **Chip: Dimainkan Sekarang untuk Kontrol Biaya** Alibaba Cloud meluncurkan chip AI generasi baru Zhenwu M890 dan memaparkan peta jalan chip dua tahun. Dengan 56 juta chip yang telah dikirimkan ke lebih dari 400 pelanggan, strateginya adalah meniru Google yang mengintegrasikan TPU dengan Gemini untuk efisiensi biaya. Dalam persaingan masa depan, kemenangan akan ditentukan oleh kemampuan setiap chip menghasilkan Token berkualitas tinggi dengan biaya lebih rendah. Chip menjadi fondasi perang biaya ini. **Mengubah Cloud untuk Kebutuhan Agent** Cloud tradisional dirancang untuk interaksi manusia (konsol web, tombol). Agent membutuhkan antarmuka terstruktur, protokol standar, dan umpan balik yang dapat diprediksi. Beban kerja Agent bersifat elastis tak teratur, siklus hidup singkat, dan melonjak secara instan. Alibaba Cloud merespons dengan: 1) Mengubah produk cloud menjadi "Skill" yang dapat dipanggil Agent seperti fungsi; 2) Membangun lingkungan eksekusi khusus untuk Agent (sandbox ringan, kolaborasi multi-Agent); 3) Beralih dari penjadwalan sumber daya ke penjadwalan tugas. Dalam skenario ini, pertumbuhan pendapatan Token justru mendorong permintaan sumber daya cloud tradisional. **Model: Dari "Berbicara Baik" ke "Mampu Mengerjakan"** Qwen3.7-Max, yang berada di peringkat teratas dalam peringkat global, kini difokuskan pada kemampuan eksekusi. Contohnya, model ini berhasil menulis dan mengoptimalkan kernel komputasi AI untuk chip Zhenwu M890 dari nol dalam 35 jam tanpa intervensi manusia, meningkatkan kinerja 10x. Platform "Bailian" juga ditingkatkan untuk mendukung kebutuhan inferensi semacam ini, tetap terbuka untuk model pihak ketiga. **Taruhan Utama dan Tantangan Transformasi** Logika transformasi ini jelas saat pertumbuhan AI melampaui bisnis cloud tradisional. Namun, eksekusinya sulit. Alibaba Cloud mengubah struktur pendapatan, hubungan pelanggan (dari departemen IT ke unit bisnis/CEO), dan sistem penjualan. Metrik kunci bergeser ke "Token berkualitas tinggi" yang menyelesaikan masalah nyata, jumlah sistem bisnis inti yang terintegrasi model, dan efisiensi Agent. Meski masa depan tidak pasti, Alibaba Cloud bertaruh dengan sikap agresif layaknya startup bahwa AI adalah peluang yang jauh lebih besar. Transformasi total ini adalah pesan inti dari puncak acara mereka.

marsbit05/20 10:26

Dapatkah Alibaba Cloud Menulis Ulang Dirinya Sendiri?

marsbit05/20 10:26

Paket Token Diluncurkan: Perang 'Konsumsi Data' di Era AI, Giliran Bean (Dou Bao) untuk Bersaing Ketat

**Ringkasan: Token Menjadi "Paket Langganan" di Era AI, Operator Telekomunikasi Memulai "Perang Lalu Lintas" Baru** Di era AI, Token—unit komputasi terkecil untuk pemrosesan informasi model besar—mulai dijual layaknya paket data seluler. Operator telekomunikasi besar Tiongkok seperti China Telecom, China Mobile, dan China Unicom telah meluncurkan paket Token berlangganan bulanan. Paket pribadi termurah mulai dari 9,9 yuan (sekitar 1000 Token), sementara paket untuk perusahaan dan pengembang menawarkan komputasi bertingkat. Sistem ini memungkinkan pengguna mengakses puluhan hingga ratusan model besar (seperti Doubao, Qianwen, DeepSeek) dalam satu platform terpadu, membayar dengan tagihan telepon. **Mengapa Operator Menjual Token?** 1. **Perubahan Model Biaya**: Dari biaya komputasi/time-based ke biaya berbasis konsumsi aktual ("kecerdasan" yang digunakan). 2. **Menurunkan Ambang Teknis**: Pengembang dan UKM tidak perlu membangun model sendiri, cukup panggil API sesuai kebutuhan. 3. **Ledakan Aplikasi AI**: Maraknya Agent AI, pembuatan konten multimodal membutuhkan interaksi Token yang tinggi dan stabil. **Dua Model Pembelian:** 1. **Dari Pengembang Model Asli**: Biaya per juta Token (seperti OpenAI, DeepSeek). 2. **Paket Langganan Operator**: Biaya bulanan tetap dengan kuota Token (contoh: 9,9 yuan untuk 1000 Token). Model ini menyederhanakan pemahaman pengguna biasa dan memudahkan pergantian model. **Dampak dan Tren Masa Depan:** Dengan operator sebagai "supermarket model," loyalitas pengguna kepada satu model akan melemah. "Doubao-doubao" (perusahaan model besar) akan terdorong untuk lebih kompetitif dalam tiga hal: 1. **Rasio Efisiensi Energi**: Fokus pada kualitas Token dengan konsumsi energi lebih rendah. 2. **Persaingan Harga**: Harga akan jadi faktor kunci saat kemudahan beralih model meningkat. 3. **Pergeseran Pusat Profit**: Dari sekadar menjual API ke penyediaan solusi aplikasi AI, Agent, dan layanan bernilai tambah bagi industri. Token diprediksi akan menjadi sumber daya dasar seperti listrik atau data, yang dijual dalam berbagai bentuk (paket pribadi, paket perusahaan, bundel dengan layanan lain). Pasar "dua sisi" terbentuk: operator mengontrol akses, sementara pengembang model mengontrol kemampuan inti.

marsbit05/19 04:09

Paket Token Diluncurkan: Perang 'Konsumsi Data' di Era AI, Giliran Bean (Dou Bao) untuk Bersaing Ketat

marsbit05/19 04:09

Memahami Model Ekonomi Token Baru dalam Satu Artikel

AI Token Ekonomi: Mengubah Token Menjadi "Barang Dagangan" yang Didistribusikan Dilaporkan oleh Zhao Ying dari Wall Street News Komersialisasi aplikasi AI berkembang dari penjualan perangkat lunak dan keanggotaan menjadi penjualan kemampuan pemanggilan Token. Token, unit informasi terkecil yang diproses oleh model besar, menjadi dasar penagihan, penyelesaian, dan konsumsi API model. Dengan meningkatnya volume pemanggilan, Token mulai diperlakukan seperti "inventaris" yang dibeli, dirutekan, dibagi, dan dijual kembali. Analis Chen Liangdong dari Huayuan Securities menyoroti inti perubahan ini: "Operasi Token sedang membentuk pasar lapisan menengah baru, mengeksplorasi model distribusi Token yang menghubungkan penyedia model besar hulu dengan pengembang, perusahaan, dan individu hilir. Ini pada dasarnya adalah infrastruktur likuiditas untuk jaringan grosir hingga eceran Token global." Latar belakangnya sederhana: di satu sisi, volume pemanggilan Token di China meledak dari 100 miliar per hari di awal 2024 menjadi 140 triliun per hari pada Maret 2026. Di sisi lain, model besar domestik semakin maju, masuk dalam tier teratas global dalam beberapa peringkat dan volume pemanggilan. Dengan permintaan yang membesar dan model yang semakin banyak, hambatan transaksi beralih ke pembayaran, jaringan, antarmuka, kepatuhan, saluran, dan penerapan skenario. Model distribusi Token tidak sekadar "menjual kembali kuota API". Keuntungan tipis berasal dari selisih harga jual kembali, sementara bagian yang lebih tebal datang dari akselerasi inferensi, penyatuan antarmuka, rekayasa Prompt untuk perusahaan, penyusunan Agen, pemilihan model, dan integrasi sistem bisnis. Karena hambatan masuk yang relatif rendah, risikonya juga langsung: persaingan yang meningkat, pendanaan di muka dan piutang tak tertagih, serta perubahan kebijakan dari penyedia model hulu dapat mempersempit margin lapisan menengah. Rantai distribusi Token mencakup tiga peran utama: penyedia model hulu (seperti ByteDance, Alibaba, Zhipu), platform perantara/agen yang mengubah protokol antarmuka menjadi format API yang seragam, dan pengguna akhir yang mengonsumsi Token. Nilai lapisan menengah terletak pada pengurangan hambatan jaringan, adaptasi kode tunggal untuk banyak model, dukungan pembayaran, dan penggabungan banyak model dalam satu platform. Ledakan volume pemanggilan adalah bahan bakar langsung bisnis ini. Konsumsi harian Token China meningkat lebih dari seribu kali dalam dua tahun. Data IDC memproyeksikan jumlah agen aktif perusahaan China akan melebihi 350 juta pada 2031, dengan pertumbuhan konsumsi Token tahunan melebihi 30 kali lipat. Peningkatan kemampuan dan harga yang kompetitif dari model besar China membuka pintu untuk Token "diekspor". Data SuperCLUE menunjukkan skor model seperti Doubao dan DeepSeek telah melampaui 70, mendekati model top global seperti GPT-5.4. Pada kuartal pertama 2026, volume pemanggilan mingguan model China di OpenRouter untuk pertama kalinya melampaui model AS. Keunggulan harga model China (mis., $0.3 per juta Token input untuk MiniMax M2.5 vs $5 untuk Claude Opus 4.6) semakin memperbesar perbedaan nilai dalam skenario konsumsi tinggi seperti Agen AI. Ketidakseimbangan sumber daya AI global menciptakan permintaan untuk platform perutean dan distribusi berlapis seperti OpenRouter dan Silicon LLM, yang mengatasi batasan akses geografis, kepatuhan, dan pembayaran. Keuntungan sebenarnya tidak selalu berasal dari "selisih harga jual beli". Ada tiga cara menghasilkan uang: 1) Selisih harga jual kembali (mis., OpenRouter menambah premium ~5.5%). 2) Premi teknologi melalui akselerasi inferensi yang mengurangi biaya per Token (mis., Silicon LLM mengurangi biaya panggilan API hingga 1/10 industri). 3) Layanan nilai tambah perusahaan, mencakup rekayasa Prompt, pemilihan model multi-model, integrasi sistem, dan lainnya. Skenario yang paling mudah mengonsumsi Token saat ini adalah pemasaran, drama pendek, game, dan e-commerce, karena klien dan kebutuhan mereka sudah ada. Perusahaan di bidang ini tidak hanya menjual kembali kemampuan model, tetapi juga menyematkan Token ke dalam alur kerja produksi konten dan material klien. Namun, risikonya nyata: persaingan yang ketat karena hambatan masuk rendah, tekanan pendanaan di muka dan risiko piutang macet, serta ketergantungan pada perubahan kebijakan penyedia model hulu yang sulit dikendalikan.

marsbit05/19 02:57

Memahami Model Ekonomi Token Baru dalam Satu Artikel

marsbit05/19 02:57

AI Mirror di Balik Pendanaan DeepSeek: Ali ke Kiri, Tencent ke Kanan

DeepSeek menggelar putaran pendanaan pertamanya pada Mei, dengan target 50 miliar yuan dan valuasi 350 miliar yuan. Negosiasi melibatkan Alibaba dan Tencent, namun kedua raksasa teknologi ini memiliki pendekatan investasi AI yang sangat berbeda. Alibaba ingin kontrol ekosistem penuh, mengintegrasikan teknologi DeepSeek ke dalam produk seperti Taobao, Alibaba Cloud, dan Amap. Ini sesuai dengan strategi "loop tertutup" Alibaba yang khas. Sebaliknya, Tencent mengambil pendekatan investasi keuangan yang lebih ringan, tanpa syarat pengikatan eksklusif atau intervensi arah teknologi, hanya menginginkan hak prioritas kerja sama di area seperti asisten cerdas WeChat. Ketegangan ini mencerminkan perbedaan mendalam dalam strategi AI ketiga raksasa Tiongkok: Alibaba dengan loop tertutup dan pengembangan mandiri, Tencent dengan pendekatan ekosistem terbuka, dan ByteDance yang berfokus pada pengembangan mandiri model Doubao dengan investasi besar di sisi pengguna (C-end). Dari segi gen perusahaan: Alibaba (e-dagang, komputasi awan) cenderung kontrol penuh, sementara Tencent (media sosial, aliran lalu lintas) lebih terbuka. Basis teknologi juga berbeda: Alibaba memiliki sistem AI mandiri yang matang, Tencent dengan model Hunyuan yang terus berkembang, dan ByteDance yang mengalokasikan anggaran AI besar-besaran untuk mendominasi pintu masuk C-end. Masa depan AI menunjukkan dua jalur paralel: Alibaba akan melanjutkan dengan loop tertutup dan pengembangan mandiri penuh, sementara Tencent akan fokus pada integrasi cerdas di ekosistem WeChat dan investasi strategis di perusahaan AI eksternal. ByteDance terus berinvestasi besar-besaran di Doubao untuk memperebutkan pintu masuk C-end. Meskipun pendekatan berbeda, ketiganya bersaing di area yang sama seperti pengembangan agent AI dan multimodal. Pola persaingan multipolar ini mungkin lebih menguntungkan bagi diversifikasi teknologi dan inovasi industri secara keseluruhan.

marsbit05/18 04:46

AI Mirror di Balik Pendanaan DeepSeek: Ali ke Kiri, Tencent ke Kanan

marsbit05/18 04:46

TechFlow Intel: Saham Korea Terjun, Portofolio Trump Kuartal 1 Diumumkan

**TechFlow Intelligence: Ringkasan Berita Teknologi dan Keuangan** Berita utama hari ini menyoroti lompatan pasar saham Korea Selatan dan pengungkapan portofolio Q1 Donald Trump. Namun, berita teknologi mendominasi dengan beberapa tren kunci: **AI & Risiko:** Dunia AI dihebohkan oleh insiden AWS dimana pengguna terkena tagihan $30,000 karena pemanggilan Claude yang tak terkendali, mengingatkan pentingnya batas anggaran. Sementara itu, Anthropic merilis makalah tentang risiko AI 2028 dan valuasinya dikabarkan melampaui OpenAI. Di sisi lain, masalah keandalan muncul ketika model lokal Qwen3.6 dikabarkan menghapus file pengguna dengan perintah `rm -rf`. **Regulasi & Pendidikan:** Platform arXiv memberlakukan aturan baru: penulis yang menggunakan LLM untuk membuat kesalahan dalam paper bisa dilarang selama setahun. Di dunia pendidikan, penggunaan ChatGPT diduga menyebabkan lonjakan nilai A, memicu debat tentang keabsahan sistem penilaian. **Crypto & Chip:** Di sektor crypto, Komite Perbankan Senat AS mengesahkan rancangan undang-undang struktur pasar, sinyal positif untuk regulasi. Sementara itu, NVIDIA bersiap menaikkan harga RTX 5090 karena kenaikan biaya GDDR7, dan AS menyetujui penjualan chip H200 ke 10 perusahaan China. **Perusahaan Teknologi & Pasar Saham:** Apple dilaporkan menurunkan harga iPhone, kemungkinan terkait tekanan penjualan. Di pasar saham, NVIDIA mencapai kapitalisasi pasar $5.7 triliun, dan IPO Cerebras ("penantang NVIDIA") melonjak dua kali lipat pada hari pertama. Portofolio Trump Q1 menunjukkan pergeseran besar ke saham infrastruktur AI seperti NVIDIA dan Broadcom, sementara mengurangi saham seperti Amazon dan Meta. **Inti Utama:** AI menciptakan dua jenis "tagihan" sekaligus: tagihan tak terduga seperti di AWS dan valuasi pasar triliunan dolar di Wall Street. Teknologi ini berjalan di antara risiko kegagalan, gelembung potensial, dan upaya dunia akademik serta regulator untuk menemukan titik keseimbangan baru. Setiap berita hari ini adalah catatan dari transformasi besar ini.

marsbit05/15 11:02

TechFlow Intel: Saham Korea Terjun, Portofolio Trump Kuartal 1 Diumumkan

marsbit05/15 11:02

Berlangganan Berbayar di Pasar China, Apa yang Dipikirkan Doubao?

Doubao, asisten AI populer dari ByteDance, kini resmi meluncurkan layanan berlangganan berbayar di China dengan tiga paket: Standar (68 RMB/bulan), Pro (200 RMB/bulan), dan Premium (500 RMB/bulan). Langkah ini muncul setelah aplikasi ini mencapai 345 juta pengguna aktif bulanan dan 1,8 miliar percakapan harian. Versi gratis akan tetap tersedia untuk fungsi dasar. Artikel ini menganalisis waktu dan logika di balik keputusan ini. Pertama, model gratis telah mencapai batas efektivitasnya dalam menarik pengguna baru. Kedua, pasar China kini lebih terbuka untuk membayar layanan AI produktivitas. Harga Doubao sebanding dengan pesaing global seperti ChatGPT Plus, dengan paket Premium menargetkan pengguna profesional berat. Meski memiliki keunggulan dalam efisiensi model dan pengendalian biaya, Doubao menghadapi tantangan besar: budaya gratis yang mengakar di China mengakibatkan tingkat retensi berlangganan yang rendah, fungsi berbayarnya mudah digantikan oleh pesaing atau model open-source, dan kenaikan biaya komputasi yang mungkin tidak sebanding dengan pendapatan. Risiko perang harga dari pesaing juga mengancam. Kesimpulannya, meski mungkin sukses dalam jangka pendek berkat basis penggunanya yang besar, kesuksesan jangka panjang model berlangganan Doubao bergantung pada kemampuannya menciptakan nilai eksklusif yang membuat pengguna betah berlangganan dan menemukan model bisnis yang berkelanjutan di tengah tantangan struktural pasar China.

marsbit05/14 02:55

Berlangganan Berbayar di Pasar China, Apa yang Dipikirkan Doubao?

marsbit05/14 02:55

Tagihan AI Inference Melonjak, Shopify dan Roblox Peringatkan: Uang yang Dihasilkan dari PHK Tak Cukup Bayar Biaya Chip

Judul: Tagihan AI Meningkat Tajam, Shopify & Roblox Peringatkan: Penghematan dari PHK Tak Cukup Bayar Biaya Chip Musim laporan keuangan Q1 2026 mengungkap paradoks baru: sementara AI membantu membekukan perekrutan dan mengurangi posisi kerja, konsumsi Token dan depresiasi GPU-nya justru menggerus margin laba. Shopify mengakui biaya LLM menekan margin langganannya, sementara sekitar seperempat penurunan panduan margin tahunan Roblox langsung disebabkan oleh investasi AI tambahan. Empat raksasa teknologi (Amazon, Meta, Microsoft, Google) diproyeksikan menghabiskan $725 miliar untuk belanja modal AI tahun 2026, naik 77%. Shopify melaporkan bahwa AI kini menangani >50% penulisan kode, tetapi biaya infrastruktur cloud (termasuk penggunaan AI) meningkat $22 juta. Penggunaan asisten AI Sidekick meledak, mendorong tagihan inferensi. Sementara itu, Roblox menjalankan >400 model AI dan mengalokasikan peningkatan biaya untuk AI. Mereka berencana mengenakan biaya untuk fitur AI canggih seperti "Roblox Reality". Analis membandingkan pengeluaran besar ini dengan penghematan upah. Misalnya, penghematan dari PHK 8.000 karyawan Meta (~$2,4 miliar) hanya dapat mengimbangi sekitar 12% dari beban depresiasi AI tahun 2026. Penyelarasannya sulit: setiap $1 tekanan finansial dari pengeluaran komputasi AI membutuhkan penghematan biaya tenaga kerja hampir $10. Pemain di lapisan aplikasi seperti SaaS kini terjepit: pendapatan terkait intensitas penggunaan AI, tetapi biaya ditentukan harga model upstream. Meski biaya inferensi model tunggal turun, harga model terdepan stabil atau naik. Shopify dan Roblox merespons dengan mengikat biaya AI lebih dalam ke pengguna/platform atau membuat fitur AI premium berbayar. Kesimpulannya, mengandalkan penghematan PHK saja untuk menutupi tagihan komputasi AI secara matematis tidak mungkin.

marsbit05/11 06:58

Tagihan AI Inference Melonjak, Shopify dan Roblox Peringatkan: Uang yang Dihasilkan dari PHK Tak Cukup Bayar Biaya Chip

marsbit05/11 06:58

活动图片