Dapatkah Alibaba Cloud Menulis Ulang Dirinya Sendiri?

marsbitDipublikasikan tanggal 2026-05-20Terakhir diperbarui pada 2026-05-20

Abstrak

Selama lima bulan terakhir, pendapatan MaaS Alibaba Cloud tumbuh 15 kali lipat, mencerminkan upaya transformasi mendalam. Dalam sebuah puncak acara, Alibaba Cloud mengumumkan penyelesaian peningkatan tumpukan penuh "chip-cloud-model-inferensi" yang ter-Agent-kan, meluncurkan situs web produk AI baru "Qianwen Cloud", server super-node dengan chip AI in-house "Zhenwu M890", dan model flagship terbaru Qwen3.7-Max. Menurut Liu Weiguang, Wakil Presiden Senior, mereka sedang membangun "pabrik AI terbesar di Tiongkok." Logika produksinya: chip sebagai bahan baku, cloud sebagai bengkel, model sebagai mesin, platform inferensi sebagai lini perakitan, dengan Token sebagai produk akhir. Inti transformasi ini adalah mengubah sistem yang selama 17 tahun dibangun untuk "manusia menggunakan cloud" menjadi sistem baru di mana "Agent mengonsumsi Token." **Chip: Dimainkan Sekarang untuk Kontrol Biaya** Alibaba Cloud meluncurkan chip AI generasi baru Zhenwu M890 dan memaparkan peta jalan chip dua tahun. Dengan 56 juta chip yang telah dikirimkan ke lebih dari 400 pelanggan, strateginya adalah meniru Google yang mengintegrasikan TPU dengan Gemini untuk efisiensi biaya. Dalam persaingan masa depan, kemenangan akan ditentukan oleh kemampuan setiap chip menghasilkan Token berkualitas tinggi dengan biaya lebih rendah. Chip menjadi fondasi perang biaya ini. **Mengubah Cloud untuk Kebutuhan Agent** Cloud tradisional dirancang untuk interaksi manusia (konsol web, tombol). Agent membutuhkan antarmuka...

Dalam lima bulan terakhir, pendapatan MaaS Alibaba Cloud tumbuh 15 kali lipat, ini hanyalah salah satu aspek dari transformasi Alibaba Cloud. Pada konferensi puncak, Alibaba Cloud mengumumkan telah menyelesaikan upgrade menyeluruh "chip-cloud-model-inferensi" yang ter-Agent-kan, serta meluncurkan situs web produk AI baru "Qianwen Cloud", server hypernode dengan chip AI buatan sendiri Zhenwu M890, dan model andalan terbaru Qwen3.7-Max.

Menurut Liu Weiguang, Senior Vice President Alibaba Cloud: "Kami sedang membangun pabrik AI terbesar di Tiongkok." Metafora pabrik ini mengisyaratkan logika produksi yang lengkap: chip adalah bahan baku, cloud adalah bengkel, model adalah mesin, platform inferensi adalah lini produksi, dan komoditas akhir yang dihasilkan adalah Token.

Inti dari transformasi ini adalah mengubah seluruh sistem yang dibangun selama 17 tahun terakhir yang berpusat pada "penggunaan cloud oleh manusia", menjadi sistem baru "konsumsi Token oleh Agent".

Mengapa Kartu Chip Dimainkan Sekarang

Di masa lalu, Alibaba Cloud jarang menekankan chip di acara publik. Konferensi puncak kali ini tidak hanya merilis chip AI generasi baru untuk pelatihan dan inferensi, Zhenwu M890, tetapi juga secara terbuka mempublikasikan roadmap chip untuk dua tahun ke depan, dengan dua generasi produk, Zhenwu V900 dan Zhenwu J900, diluncurkan bertahap setiap tahun.

Zhenwu M890 dilengkapi dengan memori 144GB, bandwidth interkoneksi antar chip 800GB/s, kinerjanya 3 kali lipat dari Zhenwu 810E generasi sebelumnya. Dipadukan dengan chip interkoneksi ICN Switch buatan sendiri, 128 chip AI dapat membentuk satu mesin, dengan latensi P2P ditekan hingga di bawah 150 nanodetik.

Tetapi selain parameter, informasi yang lebih krusial adalah skalanya. Seri Zhenwu telah mengirimkan total 560.000 chip, dan telah memasuki lebih dari 400 pelanggan di lebih dari 20 industri seperti telekomunikasi, FAW, dan Bank Pudong Development.

Liu Weiguang berulang kali membuat analogi dengan Google. Integrasi mendalam antara TPU Google dan Gemini memungkinkan Google mencapai rasio kinerja-harga terbaik dalam framework-nya sendiri. Alibaba Cloud tentu ingin menempuh jalan yang sama. Dia merangkum logika kompetisi dalam satu kalimat: "Jika di masa depan yang diperebutkan adalah setiap chip dapat menghasilkan Token berkualitas tinggi lebih banyak daripada pesaing, maka kita menang."

Ditambah dengan CPU Yitian, smart NIC Panmai, dan storage controller chip Zhenyue, peta chip Pingtouge telah meluas dari titik tunggal menjadi cakupan lengkap atas komputasi, jaringan, dan penyimpanan. Ketika permintaan inferensi meledak secara eksponensial, hanya dengan memegang chip di tangan sendiri, biaya marjinal setiap Token dapat dikendalikan.

Logikanya tidak rumit. Perusahaan model dapat bersaing dalam parameter, tetapi penyedia cloud pada akhirnya bersaing dalam Token mana yang lebih murah, lebih stabil, dan lebih cepat. Chip adalah titik awal perang biaya ini.

Cloud Itu Sendiri Juga Harus Ditulis Ulang

Chip menyelesaikan masalah "dapat berjalan", tetapi kebutuhan Agent terhadap cloud jauh melampaui komputasi.

Logika interaksi produk cloud tradisional dirancang untuk manusia: membuka konsol, melihat menu, mengkonfigurasi parameter, mengklik tombol. Hal ini sama sekali tidak dapat digunakan oleh Agent. Agent tidak melihat halaman web, tidak mengklik tombol, yang dibutuhkannya adalah deskripsi kemampuan terstruktur, protokol panggilan standar, dan umpan balik yang dapat diprediksi.

Li Feifei, CTO Alibaba Cloud, menggunakan serangkaian perbandingan untuk menjelaskan masalahnya: beban kerja cloud tradisional bersifat stabil, sebuah ECS mungkin berjalan selama berbulan-bulan atau bahkan bertahun-tahun; tetapi beban kerja Agent adalah "elastis tanpa pola, siklus hidup pendek, melonjak instan lalu pergi". Sebuah Agent menyelesaikan tugas, sandbox-nya akan dihancurkan, permintaan berikutnya mungkin datang dalam beberapa milidetik, atau mungkin baru datang beberapa jam kemudian.

Untuk itu, Alibaba Cloud melakukan tiga hal.

Pertama, menjadikan produk cloud ter-Skill-kan, ter-MCP-kan, dan ter-CLI-kan. Secara sederhana, mengemas setiap produk cloud menjadi antarmuka standar yang dapat dipanggil langsung oleh Agent, seperti memanggil fungsi untuk memanggil cloud.

Kedua, membangun lingkungan eksekusi khusus untuk Agent – sandbox ringan, kolaborasi multi-Agent, memori lintas tugas, jalur aliran data.

Ketiga, membangun kembali logika penjadwalan, dari "penjadwalan sumber daya" menjadi "penjadwalan tugas", karena ketika sejumlah besar Agent berjalan bersamaan secara konkuren, cara pengaturan sumber daya tradisional tidak akan mampu menahannya.

Liu Weiguang menyatakan bahwa beberapa aplikasi AI setelah diluncurkan, akan secara otomatis mengaktifkan sumber daya cloud di latar belakang – mesin virtual, instans database, lingkungan sandbox, seluruh proses tidak memerlukan intervensi manusia. Jumlah sumber daya yang diaktifkan secara otomatis oleh satu pelanggan dalam satu hari, setara dengan operasi manual selama dua minggu di masa lalu.

"Ini sudah setara dengan Agent menggunakan cloud sendiri." Liu Weiguang memberikan hubungan konversi yang dihitung internal: konsumsi Token dapat dikonversi secara proporsional menjadi penggunaan GPU, dan setiap pertumbuhan satu kartu GPU, kira-kira mendorong pertumbuhan CPU satu banding satu. Artinya, pertumbuhan pendapatan Token tidak menggerogoti pendapatan cloud tradisional, tetapi justru mendorongnya, dengan syarat platform cloud mampu menangani beban kerja Agent.

Oleh karena itu, Alibaba Cloud tidak hanya menambahkan lapisan kemampuan AI ke sistem lama, tetapi membangun ulang semua hal, mulai dari cara interaksi, logika penjadwalan, model penagihan, hingga bentuk produk.

Model Bukan untuk Mengobrol

Lapis ketiga dari transformasi menyeluruh adalah model. Qwen3.7-Max menempati peringkat pertama domestik dalam total peringkat Arena global blind test, melampaui Kimi-K2.6, DeepSeek-v4-pro, GLM-5.1. Poin penting peluncuran kali ini adalah definisi ulang Alibaba terhadap arah kemampuan model.

Zhou Jingren, Kepala Model Bahasa Besar Alibaba Tongyi, menyatakan, "Di masa lalu kami mengejar model yang 'berbicara dengan baik', sekarang kami menuntut model yang 'dapat melakukan'."

Dari praktik Alibaba Cloud di bidang chip, pada chip Zhenwu M890 yang belum pernah disentuh selama pelatihan, Qwen3.7-Max hanya dengan satu deskripsi tugas, bekerja secara mandiri dari nol selama 35 jam, secara independen menyelesaikan penulisan dan penyesuaian inti komputasi AI tingkat produksi, kinerja akhirnya meningkat 10 kali lipat dibandingkan versi resmi. Seluruh proses tanpa intervensi manusia, tanpa panduan di tengah jalan.

Ini menunjukkan kemampuan inti model dalam skenario Agent: eksekusi mandiri jarak jauh, menerima tugas, memecahkannya sendiri, merencanakan sendiri, menulis kode sendiri, men-debug sendiri, bekerja terus menerus selama 35 jam tanpa berhenti.

Untuk mendukung kebutuhan inferensi tingkat ini, platform Bailian juga melakukan upgrade yang sesuai: penjadwalan pool gabungan meningkatkan utilisasi GPU, caching konteks menghilangkan komputasi berulang, penjadwalan elastis throughput menangani puncak konkurensi.

Di bidang ekosistem, Bailian tetap terbuka untuk akses, selain matriks model Qianwen, juga telah meluncurkan model pihak ketiga seperti GLM-5.1 Zhipu, MiniMax M2.7, Kimi K2.6 Moonshot AI.

Liu Weiguang menyebutkan, "Pelanggan dalam penggunaan nyata tidak hanya menggunakan satu model, tetapi kombinasi multi-model. Kami menyediakan kombinasi, pelanggan menemukan padanan yang paling cocok untuk diri mereka sendiri di platform." Di lokasi konferensi puncak, eksekutif dari enam perusahaan model terkemuka domestik berdiri bersama di panggung, suasana terkesan seperti "aliansi AI domestik".

Dalam tiga bulan terakhir, model andalan Qianwen telah berulang kali diiterasi melalui tiga versi: 3.5, 3.6, 3.7. Ritme rilis ini sendiri menyampaikan sinyal, kompetisi kemampuan model masih jauh dari berakhir, dan Alibaba berencana membangun keunggulan jangka panjang dengan integrasi vertikal chip buatan sendiri + model buatan sendiri.

Taruhan Sebenarnya dari Transformasi Ini

Melihat kembali, logika dasar transformasi menyeluruh Alibaba Cloud kali ini sederhana dan murni. Ketika kecepatan pertumbuhan pendapatan AI jauh melampaui bisnis cloud tradisional, ketika Token berpotensi menggantikan ECS menjadi lini produk terbesar, ketika Agent mulai mengaktifkan sumber daya cloud secara otomatis dan tidak lagi memerlukan manusia untuk login ke konsol, seluruh sistem teknologi yang dirancang untuk manusia tiba pada titik yang harus diubah.

Tetapi kesulitan di tingkat eksekusi adalah hal lain. Liu Weiguang sendiri mengakui, transformasi "mudah diucapkan, sangat sulit dilakukan". Di masa lalu tim penjualan berurusan dengan departemen IT pelanggan, sekarang melakukan MaaS harus berbicara dengan departemen bisnis bahkan CEO,

"Kemampuan dialog, pengalaman hidup Anda, benar-benar persyaratan tingkat lain". Alibaba Cloud telah mendirikan penjualan MaaS khusus di pelanggan besar, dipisahkan dari penjualan IaaS tradisional, dinilai secara terpisah, beroperasi secara independen.

Indikator penilaian juga berubah, tidak hanya melihat volume panggilan, tetapi melihat "Token berkualitas tinggi", Token yang memecahkan masalah aktual, bukan Token obrolan yang mengisi. Tiga indikator inti: pertumbuhan harian jumlah pelanggan berbayar, jumlah sistem bisnis inti yang terhubung dengan model, efisiensi penyelesaian tugas tertutup secara mandiri oleh Agent.

Penyesuaian di tingkat organisasi dan mekanisme ini seringkali lebih dapat menjelaskan penilaian nyata sebuah perusahaan daripada rilis teknologi. Alibaba Cloud ingin membangun kembali struktur pendapatan, hubungan pelanggan, dan sistem penjualan. Liu Weiguang menyatakan, "Dulu ketika kami membuat cloud, anggaran IT pelanggan dapat dihitung, berapa banyak server di on-premise, dipindahkan ke cloud kira-kira berapa biayanya, soal dapat dilihat. Tetapi melakukan MaaS, jawaban soal ini tidak Anda ketahui, setelah masuk mungkin di luar imajinasi Anda."

Soal tidak terlihat, jawaban juga tidak pasti, tetapi Alibaba Cloud tetap memutuskan untuk membongkar dan menulis ulang seluruh sistem, karena satu-satunya kepastian adalah, AI adalah peluang sepuluh kali bahkan seratus kali lebih besar dari sebelumnya.

Ini mungkin informasi yang paling patut diperhatikan dari konferensi puncak ini: bukan chip mana yang memiliki komputasi lebih banyak, model mana peringkatnya ke berapa, tetapi penyedia cloud terbesar di Tiongkok, sedang dengan sikap agresif yang mendekati perusahaan rintisan, bertaruh pada masa depan yang diyakininya akan datang.(Penulis artikel ini | Zhang Shuai, Editor | Yang Lin)

Pertanyaan Terkait

QBagaimana pendapatan MaaS Alibaba Cloud berubah dalam lima bulan terakhir dan apa artinya?

APendapatan MaaS (Model-as-a-Service) Alibaba Cloud telah meningkat 15 kali lipat dalam lima bulan terakhir. Ini menunjukkan sisi transformasi dan rekonstruksi mendalam yang sedang dilakukan Alibaba Cloud, dari infrastruktur cloud tradisional ke sistem yang berpusat pada AI dan Agen.

QApa inti dari rekonstruksi total yang dilakukan Alibaba Cloud menurut artikel ini?

AInti rekonstruksi adalah mengubah seluruh sistem yang dibangun selama 17 tahun terakhir yang berpusat pada 'manusia menggunakan cloud', menjadi sistem baru yang berpusat pada 'Agen yang mengkonsumsi Token'. Ini melibatkan upgrade penuh tumpukan 'chip-cloud-model-inferensi' yang ter-Agent-kan.

QMengapa Alibaba Cloud kini sangat menekankan chip buatannya sendiri, seperti Zhenwu M890?

AAlibaba Cloud menekankan chip untuk mengendalikan biaya marjinal setiap Token. Dalam persaingan cloud AI masa depan, kemenangan ditentukan oleh siapa yang bisa menghasilkan Token berkualitas tinggi dengan biaya lebih murah, lebih stabil, dan lebih cepat per chipnya. Chip adalah titik awal pertempuran biaya ini.

QApa saja perubahan utama yang diperlukan pada platform cloud itu sendiri untuk mendukung Agen AI?

APerubahan utama meliputi: 1) Skillisasi, MCPisasi, dan CLIisasi produk cloud menjadi antarmuka standar untuk Agen. 2) Membangun lingkungan eksekusi khusus Agen (sandbox ringan, kolaborasi multi-Agen, memori lintas tugas). 3) Mengubah logika penjadwalan dari 'penjadwalan sumber daya' menjadi 'penjadwalan tugas' untuk menangani beban kerja Agen yang elastis dan sesaat.

QBagaimana fokus kemampuan model AI Alibaba Cloud, Qwen, telah berubah menurut artikel?

AFokus telah bergeser dari mengejar model yang 'berbicara dengan baik' (chat) menjadi model yang 'dapat melakukan' (execute). Contohnya adalah Qwen3.7-Max yang secara mandiri menulis dan mengoptimalkan kernel komputasi AI untuk chip Zhenwu M890 selama 35 jam tanpa intervensi manusia, meningkatkan performa 10x. Ini menekankan kemampuan eksekusi otonom jarak jauh untuk skenario Agen.

Bacaan Terkait

Bagaimana Mendefinisikan 'Saham AS Nyata': Perbedaan antara Token On-Chain, Kontrak Harga, dan Koneksi Langsung Broker

Pada tahun 2026, membeli saham AS dengan stablecoin seperti USDT telah menjadi tren utama. Namun, di balik klaim serupa, pasar menawarkan tiga jenis produk yang sangat berbeda dalam hal aset yang sebenarnya diperdagangkan, struktur hak, dan risiko: 1. **Saham Ter-Tokenisasi (Tokenized Stocks):** Aset digital di blockchain yang merepresentasikan eksposur ekonomi terhadap saham. Memungkinkan penggunaan di ekosistem DeFi dan perdagangan 24/7, tetapi hak kepemilikan saham sebenarnya tetap berada pada penerbit, dengan hak dividen dan suara yang sangat terbatas. 2. **Kontrak Masa Depan Saham (Stock Futures/Perpetuals):** Kontrak derivatif yang melacak harga saham. Sangat likuid dan memungkinkan perdagangan leverage dua arah 24/7, tetapi tidak memberikan hak kepemilikan atas saham sama sekali. Biaya pendanaan (*funding fee*) dapat menjadi beban biaya yang signifikan untuk posisi jangka panjang. 3. **Model Koneksi Langsung Broker (Brokerage Model):** Satu-satunya jalur yang memungkinkan pembelian saham AS secara nyata melalui broker berlisensi. Aset diselesaikan dan disimpan dalam sistem kliring dan penitipan AS (seperti DTCC). Memberikan hak pemegang saham penuh (dividen tunai, hak suara), struktur biaya jangka panjang yang bersih (tanpa *funding fee*), dan cakupan instrumen yang sangat luas (ribuan saham & ETF). Beberapa platform dalam model ini mendukung pendanaan via stablecoin, mengurangi ketergantungan pada transfer bank tradisional. Penting untuk dicatat bahwa dalam model broker, arsitektur perantara yang digunakan (misalnya, *Fully-Disclosed* vs. *Omnibus Introducing Broker*) memengaruhi bagaimana aset klien diidentifikasi dan bagaimana perlindungan seperti SIPC diteruskan. Oleh karena itu, bagi pengguna yang menginginkan kepemilikan saham yang sebenarnya dengan hak penuh, model koneksi langsung broker menawarkan keunggulan paling langsung, asalkan infrastruktur kepatuhan dan kliring dasarnya transparan dan dapat diverifikasi.

marsbit48m yang lalu

Bagaimana Mendefinisikan 'Saham AS Nyata': Perbedaan antara Token On-Chain, Kontrak Harga, dan Koneksi Langsung Broker

marsbit48m yang lalu

Nvidia Meluncurkan Platform DSX, Terus Melangkah ke Infrastruktur Pabrik AI

NVIDIA meluncurkan platform NVIDIA DSX, memperluas bisnisnya ke infrastruktur pabrik AI. Platform ini menawarkan solusi lengkap mulai dari desain, simulasi, penyebaran, hingga manajemen operasional, beralih dari fokus sebelumnya pada penjualan GPU semata. Dengan kompleksitas model AI yang meningkat, tantangan pusat data kini meliputi pasokan listrik, pendinginan, penjadwalan sumber daya, dan efisiensi operasional menyeluruh. NVIDIA meyakini bahwa efisiensi infrastruktur—cara menghasilkan lebih banyak daya komputasi dan layanan cerdas dengan listrik, ruang, dan sumber daya terbatas—akan menjadi indikator kunci kompetisi di masa depan. Platform DSX mengintegrasikan chip, sistem, perangkat lunak, arsitektur referensi, dan teknologi mitra NVIDIA. Platform ini mencakup perangkat lunak utama seperti DSX MaxLPS untuk optimalisasi daya dengan pendinginan cair, dan DSX OS, platform perangkat lunak sumber terbuka untuk operasional pabrik AI. Komponen lain meliputi DSX Reference Design, DSX Sim untuk simulasi digital twin, DSX Flex untuk penyesuaian beban kerja dinamis berdasarkan jaringan listrik, dan DSX Exchange untuk kolaborasi data. Beberapa penyedia layanan cloud seperti CoreWeave dan Lambda telah mulai menggunakan komponen inti DSX. Dari sisi perangkat keras, perusahaan seperti Dell, HPE, Lenovo, dan Supermicro sedang mengembangkan sistem yang kompatibel dengan DSX. DSX Flex juga telah menjalani proyek percontohan komersial dengan perusahaan energi. Secara strategis, DSX menandai transformasi NVIDIA dari pemasok chip AI menjadi penyedia platform infrastruktur AI yang menyeluruh, bertujuan membangun standar industri dan memperkuat kepemimpinannya di pasar global.

marsbit55m yang lalu

Nvidia Meluncurkan Platform DSX, Terus Melangkah ke Infrastruktur Pabrik AI

marsbit55m yang lalu

Sembilan Tahun Saya Menjadi VC di Web3: Dana Asia Sedang Menjalani 'Mode Neraka'

Penulis asli: Joe Zhou, Foresight News Banyak Crypto VC Asia telah menghilang. Pada tahun 2025, pasar Web3 mendingin drastis, dengan sangat sedikit VC yang tetap aktif dan berinvestasi secara konsisten. Jocy, pendiri IOSG yang telah sembilan tahun menjadi VC di Web3 dan melewati tiga siklus bear/bull, menjelaskan bahwa logika investasi Crypto VC telah berubah total. IOSG kini menyesuaikan portofolionya menjadi 50% pasar primer, 30% post-TGE, dan 20% OTC untuk manajemen likuiditas dan jalur exit DPI yang lebih baik bagi LP. VC Asia sedang mengalami "mode neraka" karena pasar pendanaan yang sangat sulit, memaksa mereka untuk lebih tepat sasaran dan hanya berfokus pada proyek top. Di sisi lain, ini adalah peluang bagi dana yang digerakkan oleh riset mendalam. Masalah terbesar industri Crypto adalah seringnya token terlepas dari nilai sebenarnya. Tren baru mendorong keterikatan yang jelas antara token dan nilai protokol, seperti yang dilakukan Uniswap, Hyperliquid, dan Morpho (investasi IOSG), dengan mekanisme seperti pembelian kembali token untuk menciptakan aset dasar yang bernilai. Logika investasi sekarang harus kembali ke bisnis itu sendiri – menganalisis metrik nyata seperti retensi pengguna, pendapatan, dan arus kas. IOSG memusatkan tembakan pada dua area: infrastruktur keuangan dengan pendapatan nyata (mis., stablecoin, pinjaman) dan persimpangan AI-Crypto (infrastruktur AI asli crypto). Perasaan utama Jocy adalah bahwa perusahaan-perusahaan hebat sering lahir justru di saat-saat paling pesimis dalam industri. Saat gelembung pecah, orang-orang yang bertahan akan membentuk masa depan.

marsbit1j yang lalu

Sembilan Tahun Saya Menjadi VC di Web3: Dana Asia Sedang Menjalani 'Mode Neraka'

marsbit1j yang lalu

Trading

Spot
Futures
活动图片