Dalam lima bulan terakhir, pendapatan MaaS Alibaba Cloud tumbuh 15 kali lipat, ini hanyalah salah satu aspek dari transformasi Alibaba Cloud. Pada konferensi puncak, Alibaba Cloud mengumumkan telah menyelesaikan upgrade menyeluruh "chip-cloud-model-inferensi" yang ter-Agent-kan, serta meluncurkan situs web produk AI baru "Qianwen Cloud", server hypernode dengan chip AI buatan sendiri Zhenwu M890, dan model andalan terbaru Qwen3.7-Max.
Menurut Liu Weiguang, Senior Vice President Alibaba Cloud: "Kami sedang membangun pabrik AI terbesar di Tiongkok." Metafora pabrik ini mengisyaratkan logika produksi yang lengkap: chip adalah bahan baku, cloud adalah bengkel, model adalah mesin, platform inferensi adalah lini produksi, dan komoditas akhir yang dihasilkan adalah Token.
Inti dari transformasi ini adalah mengubah seluruh sistem yang dibangun selama 17 tahun terakhir yang berpusat pada "penggunaan cloud oleh manusia", menjadi sistem baru "konsumsi Token oleh Agent".
Mengapa Kartu Chip Dimainkan Sekarang
Di masa lalu, Alibaba Cloud jarang menekankan chip di acara publik. Konferensi puncak kali ini tidak hanya merilis chip AI generasi baru untuk pelatihan dan inferensi, Zhenwu M890, tetapi juga secara terbuka mempublikasikan roadmap chip untuk dua tahun ke depan, dengan dua generasi produk, Zhenwu V900 dan Zhenwu J900, diluncurkan bertahap setiap tahun.
Zhenwu M890 dilengkapi dengan memori 144GB, bandwidth interkoneksi antar chip 800GB/s, kinerjanya 3 kali lipat dari Zhenwu 810E generasi sebelumnya. Dipadukan dengan chip interkoneksi ICN Switch buatan sendiri, 128 chip AI dapat membentuk satu mesin, dengan latensi P2P ditekan hingga di bawah 150 nanodetik.
Tetapi selain parameter, informasi yang lebih krusial adalah skalanya. Seri Zhenwu telah mengirimkan total 560.000 chip, dan telah memasuki lebih dari 400 pelanggan di lebih dari 20 industri seperti telekomunikasi, FAW, dan Bank Pudong Development.
Liu Weiguang berulang kali membuat analogi dengan Google. Integrasi mendalam antara TPU Google dan Gemini memungkinkan Google mencapai rasio kinerja-harga terbaik dalam framework-nya sendiri. Alibaba Cloud tentu ingin menempuh jalan yang sama. Dia merangkum logika kompetisi dalam satu kalimat: "Jika di masa depan yang diperebutkan adalah setiap chip dapat menghasilkan Token berkualitas tinggi lebih banyak daripada pesaing, maka kita menang."
Ditambah dengan CPU Yitian, smart NIC Panmai, dan storage controller chip Zhenyue, peta chip Pingtouge telah meluas dari titik tunggal menjadi cakupan lengkap atas komputasi, jaringan, dan penyimpanan. Ketika permintaan inferensi meledak secara eksponensial, hanya dengan memegang chip di tangan sendiri, biaya marjinal setiap Token dapat dikendalikan.
Logikanya tidak rumit. Perusahaan model dapat bersaing dalam parameter, tetapi penyedia cloud pada akhirnya bersaing dalam Token mana yang lebih murah, lebih stabil, dan lebih cepat. Chip adalah titik awal perang biaya ini.
Cloud Itu Sendiri Juga Harus Ditulis Ulang
Chip menyelesaikan masalah "dapat berjalan", tetapi kebutuhan Agent terhadap cloud jauh melampaui komputasi.
Logika interaksi produk cloud tradisional dirancang untuk manusia: membuka konsol, melihat menu, mengkonfigurasi parameter, mengklik tombol. Hal ini sama sekali tidak dapat digunakan oleh Agent. Agent tidak melihat halaman web, tidak mengklik tombol, yang dibutuhkannya adalah deskripsi kemampuan terstruktur, protokol panggilan standar, dan umpan balik yang dapat diprediksi.
Li Feifei, CTO Alibaba Cloud, menggunakan serangkaian perbandingan untuk menjelaskan masalahnya: beban kerja cloud tradisional bersifat stabil, sebuah ECS mungkin berjalan selama berbulan-bulan atau bahkan bertahun-tahun; tetapi beban kerja Agent adalah "elastis tanpa pola, siklus hidup pendek, melonjak instan lalu pergi". Sebuah Agent menyelesaikan tugas, sandbox-nya akan dihancurkan, permintaan berikutnya mungkin datang dalam beberapa milidetik, atau mungkin baru datang beberapa jam kemudian.
Untuk itu, Alibaba Cloud melakukan tiga hal.
Pertama, menjadikan produk cloud ter-Skill-kan, ter-MCP-kan, dan ter-CLI-kan. Secara sederhana, mengemas setiap produk cloud menjadi antarmuka standar yang dapat dipanggil langsung oleh Agent, seperti memanggil fungsi untuk memanggil cloud.
Kedua, membangun lingkungan eksekusi khusus untuk Agent – sandbox ringan, kolaborasi multi-Agent, memori lintas tugas, jalur aliran data.
Ketiga, membangun kembali logika penjadwalan, dari "penjadwalan sumber daya" menjadi "penjadwalan tugas", karena ketika sejumlah besar Agent berjalan bersamaan secara konkuren, cara pengaturan sumber daya tradisional tidak akan mampu menahannya.
Liu Weiguang menyatakan bahwa beberapa aplikasi AI setelah diluncurkan, akan secara otomatis mengaktifkan sumber daya cloud di latar belakang – mesin virtual, instans database, lingkungan sandbox, seluruh proses tidak memerlukan intervensi manusia. Jumlah sumber daya yang diaktifkan secara otomatis oleh satu pelanggan dalam satu hari, setara dengan operasi manual selama dua minggu di masa lalu.
"Ini sudah setara dengan Agent menggunakan cloud sendiri." Liu Weiguang memberikan hubungan konversi yang dihitung internal: konsumsi Token dapat dikonversi secara proporsional menjadi penggunaan GPU, dan setiap pertumbuhan satu kartu GPU, kira-kira mendorong pertumbuhan CPU satu banding satu. Artinya, pertumbuhan pendapatan Token tidak menggerogoti pendapatan cloud tradisional, tetapi justru mendorongnya, dengan syarat platform cloud mampu menangani beban kerja Agent.
Oleh karena itu, Alibaba Cloud tidak hanya menambahkan lapisan kemampuan AI ke sistem lama, tetapi membangun ulang semua hal, mulai dari cara interaksi, logika penjadwalan, model penagihan, hingga bentuk produk.
Model Bukan untuk Mengobrol
Lapis ketiga dari transformasi menyeluruh adalah model. Qwen3.7-Max menempati peringkat pertama domestik dalam total peringkat Arena global blind test, melampaui Kimi-K2.6, DeepSeek-v4-pro, GLM-5.1. Poin penting peluncuran kali ini adalah definisi ulang Alibaba terhadap arah kemampuan model.
Zhou Jingren, Kepala Model Bahasa Besar Alibaba Tongyi, menyatakan, "Di masa lalu kami mengejar model yang 'berbicara dengan baik', sekarang kami menuntut model yang 'dapat melakukan'."
Dari praktik Alibaba Cloud di bidang chip, pada chip Zhenwu M890 yang belum pernah disentuh selama pelatihan, Qwen3.7-Max hanya dengan satu deskripsi tugas, bekerja secara mandiri dari nol selama 35 jam, secara independen menyelesaikan penulisan dan penyesuaian inti komputasi AI tingkat produksi, kinerja akhirnya meningkat 10 kali lipat dibandingkan versi resmi. Seluruh proses tanpa intervensi manusia, tanpa panduan di tengah jalan.
Ini menunjukkan kemampuan inti model dalam skenario Agent: eksekusi mandiri jarak jauh, menerima tugas, memecahkannya sendiri, merencanakan sendiri, menulis kode sendiri, men-debug sendiri, bekerja terus menerus selama 35 jam tanpa berhenti.
Untuk mendukung kebutuhan inferensi tingkat ini, platform Bailian juga melakukan upgrade yang sesuai: penjadwalan pool gabungan meningkatkan utilisasi GPU, caching konteks menghilangkan komputasi berulang, penjadwalan elastis throughput menangani puncak konkurensi.
Di bidang ekosistem, Bailian tetap terbuka untuk akses, selain matriks model Qianwen, juga telah meluncurkan model pihak ketiga seperti GLM-5.1 Zhipu, MiniMax M2.7, Kimi K2.6 Moonshot AI.
Liu Weiguang menyebutkan, "Pelanggan dalam penggunaan nyata tidak hanya menggunakan satu model, tetapi kombinasi multi-model. Kami menyediakan kombinasi, pelanggan menemukan padanan yang paling cocok untuk diri mereka sendiri di platform." Di lokasi konferensi puncak, eksekutif dari enam perusahaan model terkemuka domestik berdiri bersama di panggung, suasana terkesan seperti "aliansi AI domestik".
Dalam tiga bulan terakhir, model andalan Qianwen telah berulang kali diiterasi melalui tiga versi: 3.5, 3.6, 3.7. Ritme rilis ini sendiri menyampaikan sinyal, kompetisi kemampuan model masih jauh dari berakhir, dan Alibaba berencana membangun keunggulan jangka panjang dengan integrasi vertikal chip buatan sendiri + model buatan sendiri.
Taruhan Sebenarnya dari Transformasi Ini
Melihat kembali, logika dasar transformasi menyeluruh Alibaba Cloud kali ini sederhana dan murni. Ketika kecepatan pertumbuhan pendapatan AI jauh melampaui bisnis cloud tradisional, ketika Token berpotensi menggantikan ECS menjadi lini produk terbesar, ketika Agent mulai mengaktifkan sumber daya cloud secara otomatis dan tidak lagi memerlukan manusia untuk login ke konsol, seluruh sistem teknologi yang dirancang untuk manusia tiba pada titik yang harus diubah.
Tetapi kesulitan di tingkat eksekusi adalah hal lain. Liu Weiguang sendiri mengakui, transformasi "mudah diucapkan, sangat sulit dilakukan". Di masa lalu tim penjualan berurusan dengan departemen IT pelanggan, sekarang melakukan MaaS harus berbicara dengan departemen bisnis bahkan CEO,
"Kemampuan dialog, pengalaman hidup Anda, benar-benar persyaratan tingkat lain". Alibaba Cloud telah mendirikan penjualan MaaS khusus di pelanggan besar, dipisahkan dari penjualan IaaS tradisional, dinilai secara terpisah, beroperasi secara independen.
Indikator penilaian juga berubah, tidak hanya melihat volume panggilan, tetapi melihat "Token berkualitas tinggi", Token yang memecahkan masalah aktual, bukan Token obrolan yang mengisi. Tiga indikator inti: pertumbuhan harian jumlah pelanggan berbayar, jumlah sistem bisnis inti yang terhubung dengan model, efisiensi penyelesaian tugas tertutup secara mandiri oleh Agent.
Penyesuaian di tingkat organisasi dan mekanisme ini seringkali lebih dapat menjelaskan penilaian nyata sebuah perusahaan daripada rilis teknologi. Alibaba Cloud ingin membangun kembali struktur pendapatan, hubungan pelanggan, dan sistem penjualan. Liu Weiguang menyatakan, "Dulu ketika kami membuat cloud, anggaran IT pelanggan dapat dihitung, berapa banyak server di on-premise, dipindahkan ke cloud kira-kira berapa biayanya, soal dapat dilihat. Tetapi melakukan MaaS, jawaban soal ini tidak Anda ketahui, setelah masuk mungkin di luar imajinasi Anda."
Soal tidak terlihat, jawaban juga tidak pasti, tetapi Alibaba Cloud tetap memutuskan untuk membongkar dan menulis ulang seluruh sistem, karena satu-satunya kepastian adalah, AI adalah peluang sepuluh kali bahkan seratus kali lebih besar dari sebelumnya.
Ini mungkin informasi yang paling patut diperhatikan dari konferensi puncak ini: bukan chip mana yang memiliki komputasi lebih banyak, model mana peringkatnya ke berapa, tetapi penyedia cloud terbesar di Tiongkok, sedang dengan sikap agresif yang mendekati perusahaan rintisan, bertaruh pada masa depan yang diyakininya akan datang.(Penulis artikel ini | Zhang Shuai, Editor | Yang Lin)








