Beberapa waktu lalu, Google mengumumkan mulai menjual chip TPU buatan sendiri, serta perangkat keras komputasi AI pendukungnya, langsung ke pusat data pihak ketiga dan pelanggan. Sebagai 'senjata rahasia' Google di bidang AI, sebelumnya pihak ketiga hanya bisa menyewa TPU melalui pusat data cloud. Industri juga sempat mengira Google tidak akan menjual chip-chip ini ke pihak luar, namun tak diduga datang kabar baik ini di bulan Juni tahun ini.
Lalu pertanyaannya, apa itu 'TPU'? Nama lengkapnya adalah 'Tensor Processing Unit (Unit Pemrosesan Tensor)'. Berbeda dengan CPU dan GPU, chip ini dirancang khusus untuk 'operasi matematika matriks dan tensor' dalam komputasi AI, yang mampu menangani perhitungan terkait dengan efisiensi sangat tinggi.
Kedengarannya seperti chip pendukung? Namun kenyataannya tidak demikian, karena teknologi model AI besar saat ini pada dasarnya adalah operasi matematika kompleks (terutama perkalian matriks) terhadap data dalam jumlah masif. Jadi Google melakukan satu hal, yaitu menggabungkan ribuan TPU menjadi kluster superkomputer, lalu menggunakan host CPU untuk mengatur (membongkar tugas, mengonversi data), menciptakan pusat komputasi AI dengan efisiensi sangat tinggi.

Sumber gambar: Google
Inilah mengapa Gemini mampu dengan biaya berlangganan lebih rendah dan kuota penggunaan lebih tinggi, merebut pasar pengguna dari perusahaan seperti OpenAI. Bahkan jika dilihat hanya dari harga token, Gemini adalah salah satu perwakilan produk AI luar negeri dengan harga model unggulan yang relatif rendah, dan harga model mainstream mendekati perusahaan produsen model domestik seperti DeepSeek.
Selain itu, TPU juga lebih mahir menangani permintaan komputasi massal pengguna sehari-hari, sangat 'cocok' dengan ekosistem AI masa depan, sehingga sebenarnya dunia luar sudah lama menginginkan chip ini. Setelah mengumumkan rencana penjualan, Google juga mengumumkan perjanjian senilai 50 miliar dolar AS, akan membangun pusat komputasi besar bersama perusahaan ekuitas swasta terkenal Blackstone, dengan kapasitas sementara 500 megawatt.
Lei Keji (ID: leitech) menduga, setelah kabar ini tersiar, banyak perusahaan yang mungkin menanyakan harga atau bekerja sama dengan Google, terutama perusahaan yang ingin membangun pusat komputasi sendiri. Saat ini mungkin ada yang berpikir, Amazon pasti khawatir, karena ini jelas-jelas merebut bisnis layanan cloud. Sebenarnya tidak, yang paling pusing sekarang mungkin adalah NVIDIA.
Google Menyerang NVIDIA dengan 'Menguras Dasar Perahu'?
Pertama-tama, Lei kecil ingin bertanya: Mengapa NVIDIA bisa menjadi salah satu perusahaan terpenting di era AI? Jika jawaban Anda hanya 'komputasi GPU kuat', itu baru setengah benar.
Kehebatan sebenarnya NVIDIA adalah ia sudah lama tidak hanya menjual GPU. CUDA, NVLink, DGX, jaringan InfiniBand, pustaka perangkat lunak AI, ekosistem pengembang, mitra server, adaptasi penyedia cloud, semua ini bersama-sama membentuk parit pertahanan NVIDIA.
Jadi, ketika Anda membeli kartu komputasi NVIDIA dan menyalakannya, yang Anda beli bukan hanya sebuah kartu, tetapi satu set ekosistem AI yang telah divalidasi industri. Bagi kebanyakan perusahaan, ekosistem CUDA NVIDIA membuat mereka tidak perlu 'membuat roda ulang', sehingga menghemat banyak tenaga dan biaya.
Inilah mengapa banyak perusahaan AI meskipun tahu GPU NVIDIA mahal, tetap harus menggunakannya. Karena di masa ledakan AI, 'biaya' dapat diabaikan, satu-satunya indikator adalah apakah bisa memimpin pesaing atau mengejar pesaing lebih cepat. Namun, seiring model AI besar memasuki fase penyebaran, yang diinginkan bukan lagi hanya 'kecepatan'. Menghadapi basis pengguna yang besar, efisiensi dan rasio harga-kinerja menjadi fokus baru.
Google jelas juga melihat hal ini, sehingga mereka memasang taruhan pada TPU, dan mengemasnya menjadi paket lengkap. Chip dalam paket ini bukan untuk mengalahkan NVIDIA dalam kinerja komputasi, tetapi untuk mengemas pengalaman Google selama bertahun-tahun dalam chip, pusat data, jaringan, penyimpanan, penjadwalan, dan pelatihan model, menjadi kemampuan layanan cloud yang dapat langsung dibeli perusahaan.
Inilah yang benar-benar 'dipelajari Google dari NVIDIA', bukan belajar menjual chip, tetapi belajar menjual sistem dan ekosistem, mengubah serangkaian perangkat keras menjadi 'produktivitas' yang dapat digunakan pelanggan. Ini memiliki daya tarik yang tidak kecil bagi perusahaan yang ingin mengendalikan pusat komputasi di tangan mereka sendiri.
Lalu, apakah NVIDIA panik? Tidak perlu sampai begitu, tetapi memang pusing, karena meskipun kartu komputasi unggulan menghasilkan uang, perusahaan tidak mungkin terus berada dalam keadaan 'beli sebanyak yang ada', tetapi akan secara bertahap mengalihkan pandangan ke chip lain yang lebih hemat biaya. Saat itu, solusi TPU Google pasti akan berdampak pada pasar NVIDIA ini.
Namun untuk seluruh industri AI, saat ini NVIDIA masih menjadi standar universal yang paling diakui di pasar komputasi AI, posisi ekosistem CUDA juga tidak mudah digoyahkan oleh satu atau dua generasi chip. Terutama di bagian pelatihan model besar, banyak tim telah mengumpulkan banyak pengalaman di sekitar sistem NVIDIA, beralih platform secara gegabah risikonya tidak rendah.
Misalnya DeepSeek, model baru yang diluncurkan beberapa waktu lalu mengumumkan dapat dilatih menggunakan chip Huawei Ascend, dan ini terjadi setelah kerja sama mendalam Huawei dengan DeepSeek, setelah beberapa versi iterasi.

Sumber gambar: Ascend
Namun dari sudut pandang Google, sebenarnya tidak perlu menggantikan NVIDIA di semua skenario, asalkan bisa menangkap sebagian pelanggan perusahaan, lalu membuktikan efisiensinya lebih tinggi dari ekosistem komputasi lain, maka Google sudah bisa mengambil sepotong kue dari pasar infrastruktur AI.
Terutama di fase inferensi, server komputasi TPU Google jelas lebih unggul. Semua orang tahu, token benar-benar digunakan, kecepatan konsumsinya tidak kalah dengan membuka pintu air. Ada Uber menghabiskan anggaran setahun dalam empat bulan, perusahaan misterius menghabiskan biaya token 500 juta dolar AS dalam satu bulan, kemudian ada Microsoft yang kaya raya membatasi hak akses karyawan, memerintahkan mereka menggunakan komputasi sendiri.
Dapat dikatakan, seiring frekuensi penggunaan AI di berbagai bidang semakin tinggi, pasti akan ada lebih banyak kasus membuktikan bahwa biaya token adalah kunci persaingan AI di masa depan. Karena siapa yang biaya tokennya lebih rendah, dia bisa menyebarkan AI ke lebih banyak lini bisnis, untuk merebut pengguna dan pasar.
Komputasi Menjadi Sumber Daya Dasar, Kesempatan Penyedia Cloud Datang
Lei kecil merasa ada perumpamaan netizen yang sangat tepat: Melatih model seperti membeli mobil, sedangkan layanan inferensi seperti bensin yang harus dibakar setiap hari. Sekalipun orang kaya, tidak bisa setiap hari membakar semua mobil dengan bensin 98; Komputasi yang disediakan Google seperti bensin 92, meski tenaganya agak kurang, tapi mobil tetap jalan, pekerjaan tetap selesai, dan lebih murah.
Beberapa waktu lalu, Lei kecil pernah menulis artikel, menyebutkan bahwa sekarang industri memiliki konsensus: Komputasi AI semakin menjadi seperti sumber daya dasar seperti listrik, air, bandwidth.
Dan bagi pengguna, pengguna tidak perlu tahu bagaimana 'komputasi' diproduksi, tetapi akan peduli dengan harga komputasi seperti peduli biaya listrik dan air, 'pengguna' ini bisa individu, bisa perusahaan, kota, bahkan negara.
Jadi, di pasar AI masa depan, NVIDIA tetap akan penting, karena tanpa chip kinerja tinggi, segalanya tidak mungkin dimulai. Namun ketika kebutuhan komputasi menjadi sumber daya dasar yang jangka panjang, stabil, dan berskala, hak suara justru akan secara bertahap beralih ke penyedia layanan cloud.
Inilah mengapa Google, Microsoft, Amazon, Alibaba Cloud, Huawei Cloud, penyedia cloud ini tidak lagi puas hanya menjadi 'pengecer ulang' komputasi GPU NVIDIA, tetapi semuanya sedang membangun ekosistem komputasi sendiri. Ini tentu bukan berarti mereka tidak akan terus membeli GPU NVIDIA, karena pasar membutuhkan, pelanggan juga membutuhkan, juga bisa dijual dengan harga bagus.

Sumber gambar: Lei Keji
Tapi di saat yang sama, fokus perkembangan sebenarnya mereka pasti akan beralih ke ekosistem mereka sendiri, ini juga yang paling perlu diwaspadai NVIDIA. Lagi pula, kapitalisasi pasar NVIDIA saat ini, sebagian besar dihitung dengan premis sebagai 'dasar AI'. Begitu NVIDIA kehilangan kendali atas pasar kartu komputasi non-unggulan, maka mungkin secara bertahap kembali ke posisi 5 tahun lalu di pasar kartu grafis game: Meski teratas, tapi bukan tidak bisa digantikan.
Faktanya, jika kita menarik perspektif kembali ke dalam negeri, perubahan serupa sudah muncul. Dulu ketika kita membicarakan kartu komputasi AI domestik, seringkali fokus pada perbandingan kinerja komputasi, membahas seberapa jauh kinerja per kartu dari kartu komputasi unggulan.
Masalah ini tentu penting, tetapi jika hanya fokus pada kinerja chip itu sendiri, akan mengabaikan kunci lain: Penyedia cloud domestik juga sedang mengubah chip, kluster, platform cloud, layanan model, dan solusi industri menjadi sistem produksi AI yang lengkap, dan inilah daya saing inti AI domestik.
Ini bukan kata Lei kecil, tetapi yang dilakukan oleh penyedia layanan cloud inti seperti Huawei Cloud, Alibaba Cloud, dll. Misalnya layanan cloud Ascend Huawei, meski yang sering viral masih chip Ascend, tapi Huawei sekarang sudah menyediakan rantai alat tercloud, kluster super node, migrasi model, optimasi pelatihan inferensi, dan kemampuan implementasi industri di sekitar komputasi Ascend.

Sumber gambar: Weibo
Dan, Huawei juga sedang mendorong ekosistem komputasi ini ke lebih banyak perusahaan AI domestik, selain DeepSeek yang disebut sebelumnya, ada juga Baidu, iFLYTEK, Zhipu, MiniMax, dan perusahaan AI besar terkemuka lainnya. Dapat dikatakan, Huawei sudah secara bertahap membangun ekosistem komputasinya sendiri, selanjutnya yang harus dilakukan adalah membawa lebih banyak mitra naik, lalu dengan harga token lebih rendah merebut pasar.
Alibaba Cloud juga begitu, mereka merilis chip AI pelatihan-inferensi terintegrasi Zhenwu M890 pada Mei tahun ini, dan sebelumnya, Zhenwu 810E juga sudah lama disebar dalam skala besar ke platform komputasi cerdas Lingjun Alibaba Cloud. Di puncak Alibaba Cloud tahun ini, Alibaba Cloud juga langsung mengumumkan total penjualan chip AI seri Zhenwu Pingtouge telah mencapai 560.000 lembar, skala pendapatan tahunan melampaui level 10 miliar.
Dapat dikatakan, dalam hal belajar dari NVIDIA, penyedia layanan cloud domestik tidak hanya berjalan lebih cepat, tetapi juga lebih awal.
Komputasi Terkuat? Tidak, Dunia Membutuhkan 'Komputasi Optimal'
Tentu, NVIDIA tidak akan tiba-tiba kehilangan posisi inti di era AI hanya karena Google mulai menjual TPU.
Setidaknya untuk waktu yang lama, GPU, CUDA, dan ekosistem pengembang, masih akan menjadi standar yang tidak bisa dihindari seluruh industri AI. Terutama dalam skenario pelatihan model besar, komputasi kinerja tinggi, dan pengembangan AI umum, NVIDIA masih menjadi pilihan paling matang dan paling diakui industri saat ini.
Namun masalahnya, pasar komputasi AI sedang memasuki tahap berikutnya.
Dulu yang diperebutkan adalah 'chip siapa yang lebih kuat', sekarang yang benar-benar dipedulikan perusahaan, sedang berubah menjadi 'siapa yang bisa membuat komputasi lebih murah'. Saat ini, keunggulan penyedia layanan cloud seperti Google, Huawei Cloud, Alibaba Cloud mulai terlihat: Mereka memiliki pelanggan individu dan perusahaan, data, aplikasi, dan skenario dalam jumlah masif, sekaligus lebih mahir mengemas berbagai perangkat keras menjadi sistem produktivitas yang bisa langsung digunakan.
Dengan kata lain, yang benar-benar langka di era AI, sudah bukan hanya chip itu sendiri, tetapi kemampuan sistem yang mengubah chip menjadi produktivitas.
Ketika komputasi semakin seperti sumber daya dasar seperti air, listrik, bandwidth, perusahaan yang akhirnya menang, belum tentu hanya produsen dengan kinerja per kartu terkuat, tetapi produsen yang bisa dengan biaya lebih rendah, efisiensi lebih tinggi, terus menyerahkan komputasi AI ke pelanggan.
Jadi, dalam pandangan Lei Keji, Google mulai menjual TPU sebenarnya adalah sinyal, mengingatkan seluruh industri: Persaingan infrastruktur AI, sudah bukan hanya perang chip, tetapi perang sistem.
Artikel ini dari akun WeChat resmi "Lei Keji", penulis: Lei Keji





