Penulis: Xu Chao
Ketegangan antara pasokan dan permintaan infrastruktur kecerdasan buatan semakin memanas di antara perusahaan teknologi terkemuka dunia. Menurut sumber yang mengetahui masalah ini, sekitar Maret tahun ini, Google memberi tahu Meta bahwa mereka tidak dapat memenuhi seluruh kebutuhan kapasitas komputasi Gemini dan menerapkan batas penggunaan untuk raksasa media sosial ini—bahkan penyedia layanan AI terbesar di dunia pun sulit mengatasi gelombang kebutuhan komputasi yang meluap-luap.
Dilaporkan oleh Financial Times Inggris, pembatasan ini hingga kini belum dicabut dan telah menyebabkan beberapa proyek AI internal Meta terganggu dan tertunda. Dampaknya, Meta telah meminta karyawan untuk meningkatkan efisiensi penggunaan kapasitas komputasi AI, menerapkan penghematan yang ketat terhadap penggunaan token AI di internal. Baik Google maupun Meta menolak berkomentar mengenai hal ini.
Situasi ini memaksa Google mempercepat langkah ekspansi kapasitasnya. Awal bulan ini, Google menandatangani perjanjian sewa kapasitas komputasi senilai 920 juta dolar AS per bulan dengan SpaceX milik Elon Musk. CEO Google Sundar Pichai mengakui dalam konferensi laporan keuangan kuartal pertama tahun ini: "Kami memang menghadapi kendala dalam hal kapasitas komputasi belakangan ini, pendapatan bisnis cloud akan lebih tinggi jika kami dapat memenuhi permintaan."
Meta bukan satu-satunya kasus. Beberapa sumber mengetahui menunjukkan bahwa klien perusahaan Google lainnya juga mengalami pembatasan dengan tingkat yang berbeda-beda, dan Meta terkena dampak paling dalam karena skala kebutuhannya yang luar biasa besar. Gelombang masalah ini mencerminkan ledakan beban kerja inferensi AI, yang telah menjadi salah satu tantangan terbesar yang dihadapi seluruh industri.
Kendala Kapasitas Komputasi Terus Berlanjut, Klien Besar Paling Terdampak
Meskipun berbagai perusahaan teknologi telah menggelontorkan ratusan miliar dolar untuk chip, pusat data, dan pasokan listrik, pasokan kapasitas komputasi AI masih sulit mengejar laju pertumbuhan permintaan.
Pendapatan bisnis cloud Google pada kuartal pertama kali ini menembus 20 miliar dolar AS, kontrak cloud yang telah ditandatangani tetapi belum dikirimkan menumpuk hampir dua kali lipat secara kuartalan, melebihi 460 miliar dolar AS. Pichai dengan jelas menyatakan bahwa kendala kapasitas komputasi akan terus berlanjut dalam waktu dekat.
Dalam konteks ini, dampak yang dialami Meta sangat mencolok. Sumber mengetahui menyatakan bahwa permintaan intensif dari klien perusahaan besar seperti Meta lah yang secara langsung mendorong Google mempercepat pencarian sumber kapasitas komputasi eksternal. Seiring perusahaan-perusahaan melakukan penyebaran skala besar untuk chatbot, asisten pemrograman, dan agen cerdas AI, beban kerja inferensi—yaitu konsumsi kapasitas komputasi saat model yang telah dilatih menjalankan tugas dalam aplikasi praktis—sedang menjadi hambatan inti industri.
Proyek Internal Meta Terganggu, Berakselerasi Beralih ke Model In-House
Meta secara luas menggunakan Gemini di internal, mencakup moderasi keamanan platform (termasuk mengidentifikasi konten penipuan, membersihkan informasi berbahaya), chatbot bantuan layanan pelanggan dan iklan, serta sebagian alur kerja internal dan pengembangan kode, sambil juga menggunakan model lain seperti Claude dari Anthropic.
Menurut sumber mengetahui, Meta awalnya memilih Gemini karena kinerjanya lebih unggul daripada model open-source Llama yang dikembangkan sendiri perusahaan. Namun seiring dengan pengencangan pembatasan kapasitas komputasi, Meta semakin mempercepat migrasi ke model in-house. Beberapa sumber mengetahui menyatakan bahwa Meta baru-baru ini telah mulai memprioritaskan promosi model Muse Spark yang baru diluncurkan, yang dianggap telah mampu menyaingi Gemini dalam hal kinerja, membantu mengurangi ketergantungan pada model eksternal.
CEO Meta Mark Zuckerberg sebelumnya terus meningkatkan investasi dalam talenta dan infrastruktur AI, berkomitmen untuk membangun apa yang disebutnya sebagai "kecerdasan super pribadi". Berbeda dengan Google, Meta tidak memiliki bisnis cloud, sedang mempercepat pembangunan sistem pusat data sendiri, dan berkomitmen untuk menginvestasikan total 6000 miliar dolar AS di Amerika Serikat pada tahun 2028.
Google Manfaatkan SpaceX untuk Ekspansi, Industri Mencari Jalan Keluar
Menghadapi tekanan kapasitas komputasi, Google bulan ini menandatangani perjanjian sewa kapasitas komputasi dengan SpaceX senilai 920 juta dolar AS per bulan untuk menutup kekurangan infrastruktur. Laboratorium AI Anthropic juga mencapai perjanjian serupa dengan SpaceX bulan lalu.
Tindakan Google membatasi Meta memberikan jendela langka bagi dunia luar untuk mengintip tekanan nyata yang dihadapi penyedia layanan AI kelas dunia dalam alokasi kapasitas komputasi. Saat ini, hambatan infrastruktur di seluruh industri AI sedang merambat dari sisi pelatihan ke sisi inferensi, penyelesaian ketegangan antara pasokan dan permintaan masih bergantung pada realisasi investasi modal skala besar baru yang diimplementasikan.





