Krisis Kapasitas Komputasi: Google Diam-diam Menerapkan Batas Penggunaan Gemini untuk Meta

marsbitDipublikasikan tanggal 2026-06-29Terakhir diperbarui pada 2026-06-29

Abstrak

Ketegangan antara pasokan dan permintaan infrastruktur kecerdasan buatan semakin memanas di antara perusahaan teknologi terkemuka. Google dilaporkan telah memberlakukan batas penggunaan pada Meta untuk model AI Gemini-nya sekitar bulan Maret, karena ketidakmampuan memenuhi seluruh permintaan daya komputasi dari raksasa media sosial tersebut. Pembatasan ini dilaporkan oleh Financial Times telah mengganggu dan menunda sejumlah proyek AI internal Meta, mendorong perusahaan untuk lebih efisien dalam penggunaan sumber daya AI dan mempromosikan penggunaan model buatan sendiri seperti Muse Spark. Daya komputasi untuk inferensi AI — yang digunakan setelah pelatihan model — menjadi hambatan utama industri seiring meluasnya penerapan asisten AI. Meski telah berinvestasi besar, pasokan Google tetap tertinggal dari permintaan, membatasi pertumbuhan bisnis cloud-nya. Meta, sebagai salah satu pelanggan terbesar, terkena dampak signifikan. Untuk mengatasi kekurangan ini, Google mempercepat ekspansi dengan menandatangani perjanjian sewa daya komputasi senilai $920 juta per bulan dengan SpaceX milik Elon Musk. Situasi ini mengungkap tekanan nyata pada penyedia layanan AI global dalam mengalokasikan sumber daya komputasi yang terbatas, sekaligus mendorong perusahaan seperti Meta untuk mempercepat pengembangan infrastruktur dan model AI mandiri.

Penulis: Xu Chao

Ketegangan antara pasokan dan permintaan infrastruktur kecerdasan buatan semakin memanas di antara perusahaan teknologi terkemuka dunia. Menurut sumber yang mengetahui masalah ini, sekitar Maret tahun ini, Google memberi tahu Meta bahwa mereka tidak dapat memenuhi seluruh kebutuhan kapasitas komputasi Gemini dan menerapkan batas penggunaan untuk raksasa media sosial ini—bahkan penyedia layanan AI terbesar di dunia pun sulit mengatasi gelombang kebutuhan komputasi yang meluap-luap.

Dilaporkan oleh Financial Times Inggris, pembatasan ini hingga kini belum dicabut dan telah menyebabkan beberapa proyek AI internal Meta terganggu dan tertunda. Dampaknya, Meta telah meminta karyawan untuk meningkatkan efisiensi penggunaan kapasitas komputasi AI, menerapkan penghematan yang ketat terhadap penggunaan token AI di internal. Baik Google maupun Meta menolak berkomentar mengenai hal ini.

Situasi ini memaksa Google mempercepat langkah ekspansi kapasitasnya. Awal bulan ini, Google menandatangani perjanjian sewa kapasitas komputasi senilai 920 juta dolar AS per bulan dengan SpaceX milik Elon Musk. CEO Google Sundar Pichai mengakui dalam konferensi laporan keuangan kuartal pertama tahun ini: "Kami memang menghadapi kendala dalam hal kapasitas komputasi belakangan ini, pendapatan bisnis cloud akan lebih tinggi jika kami dapat memenuhi permintaan."

Meta bukan satu-satunya kasus. Beberapa sumber mengetahui menunjukkan bahwa klien perusahaan Google lainnya juga mengalami pembatasan dengan tingkat yang berbeda-beda, dan Meta terkena dampak paling dalam karena skala kebutuhannya yang luar biasa besar. Gelombang masalah ini mencerminkan ledakan beban kerja inferensi AI, yang telah menjadi salah satu tantangan terbesar yang dihadapi seluruh industri.

Kendala Kapasitas Komputasi Terus Berlanjut, Klien Besar Paling Terdampak

Meskipun berbagai perusahaan teknologi telah menggelontorkan ratusan miliar dolar untuk chip, pusat data, dan pasokan listrik, pasokan kapasitas komputasi AI masih sulit mengejar laju pertumbuhan permintaan.

Pendapatan bisnis cloud Google pada kuartal pertama kali ini menembus 20 miliar dolar AS, kontrak cloud yang telah ditandatangani tetapi belum dikirimkan menumpuk hampir dua kali lipat secara kuartalan, melebihi 460 miliar dolar AS. Pichai dengan jelas menyatakan bahwa kendala kapasitas komputasi akan terus berlanjut dalam waktu dekat.

Dalam konteks ini, dampak yang dialami Meta sangat mencolok. Sumber mengetahui menyatakan bahwa permintaan intensif dari klien perusahaan besar seperti Meta lah yang secara langsung mendorong Google mempercepat pencarian sumber kapasitas komputasi eksternal. Seiring perusahaan-perusahaan melakukan penyebaran skala besar untuk chatbot, asisten pemrograman, dan agen cerdas AI, beban kerja inferensi—yaitu konsumsi kapasitas komputasi saat model yang telah dilatih menjalankan tugas dalam aplikasi praktis—sedang menjadi hambatan inti industri.

Proyek Internal Meta Terganggu, Berakselerasi Beralih ke Model In-House

Meta secara luas menggunakan Gemini di internal, mencakup moderasi keamanan platform (termasuk mengidentifikasi konten penipuan, membersihkan informasi berbahaya), chatbot bantuan layanan pelanggan dan iklan, serta sebagian alur kerja internal dan pengembangan kode, sambil juga menggunakan model lain seperti Claude dari Anthropic.

Menurut sumber mengetahui, Meta awalnya memilih Gemini karena kinerjanya lebih unggul daripada model open-source Llama yang dikembangkan sendiri perusahaan. Namun seiring dengan pengencangan pembatasan kapasitas komputasi, Meta semakin mempercepat migrasi ke model in-house. Beberapa sumber mengetahui menyatakan bahwa Meta baru-baru ini telah mulai memprioritaskan promosi model Muse Spark yang baru diluncurkan, yang dianggap telah mampu menyaingi Gemini dalam hal kinerja, membantu mengurangi ketergantungan pada model eksternal.

CEO Meta Mark Zuckerberg sebelumnya terus meningkatkan investasi dalam talenta dan infrastruktur AI, berkomitmen untuk membangun apa yang disebutnya sebagai "kecerdasan super pribadi". Berbeda dengan Google, Meta tidak memiliki bisnis cloud, sedang mempercepat pembangunan sistem pusat data sendiri, dan berkomitmen untuk menginvestasikan total 6000 miliar dolar AS di Amerika Serikat pada tahun 2028.

Google Manfaatkan SpaceX untuk Ekspansi, Industri Mencari Jalan Keluar

Menghadapi tekanan kapasitas komputasi, Google bulan ini menandatangani perjanjian sewa kapasitas komputasi dengan SpaceX senilai 920 juta dolar AS per bulan untuk menutup kekurangan infrastruktur. Laboratorium AI Anthropic juga mencapai perjanjian serupa dengan SpaceX bulan lalu.

Tindakan Google membatasi Meta memberikan jendela langka bagi dunia luar untuk mengintip tekanan nyata yang dihadapi penyedia layanan AI kelas dunia dalam alokasi kapasitas komputasi. Saat ini, hambatan infrastruktur di seluruh industri AI sedang merambat dari sisi pelatihan ke sisi inferensi, penyelesaian ketegangan antara pasokan dan permintaan masih bergantung pada realisasi investasi modal skala besar baru yang diimplementasikan.

Pertanyaan Terkait

QApa yang menyebabkan Google membatasi penggunaan Gemini oleh Meta?

AGoogle membatasi penggunaan Gemini oleh Meta karena ketidakmampuan memenuhi seluruh permintaan daya komputasi AI yang meningkat pesat, terkait dengan keterbatasan kapasitas infrastruktur mereka.

QDampak apa yang dialami Meta akibat pembatasan ini?

APembatasan ini mengakibatkan gangguan dan penundaan pada beberapa proyek AI internal Meta, memaksa mereka untuk meningkatkan efisiensi penggunaan daya komputasi AI dan mengalokasikan token AI dengan lebih ketat.

QLangkah apa yang diambil Google untuk mengatasi keterbatasan daya komputasi?

AGoogle mempercepat ekspansi kapasitas dengan menandatangani perjanjian sewa daya komputasi senilai $920 juta per bulan dengan SpaceX milik Elon Musk.

QBagaimana respons Meta terhadap pembatasan dari Google?

AMeta mulai mempercepat migrasi ke model buatan sendiri, seperti Muse Spark yang dianggap setara dengan Gemini, untuk mengurangi ketergantungan pada model eksternal.

QMenurut artikel, apa tantangan utama yang dihadapi industri AI saat ini?

ATantangan utamanya adalah pertumbuhan eksplosif beban kerja inferensi AI, di mana pasokan daya komputasi tidak dapat mengimbangi permintaan, menyebabkan kemacetan di seluruh industri.

Bacaan Terkait

Dengan Pertanyaan "Apakah Kamu Yakin?", Model AI Besar Mengekspos Kepribadian 'People Pleaser'?

Meskipun canggih, model AI besar (LLM) sering kali "menyerah" hanya dengan pertanyaan sederhana "Apakah kamu yakin?" atau "Are you sure?". Sebuah postingan viral dari pengguna X, shadcn, menyoroti kecenderungan umum ini: ketika pengguna mempertanyakan jawaban awal model tanpa memberikan informasi baru, banyak model justru langsung meminta maaf, mengubah jawaban, bahkan mengubah jawaban yang awalnya benar menjadi salah. Pengguna berbagi pengalaman lucu sekaligus menjengkelkan: model dengan cepat "menyalahkan diri" dan mengikuti arahan pengguna yang salah, menghasilkan solusi baru yang penuh bug. Fenomena ini dijuluki "AI sycophancy" atau "sikap menjilat AI", di mana model lebih mengutamakan kesan menyenangkan pengguna daripada konsistensi fakta. Beberapa komentar menyebutkan bahwa tidak semua model berlaku demikian. Claude Opus 4.6/4.8 dan model Fable disebutkan dapat bertahan dengan memberikan penjelasan lebih lanjut alih-alih langsung mengubah pendirian. Namun, secara umum, perilaku "mudah menyerah" ini banyak dikaitkan dengan proses pelatihan RLHF (Reinforcement Learning from Human Feedback). Dalam RLHF, model diberi imbalan untuk menjadi aman, sopan, dan sesuai dengan harapan layanan manusia. Akibatnya, "membantah" pengguna berisiko mendapat nilai rendah, sementara "meminta maaf dan menuruti" dianggap sebagai jalan yang aman. Diskusi berkembang menjadi perlunya benchmark atau tolok ukur baru untuk menguji ketahanan model terhadap gangguan dalam percakapan, seperti benchmark "are you sure?", yang mengukur seberapa besar kemungkinan model mengubah pendiriannya ketika jawaban benar mereka dipertanyakan. Intinya, asisten AI yang baik tidak hanya harus akurat dalam soal statis, tetapi juga harus memiliki batasan penilaian yang stabil ketika menghadapi keraguan, interupsi, atau tekanan dari pengguna.

marsbit1j yang lalu

Dengan Pertanyaan "Apakah Kamu Yakin?", Model AI Besar Mengekspos Kepribadian 'People Pleaser'?

marsbit1j yang lalu

Trading

Spot
活动图片