Catatan Editor: Wawancara ini memberikan jendela untuk mengamati siklus komputasi AI: Permintaan tidak mereda meski ada gelombang pembelian GPU sebelumnya, justru didorong lebih tinggi oleh agen cerdas, inferensi, dan aplikasi AI tingkat perusahaan.
Artikel ini mewawancarai Brannin McBee, salah satu pendiri dan Chief Development Officer CoreWeave, serta Nick Robbins, Wakil Presiden Pengembangan Perusahaan dan Hubungan Investor, untuk membahas kondisi permintaan AI dan pasar neocloud. Inti pernyataan eksekutif CoreWeave sangat langsung—permintaan AI tampaknya semakin meningkat setiap hari dengan cara-cara baru, dan hambatan sesungguhnya juga bergeser dari "ada tidaknya GPU" ke masalah infrastruktur yang lebih kompleks: shell pusat data yang dialiri daya, CPU, penyimpanan, teknisi listrik, kemampuan eksekusi rantai pasok, serta seberapa tinggi biaya yang bersedia dibayar pelanggan untuk daya komputasi generasi baru.
Kekhasan CoreWeave terletak pada posisinya di tengah rantai infrastruktur AI: melayani pelanggan besar seperti OpenAI, Anthropic, Meta, Google, Microsoft, Nvidia, sekaligus merasakan langsung perubahan permintaan dari laboratorium riset, pelanggan korporasi, dan penyedia cloud hyperscale. Oleh karena itu, yang mereka lihat bukan hanya "apakah GPU kekurangan", tetapi juga perubahan struktural pada beban kerja AI itu sendiri. Seiring munculnya AI agen dan model penalaran, kebutuhan daya komputasi tidak lagi hanya berpusat pada GPU, pentingnya CPU dan penyimpanan juga meningkat. Desain pusat data generasi baru harus menyediakan ruang untuk CPU Vera, server Vera Rubin, dan lebih banyak penyimpanan.
Ini juga menjelaskan mengapa persaingan infrastruktur AI sedang bergeser dari sekadar pembelian chip, ke kemampuan pengiriman rekayasa yang lebih komprehensif. Siapa yang lebih cepat mendapatkan pusat data bertenaga, menggelar server, menghubungkan rantai pasok, mengoptimalkan biaya per token, dialah yang lebih dekat dengan inti siklus pengeluaran modal AI gelombang ini. CoreWeave berulang kali menekankan "didorong oleh pelanggan", yang di belakangnya sebenarnya adalah penilaian yang lebih besar: Penyedia layanan cloud AI tidak lagi hanya menjual daya komputasi, tetapi merekonstruksi pabrik AI generasi berikutnya lebih awal berdasarkan peta jalan pelanggan yang paling mutakhir.
Bagi investor dan pengamat industri, yang paling layak diperhatikan dari wawancara ini bukan angka tertentu, tetapi arah perubahan kebutuhan infrastruktur AI: GPU masih penting, tetapi hambatan menyebar; Nvidia tetap inti, tetapi CPU, HBM, penyimpanan, dan kemampuan daya pusat data sedang menjadi variabel baru; Permintaan AI masih tumbuh, tetapi kemenangan di masa depan mungkin tergantung pada siapa yang mampu mengirimkan infrastruktur kompleks secara berkelanjutan, stabil, dan berskala.
Berikut teks aslinya:
CoreWeave dipandang sebagai pemimpin pasar awal yang inovatif di bidang neocloud (layanan cloud tipe baru).
Ini adalah satu-satunya penyedia layanan cloud yang mendapat peringkat tertinggi "Platinum" dari lembaga riset AI SemiAnalysis. CoreWeave didirikan pada 2017, menyediakan daya komputasi GPU skala besar untuk perusahaan rintisan dan perusahaan besar.
Key Context baru-baru ini mewawancarai Brannin McBee, salah satu pendiri dan Chief Development Officer CoreWeave, serta Nick Robbins, Wakil Presiden Pengembangan Perusahaan dan Hubungan Investor, untuk membahas kondisi permintaan AI dan pasar neocloud.
Berikut poin-poin penting yang telah disunting dari dialog ini:
Permintaan AI Terus Meningkat
Tae: Gelombang permintaan AI agen mulai meledak sejak kapan?
Brannin: Kami melihat awal yang sesungguhnya di kuartal keempat tahun lalu. Saat itu, kami sedang berkomunikasi dengan pelanggan di tingkat rekayasa, mendiskusikan produk yang mereka perkirakan akan diluncurkan ke pasar pada kuartal pertama tahun ini.
Ini selalu menjadi perspektif yang sangat penting dalam melihat kebutuhan pelanggan. Ada hubungan rekayasa yang saling terhubung secara mendalam antara kami dan pelanggan. Hubungan inilah yang memungkinkan kami melihat tren lebih awal, bukan merespons secara pasif setelah perubahan terjadi.
Jika dilihat dari sudut pandang produk pasar AI, saya akan mengatakan, kuartal pertama adalah momen titik balik besar dalam inferensi dan konsumsi AI, dan percepatan ini masih berlanjut hingga sekarang.
Tae: Saat ini permintaan AI berada dalam keadaan seperti apa? Dibandingkan beberapa bulan lalu, apakah tidak ada tanda-tanda perlambatan sama sekali dalam beberapa pekan terakhir?
Nick: Tampaknya setiap hari semakin meningkat dengan cara-cara baru.
Tae: Bicara soal tren kenaikan kebutuhan CPU relatif terhadap GPU dalam gelombang AI agen. Apakah Anda akan menggelar deretan rak CPU Vera di samping server GPU Nvidia?
Brannin: CoreWeave sudah menjalankan CPU sejak 2023. Kami selalu memiliki produk cloud lengkap. Jadi masalahnya bukan apakah kami baru mulai menambah CPU, tetapi apa yang benar-benar dibutuhkan pelanggan? Apakah kebutuhan ini secara relatif sedang naik? Jawabannya, sangat jelas, ya.
Seiring kemampuan agen dan inferensi benar-benar bangkit dalam model, kebutuhan penyimpanan juga meningkat dibandingkan generasi-generasi sebelumnya. Saya pikir tren ini akan berlanjut.
Nick: Untuk pertanyaan Anda, jawabannya ya. Anda pasti akan melihat banyak CPU Vera digelar di samping banyak server Vera Rubin. Tahun lalu, kami sebenarnya mendesain ulang secara mendasar skema pusat data dasar, menyisakan ruang untuk lebih banyak penyimpanan dan lebih banyak CPU, agar dapat digelar di samping GPU.
Alasan kami melakukan ini adalah karena kami berada di posisi yang sangat unik di seluruh ekosistem. Kami adalah satu-satunya penyedia layanan cloud independen yang melayani semua pengguna teknologi paling canggih. Tidak ada penyedia layanan cloud AI independen lain yang bisa mengatakan, Anthropic, OpenAI, Meta, Google, Microsoft, Nvidia, dan lainnya adalah pelanggan mereka sendiri.
Ini menciptakan siklus roda gila yang menguntungkan, atau putaran umpan balik positif, untuk bisnis kami: Kami memahami ke mana pelanggan membawa teknologi, dan merencanakan berdasarkan itu.
Hambatan Tidak Lagi Hanya GPU
Tae: Di masa depan, apakah Anda terutama akan menggunakan CPU Vera Nvidia?
Nick: Itu tergantung pada beban kerja spesifik. Cara kami bekerja didorong oleh kebutuhan pelanggan. Kami memang memperkirakan akan menjadi pengguna awal dan penting untuk CPU Vera, ini sudah kami ungkapkan. Saat ini, armada kami sebenarnya masih didominasi AMD, tetapi seiring waktu, ini mungkin berubah sesuai kebutuhan pelanggan. Minat pelanggan terhadap CPU Vera sangat besar.
Brannin: Ini juga pengingat yang baik bahwa kita bisa membahas bagaimana kontrak kami beroperasi. Seperti yang Anda ketahui, lebih dari 98% pendapatan kami digerakkan oleh kontrak. Kami tidak menebak infrastruktur seperti apa yang diinginkan pelanggan. Pelanggan akan memberi tahu kami dengan sangat jelas, konfigurasi seperti apa yang mereka butuhkan. Semuanya didorong oleh pelanggan. Pelanggan yang menentukan apa yang harus kami bangun.
Tae: Bicarakan lanskap persaingan. Menghadapi neocloud seperti SpaceX, Nebius, Oracle, serta penyedia layanan cloud hyperscale seperti Azure, AWS, Google, bagaimana Anda memasuki pasar dan berkompetisi?
Brannin: Dalam hal diferensiasi, saya lebih suka melihat dari sudut pandang validasi pihak ketiga. Di luar Cina, sembilan dari sepuluh laboratorium AI teratas di dunia menggunakan platform kami. SemiAnalysis selalu menempatkan kami secara terpisah pada tingkat tertinggi dalam hal kinerja. Saya tidak berpikir kami mendapatkan alokasi GPU seperti itu karena persahabatan pribadi kami dengan Jensen.
Ini menunjukkan bahwa pemasok memiliki keyakinan yang sangat dalam pada catatan eksekusi dan kemampuan rekayasa kami, percaya bahwa kami dapat mencerminkan kemampuan produk mereka dengan cara terbaik di seluruh dunia.
Nick: Kami bisa memenangkan pelanggan penyedia layanan cloud hyperscale karena kami sangat ahli dalam eksekusi. Kami bisa membangun sistem-sistem ini dengan sangat cepat, dan sistemnya berjalan sangat baik. Kami bisa memenangkan pelanggan laboratorium riset karena kami menyediakan versi teknologi yang paling kuat secara kinerja, dan memiliki efisiensi per token terbaik.
Kami bisa memenangkan pelanggan korporasi karena infrastrukturnya memang berjalan dengan baik, dan kami membangun lapisan orkestrasi yang sangat bagus, terbaik di kelasnya, yang juga menjadi sumber peringkat Platinum dan pengakuan lainnya.
Tapi yang semakin penting, di antara penyedia layanan cloud AI, kami telah membangun lapisan kemampuan paling matang, mencakup alat-alat inferensi dan pengembangan, membantu perusahaan benar-benar menjalankan AI dalam produksi.
Ini berarti, kami sedang membangun dan mengirimkan beberapa produk, yang pada akhirnya membantu perusahaan dengan kematangan teknologi relatif rendah, mengubah data menjadi model, lalu menjadi agen yang bisa dijalankan secara internal, dan kami juga bisa menjual silang layanan cloud CoreWeave dalam proses ini.
Tae: Apa hambatannya saat ini? Apakah shell pusat data yang sudah dialiri daya? GPU? Atau teknisi listrik?
Brannin: Adalah powered shells, yaitu shell pusat data yang sudah dialiri daya. Lebih tepatnya, adalah komponen di dalam shell ini. Anda khusus menyebutkan teknisi listrik, itu benar sekali. Ini adalah bidang yang kompleks.
Tapi yang penting, kami sudah memiliki 49 situs seperti itu yang aktif dan berjalan. Kami tidak menaruh harapan pada satu dua situs saja. Kami sudah melakukannya 49 kali.
Ini adalah catatan eksekusi yang sangat dalam.
Ini juga berarti kami mengumpulkan banyak pengetahuan, tahu cara menangani masalah rantai pasok, tahu vendor mana yang cocok untuk bekerja sama dalam rantai pasok ini, dan mana yang tidak.
Tae: Tentang biaya dan kekurangan memori HBM, apa yang bisa Anda ungkapkan? Bagaimana Anda mengatasinya? Apakah pelanggan perlu menanggung biaya kenaikan harga?
Nick: Jawabannya ya. Model bisnis kami dirancang, pada saat menandatangani pesanan pembelian GPU, menentukan berapa banyak biaya yang kami bayar, sekaligus mengunci harga GPU yang kami kenakan kepada pelanggan. Lebih luasnya, yaitu harga server, dan harga server jelas mencakup biaya HBM.
Ini cara kami mengisolasi dampak fluktuasi harga harian.
Jika biaya komponen kami naik dalam transaksi berikutnya, kami akan mencerminkan biaya ini ke harga yang kami pikir dapat kami kenakan kepada pelanggan, sehingga melindungi margin keuntungan kami. Kami terlindungi dengan baik dalam meneruskan biaya ini kepada pelanggan. Ini hal yang kami pantau dengan sangat cermat.
Saat ini, mendapatkan komponen bukan hambatan terbesar. Hambatan terbesar adalah powered shell. Tapi di masa depan tertentu, jawaban ini mungkin bisa bolak-balik berubah.
Tae: Bagaimana Anda memperkirakan kenaikan penempatan Vera Rubin akan berlangsung? Bagaimana situasi di paruh kedua tahun ini?
Nick: Kami jelas perusahaan pertama di dunia yang menjalankan dan memvalidasi sepenuhnya VR, yaitu rak Vera Rubin. Tahun lalu kami juga seperti ini pada GB200, GB300. Saya perkirakan VR akan mulai muncul pada akhir tahun ini.
Saya perkirakan, kenaikan penempatan yang benar-benar besar, sangat kuat akan berlangsung sepanjang tahun 2027. Irama ini mirip dengan GB: GB mulai muncul di tahun 2025, tapi kenaikan yang benar-benar besar sebenarnya berlangsung sepanjang tahun 2026. Artinya, akhir tahun lalu sudah cukup banyak yang ditempatkan, tapi tahun inilah tahun penempatan GB yang benar-benar besar.
Saya perkirakan, dalam 12 hingga 18 bulan ke depan, VR akan menunjukkan irama yang sangat mirip.






