Judul Asli: An Interview with CoreWeave Executives: AI Demand Seems to 'Intensify' Every Day
Penulis Asli: Tae Kim
Kompilasi Asli: Peggy, BlockBeats
Catatan Editor: Wawancara ini memberikan jendela untuk mengamati siklus daya komputasi AI: Permintaan tidak mereda meskipun ada gelombang pembelian GPU sebelumnya, tetapi justru terus didorong oleh agen, inferensi, dan aplikasi AI tingkat perusahaan.
Artikel ini mewawancarai Brannin McBee, Co-Founder dan Chief Development Officer CoreWeave, serta Nick Robbins, Wakil Presiden Pengembangan Perusahaan dan Hubungan Investor, untuk membahas kondisi permintaan AI dan pasar neocloud. Inti pernyataan eksekutif CoreWeave sangat langsung—permintaan AI tampaknya meningkat setiap hari dengan cara-cara baru, dan hambatan sebenarnya mulai bergeser dari "apakah ada GPU" ke masalah infrastruktur yang lebih kompleks: pasokan daya rak data center, CPU, penyimpanan, tenaga listrik, kemampuan eksekusi rantai pasokan, dan seberapa tinggi biaya yang bersedia dibayar klien untuk daya komputasi generasi baru.
Keunikan CoreWeave terletak pada posisinya di tengah rantai infrastruktur AI: melayani klien-klien terdepan seperti OpenAI, Anthropic, Meta, Google, Microsoft, Nvidia, dan juga langsung merasakan perubahan kebutuhan laboratorium penelitian, klien perusahaan, dan penyedia layanan cloud skala besar (hyperscaler). Oleh karena itu, yang mereka lihat bukan hanya "apakah GPU langka", tetapi perubahan struktural dalam beban kerja AI itu sendiri. Dengan bangkitnya model AI agen dan reasoning, kebutuhan daya komputasi tidak lagi hanya berpusat pada GPU, pentingnya CPU dan penyimpanan juga meningkat. Desain data center generasi baru harus menyediakan ruang untuk Vera CPU, server Vera Rubin, dan lebih banyak penyimpanan.
Ini juga menjelaskan mengapa persaingan infrastruktur AI bergeser dari sekadar pembelian chip ke kemampuan pengiriman rekayasa yang lebih komprehensif. Siapa yang dapat lebih cepat mendapatkan data center berdaya, menempatkan server, mengintegrasikan rantai pasokan, dan mengoptimalkan biaya per token, akan lebih dekat dengan inti siklus pengeluaran modal AI ini. Penekanan berulang CoreWeave pada "didorong oleh klien" sebenarnya adalah penilaian yang lebih besar: penyedia layanan cloud AI tidak lagi hanya menjual daya komputasi, tetapi merekonstruksi pabrik AI generasi berikutnya lebih awal berdasarkan roadmap klien yang paling mutakhir.
Bagi investor dan pengamat industri, yang paling perlu diperhatikan dalam wawancara ini bukanlah angka tunggal tertentu, tetapi arah perubahan kebutuhan infrastruktur AI: GPU masih penting, tetapi hambatan mulai menyebar; Nvidia tetap inti, tetapi CPU, HBM, penyimpanan, dan kapasitas daya data center sedang menjadi variabel baru; permintaan AI masih tumbuh, tetapi kemenangan di masa depan mungkin tergantung pada siapa yang dapat secara berkelanjutan, stabil, dan skala besar mengirimkan infrastruktur yang kompleks.
Berikut adalah teks asli:
CoreWeave dianggap sebagai pemimpin pasar awal yang inovatif di bidang neocloud (layanan cloud baru).
Ini adalah satu-satunya penyedia layanan cloud yang menerima peringkat tertinggi "Platinum" dari lembaga penelitian AI, SemiAnalysis. CoreWeave didirikan pada tahun 2017, menyediakan daya komputasi GPU skala besar untuk perusahaan rintisan dan perusahaan besar.
Key Context baru-baru ini mewawancarai Brannin McBee, Co-Founder dan Chief Development Officer CoreWeave, serta Nick Robbins, Wakil Presiden Pengembangan Perusahaan dan Hubungan Investor, untuk membahas kondisi permintaan AI dan pasar neocloud.
Berikut adalah poin-poin penting dari dialog ini yang telah diedit:
Permintaan AI Terus Meningkat
Tae: Kapan gelombang permintaan AI agen mulai meledak?
Brannin: Kami melihat awal yang nyata pada kuartal keempat tahun lalu. Saat itu, kami sedang berkomunikasi dengan klien di tingkat rekayasa, membahas produk yang mereka perkirakan akan diluncurkan ke pasar pada kuartal pertama tahun ini.
Ini selalu menjadi perspektif yang sangat penting dalam melihat kebutuhan klien. Ada hubungan rekayasa yang sangat terhubung antara kami dan klien. Hubungan inilah yang memungkinkan kami melihat tren lebih awal, bukan menanggapi perubahan setelah terjadi.
Jika dilihat dari sudut pandang produk pasar AI, saya akan mengatakan, kuartal pertama adalah momen titik balik besar untuk inferensi dan konsumsi AI, dan akselerasi ini masih berlanjut hingga sekarang.
Tae: Bagaimana keadaan permintaan AI saat ini? Dibandingkan dengan beberapa bulan lalu, apakah tidak ada tanda-tanda perlambatan dalam beberapa minggu terakhir?
Nick: Tampaknya setiap hari meningkat dengan cara-cara baru.
Tae: Bicarakan tentang tren kenaikan permintaan CPU relatif terhadap GPU dalam gelombang AI agen. Apakah kalian akan menempatkan rak-rak CPU Vera di samping server GPU Nvidia?
Brannin: CoreWeave telah menjalankan CPU sejak 2023. Kami selalu memiliki produk cloud lengkap. Jadi pertanyaannya bukan apakah kami baru mulai menambah CPU, tetapi apa yang sebenarnya dibutuhkan klien? Apakah kebutuhan ini meningkat secara relatif? Jawabannya, sangat jelas, ya.
Seiring dengan bangkitnya kemampuan agen dan inferensi dalam model, kebutuhan penyimpanan juga meningkat dibandingkan dengan generasi sebelumnya. Saya rasa tren ini akan berlanjut.
Nick: Untuk pertanyaanmu, jawabannya ya. Anda pasti akan melihat banyak CPU Vera yang ditempatkan di samping banyak server Vera Rubin. Tahun lalu, kami sebenarnya mendesain ulang secara fundamental skema data center dasar kami untuk menyediakan ruang bagi lebih banyak penyimpanan dan lebih banyak CPU, sehingga dapat ditempatkan di samping GPU.
Kami melakukan ini karena posisi kami yang sangat unik di seluruh ekosistem. Kami adalah satu-satunya penyedia layanan cloud independen yang melayani semua pengguna teknologi paling mutakhir. Tidak ada penyedia layanan cloud AI independen lain yang dapat mengatakan bahwa Anthropic, OpenAI, Meta, Google, Microsoft, Nvidia, dll., adalah klien mereka.
Ini menciptakan flywheel yang bermanfaat, atau siklus umpan balik positif, untuk bisnis kami: Kami dapat memahami ke mana klien membawa teknologi, dan merencanakannya sesuai dengan itu.
Hambatan Bukan Hanya GPU Lagi
Tae: Apakah di masa depan kalian akan terutama menggunakan CPU Vera Nvidia?
Nick: Itu tergantung pada beban kerja spesifik. Cara kami bekerja didorong oleh kebutuhan klien. Kami memang memperkirakan akan menjadi pengguna awal dan penting dari CPU Vera, dan ini telah kami ungkapkan. Saat ini, armada kami sebenarnya masih didominasi AMD, tetapi seiring waktu, ini mungkin berubah sesuai kebutuhan klien. Minat klien terhadap CPU Vera sangat tinggi.
Brannin: Ini juga pengingat yang baik untuk membicarakan bagaimana kontrak kami bekerja. Seperti yang Anda ketahui, lebih dari 98% pendapatan kami didorong oleh kontrak. Kami tidak menebak-nebak infrastruktur seperti apa yang diinginkan klien. Klien akan memberi tahu kami dengan sangat jelas konfigurasi seperti apa yang mereka butuhkan. Semuanya didorong oleh klien. Klienlah yang mendefinisikan apa yang akan kami bangun.
Tae: Bicarakan tentang lanskap persaingan. Bagaimana kalian memasuki pasar dan bersaing menghadapi neocloud seperti SpaceX, Nebius, Oracle, serta penyedia layanan cloud skala besar (hyperscaler) seperti Azure, AWS, Google?
Brannin: Dalam hal diferensiasi, saya lebih suka melihat dari sudut pandang validasi pihak ketiga. Di luar China, sembilan dari sepuluh laboratorium AI teratas dunia menggunakan platform kami. SemiAnalysis selalu menempatkan kami secara terpisah pada tingkat tertinggi dalam hal kinerja. Saya tidak berpikir kami mendapatkan alokasi GPU seperti ini karena hubungan pribadi kami dengan Jensen.
Ini menunjukkan bahwa pemasok memiliki keyakinan yang sangat dalam pada rekam jejak eksekusi dan kemampuan rekayasa kami, percaya bahwa kami dapat merepresentasikan kemampuan produk mereka dengan sangat baik di seluruh dunia.
Nick: Kami bisa memenangkan klien hyperscaler karena kami sangat ahli dalam eksekusi. Kami bisa membangun sistem ini dengan sangat cepat, dan mereka berjalan dengan sangat baik. Kami bisa memenangkan klien laboratorium penelitian karena kami menyediakan versi teknologi dengan kinerja terkuat, dan efisiensi per token yang terbaik.
Kami bisa memenangkan klien perusahaan karena infrastrukturnya memang berjalan dengan baik, dan kami membangun lapisan orkestrasi yang sangat baik, terbaik di kelasnya, yang juga diakui oleh peringkat Platinum, dll.
Tapi yang semakin penting, di antara penyedia layanan cloud AI, kami telah membangun lapisan kemampuan paling matang yang mencakup alat-alat inferensi dan pengembangan, membantu perusahaan benar-benar menerapkan AI ke dalam produksi.
Ini berarti, kami sedang membangun dan mengirimkan beberapa produk yang pada akhirnya membantu perusahaan dengan tingkat kematangan teknologi yang relatif lebih rendah, mengubah data menjadi model, lalu menjadi agen yang dapat dijalankan secara internal, dan kami juga dapat melakukan penjualan silang layanan cloud CoreWeave dalam proses ini.
Tae: Apa hambatan saat ini? Apakah rak data center yang sudah memiliki daya (powered shell)? GPU? Atau tenaga listrik?
Brannin: Powered shells, yaitu rak data center yang sudah memiliki daya. Lebih tepatnya, komponen di dalam rak-rak ini. Anda secara khusus menyebutkan tenaga listrik, itu sepenuhnya benar. Ini adalah bidang yang kompleks.
Tapi yang penting, kami sudah memiliki 49 situs seperti ini yang beroperasi. Kami tidak menaruh harapan hanya pada satu atau dua situs. Kami sudah melakukan ini 49 kali.
Ini adalah rekam jejak eksekusi yang sangat mendalam.
Ini juga berarti kami telah mengumpulkan banyak pengetahuan tentang cara menangani masalah rantai pasokan, tahu vendor mana yang cocok untuk bekerja sama dalam rantai pasokan ini, dan mana yang tidak.
Catatan Editor: Powered shells mengacu pada bangunan data center itu sendiri, tidak termasuk perangkat keras server komputasi yang sebenarnya.
Tae: Apa yang bisa kalian ungkapkan tentang biaya dan kekurangan memori HBM? Bagaimana kalian menanganinya? Apakah klien perlu menanggung biaya kenaikan?
Nick: Jawabannya ya. Model bisnis kami dirancang untuk mengunci harga GPU yang kami kenakan kepada klien, pada saat yang sama dengan menandatangani pesanan pembelian GPU dan menentukan berapa banyak biaya yang harus kami bayar. Secara lebih luas, yaitu harga server, dan harga server jelas mencakup biaya HBM.
Ini cara kami mengisolasi dampak fluktuasi harga harian.
Jika biaya komponen kami naik dalam transaksi berikutnya, kami akan mencerminkan biaya ini ke harga yang menurut kami dapat kami kenakan kepada klien, sehingga melindungi margin keuntungan kami. Kami sangat terlindungi dalam meneruskan biaya ini kepada klien. Ini adalah hal yang sangat kami perhatikan dengan cermat.
Saat ini, mendapatkan komponen bukanlah hambatan terbesar. Hambatan terbesar adalah powered shell. Tapi di beberapa titik di masa depan, jawaban ini mungkin bisa berubah-ubah.
Tae: Bagaimana kalian memperkirakan ramp-up penempatan Vera Rubin akan berlangsung? Bagaimana situasi pada paruh kedua tahun ini?
Nick: Kami jelas adalah perusahaan pertama di dunia yang meluncurkan dan sepenuhnya memvalidasi VR, yaitu rak Vera Rubin. Tahun lalu kami melakukan hal yang sama pada GB200, GB300. Saya memperkirakan VR akan mulai muncul pada akhir tahun ini.
Saya memperkirakan, ramp-up penempatan yang benar-benar skala besar dan sangat kuat akan berlangsung sepanjang tahun 2027. Irama ini mirip dengan GB: GB mulai muncul pada tahun 2025, tetapi ramp-up skala besar yang sebenarnya terjadi sepanjang tahun 2026. Artinya, cukup banyak yang telah ditempatkan pada akhir tahun lalu, tetapi tahun inilah tahun penempatan GB skala besar yang sebenarnya.
Saya memperkirakan, dalam 12 hingga 18 bulan ke depan, VR akan menunjukkan irama yang sangat mirip.





