Biên tập viên giới thiệu: Bài phỏng vấn này cung cấp một góc nhìn vào chu kỳ sức mạnh tính toán của AI: nhu cầu không hạ nhiệt sau làn sóng săn GPU trước đó, mà ngược lại đang tiếp tục được đẩy cao bởi các tác nhân AI, suy luận và ứng dụng AI cấp doanh nghiệp.
Bài viết phỏng vấn Brannin McBee, Đồng sáng lập kiêm Giám đốc Phát triển, và Nick Robbins, Phó chủ tịch Phát triển Kinh doanh và Quan hệ Nhà đầu tư của CoreWeave, thảo luận về hiện trạng nhu cầu AI và thị trường neocloud. Thông điệp cốt lõi từ các lãnh đạo CoreWeave rất trực tiếp – nhu cầu AI dường như đang trở nên gay gắt hơn mỗi ngày theo những cách mới, và điểm nghẽn thực sự cũng đang chuyển từ "có GPU hay không" sang những vấn đề cơ sở hạ tầng phức tạp hơn: vỏ trung tâm dữ liệu có sẵn điện, CPU, lưu trữ, thợ điện, khả năng thực thi chuỗi cung ứng, và khách hàng sẵn sàng trả giá cao đến mức nào cho sức mạnh tính toán thế hệ mới.
Điểm đặc biệt của CoreWeave nằm ở vị trí trung gian trong chuỗi cơ sở hạ tầng AI: vừa phục vụ các khách hàng hàng đầu như OpenAI, Anthropic, Meta, Google, Microsoft, Nvidia, vừa trực tiếp cảm nhận những thay đổi nhu cầu từ các phòng thí nghiệm nghiên cứu, khách hàng doanh nghiệp và các nhà cung cấp dịch vụ đám mây siêu lớn. Do đó, những gì họ thấy không chỉ là "GPU có thiếu hay không", mà là chính khối lượng công việc AI đang thay đổi về cấu trúc. Với sự trỗi dậy của AI tác nhân và mô hình suy luận, nhu cầu sức mạnh tính toán không còn chỉ xoay quanh GPU, tầm quan trọng của CPU và lưu trữ cũng đang tăng lên, thiết kế trung tâm dữ liệu thế hệ mới phải dành chỗ cho CPU Vera, máy chủ Vera Rubin và nhiều dung lượng lưu trữ hơn.
Điều này cũng giải thích tại sao cạnh tranh trong cơ sở hạ tầng AI đang chuyển từ việc mua sắm chip đơn thuần, sang khả năng cung cấp công trình toàn diện hơn. Ai có thể nhanh chóng sở hữu trung tâm dữ liệu có sẵn điện, triển khai máy chủ, thông suốt chuỗi cung ứng, tối ưu hóa chi phí trên mỗi token, thì người đó càng gần với trung tâm của chu kỳ chi tiêu vốn AI lần này. CoreWeave nhiều lần nhấn mạnh "được khách hàng dẫn dắt", đằng sau đó thực chất là một đánh giá lớn hơn: các nhà cung cấp dịch vụ đám mây AI không còn chỉ bán sức mạnh tính toán, mà đang tái cấu trúc nhà máy AI thế hệ tiếp theo trước thời hạn, dựa trên lộ trình của những khách hàng tiên phong nhất.
Đối với các nhà đầu tư và người quan sát ngành, điều đáng chú ý nhất trong bài phỏng vấn này không phải là một con số đơn lẻ nào, mà là hướng thay đổi của nhu cầu cơ sở hạ tầng AI: GPU vẫn quan trọng, nhưng điểm nghẽn đang lan rộng; Nvidia vẫn là cốt lõi, nhưng CPU, HBM, lưu trữ và khả năng cấp điện cho trung tâm dữ liệu đang trở thành những biến số mới; Nhu cầu AI vẫn tăng, nhưng thắng thua trong tương lai có thể phụ thuộc vào việc ai có thể cung cấp liên tục, ổn định và trên quy mô lớn cơ sở hạ tầng phức tạp đó.
Dưới đây là nội dung gốc:
CoreWeave được coi là nhà dẫn đầu thị trường sớm đầy sáng tạo trong lĩnh vực neocloud (dịch vụ đám mây kiểu mới).
Đây là nhà cung cấp dịch vụ đám mây duy nhất đạt được xếp hạng cao nhất "Bạch kim" từ tổ chức nghiên cứu AI SemiAnalysis. CoreWeave được thành lập năm 2017, cung cấp sức mạnh tính toán GPU quy mô lớn cho các công ty khởi nghiệp và doanh nghiệp lớn.
Gần đây, Key Context đã phỏng vấn Brannin McBee, Đồng sáng lập kiêm Giám đốc Phát triển, và Nick Robbins, Phó chủ tịch Phát triển Kinh doanh và Quan hệ Nhà đầu tư của CoreWeave, thảo luận về nhu cầu AI và hiện trạng thị trường neocloud.
Dưới đây là các điểm chính đã được biên tập từ cuộc trò chuyện này:
Nhu cầu AI tiếp tục gia tăng gay gắt
Tae: Làn sóng nhu cầu về AI tác nhân bắt đầu bùng nổ từ khi nào?
Brannin: Chúng tôi đã thấy sự khởi đầu thực sự vào quý 4 năm ngoái. Khi đó, chúng tôi đang trao đổi với khách hàng ở cấp độ kỹ thuật, thảo luận về các sản phẩm mà họ dự kiến sẽ đưa ra thị trường trong quý 1 năm nay.
Đây luôn là một góc nhìn rất quan trọng khi chúng tôi xem xét nhu cầu của khách hàng. Chúng tôi có một mối quan hệ kỹ thuật liên kết sâu sắc với khách hàng. Chính mối quan hệ đó cho phép chúng tôi nhìn thấy xu hướng trước, thay vì phản ứng thụ động sau khi thay đổi xảy ra.
Nếu nhìn từ góc độ sản phẩm của thị trường AI, tôi sẽ nói rằng, quý 1 là thời điểm của bước ngoặt lớn trong suy luận và tiêu dùng AI, và sự tăng tốc này vẫn đang tiếp diễn cho đến nay.
Tae: Hiện tại nhu cầu AI đang ở trạng thái nào? So với vài tháng trước, có dấu hiệu chậm lại nào trong vài tuần gần đây không?
Nick: Nó dường như đang trở nên gay gắt hơn mỗi ngày theo những cách mới.
Tae: Hãy nói về xu hướng tăng nhu cầu của CPU so với GPU trong làn sóng AI tác nhân. Các bạn có triển khai hàng loạt giá đỡ CPU Vera bên cạnh các máy chủ GPU Nvidia không?
Brannin: CoreWeave đã vận hành CPU từ năm 2023. Chúng tôi luôn có đầy đủ sản phẩm đám mây. Vậy vấn đề không phải là chúng tôi có bắt đầu tăng CPU hay không, mà là khách hàng thực sự cần gì? Và liệu nhu cầu đó có đang tăng lên một cách tương đối? Câu trả lời là, rất rõ ràng, đúng là như vậy.
Khi khả năng tác nhân và suy luận thực sự trỗi dậy trong các mô hình, nhu cầu lưu trữ cũng đang tăng lên so với các thế hệ trước. Tôi nghĩ xu hướng này sẽ tiếp tục.
Nick: Đối với câu hỏi của bạn, câu trả lời là có. Bạn chắc chắn sẽ thấy một lượng lớn CPU Vera được triển khai bên cạnh hàng loạt máy chủ Vera Rubin. Năm ngoái, chúng tôi thực sự đã thiết kế lại cơ bản phương án trung tâm dữ liệu, để dành chỗ cho nhiều lưu trữ hơn và nhiều CPU hơn, để chúng có thể được triển khai bên cạnh GPU.
Lý do chúng tôi làm điều này là vì chúng tôi ở một vị trí rất độc đáo trong toàn bộ hệ sinh thái. Chúng tôi là nhà cung cấp dịch vụ đám mây độc lập duy nhất phục vụ tất cả người dùng công nghệ tiên tiến nhất. Không có nhà cung cấp dịch vụ đám mây AI độc lập nào khác có thể nói rằng Anthropic, OpenAI, Meta, Google, Microsoft, Nvidia, v.v... đều là khách hàng của mình.
Điều này tạo ra một vòng xoáy có lợi, hay nói cách khác là một chu kỳ phản hồi tích cực cho hoạt động kinh doanh của chúng tôi: chúng tôi có thể hiểu khách hàng đang đưa công nghệ đi đâu, và lập kế hoạch dựa trên đó.
Điểm nghẽn không còn chỉ là GPU
Tae: Trong tương lai, các bạn sẽ chủ yếu sử dụng CPU Vera của Nvidia phải không?
Nick: Điều đó phụ thuộc vào khối lượng công việc cụ thể. Chúng tôi hành động dựa trên nhu cầu của khách hàng. Chúng tôi thực sự dự kiến sẽ trở thành những người áp dụng sớm và quan trọng đối với CPU Vera, điều này chúng tôi đã tiết lộ. Hiện tại, đội tàu của chúng tôi thực chất vẫn chủ yếu là AMD, nhưng theo thời gian, điều này có thể thay đổi dựa trên nhu cầu của khách hàng. Khách hàng rất quan tâm đến CPU Vera.
Brannin: Điều này cũng là một lời nhắc nhở tốt để chúng ta có thể nói về cách hợp đồng của chúng tôi hoạt động. Như bạn đã biết, hơn 98% doanh thu của chúng tôi được thúc đẩy bởi hợp đồng. Chúng tôi không phải đoán khách hàng muốn loại cơ sở hạ tầng nào. Khách hàng sẽ nói với chúng tôi rất rõ ràng họ cần cấu hình nào. Mọi thứ đều do khách hàng dẫn dắt. Chính khách hàng đang xác định chúng tôi phải xây dựng cái gì.
Tae: Hãy nói về bối cảnh cạnh tranh. Làm thế nào mà các bạn thâm nhập thị trường và cạnh tranh với các neocloud như SpaceX, Nebius, Oracle, và các nhà cung cấp dịch vụ đám mây siêu lớn như Azure, AWS, Google?
Brannin: Về sự khác biệt, tôi muốn nhìn từ góc độ xác minh của bên thứ ba. Ngoại trừ Trung Quốc, chín trong số mười phòng thí nghiệm AI hàng đầu thế giới đang sử dụng nền tảng của chúng tôi. SemiAnalysis luôn xếp chúng tôi ở cấp độ cao nhất về hiệu suất một cách riêng biệt. Tôi không nghĩ rằng chúng tôi nhận được phân bổ GPU như vậy là vì mối quan hệ cá nhân của chúng tôi với Jensen.
Điều này cho thấy các nhà cung cấp có niềm tin sâu sắc vào hồ sơ thực thi và khả năng kỹ thuật của chúng tôi, tin rằng chúng tôi có thể thể hiện tốt nhất khả năng sản phẩm của họ trên toàn cầu.
Nick: Chúng tôi có thể giành được khách hàng là các nhà cung cấp dịch vụ đám mây siêu lớn vì chúng tôi rất giỏi thực thi. Chúng tôi có thể dựng các hệ thống này với tốc độ cực kỳ nhanh, và chúng chạy rất tốt. Chúng tôi có thể giành được khách hàng là các phòng thí nghiệm nghiên cứu vì chúng tôi cung cấp phiên bản công nghệ mạnh nhất về hiệu suất, và hiệu quả trên mỗi token là tốt nhất.
Chúng tôi có thể giành được khách hàng doanh nghiệp vì cơ sở hạ tầng thực sự chạy tốt, và chúng tôi đã xây dựng một lớp điều phối xuất sắc, tốt nhất trong loại của nó, cũng là nguồn gốc của các xếp hạng Bạch kim, v.v.
Nhưng ngày càng quan trọng là, trong số các nhà cung cấp dịch vụ đám mây AI, chúng tôi đã xây dựng được lớp năng lực trưởng thành nhất, bao phủ các công cụ suy luận và phát triển, giúp doanh nghiệp thực sự đưa AI vào sản xuất.
Điều này có nghĩa là, chúng tôi đang xây dựng và cung cấp một số sản phẩm, cuối cùng giúp những doanh nghiệp có độ trưởng thành công nghệ tương đối thấp hơn, biến dữ liệu thành mô hình, rồi thành các tác nhân có thể chạy nội bộ, và chúng tôi cũng có thể bán chéo dịch vụ đám mây CoreWeave trong quá trình này.
Tae: Điểm nghẽn hiện tại là gì? Là vỏ trung tâm dữ liệu có sẵn điện? GPU? Hay là thợ điện?
Brannin: Là các vỏ có điện (powered shells), tức là vỏ trung tâm dữ liệu có điều kiện cấp điện. Chính xác hơn, là các thành phần bên trong những vỏ này. Bạn đặc biệt nhắc đến thợ điện, điều đó hoàn toàn đúng. Đây là một lĩnh vực phức tạp.
Nhưng quan trọng là, chúng tôi đã có 49 địa điểm như vậy hoạt động và chạy. Chúng tôi không đặt hy vọng vào một hoặc hai địa điểm. Chúng tôi đã làm 49 lần.
Đây là một hồ sơ thực thi rất sâu sắc.
Điều này cũng có nghĩa là chúng tôi tích lũy được rất nhiều kiến thức, biết cách xử lý các vấn đề chuỗi cung ứng, biết trong chuỗi cung ứng này, nhà cung cấp nào phù hợp để hợp tác, nhà cung cấp nào không phù hợp.
Tae: Về chi phí và tình trạng thiếu hụt bộ nhớ HBM, các bạn có thể tiết lộ điều gì? Các bạn ứng phó như thế nào? Khách hàng có phải chịu chi phí tăng giá không?
Nick: Câu trả lời là có. Mô hình kinh doanh của chúng tôi được thiết kế để, đồng thời với việc ký đơn đặt hàng mua GPU, xác định chúng tôi sẽ trả bao nhiêu chi phí, thì cũng khóa giá GPU mà chúng tôi tính cho khách hàng. Nói rộng hơn, tức là giá máy chủ, và giá máy chủ rõ ràng bao gồm chi phí HBM.
Đây là cách chúng tôi cách ly ảnh hưởng của biến động giá hàng ngày.
Nếu chi phí linh kiện của chúng tôi tăng trong giao dịch tiếp theo, chúng tôi sẽ phản ánh phần chi phí đó vào mức giá mà chúng tôi cho rằng có thể tính cho khách hàng, từ đó bảo vệ tỷ suất lợi nhuận của mình. Chúng tôi được bảo vệ tốt trong việc chuyển những chi phí này cho khách hàng. Đây là điều chúng tôi theo dõi rất sát sao.
Hiện tại, việc có được linh kiện không phải là điểm nghẽn lớn nhất. Điểm nghẽn lớn nhất là vỏ có điện (powered shell). Nhưng tại một thời điểm nào đó trong tương lai, câu trả lời này có thể thay đổi qua lại.
Tae: Các bạn dự đoán việc triển khai và tăng tốc Vera Rubin sẽ diễn ra như thế nào? Nửa cuối năm nay sẽ ra sao?
Nick: Chúng tôi rõ ràng là công ty đầu tiên trên thế giới khởi động và xác minh toàn diện tủ VR, tức là tủ Vera Rubin. Năm ngoái chúng tôi cũng đã làm tương tự với GB200, GB300. Tôi dự kiến VR sẽ bắt đầu xuất hiện vào cuối năm nay.
Tôi dự kiến, việc triển khai và tăng tốc thực sự quy mô lớn, rất mạnh mẽ sẽ diễn ra xuyên suốt cả năm 2027. Nhịp độ này tương tự như GB: GB bắt đầu xuất hiện vào năm 2025, nhưng việc tăng tốc thực sự quy mô lớn thực chất đã diễn ra xuyên suốt năm 2026. Nghĩa là, cuối năm ngoái đã triển khai khá nhiều, nhưng năm nay mới là năm triển khai GB quy mô lớn thực sự.
Tôi dự kiến, trong vòng 12 đến 18 tháng tới, VR sẽ có nhịp độ rất tương tự.






