Tác giả: Hứa Siêu
Mâu thuẫn cung cầu về cơ sở hạ tầng trí tuệ nhân tạo đang gia tăng giữa các công ty công nghệ hàng đầu toàn cầu. Theo những nguồn tin thân cận, khoảng tháng 3 năm nay, Google đã thông báo với Meta rằng họ không thể đáp ứng toàn bộ nhu cầu sức mạnh xử lý cho Gemini, đồng thời áp đặt hạn mức sử dụng đối với ông lớn mạng xã hội này - ngay cả nhà cung cấp dịch vụ AI lớn nhất thế giới cũng khó lòng ứng phó với làn sóng nhu cầu về sức mạnh xử lý đang tràn đến.
Theo báo cáo của tờ Financial Times (Anh), các hạn chế trên đến nay vẫn chưa được dỡ bỏ, dẫn đến nhiều dự án AI nội bộ của Meta bị ảnh hưởng và chậm trễ. Chịu tác động từ điều này, Meta đã yêu cầu nhân viên nâng cao hiệu quả sử dụng sức mạnh xử lý AI, thực hiện việc tính toán chi li các token AI trong nội bộ. Cả Google và Meta đều từ chối bình luận về vấn đề này.
Tình thế này buộc Google phải đẩy nhanh tốc độ mở rộng quy mô. Đầu tháng này, Google đã ký kết một thỏa thuận thuê sức mạnh xử lý trị giá 92 triệu USD mỗi tháng với SpaceX thuộc sở hữu của Elon Musk. CEO Google Sundar Pichai trong cuộc họp báo cáo tài chính quý I năm nay thừa nhận: "Gần đây chúng tôi thực sự đối mặt với những hạn chế về sức mạnh xử lý, nếu có thể đáp ứng được nhu cầu, doanh thu của mảng kinh doanh đám mây sẽ cao hơn."
Meta không phải là trường hợp duy nhất. Nhiều nguồn tin thân cận chỉ ra rằng các khách hàng doanh nghiệp khác của Google cũng chịu những hạn chế ở mức độ khác nhau, và Meta bị ảnh hưởng sâu sắc nhất do quy mô nhu cầu đặc biệt lớn. Sự việc này phản ánh sự bùng nổ tăng trưởng của khối lượng công việc suy luận AI, đã trở thành một trong những thách thức lớn nhất mà toàn ngành phải đối mặt.
Điểm nghẽn sức mạnh xử lý tiếp tục chịu áp lực, khách hàng lớn gánh chịu trước tiên
Mặc dù các công ty công nghệ lớn đã đổ hàng trăm tỷ USD vào chip, trung tâm dữ liệu và nguồn cung điện, việc cung cấp sức mạnh xử lý AI vẫn khó lòng theo kịp tốc độ tăng trưởng nhu cầu.
Doanh thu mảng kinh doanh đám mây của Google trong quý I lần đầu vượt mốc 20 tỷ USD, khối lượng hợp đồng đám mây đã ký kết nhưng chưa thực hiện tồn đọng tăng gần gấp đôi so với quý trước, vượt quá 460 tỷ USD. Pichai khẳng định rõ ràng, các hạn chế về sức mạnh xử lý vẫn sẽ tiếp tục trong thời gian tới.
Trong bối cảnh này, tác động đối với Meta càng nổi bật. Các nguồn tin thân cận cho biết, chính nhu cầu cao độ từ những khách hàng doanh nghiệp lớn như Meta đã trực tiếp thúc đẩy Google đẩy nhanh việc tìm kiếm nguồn sức mạnh xử lý bên ngoài. Khi doanh nghiệp triển khai hàng loạt chatbot, trợ lý lập trình và tác nhân AI, khối lượng công việc suy luận - tức là sức mạnh xử lý tiêu thụ khi mô hình đã được huấn luyện thực thi nhiệm vụ trong ứng dụng thực tế - đang trở thành điểm nghẽn cốt lõi của ngành.
Dự án nội bộ Meta bị cản trở, đẩy nhanh chuyển hướng sang mô hình tự phát triển
Meta sử dụng Gemini rộng rãi trong nội bộ, bao gồm kiểm duyệt an toàn nền tảng (như nhận diện nội dung lừa đảo, loại bỏ thông tin độc hại), chatbot hỗ trợ dịch vụ khách hàng và quảng cáo, cũng như một số quy trình làm việc nội bộ và phát triển mã, đồng thời kết hợp sử dụng các mô hình khác như Claude của Anthropic.
Theo những nguồn tin thân cận, Meta ban đầu chọn Gemini vì hiệu suất của nó vượt trội hơn so với mô hình mã nguồn mở Llama do công ty tự phát triển. Tuy nhiên, khi các hạn chế về sức mạnh xử lý thắt chặt, Meta đang đẩy nhanh việc di chuyển sang mô hình tự phát triển. Nhiều nguồn tin thân cận cho biết, Meta gần đây đã bắt đầu ưu tiên quảng bá mô hình Muse Spark mới ra mắt, mô hình này được đánh giá đã có thể cạnh tranh về hiệu suất với Gemini, giúp giảm sự phụ thuộc vào các mô hình bên ngoài.
CEO Meta Mark Zuckerberg trước đó liên tục tăng cường đầu tư vào nhân tài và cơ sở hạ tầng AI, cam kết xây dựng cái mà ông gọi là "siêu trí tuệ cá nhân". Khác với Google, Meta không có mảng kinh doanh đám mây, đang đẩy nhanh việc tự xây dựng hệ thống trung tâm dữ liệu, và cam kết đầu tư tích lũy 6000 tỷ USD tại Mỹ cho đến năm 2028.
Google mở rộng quy mô thông qua SpaceX, ngành công nghiệp tìm cách đột phá
Đối mặt với áp lực về sức mạnh xử lý, Google đã ký kết thỏa thuận thuê sức mạnh xử lý trị giá 92 triệu USD mỗi tháng với SpaceX vào tháng này, nhằm bù đắp khoảng trống cơ sở hạ tầng. Phòng thí nghiệm AI Anthropic cũng đã đạt được thỏa thuận tương tự với SpaceX vào tháng trước.
Việc Google áp dụng biện pháp hạn chế đối với Meta đã cung cấp một cửa sổ hiếm hoi cho bên ngoài, để có thể nhìn thấy áp lực thực sự mà nhà cung cấp dịch vụ AI hàng đầu thế giới phải đối mặt trong việc phân bổ sức mạnh xử lý. Hiện tại, điểm nghẽn cơ sở hạ tầng của toàn ngành AI đang lan từ phía huấn luyện sang phía suy luận, việc giải quyết mâu thuẫn cung cầu vẫn phụ thuộc vào việc hiện thực hóa một vòng đầu tư vốn quy mô lớn mới.





