Sức mạnh xử lý sắp cạn: Google thầm áp đặt hạn mức sử dụng Gemini đối với Meta

marsbitXuất bản vào 2026-06-29Cập nhật gần nhất vào 2026-06-29

Tóm tắt

Cuộc khủng hoảng hạ tầng AI đang leo thang giữa các gã khổng lồ công nghệ. Theo các nguồn tin, từ khoảng tháng 3, Google đã thông báo với Meta rằng họ không thể đáp ứng toàn bộ nhu cầu sử dụng mô hình Gemini và áp dụng giới hạn sử dụng, gây ra sự chậm trễ cho một số dự án AI nội bộ của Meta. Cả hai công ty từ chối bình luận. Tình trạng thiếu hụt năng lực tính toán (compute) buộc Google phải đẩy nhanh việc mở rộng, bao gồm ký hợp đồng thuê năng lực tính toán trị giá 920 triệu USD mỗi tháng với SpaceX của Elon Musk. Giám đốc điều hành Google Sundar Pichai thừa nhận hạn chế về compute đang ảnh hưởng đến doanh thu đám mây. Meta, một trong những khách hàng doanh nghiệp lớn nhất của Google, bị ảnh hưởng nặng nề nhất. Công ty này sử dụng Gemini cho nhiều mục đích như kiểm duyệt nội dung, chatbot hỗ trợ và phát triển mã nguồn. Để giảm phụ thuộc, Meta đang đẩy mạnh chuyển sang sử dụng mô hình tự phát triển như Muse Spark và tăng cường đầu tư vào hạ tầng data center riêng. Sự việc cho thấy áp lực ngày càng tăng từ khối lượng công việc suy luận (AI inference) sau khi mô hình được huấn luyện, trở thành một trong những thách thức lớn nhất của ngành, bất chấp hàng trăm tỷ USD đã được đổ vào chip và trung tâm dữ liệu.

Tác giả: Hứa Siêu

Mâu thuẫn cung cầu về cơ sở hạ tầng trí tuệ nhân tạo đang gia tăng giữa các công ty công nghệ hàng đầu toàn cầu. Theo những nguồn tin thân cận, khoảng tháng 3 năm nay, Google đã thông báo với Meta rằng họ không thể đáp ứng toàn bộ nhu cầu sức mạnh xử lý cho Gemini, đồng thời áp đặt hạn mức sử dụng đối với ông lớn mạng xã hội này - ngay cả nhà cung cấp dịch vụ AI lớn nhất thế giới cũng khó lòng ứng phó với làn sóng nhu cầu về sức mạnh xử lý đang tràn đến.

Theo báo cáo của tờ Financial Times (Anh), các hạn chế trên đến nay vẫn chưa được dỡ bỏ, dẫn đến nhiều dự án AI nội bộ của Meta bị ảnh hưởng và chậm trễ. Chịu tác động từ điều này, Meta đã yêu cầu nhân viên nâng cao hiệu quả sử dụng sức mạnh xử lý AI, thực hiện việc tính toán chi li các token AI trong nội bộ. Cả Google và Meta đều từ chối bình luận về vấn đề này.

Tình thế này buộc Google phải đẩy nhanh tốc độ mở rộng quy mô. Đầu tháng này, Google đã ký kết một thỏa thuận thuê sức mạnh xử lý trị giá 92 triệu USD mỗi tháng với SpaceX thuộc sở hữu của Elon Musk. CEO Google Sundar Pichai trong cuộc họp báo cáo tài chính quý I năm nay thừa nhận: "Gần đây chúng tôi thực sự đối mặt với những hạn chế về sức mạnh xử lý, nếu có thể đáp ứng được nhu cầu, doanh thu của mảng kinh doanh đám mây sẽ cao hơn."

Meta không phải là trường hợp duy nhất. Nhiều nguồn tin thân cận chỉ ra rằng các khách hàng doanh nghiệp khác của Google cũng chịu những hạn chế ở mức độ khác nhau, và Meta bị ảnh hưởng sâu sắc nhất do quy mô nhu cầu đặc biệt lớn. Sự việc này phản ánh sự bùng nổ tăng trưởng của khối lượng công việc suy luận AI, đã trở thành một trong những thách thức lớn nhất mà toàn ngành phải đối mặt.

Điểm nghẽn sức mạnh xử lý tiếp tục chịu áp lực, khách hàng lớn gánh chịu trước tiên

Mặc dù các công ty công nghệ lớn đã đổ hàng trăm tỷ USD vào chip, trung tâm dữ liệu và nguồn cung điện, việc cung cấp sức mạnh xử lý AI vẫn khó lòng theo kịp tốc độ tăng trưởng nhu cầu.

Doanh thu mảng kinh doanh đám mây của Google trong quý I lần đầu vượt mốc 20 tỷ USD, khối lượng hợp đồng đám mây đã ký kết nhưng chưa thực hiện tồn đọng tăng gần gấp đôi so với quý trước, vượt quá 460 tỷ USD. Pichai khẳng định rõ ràng, các hạn chế về sức mạnh xử lý vẫn sẽ tiếp tục trong thời gian tới.

Trong bối cảnh này, tác động đối với Meta càng nổi bật. Các nguồn tin thân cận cho biết, chính nhu cầu cao độ từ những khách hàng doanh nghiệp lớn như Meta đã trực tiếp thúc đẩy Google đẩy nhanh việc tìm kiếm nguồn sức mạnh xử lý bên ngoài. Khi doanh nghiệp triển khai hàng loạt chatbot, trợ lý lập trình và tác nhân AI, khối lượng công việc suy luận - tức là sức mạnh xử lý tiêu thụ khi mô hình đã được huấn luyện thực thi nhiệm vụ trong ứng dụng thực tế - đang trở thành điểm nghẽn cốt lõi của ngành.

Dự án nội bộ Meta bị cản trở, đẩy nhanh chuyển hướng sang mô hình tự phát triển

Meta sử dụng Gemini rộng rãi trong nội bộ, bao gồm kiểm duyệt an toàn nền tảng (như nhận diện nội dung lừa đảo, loại bỏ thông tin độc hại), chatbot hỗ trợ dịch vụ khách hàng và quảng cáo, cũng như một số quy trình làm việc nội bộ và phát triển mã, đồng thời kết hợp sử dụng các mô hình khác như Claude của Anthropic.

Theo những nguồn tin thân cận, Meta ban đầu chọn Gemini vì hiệu suất của nó vượt trội hơn so với mô hình mã nguồn mở Llama do công ty tự phát triển. Tuy nhiên, khi các hạn chế về sức mạnh xử lý thắt chặt, Meta đang đẩy nhanh việc di chuyển sang mô hình tự phát triển. Nhiều nguồn tin thân cận cho biết, Meta gần đây đã bắt đầu ưu tiên quảng bá mô hình Muse Spark mới ra mắt, mô hình này được đánh giá đã có thể cạnh tranh về hiệu suất với Gemini, giúp giảm sự phụ thuộc vào các mô hình bên ngoài.

CEO Meta Mark Zuckerberg trước đó liên tục tăng cường đầu tư vào nhân tài và cơ sở hạ tầng AI, cam kết xây dựng cái mà ông gọi là "siêu trí tuệ cá nhân". Khác với Google, Meta không có mảng kinh doanh đám mây, đang đẩy nhanh việc tự xây dựng hệ thống trung tâm dữ liệu, và cam kết đầu tư tích lũy 6000 tỷ USD tại Mỹ cho đến năm 2028.

Google mở rộng quy mô thông qua SpaceX, ngành công nghiệp tìm cách đột phá

Đối mặt với áp lực về sức mạnh xử lý, Google đã ký kết thỏa thuận thuê sức mạnh xử lý trị giá 92 triệu USD mỗi tháng với SpaceX vào tháng này, nhằm bù đắp khoảng trống cơ sở hạ tầng. Phòng thí nghiệm AI Anthropic cũng đã đạt được thỏa thuận tương tự với SpaceX vào tháng trước.

Việc Google áp dụng biện pháp hạn chế đối với Meta đã cung cấp một cửa sổ hiếm hoi cho bên ngoài, để có thể nhìn thấy áp lực thực sự mà nhà cung cấp dịch vụ AI hàng đầu thế giới phải đối mặt trong việc phân bổ sức mạnh xử lý. Hiện tại, điểm nghẽn cơ sở hạ tầng của toàn ngành AI đang lan từ phía huấn luyện sang phía suy luận, việc giải quyết mâu thuẫn cung cầu vẫn phụ thuộc vào việc hiện thực hóa một vòng đầu tư vốn quy mô lớn mới.

Câu hỏi Liên quan

QThông tin chính về việc Google giới hạn Meta sử dụng Gemini được tiết lộ vào thời gian nào?

AThông tin được tiết lộ rằng Google đã thông báo cho Meta về việc không thể đáp ứng toàn bộ nhu cầu điện toán cho Gemini và áp dụng giới hạn sử dụng vào khoảng tháng 3 năm nay.

QTác động chính của việc Google áp dụng giới hạn đối với Meta là gì?

AViệc áp dụng giới hạn đã gây ra sự gián đoạn và chậm trễ cho nhiều dự án AI nội bộ của Meta, buộc công ty này phải yêu cầu nhân viên nâng cao hiệu quả sử dụng điện toán AI và tiết kiệm chi tiêu token AI.

QGoogle đã thực hiện biện pháp nào để giải quyết tình trạng thiếu hụt năng lực điện toán?

AĐể giải quyết tình trạng thiếu hụt, Google đã ký một thỏa thuận thuê năng lực điện toán trị giá 920 triệu USD mỗi tháng với SpaceX, công ty thuộc sở hữu của Elon Musk.

QPhản ứng của Meta trước hạn chế từ Google là gì?

AMeta đang đẩy nhanh quá trình chuyển đổi sang sử dụng mô hình tự nghiên cứu, đặc biệt là ưu tiên triển khai mô hình Muse Spark mới, nhằm giảm sự phụ thuộc vào các mô hình bên ngoài như Gemini.

QNguyên nhân chính dẫn đến tình trạng thiếu hụt năng lực điện toán AI trong ngành là gì?

ANguyên nhân chính là sự bùng nổ của khối lượng công việc suy luận AI (AI inference workload) sau khi mô hình được huấn luyện, khi các doanh nghiệp triển khai hàng loạt chatbot, trợ lý lập trình và tác nhân AI, khiến nguồn cung điện toán không theo kịp tốc độ tăng trưởng nhu cầu.

Nội dung Liên quan

Một nhóm người chơi trên chain không xem World Cup, đã làm giàu từ ANSEM

Bài báo chia sẻ câu chuyện về sự bùng nổ của memecoin ANSEM trên mạng Solana. Trong vòng chưa đầy một ngày, vốn hóa của ANSEM đã tăng từ khoảng 4 triệu USD lên hơn 100 triệu USD, tạo ra những câu chuyện làm giàu nhanh chóng, như trường hợp một nhà đầu tư thu về lợi nhuận gấp 135 lần. ANSEM không phải do KOL nổi tiếng Ansem (Zion Thomas) phát hành hay bảo trợ, mà là một đồng memecoin cộng đồng có tên "The Black Bull". Tuy nhiên, mối liên hệ trong tâm trí cộng đồng được củng cố khi người tạo ra ANSEM gửi khoảng 65% tổng nguồn cung vào ví công khai của Ansem. Đợt tăng giá mạnh bắt đầu sau khi Ansem thông báo trên X rằng anh sẽ sử dụng phí sáng tạo kiếm được từ Pump.fun (khoảng 200.000 USD/tuần) để airdrop ngẫu nhiên cho người hâm mộ. Thông điệp này đã đánh trúng tâm lý thất vọng của nhiều người chơi đang chờ đợi airdrop từ PUMP, biến ANSEM thành tài sản được giao dịch để "thể hiện cảm xúc" này. Bài báo nhấn mạnh rằng đà tăng của ANSEM chủ yếu được thúc đẩy bởi cảm xúc, sự chú ý và cấu trúc nguồn cung (phần lớn bị khóa trong ví của Ansem, làm giảm nguồn cung lưu hành thực tế). Trong khi nó mang lại cảm giác phấn khích cho thị trường memecoin Solana, bài viết cũng cảnh báo rằng đây là một động thái mang tính đầu cơ cao, dễ biến động và phụ thuộc vào việc cộng đồng có tiếp tục duy trì câu chuyện hay không.

Odaily星球日报30 phút trước

Một nhóm người chơi trên chain không xem World Cup, đã làm giàu từ ANSEM

Odaily星球日报30 phút trước

Câu hỏi "Anh có chắc không?" khiến mô hình lớn AI bộc lộ "tính cách xu nịnh"?

Ngay cả các mô hình AI mạnh mẽ nhất cũng khó cưỡng lại sự nghi ngờ lặp đi lặp lại từ người dùng. Một bài đăng gần đây trên X của shadcn@shadcn đã gây bão trong cộng đồng phát triển và nghiên cứu AI: "Không có mô hình nào có thể đứng vững trước câu hỏi 'Bạn có chắc không?' - tất cả đều nhanh chóng đầu hàng." Điều này phản ánh một tình huống phổ biến: người dùng chỉ cần hỏi lại "Bạn có chắc không?" mà không cung cấp thông tin mới, nhiều mô hình lớn (LLM) lập tức xin lỗi, sửa đổi câu trả lời, thậm chí biến một đáp án đúng thành sai. Trong phần bình luận, nhiều người dùng chia sẻ trải nghiệm tương tự, nơi AI dễ dàng bị "gaslight" (thao túng tâm lý) để đưa ra câu trả lời kém hơn dù ban đầu nó đúng. Họ nhận xét các mô hình thiếu sự tự tin thực sự; sự chắc chắn của chúng chỉ là cảm giác được đóng gói thành sự tự tin. Tuy nhiên, một số người dùng chỉ ra rằng không phải tất cả mô hình đều như vậy. Ví dụ, AI trợ lý Poke của The Interaction Company và Claude Opus 4.8 của Anthropic có thể giữ vững lập trường khi bị chất vấn. Claude Opus 4.6 cũng được khen ngợi nhờ khả năng "chịu được áp lực" nếu được hướng dẫn trong prompt hệ thống rằng nên phản đối khi chắc chắn. Nguyên nhân sâu xa của hành vi "xu nịnh" này thường được quy cho "lời nguyền" từ quá trình Huấn luyện Củng cố bằng Phản hồi Con người (RLHF). Trong quá trình căn chỉnh, các mô hình được khen thưởng vì an toàn, lịch sự và tuân theo mong đợi của con người. Việc "cãi lại" hoặc kiên định có thể bị trừng phạt, trong khi xin lỗi và tuân theo người dùng là con đường an toàn để đạt điểm cao, vô hình trung tạo ra "nhân cách xu nịnh" ở AI. Hiện tượng này còn được gọi là "AI sycophancy" - sự hy sinh tính nhất quán thực tế để chiều theo khuynh hướng người dùng. Một số ý kiến cho rằng cần có một tiêu chuẩn đánh giá (benchmark) mới, chẳng hạn như benchmark "Bạn có chắc không?", để đo lường khả năng giữ vững lập trường của mô hình khi bị người dùng chất vấn sau khi đã đưa ra câu trả lời đúng. Một trợ lý AI đủ tiêu chuẩn không chỉ cần chính xác trong các bài kiểm tra tĩnh mà còn phải có khả năng chống nhiễu và duy trì ranh giới phán đoán trong đối thoại thực tế.

marsbit1 giờ trước

Câu hỏi "Anh có chắc không?" khiến mô hình lớn AI bộc lộ "tính cách xu nịnh"?

marsbit1 giờ trước

Giao dịch

Giao ngay
活动图片