Sức mạnh xử lý sắp cạn: Google thầm áp đặt hạn mức sử dụng Gemini đối với Meta

marsbitXuất bản vào 2026-06-29Cập nhật gần nhất vào 2026-06-29

Tóm tắt

Cuộc khủng hoảng hạ tầng AI đang leo thang giữa các gã khổng lồ công nghệ. Theo các nguồn tin, từ khoảng tháng 3, Google đã thông báo với Meta rằng họ không thể đáp ứng toàn bộ nhu cầu sử dụng mô hình Gemini và áp dụng giới hạn sử dụng, gây ra sự chậm trễ cho một số dự án AI nội bộ của Meta. Cả hai công ty từ chối bình luận. Tình trạng thiếu hụt năng lực tính toán (compute) buộc Google phải đẩy nhanh việc mở rộng, bao gồm ký hợp đồng thuê năng lực tính toán trị giá 920 triệu USD mỗi tháng với SpaceX của Elon Musk. Giám đốc điều hành Google Sundar Pichai thừa nhận hạn chế về compute đang ảnh hưởng đến doanh thu đám mây. Meta, một trong những khách hàng doanh nghiệp lớn nhất của Google, bị ảnh hưởng nặng nề nhất. Công ty này sử dụng Gemini cho nhiều mục đích như kiểm duyệt nội dung, chatbot hỗ trợ và phát triển mã nguồn. Để giảm phụ thuộc, Meta đang đẩy mạnh chuyển sang sử dụng mô hình tự phát triển như Muse Spark và tăng cường đầu tư vào hạ tầng data center riêng. Sự việc cho thấy áp lực ngày càng tăng từ khối lượng công việc suy luận (AI inference) sau khi mô hình được huấn luyện, trở thành một trong những thách thức lớn nhất của ngành, bất chấp hàng trăm tỷ USD đã được đổ vào chip và trung tâm dữ liệu.

Tác giả: Hứa Siêu

Mâu thuẫn cung cầu về cơ sở hạ tầng trí tuệ nhân tạo đang gia tăng giữa các công ty công nghệ hàng đầu toàn cầu. Theo những nguồn tin thân cận, khoảng tháng 3 năm nay, Google đã thông báo với Meta rằng họ không thể đáp ứng toàn bộ nhu cầu sức mạnh xử lý cho Gemini, đồng thời áp đặt hạn mức sử dụng đối với ông lớn mạng xã hội này - ngay cả nhà cung cấp dịch vụ AI lớn nhất thế giới cũng khó lòng ứng phó với làn sóng nhu cầu về sức mạnh xử lý đang tràn đến.

Theo báo cáo của tờ Financial Times (Anh), các hạn chế trên đến nay vẫn chưa được dỡ bỏ, dẫn đến nhiều dự án AI nội bộ của Meta bị ảnh hưởng và chậm trễ. Chịu tác động từ điều này, Meta đã yêu cầu nhân viên nâng cao hiệu quả sử dụng sức mạnh xử lý AI, thực hiện việc tính toán chi li các token AI trong nội bộ. Cả Google và Meta đều từ chối bình luận về vấn đề này.

Tình thế này buộc Google phải đẩy nhanh tốc độ mở rộng quy mô. Đầu tháng này, Google đã ký kết một thỏa thuận thuê sức mạnh xử lý trị giá 92 triệu USD mỗi tháng với SpaceX thuộc sở hữu của Elon Musk. CEO Google Sundar Pichai trong cuộc họp báo cáo tài chính quý I năm nay thừa nhận: "Gần đây chúng tôi thực sự đối mặt với những hạn chế về sức mạnh xử lý, nếu có thể đáp ứng được nhu cầu, doanh thu của mảng kinh doanh đám mây sẽ cao hơn."

Meta không phải là trường hợp duy nhất. Nhiều nguồn tin thân cận chỉ ra rằng các khách hàng doanh nghiệp khác của Google cũng chịu những hạn chế ở mức độ khác nhau, và Meta bị ảnh hưởng sâu sắc nhất do quy mô nhu cầu đặc biệt lớn. Sự việc này phản ánh sự bùng nổ tăng trưởng của khối lượng công việc suy luận AI, đã trở thành một trong những thách thức lớn nhất mà toàn ngành phải đối mặt.

Điểm nghẽn sức mạnh xử lý tiếp tục chịu áp lực, khách hàng lớn gánh chịu trước tiên

Mặc dù các công ty công nghệ lớn đã đổ hàng trăm tỷ USD vào chip, trung tâm dữ liệu và nguồn cung điện, việc cung cấp sức mạnh xử lý AI vẫn khó lòng theo kịp tốc độ tăng trưởng nhu cầu.

Doanh thu mảng kinh doanh đám mây của Google trong quý I lần đầu vượt mốc 20 tỷ USD, khối lượng hợp đồng đám mây đã ký kết nhưng chưa thực hiện tồn đọng tăng gần gấp đôi so với quý trước, vượt quá 460 tỷ USD. Pichai khẳng định rõ ràng, các hạn chế về sức mạnh xử lý vẫn sẽ tiếp tục trong thời gian tới.

Trong bối cảnh này, tác động đối với Meta càng nổi bật. Các nguồn tin thân cận cho biết, chính nhu cầu cao độ từ những khách hàng doanh nghiệp lớn như Meta đã trực tiếp thúc đẩy Google đẩy nhanh việc tìm kiếm nguồn sức mạnh xử lý bên ngoài. Khi doanh nghiệp triển khai hàng loạt chatbot, trợ lý lập trình và tác nhân AI, khối lượng công việc suy luận - tức là sức mạnh xử lý tiêu thụ khi mô hình đã được huấn luyện thực thi nhiệm vụ trong ứng dụng thực tế - đang trở thành điểm nghẽn cốt lõi của ngành.

Dự án nội bộ Meta bị cản trở, đẩy nhanh chuyển hướng sang mô hình tự phát triển

Meta sử dụng Gemini rộng rãi trong nội bộ, bao gồm kiểm duyệt an toàn nền tảng (như nhận diện nội dung lừa đảo, loại bỏ thông tin độc hại), chatbot hỗ trợ dịch vụ khách hàng và quảng cáo, cũng như một số quy trình làm việc nội bộ và phát triển mã, đồng thời kết hợp sử dụng các mô hình khác như Claude của Anthropic.

Theo những nguồn tin thân cận, Meta ban đầu chọn Gemini vì hiệu suất của nó vượt trội hơn so với mô hình mã nguồn mở Llama do công ty tự phát triển. Tuy nhiên, khi các hạn chế về sức mạnh xử lý thắt chặt, Meta đang đẩy nhanh việc di chuyển sang mô hình tự phát triển. Nhiều nguồn tin thân cận cho biết, Meta gần đây đã bắt đầu ưu tiên quảng bá mô hình Muse Spark mới ra mắt, mô hình này được đánh giá đã có thể cạnh tranh về hiệu suất với Gemini, giúp giảm sự phụ thuộc vào các mô hình bên ngoài.

CEO Meta Mark Zuckerberg trước đó liên tục tăng cường đầu tư vào nhân tài và cơ sở hạ tầng AI, cam kết xây dựng cái mà ông gọi là "siêu trí tuệ cá nhân". Khác với Google, Meta không có mảng kinh doanh đám mây, đang đẩy nhanh việc tự xây dựng hệ thống trung tâm dữ liệu, và cam kết đầu tư tích lũy 6000 tỷ USD tại Mỹ cho đến năm 2028.

Google mở rộng quy mô thông qua SpaceX, ngành công nghiệp tìm cách đột phá

Đối mặt với áp lực về sức mạnh xử lý, Google đã ký kết thỏa thuận thuê sức mạnh xử lý trị giá 92 triệu USD mỗi tháng với SpaceX vào tháng này, nhằm bù đắp khoảng trống cơ sở hạ tầng. Phòng thí nghiệm AI Anthropic cũng đã đạt được thỏa thuận tương tự với SpaceX vào tháng trước.

Việc Google áp dụng biện pháp hạn chế đối với Meta đã cung cấp một cửa sổ hiếm hoi cho bên ngoài, để có thể nhìn thấy áp lực thực sự mà nhà cung cấp dịch vụ AI hàng đầu thế giới phải đối mặt trong việc phân bổ sức mạnh xử lý. Hiện tại, điểm nghẽn cơ sở hạ tầng của toàn ngành AI đang lan từ phía huấn luyện sang phía suy luận, việc giải quyết mâu thuẫn cung cầu vẫn phụ thuộc vào việc hiện thực hóa một vòng đầu tư vốn quy mô lớn mới.

Câu hỏi Liên quan

QThông tin chính về việc Google giới hạn Meta sử dụng Gemini được tiết lộ vào thời gian nào?

AThông tin được tiết lộ rằng Google đã thông báo cho Meta về việc không thể đáp ứng toàn bộ nhu cầu điện toán cho Gemini và áp dụng giới hạn sử dụng vào khoảng tháng 3 năm nay.

QTác động chính của việc Google áp dụng giới hạn đối với Meta là gì?

AViệc áp dụng giới hạn đã gây ra sự gián đoạn và chậm trễ cho nhiều dự án AI nội bộ của Meta, buộc công ty này phải yêu cầu nhân viên nâng cao hiệu quả sử dụng điện toán AI và tiết kiệm chi tiêu token AI.

QGoogle đã thực hiện biện pháp nào để giải quyết tình trạng thiếu hụt năng lực điện toán?

AĐể giải quyết tình trạng thiếu hụt, Google đã ký một thỏa thuận thuê năng lực điện toán trị giá 920 triệu USD mỗi tháng với SpaceX, công ty thuộc sở hữu của Elon Musk.

QPhản ứng của Meta trước hạn chế từ Google là gì?

AMeta đang đẩy nhanh quá trình chuyển đổi sang sử dụng mô hình tự nghiên cứu, đặc biệt là ưu tiên triển khai mô hình Muse Spark mới, nhằm giảm sự phụ thuộc vào các mô hình bên ngoài như Gemini.

QNguyên nhân chính dẫn đến tình trạng thiếu hụt năng lực điện toán AI trong ngành là gì?

ANguyên nhân chính là sự bùng nổ của khối lượng công việc suy luận AI (AI inference workload) sau khi mô hình được huấn luyện, khi các doanh nghiệp triển khai hàng loạt chatbot, trợ lý lập trình và tác nhân AI, khiến nguồn cung điện toán không theo kịp tốc độ tăng trưởng nhu cầu.

Nội dung Liên quan

IBIT Ghi Nhận Dòng Tiền Ròng Rút 1.3 Tỷ USD Trong Một Tuần, ETF Bitcoin Lớn Nhất Đang Trở Thành Bức Tường Bán Áp Lực Mà Phe Mua Phải Vượt Qua

Bài viết phân tích về tình trạng ròng dòng tiền ra mạnh mẽ từ quỹ ETF Bitcoin trực tiếp lớn nhất của BlackRock, iShares Bitcoin Trust (IBIT), trong tuần giao dịch từ 22-26/6, với mức rút ròng lên tới 1,3 tỷ USD, chiếm gần 73% tổng dòng tiền ra từ toàn bộ nhóm ETF Bitcoin trực tiếp tại Mỹ. Điều này đánh dấu một sự thay đổi cấu trúc thị trường quan trọng: kênh tiếp cận hợp quy định chính từng thúc đẩy câu chuyện "nhu cầu thể chế" giờ đây có thể đang vận hành theo chiều ngược lại, trở thành một nguồn cung cấp áp lực bán tập trung. Áp lực tập trung vào IBIT, sản phẩm có quy mô lớn và tính thanh khoản cao nhất, khiến nó trở thành điểm thử nghiệm then chốt cho đà phục hồi của Bitcoin quanh ngưỡng 60.000 USD. Bài viết đặt ra hai kịch bản: Nếu dòng tiền ra từ IBIT chậm lại và Bitcoin giữ được vùng giá cao, đây có thể chỉ là đợt thanh lọc. Ngược lại, nếu IBIT tiếp tục dẫn đầu dòng tiền ra và Bitcoin không thể củng cố trên 60.000 USD, áp lực bán cấu trúc từ ETF có thể trở thành một rào cản lâu dài, buộc thị trường giao ngang phải hấp thụ lượng cung này mà không có sự hỗ trợ từ câu chuyện ETF trước đây. Các ngày giao dịch sắp tới sẽ có ý nghĩa quyết định trong việc xác định hướng đi tiếp theo của thị trường.

marsbit5 phút trước

IBIT Ghi Nhận Dòng Tiền Ròng Rút 1.3 Tỷ USD Trong Một Tuần, ETF Bitcoin Lớn Nhất Đang Trở Thành Bức Tường Bán Áp Lực Mà Phe Mua Phải Vượt Qua

marsbit5 phút trước

"Ông Vua Kêu Gọi" Hayes Lại Ra Tay, Lần Này Mục Tiêu Là Deribit

BitMEX đồng sáng lập Arthur Hayes mua 6,16 triệu đồng SYN, trị giá khoảng 2,2 triệu USD, qua nền tảng OTC Flowdesk. Trên X, Hayes tuyên bố SYN là một trong những khoản đầu tư bất đối xứng nhất mà ông thấy kể từ HYPE và cho rằng đã đến lúc một DEX quyền chọn thách thức Deribit, với Hypercall là đối thủ. Synapse Protocol ban đầu là mạng lưới thanh khoản và truyền tin đa chuỗi, TVL từng đạt trên 10 tỷ USD. Hiện tại, dự án chuyển hướng sang quyền chọn trên chuỗi với Hypercall, được xây dựng trên HyperEVM của Hyperliquid, hướng tới mục tiêu trở thành sàn giao dịch quyền chọn cho mọi tài sản. Hypercall nhấn mạnh ưu điểm không cần KYC, không có rủi ro thanh lý dây chuyền và giao dịch 24/7. Deribit, thành lập năm 2016, hiện chiếm thị phần khoảng 85% trong thị trường quyền chọn BTC và ETH, với tổng tài sản trị giá 35,88 tỷ USD. Tuy nhiên, nó tồn tại những hạn chế của mô hình tập trung như rủi ro lưu ký và rào cản pháp lý. Hayes kỳ vọng Hypercall có thể bổ sung và cạnh tranh khác biệt, đặc biệt trong lĩnh vực quyền chọn cho tài sản DeFi nguyên bản và mới nổi. Hayes gần đây có một số lần "kêu gọi" gây chú ý. Ông từng tích cực ủng hộ HYPE nhưng sau đó bán toàn bộ, rồi lại mua lại một phần. Báo cáo nghiên cứu của công ty gia đình Maelstrom về CARDS cũng gây tranh cãi khi giá sau đó giảm mạnh. Điều này khiến Hayes bị chỉ trích có thể tạo ra "thanh khoản thoát" cho người theo dõi, dù ông phản bác rằng mình chỉ giao dịch bình thường.

Foresight News16 phút trước

"Ông Vua Kêu Gọi" Hayes Lại Ra Tay, Lần Này Mục Tiêu Là Deribit

Foresight News16 phút trước

Một năm sau vụ sụp đổ của các công ty kho bạc tiền mã hóa, những kẻ bắt chước đã quay trở lại

Tóm tắt: Chỉ một năm sau sự sụp đổ thảm hại của các công ty kho bạc số (DAT) - nơi nhà đầu tư mất tới 99% giá trị - cùng một mô hình lừa đảo đã quay trở lại. Lần này, chúng được ngụy trang dưới dạng "công ty kho bạc" nắm giữ cổ phiếu SpaceX hoặc token HYPE. Bài viết điểm lại cơn sốt ban đầu do MicroStrategy khởi xướng, với việc cổ phiếu giao dịch ở mức cao gấp đôi giá trị tài sản ròng (NAV), và sự sụp đổ tiếp theo của hàng loạt công ty bắt chước như TwentyOne, Metaplanet và Nakamoto (mất tới 99.35% giá trị). Tác giả chỉ ra rằng không có lý do cơ bản nào cho các khoản phí bảo hiểm này khi đã có Bitcoin ETF và việc tự nắm giữ tài sản. Hiện tượng này được thúc đẩy bởi sự kết hợp giữa FOMO, đầu cơ và tâm lý cho rằng thị trường bị thao túng, tạo điều kiện cho những người trong cuộc thao túng giá (pump and dump) kiếm lợi. Thông điệp cuối cùng: lịch sử luôn lặp lại; đối với những kẻ vận hành, "pump and dump" không phải là lỗ hổng mà chính là sản phẩm, và chu kỳ tham lam-sợ hãi vẫn tiếp diễn khi các nhà đầu tư nhỏ lẻ tiếp tục trả giá.

marsbit27 phút trước

Một năm sau vụ sụp đổ của các công ty kho bạc tiền mã hóa, những kẻ bắt chước đã quay trở lại

marsbit27 phút trước

Chiều nay, Hàn Quốc sẽ đặt cược vận mệnh quốc gia trong mười năm tới

Văn phòng Tổng thống Hàn Quốc thông báo, Tập đoàn Samsung và SK sẽ công bố một kế hoạch đầu tư lớn với sự chủ trì của Tổng thống Lee Jae-myung. Báo chí tiết lộ kế hoạch này có quy mô lên tới 2000 nghìn tỷ won (khoảng 1,3 nghìn tỷ USD). Trong mười năm tới, hai tập đoàn sẽ tăng cường đầu tư mạnh mẽ vào ngành công nghiệp bán dẫn trong nước, xây dựng nhiều nhà máy sản xuất chip mới tại Gwangju và các khu vực khác. Sự kiện này được xem là một chiến lược công nghiệp trọng điểm do chính phủ Hàn Quốc dẫn dắt, thể hiện cam kết mạnh mẽ của quốc gia này đối với kỷ nguyên AI. Lý do chính cho khoản đầu tư khổng lồ này xuất phát từ sự thay đổi của ngành công nghiệp bộ nhớ dưới tác động của AI. Nhu cầu về bộ nhớ hiệu suất cao, đặc biệt là bộ nhớ băng thông cao (HBM) cho việc đào tạo mô hình lớn và trung tâm dữ liệu AI, đang bùng nổ, đưa bộ nhớ từ một bộ phận phụ trở thành trung tâm của chuỗi cung ứng AI. Hàn Quốc đang đặt cược vào giả định rằng nhu cầu AI đối với bộ nhớ hiệu suất cao không phải là một chu kỳ ngắn hạn mà là một làn sóng công nghiệp kéo dài ít nhất một thập kỷ. Tuy nhiên, ngành bộ nhớ vốn có tính chu kỳ mạnh mẽ. Câu hỏi đặt ra là liệu AI có thể loại bỏ tính chu kỳ này hay chỉ kéo dài nó thành một "siêu chu kỳ". Kế hoạch đầu tư 10 năm của Hàn Quốc chính là lời cam kết mạnh mẽ, nhưng câu trả lời cuối cùng chỉ có thời gian mới xác định được.

Odaily星球日报50 phút trước

Chiều nay, Hàn Quốc sẽ đặt cược vận mệnh quốc gia trong mười năm tới

Odaily星球日报50 phút trước

Giao dịch

Giao ngay
活动图片