
Là 'quái vật nuốt vàng' được Silicon Valley công nhận, Mark Zuckerberg đột nhiên quyết định không còn là một người mua sức mạnh tính toán thuần túy nữa.
Theo một báo cáo từ Bloomberg, Meta đang chuẩn bị bán sức mạnh tính toán AI 'dư thừa' nội bộ của mình cho khách hàng bên ngoài.
Động thái này đã trực tiếp gây ra một đợt bán tháo dây chuyền trong lĩnh vực cơ sở hạ tầng AI vào ngày 2 tháng 7. Nvidia giảm, TSMC giảm, AMD giảm, Micron giảm, CoreWeave lao dốc.
Cả ngành cơ sở hạ tầng AI mất tổng cộng nghìn tỷ USD vốn hóa thị trường chỉ sau một đêm. Bản thân Meta, ngược lại, tăng 8%.
Nhìn lại, đây chỉ là một quyết định kinh doanh rất bình thường. Một công ty, đem tài nguyên nhàn rỗi ra bán kiếm tiền. Ở bất kỳ ngành nào, việc này còn chẳng đáng thành tin tức.
Nhưng đặt trong ngành AI, nó gần như tương đương với việc nói công khai một câu: Ở đây, tôi vẫn còn thừa.
Thị trường lập tức im lặng. Hai năm qua, chỉ có một câu duy nhất chống đỡ toàn bộ định giá của ngành công nghiệp AI: Sức mạnh tính toán mãi mãi không đủ.
Một, Thị Trường Bò AI, Là Một Câu Chuyện Búp Bê Nga
Để hiểu tại sao thị trường phản ứng lớn như vậy, trước tiên phải hiểu hai năm qua AI kiếm tiền như thế nào.
Chính xác mà nói, là được định giá như thế nào.
Toàn bộ ngành công nghiệp AI thực chất chỉ có một vòng lặp thương mại:
AI cần GPU → GPU bán chạy như tôm tươi → HBM bán chạy → PCB bán chạy → Bộ chuyển mạch bán chạy → Mô-đun quang bán chạy → Điện bán chạy → Trung tâm dữ liệu bán chạy → Tiếp tục mua GPU
Cứ lặp đi lặp lại như vậy.
Thị trường vốn đã đặt cược vô số tiền thật vào chuỗi này.
Từ đó hình thành một công thức đơn giản và thô bạo: Tăng trưởng AI = Tăng trưởng GPU = Sức mạnh tính toán luôn khan hiếm
Tại sao Nvidia từng chạm mốc vốn hóa 6 nghìn tỷ USD? Chống đỡ con số này là niềm tin của tất cả mọi người rằng GPU sẽ mãi mãi cung không đủ cầu.
Giả định về sự mất cân bằng cung-cầu cực độ này, là mô hình định giá cốt lõi nhất của toàn bộ thị trường bò AI trong hai năm qua.
Thậm chí đã trở thành một niềm tin được công nhận.
Nhờ niềm tin này, HBM từ cổ phiếu chu kỳ biến thành cổ phiếu tăng trưởng; mô-đun quang từ sản phẩm công nghiệp biến thành tài sản cốt lõi AI, tạo ra những huyền thoại làm giàu.
Nhưng điểm khởi đầu của tất cả những câu chuyện này, đều là cùng một câu: Sức mạnh tính toán không đủ.
Chỉ cần câu này còn đứng vững, mỗi mắt xích trên chuỗi đều có câu chuyện để kể.
Một khi câu này bị lung lay, toàn bộ chuỗi đều phải tính toán lại.
Giám đốc Delta One của Goldman Sachs, Rich Privotsky, nói rất thẳng thắn trong một cuộc họp nội bộ gần đây:
Tiền đề cốt lõi trước đây của thị trường là sức mạnh tính toán đang trong tình trạng khan hiếm, nếu tiền đề này bị lung lay, lĩnh vực đầu tiên bị ảnh hưởng là phần cứng.
Ông ấy không nói sẽ lung lay, ông ấy nói là 'nếu'.
Và tin tức về Meta, đã biến cái 'nếu' đó, từ giả định thành một câu hỏi.
Hai, Tại Sao Meta Lại Bán Ngay Bây Giờ?
Việc Meta bán sức mạnh tính toán, điều được thảo luận nhiều nhất bên ngoài là kiếm thêm một khoản tiền.
Cách nói này không sai, nhưng chưa chạm tới gốc rễ.
Meta làm việc này, ít nhất có ba động cơ.
Tầng thứ nhất, tỷ lệ sử dụng.
Chi tiêu vốn của Meta năm 2025 đã gần 70 tỷ USD, dự báo năm 2026 tiếp tục tăng, thị trường kỳ vọng phổ biến ở mức nghìn tỷ USD.
Số tiền này đổi lại là hàng trăm nghìn GPU, hàng trăm megawatt điện, đội ngũ vận hành hàng nghìn người.
Đặc điểm của phát triển mô hình lớn là phi tuyến tính, giai đoạn huấn luyện cần dồn toàn bộ sức mạnh tính toán đẩy lên đỉnh, nhưng một khi bước vào giai đoạn tinh chỉnh mô hình, căn chỉnh hoặc chờ đánh giá, nhu cầu sức mạnh tính toán sẽ xuất hiện thung lũng sâu thẳm.
Giai đoạn thung lũng, để không cũng là khấu hao.
Một lượng lớn GPU chạy không tải trong phòng máy, mỗi giây đều tiêu hao chi phí khấu hao đắt đỏ và điện năng cơ bản. Thay vì để card đồ họa bám bụi trong kho, không bằng cho thuê ra ngoài.
Tầng thứ hai, lựa chọn con đường.
Đây mới là then chốt.
Hai năm qua, con đường về AI của các đại gia Silicon Valley đã bắt đầu phân nhánh.
OpenAI bán API, Anthropic bán API, Google bán API + Mô hình. Microsoft bán API + Đám mây.
Meta thì sao? Llama không đặt rào cản, mã nguồn mô hình công khai toàn bộ, khung Agent cũng không tính phí riêng, hầu như không kiếm được tiền từ API.
Giới bên ngoài luôn diễn giải việc này là chủ nghĩa lý tưởng mã nguồn mở.
Zuckerberg không phải nhà từ thiện. Ông ấy chỉ không muốn trở thành OpenAI, ông ấy muốn trở thành AWS.
Thời Facebook, Meta kiếm tiền nhờ mạng xã hội.
Thời đại AI, cược của Meta là:
Mô hình không kiếm tiền không sao, sức mạnh tính toán kiếm tiền.
Llama mở cửa, là để kéo nhà phát triển vào hệ sinh thái của Meta. Khung Agent không tính phí riêng, là để đội ngũ AI chạy tác vụ trên đám mây của Meta.
Cuối cùng muốn kiếm, là số tiền sức mạnh tính toán ở tầng đáy.
Nhìn lại lịch sử internet, Amazon ban đầu làm AWS, cũng không phải để kiếm thêm một khoản tiền. Jeff Bezos chỉ muốn cho thuê dung lượng dư thừa mà máy chủ thương mại điện tử Amazon dự phòng cho 'Black Friday'.
Kết quả AWS sau này trở thành bộ phận kiếm tiền nhất của Amazon, tỷ suất lợi nhuận gộp cao hơn hẳn bán lẻ.
Meta đang cược cùng một câu chuyện.
Tầng thứ ba, định nghĩa lại cơ sở hạ tầng AI.
Đây là tầng sâu hơn.
Trước đây nhắc đến cơ sở hạ tầng AI, phản ứng đầu tiên là GPU. Nhưng thứ Meta lần này đưa ra, về bản chất là một bộ dịch vụ hoàn chỉnh: GPU + Khung huấn luyện + Mô hình mã nguồn mở + Tối ưu suy luận + Đám mây của Meta.
Không phải bán đơn lẻ một tấm card, mà là bán một 'nhà máy AI'.
Nếu theo logic này đi tiếp, Meta muốn chiếm không phải thị trường GPU, mà là thị trường đám mây AI, GPU chỉ là lối vào.
AWS ngày xưa bán EC2, cũng không định vị mình là bán máy chủ, nó bán dịch vụ không cần tự mua máy chủ.
Việc Meta làm hôm nay, về bản chất là cùng một việc, chỉ là đối tượng từ khách hàng thương mại điện tử đổi thành đội ngũ AI.
Ba, Vốn Đang Sợ Điều Gì
Meta bán thêm vài tấm card, bản thân việc đó vốn không sợ.
Điều thực sự khiến vốn không thể ngồi yên, là tín hiệu đằng sau câu nói của Meta, có thể thành sự thật.
Meta nói là 'tôi có sức mạnh tính toán để bán'.
Tín hiệu thực tế truyền tải là, GPU có thể chia sẻ. Nếu GPU có thể chia sẻ, thì toàn bộ mô hình nhu cầu được xây dựng trong hai năm qua, đều phải tính toán lại.
Logic trước đây là, hoặc tự mua card, hoặc tự xây phòng máy, hoặc dự trữ hàng trước.
Cứ thêm một công ty AI, là thêm một đơn hàng GPU.
Trong logic tích trữ cực độ lo lắng này, sức mạnh tính toán trở thành hào nước phòng thủ mà các đại gia phòng bị lẫn nhau, tự mình xây dựng.
Nhưng nếu có thể thuê thì sao? Nếu có một gã khổng lồ, trong tay nắm hàng trăm nghìn GPU, lúc rảnh cho thuê ra ngoài thì sao?
Công ty AI mới gia nhập, không nhất thiết cần tự mua card, có thể trực tiếp gọi dùng.
Vậy mô hình nhu cầu GPU sẽ thay đổi, từ tăng trưởng tuyến tính theo số lượng nhà sản xuất, biến thành điều chỉnh động theo lượng gọi thực tế toàn mạng.
Đây là hai logic định giá hoàn toàn khác nhau.
Có thể so sánh với một lịch sử. Trước đây mọi người đều mua máy chủ, sau đó AWS xuất hiện.
Giờ không ai tự mua máy chủ nữa, Capex (chi tiêu vốn) biến thành Opex (chi phí hoạt động), tài sản nặng biến thành đăng ký định kỳ.
Việc Meta làm hôm nay, là diễn lại việc đó trong thời đại AI.
Công ty phản ứng thị trường dữ dội nhất, có lẽ là công ty công nghệ cơ sở hạ tầng đám mây CoreWeave. Mô hình kinh doanh của CoreWeave có thể nói gọn trong một câu: Tôi xây cụm GPU, cho các công ty AI thuê.
Nhưng nền tảng thương mại của CoreWeave được xây dựng trong khoảng trống khi các gã khổng lồ tự dùng sức mạnh tính toán, thị trường thiếu card trầm trọng. Một khi Meta thực sự bắt đầu làm việc này, vai trò của CoreWeave sẽ trở nên khó xử.
Về quy mô, CoreWeave không có lợi thế về quy mô như Meta. Về độ hoàn chỉnh của stack, CoreWeave cũng không có mô hình và phần mềm của Meta.
Khi khách hàng doanh nghiệp có thể trực tiếp chạy mô hình gốc Llama trên đám mây của Meta, và tận hưởng khung nền tảng được tối ưu bởi kỹ sư Meta, họ không có lý do gì để trả thêm phí chuyển nhượng thuê máy chủ kim loại trần thuần túy của CoreWeave.
Chiến trường CoreWeave thua, đã từ tầng bán sức mạnh tính toán, leo lên tầng bán toàn bộ dịch vụ AI.
Đây không phải là cuộc cạnh tranh cùng cấp độ.
Vốn nhìn thấy tầng này, nên giết mạnh nhất.
Bốn, Tại Sao Ngày Hôm Sau Lại Tăng Trở Lại
Những cổ phiếu giảm mạnh nhất, ngày hôm sau cơ bản đều tăng trở lại.
Nhiều diễn giải cho là thị trường phục hồi.
Nhưng tôi cho rằng, nguyên nhân thực sự, là vốn đã thực hiện một lần định giá lại trong vòng 24 giờ.
Mọi người nghĩ thông một việc: Meta nói thật, nhưng không phải hôm nay.
Thực tế hiện tại là, Định luật Mở rộng (Scaling Law) của mô hình lớn vẫn chưa chạm trần, cụm chủ lực của các đại gia chính vẫn đang chạy huấn luyện mô hình đa phương thức thế hệ tiếp theo liên tục.
Nhu cầu suy luận vẫn đang tăng trưởng cao theo năm.
Sức mạnh tính toán thung lũng mà Meta có thể giải phóng ở giai đoạn hiện tại, so với lượng thông lượng khổng lồ toàn mạng, vẫn chỉ là bổ sung cực kỳ hạn chế.
Nhìn ngắn hạn, cảm xúc đã giải tỏa xong. Nhìn trung hạn, câu chuyện chi tiêu vốn AI không thay đổi. Nhìn dài hạn, chỉ một việc bị lung lay: Quan hệ cung-cầu của GPU, có thể từ thiếu hụt tuyệt đối, dần dần biến thành dư thừa cấu trúc.
Thay đổi này không xảy ra trong một đêm, có thể hai năm, có thể ba năm.
Nhưng hướng đã thay đổi.
Meta một câu, đẩy toàn bộ thị trường bò từ việc được dẫn dắt bởi thiếu hụt, sang được dẫn dắt bởi hiệu quả.
Mà thị trường bò được dẫn dắt bởi hiệu quả, logic định giá là một bộ khác. Vốn hóa thị trường của Nvidia, là do thiếu hụt dẫn dắt. Định giá cao của OpenAI, là do thiếu hụt dẫn dắt.
Phần lớn các công ty trên chuỗi AI infra, là do thiếu hụt dẫn dắt.
Một khi thị trường bắt đầu định giá lại theo hiệu quả, neo định giá của toàn bộ ngành đều phải điều chỉnh. Meta chỉ đẩy lịch trình điều chỉnh này lên trước.
Năm, Thứ Thực Sự Thay Đổi, Không Phải Là GPU
Nhìn lại, câu chuyện của ngành công nghiệp AI hai năm qua rất đơn giản.
Thiếu GPU.
Chỉ mấy chữ đơn giản đó, đủ để chống đỡ vài nghìn tỷ USD vốn hóa.
Nhưng ở giai đoạn hiện tại, hiệu ứng biên của logic này đã bắt đầu giảm mạnh.
GPU vẫn thiếu, chỉ là 'thiếu' đã không thể giải thích hoàn toàn định giá nữa.
Tiếp theo, vấn đề mới duy nhất ngành công nghiệp AI phải trả lời: Làm sao để dùng hết số GPU đã mua về.
Đây là hai thời đại hoàn toàn khác nhau.
Một thời đại so sánh mua sắm, ai nhiều tiền hơn, nhiều card hơn, định giá của người đó cao hơn.
Một thời đại so sánh tỷ lệ sử dụng, ai có TCO (Tổng chi phí sở hữu) thấp hơn, PUE (Hiệu suất sử dụng năng lượng) thấp hơn, chi phí suy luận trên mỗi Token rẻ hơn, người đó có thể tồn tại trên thị trường.
Một thời đại là Capex (Chi tiêu vốn) dẫn dắt, một thời đại là ROA (Tỷ suất sinh lời trên tài sản) dẫn dắt.
Nếu nói ChatGPT thay đổi AI, thì lần này của Meta, lần đầu tiên bắt đầu thay đổi cách AI kiếm tiền.
Lời của 【Bên Ngoài Trang Giấy】:
Điểm ngoặt công nghiệp thực sự, không bao giờ là lần đầu tiên nhu cầu xuất hiện. Mà là lần đầu tiên có người bắt đầu thảo luận, cung ứng kiếm tiền như thế nào.
Hai năm qua, cả thế giới đều hỏi một câu hỏi, AI còn cần bao nhiêu GPU?
Lần này của Meta, lần đầu tiên hỏi một câu hỏi khác, số GPU đã mua về, tại sao không thể bắt đầu kiếm tiền?
Đây là cùng một ngành công nghiệp, hai loại thời đại.
Thời đại trước gọi là thiếu hụt, thời đại sau, gọi là vận hành.
Động thái này của Zuckerberg, về bản chất là một phát súng hiệu.
Thứ ông ấy tranh giành, chưa bao giờ là bán được bao nhiêu card, là khiến tất cả mọi người nhận ra, thời kỳ lợi nhuận của toàn bộ ngành công nghiệp AI chỉ cần mua card tích trữ là có thể ngồi mát ăn bát vàng, định giá bùng nổ, đã đến hồi kết.
Bài viết này đến từ tài khoản công chúng WeChat "Bên Ngoài Trang Giấy", tác giả: Họa Họa








