Tác giả: Ada, Shenchao TechFlow
Ruòmíng Páng còn chưa kịp làm quen với chỗ ngồi của mình tại Meta, đã rời đi.
Vào tháng 7 năm 2025, Mark Zuckerberg đã dùng một gói thù lao nhiều năm với tổng giá trị hơn 200 triệu USD để giành lấy kỹ sư người Hoa được săn đón nhất trong lĩnh vực cơ sở hạ tầng AI từ tay Apple. Páng Ruòmíng được bố trí vào Phòng thí nghiệm Siêu trí tuệ Meta (Meta Super Intelligent Lab), chịu trách nhiệm xây dựng cơ sở hạ tầng cho thế hệ mô hình AI tiếp theo.
7 tháng sau, OpenAI đã chiêu mộ anh ta.
Theo thông tin từ The Information, OpenAI đã triển khai chiến dịch tuyển dụng kéo dài hàng tháng trời nhắm vào Páng Ruòmíng. Mặc dù Páng Ruòmíng từng nói với đồng nghiệp rằng "anh ấy làm việc tại Meta rất vui vẻ", nhưng cuối cùng vẫn chọn rời đi. Theo Bloomberg, gói thù lao của anh tại Meta được gắn với các cột mốc, việc rời đi sớm đồng nghĩa với việc từ bỏ phần lớn cổ phiếu chưa được trao.
200 triệu USD, không mua được 7 tháng trung thành.
Đây không chỉ là một câu chuyện nhảy việc đơn giản.
Sự ra đi của một người, tín hiệu của một nhóm người
Páng Ruòmíng không phải là người đầu tiên rời đi.
Tuần trước, người phụ trách sản phẩm nền tảng nhà phát triển của Phòng thí nghiệm Siêu trí tuệ Meta, Mat Velloso, cũng thông báo rời đi. Người này đã rời Google DeepMind để gia nhập Meta vào tháng 7 năm ngoái, ở lại chưa đầy 8 tháng. Lùi lại xa hơn, vào tháng 11 năm 2025, người đoạt giải Turing, nhà khoa học AI cấp cao của Meta sau 12 năm gắn bó, Yann LeCun, đã thông báo rời đi để khởi nghiệp, thực hiện "mô hình thế giới" mà ông luôn cổ vũ. Phó chủ tịch nghiên cứu AI生成式 (Generative AI) của Meta, đệ tử cốt lõi của Geoffrey Hinton, Russ Salakhutdinov, cũng gần đây chính thức thông báo rời đi.
Để hiểu được tình trạng chảy máu chất xám AI của Meta, trước tiên phải hiểu Llama 4 đã gây tổn thương như thế nào.
Tháng 4 năm 2025, Meta đã công bố rầm rộ các mô hình Scout và Maverick của loạt Llama 4. Dữ liệu trên giấy tờ chính thức được cho là hoành tráng, tuyên bố rằng trong các bài kiểm tra chuẩn (Benchmark) cốt lõi như MATH-500 và GPQA Diamond, đã áp đảo hoàn toàn GPT-4.5 và Claude Sonnet 3.7.
Tuy nhiên, mô hình flagship mang theo tham vọng của Meta này đã nhanh chóng "lộ nguyên hình" trong các bài kiểm tra mù độc lập của bên thứ ba trong cộng đồng mã nguồn mở, khả năng khái quát hóa và suy luận thực tế có sự chênh lệch thảm hại so với quảng cáo. Trước những nghi ngờ mạnh mẽ từ cộng đồng, nhà khoa học AI cấp cao Yann LeCun cuối cùng đã thừa nhận rằng nhóm đã "sử dụng các phiên bản mô hình khác nhau để chạy các bộ kiểm tra khác nhau, nhằm tối ưu hóa điểm số cuối cùng" trong giai đoạn thử nghiệm.
Trong giới học thuật và kỹ thuật AI nghiêm túc, điều này đã chạm vào vạch đỏ không thể tha thứ. Nói cách khác, nhóm đã huấn luyện Llama 4 trở thành một "học sinh chỉ giỏi làm đề thi cũ" thay vì một "học sinh ưu tú" thực sự sở hữu trí thông minh tiên tiến. Thi toán thì cho xem đề toán khó nhất, thi lập trình thì cho xem đề lập trình khó nhất, mỗi bài kiểm tra đơn lẻ trông có vẻ rất mạnh, nhưng thực tế đây không phải là cùng một mô hình.
Trong giới học thuật AI, điều này gọi là "hái anh đào" (cherry-picking), trong giới giáo dục thi cử gọi là "thi hộ".
Đối với Meta, vốn luôn tự coi mình là "ngọn hải đăng mã nguồn mở", sự việc này đã trực tiếp phá hủy tài sản tin tưởng quý giá nhất trong hệ sinh thái nhà phát triển của họ. Cái giá trực tiếp là Zuckerberg "hoàn toàn mất niềm tin" vào tiêu chuẩn kỹ thuật của nhóm GenAI cũ, và từ đó mở ra màn kịch cho việc đưa các quản lý cấp cao mới vào, làm giảm quyền lực của các bộ phận cơ sở hạ tầng cốt lõi.
Ông đã chi 14.3 đến 15 tỷ USD để mua 49% cổ phần của công ty gán nhãn dữ liệu Scale AI, đưa CEO Scale AI 28 tuổi Alexandr Wang vào vị trí Giám đốc AI của Meta, thành lập Phòng thí nghiệm Siêu trí tuệ Meta (MSL). Người đoạt giải Turing LeCun trong cơ cấu mới phải báo cáo với chàng trai 28 tuổi này. Tháng 10, Meta đã cắt giảm khoảng 600 vị trí trong MSL, bao gồm các thành viên của bộ phận nghiên cứu FAIR do chính LeCun tạo ra.
Và mô hình flagship Llama 4 Behemoth dự kiến phát hành vào mùa hè năm 2025 cũng bị trì hoãn nhiều lần, từ mùa hè sang mùa thu, và cuối cùng bị hoãn vô thời hạn.
Meta chuyển hướng phát triển mô hình văn bản thế hệ tiếp theo có mã hiệu "Avocado" và mô hình hình ảnh/video có mã hiệu "Mango". Theo báo cáo, mục tiêu của Avocado là sánh ngang với GPT-5 và Gemini 3 Ultra. Dự kiến ban đầu giao hàng vào cuối năm 2025, nhưng do hiệu suất kiểm tra và tối ưu hóa huấn luyện không đạt, đãy lùi sang quý I năm 2026. Meta đang cân nhắc phát hành nó dưới dạng mã đóng, từ bỏ truyền thống mã nguồn mở vốn có của loạt Llama.
Meta đã phạm hai sai lầm chết người với mô hình AI. Thứ nhất là gian lận benchmark, điều này trực tiếp phá hủy niềm tin của cộng đồng nhà phát triển; thứ hai là nhét một bộ phận nghiên cứu cơ bản như FAIR vốn cần mười năm mài kiếm vào một tổ chức sản phẩm theo đuổi KPI hàng quý. Hai điều này cộng lại chính là nguyên nhân gốc rễ của tình trạng chảy máu chất xám hiện nay.
Chip tự nghiên cứu: Một chân trụ khác gãy
Nhân tài bỏ chạy, chip cũng gặp vấn đề.
Theo The Information, Meta đã cắt bỏ dự án chip đào tạo AI nội bộ tiên tiến nhất đang được phát triển vào tuần trước.
Kế hoạch chip tự nghiên cứu của Meta gọi là MTIA (Bộ tăng tốc Đào tạo và Suy luận Meta). Lộ trình ban đầu của công ty đầy tham vọng: MTIA v4 mã "Santa Barbara", v5 mã "Olympus", v6 mã "Universal Core" dự kiến lần lượt được giao từ năm 2026 đến 2028. Trong đó, Olympus được thiết kế là chip đầu tiên của Meta dựa trên kiến trúc chiplet 2nm, nhằm mục tiêu bao phủ cả đào tạo mô hình cao cấp và suy luận thời gian thực, cuối cùng thay thế vai trò của NVIDIA trong cụm đào tạo của Meta.
Giờ đây, con chip đào tạo tiên tiến nhất này đã bị cắt bỏ.
Meta không phải là không có tiến triển, MTIA đã có một số thành tựu ở phía suy luận. Chip suy luận MTIA v3 mã "Iris" đã được triển khai quy mô lớn trong trung tâm dữ liệu của Meta, chủ yếu cho hệ thống đề xuất của Facebook Reels và Instagram, được cho là đã giảm 40% đến 44% tổng chi phí sở hữu. Nhưng suy luận và đào tạo là hai việc khác nhau. Suy luận là chạy mô hình, đào tạo là huấn luyện mô hình. Meta có thể tự làm chip suy luận, nhưng không thể chế tạo chip đào tạo có thể cạnh tranh trực tiếp với NVIDIA.
Lịch sử đây không phải là lần đầu tiên. Năm 2022, Meta từng thử nghiệm chip suy luận tự nghiên cứu, sau khi thất bại trong triển khai quy mô nhỏ đã từ bỏ ngay, quay đầu đặt hàng lớn với NVIDIA.
Việc tự nghiên cứu chip gặp trở ngại đã trực tiếp đẩy nhanh cơn cuồng mua ngoại của Meta.
Mua sắm hoảng loạn 1350 tỷ USD
Tháng 1 năm 2026, Meta thông báo ngân sách chi tiêu vốn năm nay là 1150 đến 1350 tỷ USD, gần gấp đôi con số 722 tỷ USD của năm ngoái. Phần lớn số tiền này sẽ được chi cho chip.
Trong vòng 10 ngày, ba đơn hàng lớn liên tiếp được ký kết:
Ngày 17 tháng 2, Meta ký kết thỏa thuận hợp tác chiến lược đa năm, xuyên thế hệ với NVIDIA. Meta sẽ triển khai "hàng triệu" GPU Blackwell và Vera Rubin thế hệ mới của NVIDIA, cùng với CPU độc lập Grace. Các nhà phân tích ước tính quy mô giao dịch ở mức hàng chục tỷ USD, Meta trở thành khách hàng siêu máy tính đầu tiên trên thế giới triển khai quy mô lớn CPU độc lập Grace của NVIDIA.
Ngày 24 tháng 2, Meta ký kết thỏa thuận chip đa năm trị giá 60 đến 100 tỷ USD với AMD. Meta sẽ mua GPU loạt MI450 mới nhất và CPU EPYC thế hệ thứ sáu của AMD. Như một phần của thỏa thuận, AMD đã phát hành cho Meta tối đa 160 triệu cổ phiếu phổ thông dưới dạng chứng quyền, tương đương khoảng 10% cổ phần của AMD, với giá 0.01 USD mỗi cổ phiếu, sẽ thuộc sở hữu theo từng đợt dựa trên các cột mốc giao hàng.
Ngày 26 tháng 2, theo The Information, Meta đã ký kết một thỏa thuận đa năm trị giá hàng tỷ USD với Google, thuê chip TPU của Google Cloud để đào tạo và chạy mô hình ngôn ngữ lớn thế hệ tiếp theo của mình. Đồng thời, hai bên cũng đang thảo luận về việc Meta từ năm 2027 sẽ trực tiếp mua TPU để triển khai vào trung tâm dữ liệu của riêng mình.
Một công ty truyền thông xã hội, trong 10 ngày đã cùng lúc đặt hàng với ba nhà cung cấp chip với tổng giá trị có thể lên tới hơn nghìn tỷ USD.
Đây không phải là bố trí đa dạng hóa. Đây là mua sắm hoảng loạn.
Ba tầng logic của nỗi lo về sức mạnh tính toán
Tại sao Meta lại vội vàng như vậy?
Thứ nhất, chip tự nghiên cứu không còn có thể trông cậy. Dự án chip đào tạo tiên tiến nhất bị cắt bỏ, đồng nghĩa với việc Meta trong tương lai gần chỉ có thể dựa vào mua ngoài để đáp ứng nhu cầu đào tạo AI. Chip MTIA phía suy luận có thể xử lý các nghiệp vụ trưởng thành như hệ thống đề xuất, nhưng để đào tạo các mô hình tiên phong như Avocado sánh ngang GPT-5, phải sử dụng phần cứng của NVIDIA hoặc cấp độ tương đương.
Thứ hai, đối thủ cạnh tranh sẽ không chờ. OpenAI đã nhận được nguồn lực khổng lồ từ Microsoft, SoftBank đến quỹ đầu tư quốc gia UAE. Anthropic đã khóa chặt nguồn cung cấp 1 triệu chip TPU và Trainium từ Google và Amazon. Google Gemini 3 hoàn toàn được đào tạo trên TPU. Nếu Meta không có đủ sức mạnh tính toán, ngay cả vé vào sân chơi cũng không giữ được.
Thứ ba, và có lẽ là căn bản nhất, Zuckerberg cần dùng "sức mua" để bù đắp cho "sức nghiên cứu" không đủ. Llama 4 lật nhào, nhân tài cốt lõi chảy máu, chip tự nghiên cứu gặp trở ngại, ba việc này chồng chất lên nhau, khiến câu chuyện AI của Meta trở nên mong manh trước Phố Wall. Lúc này ký kết đơn hàng lớn với ba nhà NVIDIA, AMD, Google, ít nhất cũng phát đi tín hiệu: chúng tôi có tiền, chúng tôi đang mua, chúng tôi không từ bỏ.
Chiến lược của Meta bây giờ là, phần mềm không giải quyết được thì đập phần cứng, giữ không được người thì mua chip. Nhưng cuộc đua AI không phải là trò chơi có thể thắng chỉ bằng cách viết séc. Sức mạnh tính toán là điều kiện cần, không phải điều kiện đủ. Không có đội ngũ mô hình đỉnh cao và lộ trình công nghệ rõ ràng, nhiều chip cũng chỉ là hàng tồn kho đắt tiền trong kho.
Tình thế khó của người mua
Nhìn lại ba giao dịch của Meta trong tháng 2, một chi tiết thú vị đã bị hầu hết mọi người bỏ qua.
Meta mua của NVIDIA là Blackwell hiện tại và Vera Rubin tương lai; giao dịch với AMD, mua MI450 và MI455X tương lai; thuê của Google là TPU Ironwood hiện tại, kế hoạch năm sau mua trực tiếp.
Ba nhà cung cấp, ba kiến trúc phần cứng và hệ sinh thái phần mềm hoàn toàn khác nhau.
Điều này có nghĩa là Meta phải nhảy qua nhảy lại giữa ba hệ sinh thái nền tảng hoàn toàn khác biệt: CUDA của NVIDIA, ROCm của AMD và XLA/JAX của Google. Chiến lược đa nhà cung cấp tuy có thể phân tán rủi ro chuỗi cung ứng, ép giá mua phần cứng, nhưng sẽ mang lại độ phức tạp kỹ thuật tăng theo cấp số nhân.
Đây chính là điểm yếu chết người nhất của Meta hiện nay, để một mô hình nghìn tỷ tham số có thể được đào tạo hiệu quả trên ba phần cứng có mô hình lập trình nền tảng hoàn toàn khác nhau này, cần không chỉ kỹ sư biết CUDA, mà là kiến trúc sư có thể xây dựng khung đào tạo đa nền tảng từ con số không.
Loại người này trên thế giới có thể không quá 100 người. Páng Ruòmíng là một trong số đó.
Chi 1000 tỷ USD mua vào tổ hợp phần cứng phức tạp nhất toàn cầu, đồng thời lại đang đánh mất những bộ não có thể điều khiển những phần cứng này, đây mới là hình ảnh kỳ ảo nhất trong canh bạc lớn của Zuckerberg.
Ván cược của Zuckerberg
Kéo ống kính ra xa một chút để xem, con đường vận hành AI của Zuckerberg trong 18 tháng qua, có nhịp điệu giống một cách đáng kinh ngạc với All In metaverse của ông năm xưa:
Nhìn thấy xu hướng, đầu tư nặng, tuyển dụng ồ ạt, gặp khó khăn, chiến lược chuyển hướng gấp, lại đầu tư nặng.
2021 đến 2023 là metaverse, kết quả mỗi năm lỗ hàng trăm tỷ, cuối cùng cổ phiếu từ 380 USD giảm xuống 88 USD. 2024 đến 2026 là AI, cũng là đập tiền không tính toán, tổ chức tái cơ cấu thường xuyên, cũng là câu chuyện kể "tin tôi, tôi có tầm nhìn".
Khác biệt là, lần này cơn sốt AI thực tế hơn metaverse rất nhiều. Và Meta có tiền để đốt, nghiệp vụ quảng cáo của họ tạo ra dòng tiền dồi dào, quý IV năm 2025 Meta doanh thu 59.9 tỷ USD, tăng trưởng 24%.
Vấn đề nằm ở: tiền có thể mua chip, mua sức mạnh tính toán, thậm chí là người ngồi ở chỗ làm, nhưng không mua được người ở lại.
Páng Ruòmíng chọn OpenAI, Russ Salakhutdinov chọn rời đi, LeCun chọn khởi nghiệp.
Zuckerberg bây giờ đặt cược rằng, chỉ cần mua đủ chip, xây dựng đủ trung tâm dữ liệu lớn, tiêu đủ tiền, tổng có thể tìm được hoặc đào tạo ra người có thể sử dụng những tài nguyên này.
Cược này có thể thành công. Meta rốt cuộc là một trong những công ty công nghệ giàu có nhất thế giới, dòng tiền hoạt động hơn 1000 tỷ USD là hào thành kiên cố nhất của nó. Từ OpenAI đến Anthropic, từ Google đến các đối thủ cạnh tranh khác, Meta đều đang không ngừng chiêu mộ người. Theo báo cáo của Quantum Bit, trong 44 người của nhóm Siêu trí tuệ Meta, gần 40% đến từ OpenAI.
Nhưng sự tàn khốc của cuộc đua AI nằm ở chỗ, dự trữ sức mạnh tính toán, danh sách nhân tài, biểu hiện mô hình đều là công khai, sự kiện gian lận benchmark của Llama 4 chứng minh, trong ngành này, bạn không có cách nào duy trì dẫn đầu bằng PPT và quan hệ công chúng.
Thị trường cuối cùng chỉ nhận một thứ: mô hình của bạn có đủ tốt hay không.
Vị trí trong chuỗi thức ăn
Cuộc chạy đua vũ trang AI bước vào năm 2026, thứ tự trong chuỗi thức ăn đã dần rõ ràng:
Đỉnh là OpenAI và Google. OpenAI có mô hình mạnh nhất, cơ sở người dùng lớn nhất và nguồn vốn tích cực nhất. Google có chip tự nghiên cứu, mô hình tự nghiên cứu và tích hợp dọc hoàn chỉnh với cơ sở hạ tầng đám mây tự nghiên cứu. Anthropic theo sát sau, dựa vào sức sản phẩm của mô hình Claude và nguồn cung sức mạnh tính toán kép từ Google, Amazon, ổn định ở nhóm đầu.
Meta? Họ đã đập nhiều tiền nhất, ký hợp đồng chip nhiều nhất, tái cơ cấu tổ chức thường xuyên nhất, nhưng cho đến nay, vẫn chưa đưa ra một mô hình tiên phong nào có thể thuyết phục thị trường.
Câu chuyện AI của Meta hơi giống Yahoo năm 2005. Lúc đó Yahoo cũng là một trong những công ty internet giàu nhất, cũng đang mua lại và đập tiền điên cuồng, nhưng không làm ra được công cụ tìm kiếm như Google. Tiền không phải là vạn năng. Zuckerberg cần suy nghĩ rõ ràng, Meta rốt cuộc muốn làm gì với AI, chứ không phải thấy cái gì nóng thì mua cái đó.
Tất nhiên, viết cáo phó cho Meta vẫn còn quá sớm. 3.58 tỷ người dùng hoạt động hàng tháng, doanh thu hàng quý 59.9 tỷ USD, bộ dữ liệu truyền thông xã hội lớn nhất toàn cầu, đây là tài sản mà bất kỳ đối thủ cạnh tranh nào cũng khó sao chép.
Nếu mô hình thế hệ tiếp theo mã hiệu Avocado có thể được giao hàng như kế hoạch vào năm 2026 và trở lại nhóm đầu, tất cả việc đập tiền và tái cơ cấu của Zuckerberg sẽ được đóng gói thành "sức mạnh chiến lược xoay chuyển tình thế". Nhưng nếu một lần nữa không đạt kỳ vọng, thì 1350 tỷ USD này đổi lại, sẽ chỉ là những kho chứa wafer silicon phát nhiệt thông điện.
Rốt cuộc, cuộc chạy đua vũ trang AI Thung lũng Silicon không thiếu người mua siêu cấp vung séc. Thiếu là, những người biết cách dùng những sức mạnh tính toán này để luyện ra tương lai.






