Thời gian trước, Google đã tuyên bố chính thức bắt đầu bán chip TPU tự nghiên cứu, cùng với phần cứng điện toán AI đi kèm trực tiếp cho các trung tâm dữ liệu và khách hàng bên thứ ba. Là "vũ khí bí mật" của Google trong lĩnh vực AI, trước đây bên thứ ba chỉ có thể thuê TPU thông qua các trung tâm dữ liệu đám mây, và giới công nghiệp cũng từng nghĩ rằng Google sẽ không bán những con chip này ra ngoài, nhưng không ngờ đến tháng 6 năm nay đã đón nhận tin vui này.
Vậy câu hỏi đặt ra là, "TPU" là gì? Thứ này có tên đầy đủ là "Tensor Processing Unit (Bộ xử lý Tensor)", khác với CPU và GPU, nó là chip được thiết kế chuyên biệt cho "các phép toán ma trận và tensor" trong tính toán AI, có khả năng xử lý các phép tính liên quan với hiệu suất cực cao.
Nghe có vẻ như một chip phụ trợ? Tuy nhiên thực tế không phải vậy, bởi vì công nghệ mô hình lớn AI hiện nay, về bản chất chính là các phép toán phức tạp (chủ yếu là phép nhân ma trận) trên dữ liệu khổng lồ. Vì vậy Google đã làm một việc, đó là kết hợp hàng nghìn TPU thành cụm siêu máy tính, sau đó sử dụng máy chủ CPU để điều phối (phân giải nhiệm vụ, chuyển đổi dữ liệu), tạo ra trung tâm điện toán AI có hiệu suất cực cao.

Nguồn ảnh: Google
Đây cũng là lý do tại sao Gemini có thể với mức phí thuê bao thấp hơn và hạn mức sử dụng cao hơn, đã chiếm lấy nhóm người dùng của các doanh nghiệp như OpenAI một cách điên cuồng. Ngay cả khi chỉ xét riêng giá token, Gemini cũng là một trong những đại diện có mô hình flagship định giá thấp trong số các sản phẩm AI nước ngoài, đồng thời giá của mô hình chủ lực cũng gần với các nhà sản xuất mô hình trong nước như DeepSeek.
Hơn nữa, TPU cũng giỏi xử lý các yêu cầu tính toán khổng lồ của người dùng hàng ngày hơn, và có thể nói là "chuyên môn phù hợp" với hệ sinh thái AI trong tương lai, đến mức giới bên ngoài thực sự đã thèm muốn bộ chip này từ lâu. Sau khi công bố kế hoạch bán hàng, Google đồng thời cũng công bố một thỏa thuận trị giá 50 tỷ USD, sẽ cùng với công ty tư nhân nổi tiếng Blackstone xây dựng một trung tâm điện toán lớn, công suất tạm thời là 500 megawatt.
Lei Keji (ID: leitech) phỏng đoán, sau khi tin này được đưa ra, số lượng doanh nghiệp tìm Google để hỏi giá hoặc hợp tác ước tính không ít, đặc biệt là những doanh nghiệp muốn tự xây dựng trung tâm điện toán. Lúc này có người có thể nghĩ, Amazon chắc phải sốt ruột, rốt cuộc đây là cướp công việc kinh doanh dịch vụ đám mây một cách trắng trợn. Thực ra không phải vậy, lúc này đau đầu nhất ước tính là Nvidia.
Google đã "rút củi đáy nồi" Nvidia?
Trước tiên Lei Keji muốn hỏi một câu hỏi: Tại sao Nvidia có thể trở thành một trong những công ty quan trọng nhất trong thời đại AI? Nếu câu trả lời của bạn chỉ là "điện toán GPU mạnh", thì thực ra mới chỉ đúng một nửa.
Điểm thực sự giỏi của Nvidia, là nó đã không chỉ bán GPU từ lâu. CUDA, NVLink, DGX, mạng InfiniBand, thư viện phần mềm AI, hệ sinh thái nhà phát triển, đối tác máy chủ, khả năng tương thích của nhà cung cấp đám mây, những thứ này cùng nhau tạo thành hào bảo vệ của Nvidia.
Vì vậy, khi bạn mua một card điện toán của Nvidia và khởi động, bạn không chỉ mua một card, mà là cả một hệ sinh thái AI đã được ngành công nghiệp kiểm chứng, vậy thì đối với hầu hết các công ty, hệ sinh thái CUDA của Nvidia khiến họ không cần "tái phát minh bánh xe", từ đó tiết kiệm được nhiều công sức và chi phí.
Đây cũng là lý do tại sao nhiều công ty AI biết rõ GPU của Nvidia rất đắt, vẫn phải dùng. Bởi vì trong thời kỳ bùng nổ AI, "chi phí" có thể bỏ qua, chỉ tiêu duy nhất là có thể dẫn đối thủ hay nhanh chóng đuổi kịp đối thủ hay không. Nhưng, khi mô hình lớn AI bước vào giai đoạn phổ cập, mọi người muốn không chỉ là "tốc độ" nữa, đối mặt với số lượng người dùng khổng lồ, hiệu suất và tính cạnh tranh về giá trở thành trọng tâm mới.
Google rõ ràng cũng nhìn thấy điểm này, vì vậy họ đặt cược vào TPU, và đóng gói nó thành một bộ giải pháp hoàn chỉnh, những con chip trong bộ giải pháp này không phải để đánh bại Nvidia về hiệu suất điện toán, mà là biến kinh nghiệm nhiều năm qua của Google về chip, trung tâm dữ liệu, mạng, lưu trữ, điều phối và huấn luyện mô hình, thành khả năng dịch vụ đám mây mà doanh nghiệp có thể mua trực tiếp.
Đây mới là nơi Google thực sự "học Nvidia", nó học không phải là bán chip, mà là bán hệ thống và hệ sinh thái, biến một loạt phần cứng thành "năng lực sản xuất" mà khách hàng có thể sử dụng, điều này có sức hấp dẫn không nhỏ đối với những doanh nghiệp hy vọng nắm giữ trung tâm điện toán trong tay mình.
Vậy, Nvidia sẽ hoảng loạn? Cũng không đến mức đó, nhưng đau đầu cũng thực sự đau đầu, rốt cuộc card điện toán flagship mặc dù kiếm tiền, nhưng mọi người không thể luôn ở trạng thái "có bao nhiêu mua bấy nhiêu", mà sẽ dần dần hướng mục tiêu sang những con chip có tính cạnh tranh về giá hơn, lúc đó giải pháp TPU của Google chắc chắn sẽ gây ảnh hưởng đến phần thị trường này của Nvidia.
Tuy nhiên đối với toàn bộ ngành công nghiệp AI, hiện nay Nvidia vẫn là tiêu chuẩn chung được thị trường điện toán AI công nhận nhất, vị thế của hệ sinh thái CUDA cũng không phải một hai thế hệ chip có thể dễ dàng lung lay. Đặc biệt là ở khâu huấn luyện mô hình lớn, nhiều đội ngũ đã tích lũy nhiều kinh nghiệm xung quanh hệ thống của Nvidia, việc chuyển đổi nền tảng một cách liều lĩnh rủi ro không thấp.
Ví dụ như DeepSeek, mô hình mới ra mắt trước đó đã tuyên bố có thể sử dụng chip Ascend của Huawei để huấn luyện, điều này vẫn là sau khi Huawei và DeepSeek hợp tác sâu, trải qua vài phiên bản lặp mới làm được.

Nguồn ảnh: Ascend
Nhưng đứng từ góc độ của Google, thực ra cũng không cần thay thế Nvidia trong tất cả các tình huống, chỉ cần nó nắm bắt được một phần khách hàng doanh nghiệp, sau đó chứng minh hiệu suất của mình cao hơn các hệ sinh thái điện toán khác, thì nó đã có thể cắt một phần bánh từ thị trường cơ sở hạ tầng AI.
Đặc biệt là giai đoạn suy luận, máy chủ điện toán TPU của Google rõ ràng chiếm ưu thế hơn. Mọi người đều biết, token thực sự dùng lên, tốc độ tiêu hao không chậm hơn mở cửa xả nước là bao, trước có Uber bốn tháng đốt hết ngân sách một năm, doanh nghiệp bí ẩn một tháng tiêu hết 500 triệu USD chi phí token, sau có Microsoft giàu có ra lệnh hạn chế quyền hạn nhân viên, buộc họ sử dụng điện toán của chính mình.
Có thể nói, khi tần suất sử dụng AI trong các lĩnh vực ngày càng cao, chắc chắn sẽ có nhiều ví dụ chứng minh hơn, chi phí token mới là chìa khóa cạnh tranh AI trong tương lai. Bởi vì chi phí token của ai thấp hơn, người đó có thể phổ cập AI đến nhiều tuyến nghiệp vụ hơn, để chiếm lấy người dùng và thị trường.
Điện toán trở thành tài nguyên cơ bản, cơ hội của nhà cung cấp đám mây đến rồi
Lei Keji thấy có một cách ví von của cư dân mạng rất sát thực: Huấn luyện mô hình giống như mua xe, còn dịch vụ suy luận thì giống như xăng phải đốt mỗi ngày, cho dù là nhà giàu, cũng không thể ngày nào cũng để tất cả xe đều đốt xăng 98; điện toán mà Google cung cấp giống như xăng 92, tuy động lực hơi không đủ, nhưng xe vẫn chạy, việc vẫn làm, mà lại rẻ hơn.
Thời gian trước, Lei Keji đã viết một bài viết, đề cập đến hiện nay ngành công nghiệp có một sự đồng thuận: Điện toán AI đang ngày càng trở nên giống như điện, nước, băng thông rộng - những tài nguyên cơ bản.
Hơn nữa đối với người dùng, người dùng không cần biết "điện toán" được sản xuất ra như thế nào, nhưng sẽ quan tâm đến giá điện toán giống như quan tâm hóa đơn điện nước, "người dùng" này có thể vừa là cá nhân, cũng có thể là doanh nghiệp, thành phố, thậm chí là quốc gia.
Vì vậy, trong thị trường AI tương lai, Nvidia vẫn sẽ rất quan trọng, bởi vì không có chip hiệu suất cao, mọi thứ đều không thể bàn đến. Nhưng khi nhu cầu điện toán trở thành tài nguyên cơ bản lâu dài, ổn định và quy mô hóa, quyền phát ngôn ngược lại sẽ dần dần chuyển đến tay các nhà cung cấp dịch vụ đám mây.
Đây cũng là lý do tại sao các nhà cung cấp đám mây như Google, Microsoft, Amazon, Aliyun, Huawei Cloud không còn hài lòng với việc chỉ làm "nhà bán lại" điện toán GPU của Nvidia, mà đều đang bố trí hệ sinh thái điện toán của riêng mình. Đương nhiên không phải nói họ sẽ không tiếp tục mua GPU của Nvidia, bởi vì thị trường cần, khách hàng cũng cần, đồng thời cũng có thể bán được giá tốt.

Nguồn ảnh: Lei Keji
Nhưng đồng thời, trọng tâm phát triển thực sự của họ chắc chắn sẽ chuyển hướng sang hệ sinh thái của chính mình, đây cũng là điều Nvidia cần cảnh giác nhất, rốt cuộc giá trị thị trường hiện nay của Nvidia, phần lớn đều được tính toán dựa trên tiền đề là "nền tảng cơ sở AI" của nó, một khi Nvidia mất kiểm soát đối với thị trường card điện toán không phải top đầu, thì có thể dần dần trở lại vị trí 5 năm trước trên thị trường card đồ họa chơi game: tuy là đỉnh cao, nhưng không phải không thể không có bạn.
Thực tế, nếu chúng ta kéo góc nhìn về trong nước, những thay đổi tương tự đã xuất hiện. Trước đây khi chúng ta nói về card điện toán AI nội địa, thường đặt trọng tâm vào so sánh hiệu suất điện toán, để thảo luận khoảng cách hiệu suất đơn card còn bao xa so với card điện toán đỉnh cao.
Vấn đề này tuy quan trọng, nhưng nếu chỉ nhìn chằm chằm vào hiệu suất chip, sẽ bỏ qua một điểm mấu chốt khác: Các nhà cung cấp đám mây trong nước cũng đang biến chip, cụm, nền tảng đám mây, dịch vụ mô hình và giải pháp ngành công nghiệp thành một hệ thống sản xuất AI hoàn chỉnh, và đây mới là sức cạnh tranh cốt lõi của AI nội địa.
Đây không phải Lei Keji nói, mà là những nhà cung cấp dịch vụ đám mây cốt lõi như Huawei Cloud, Aliyun đều đang làm. Ví dụ như dịch vụ đám mây Ascend của Huawei, tuy vẫn là chip Ascend nhiều lần gây sốt, nhưng hiện nay Huawei đã xoay quanh điện toán Ascend cung cấp chuỗi công cụ điện toán đám mây hóa, cụm siêu nút, di chuyển mô hình, tối ưu hóa huấn luyện suy luận và năng lực triển khai ngành công nghiệp.

Nguồn ảnh: Weibo
Hơn nữa, Huawei cũng đang đẩy hệ sinh thái điện toán này cho nhiều công ty AI nội địa hơn, ngoài DeepSeek đã đề cập trước đó, còn có Baidu, iFlytek, Zhipu, MiniMax và các nhà máy AI hàng đầu khác. Có thể nói, Huawei đã dần dần xây dựng hệ sinh thái điện toán của mình, việc tiếp theo cần làm là kéo nhiều đối tác lên xe, sau đó dùng giá token thấp hơn để chiếm lĩnh thị trường.
Aliyun cũng như vậy, họ đã phát hành chip AI huấn luyện suy luận tích hợp Zhenwu M890 vào tháng 5 năm nay, mà trước đó, Zhenwu 810E cũng đã được triển khai quy mô lớn vào nền tảng trí tuệ nhân tạo Lin Jun của Aliyun. Tại hội nghị thượng đỉnh Aliyun năm nay, Aliyun cũng trực tiếp tuyên bố lượng xuất hàng tích lũy của dòng chip AI Zhenwu của Pingtouge đã đạt 560 nghìn tấm, quy mô doanh thu hàng năm đã vượt mức trăm tỷ.
Có thể nói, trong việc học Nvidia, các nhà cung cấp dịch vụ đám mây trong nước không chỉ đi nhanh hơn, mà còn đi sớm hơn.
Điện toán mạnh nhất? Không, thế giới cần "điện toán tối ưu nhất"
Đương nhiên, Nvidia sẽ không vì Google bắt đầu bán TPU, mà đột nhiên mất vị trí cốt lõi trong thời đại AI.
Ít nhất trong một thời gian dài, GPU, CUDA và hệ sinh thái nhà phát triển, vẫn sẽ là tiêu chuẩn mà toàn bộ ngành công nghiệp AI không thể bỏ qua. Đặc biệt là trong các tình huống huấn luyện mô hình lớn, tính toán hiệu suất cao và phát triển AI chung, Nvidia vẫn là lựa chọn trưởng thành nhất và được ngành công nghiệp công nhận nhất hiện nay.
Nhưng vấn đề nằm ở chỗ, thị trường điện toán AI đang bước vào giai đoạn tiếp theo.
Trước đây mọi người tranh giành "chip của ai mạnh hơn", mà hiện nay doanh nghiệp thực sự quan tâm, đang trở thành "ai có thể biến điện toán rẻ hơn". Lúc này, ưu thế của các nhà cung cấp dịch vụ đám mây như Google, Huawei Cloud, Aliyun bắt đầu thể hiện: Họ sở hữu lượng khách hàng cá nhân và doanh nghiệp, dữ liệu, ứng dụng và tình huống khổng lồ, đồng thời cũng giỏi hơn trong việc đóng gói các phần cứng thành một hệ thống năng lực sản xuất có thể sử dụng trực tiếp.
Nói cách khác, thứ thực sự khan hiếm trong thời đại AI, đã không chỉ là bản thân chip, mà là năng lực hệ thống biến chip thành năng lực sản xuất.
Khi điện toán ngày càng giống như nước, điện, băng thông rộng - những tài nguyên cơ bản, công ty cuối cùng chiến thắng, chưa chắc chỉ là nhà sản xuất có hiệu suất đơn card mạnh nhất, mà là nhà sản xuất có thể với chi phí thấp hơn, hiệu suất cao hơn, liên tục giao điện toán AI cho khách hàng.
Vì vậy, theo quan điểm của Lei Keji, việc Google bán TPU thực ra là một tín hiệu, nó nhắc nhở toàn bộ ngành công nghiệp: Cuộc cạnh tranh cơ sở hạ tầng AI, đã không chỉ là chiến tranh chip, mà là chiến tranh hệ thống.
Bài viết này đến từ tài khoản công chúng WeChat "Lei Keji", tác giả: Lei Keji





