Tác giả: Hắc Sắc Long Hà, Shenchao TechFlow
Tiêu đề gốc: Token xuất hải, bán điện Trung Quốc cho toàn thế giới
Mùa hè năm 1858, một cáp đồng xuyên dưới đáy Đại Tây Dương, kết nối London và New York.
Ý nghĩa của sự kiện này không bao giờ nằm ở tốc độ truyền tải, mà nằm ở cấu trúc quyền lực, ai đặt cáp dưới biển, người đó có thể thu phí trong dòng chảy thông tin. Đế quốc Anh dựa vào mạng lưới điện báo toàn cầu này, nắm giữ thông tin tình báo thuộc địa, giá cả bông, tin tức chiến tranh.
Sự hùng mạnh của đế quốc không chỉ có hạm đội, mà còn có sợi cáp đó.
Hơn một trăm sáu mươi năm sau, logic này đang tái diễn theo một cách không ngờ tới.
Năm 2026, mô hình lớn Trung Quốc đang âm thầm chiếm lĩnh thị trường nhà phát triển toàn cầu. Dữ liệu mới nhất từ OpenRouter cho thấy, trong mức tiêu thụ Token của top 10 mô hình trên nền tảng, các mô hình Trung Quốc chiếm riêng 61%, ba vị trí đầu tiên đều đến từ Trung Quốc. Các yêu cầu API hàng ngày từ các nhà phát triển ở San Francisco, Berlin, Singapore đang vượt qua cáp quang biển Thái Bình Dương để đến các trung tâm dữ liệu ở Trung Quốc, năng lực tính toán được tiêu thụ ở đó, điện năng chảy ở đó, kết quả được truyền về.
Điện chưa bao giờ rời khỏi lưới điện Trung Quốc, nhưng giá trị của nó thông qua Token đã hoàn thành giao dịch xuyên biên giới.
Cuộc di cư lớn của mô hình AI
Ngày 24 tháng 2 năm 2026, OpenRouter công bố dữ liệu hàng tuần: tổng mức tiêu thụ Token của top 10 mô hình trên nền tảng là khoảng 8,7 nghìn tỷ, các mô hình Trung Quốc chiếm riêng 5,3 nghìn tỷ, tỷ lệ 61%. MiniMax M2.5 với 2,45 nghìn tỷ Token đứng đầu bảng, Kimi K2.5, Zhipu GLM-5 theo sát, top 3 đều đến từ Trung Quốc.
Dữ liệu mới nhất ngày 26 tháng 2
Đây không phải ngẫu nhiên, một ngòi nổ đã châm ngòi cho tất cả.
Đầu năm nay, OpenClaw ra đời, một công cụ mã nguồn mở giúp AI thực sự "làm việc", có thể trực tiếp điều khiển máy tính, thực thi lệnh, hoàn thành song song các luồng công việc phức tạp, số sao GitHub trong vài tuần vượt 210 nghìn.
Nhân viên tài chính John lập tức cài đặt OpenClaw, và kết nối với Anthropic API, bắt đầu tự động giám sát thông tin thị trường chứng khoán, và kịp thời báo cáo tín hiệu giao dịch, vài giờ sau, anh nhìn chằm chằm vào số dư tài khoản vài giây: mấy chục đô la, biến mất.
Đây là thực tế mới OpenClaw mang lại. Trước đây trò chuyện với AI, một lần đối thoại vài nghìn Token, chi phí không đáng kể. Sau khi OpenClaw kết nối, AI chạy đồng thời hàng chục tác vụ con ở nền, liên tục gọi ngữ cảnh, lặp lại vòng lặp, mức tiêu thụ Token không tuyến tính, mà là theo cấp số nhân. Hóa đơn như chiếc xe mở nắp capô đang tăng tốc, đồng hồ xăng lao xuống, không dừng lại được.
Cộng đồng nhà phát triển sau đó lan truyền một "mẹo": dùng token OAuth kết nối trực tiếp tài khoản đăng ký Anthropic hoặc Google vào OpenClaw, biến hạn mức "vô hạn" theo tháng thành nhiên liệu miễn phí cho AI Agent, đây cũng là phương pháp nhiều nhà phát triển áp dụng.
Sự phản công chính thức sau đó ập đến.
Anthropic vào ngày 19 tháng 2 cập nhật thỏa thuận, cấm rõ ràng việc sử dụng chứng thực đăng ký Claude cho các công cụ bên thứ ba như OpenClaw, để kết nối tính năng Claude, phải đi qua kênh tính phí API. Google thậm chí cấm hàng loạt tài khoản đăng ký kết nối Antigravity và Gemini AI Ultra thông qua OpenClaw.
"Thiên hạ khổ Tần lâu rồi", Jhon lập tức gia nhập vào vòng tay của mô hình lớn Trung Quốc.
Trên OpenRouter, mô hình Trung Quốc MiniMax M2.5 điểm số trong nhiệm vụ kỹ thuật phần mềm là 80.2%, Claude Opus 4.6 là 80.8%, khoảng cách gần như không đáng kể. Nhưng giá cả khác biệt trời vực, đầu vào trước đó mỗi triệu Token 0.3 đô la, sau đó 5 đô la, chênh lệch khoảng 17 lần.
John chuyển sang, luồng công việc vẫn vận hành, hóa đơn co lại một bậc độ lớn, cuộc di cư này đang đồng thời xảy ra trên toàn cầu.
COO OpenRouter Chris Clark nói rất trực tiếp, lý do mô hình mã nguồn mở Trung Quốc có thể chiếm thị phần lớn, là vì tỷ lệ của chúng trong luồng công việc agent mà nhà phát triển Mỹ chạy là cực kỳ cao.
Xuất khẩu điện năng
Để hiểu bản chất của Token xuất hải, trước tiên phải nắm rõ cấu trúc chi phí của một Token.
Nó trông có vẻ nhẹ, một Token xấp xỉ bằng 0.75 từ tiếng Anh, một lần đối thoại thông thường của bạn với AI, tiêu thụ cũng chỉ vài nghìn Token. Nhưng khi những Token này chồng chất với đơn vị nghìn tỷ, thực tế vật lý đằng sau trở nên nặng nề.
Tách chi phí Token, cốt lõi chỉ có hai mục: năng lực tính toán và điện năng.
Năng lực tính toán là khấu hao GPU, bạn mua một card H100 của Nvidia, khoảng ba mươi nghìn đô la, tuổi thọ của nó quy đổi cho mỗi lần suy luận, chính là chi phí khấu hao. Điện năng là nhiên liệu vận hành liên tục của trung tâm dữ liệu, GPU khi tải đầy mỗi card tiêu thụ khoảng 700 watt, cộng với chi phí hệ thống làm mát, hóa đơn điện của một trung tâm dữ liệu AI lớn có thể dễ dàng vượt quá hàng trăm triệu đô la mỗi năm.
Bây giờ, hãy vẽ quá trình vật lý này trên bản đồ.
Một nhà phát triển Mỹ ở San Francisco gửi một yêu cầu API. Dữ liệu xuất phát từ California, thông qua cáp quang biển Thái Bình Dương đến một trung tâm dữ liệu ở Trung Quốc, cụm GPU bắt đầu làm việc, điện từ lưới điện Trung Quốc chảy đến những con chip, suy luận hoàn thành, kết quả truyền về. Toàn bộ quá trình, có lẽ chỉ mất một hai giây.
Điện, chưa bao giờ rời khỏi lưới điện Trung Quốc, nhưng giá trị của điện năng, thông qua Token, đã hoàn thành giao dịch xuyên biên giới.
Ở đây có một điểm kỳ diệu mà thương mại thông thường không thể với tới: Token không có hình dạng, không cần qua hải quan, không bị đánh thuế, thậm chí không nằm trong bất kỳ khẩu thống kê thương mại hiện hành nào. Trung Quốc xuất khẩu một lượng lớn dịch vụ năng lực tính toán và điện năng, nhưng trên dữ liệu thương mại hàng hóa chính thức, nó gần như vô hình.
Token trở thành sản phẩm phái sinh của điện năng, Token xuất hải bản chất là xuất khẩu điện năng.
Điều này cũng nhờ vào giá điện tương đối thấp của Trung Quốc, giá điện tổng hợp thấp hơn Mỹ khoảng 40%, đây là chênh lệch chi phí ở tầng vật lý, đối thủ cạnh tranh khó có thể sao chép dễ dàng.
Ngoài ra, mô hình AI Trung Quốc cũng có lợi thế thuật toán và "cuốn chiếu".
Kiến trúc MoE của DeepSeek V3 khi suy luận chỉ kích hoạt một phần tham số, kiểm tra độc lập cho thấy chi phí suy luận thấp hơn GPT-4o khoảng 36 lần, MiniMax M2.5 tương tự tổng tham số 229B chỉ kích hoạt 10B.
Tầng trên cùng là cuốn chiếu, Alibaba, ByteDance, Baidu, Tencent, Moon Dark Side, Zhipu, MiniMax... hàng chục công ty trên cùng một đường đua giẫm đạp lên nhau, giá cả từ lâu đã rơi xuống dưới vùng lợi nhuận hợp lý, lỗ vốn kiếm tiếng tăm đã là hiện trạng ngành.
Nhìn kỹ, điều này giống như xuất khẩu sản xuất Trung Quốc, tận dụng lợi thế chuỗi cung ứng và cuốn chiếu trong ngành, đẩy giá Token xuống mạnh.
Từ Bitcoin đến Token
Trước Token, đã có một lần xuất khẩu điện năng.
Khoảng trước sau năm 2015, các nhà quản lý trạm điện ở Tứ Xuyên, Vân Nam và Tân Cương, bắt đầu đón những vị khách kỳ lạ.
Những người này thuê nhà xưởng bỏ hoang, lắp đặt máy móc dày đặc, thông điện vận hành 24 giờ. Máy móc không sản xuất gì, chỉ không ngừng làm một bài toán toán học, thỉnh thoảng, từ bài toán vô tận này, tính ra một Bitcoin.
Đây là hình thái đầu tiên của xuất khẩu điện năng: biến thủy điện và phong điện giá rẻ, thông qua tính toán băm của máy đào, đổi thành tài sản số lưu thông toàn cầu, rồi trên sàn giao dịch hiện thực hóa thành đô la.
Điện không vượt qua bất kỳ biên giới nào, nhưng giá trị của điện năng, lấy Bitcoin làm vật mang, chảy vào thị trường toàn cầu.
Những năm đó, năng lực tính toán Trung Quốc từng chiếm hơn 70% năng lực đào Bitcoin toàn cầu. Thủy điện và nhiệt điện Trung Quốc, theo cách vòng vo này, tham gia vào một sự phân bổ lại vốn toàn cầu.
Năm 2021, tất cả đột ngột dừng lại. Búa quản lý giáng xuống, thợ đào tan tác, năng lực tính toán di cư đến Kazakhstan, Texas Mỹ và Canada.
Nhưng bản thân logic này chưa bao giờ biến mất, chỉ đang chờ đợi một vỏ bọc mới, cho đến khi ChatGPT ra đời, các mô hình lớn tranh hùng, trại đào Bitcoin xưa kia biến thành trung tâm dữ liệu AI, máy đào biến thành GPU tính toán, Bitcoin từng sản xuất biến thành Token, không thay đổi chỉ có điện năng.
Bitcoin xuất hải và Token xuất hải, về logic đáy là đồng cấu trúc, nhưng Token trong hiện tại có giá trị thương mại hơn.
Đào Bitcoin bằng máy đào là một tính toán toán học thuần túy, Bitcoin sản xuất ra là một tài sản tài chính, giá trị của nó đến từ sự khan hiếm và đồng thuận thị trường, hoàn toàn không liên quan đến "tính cái gì". Bản thân năng lực tính toán không có tính sản xuất, giống như một sản phẩm phụ của cơ chế tin tưởng.
Suy luận mô hình lớn thì khác. GPU tiêu thụ điện năng, sản xuất ra là dịch vụ nhận thức thực sự, mã code, phân tích, dịch thuật, sáng tạo. Giá trị của Token trực tiếp đến từ hiệu dụng của nó với người dùng. Đây là một sự nhúng sâu hơn, một khi luồng công việc của nhà phát triển phụ thuộc vào API của một mô hình nào đó, chi phí chuyển đổi sẽ tăng lên theo cấp số nhân theo thời gian.
Tất nhiên, còn một khác biệt then chốt: đào Bitcoin bị Trung Quốc trục xuất, còn Token xuất hải, được các nhà phát triển toàn cầu chủ động lựa chọn.
Chiến tranh Token
Sợi cáp dưới biển được đặt năm 1858, đại diện cho chủ quyền của Đế quốc Anh đối với đường cao tốc thông tin, ai sở hữu cơ sở hạ tầng, người đó có thể định nghĩa luật chơi.
Token xuất hải, đồng thời là một cuộc chiến không tuyên chiến, trở ngại chồng chất.
Chủ quyền dữ liệu là bức tường đầu tiên, một yêu cầu API của nhà phát triển Mỹ thông qua trung tâm dữ liệu Trung Quốc xử lý, dữ liệu vật lý chảy qua Trung Quốc. Đối với nhà phát triển cá nhân và ứng dụng nhỏ, đây không phải vấn đề, nhưng liên quan đến dữ liệu nhạy cảm doanh nghiệp, thông tin tài chính, cảnh quan tuân thủ chính phủ, đây là một điểm cứng. Đây cũng là lý do tại sao tỷ lệ thâm nhập của mô hình Trung Quốc trong lĩnh vực công cụ phát triển và ứng dụng cá nhân cao nhất, trong hệ thống cốt lõi doanh nghiệp hầu như không có sự hiện diện.
Lệnh cấm chip là bức tường thứ hai, phát triển AI Trung Quốc đối mặt với kiểm soát xuất khẩu GPU cao cấp của Nvidia, kiến trúc MoE và tối ưu hóa thuật toán chỉ có thể bù đắp một phần bất lợi này, trần nhà vẫn tồn tại.
Nhưng trở ngại trước mắt, chỉ là chương mở đầu, chiến trường lớn hơn đang hình thành.
Token và mô hình AI, đã trở thành chiều kích đấu tranh chiến lược mới giữa Trung-Mỹ, không kém gì bán dẫn, internet thế kỷ 20, thậm chí gần giống hơn với một phép ẩn dụ cổ xưa: tranh giành không gian.
Năm 1957, Liên Xô phóng Sputnik 1, Mỹ cả nước chấn động, lập tức khởi động kế hoạch Apollo, đổ xuống tài nguyên tương đương hàng nghìn tỷ đô la ngày nay, quyết không thua trong cuộc chạy đua không gian.
Logic tranh giành AI tương tự kinh ngạc, nhưng mức độ kịch liệt sẽ vượt xa cuộc chạy đua không gian. Không gian cuối cùng là không gian vật lý, người bình thường không cảm nhận được, AI thấm vào là mao mạch kinh tế, đằng sau mỗi dòng code, mỗi hợp đồng, mỗi hệ thống quyết định chính phủ, đều có thể chạy mô hình lớn của một quốc gia nào đó. Mô hình của ai trở thành lựa chọn mặc định cơ sở hạ tầng cho nhà phát triển toàn cầu, người đó trong vô hình đã giành được sức ảnh hưởng cấu trúc đối với nền kinh tế số toàn cầu.
Đây chính là điểm khiến Washington thực sự bất an về Token xuất hải Trung Quốc.
Khi kho code của một nhà phát triển, luồng công việc Agent, logic sản phẩm đều xây dựng xung quanh API của một mô hình Trung Quốc nào đó, chi phí di chuyển sẽ tăng theo cấp số nhân theo thời gian. Đến lúc đó, dù Mỹ lập pháp hạn chế, nhà phát triển cũng sẽ dùng chân để chống lại, giống như ngày nay không lập trình viên nào có thể từ bỏ GitHub.
Token xuất hải ngày nay, có lẽ chỉ là chương mở đầu của cuộc cờ vây dài này. Mô hình lớn Trung Quốc không tuyên bố lật đổ cái gì, chúng chỉ với giá thấp hơn, đưa dịch vụ đến tay mọi nhà phát triển có API Key trên toàn cầu.
Lần này, những người đặt cáp, là những đội ngũ kỹ sư viết code ở Hàng Châu, Bắc Kinh, Thượng Hải, và cụm GPU vận hành ngày đêm ở một tỉnh phía Nam nào đó.
Cuộc tranh giành này không có đếm ngược, nó diễn ra 24 giờ mỗi ngày, đơn vị là Token, chiến trường là terminal của mỗi nhà phát triển.
Twitter:https://twitter.com/BitpushNewsCN
Nhóm trao đổi TG Bitui:https://t.me/BitPushCommunity
Đăng ký TG Bitui: https://t.me/bitpush






