Token đắt, đốt tiền xót xa.
Đây không chỉ là tâm tư của những người đang mê mẩn Vibe Coding, mà ngay cả các "gã khổng lồ" thung lũng Silicon trước đây từng nhiệt tình cổ vũ Tokenmaxxing, cũng đã bắt đầu áp đặt giới hạn token cho nhân viên của mình.
Nhưng một điểm trái ngược thông thường là, những ai đang sử dụng dịch vụ AI theo hình thức đăng ký hiện nay, thực chất token mà bạn dùng đã được các hãng AI lớn trợ cấp, với mức trợ cấp cao nhất thậm chí có thể gấp 70 lần phí đăng ký!
Điều đáng lo hơn là, cả hai công ty dẫn đầu AI là OpenAI và Anthropic, đều đã bước vào giai đoạn chạy nước rút lên sàn. Sau khi hai công ty này lên sàn,
liệu có giống như thời đại Internet sau "cuộc chiến trợ cấp", các công ty còn lại bắt đầu tăng giá đơn hàng, để giá token trở về mức hợp lý?
Tin tốt là, tình huống này có thể sẽ không xảy ra. Gần đây, Bill Maris, người sáng lập Google Ventures, đã đặt ra một câu hỏi trong podcast All-in:
Nếu Google quyết định cắt giá token thêm 80%, OpenAI và Anthropic sẽ ứng phó ra sao?
Không phải là duy nhất, cách đây không lâu, nhóm khởi nghiệp Agnes AI, trong buổi livestream với Geek Park, đã giải thích chi tiết về "kỷ nguyên Token miễn phí" sắp tới.
Vậy, giá token trong tương lai rốt cuộc sẽ tăng, hay giảm? Và điều này có ý nghĩa gì với những người đã nghiện AI?
01 Trợ cấp Token đã đốt đến bốc khói
Tại sao nói, giá token hiện nay thực chất không đắt?
Bởi vì ít nhất trong mô hình đăng ký AI hiện tại, mức giá của các công ty AI đã là "giá gãy xương" sau khi được trợ cấp.
Gần đây, SemiAnalysis đã đánh giá chi tiết so sánh giữa giá trị token tiêu thụ thực tế và phí đăng ký trong mô hình đăng ký của OpenAI và Anthropic.
SemiAnalysis đã làm một việc đơn giản nhưng hiệu quả - sử dụng AI thực tế dưới các gói đăng ký của các nền tảng AI khác nhau để hoàn thành nhiệm vụ, sau đó sử dụng giá công khai của API để tính ngược lại xem những nhiệm vụ này có giá trị token bao nhiêu. Kết quả như sau:
Hãy lưu ý một quy luật: Gói càng đắt, hệ số trợ cấp càng cao. Điều này tự nó đã chứng minh rằng các gói cao cấp này không phải để kiếm tiền - chúng là một kiểu "định giá ngược", dùng sự thua lỗ mạnh mẽ nhất để giữ chân người dùng nặng nhất. Bởi vì người dùng nặng là nhà phát triển, là người ra quyết định doanh nghiệp, một khi họ bị ràng buộc với một nền tảng, sẽ kéo theo cả nhóm và toàn bộ dòng sản phẩm phía sau.
Lỗ đến mức này, tại sao vẫn làm? Câu trả lời tiêu chuẩn là: Đốt tiền trước để đổi lấy quy mô, khi quy mô lớn mạnh sẽ tăng giá để lấy lại máu. Internet di động đã chơi theo cách này - Didi và Uber đã trợ cấp hàng trăm tỷ nhân dân tệ cho phí taxi, sau khi trợ cấp kết thúc, phí taxi đã tăng; Meituan trợ cấp vô số suất ăn, sau khi trợ cấp kết thúc, phí vận chuyển đã tăng. Logic này thành lập có một tiền đề then chốt: Trong thời kỳ trợ cấp đã xây dựng được hiệu ứng khóa chặt.
Didi có thể tăng giá, bởi vì tài xế không thể tách rời dòng đơn hàng trên nền tảng, hành khách không thể tách rời tài xế trên nền tảng. Meituan có thể tăng giá, bởi vì cửa hàng không thể tách rời lưu lượng truy cập và mạng lưới vận chuyển của nó. Khi trợ cấp kết thúc, người dùng đã bị "khóa" trong hệ sinh thái, chi phí chuyển đổi cực kỳ cao.
Nhưng cuộc chiến AI có một khác biệt căn bản với Internet - Token hầu như không có hiệu ứng khóa chặt.
Nếu Claude tăng giá, nhà phát triển có thể di chuyển việc gọi API sang GPT hoặc Gemini chỉ trong một ngày - giao diện của các hãng ngày càng tiêu chuẩn hóa, nhiều khung phát triển thậm chí tích hợp sẵn tính năng chuyển đổi đa mô hình. Với người dùng phổ thông còn đơn giản hơn: chỉ cần đổi một địa chỉ web. AI không giống như taxi có mạng lưới tài xế địa phương, không giống như dịch vụ giao đồ ăn có hệ thống vận chuyển, không giống như mạng xã hội có chuỗi quan hệ bạn bè. Token chỉ là token, dù là của hãng nào sản xuất, cũng là cùng một loại.
Điều này có nghĩa là một khi trợ cấp dừng lại, người dùng có thể biến mất ngay lập tức. Trợ cấp không phải đang "xây dựng rào cản", mà giống như "duy trì nhịp tim" hơn - chỉ cần có người ra giá thấp hơn, người dùng sẽ chạy.
Và điều này còn chưa tính đến một biến số mới đang khiến hóa đơn của mọi người vượt tầm kiểm soát: AI Agent.
Khi bạn trò chuyện với ChatGPT, một cuộc hội thoại có lẽ tiêu thụ vài nghìn token. Nhưng khi bạn để AI Agent thực hiện một nhiệm vụ phức tạp - viết một đoạn mã rồi tự động gỡ lỗi, phân tích một tài liệu hàng chục trang rồi tạo báo cáo - một vòng như vậy, mức tiêu thụ token là 5 đến 30 lần so với cuộc trò chuyện thông thường. Có nhà phát triển thử nghiệm thực tế, trên gói Claude Max 100 đô la, một phiên lập trình Agent có thể đốt hết token trị giá gần trăm đô la. CTO của Uber gần đây tiết lộ, công ty chỉ trong bốn tháng đã đốt hết ngân sách AI cả năm 2026.
Vấn đề là, cuộc chiến trợ cấp Token như vậy có thể kéo dài được không? Ai có khả năng vẫn đứng vững sau cuộc hỗn chiến?
Bill Maris cho rằng câu trả lời rõ ràng là những gã khổng lồ truyền thống.
02 Token làm vũ khí
Để hiểu sự khốc liệt thực sự của cuộc chiến trợ cấp này, cần phải nhìn rõ một sự bất đối xứng có tính cấu trúc - nguồn đạn dược của các bên tham chiến hoàn toàn khác nhau.
Doanh thu quảng cáo hàng năm của Google vượt quá 3000 tỷ đô la. Đây không phải là tiền của nhà đầu tư, không phải tiền vốn rót vốn để đốt, mà là một cỗ máy in tiền tự động vận hành mỗi ngày. Hàng tỷ người trên thế giới mỗi ngày mở công cụ tìm kiếm, xem YouTube, dùng Gmail, tiền quảng cáo tự động chảy vào tài khoản. Nó không cần thuyết trình, không cần lấy lòng nhà phân tích, không cần giải thích với bất kỳ ai tại sao phải chi số tiền này.
Google dùng lợi nhuận quảng cáo để trợ cấp token AI, giống như một người sở hữu giếng dầu đi đánh cuộc chiến giá với các trạm xăng - dầu của anh ta là từ dưới đất nhà mình trào lên, còn dầu của đối thủ là đi vay ngân hàng để mua.
OpenAI và Anthropic, chính là những người đi vay mua dầu đó.
OpenAI đã huy động tổng cộng hơn 1800 tỷ đô la, định giá mới nhất vượt 8500 tỷ đô la. Anthropic huy động được hơn 1300 tỷ đô la. Số tiền này đến từ các nhà đầu tư mạo hiểm và nhà đầu tư chiến lược - họ cho tiền không phải làm từ thiện, họ kỳ vọng các công ty này lên sàn, kỳ vọng khi thoái vốn sẽ thu được lợi nhuận phong phú.
Và sau khi lên sàn, rắc rối mới thực sự bắt đầu. Lên sàn có nghĩa là báo cáo tài chính công khai với cả thế giới. Mỗi quý, các nhà phân tích Phố Wall sẽ theo dõi doanh thu, lợi nhuận, chi phí thu hút người dùng, chi phí biên. Khi họ tính toán ra rằng cứ mỗi 1 đô la phí đăng ký bạn nhận được, bạn thực tế lỗ 70 đô la - thì câu chuyện tăng trưởng dù có huy hoàng đến đâu cũng không chống đỡ nổi giá cổ phiếu.
Bill Maris đã nói thẳng logic này trong podcast. Nguyên văn của ông là: "Nếu tôi là Google, quyết định cắt giá token tùy ý 80%, thì mô hình kinh doanh của OpenAI và Anthropic sẽ thế nào?"
Người dẫn chương trình hỏi tiếp xác suất đó lớn bao nhiêu. Maris không do dự: "100%. Capital as a weapon, tokens as a weapon (Vốn làm vũ khí, Token làm vũ khí)."
Đây không phải là suy đoán của nhà phân tích. Bill Maris là người sáng lập kiêm CEO của Google Ventures, cũng là Phó Chủ tịch Dự án Đặc biệt của Google, từng ấp ủ Waymo và Google X. Tất cả mọi người có mặt đều hiểu: Đây không phải là giả định, đây là ông ấy đã tận mắt thấy Google chiến đấu như thế nào.
Ông mô tả cảnh tượng đơn giản: Google tuyên bố Gemini API giảm giá 80%. Khách hàng doanh nghiệp sẽ làm gì? Nếu chất lượng sản phẩm tương đương - trong nhiều bài kiểm tra chuẩn, Gemini đã không thua kém Claude và GPT - nhưng giá rẻ hơn 4/5, bạn có tiếp tục dùng cái đắt hơn không?
Maris tự đưa ra câu trả lời: "Nếu bạn là một công ty, đến Google và Gemini có thể trả ít hơn 80% tiền, mua sản phẩm về cơ bản giống nhau, tại sao bạn không? Và sau đó áp lực lên những công ty đó sẽ trở nên rất nghiêm trọng."
Và OpenAI cùng Anthropic hầu như không có biện pháp phản công đối xứng. Họ không thể theo giá - không có máy in tiền, mỗi đô la đều là tiền của nhà đầu tư. Họ cũng không thể dựa vào khoảng cách công nghệ để duy trì mức giá cao hơn - khoảng cách giữa các mô hình lớn đang thu hẹp nhanh chóng, hôm nay bạn dẫn trước ba tháng, ba tháng sau đã bị đuổi kịp. Điều này không giống như sự chênh lệch thế hệ công nghệ một đời như iPhone so với Nokia. Hào phòng thủ giữa các mô hình AI, giống như đê đắp bằng cát, nước triều lên là tràn qua.
Trong cách kể chuyện của Bill, Google có lợi thế thắng lớn, nhưng trong thế giới AI, Google thực sự có thể độc quyền không? Meta có thể bất cứ lúc nào mở nguồn một mô hình miễn phí, Trung Quốc có DeepSeek và ByteDance, Amazon đang đẩy mô hình của riêng mình. Khi bạn hạ giá token xuống bằng giá bắp cải, đối thủ cạnh tranh không biến mất - họ cũng đang giảm giá.
Cuộc chiến AI, có thể không có người thắng.
03 Trò chơi 'vô hạn' của Token?
Ngay cả những người không rõ lắm về lịch sử, đều phần nào đưa ra phán đoán về kết cục của cuộc chiến AI hiện nay như sau:
Kịch bản thứ nhất là kịch bản "dịch vụ Internet" - câu chuyện của Didi, câu chuyện của Amazon: Trợ cấp trước, độc quyền sau, rồi tăng giá thu hoạch. Trong kịch bản này, chiến tranh giá cả hôm nay chỉ là khúc dạo đầu, cuối cùng sẽ có một hoặc hai người chiến thắng chiếm phần lớn thị trường, giành quyền định giá. Nếu như vậy, sự thua lỗ khổng lồ hiện nay là một khoản đầu tư có lời - giống như Amazon lỗ hai mươi năm, cuối cùng trở thành ông vua kép của thương mại điện tử và điện toán đám mây.
Kịch bản thứ hai là kịch bản "nước, điện, than". Token trở thành một nguồn tài nguyên cơ sở tiêu chuẩn hóa, giống như điện lực, băng thông, lưu trữ đám mây. Không ai có thể duy trì quyền định giá lâu dài, bởi vì sự khác biệt sản phẩm quá nhỏ, chi phí chuyển đổi quá thấp. Cạnh tranh đẩy giá vô hạn về đường chi phí, tỷ suất lợi nhuận tiệm cận bằng không. Cuối cùng, chính phủ có thể can thiệp quản lý - giống như một trăm năm trước đã làm với điện lực và viễn thông.
Phân giới của hai kịch bản phụ thuộc vào một từ:
Khóa chặt.
Didi có thể tăng giá, vì hành khách bị khóa trong mạng lưới tài xế, tài xế cũng bị khóa trong dòng đơn hàng. Amazon có thể tăng giá, vì cửa hàng bị khóa trong hệ sinh thái hậu cần và lưu lượng của nó.
Hiệu ứng khóa chặt là nền tảng của mô hình "lỗ trước, lãi sau".
Nhưng token AI - như đã lập luận nhiều lần ở trên - hầu như không tồn tại sự khóa chặt. API tiêu chuẩn hóa, chi phí chuyển đổi xấp xỉ bằng không. Điều kiện cốt lõi để kịch bản thứ nhất thành lập, trên sản phẩm token này không tồn tại.
Nếu kịch bản thứ hai, kết cục cơ sở hạ tầng "nước, điện, than", gần với thực tế hơn, điều chúng ta đang chứng kiến không phải là một cuộc chiến sắp phân thắng bại, mà là một cuộc thi đấu tiêu hao không có kết cục.
Vương Hưng, người sáng lập Meituan, từng mô tả trạng thái cạnh tranh này. Sự thấu hiểu của ông là: Một số cạnh tranh không tồn tại khái niệm "thắng". Mục tiêu của người tham gia không phải là đánh bại đối thủ, mà là đảm bảo mình luôn ở trên bàn bài. Bởi vì chỉ cần còn trên bàn bài, bạn có thể tiếp tục huy động vốn, tuyển người, lặp lại. Rời khỏi bàn bài mới là cách thua duy nhất.
Dùng khuôn khổ này xem xét lại cấu trúc AI ngày nay, nhiều điều tưởng như mâu thuẫn bỗng trở nên rõ ràng.
Định giá vòng mới nhất của OpenAI vượt 8000 tỷ đô la, không phải vì huấn luyện mô hình cần nhiều tiền đến thế. Nó cần nhiều tiền như vậy để tiếp tục cuộc chiến giá. Huy động vốn không phải để thắng, là để "có tư cách tiếp tục đánh".
Google chuẩn bị giảm giá token 80%, không phải để tiêu diệt OpenAI và Anthropic. Nó là để đảm bảo mình trong thời đại AI luôn là người chơi cốt lõi - giống như nó từng thông qua Android miễn phí, đảm bảo mình không bị thời đại di động bỏ lại trên bàn bài.
Còn Anthropic tăng giá API của mô hình hàng đầu mới nhất Fable 5 lên gấp đôi thế hệ trước - đầu vào mỗi triệu token 10 đô la, đầu ra mỗi triệu 50 đô la - nhìn bề ngoài là "tăng giá", thực chất là chủ động sàng lọc khách hàng doanh nghiệp sẵn lòng trả giá cao cho năng lực cao cấp, bởi vì trong lòng họ rõ: Cuộc chiến trợ cấp phía người tiêu dùng, không thể thắng được Google.
Mỗi vòng chiến tranh giá, đều sẽ mở rộng quy mô sử dụng AI. Quy mô mở rộng, có nghĩa là nhiều dữ liệu hơn, nhiều kịch bản hơn, nhiều nhà phát triển hơn đổ vào hệ sinh thái. Điều này ngược lại khiến mô hình của tất cả người tham gia trở nên mạnh hơn. Người tham chiến dùng chính cuộc chiến để thu hút tài nguyên nâng cấp bản thân - đây không phải là một trò chơi tổng bằng không ăn thua, mà là một quá trình tất cả mọi người thông qua cạnh tranh cùng nhau trở nên mạnh hơn, nhưng cũng khó có thể kiếm được lợi nhuận khổng lồ.
Nghe có vẻ, có giống như diện mạo cuối cùng của ngành điện lực không?
140 năm trước, Edison và Westinghouse đều nghĩ mình đang tranh giành một thị trường người thắng ăn tất. Họ đặt cược toàn bộ gia tài, cá rằng "ai định nghĩa tiêu chuẩn điện lực, người đó sẽ sở hữu điện lực". Nhưng số phận của điện lực nói với chúng ta một đạo lý đơn giản:
Khi một công nghệ đủ quan trọng, đủ phổ quát, đủ tiêu chuẩn hóa, nó không còn thuộc về bất kỳ công ty nào. Nó thuộc về cơ sở hạ tầng.
Cạnh tranh AI, nhìn bề mặt là Google với OpenAI với Anthropic, là so tài năng lực mô hình, là so quy mô huy động vốn. Nhưng kéo ống kính ra xa, tác dụng thực sự của cuộc cạnh tranh này là: Nó đang đẩy nhanh AI lên một tầng cơ sở hạ tầng mà bất kỳ công ty nào cũng không thể độc chiếm.
Khi Bill Maris nói "100% sẽ xảy ra", có lẽ ông không chỉ dự đoán Google sẽ giảm giá. Ông có lẽ đang không tự giác dự đoán một xu hướng lớn hơn - trong thế giới AI, token cuối cùng sẽ không thuộc về bất kỳ ai. Giống như ngày nay không ai "sở hữu" điện lực vậy.
Với OpenAI và Anthropic, điều này mang ý nghĩa một việc bất an: Ngay cả khi dẫn đầu công nghệ, ngay cả khi huy động được số vốn khổng lồ, tương lai "kiếm tiền lớn nhờ AI" mà họ đuổi theo, có thể ngay từ đầu đã không tồn tại. Họ đối mặt không phải một cuộc chiến giá tạm thời, mà là một số phận có tính cấu trúc - thứ họ đang cố gắng xây dựng, về bản chất có thể chính là nước, điện và đường xá của thế hệ tiếp theo.
Còn với người dùng, ở mức độ nào đó, có lẽ là một tin tốt. Bởi vì chỉ cần cuộc chiến trợ cấp Token tiếp tục, mọi người vẫn có thể tận hưởng "giao dịch tốt" 20 đô la chi phí, 400 đô la sức tính toán.
Bài viết từ tài khoản WeChat công khai "Công viên Kỹ thuật" (ID: geekpark), tác giả: Dũng sĩ Vũ trụ







