Tác giả | Hành Trình Nhà Thám Hiểm
Token đắt, đốt tiền khiến người ta xót ruột.
Đây không chỉ là tâm tư của những người đam mê "Vibe Coding" hiện nay, mà ngay cả các ông lớn Thung lũng Silicon từng cổ xúy điên cuồng "Tokenmaxxing" cũng bắt đầu áp đặt giới hạn token cho nhân viên của mình.
Nhưng thực tế có một điểm trái với lẽ thường là, hiện tại những ai đang sử dụng gói đăng ký AI, token mà bạn dùng thực chất đã được các công ty AI lớn bao cấp, với mức bao cấp cao nhất thậm chí có thể gấp 70 lần phí đăng ký!
Điều đáng lo ngại hơn một chút là, cả OpenAI và Anthropic, hai đầu tàu trong lĩnh vực AI, đều đã bước vào giai đoạn chạy nước rút chuẩn bị cho IPO. Sau khi hai công ty này lên sàn,
liệu có giống như thời kỳ "cuộc chiến bao cấp" của kỷ nguyên internet trước đây, các công ty còn lại sẽ bắt đầu tăng giá đơn hàng, đưa giá token trở về mức hợp lý?
Tin tốt là, tình huống đó có thể sẽ không xảy ra. Gần đây, người sáng lập Google Ventures Bill Maris, trong podcast All-in, đã đặt ra một câu hỏi:
Nếu Google quyết định cắt giảm giá token thêm 80%, OpenAI và Anthropic sẽ phản ứng như thế nào?
Không phải là trùng hợp, không lâu trước đó, đội ngũ khởi nghiệp Agnes AI, trong buổi livestream với Công Viên Công Nghệ, đã giải thích chi tiết về khả năng đến của "Kỷ nguyên Token miễn phí".
Vậy, tương lai giá token sẽ tăng hay giảm? Và điều này có ý nghĩa gì đối với những người đã nghiện AI?
01 Cuộc chiến bao cấp Token đã bốc khói nghi ngút
Tại sao nói, giá token hiện tại, thực chất không hề đắt?
Bởi vì ít nhất trong mô hình đăng ký AI, giá cả hiện tại của các công ty AI đã là "giá gãy xương" sau khi được bao cấp rồi.
Gần đây, SemiAnalysis đã đánh giá chi tiết sự tương phản giữa giá trị token tiêu thụ thực tế và phí đăng ký trong mô hình đăng ký của OpenAI và Anthropic.
SemiAnalysis đã làm một việc đơn giản nhưng hiệu quả - thực tế sử dụng AI để hoàn thành các nhiệm vụ khác nhau dưới các gói đăng ký của các nền tảng AI, sau đó sử dụng giá công khai của API để tính ngược lại xem những nhiệm vụ này trị giá bao nhiêu token. Kết quả như sau:
Hãy chú ý một quy luật: Gói càng đắt, hệ số bao cấp càng cao. Điều này tự nó đã chứng tỏ các gói cao cấp này không phải để kiếm tiền - chúng là một kiểu "định giá ngược", dùng sự lỗ lãi cực kỳ mạnh tay để giữ chân những người dùng nặng nhất. Bởi vì người dùng nặng là các nhà phát triển, là người ra quyết định doanh nghiệp, một khi họ bị ràng buộc với một nền tảng nào đó, phía sau họ sẽ kéo theo cả một đội ngũ và toàn bộ dòng sản phẩm.
Lỗ đến mức này, tại sao vẫn phải làm? Câu trả lời tiêu chuẩn là: Đốt tiền trước để đổi lấy quy mô, quy mô tăng lên rồi sẽ tăng giá để hồi vốn. Mạng di động đã hoạt động như vậy - Didi và Uber đã bao cấp hàng trăm tỷ nhân dân tệ tiền gọi xe, sau khi kết thúc bao cấp, giá taxi đã tăng; Meituan bao cấp vô số bữa đồ ăn giao tận nơi, sau khi kết thúc bao cấp, phí giao hàng đã tăng. Logic này thành lập có một tiền đề then chốt: Hiệu ứng khóa chân được thiết lập trong thời kỳ bao cấp.
Didi có thể tăng giá, vì tài xế không thể tách rời dòng đơn hàng trên nền tảng, hành khách không thể tách rời tài xế trên nền tảng. Meituan có thể tăng giá, vì các cửa hàng không thể tách rời lưu lượng truy cập và mạng lưới giao hàng của nó. Khi kết thúc bao cấp, người dùng đã bị "khóa" trong hệ sinh thái, chi phí chuyển đổi cực kỳ cao.
Nhưng cuộc chiến AI, có một sự khác biệt cơ bản so với internet - Token gần như không có hiệu ứng khóa chân.
Nếu Claude tăng giá, các nhà phát triển có thể di chuyển việc gọi API sang GPT hoặc Gemini chỉ trong một ngày - giao diện của các hãng ngày càng chuẩn hóa, nhiều framework phát triển thậm chí tích hợp sẵn chức năng chuyển đổi đa mô hình. Với người dùng phổ thông còn đơn giản hơn: chỉ cần đổi một địa chỉ web. AI không giống như gọi xe có mạng lưới tài xế địa phương, không giống như đồ ăn giao tận nơi có hệ thống phân phối, không giống như mạng xã hội có chuỗi quan hệ bạn bè. Token chỉ là token, dù là của hãng nào sản xuất, cũng đều là một thứ như nhau.
Điều này có nghĩa là một khi việc bao cấp dừng lại, người dùng có thể rời bỏ trong nháy mắt. Bao cấp không phải đang "xây dựng rào cản", mà giống như đang "duy trì nhịp tim" hơn - chỉ cần có ai đó ra giá thấp hơn, người dùng sẽ bỏ chạy.
Và điều này vẫn chưa tính đến một biến số mới đang khiến hóa đơn của mọi người mất kiểm soát: AI Agent.
Khi bạn trò chuyện với ChatGPT, một cuộc hội thoại có thể tiêu thụ vài nghìn token. Nhưng khi bạn để AI Agent thực hiện một nhiệm vụ phức tạp - viết một đoạn mã rồi tự động gỡ lỗi, phân tích một tài liệu vài chục trang rồi tạo báo cáo - một vòng thực hiện, lượng token tiêu thụ gấp từ 5 đến 30 lần so với cuộc trò chuyện thông thường. Có nhà phát triển thử nghiệm thực tế, trên gói Claude Max 100 đô la, một phiên làm việc lập trình với Agent có thể đốt hết số token trị giá gần trăm đô la. CTO của Uber gần đây tiết lộ, công ty đã đốt hết ngân sách AI cả năm 2026 chỉ trong bốn tháng.
Vấn đề là, cuộc chiến bao cấp Token như vậy, có thể kéo dài không? Ai có khả năng là người vẫn đứng vững sau cuộc hỗn chiến này?
Bill Maris cho rằng câu trả lời rõ ràng là các ông lớn truyền thống.
02 Token như một vũ khí
Để hiểu được sự tàn khốc thực sự của cuộc chiến bao cấp này, cần phải nhìn rõ một sự bất đối xứng mang tính cấu trúc - nguồn đạn dược của các bên tham chiến hoàn toàn khác nhau.
Doanh thu quảng cáo hàng năm của Google vượt quá 300 tỷ đô la. Đây không phải tiền do nhà đầu tư cho, không phải tiền đốt từ vốn gọi được, mà là một cỗ máy in tiền tự động vận hành mỗi ngày. Hàng tỷ người trên thế giới mỗi ngày mở công cụ tìm kiếm, xem YouTube, dùng Gmail, tiền quảng cáo sẽ tự động chảy vào tài khoản. Nó không cần pitching, không cần làm hài lòng các nhà phân tích, không cần giải thích với bất kỳ ai tại sao phải tiêu số tiền này.
Google dùng lợi nhuận quảng cáo để bao cấp AI token, giống như một người sở hữu mỏ dầu đi đánh cuộc chiến giá với các trạm xăng - dầu của anh ta là từ trong lòng đất nhà mình trào ra, còn dầu của đối thủ là vay ngân hàng mua về.
OpenAI và Anthropic, chính là những người vay tiền mua dầu đó.
OpenAI đã huy động tổng cộng hơn 180 tỷ đô la, định giá mới nhất vượt quá 8500 tỷ đô la. Anthropic huy động được hơn 130 tỷ đô la. Những số tiền này đến từ các nhà đầu tư mạo hiểm và đầu tư chiến lược - họ cho tiền không phải để làm từ thiện, họ kỳ vọng các công ty này lên sàn, kỳ vọng nhận được lợi nhuận phong phú khi thoái vốn.
Và sau khi lên sàn, rắc rối mới thực sự bắt đầu. Lên sàn có nghĩa là báo cáo tài chính công khai với toàn thế giới. Mỗi quý, các nhà phân tích phố Wall sẽ theo sát doanh thu, lợi nhuận, chi phí thu hút người dùng, chi phí biên. Khi họ tính toán ra rằng cứ mỗi 1 đô la phí đăng ký bạn nhận được, bạn thực tế lỗ 70 đô la - thì câu chuyện tăng trưởng dù huy hoàng đến đâu cũng không chống đỡ nổi giá cổ phiếu.
Bill Maris đã nói logic này rất thẳng thắn trên podcast. Nguyên văn lời ông là: "Nếu tôi là Google, quyết định cắt giảm giá token bất kỳ 80%, thì mô hình kinh doanh của OpenAI và Anthropic sẽ xảy ra chuyện gì?"
Người dẫn chương trình truy hỏi xác suất đó là bao nhiêu. Maris không do dự: "100%. Capital as a weapon, tokens as a weapon (Vốn như một vũ khí, Token như một vũ khí)."
Đây không phải là suy đoán của nhà phân tích. Bill Maris là người sáng lập kiêm CEO của Google Ventures, cũng là Phó chủ tịch Dự án đặc biệt của Google, từng ấp ủ Waymo và Google X. Tất cả mọi người có mặt đều hiểu: Đây không phải là giả định, đây là những gì ông đã tận mắt chứng kiến Google chiến đấu như thế nào.
Ông vẽ ra một cảnh tượng rất đơn giản: Google tuyên bố giảm giá API Gemini 80%. Khách hàng doanh nghiệp sẽ làm gì? Nếu chất lượng sản phẩm tương đương - trong nhiều bài kiểm tra chuẩn, Gemini đã không kém cạnh Claude và GPT - nhưng giá rẻ hơn bốn phần năm, bạn có tiếp tục dùng cái đắt hơn không?
Maris tự đưa ra câu trả lời: "Nếu bạn là một công ty, đến Google và Gemini có thể trả ít hơn 80% số tiền, mua được sản phẩm cơ bản giống nhau, tại sao bạn lại không? Và sau đó áp lực lên những công ty đó sẽ trở nên vô cùng nghiêm trọng."
Còn OpenAI và Anthropic gần như không có biện pháp phản công đối xứng. Họ không thể theo đuôi giảm giá - không có cỗ máy in tiền, mỗi đô la đều là tiền của nhà đầu tư. Họ cũng không thể dựa vào khoảng cách kỹ thuật để duy trì giá cao - khoảng cách giữa các mô hình lớn đang thu hẹp nhanh chóng, hôm nay bạn dẫn trước ba tháng, ba tháng sau sẽ bị đuổi kịp. Điều này không giống như sự chênh lệch thế hệ công nghệ một đời giữa iPhone và Nokia. Hào phòng thủ giữa các mô hình AI, giống như đê đắp bằng cát, nước triều lên là tràn qua.
Trong lời kể của Bill, Google có cơ hội thắng lớn, nhưng trong thế giới AI, Google thực sự có thể độc quyền sao? Meta có thể bất cứ lúc nào mở nguồn một mô hình miễn phí, Trung Quốc có DeepSeek và ByteDance, Amazon đang đẩy mô hình của riêng mình. Khi bạn đánh giá token xuống mức giá rẻ như bắp cải, đối thủ cạnh tranh không biến mất - họ cũng đang giảm giá.
Cuộc chiến AI, có thể không có kẻ thắng cuộc.
03 Trò chơi "vô hạn" của Token?
Cho dù không rõ lịch sử đến đâu, người ta cũng ít nhiều có thể đưa ra phán đoán sau về kết cuộc của cuộc chiến AI hiện tại:
Kịch bản thứ nhất là kịch bản "dịch vụ internet" - câu chuyện của Didi, câu chuyện của Amazon: Bao cấp trước, độc quyền sau, rồi tăng giá để thu hoạch. Trong kịch bản này, cuộc chiến giá hiện tại chỉ là mở màn, cuối cùng sẽ có một hoặc hai người chiến thắng chiếm phần lớn thị trường, giành quyền định giá. Nếu như vậy, sự thua lỗ khổng lồ trước mắt là một khoản đầu tư có lời - giống như Amazon lỗ hai mươi năm, cuối cùng trở thành ông trùm cả thương mại điện tử lẫn điện toán đám mây.
Kịch bản thứ hai là kịch bản "nước, điện, than". Token trở thành một nguồn tài nguyên cơ sở tiêu chuẩn hóa, giống như điện lực, băng thông, lưu trữ đám mây. Không ai có thể duy trì quyền định giá lâu dài, vì sự khác biệt sản phẩm quá nhỏ, chi phí chuyển đổi quá thấp. Cạnh tranh đẩy giá xuống vô hạn về mức chi phí, tỷ suất lợi nhuận tiệm cận bằng không. Cuối cùng, chính phủ có thể can thiệp quản lý - giống như một trăm năm trước đã làm với điện lực và viễn thông.
Sự phân chia của hai kịch bản phụ thuộc vào một từ:
Khóa chân.
Didi có thể tăng giá, vì hành khách bị khóa trong mạng lưới tài xế, tài xế cũng bị khóa trong dòng đơn hàng. Amazon có thể tăng giá, vì các cửa hàng bị khóa trong hệ sinh thái logistics và lưu lượng của nó.
Hiệu ứng khóa chân là nền tảng của mô hình "lỗ trước, lãi sau".
Nhưng AI token - như đã lập luận nhiều lần trước đó - gần như không tồn tại sự khóa chân. API tiêu chuẩn hóa, chi phí chuyển đổi xấp xỉ bằng không. Điều kiện cốt lõi để kịch bản thứ nhất thành lập, trên sản phẩm token này không hề tồn tại.
Nếu kịch bản thứ hai, kết cuộc cơ sở hạ tầng "nước, điện, than", gần với thực tế hơn, những gì chúng ta đang chứng kiến không phải là một cuộc chiến cuối cùng sẽ phân thắng bại, mà là một cuộc thi đấu tiêu hao không có hồi kết.
Người sáng lập Meituan Vương Hưng từng miêu tả trạng thái cạnh tranh này. Sự thấu hiểu của ông là: Có một số cuộc cạnh tranh không tồn tại khái niệm "thắng". Mục tiêu của người tham gia không phải là đánh bại đối thủ, mà là đảm bảo bản thân luôn ở trên bàn chơi. Bởi vì chỉ cần còn ở trên bàn chơi, bạn có thể tiếp tục huy động vốn, tuyển người, lặp lại. Rời khỏi bàn chơi mới là cách thua duy nhất.
Dùng khung này để xem xét lại cục diện AI hiện nay, nhiều điều tưởng chừng mâu thuẫn bỗng trở nên rõ ràng.
Vòng định giá mới nhất của OpenAI vượt 8000 tỷ đô la, không phải vì huấn luyện mô hình cần nhiều tiền đến vậy. Nó cần nhiều tiền như vậy để tiếp tục cuộc chiến giá. Huy động vốn không phải để thắng, mà là để "có tư cách tiếp tục chiến đấu".
Google chuẩn bị giảm giá token 80%, không phải để tiêu diệt OpenAI và Anthropic. Nó là để đảm bảo bản thân trong thời đại AI luôn là người chơi cốt lõi - giống như nó đã từng thông qua Android miễn phí, đảm bảo mình không bị bỏ lại khỏi bàn chơi thời kỳ di động.
Còn Anthropic đưa giá API của mô hình hàng đầu mới nhất Fable 5 lên gấp đôi thế hệ trước - đầu vào 10 đô la mỗi triệu token, đầu ra 50 đô la mỗi triệu - xem ra đang "tăng giá", thực chất là chủ động sàng lọc khách hàng doanh nghiệp sẵn sàng trả tiền cho năng lực cao cấp, bởi vì trong lòng họ rõ ràng: Cuộc chiến bao cấp phía người tiêu dùng, là đốt không thắng nổi Google.
Mỗi vòng chiến giá, sẽ mở rộng quy mô sử dụng AI. Quy mô mở rộng, đồng nghĩa với nhiều dữ liệu hơn, nhiều ngữ cảnh hơn, nhiều nhà phát triển hơn đổ vào hệ sinh thái. Điều này ngược lại khiến mô hình của tất cả người tham gia trở nên mạnh hơn. Người tham chiến dùng chính cuộc chiến để thu hút tài nguyên nâng cấp bản thân - đây không phải là một trò chơi tổng bằng không bạn chết tôi sống, mà là một quá trình mọi người thông qua cạnh tranh cùng nhau trở nên mạnh hơn, nhưng cũng đều không mấy khả năng kiếm được lợi nhuận khổng lồ.
Nghe điều này, có giống như cái kết cuối cùng của ngành điện lực không?
140 năm trước, Edison và Westinghouse đều nghĩ rằng mình đang tranh giành một thị trường kẻ thắng ăn tất. Họ đập toàn bộ gia sản xuống, cá cược "ai định nghĩa tiêu chuẩn điện lực, người đó sẽ sở hữu điện lực". Nhưng số phận của điện lực nói với chúng ta một đạo lý đơn giản:
Khi một công nghệ đủ quan trọng, đủ phổ quát, đủ tiêu chuẩn hóa, nó sẽ không còn thuộc về bất kỳ công ty nào. Nó thuộc về cơ sở hạ tầng.
Cuộc cạnh tranh AI, nhìn bề ngoài là Google đấu với OpenAI, đấu với Anthropic, là so kè năng lực mô hình, là tranh đua quy mô huy động vốn. Nhưng kéo ống kính ra xa, tác dụng thực sự của cuộc cạnh tranh này là: Nó đang thúc đẩy đưa AI tiến đến một cấp độ cơ sở hạ tầng mà không công ty nào có thể độc chiếm.
Khi Bill Maris nói "100% sẽ xảy ra", có thể ông không chỉ đang tiên tri Google sẽ giảm giá. Có thể ông đang vô thức tiên tri một xu hướng lớn hơn - trong thế giới AI, token cuối cùng sẽ không thuộc về bất kỳ ai. Giống như ngày nay không ai "sở hữu" điện lực vậy.
Đối với OpenAI và Anthropic, điều này có nghĩa là một việc bất an: Cho dù dẫn đầu về công nghệ, cho dù huy động được số vốn khổng lồ, tương lai "kiếm tiền lớn nhờ AI" mà họ đuổi theo, có thể từ đầu đã không tồn tại. Họ đối mặt không phải là một cuộc chiến giá tạm thời, mà là một vận mệnh mang tính cấu trúc - thứ mà họ đang ra sức xây dựng, về bản chất có thể chính là nước, điện và đường cao tốc của thế hệ tiếp theo.
Còn đối với người dùng, ở một mức độ nào đó, có thể là một tin tốt. Bởi vì chỉ cần cuộc chiến bao cấp Token còn tiếp diễn, mọi người vẫn có thể tận hưởng "món hời" chi phí 20 đô la, năng lực tính toán trị giá 400 đô la."






