Văn bản | Silicon-based Quadrant
Khi người dùng không còn băn khoăn mỗi tháng có nên nâng cấp gói dữ liệu hay không, có lẽ họ sẽ bắt đầu băn khoăn mỗi tháng mua bao nhiêu dịch vụ Token.
Token sắp trở thành dịch vụ tiêu chuẩn được các nhà mạng đóng gói và bán ra, giống như lưu lượng, băng thông rộng hay tin nhắn.
Gần đây, ba nhà mạng lớn trong nước lần lượt cho ra mắt sản phẩm gói Token: ra mắt gói Token đăng ký theo tháng dành cho người dùng cá nhân, cung cấp gói sức mạnh tính toán phân tầng cho khách hàng là nhà phát triển và doanh nghiệp, đồng thời công bố đã tích hợp hàng chục đến hàng trăm mô hình lớn vào nền tảng, "mua theo tháng, gọi nhiều mô hình, thanh toán bằng cước điện thoại".
China Telecom đã cho ra mắt gói Token dành cho cá nhân và doanh nghiệp, mức phí thấp nhất là 9,9 NDT/tháng, tương ứng 10 triệu Token; trong khi các nhà mạng địa phương như Shanghai Mobile, Shanghai Telecom lại tung ra mô hình tính phí theo điểm hạn mức hoặc Token thông dụng, ví dụ Shanghai Mobile chỉ 1 NDT có thể nhận được 400.000 Token.
Khi các nhà mạng bắt đầu bán dịch vụ Token, chi phí chuyển đổi mô hình lớn của người dùng sẽ giảm mạnh, điều đó có nghĩa là đối với các doanh nghiệp mô hình lớn, "độ trung thành của người dùng" sẽ bị suy yếu, chỉ có "cuộc đua khốc liệt hơn" mới có thể giữ vững thị trường.
Trong tương lai, các nhà cung cấp mô hình lớn như Doubao, Qianwen, DeepSeek, không chỉ phải cạnh tranh về "giá cả", "chất lượng Token trên một đơn vị năng lượng tiêu thụ", mà thậm chí còn phải đua về "năng lực giải pháp ứng dụng AI có giá trị cao hơn".
01 Dịch vụ Token là gì?
Để hiểu dịch vụ Token, trước tiên phải hiểu Token là gì.
Máy tính không thể trực tiếp nhận dạng chữ viết, mà chỉ có thể nhận dạng mã 0 và 1, vì vậy mỗi từ ngữ, chữ cái, âm thanh, dấu câu chúng ta nhập vào đều thông qua một cơ chế mã hóa cụ thể để chuyển đổi thành mã 0 và 1.
Trong ngữ cảnh mô hình lớn, cũng cần nhận dạng mã số trước, và số bit mã số mà mỗi ký tự chuyển đổi thành có sự khác biệt nhẹ.
Token là đơn vị tính toán nhỏ nhất mà mô hình lớn xử lý thông tin. Đầu vào của người dùng, bộ nhớ ngữ cảnh, đầu ra của mô hình đều được tính bằng Token. Mô hình gọi càng phức tạp, ngữ cảnh càng dài, chuỗi thực thi Agent càng sâu, thì mức tiêu hao Token càng cao.
Thông thường: Trong tiếng Anh, một Token tương đương khoảng 4 chữ cái; Trong tiếng Trung, do mật độ thông tin của chữ Hán cao hơn, một chữ Hán, một dấu câu hoặc một cụm từ thường tương ứng với 1 đến 2 Token.
Vì quá trình suy nghĩ và đầu ra của mô hình lớn được thực hiện theo từng Token, do đó, ngành công nghiệp đã đưa chi phí gọi, hạn mức sử dụng của mô hình lớn ra bán và thanh toán cho người dùng dưới dạng "Mỗi triệu Token (Per Million Tokens)" hoặc "điểm hạn mức".
Hiện tại các công ty mô hình lớn tính phí Token theo bậc thang, người dùng thông thường sử dụng chế độ thông thường của các mô hình lớn như Doubao, Qianwen thì miễn phí; còn nếu là sử dụng nặng cấp doanh nghiệp, có thể thông qua việc mua các gói API theo tháng, dịch vụ đo lường ở các bậc khác nhau.
Từ năm ngoái, các nhà mạng đã mở ra "siêu thị sức mạnh tính toán" cho mô hình lớn. Các nhà cung cấp mô hình là "cửa hàng tham gia", nhà mạng thu "phí nền tảng + phí sức mạnh tính toán + phí kênh". Người dùng mua không phải là "mô hình của nhà mạng", mà là: trên nền tảng viễn thông, sử dụng sức mạnh tính toán viễn thông, gọi bất kỳ mô hình lớn nào và tính phí theo Token.
Tháng 7/2025, China Mobile ra mắt nền tảng dịch vụ mô hình MoMA (Mobile Model Access); tháng 4, China Telecom ra mắt nền tảng vận hành dịch vụ TokenHub tinh tú; tháng 5, nền tảng dịch vụ Token "Unicom Xingluo" được ra mắt. Các nền tảng này tích hợp tất cả các mô hình lớn chủ lực như Baidu, Alibaba, ByteDance, DeepSeek, với API thống nhất, xác thực thống nhất, tính phí thống nhất.
Nền tảng của nhà mạng điều chỉnh nội bộ cho nhiều mô hình lớn, người dùng chỉ cần thay đổi tên mô hình (Model ID) là có thể chuyển đổi mượt mà.
02 Tại sao nhà mạng bán Token?
Sự bùng nổ của dịch vụ Token không phải là ngẫu nhiên.
Thứ nhất, mô hình tính phí thay đổi. Trong thời đại điện toán đám mây truyền thống, người dùng quen với việc trả tiền cho "thời gian thuê máy chủ" hoặc "băng thông cố định" (tức là trả phí sức mạnh tính toán ở tầng IaaS), mua là tốc độ băng thông và thời gian. Nhưng với sự phát triển của mô hình lớn, khả năng mà các mô hình lớn khác nhau cung cấp, sự chênh lệch chi phí tiêu hao cho các nhiệm vụ khác nhau là rất lớn. Ví dụ, mô hình mạnh hơn, một Token đơn lẻ đắt hơn; ngữ cảnh càng dài, tiêu hao Token càng nhiều; độ phức tạp suy luận càng cao, chi phí thực tế càng cao. Tính phí theo Token có thể căn chỉnh "mức độ thông minh người dùng tiêu hao" với "chi phí sức mạnh tính toán nhà cung cấp bỏ ra".
Thứ hai, giảm rào cản kỹ thuật và "chi phí thử sai". Nghiên cứu và triển khai mô hình lớn thường cần đầu tư hàng chục triệu thậm chí hàng trăm triệu đô la Mỹ. Đối với đa số doanh nghiệp vừa và nhỏ cùng các nhà phát triển cá nhân, việc tự xây dựng mô hình là không thực tế. Dịch vụ Token chia nhỏ, đóng gói năng lực "Trí tuệ nhân tạo tổng quát (AGI)", nhà phát triển không cần quan tâm dưới đáy có mấy chục nghìn GPU đang đốt điện, chỉ cần gọi API theo nhu cầu và trả phí Token.
Cuối cùng, nhu cầu cấp bách do sự bùng nổ ở tầng ứng dụng. Bước vào năm 2026, các kịch bản ứng dụng ở tầng ứng dụng như AI Agent (tác nhân thông minh), hỗ trợ lập trình AI, tạo nội dung đa phương thức... bùng nổ. Các ứng dụng này trong quá trình vận hành hàng ngày cần tương tác "nạp xuất" thường xuyên với mô hình lớn nền tảng. Một công cụ viết mã AI tự động có thể tiêu hao hàng triệu Token chỉ trong một đêm. Sự tương tác tần suất cao, khối lượng lớn này buộc thị trường phải cung cấp dịch vụ gói Token tiêu chuẩn hóa hơn, ổn định và có tính cạnh tranh về giá.
Hai mươi năm qua, mô hình kinh doanh của các nhà mạng đã trải qua ba lần thay đổi đơn vị đo lường cốt lõi.
Giai đoạn đầu là thời đại thoại, nhà mạng bán ra là số phút; giai đoạn thứ hai là thời đại Internet di động, bán ra là lưu lượng GB; còn khi bước vào thời đại AI, các nhà mạng bắt đầu thử nghiệm bán Token.
Token đang trải qua quá trình tiến hóa tương tự như lưu lượng. Ban đầu, chỉ là chỉ số kỹ thuật; sau đó trở thành đơn vị tính phí; cuối cùng tiến hóa thành hàng hóa tiêu chuẩn hóa.
Sự tham gia của các nhà mạng đánh dấu Token đã bắt đầu thoát khỏi phạm trù kỹ thuật, bước vào hệ thống tiêu dùng.
Trong vài năm tới, cách người dùng mua năng lực AI có thể thay đổi căn bản: người dùng cá nhân mua "gói AI hàng tháng", doanh nghiệp mua sắm "bể tài nguyên Token", băng thông rộng gia đình đi kèm hạn mức AI, đường chuyên dụng chính phủ - doanh nghiệp tích hợp dịch vụ Agent. Token sẽ giống như điện, nước, lưu lượng trở thành tài nguyên cơ bản.
Nhưng điều này không có nghĩa là nhà mạng sẽ thay thế các nhà cung cấp mô hình lớn.
03 Mua Token như thế nào là phù hợp?
Dịch vụ Token rốt cuộc là nên mua trực tiếp từ nhà cung cấp mô hình gốc, hay mua từ nền tảng nhà mạng? Hai mô hình kinh doanh này hiện tại có ưu nhược điểm như thế nào.
Thứ nhất là mô hình nhà cung cấp mô hình gốc, tức tính phí theo triệu Token. OpenAI, Anthropic, DeepSeek, Qianwen và các nhà cung cấp khác phổ biến áp dụng hệ thống này. Người dùng trả phí riêng cho Token đầu vào, Token đầu ra. Như Qianwen và các mô hình khác có thể áp dụng hình thức mua trước đầu tháng, thanh toán cuối tháng.
Thứ hai là đăng ký theo tháng hạn mức Token của nhà mạng. Ví dụ Shanghai Telecom tung ra mức thấp nhất 9,9 NDT tương ứng 10 triệu Token, vượt hạn mức thì bổ sung, và có kế hoạch tích hợp quyền lợi Token vào không gian số "Gia đình Tươi đẹp" của hộ gia đình, hỗ trợ thanh toán hóa đơn cước điện thoại một lần.
Mô hình "một giá trọn gói" hoặc "tích hợp cước" này, giúp người dùng Trung Quốc có thể mua sức mạnh tính toán mô hình lớn giống như mua gói lưu lượng.
Thị trường hải ngoại chủ yếu là định giá bậc thang API của các doanh nghiệp mô hình gốc, trong khi thị trường nội địa đẩy dịch vụ Token tiến vào kỷ nguyên "gói hóa" giống như cước điện thoại di động.
Hiện tại, hai mô hình tính phí đều có ưu thế riêng, bởi xét về nhóm người dùng gói Token, chủ yếu chia thành ba loại.
Thứ nhất là nhà phát triển độc lập và người đam mê công nghệ (Geeks). Họ sử dụng giao diện API mà các nhà cung cấp cung cấp để xây dựng ứng dụng AI cá nhân hóa của riêng mình, như công cụ năng suất, plugin dịch tự động, cơ sở kiến thức cá nhân chuyên biệt, v.v.;
Thứ hai là doanh nghiệp vừa và nhỏ, công ty khởi nghiệp và nhà phát triển phần mềm độc lập (ISV) phía B,đây là nhóm khách hàng cốt lõi nhất của dịch vụ Token. Dù là mua Token cho nhân viên công ty dùng để lập trình, hay phát triển AI Agent cho ngành cụ thể, hay nhúng chức năng hỗ trợ AI vào hệ thống ERP, CRM hiện có của doanh nghiệp, các doanh nghiệp vừa và nhỏ đều cần đăng ký "gói Token phiên bản nhóm" của nhà cung cấp đám mây hoặc nhà mạng.
Thứ ba là người lao động và hộ gia đình thông thường "phụ thuộc nặng vào AI", họ trong bối cảnh gia đình cần sử dụng AI tần suất cao để sáng tạo văn bản, viết mã, hoặc cần AI hướng dẫn bài tập cho con cái.
Đối với doanh nghiệp vừa và nhỏ, công ty khởi nghiệp, từ góc độ kinh tế học công nghệ, mô hình tính phí Token thuần túy của mô hình lớn gốc khoa học hơn.
Còn mô hình gói của nhà mạng có hai ưu thế, một mặt, nhà phát triển độc lập không cần ràng buộc vào một mô hình lớn nhất định, có thể thông qua nhà cung cấp nền tảng để tự chọn nhiều mô hình lớn; mặt khác, dịch vụ Token có thể nhanh chóng hướng tới tiêu dùng đại chúng hơn. Bởi vì hầu hết mọi người biết 100GB lưu lượng nghĩa là gì, nhưng không thể cảm nhận 10 triệu Token đại diện cho bao nhiêu.
Nhà mạng áp dụng đăng ký theo tháng, về bản chất là đang giảm rào cản nhận thức. Người dùng không cần hiểu Token, chỉ cần bắt đầu từ mức 9,9 NDT/10 triệu Token thông thường để hiểu nhu cầu của mình.
Khi các nhà mạng bắt đầu bán dịch vụ Token, "các Doubao" sắp bắt đầu cuộc đua nội bộ ở ba cấp độ.
Từ "chạy đua thông số" đến "chạy đua hiệu suất năng lượng": Đối với doanh nghiệp mô hình lớn, không thể tiếp tục theo đuổi mù quáng mô hình lớn với thông số lớn, tiêu hao năng lượng lớn, mà phải dồn sức vào các năng lực như chưng cất mô hình (Distillation), lượng tử hóa (Quantization) cũng như tăng tốc suy luận (Inference Optimization) - những thứ có thể dùng năng lượng nhỏ hơn, đầu ra Token chất lượng cao hơn.
Cạnh tranh giá cả sẽ tiếp tục gia tăng. Khi nhà mạng tập hợp hàng trăm mô hình, chi phí chuyển đổi của người dùng giảm xuống. Nếu mô hình A tăng giá, có thể thay thế bằng mô hình B thông qua nền tảng. Khi sự khác biệt năng lực mô hình không đủ, giá cả sẽ trở thành yếu tố cạnh tranh cốt lõi.
Trung tâm lợi nhuận của doanh nghiệp mô hình lớn sẽ chuyển dịch. Chỉ bán API lợi nhuận hạn chế, trọng điểm sinh lời trong tương lai có thể chuyển hướng sang Agent, ứng dụng ngành, giải pháp doanh nghiệp. Bản thân mô hình dần trở thành cơ sở hạ tầng, còn tầng ứng dụng trở thành trung tâm giá trị.
Có lẽ, "thị trường hai chiều" đang hình thành: nhà mạng kiểm soát lối vào, nhà cung cấp mô hình kiểm soát năng lực.






