Offres de forfait Token : L'ère de la "guerre du trafic" de l'IA, maintenant c'est au tour des Doubao et autres de se concurrencer

marsbitPublié le 2026-05-19Dernière mise à jour le 2026-05-19

Résumé

Les opérateurs télécoms chinois (China Telecom, China Mobile, China Unicom) lancent des forfaits de « Tokens », unités de calcul standardisées pour l’IA, vendus par abonnement mensuel. Ces forfaits, accessibles aux particuliers (dès 9,9 yuans pour 10 millions de Tokens) et aux entreprises, permettent d’accéder à des dizaines de grands modèles via une plateforme unique. Le Token est l’unité de base du traitement par l’IA. Ces forfaits, comparables aux forfaits données mobiles, simplifient l’accès et le paiement (via la facture téléphonique) et réduisent les coûts de changement de modèle pour l’utilisateur. Cette évolution pousse les éditeurs de modèles (comme Doubao, Qwen, DeepSeek) vers une concurrence accrue sur les prix, l’efficacité énergétique par Token et le développement de solutions à plus forte valeur ajoutée (agents IA, applications sectorielles). Les opérateurs deviennent des agrégateurs/distributeurs, tandis que les modèles deviennent une commodité, la valeur migrant vers la couche applicative.

Texte | Silicon Quadrant

Lorsque les utilisateurs ne se demanderont plus s'ils doivent augmenter leur forfait mensuel de données, ils devront peut-être commencer à se demander combien de services Token acheter chaque mois.

Les Token sont sur le point d'être vendus par les opérateurs comme des services standardisés, à l'instar du trafic internet, de la bande passante ou des SMS.

Récemment, les trois principaux opérateurs télécoms chinois ont successivement lancé des produits forfaitaires en Token : des abonnements mensuels Token pour les utilisateurs individuels, et des forfaits de puissance de calcul (computing) échelonnés pour les développeurs et les clients professionnels. Ils ont également annoncé avoir intégré des dizaines, voire des centaines de grands modèles sur leurs plateformes, avec un système de « paiement mensuel, accès multi-modèles, réglé sur la facture téléphonique ».

China Telecom a déjà lancé des forfaits Token pour particuliers et entreprises, avec un tarif mensuel minimum de 9.9 yuans pour 10 millions de Token d'utilisation. Des opérateurs régionaux comme Shanghai Mobile et Shanghai Telecom proposent quant à eux des modes de facturation par points de quota ou par Token génériques. Par exemple, Shanghai Mobile offre 400 000 Tokens pour 1 yuan.

Avec les opérateurs qui commencent à vendre des services Token, le coût pour les utilisateurs de changer de grand modèle va considérablement diminuer. Pour les entreprises de grands modèles, cela signifie que la « fidélité des utilisateurs » sera affaiblie, et seule une « concurrence plus acharnée » leur permettra de préserver leur part de marché.

À l'avenir, les fabricants de grands modèles comme Doubao, Qianwen, DeepSeek, etc., devront non seulement rivaliser sur les « prix », mais aussi sur la « qualité des Token par unité d'énergie consommée », et même se tourner vers « des capacités de solutions applicatives à plus forte valeur ajoutée ».

01 Qu'est-ce qu'un service Token ?

Pour comprendre le service Token, il faut d'abord comprendre ce qu'est un Token.

Un ordinateur ne peut pas directement reconnaître du texte, seulement du code binaire (0 et 1). Ainsi, chaque mot, caractère, son ou ponctuation que nous saisissons est converti en code binaire via un mécanisme d'encodage spécifique.

Dans le contexte des grands modèles, le processus commence également par la reconnaissance d'un encodage numérique, et le nombre de bits de cet encodage varie légèrement pour chaque caractère.

Le Token est l'unité de calcul minimale traitée par un grand modèle. L'entrée de l'utilisateur, la mémoire contextuelle et la sortie du modèle sont toutes calculées en Token. Plus l'appel au modèle est complexe, plus le contexte est long, plus la chaîne d'exécution d'un Agent est profonde, plus la consommation de Token est élevée.

Typiquement : En anglais, un Token correspond environ à 4 lettres. En chinois, en raison de la densité d'information plus élevée des caractères, un sinogramme, un signe de ponctuation ou une locution correspond souvent à 1 ou 2 Tokens.

Étant donné que la réflexion et la production des grands modèles se font Token par Token, l'industrie a donc adopté la facturation et le calcul des quotas d'utilisation en « par million de Tokens (Per Million Tokens) » ou en « points de quota ».

Actuellement, les entreprises de grands modèles facturent les Token de manière progressive. Les utilisateurs ordinaires utilisant des modèles standards comme Doubao ou Qianwen sont gratuits. En revanche, pour une utilisation intensive de niveau professionnel, il est possible d'acheter différents paliers de services API par abonnement ou à la consommation.

Depuis l'année dernière, les opérateurs ont ouvert des « supermarchés de calcul » pour grands modèles. Les éditeurs de modèles sont les « commerçants hébergés », et les opérateurs perçoivent des « frais de plateforme + frais de calcul + frais de canal ». L'utilisateur n'achète pas un « modèle de l'opérateur », mais plutôt : sur la plateforme de l'opérateur, en utilisant la puissance de calcul de l'opérateur, il fait appel à n'importe quel grand modèle, avec une facturation au Token.

En juillet 2025, China Mobile a lancé la plateforme de services de modèles MoMA (Mobile Model Access) ; en avril, China Telecom a lancé la plateforme opérationnelle de services Token Xingchen TokenHub ; en mai, « China Unicom Xingluo » a publié sa plateforme de services Token. Ces plateformes intègrent les principaux grands modèles comme ceux de Baidu, Alibaba, ByteDance (Douyin), DeepSeek, etc., avec une API unifiée, une authentification unifiée et une facturation unifiée.

Les plateformes des opérateurs adaptent en interne de multiples grands modèles. L'utilisateur n'a qu'à changer le nom du modèle (Model ID) pour basculer en douceur.

02 Pourquoi les opérateurs vendent-ils des Token ?

L'explosion des services Token n'est pas un hasard.

Tout d'abord, le modèle de tarification change. À l'ère traditionnelle du cloud computing, les utilisateurs étaient habitués à payer pour la « durée de location des serveurs » ou la « bande passante fixe » (c'est-à-dire le paiement de la puissance de calcul au niveau IaaS), ils achetaient de la vitesse et du temps. Mais avec le développement des grands modèles, les capacités offertes par les différents modèles et les coûts de consommation requis par les différentes tâches varient énormément. Par exemple, un modèle plus puissant coûte plus cher par Token ; un contexte plus long consomme plus de Tokens ; plus la complexité du raisonnement est élevée, plus le coût réel est élevé. La facturation au Token permet d'aligner le « degré d'intelligence consommé par l'utilisateur » et le « coût en puissance de calcul supporté par le fournisseur ».

Ensuite, cela réduit les barrières techniques et le « coût d'expérimentation ». Le développement et le déploiement d'un grand modèle nécessitent des investissements de dizaines de millions, voire de milliards de dollars. Pour la grande majorité des PME et des développeurs individuels, construire son propre modèle n'est pas réaliste. Le service Token découpe et conditionne la capacité d'« Intelligence Artificielle Générale (IAG ou AGI) », permettant aux développeurs de ne pas se soucier du nombre de GPU utilisés en couches basses, mais simplement d'appeler l'API à la demande et de payer les frais de Token.

Enfin, la demande urgente générée par l'explosion de la couche applicative. En entrant dans l'année 2026, les scénarios applicatifs explosent : Agents IA (Intelligents), assistance à la programmation par IA, génération de contenu multimodal, etc. Dans leur fonctionnement quotidien, ces applications nécessitent des interactions fréquentes et massives de « débit » avec les grands modèles sous-jacents. Un outil automatisé d'écriture de code par IA peut consommer des millions de Tokens en une seule nuit. Cette interaction haute fréquence et à grande échelle pousse le marché à fournir des services de forfaits Token plus standardisés, stables et compétitifs en termes de prix.

Au cours des vingt dernières années, le modèle commercial des opérateurs a connu trois changements majeurs dans son unité de mesure centrale.

La première étape était l'ère de la voix, où les opérateurs vendaient des minutes. La deuxième étape était l'ère de l'internet mobile, où ils vendaient des Go de trafic. En entrant dans l'ère de l'IA, les opérateurs commencent à tenter de vendre des Tokens.

Les Token suivent un processus d'évolution similaire à celui du trafic internet. Au départ, ce n'était qu'un indicateur technique ; ensuite, cela est devenu une unité de facturation ; pour finalement évoluer en un produit standardisé.

L'entrée en scène des opérateurs marque le fait que les Token commencent à quitter le champ technique pour entrer dans le système de consommation.

Dans les années à venir, la manière dont les utilisateurs achètent des capacités d'IA pourrait changer fondamentalement : les particuliers achèteront des « forfaits mensuels IA », les entreprises achèteront des « pools de ressources Token », les forfaits internet familiaux comprendront des quotas IA, et les lignes dédiées aux entreprises et gouvernements intégreront des services Agent. Les Token deviendront une ressource de base, comme l'électricité, l'eau ou le trafic internet.

Cela ne signifie cependant pas que les opérateurs remplaceront les fabricants de grands modèles.

03 Quel forfait Token choisir ?

Le service Token doit-il être acheté directement auprès des fabricants natifs de grands modèles, ou sur les plateformes des opérateurs ? Quels sont actuellement les avantages et inconvénients des deux modèles économiques ?

Le premier est le modèle des fabricants natifs de modèles, c'est-à-dire la facturation au million de Tokens. Des entreprises comme OpenAI, Anthropic, DeepSeek, Qianwen, etc., adoptent généralement ce système. Les utilisateurs paient séparément pour les Tokens d'entrée et de sortie. Certains, comme Qianwen, pourraient utiliser un système de pré-achat en début de mois et de règlement en fin de mois.

Le second est l'abonnement mensuel des opérateurs avec un quota de Token. Par exemple, Shanghai Telecom propose un forfait minimum de 9.9 yuans pour 10 millions de Token, avec des options supplémentaires en cas de dépassement. Il est également prévu d'intégrer les droits Token dans l'espace numérique familial « Meihaojia » et de permettre un paiement direct sur la facture téléphonique.

Ce modèle « tout compris en un prix » ou « intégré à la facture » permet aux utilisateurs chinois d'acheter de la puissance de calcul pour grands modèles comme ils achètent un forfait de données.

Alors que le marché international est principalement dominé par la tarification progressive des API des entreprises natives de grands modèles, le marché chinois pousse les services Token vers une ère de « forfaitisation » similaire à celle des forfaits téléphoniques.

Pour l'instant, les deux modèles de tarification ont leurs avantages, car les utilisateurs des forfaits Token se divisent principalement en trois catégories.

La première est celle des développeurs indépendants et des passionnés de technologie (Geeks). Ils utilisent les interfaces API fournies par les différents fabricants pour créer leurs propres applications IA personnalisées, comme des outils de productivité, des extensions de traduction automatique, des bases de connaissances personnelles, etc.

La deuxième catégorie est celle des PME, des start-ups et des éditeurs de logiciels indépendants (ISV) côté B. C'est le cœur de cible principal des services Token. Qu'il s'agisse d'acheter des Token pour les employés afin de les utiliser pour la programmation, de développer des Agents IA pour des secteurs spécifiques, ou d'intégrer des fonctionnalités d'assistance IA dans les systèmes ERP et CRM existants des entreprises, les PME ont besoin de s'abonner aux « forfaits Token version équipe » des fournisseurs de cloud ou des opérateurs.

La troisième catégorie est celle des travailleurs « très dépendants de l'IA » et des familles ordinaires, qui, dans le cadre domestique, ont besoin d'utiliser l'IA de manière intensive pour la rédaction de textes, l'écriture de code, ou pour l'assistance aux devoirs des enfants.

Du point de vue de l'économie de la technologie, le modèle de facturation pure au Token des grands modèles natifs est plus scientifique pour les PME et les start-ups.

Le modèle forfaitaire des opérateurs présente deux avantages : d'une part, les développeurs indépendants ne sont pas liés à un seul grand modèle et peuvent choisir librement parmi plusieurs modèles via les plateformes des opérateurs ; d'autre part, les services Token pourraient atteindre plus rapidement le grand public consommateur. Car la plupart des gens savent ce que représentent 100 Go de trafic, mais ne peuvent pas percevoir ce que signifient 10 millions de Token.

L'utilisation de l'abonnement mensuel par les opérateurs réduit essentiellement la barrière cognitive. L'utilisateur n'a pas besoin de comprendre le Token, il peut simplement commencer avec le forfait standard de 9.9 yuans pour 10 millions de Token pour découvrir ses besoins.

Avec les opérateurs qui commencent à vendre des services Token, les « Doubao et autres » sont sur le point de s'engager dans une concurrence acharnée à trois niveaux.

De la « course aux paramètres » à la « course au rendement énergétique » : Pour les entreprises de grands modèles, elles ne pourront plus poursuivre aveuglément des modèles avec de très grands paramètres et une consommation d'énergie élevée. Elles devront plutôt consacrer leurs efforts à des capacités comme la distillation de modèles (Distillation), la quantification (Quantization) et l'optimisation de l'inférence (Inference Optimization), afin de produire des Token de meilleure qualité avec une consommation d'énergie réduite.

La concurrence sur les prix va s'intensifier davantage. Une fois que les opérateurs auront agrégé des centaines de modèles, le coût de changement pour l'utilisateur diminuera. Si le modèle A augmente ses prix, il pourra être remplacé par le modèle B via la plateforme. Lorsque les différences de capacités entre modèles sont faibles, le prix devient le facteur de concurrence central.

Le centre de profit des entreprises de grands modèles va se déplacer. Vendre uniquement des API génère des profits limités. À l'avenir, le point de profit pourrait se déplacer vers les Agents, les applications sectorielles et les solutions d'entreprise. Le modèle lui-même deviendra progressivement une infrastructure, tandis que la couche applicative deviendra le centre de valeur.

Peut-être qu'un « marché bilatéral » est en train de se former : les opérateurs contrôlent l'accès, les fabricants de modèles contrôlent les capacités.

Questions liées

QQu'est-ce que le service de Token et pourquoi les opérateurs de télécommunications le vendent-ils maintenant ?

ALe service de Token consiste à vendre des Tokens, l'unité minimale de traitement de l'information pour les grands modèles d'IA, sous forme de forfaits standardisés. Les opérateurs le commercialisent car cela correspond à un changement de mode de facturation (coût aligné sur l'utilisation réelle), réduit les coûts et les barrières techniques pour les utilisateurs, et répond à la demande croissante des applications d'IA qui consomment massivement des Tokens.

QComment les opérateurs chinois comme China Telecom proposent-ils leurs forfaits Token ?

ALes opérateurs chinois proposent des forfaits Token par abonnement mensuel. Par exemple, China Telecom propose un forfait personnel à partir de 9,9 yuans par mois pour 10 millions de Tokens. D'autres, comme Shanghai Mobile, offrent un modèle de paiement à l'unité (1 yuan pour 400 000 Tokens). Ces forfaits sont intégrés aux factures de téléphone, simplifiant le paiement pour les consommateurs.

QQuels sont les principaux groupes cibles pour les services de Token et quels sont leurs besoins ?

AIl y a trois groupes cibles principaux : 1) Les développeurs indépendants et les passionnés de technologie qui créent des applications personnalisées. 2) Les PME, startups et éditeurs de logiciels qui intègrent l'IA dans leurs outils professionnels. 3) Les particuliers et familles utilisant intensivement l'IA pour des tâches comme la rédaction, le codage ou l'aide aux devoirs.

QQuel impact la vente de Tokens par les opérateurs aura-t-elle sur les entreprises de grands modèles de langage comme 'Doubao' ?

ACela va intensifier la concurrence pour les entreprises de grands modèles ('Doubao'). La fidélité des utilisateurs diminuera car il sera facile de changer de modèle via la plateforme des opérateurs. Elles devront se concurrencer sur trois aspects : l'efficacité énergétique (qualité du Token par unité d'énergie), les prix, et le développement de solutions à valeur ajoutée (comme les Agents IA) au-delà de la simple vente d'API.

QQuelle analogie l'article établit-il entre les Tokens et d'autres services des opérateurs ?

AL'article établit une analogie entre l'évolution des unités de facturation des opérateurs : les minutes de communication à l'ère de la voix, les gigaoctets (Go) de données à l'ère mobile, et maintenant les Tokens à l'ère de l'IA. Les Tokens sont en train de passer d'un indicateur technique à une unité de facturation, puis à une marchandise standardisée, tout comme l'ont été les forfaits données avant eux.

Lectures associées

Le prochain cycle haussier de la crypto commencera-t-il par les transactions sur chaîne de SpaceX ?

L'article propose un scénario détaillé (2026-2029) sur l'évolution de la cryptomonnaie, prédisant un passage des "narratifs de jetons" à l'accès aux "actifs réels". En 2026, les contrats perpétuels pré-IPO sur des sociétés comme SpaceX ou OpenAI sur des plateformes comme Hyperliquid deviennent le principal accès pour les actifs privés de qualité, tandis que la majorité des projets à l'intersection IA et Crypto échouent. D'ici 2027, les fondations de blockchains se repositionnent vers une infrastructure institutionnelle conforme, et la tokenisation d'actifs comme le crédit privé progresse lentement, freinée par l'incertitude politique. Le tournant potentiel arrive en 2028. Après un événement de liquidation majeur mettant en lumière les risques des contrats synthétiques sans ancrage réel, une réforme réglementaire pourrait permettre la sollicitation publique pour la revente de titres privés à des investisseurs qualifiés élargis. Les véritables actions de sociétés privées remplaceraient alors les produits synthétiques comme cœur du marché. En 2029, l'industrie serait plus "ennuyeuse" mais essentielle : les stablecoins et le règlement sur chaîne seraient absorbés par les infrastructures financières traditionnelles. Seuls les jetons représentant des droits exécutoires sur des flux de trésorerie ou des actifs réels conserveraient de la valeur, tandis que les autres perdraient tout intérêt. La thèse centrale est que le principal goulot d'étranglement pour la prochaine phase de croissance est juridique, et non technologique.

marsbitIl y a 1 h

Le prochain cycle haussier de la crypto commencera-t-il par les transactions sur chaîne de SpaceX ?

marsbitIl y a 1 h

La répartition de la valeur des stablecoins

L'article analyse la répartition de valeur dans l'écosystème des stablecoins, en le divisant en quatre couches : 1. **Couche d'émission** : (ex. : Tether, Circle) - Émettent les stablecoins, détiennent les actifs de réserve et capturent la marge d'intérêt. 2. **Couche d'infrastructure** : (ex. : Bridge, BVNK) - Relient les stablecoins au système financier traditionnel (connexions bancaires, conformité, gestion des entrées/sorties en fiat). C'est le travail le plus complexe et essentiel pour une adoption large. 3. **Couche d'acquisition/distribution** : (ex. : Stripe, Coinbase) - Intègrent les stablecoins dans les systèmes marchands et logiciels d'entreprise. 4. **Couche applicative** : Les utilisateurs finaux. Actuellement, la couche d'émission génère les profits les plus importants. L'auteur souligne que la **couche d'infrastructure**, bien que cruciale, est souvent sous-estimée. Son rôle de "trait d'union" entre la blockchain et le monde réel (règlement, conformité, intégration aux flux de trésorerie des entreprises) est difficile mais constitue un avantage concurrentiel durable. Des acquisitions comme celle de Bridge par Stripe ou de BVNK par Mastercard montrent l'importance stratégique de ce segment. Bien que cette couche nécessite d'importants investissements initiaux et fasse face à une pression de la part des autres couches, elle pourrait acquérir un fort pouvoir de négociation une fois que les stablecoins deviendront un canal de paiement par défaut pour les entreprises.

marsbitIl y a 7 h

La répartition de la valeur des stablecoins

marsbitIl y a 7 h

Pourquoi Nvidia emprunte-t-elle 200 milliards de dollars si elle n'a pas besoin d'argent ?

Résumé de l'article : Nvidia, qui dispose d'une trésorerie abondante (flux de trésorerie libre d'environ 48,6 milliards de dollars pour son dernier trimestre), prévoit d'émettre des obligations (notes senior) pour au moins 20 milliards de dollars. Contrairement à une lecture simpliste sur un besoin de liquidités, cette opération s'analyse plutôt comme une optimisation active de la structure financière. L'entreprise profite de sa solide notation de crédit (AA) et de conditions de marché favorables pour lever des fonds à long terme (jusqu'à 30 ans) à un coût faible. Cette dette servira à financer des investissements à long cycle comme les infrastructures de datacenters IA, la R&D, les paiements anticipés à la chaîne d'approvisionnement et les investissements stratégiques. Cette approche permet à Nvidia de poursuivre son expansion dans l'écosystème IA sans diluer les actionnaires (alternative à une augmentation de capital), tout en maintenant parallèlement un retour aux actionnaires via un important programme de rachats d'actions et une augmentation du dividende. Elle reflète une évolution vers une gestion du capital plus mature, typique des grandes plateformes technologiques, et s'inscrit dans une tendance où les géants de la tech utilisent la dette pour financer le cycle d'investissements lourds de l'IA. La réussite de cette stratégie dépendra de la capacité future de Nvidia à générer des rendements supérieurs au coût de sa dette et à maintenir sa forte génération de flux de trésorerie.

marsbitIl y a 8 h

Pourquoi Nvidia emprunte-t-elle 200 milliards de dollars si elle n'a pas besoin d'argent ?

marsbitIl y a 8 h

Trading

Spot
Futures

Articles tendance

Comment acheter ERA

Bienvenue sur HTX.com ! Nous vous permettons d'acheter Caldera (ERA) de manière simple et pratique. Suivez notre guide étape par étape pour commencer votre parcours crypto.Étape 1 : Création de votre compte HTXUtilisez votre adresse e-mail ou votre numéro de téléphone pour ouvrir un compte sur HTX gratuitement. L'inscription se fait en toute simplicité et débloque toutes les fonctionnalités.Créer mon compteÉtape 2 : Choix du mode de paiement (rubrique Acheter des cryptosCarte de crédit/débit : utilisez votre carte Visa ou Mastercard pour acheter instantanément Caldera (ERA).Solde :utilisez les fonds du solde de votre compte HTX pour trader en toute simplicité.Prestataire tiers :pour accroître la commodité d'utilisation, nous avons ajouté des modes de paiement populaires tels que Google Pay et Apple Pay.P2P :tradez directement avec d'autres utilisateurs sur HTX.OTC (de gré à gré) : nous offrons des services personnalisés et des taux de change compétitifs aux traders.Étape 3 : stockage de vos Caldera (ERA)Après avoir acheté vos Caldera (ERA), stockez-les sur votre compte HTX. Vous pouvez également les envoyer ailleurs via un transfert sur la blockchain ou les utiliser pour trader d'autres cryptos.Étape 4 : tradez des Caldera (ERA)Tradez facilement Caldera (ERA) sur le marché Spot de HTX. Il vous suffit d'accéder à votre compte, de sélectionner la paire de trading, d'exécuter vos trades et de les suivre en temps réel. Nous offrons une expérience conviviale aux débutants comme aux traders chevronnés.

566 vues totalesPublié le 2025.07.17Mis à jour le 2026.06.02

Comment acheter ERA

Discussions

Bienvenue dans la Communauté HTX. Ici, vous pouvez vous tenir informé(e) des derniers développements de la plateforme et accéder à des analyses de marché professionnelles. Les opinions des utilisateurs sur le prix de ERA (ERA) sont présentées ci-dessous.

活动图片