Offres de forfait Token : L'ère de la "guerre du trafic" de l'IA, maintenant c'est au tour des Doubao et autres de se concurrencer

marsbitPublié le 2026-05-19Dernière mise à jour le 2026-05-19

Résumé

Les opérateurs télécoms chinois (China Telecom, China Mobile, China Unicom) lancent des forfaits de « Tokens », unités de calcul standardisées pour l’IA, vendus par abonnement mensuel. Ces forfaits, accessibles aux particuliers (dès 9,9 yuans pour 10 millions de Tokens) et aux entreprises, permettent d’accéder à des dizaines de grands modèles via une plateforme unique. Le Token est l’unité de base du traitement par l’IA. Ces forfaits, comparables aux forfaits données mobiles, simplifient l’accès et le paiement (via la facture téléphonique) et réduisent les coûts de changement de modèle pour l’utilisateur. Cette évolution pousse les éditeurs de modèles (comme Doubao, Qwen, DeepSeek) vers une concurrence accrue sur les prix, l’efficacité énergétique par Token et le développement de solutions à plus forte valeur ajoutée (agents IA, applications sectorielles). Les opérateurs deviennent des agrégateurs/distributeurs, tandis que les modèles deviennent une commodité, la valeur migrant vers la couche applicative.

Texte | Silicon Quadrant

Lorsque les utilisateurs ne se demanderont plus s'ils doivent augmenter leur forfait mensuel de données, ils devront peut-être commencer à se demander combien de services Token acheter chaque mois.

Les Token sont sur le point d'être vendus par les opérateurs comme des services standardisés, à l'instar du trafic internet, de la bande passante ou des SMS.

Récemment, les trois principaux opérateurs télécoms chinois ont successivement lancé des produits forfaitaires en Token : des abonnements mensuels Token pour les utilisateurs individuels, et des forfaits de puissance de calcul (computing) échelonnés pour les développeurs et les clients professionnels. Ils ont également annoncé avoir intégré des dizaines, voire des centaines de grands modèles sur leurs plateformes, avec un système de « paiement mensuel, accès multi-modèles, réglé sur la facture téléphonique ».

China Telecom a déjà lancé des forfaits Token pour particuliers et entreprises, avec un tarif mensuel minimum de 9.9 yuans pour 10 millions de Token d'utilisation. Des opérateurs régionaux comme Shanghai Mobile et Shanghai Telecom proposent quant à eux des modes de facturation par points de quota ou par Token génériques. Par exemple, Shanghai Mobile offre 400 000 Tokens pour 1 yuan.

Avec les opérateurs qui commencent à vendre des services Token, le coût pour les utilisateurs de changer de grand modèle va considérablement diminuer. Pour les entreprises de grands modèles, cela signifie que la « fidélité des utilisateurs » sera affaiblie, et seule une « concurrence plus acharnée » leur permettra de préserver leur part de marché.

À l'avenir, les fabricants de grands modèles comme Doubao, Qianwen, DeepSeek, etc., devront non seulement rivaliser sur les « prix », mais aussi sur la « qualité des Token par unité d'énergie consommée », et même se tourner vers « des capacités de solutions applicatives à plus forte valeur ajoutée ».

01 Qu'est-ce qu'un service Token ?

Pour comprendre le service Token, il faut d'abord comprendre ce qu'est un Token.

Un ordinateur ne peut pas directement reconnaître du texte, seulement du code binaire (0 et 1). Ainsi, chaque mot, caractère, son ou ponctuation que nous saisissons est converti en code binaire via un mécanisme d'encodage spécifique.

Dans le contexte des grands modèles, le processus commence également par la reconnaissance d'un encodage numérique, et le nombre de bits de cet encodage varie légèrement pour chaque caractère.

Le Token est l'unité de calcul minimale traitée par un grand modèle. L'entrée de l'utilisateur, la mémoire contextuelle et la sortie du modèle sont toutes calculées en Token. Plus l'appel au modèle est complexe, plus le contexte est long, plus la chaîne d'exécution d'un Agent est profonde, plus la consommation de Token est élevée.

Typiquement : En anglais, un Token correspond environ à 4 lettres. En chinois, en raison de la densité d'information plus élevée des caractères, un sinogramme, un signe de ponctuation ou une locution correspond souvent à 1 ou 2 Tokens.

Étant donné que la réflexion et la production des grands modèles se font Token par Token, l'industrie a donc adopté la facturation et le calcul des quotas d'utilisation en « par million de Tokens (Per Million Tokens) » ou en « points de quota ».

Actuellement, les entreprises de grands modèles facturent les Token de manière progressive. Les utilisateurs ordinaires utilisant des modèles standards comme Doubao ou Qianwen sont gratuits. En revanche, pour une utilisation intensive de niveau professionnel, il est possible d'acheter différents paliers de services API par abonnement ou à la consommation.

Depuis l'année dernière, les opérateurs ont ouvert des « supermarchés de calcul » pour grands modèles. Les éditeurs de modèles sont les « commerçants hébergés », et les opérateurs perçoivent des « frais de plateforme + frais de calcul + frais de canal ». L'utilisateur n'achète pas un « modèle de l'opérateur », mais plutôt : sur la plateforme de l'opérateur, en utilisant la puissance de calcul de l'opérateur, il fait appel à n'importe quel grand modèle, avec une facturation au Token.

En juillet 2025, China Mobile a lancé la plateforme de services de modèles MoMA (Mobile Model Access) ; en avril, China Telecom a lancé la plateforme opérationnelle de services Token Xingchen TokenHub ; en mai, « China Unicom Xingluo » a publié sa plateforme de services Token. Ces plateformes intègrent les principaux grands modèles comme ceux de Baidu, Alibaba, ByteDance (Douyin), DeepSeek, etc., avec une API unifiée, une authentification unifiée et une facturation unifiée.

Les plateformes des opérateurs adaptent en interne de multiples grands modèles. L'utilisateur n'a qu'à changer le nom du modèle (Model ID) pour basculer en douceur.

02 Pourquoi les opérateurs vendent-ils des Token ?

L'explosion des services Token n'est pas un hasard.

Tout d'abord, le modèle de tarification change. À l'ère traditionnelle du cloud computing, les utilisateurs étaient habitués à payer pour la « durée de location des serveurs » ou la « bande passante fixe » (c'est-à-dire le paiement de la puissance de calcul au niveau IaaS), ils achetaient de la vitesse et du temps. Mais avec le développement des grands modèles, les capacités offertes par les différents modèles et les coûts de consommation requis par les différentes tâches varient énormément. Par exemple, un modèle plus puissant coûte plus cher par Token ; un contexte plus long consomme plus de Tokens ; plus la complexité du raisonnement est élevée, plus le coût réel est élevé. La facturation au Token permet d'aligner le « degré d'intelligence consommé par l'utilisateur » et le « coût en puissance de calcul supporté par le fournisseur ».

Ensuite, cela réduit les barrières techniques et le « coût d'expérimentation ». Le développement et le déploiement d'un grand modèle nécessitent des investissements de dizaines de millions, voire de milliards de dollars. Pour la grande majorité des PME et des développeurs individuels, construire son propre modèle n'est pas réaliste. Le service Token découpe et conditionne la capacité d'« Intelligence Artificielle Générale (IAG ou AGI) », permettant aux développeurs de ne pas se soucier du nombre de GPU utilisés en couches basses, mais simplement d'appeler l'API à la demande et de payer les frais de Token.

Enfin, la demande urgente générée par l'explosion de la couche applicative. En entrant dans l'année 2026, les scénarios applicatifs explosent : Agents IA (Intelligents), assistance à la programmation par IA, génération de contenu multimodal, etc. Dans leur fonctionnement quotidien, ces applications nécessitent des interactions fréquentes et massives de « débit » avec les grands modèles sous-jacents. Un outil automatisé d'écriture de code par IA peut consommer des millions de Tokens en une seule nuit. Cette interaction haute fréquence et à grande échelle pousse le marché à fournir des services de forfaits Token plus standardisés, stables et compétitifs en termes de prix.

Au cours des vingt dernières années, le modèle commercial des opérateurs a connu trois changements majeurs dans son unité de mesure centrale.

La première étape était l'ère de la voix, où les opérateurs vendaient des minutes. La deuxième étape était l'ère de l'internet mobile, où ils vendaient des Go de trafic. En entrant dans l'ère de l'IA, les opérateurs commencent à tenter de vendre des Tokens.

Les Token suivent un processus d'évolution similaire à celui du trafic internet. Au départ, ce n'était qu'un indicateur technique ; ensuite, cela est devenu une unité de facturation ; pour finalement évoluer en un produit standardisé.

L'entrée en scène des opérateurs marque le fait que les Token commencent à quitter le champ technique pour entrer dans le système de consommation.

Dans les années à venir, la manière dont les utilisateurs achètent des capacités d'IA pourrait changer fondamentalement : les particuliers achèteront des « forfaits mensuels IA », les entreprises achèteront des « pools de ressources Token », les forfaits internet familiaux comprendront des quotas IA, et les lignes dédiées aux entreprises et gouvernements intégreront des services Agent. Les Token deviendront une ressource de base, comme l'électricité, l'eau ou le trafic internet.

Cela ne signifie cependant pas que les opérateurs remplaceront les fabricants de grands modèles.

03 Quel forfait Token choisir ?

Le service Token doit-il être acheté directement auprès des fabricants natifs de grands modèles, ou sur les plateformes des opérateurs ? Quels sont actuellement les avantages et inconvénients des deux modèles économiques ?

Le premier est le modèle des fabricants natifs de modèles, c'est-à-dire la facturation au million de Tokens. Des entreprises comme OpenAI, Anthropic, DeepSeek, Qianwen, etc., adoptent généralement ce système. Les utilisateurs paient séparément pour les Tokens d'entrée et de sortie. Certains, comme Qianwen, pourraient utiliser un système de pré-achat en début de mois et de règlement en fin de mois.

Le second est l'abonnement mensuel des opérateurs avec un quota de Token. Par exemple, Shanghai Telecom propose un forfait minimum de 9.9 yuans pour 10 millions de Token, avec des options supplémentaires en cas de dépassement. Il est également prévu d'intégrer les droits Token dans l'espace numérique familial « Meihaojia » et de permettre un paiement direct sur la facture téléphonique.

Ce modèle « tout compris en un prix » ou « intégré à la facture » permet aux utilisateurs chinois d'acheter de la puissance de calcul pour grands modèles comme ils achètent un forfait de données.

Alors que le marché international est principalement dominé par la tarification progressive des API des entreprises natives de grands modèles, le marché chinois pousse les services Token vers une ère de « forfaitisation » similaire à celle des forfaits téléphoniques.

Pour l'instant, les deux modèles de tarification ont leurs avantages, car les utilisateurs des forfaits Token se divisent principalement en trois catégories.

La première est celle des développeurs indépendants et des passionnés de technologie (Geeks). Ils utilisent les interfaces API fournies par les différents fabricants pour créer leurs propres applications IA personnalisées, comme des outils de productivité, des extensions de traduction automatique, des bases de connaissances personnelles, etc.

La deuxième catégorie est celle des PME, des start-ups et des éditeurs de logiciels indépendants (ISV) côté B. C'est le cœur de cible principal des services Token. Qu'il s'agisse d'acheter des Token pour les employés afin de les utiliser pour la programmation, de développer des Agents IA pour des secteurs spécifiques, ou d'intégrer des fonctionnalités d'assistance IA dans les systèmes ERP et CRM existants des entreprises, les PME ont besoin de s'abonner aux « forfaits Token version équipe » des fournisseurs de cloud ou des opérateurs.

La troisième catégorie est celle des travailleurs « très dépendants de l'IA » et des familles ordinaires, qui, dans le cadre domestique, ont besoin d'utiliser l'IA de manière intensive pour la rédaction de textes, l'écriture de code, ou pour l'assistance aux devoirs des enfants.

Du point de vue de l'économie de la technologie, le modèle de facturation pure au Token des grands modèles natifs est plus scientifique pour les PME et les start-ups.

Le modèle forfaitaire des opérateurs présente deux avantages : d'une part, les développeurs indépendants ne sont pas liés à un seul grand modèle et peuvent choisir librement parmi plusieurs modèles via les plateformes des opérateurs ; d'autre part, les services Token pourraient atteindre plus rapidement le grand public consommateur. Car la plupart des gens savent ce que représentent 100 Go de trafic, mais ne peuvent pas percevoir ce que signifient 10 millions de Token.

L'utilisation de l'abonnement mensuel par les opérateurs réduit essentiellement la barrière cognitive. L'utilisateur n'a pas besoin de comprendre le Token, il peut simplement commencer avec le forfait standard de 9.9 yuans pour 10 millions de Token pour découvrir ses besoins.

Avec les opérateurs qui commencent à vendre des services Token, les « Doubao et autres » sont sur le point de s'engager dans une concurrence acharnée à trois niveaux.

De la « course aux paramètres » à la « course au rendement énergétique » : Pour les entreprises de grands modèles, elles ne pourront plus poursuivre aveuglément des modèles avec de très grands paramètres et une consommation d'énergie élevée. Elles devront plutôt consacrer leurs efforts à des capacités comme la distillation de modèles (Distillation), la quantification (Quantization) et l'optimisation de l'inférence (Inference Optimization), afin de produire des Token de meilleure qualité avec une consommation d'énergie réduite.

La concurrence sur les prix va s'intensifier davantage. Une fois que les opérateurs auront agrégé des centaines de modèles, le coût de changement pour l'utilisateur diminuera. Si le modèle A augmente ses prix, il pourra être remplacé par le modèle B via la plateforme. Lorsque les différences de capacités entre modèles sont faibles, le prix devient le facteur de concurrence central.

Le centre de profit des entreprises de grands modèles va se déplacer. Vendre uniquement des API génère des profits limités. À l'avenir, le point de profit pourrait se déplacer vers les Agents, les applications sectorielles et les solutions d'entreprise. Le modèle lui-même deviendra progressivement une infrastructure, tandis que la couche applicative deviendra le centre de valeur.

Peut-être qu'un « marché bilatéral » est en train de se former : les opérateurs contrôlent l'accès, les fabricants de modèles contrôlent les capacités.

Questions liées

QQu'est-ce que le service de Token et pourquoi les opérateurs de télécommunications le vendent-ils maintenant ?

ALe service de Token consiste à vendre des Tokens, l'unité minimale de traitement de l'information pour les grands modèles d'IA, sous forme de forfaits standardisés. Les opérateurs le commercialisent car cela correspond à un changement de mode de facturation (coût aligné sur l'utilisation réelle), réduit les coûts et les barrières techniques pour les utilisateurs, et répond à la demande croissante des applications d'IA qui consomment massivement des Tokens.

QComment les opérateurs chinois comme China Telecom proposent-ils leurs forfaits Token ?

ALes opérateurs chinois proposent des forfaits Token par abonnement mensuel. Par exemple, China Telecom propose un forfait personnel à partir de 9,9 yuans par mois pour 10 millions de Tokens. D'autres, comme Shanghai Mobile, offrent un modèle de paiement à l'unité (1 yuan pour 400 000 Tokens). Ces forfaits sont intégrés aux factures de téléphone, simplifiant le paiement pour les consommateurs.

QQuels sont les principaux groupes cibles pour les services de Token et quels sont leurs besoins ?

AIl y a trois groupes cibles principaux : 1) Les développeurs indépendants et les passionnés de technologie qui créent des applications personnalisées. 2) Les PME, startups et éditeurs de logiciels qui intègrent l'IA dans leurs outils professionnels. 3) Les particuliers et familles utilisant intensivement l'IA pour des tâches comme la rédaction, le codage ou l'aide aux devoirs.

QQuel impact la vente de Tokens par les opérateurs aura-t-elle sur les entreprises de grands modèles de langage comme 'Doubao' ?

ACela va intensifier la concurrence pour les entreprises de grands modèles ('Doubao'). La fidélité des utilisateurs diminuera car il sera facile de changer de modèle via la plateforme des opérateurs. Elles devront se concurrencer sur trois aspects : l'efficacité énergétique (qualité du Token par unité d'énergie), les prix, et le développement de solutions à valeur ajoutée (comme les Agents IA) au-delà de la simple vente d'API.

QQuelle analogie l'article établit-il entre les Tokens et d'autres services des opérateurs ?

AL'article établit une analogie entre l'évolution des unités de facturation des opérateurs : les minutes de communication à l'ère de la voix, les gigaoctets (Go) de données à l'ère mobile, et maintenant les Tokens à l'ère de l'IA. Les Tokens sont en train de passer d'un indicateur technique à une unité de facturation, puis à une marchandise standardisée, tout comme l'ont été les forfaits données avant eux.

Lectures associées

Même Apple doit payer un loyer

**Resumé en français :** L’histoire présente deux transactions clés entre Apple et Google qui illustrent un renversement des rôles de « propriétaire » et de « locataire » dans le paysage technologique. D’un côté, Google verse environ 20 milliards de dollars par an à Apple pour rester le moteur de recherche par défaut sur Safari, un « loyer » payé pour un accès privilégié au flux d’utilisateurs d’Apple. Cette rente, basée sur la rareté de l’accès, montre cependant des signes de faiblesse avec l’émergence des outils d’IA comme ChatGPT. De l’autre, Apple paierait désormais environ 1 milliard de dollars par an à Google pour intégrer les modèles d’IA Gemini avancés dans son écosystème. Bien qu’Apple insiste sur le fait que ses modèles finaux sont « distillés » et indépendants, cette transaction révèle une dépendance envers les capacités de pointe et l’infrastructure de Google pour la connaissance et la puissance de calcul. L’article analyse cette dynamique à travers le prisme de la rareté. La question centrale est de savoir si les modèles d’IA de pointe deviendront une commodité bon marché (scénario idéal pour Apple, le « propriétaire » de l’accès) ou resteront une ressource rare et chère concentrée chez quelques acteurs (ce qui ferait de Google le « propriétaire » incontournable). Enfin, l’auteur élargit la réflexion en montrant comment Apple, Google et même WeChat imposent désormais aux développeurs une nouvelle forme de « loyer » : pour que leurs applications soient accessibles et actionnées par les assistants IA natifs (comme Siri), elles doivent se conformer aux standards de la plateforme, cédant ainsi une partie du contrôle sur l’expérience utilisateur. La structure du pouvoir, où la plateforme qui contrôle la ressource rare perçoit un tribut, persiste, même si la nature de cette ressource évolue.

marsbitIl y a 1 h

Même Apple doit payer un loyer

marsbitIl y a 1 h

Vous avez raté l'introduction en bourse de SpaceX ? WEEX « Premier ordre remboursé en cas de perte » vous offre une expérience de trading sans risque sur les actions américaines

Le mythe de richesse créé par SpaceX a ravivé l'intérêt des investisseurs chinois pour le marché américain, mais l'accès régulier et pratique est devenu difficile après les sanctions contre des courtiers comme Futu et Tiger. Les voies traditionnelles présentent des inconvénients : les fonds QDII/LOF ont des frais élevés et des primes importantes, les petits courtiers étrangers posent des risques de stabilité, et les comptes VIP bancaires à Hong Kong ou Singapour nécessitent un capital minimum élevé et un déplacement physique. Les plateformes de crypto-monnaies comme WEEX émergent comme une alternative pratique. WEEX propose plus de 60 paires de TradFi au spot et 90 contrats perpétuels sur des actifs comme NVIDIA, Apple, Tesla, ainsi que des ETF tels que SPY et QQQ. Le 12 juin, WEEX a listé le token-action SPCXON de SpaceX peu après son introduction en Bourse, permettant une participation rapide. Les avantages de WEEX TradFi incluent : un compte unique pour crypto et TradFi, le règlement en USDT sans conversion bancaire, un effet de levier flexible (jusqu'à 100x pour les actions américaines), et une meilleure liquidité avec un carnet d'ordres à plusieurs niveaux. Pour encourager l'essai, WEEX lance une promotion "Première transaction remboursée si perte" du 15 juin au 8 juillet (UTC+8). Après inscription et un volume de transaction de 500 USDT sur les contrats actions US, les utilisateurs bénéficient d'un remboursement à 100% en cas de perte sur la première transaction (jusqu'à 30 USDT en bonus) ou d'un bonus supplémentaire de 20% sur les gains (plafonné à 30 USDT). Un volume de 1 000 USDT débloque également un défi de trading consécutif avec des bonus jusqu'à 30 USDT. Cette offre permet une expérience de trading sans risque sur le marché américain, combinant la technologie Web3 pour un accès facilité à la finance traditionnelle.

marsbitIl y a 1 h

Vous avez raté l'introduction en bourse de SpaceX ? WEEX « Premier ordre remboursé en cas de perte » vous offre une expérience de trading sans risque sur les actions américaines

marsbitIl y a 1 h

À quel point est-il difficile de fabriquer une puce ? Une erreur de division et 475 millions de dollars sont partis en fumée

Qu'est-ce qui rend la conception des puces si difficile ? Dans une conférence, Shi Kan, chercheur à l'Institut de technologie informatique de l'Académie chinoise des sciences et créateur de contenu scientifique, l'explique en prenant l'exemple du célèbre bogue de la division en virgule flottante du processeur Pentium d'Intel dans les années 1990. Une simple erreur de calcul a contraint la société à dépenser 475 millions de dollars pour rappeler les puces défectueuses. Contrairement aux logiciels, les puces électroniques ne peuvent pas être corrigées après leur fabrication. Leur développement exige donc une parfaite fiabilité dès le premier essai, ce qui est rare : seulement 24 % des projets de puces réussissent du premier coup. La phase de vérification, cruciale pour détecter les erreurs de conception avant la production, est devenue le goulet d'étranglement. Elle peut représenter jusqu'à 70 % du cycle de conception, d'autant plus que la complexité des puces ne cesse de croître. Vérifier exhaustivement un cœur de processeur avec les technologies actuelles prendrait des millénaires. Face à ce défi, Shi Kan et son équipe se consacrent à la recherche sur la vérification des puces, un domaine exigeant et souvent négligé. Ils ont développé une plateforme de vérification agile nommée ENCORE, basée sur des FPGA (Field-Programmable Gate Arrays), pour améliorer radicalement l'efficacité et la capacité de débogage. Parallèlement à ses travaux académiques, Shi Kan s'engage dans la vulgarisation scientifique sur les puces via sa chaîne "老石谈芯". Il considère à la fois la recherche pointue sur la vérification et la diffusion des connaissances au grand public comme des tâches difficiles mais essentielles, qui méritent un engagement à long terme. Pour lui, la difficulté et la persévérance requises sont souvent le signe de la justesse d'une voie.

marsbitIl y a 1 h

À quel point est-il difficile de fabriquer une puce ? Une erreur de division et 475 millions de dollars sont partis en fumée

marsbitIl y a 1 h

Trading

Spot
Futures

Articles tendance

Comment acheter ERA

Bienvenue sur HTX.com ! Nous vous permettons d'acheter Caldera (ERA) de manière simple et pratique. Suivez notre guide étape par étape pour commencer votre parcours crypto.Étape 1 : Création de votre compte HTXUtilisez votre adresse e-mail ou votre numéro de téléphone pour ouvrir un compte sur HTX gratuitement. L'inscription se fait en toute simplicité et débloque toutes les fonctionnalités.Créer mon compteÉtape 2 : Choix du mode de paiement (rubrique Acheter des cryptosCarte de crédit/débit : utilisez votre carte Visa ou Mastercard pour acheter instantanément Caldera (ERA).Solde :utilisez les fonds du solde de votre compte HTX pour trader en toute simplicité.Prestataire tiers :pour accroître la commodité d'utilisation, nous avons ajouté des modes de paiement populaires tels que Google Pay et Apple Pay.P2P :tradez directement avec d'autres utilisateurs sur HTX.OTC (de gré à gré) : nous offrons des services personnalisés et des taux de change compétitifs aux traders.Étape 3 : stockage de vos Caldera (ERA)Après avoir acheté vos Caldera (ERA), stockez-les sur votre compte HTX. Vous pouvez également les envoyer ailleurs via un transfert sur la blockchain ou les utiliser pour trader d'autres cryptos.Étape 4 : tradez des Caldera (ERA)Tradez facilement Caldera (ERA) sur le marché Spot de HTX. Il vous suffit d'accéder à votre compte, de sélectionner la paire de trading, d'exécuter vos trades et de les suivre en temps réel. Nous offrons une expérience conviviale aux débutants comme aux traders chevronnés.

566 vues totalesPublié le 2025.07.17Mis à jour le 2026.06.02

Comment acheter ERA

Discussions

Bienvenue dans la Communauté HTX. Ici, vous pouvez vous tenir informé(e) des derniers développements de la plateforme et accéder à des analyses de marché professionnelles. Les opinions des utilisateurs sur le prix de ERA (ERA) sont présentées ci-dessous.

活动图片