Offres de forfait Token : L'ère de la "guerre du trafic" de l'IA, maintenant c'est au tour des Doubao et autres de se concurrencer

marsbitPublié le 2026-05-19Dernière mise à jour le 2026-05-19

Résumé

Les opérateurs télécoms chinois (China Telecom, China Mobile, China Unicom) lancent des forfaits de « Tokens », unités de calcul standardisées pour l’IA, vendus par abonnement mensuel. Ces forfaits, accessibles aux particuliers (dès 9,9 yuans pour 10 millions de Tokens) et aux entreprises, permettent d’accéder à des dizaines de grands modèles via une plateforme unique. Le Token est l’unité de base du traitement par l’IA. Ces forfaits, comparables aux forfaits données mobiles, simplifient l’accès et le paiement (via la facture téléphonique) et réduisent les coûts de changement de modèle pour l’utilisateur. Cette évolution pousse les éditeurs de modèles (comme Doubao, Qwen, DeepSeek) vers une concurrence accrue sur les prix, l’efficacité énergétique par Token et le développement de solutions à plus forte valeur ajoutée (agents IA, applications sectorielles). Les opérateurs deviennent des agrégateurs/distributeurs, tandis que les modèles deviennent une commodité, la valeur migrant vers la couche applicative.

Texte | Silicon Quadrant

Lorsque les utilisateurs ne se demanderont plus s'ils doivent augmenter leur forfait mensuel de données, ils devront peut-être commencer à se demander combien de services Token acheter chaque mois.

Les Token sont sur le point d'être vendus par les opérateurs comme des services standardisés, à l'instar du trafic internet, de la bande passante ou des SMS.

Récemment, les trois principaux opérateurs télécoms chinois ont successivement lancé des produits forfaitaires en Token : des abonnements mensuels Token pour les utilisateurs individuels, et des forfaits de puissance de calcul (computing) échelonnés pour les développeurs et les clients professionnels. Ils ont également annoncé avoir intégré des dizaines, voire des centaines de grands modèles sur leurs plateformes, avec un système de « paiement mensuel, accès multi-modèles, réglé sur la facture téléphonique ».

China Telecom a déjà lancé des forfaits Token pour particuliers et entreprises, avec un tarif mensuel minimum de 9.9 yuans pour 10 millions de Token d'utilisation. Des opérateurs régionaux comme Shanghai Mobile et Shanghai Telecom proposent quant à eux des modes de facturation par points de quota ou par Token génériques. Par exemple, Shanghai Mobile offre 400 000 Tokens pour 1 yuan.

Avec les opérateurs qui commencent à vendre des services Token, le coût pour les utilisateurs de changer de grand modèle va considérablement diminuer. Pour les entreprises de grands modèles, cela signifie que la « fidélité des utilisateurs » sera affaiblie, et seule une « concurrence plus acharnée » leur permettra de préserver leur part de marché.

À l'avenir, les fabricants de grands modèles comme Doubao, Qianwen, DeepSeek, etc., devront non seulement rivaliser sur les « prix », mais aussi sur la « qualité des Token par unité d'énergie consommée », et même se tourner vers « des capacités de solutions applicatives à plus forte valeur ajoutée ».

01 Qu'est-ce qu'un service Token ?

Pour comprendre le service Token, il faut d'abord comprendre ce qu'est un Token.

Un ordinateur ne peut pas directement reconnaître du texte, seulement du code binaire (0 et 1). Ainsi, chaque mot, caractère, son ou ponctuation que nous saisissons est converti en code binaire via un mécanisme d'encodage spécifique.

Dans le contexte des grands modèles, le processus commence également par la reconnaissance d'un encodage numérique, et le nombre de bits de cet encodage varie légèrement pour chaque caractère.

Le Token est l'unité de calcul minimale traitée par un grand modèle. L'entrée de l'utilisateur, la mémoire contextuelle et la sortie du modèle sont toutes calculées en Token. Plus l'appel au modèle est complexe, plus le contexte est long, plus la chaîne d'exécution d'un Agent est profonde, plus la consommation de Token est élevée.

Typiquement : En anglais, un Token correspond environ à 4 lettres. En chinois, en raison de la densité d'information plus élevée des caractères, un sinogramme, un signe de ponctuation ou une locution correspond souvent à 1 ou 2 Tokens.

Étant donné que la réflexion et la production des grands modèles se font Token par Token, l'industrie a donc adopté la facturation et le calcul des quotas d'utilisation en « par million de Tokens (Per Million Tokens) » ou en « points de quota ».

Actuellement, les entreprises de grands modèles facturent les Token de manière progressive. Les utilisateurs ordinaires utilisant des modèles standards comme Doubao ou Qianwen sont gratuits. En revanche, pour une utilisation intensive de niveau professionnel, il est possible d'acheter différents paliers de services API par abonnement ou à la consommation.

Depuis l'année dernière, les opérateurs ont ouvert des « supermarchés de calcul » pour grands modèles. Les éditeurs de modèles sont les « commerçants hébergés », et les opérateurs perçoivent des « frais de plateforme + frais de calcul + frais de canal ». L'utilisateur n'achète pas un « modèle de l'opérateur », mais plutôt : sur la plateforme de l'opérateur, en utilisant la puissance de calcul de l'opérateur, il fait appel à n'importe quel grand modèle, avec une facturation au Token.

En juillet 2025, China Mobile a lancé la plateforme de services de modèles MoMA (Mobile Model Access) ; en avril, China Telecom a lancé la plateforme opérationnelle de services Token Xingchen TokenHub ; en mai, « China Unicom Xingluo » a publié sa plateforme de services Token. Ces plateformes intègrent les principaux grands modèles comme ceux de Baidu, Alibaba, ByteDance (Douyin), DeepSeek, etc., avec une API unifiée, une authentification unifiée et une facturation unifiée.

Les plateformes des opérateurs adaptent en interne de multiples grands modèles. L'utilisateur n'a qu'à changer le nom du modèle (Model ID) pour basculer en douceur.

02 Pourquoi les opérateurs vendent-ils des Token ?

L'explosion des services Token n'est pas un hasard.

Tout d'abord, le modèle de tarification change. À l'ère traditionnelle du cloud computing, les utilisateurs étaient habitués à payer pour la « durée de location des serveurs » ou la « bande passante fixe » (c'est-à-dire le paiement de la puissance de calcul au niveau IaaS), ils achetaient de la vitesse et du temps. Mais avec le développement des grands modèles, les capacités offertes par les différents modèles et les coûts de consommation requis par les différentes tâches varient énormément. Par exemple, un modèle plus puissant coûte plus cher par Token ; un contexte plus long consomme plus de Tokens ; plus la complexité du raisonnement est élevée, plus le coût réel est élevé. La facturation au Token permet d'aligner le « degré d'intelligence consommé par l'utilisateur » et le « coût en puissance de calcul supporté par le fournisseur ».

Ensuite, cela réduit les barrières techniques et le « coût d'expérimentation ». Le développement et le déploiement d'un grand modèle nécessitent des investissements de dizaines de millions, voire de milliards de dollars. Pour la grande majorité des PME et des développeurs individuels, construire son propre modèle n'est pas réaliste. Le service Token découpe et conditionne la capacité d'« Intelligence Artificielle Générale (IAG ou AGI) », permettant aux développeurs de ne pas se soucier du nombre de GPU utilisés en couches basses, mais simplement d'appeler l'API à la demande et de payer les frais de Token.

Enfin, la demande urgente générée par l'explosion de la couche applicative. En entrant dans l'année 2026, les scénarios applicatifs explosent : Agents IA (Intelligents), assistance à la programmation par IA, génération de contenu multimodal, etc. Dans leur fonctionnement quotidien, ces applications nécessitent des interactions fréquentes et massives de « débit » avec les grands modèles sous-jacents. Un outil automatisé d'écriture de code par IA peut consommer des millions de Tokens en une seule nuit. Cette interaction haute fréquence et à grande échelle pousse le marché à fournir des services de forfaits Token plus standardisés, stables et compétitifs en termes de prix.

Au cours des vingt dernières années, le modèle commercial des opérateurs a connu trois changements majeurs dans son unité de mesure centrale.

La première étape était l'ère de la voix, où les opérateurs vendaient des minutes. La deuxième étape était l'ère de l'internet mobile, où ils vendaient des Go de trafic. En entrant dans l'ère de l'IA, les opérateurs commencent à tenter de vendre des Tokens.

Les Token suivent un processus d'évolution similaire à celui du trafic internet. Au départ, ce n'était qu'un indicateur technique ; ensuite, cela est devenu une unité de facturation ; pour finalement évoluer en un produit standardisé.

L'entrée en scène des opérateurs marque le fait que les Token commencent à quitter le champ technique pour entrer dans le système de consommation.

Dans les années à venir, la manière dont les utilisateurs achètent des capacités d'IA pourrait changer fondamentalement : les particuliers achèteront des « forfaits mensuels IA », les entreprises achèteront des « pools de ressources Token », les forfaits internet familiaux comprendront des quotas IA, et les lignes dédiées aux entreprises et gouvernements intégreront des services Agent. Les Token deviendront une ressource de base, comme l'électricité, l'eau ou le trafic internet.

Cela ne signifie cependant pas que les opérateurs remplaceront les fabricants de grands modèles.

03 Quel forfait Token choisir ?

Le service Token doit-il être acheté directement auprès des fabricants natifs de grands modèles, ou sur les plateformes des opérateurs ? Quels sont actuellement les avantages et inconvénients des deux modèles économiques ?

Le premier est le modèle des fabricants natifs de modèles, c'est-à-dire la facturation au million de Tokens. Des entreprises comme OpenAI, Anthropic, DeepSeek, Qianwen, etc., adoptent généralement ce système. Les utilisateurs paient séparément pour les Tokens d'entrée et de sortie. Certains, comme Qianwen, pourraient utiliser un système de pré-achat en début de mois et de règlement en fin de mois.

Le second est l'abonnement mensuel des opérateurs avec un quota de Token. Par exemple, Shanghai Telecom propose un forfait minimum de 9.9 yuans pour 10 millions de Token, avec des options supplémentaires en cas de dépassement. Il est également prévu d'intégrer les droits Token dans l'espace numérique familial « Meihaojia » et de permettre un paiement direct sur la facture téléphonique.

Ce modèle « tout compris en un prix » ou « intégré à la facture » permet aux utilisateurs chinois d'acheter de la puissance de calcul pour grands modèles comme ils achètent un forfait de données.

Alors que le marché international est principalement dominé par la tarification progressive des API des entreprises natives de grands modèles, le marché chinois pousse les services Token vers une ère de « forfaitisation » similaire à celle des forfaits téléphoniques.

Pour l'instant, les deux modèles de tarification ont leurs avantages, car les utilisateurs des forfaits Token se divisent principalement en trois catégories.

La première est celle des développeurs indépendants et des passionnés de technologie (Geeks). Ils utilisent les interfaces API fournies par les différents fabricants pour créer leurs propres applications IA personnalisées, comme des outils de productivité, des extensions de traduction automatique, des bases de connaissances personnelles, etc.

La deuxième catégorie est celle des PME, des start-ups et des éditeurs de logiciels indépendants (ISV) côté B. C'est le cœur de cible principal des services Token. Qu'il s'agisse d'acheter des Token pour les employés afin de les utiliser pour la programmation, de développer des Agents IA pour des secteurs spécifiques, ou d'intégrer des fonctionnalités d'assistance IA dans les systèmes ERP et CRM existants des entreprises, les PME ont besoin de s'abonner aux « forfaits Token version équipe » des fournisseurs de cloud ou des opérateurs.

La troisième catégorie est celle des travailleurs « très dépendants de l'IA » et des familles ordinaires, qui, dans le cadre domestique, ont besoin d'utiliser l'IA de manière intensive pour la rédaction de textes, l'écriture de code, ou pour l'assistance aux devoirs des enfants.

Du point de vue de l'économie de la technologie, le modèle de facturation pure au Token des grands modèles natifs est plus scientifique pour les PME et les start-ups.

Le modèle forfaitaire des opérateurs présente deux avantages : d'une part, les développeurs indépendants ne sont pas liés à un seul grand modèle et peuvent choisir librement parmi plusieurs modèles via les plateformes des opérateurs ; d'autre part, les services Token pourraient atteindre plus rapidement le grand public consommateur. Car la plupart des gens savent ce que représentent 100 Go de trafic, mais ne peuvent pas percevoir ce que signifient 10 millions de Token.

L'utilisation de l'abonnement mensuel par les opérateurs réduit essentiellement la barrière cognitive. L'utilisateur n'a pas besoin de comprendre le Token, il peut simplement commencer avec le forfait standard de 9.9 yuans pour 10 millions de Token pour découvrir ses besoins.

Avec les opérateurs qui commencent à vendre des services Token, les « Doubao et autres » sont sur le point de s'engager dans une concurrence acharnée à trois niveaux.

De la « course aux paramètres » à la « course au rendement énergétique » : Pour les entreprises de grands modèles, elles ne pourront plus poursuivre aveuglément des modèles avec de très grands paramètres et une consommation d'énergie élevée. Elles devront plutôt consacrer leurs efforts à des capacités comme la distillation de modèles (Distillation), la quantification (Quantization) et l'optimisation de l'inférence (Inference Optimization), afin de produire des Token de meilleure qualité avec une consommation d'énergie réduite.

La concurrence sur les prix va s'intensifier davantage. Une fois que les opérateurs auront agrégé des centaines de modèles, le coût de changement pour l'utilisateur diminuera. Si le modèle A augmente ses prix, il pourra être remplacé par le modèle B via la plateforme. Lorsque les différences de capacités entre modèles sont faibles, le prix devient le facteur de concurrence central.

Le centre de profit des entreprises de grands modèles va se déplacer. Vendre uniquement des API génère des profits limités. À l'avenir, le point de profit pourrait se déplacer vers les Agents, les applications sectorielles et les solutions d'entreprise. Le modèle lui-même deviendra progressivement une infrastructure, tandis que la couche applicative deviendra le centre de valeur.

Peut-être qu'un « marché bilatéral » est en train de se former : les opérateurs contrôlent l'accès, les fabricants de modèles contrôlent les capacités.

Questions liées

QQu'est-ce que le service de Token et pourquoi les opérateurs de télécommunications le vendent-ils maintenant ?

ALe service de Token consiste à vendre des Tokens, l'unité minimale de traitement de l'information pour les grands modèles d'IA, sous forme de forfaits standardisés. Les opérateurs le commercialisent car cela correspond à un changement de mode de facturation (coût aligné sur l'utilisation réelle), réduit les coûts et les barrières techniques pour les utilisateurs, et répond à la demande croissante des applications d'IA qui consomment massivement des Tokens.

QComment les opérateurs chinois comme China Telecom proposent-ils leurs forfaits Token ?

ALes opérateurs chinois proposent des forfaits Token par abonnement mensuel. Par exemple, China Telecom propose un forfait personnel à partir de 9,9 yuans par mois pour 10 millions de Tokens. D'autres, comme Shanghai Mobile, offrent un modèle de paiement à l'unité (1 yuan pour 400 000 Tokens). Ces forfaits sont intégrés aux factures de téléphone, simplifiant le paiement pour les consommateurs.

QQuels sont les principaux groupes cibles pour les services de Token et quels sont leurs besoins ?

AIl y a trois groupes cibles principaux : 1) Les développeurs indépendants et les passionnés de technologie qui créent des applications personnalisées. 2) Les PME, startups et éditeurs de logiciels qui intègrent l'IA dans leurs outils professionnels. 3) Les particuliers et familles utilisant intensivement l'IA pour des tâches comme la rédaction, le codage ou l'aide aux devoirs.

QQuel impact la vente de Tokens par les opérateurs aura-t-elle sur les entreprises de grands modèles de langage comme 'Doubao' ?

ACela va intensifier la concurrence pour les entreprises de grands modèles ('Doubao'). La fidélité des utilisateurs diminuera car il sera facile de changer de modèle via la plateforme des opérateurs. Elles devront se concurrencer sur trois aspects : l'efficacité énergétique (qualité du Token par unité d'énergie), les prix, et le développement de solutions à valeur ajoutée (comme les Agents IA) au-delà de la simple vente d'API.

QQuelle analogie l'article établit-il entre les Tokens et d'autres services des opérateurs ?

AL'article établit une analogie entre l'évolution des unités de facturation des opérateurs : les minutes de communication à l'ère de la voix, les gigaoctets (Go) de données à l'ère mobile, et maintenant les Tokens à l'ère de l'IA. Les Tokens sont en train de passer d'un indicateur technique à une unité de facturation, puis à une marchandise standardisée, tout comme l'ont été les forfaits données avant eux.

Lectures associées

Variant : Trois actifs de couche 1 sont particulièrement susceptibles de devenir des réserves de valeur majeures

L’équipe de Variant expose sa vision des actifs de couche 1 (L1) comme potentiels moyens de réserve de valeur (SOV), un marché estimé à plusieurs dizaines de milliers de milliards de dollars. Leur cadre d'analyse repose sur plusieurs critères essentiels : la durabilité technique, la rareté, la résistance à la censure, la productivité économique, l'aspect « mémétique » (perception sociale) et la liquidité. Trois actifs L1 se distinguent particulièrement selon ce modèle : * **Bitcoin (BTC)** : Il domine par sa puissance « mémétique » et sa perception en tant qu'« or numérique », attirant une conviction croissante des particuliers aux institutions. * **Ethereum (ETH)** : Il excelle en durabilité technique grâce à sa capacité d'adaptation et de mise à niveau, lui permettant de relever les défis futurs et de maintenir sa pertinence à long terme. * **ZCash (ZEC)** : Il offre une résistance à la censure et une confidentialité inégalées via ses transactions protégées (shielded pool), fournissant une option cruciale pour protéger les actifs contre la surveillance ou la confiscation. Alors que l'or et l'argent dominent encore largement le marché des réserves de valeur, ces actifs numériques présentent, selon Variant, des propriétés fondamentales supérieures. La faible part qu'ils occupent actuellement dans ce marché total représente donc une opportunité de croissance significative, permettant potentiellement la coexistence de plusieurs SOV numériques de premier plan.

链捕手Il y a 45 mins

Variant : Trois actifs de couche 1 sont particulièrement susceptibles de devenir des réserves de valeur majeures

链捕手Il y a 45 mins

Sui dévoile ce qui a provoqué trois arrêts de son réseau principal après une mise à jour majeure

Le réseau principal de Sui a connu trois interruptions distinctes les 28 et 29 mai, suite à la mise à jour 1.72 qui a révélé des cas limites dans la logique de facturation du gas et de redémarrage des validateurs, selon un rapport post-mortem de la Fondation Sui. Aucun fonds utilisateur n'a été compromis et le réseau a repris son activité normalement. Les deux premières interruptions étaient liées à un bug dans l'interaction entre la nouvelle fonctionnalité de solde d'adresse (introduite pour payer le gas) et la logique existante, provoquant un dépassement inférieur lors du règlement des transactions. Un correctif temporaire a été appliqué, mais une faiblesse résiduelle a causé la seconde panne. La troisième interruption, distincte, est survenue lors d'un changement d'époque programmé. Après les redémarrages, un bug latent dans la persistance de l'état du protocole de génération de clés distribuée (DKG) a empêché la finalisation de l'époque. La solution a consisté à persister l'état du DKG et à ajouter un mécanisme de clôture forcée coordonnée. La Fondation Sui a présenté ces incidents comme une leçon pour renforcer la résilience des changements d'époque et appliquer une rigueur accrue à la logique de facturation du gas, au même titre que d'autres composants fondamentaux du protocole.

bitcoinistIl y a 57 mins

Sui dévoile ce qui a provoqué trois arrêts de son réseau principal après une mise à jour majeure

bitcoinistIl y a 57 mins

Le nouveau poste de FDE connaît un grand succès dans la Silicon Valley. De quel type de talents en IA les entreprises ont-elles besoin ?

Un nouveau poste en vogue dans la Silicon Valley, l’Ingénieur de Déploiement sur le Terrain en IA (AI Forward Deployed Engineer, FDE), consiste à déployer directement chez le client des flux de travail d'Agent IA personnalisés, adaptés à des processus métiers spécifiques. Même si ce rôle, popularisé par Palantir il y a vingt ans, connaît un regain d'intérêt avec les initiatives d'OpenAI et d'Anthropic, il ne représente qu'une partie de l'évolution du marché de l'emploi liée à l'IA. L'article souligne que l'impact de l'IA ne se résume pas à un simple remplacement d'emplois, mais qu'elle crée de nouveaux rôles génériques. La demande devrait être bien plus forte pour les ingénieurs en IA internes aux entreprises. Ces professionnels doivent maîtriser les prompts, les frameworks d'agents, les systèmes d'évaluation et utiliser des outils de programmation assistée par IA pour intégrer les capacités de l'IA dans les logiciels et les systèmes opérationnels. À l'image de la spécialisation passée du génie logiciel (front-end, back-end, DevOps), le domaine de l'ingénierie IA devrait à son tour se différencier en rôles plus spécialisés, tels que LLMOps, ingénieur en évaluation ou ingénieur de données IA. La vraie rareté sur le marché sera les profils hybrides, alliant une solide compétence technique à une compréhension approfondie des scénarios métiers.

marsbitIl y a 1 h

Le nouveau poste de FDE connaît un grand succès dans la Silicon Valley. De quel type de talents en IA les entreprises ont-elles besoin ?

marsbitIl y a 1 h

Trading

Spot
Futures

Articles tendance

Comment acheter ERA

Bienvenue sur HTX.com ! Nous vous permettons d'acheter Caldera (ERA) de manière simple et pratique. Suivez notre guide étape par étape pour commencer votre parcours crypto.Étape 1 : Création de votre compte HTXUtilisez votre adresse e-mail ou votre numéro de téléphone pour ouvrir un compte sur HTX gratuitement. L'inscription se fait en toute simplicité et débloque toutes les fonctionnalités.Créer mon compteÉtape 2 : Choix du mode de paiement (rubrique Acheter des cryptosCarte de crédit/débit : utilisez votre carte Visa ou Mastercard pour acheter instantanément Caldera (ERA).Solde :utilisez les fonds du solde de votre compte HTX pour trader en toute simplicité.Prestataire tiers :pour accroître la commodité d'utilisation, nous avons ajouté des modes de paiement populaires tels que Google Pay et Apple Pay.P2P :tradez directement avec d'autres utilisateurs sur HTX.OTC (de gré à gré) : nous offrons des services personnalisés et des taux de change compétitifs aux traders.Étape 3 : stockage de vos Caldera (ERA)Après avoir acheté vos Caldera (ERA), stockez-les sur votre compte HTX. Vous pouvez également les envoyer ailleurs via un transfert sur la blockchain ou les utiliser pour trader d'autres cryptos.Étape 4 : tradez des Caldera (ERA)Tradez facilement Caldera (ERA) sur le marché Spot de HTX. Il vous suffit d'accéder à votre compte, de sélectionner la paire de trading, d'exécuter vos trades et de les suivre en temps réel. Nous offrons une expérience conviviale aux débutants comme aux traders chevronnés.

547 vues totalesPublié le 2025.07.17Mis à jour le 2026.06.02

Comment acheter ERA

Discussions

Bienvenue dans la Communauté HTX. Ici, vous pouvez vous tenir informé(e) des derniers développements de la plateforme et accéder à des analyses de marché professionnelles. Les opinions des utilisateurs sur le prix de ERA (ERA) sont présentées ci-dessous.

活动图片