Article | Canal Luo Chao
DeepSeek a annoncé la « pérennisation » de la remise de 75 % sur l'API V4-Pro, effective simultanément dans le monde entier.
Le système tarifaire final : le prix de base de l'entrée passe de 1,74 $ / million de tokens à 0,435 $ / million de tokens, et le prix de sortie passe de 3,48 $ / million de tokens à 0,87 $ / million de tokens. Pour l'ensemble de la gamme de produits API, DeepSeek a mis en place un rabais encore plus important pour les entrées en cache : 0,003625 $ / million de tokens, adoptant entièrement un modèle de tarification au plancher de type Pinduoduo.
Sur les réseaux sociaux, y compris X, des appels sont immédiatement apparus : Liang Wenfeng est le bodhisattva cybernétique du monde de l'IA, le Dieu Feng, le Saint Liang. L'émotion ne vient pas uniquement du prix bas en soi – DeepSeek a toujours été appelé le Pinduoduo de l'IA, gratuit pour les consommateurs, bon marché pour les entreprises, le monde entier s'est habitué à ses prix bas. Mais la difficulté de cette baisse de prix réside dans le fait que : partout dans le monde, les prix de l'IA augmentent.
Des reportages indiquent que dans le tour de financement de série A record que DeepSeek est en train de mener, Liang Wenfeng investira personnellement jusqu'à 200 milliards de yuans, soit 40 % du montant total du financement. La première chose que font la plupart des entreprises lorsqu'elles lèvent des fonds est de renforcer leur trésorerie, d'avoir de meilleures performances financières. Mais Liang Wenfeng ne compte pas utiliser la promesse de commercialisation pour attirer les investisseurs, il insiste sur l'open source et poursuit l'AGI. Cette baisse de prix, c'est vraiment tenir parole. La dernière fois qu'une entreprise a déclaré aussi courageusement qu'elle ne voulait pas gagner d'argent, c'était Pinduoduo. En 2024, son co-fondateur a clairement déclaré lors d'une conférence téléphonique aux investisseurs : « À partir du T3, nos bénéfices vont progressivement baisser et ne rebondiront pas à court terme. À long terme, la baisse de la rentabilité est inévitable. » Le cours de l'action a chuté.
Sam Altman parle sans cesse de démocratisation de l'IA, mais OpenAI se dirige à toute vitesse vers l'inverse de son nom : CloseAI. Liang Wenfeng, quant à lui, met en pratique son engagement pour que chaque individu, chaque entreprise, puisse utiliser l'IA de manière aussi accessible et équitable que possible. Mais Liang Wenfeng est-il vraiment un bodhisattva vivant ? Non. C'est un entrepreneur, l'open source et l'accessibilité ne sont qu'un choix de modèle commercial, ce qui est précieux actuellement et deviendra de plus en plus rare à l'avenir.
Car : L'IA devient de plus en plus chère.
Cette semaine, Microsoft a annulé ses licences internes pour Claude Code, car la facturation basée sur les tokens était trop élevée pour qu'elle puisse y faire face. Microsoft a lourdement soutenu OpenAI, fournit également des services cloud Azure à A (probablement Anthropic), et possède des ressources en cloud computing que toutes les entreprises envient. Mais le coût des tokens lui fait encore mal. Par un hasard révélateur, le CTO d'Uber a rapporté en avril à la direction une situation embarrassante : le budget alloué par l'entreprise pour l'IA pour l'année 2026 avait été dépensé en quatre mois, 95% des ingénieurs utilisant des outils de programmation par IA chaque mois, 70% du code soumis étant généré par IA. Ses propres mots étaient : « Je retourne à la planche à dessin car le budget que je pensais avoir besoin est déjà parti en fumée. ».
Le fait que les budgets token des grandes entreprises brûlent beaucoup plus vite que prévu est certes dû en partie au fait que les employés utilisent les tokens sans compter, « ne faisant pas attention aux coûts », mais la racine de la tension budgétaire est que l'IA devient plus chère. Le prix des logiciels d'IA aux États-Unis a augmenté de 20% à 37% au cours de la dernière année. Les trois grands – Anthropic, OpenAI et Google – ont tous discrètement augmenté le prix réel de la même sortie d'IA au cours des six derniers mois.
(Source : X)
L'idée populaire précédente était « plus l'IA est utilisée à grande échelle, plus son industrialisation est élevée, plus les coûts sont bas, plus les entreprises sont contentes ». Résultat : on a été naïfs.
Et cette tendance ne va pas s'inverser. Le prix est déterminé par l'offre et la demande, pas par le coût, mais la relation offre/demande pour l'IA a complètement basculé en 2026. Avant, les grandes entreprises suppliaient les gens d'utiliser l'IA, pour éduquer le marché, promouvoir la technologie, l'IA était subventionnée. Combien de tasses de lait/thé de Tongyi Qianwen avez-vous bues ? Maintenant ? Les gens l'utilisent de plus en plus activement, « une fois qu'on a pris la première bouffée, on ne peut plus s'en passer ». La programmation par IA, les documents par IA, la génération de contenu par IA et même la recherche par IA deviennent de plus en plus courants. L'ère des subventions à l'IA est définitivement terminée.
Plus il y a d'utilisateurs, plus la demande est grande, plus les ressources en tokens sont tendues. Ainsi, la pénurie de puissance de calcul s'est propagée des GPU aux CPU, au stockage, voire à la bande passante. Intel, Micron, SK Hynix, Samsung Electronics, SanDisk ainsi que les entreprises chinoises comme Longsys et les deux « chang » (probablement ChangXin et autre) suivent Nvidia pour manger leur part du gâteau. D'où viennent les revenus multipliés des géants des semi-conducteurs en 2026 ? Ce n'est fondamentalement pas du tout de la boucle d'investissement triangulaire OpenAI-Oracle-Microsoft, n'est-ce pas ? Et les douleurs des entreprises ne font que commencer. De plus, l'accent mis par des produits comme ChatGPT, Claude, Gemini, Doubao sur la distinction stricte entre version gratuite et payante va rendre les utilisateurs individuels de plus en plus perplexes.
C'est comme le covoiturage : pendant la folie, vous pouviez prendre des voitures de luxe gratuitement pour aller au travail, le capital payait pour vous. Une fois les habitudes des utilisateurs établies, les subventions prennent fin, les prix reviennent à des niveaux normaux, ceux qui doivent prendre le métro le prennent à nouveau. Il en va de même pour l'IA. Ainsi, dans le contexte général de hausse des prix des tokens, le fait que DeepSeek persiste à baisser ses prix n'est plus seulement une question de courage personnel de « bodhisattva cybernétique », mais démontre un pouvoir de fixation des prix inverse : je peux être aussi bon marché, fonctionner normalement, et la qualité ne baisse pas.
Si Liang Wenfeng le voulait, DeepSeek n'aurait absolument pas besoin d'être aussi bon marché. Alors les gens commencent à s'inquiéter : DeepSeek deviendra-t-il le Linux de l'ère de l'IA ? Une influence énorme, mais incapable de gagner beaucoup d'argent. La contribution de Linux à l'industrie informatique est bien plus grande que celle de Windows ou d'Android (Android lui-même est basé sur le noyau Linux), mais il est open source et n'a pas donné naissance à des géants commerciaux comme Microsoft ou Google. L'influence actuelle de DeepSeek est énorme, mais ses capacités commerciales sont loin derrière celles des trois grands de la Silicon Valley, et même inférieures à celles des trois entreprises chinoises Kimi, MiniMax et Zhipu AI. Classement des revenus des quatre « petits dragons » en 2025 : Zhipu AI (revenus 2025 : 7,24 milliards de yuans) > MiniMax (revenus 2025 : environ 5,6 milliards de yuans) > Moonshot AI (environ 2 milliards de yuans) > DeepSeek (inconnu mais inférieur).
Liang Wenfeng gagne de l'argent grâce à l'IA quantitative, il peut personnellement investir 200 milliards dans DeepSeek, mais l'histoire du « travail par passion » ne peut pas durer éternellement.
En outre, avec le modèle open source, d'autres peuvent aussi distiller, déployer, réentraîner, la barrière technologique de DeepSeek pourrait s'amincir. C'est pourquoi on voit souvent ce genre de nouvelles de « classement » : après l'ouverture de GLM-5.1 de Zhipu AI, il a battu un record mondial dans le benchmark SWE-bench Pro, le MiMo-V2.5-Pro de Xiaomi est arrivé en tête du classement mondial des grands modèles open source... Un rapport conjoint du MIT et de Hugging Face montre qu'au cours de l'année écoulée, les modèles open source développés en Chine ont représenté 17,1 % des téléchargements mondiaux, dépassant les 15,8 % des États-Unis, première place mondiale.
Pas étonnant que de plus en plus de voix dans la Silicon Valley disent : il faut absolument une version américaine de DeepSeek, on ne peut pas rester les bras croisés à regarder l'industrie de l'IA revivre l'histoire de Shein, Temu ou TikTok. « Si les États-Unis ne voient pas émerger un champion open source, le monde fonctionnera avec des modèles open source et des logiciels open source provenant du pays qui peut produire les modèles les plus puissants, les plus stables, les moins chers, personnalisables, évolutifs, adaptés aux besoins individuels et commerciaux. » Les sujets impliquant la concurrence entre grandes puissances sont souvent un peu vastes, mais la concurrence qui se cache derrière est bien réelle.
Derrière l'essor de DeepSeek, il y a déjà un récit de substitution autonome. Le support d'Ascend par V4 a été accueilli avec joie, propulsé par les capacités de calcul nationales, la compétitivité tarifaire actuellement démontrée par DeepSeek n'est que l'apéritif. Dans son rapport technique, DeepSeek a indiqué qu'après la mise sur le marché en série des super-nœuds Ascend 950 au second semestre, le prix de V4-Pro sera encore considérablement réduit, les beaux jours sont encore à venir.
Il y a aussi l'avantage des talents en IA de haut niveau. Les talents en IA sont chers à un niveau « luxueux », mais ils sont relativement moins chers en Chine. Que Lei Jun ait recruté Luo Fuli chez DeepSeek avec un salaire annuel de 10 millions de yuans est devenu une nouvelle, tandis qu'au même moment, Mark Zuckerberg devait dépenser 1 milliard de dollars pour recruter des gens, y compris par des acquisitions de talents. Mais la différence entre ce que produisent les personnes à 1 milliard de dollars et celles à 10 millions de yuans n'est évidemment pas de 700 fois. L'écart de prix des talents en IA se traduira en fait en un écart systématique dans le système de production des tokens.
Une compétitivité encore plus grande réside dans le système énergétique, c'est la première couche du gâteau à cinq étages de l'IA de Jensen Huang.
La fin de l'IA, c'est la puissance de calcul. La fin de la puissance de calcul, c'est l'électricité. En avril 2026, DeepSeek a publié des offres d'emploi pour des ingénieurs d'exploitation senior et des chefs de projet de livraison senior pour un centre de données à Ulanqab, en Mongolie-Intérieure. Cela signifie qu'il va construire des « usines à tokens » dans l'ouest, étendant son avantage en termes de coûts de la couche logicielle à la couche physique. La dernière fois que j'ai écrit un article mentionnant Ulanqab, c'était quand Kuaishou y construisait un centre de données : proche des centrales électriques, climat adapté pour un bon refroidissement. De plus, le prix de l'électricité verte dans l'ouest de la Chine est d'environ 0,2-0,3 yuan/kWh, soit seulement 1/5 à 1/4 de celui de l'Europe et des États-Unis.
Ce n'est pas seulement l'électricité verte de l'ouest qui est compétitive. Les données 2025 de l'Agence internationale de l'énergie montrent que la capacité totale installée de production d'électricité en Chine a dépassé 2300 GW, représentant environ 22 % du total mondial, première place mondiale ; environ 1300 GW pour les États-Unis. Plus crucial encore, la Chine possède la structure électrique la plus complète au monde : thermique, hydroélectrique, éolien, nucléaire, photovoltaïque, tous présents. Les données montrent que le prix industriel de l'électricité en Chine est maintenu à long terme entre 0,06 et 0,08 $/kWh. Le prix industriel de l'électricité en Californie approche déjà 0,18 $/kWh, et dans certaines parties de l'Allemagne, il dépasse même 0,25 $/kWh. Cela signifie qu'entraîner un cluster de dix mille cartes, en Chine, coûte naturellement des dizaines de points de pourcentage moins cher qu'en Europe et aux États-Unis.
Dans les coûts d'exploitation des grands modèles d'IA, le coût de l'électricité représente jusqu'à 60%-70 % du coût opérationnel total. Ce n'est pas seulement pour faire tourner le modèle qu'il faut de l'électricité, mais aussi pour le refroidissement, qui est un poste important. Le « monstre des infrastructures » a même construit des centres de données directement au fond de la mer, avec l'énergie éolienne offshore à proximité comme source d'électricité et l'eau de mer en circulation pour le refroidissement gratuit. Il y a aussi les grands projets comme « l'électricité de l'ouest envoyée à l'est » et « les calculs de l'est traités à l'ouest ». La capacité de régulation régionale de l'électricité et de la puissance de calcul est extrêmement forte. Le Guizhou, la Mongolie-Intérieure, le Ningxia sont déjà des nœuds clés de « l'est calcule, l'ouest traite », la voie est toute tracée pour déplacer les centres de calcul d'IA vers l'ouest.
Utiliser l'IA chinoise, c'est essentiellement utiliser une IA entraînée par un système énergétique plus compétitif – une IA plus économique, plus accessible. C'est l'une des raisons pour lesquelles les revenus à l'étranger de kimi, minimax, etc. ont explosé après le Nouvel An chinois. Ce n'est pas seulement que les algorithmes sont plus puissants, mais qu'ils bénéficient d'un avantage sur le prix de l'électricité.
Nvidia peut définir le prix de la puissance de calcul haut de gamme, mais DeepSeek et ses pairs s'emparent du pouvoir de fixation des prix des tokens. Vous pourriez dire : ce qui est bon marché en IA n'est pas de bonne qualité. L'IA est effectivement à la qualité, au prix. DeepSeek V4 a seulement réduit l'écart entre l'open source et le propriétaire au niveau le plus faible de l'histoire. L'entreprise reconnaît officiellement l'écart objectif avec les modèles de pointe comme GPT, et il n'est pas multimodal non plus : il peut reconnaître des images, mais ne peut pas en générer.
Mais cela n'a pas empêché la communauté de se tourner vers DeepSeek. La raison : la plupart des scénarios commerciaux réels n'ont pas besoin d'appeler à chaque fois le modèle le plus puissant au monde. Le conseil, le service client, le résumé, la traduction, la complétion de code, les bases de connaissances d'entreprise, les processus d'automatisation, tout cela ne nécessite pas l'intelligence la plus élevée, mais « un niveau suffisant + assez bon marché + assez stable ». Lorsque le coût d'inférence de DeepSeek V4 n'est qu'environ 1 % (Flash) à 11 % (Pro) de celui de GPT-5.5, une entreprise avec le même budget peut appeler des dizaines de fois plus de tokens, essayer plus de chaînes de prompts, itérer sur plus de flux de travail d'agents, et finalement produire un travail qui peut potentiellement être meilleur. Après tout, l'IA est elle-même un jeu de « probabilités ». Tant que c'est assez bon marché, s'arranger avec un niveau acceptable pour obtenir un résultat, pourquoi pas ?
Ainsi, plus l'IA est chère, plus la bon marchéé de DeepSeek a de la valeur, plus la société DeepSeek a de la valeur. Liang Wenfeng et ses investisseurs y voient plus clair que quiconque.







