DeepSeek baisse ses prix de façon permanente, mais Liang Wenfeng ne veut pas devenir le « bodhisattva cybernétique »

marsbitPublié le 2026-05-24Dernière mise à jour le 2026-05-24

Résumé

DeepSeek a annoncé la pérennisation d'une réduction de 75 % sur son API V4-Pro, abaissant significativement ses tarifs par token. Cette décision intervient dans un contexte où la plupart des grands acteurs de l'IA, comme OpenAI, Anthropic et Google, augmentent leurs prix en raison d'une demande croissante et de contraintes sur les ressources de calcul. Bien que salué comme un « bodhisattva cybernétique », le fondateur Liang Wenfeng est avant tout un entrepreneur. Son choix stratégique de l'open-source et des prix bas repose sur des avantages structurels profonds : des talents en IA relativement moins chers, l'utilisation de puces chinoises comme l'Ascend et, surtout, un accès à une énergie beaucoup moins chère. La Chine bénéficie de coûts électriques industriels bien inférieurs à ceux des États-Unis ou de l'Europe, ce qui réduit considérablement le coût opérationnel principal des grands modèles. Cette compétitivité par les coûts permet à DeepSeek d'offrir une alternative viable pour de nombreuses applications professionnelles qui n'exigent pas nécessairement le modèle le plus performant, mais plutôt un rapport qualité-prix et une stabilité optimaux. Alors que l'IA devient plus chère ailleurs, la proposition de valeur de DeepSeek se renforce, positionnant l'entreprise comme un acteur clé capable d'influencer les prix du marché mondial de l'IA.

Article | Canal Luo Chao

DeepSeek a annoncé la « pérennisation » de la remise de 75 % sur l'API V4-Pro, effective simultanément dans le monde entier.

Le système tarifaire final : le prix de base de l'entrée passe de 1,74 $ / million de tokens à 0,435 $ / million de tokens, et le prix de sortie passe de 3,48 $ / million de tokens à 0,87 $ / million de tokens. Pour l'ensemble de la gamme de produits API, DeepSeek a mis en place un rabais encore plus important pour les entrées en cache : 0,003625 $ / million de tokens, adoptant entièrement un modèle de tarification au plancher de type Pinduoduo.

Sur les réseaux sociaux, y compris X, des appels sont immédiatement apparus : Liang Wenfeng est le bodhisattva cybernétique du monde de l'IA, le Dieu Feng, le Saint Liang. L'émotion ne vient pas uniquement du prix bas en soi – DeepSeek a toujours été appelé le Pinduoduo de l'IA, gratuit pour les consommateurs, bon marché pour les entreprises, le monde entier s'est habitué à ses prix bas. Mais la difficulté de cette baisse de prix réside dans le fait que : partout dans le monde, les prix de l'IA augmentent.

Des reportages indiquent que dans le tour de financement de série A record que DeepSeek est en train de mener, Liang Wenfeng investira personnellement jusqu'à 200 milliards de yuans, soit 40 % du montant total du financement. La première chose que font la plupart des entreprises lorsqu'elles lèvent des fonds est de renforcer leur trésorerie, d'avoir de meilleures performances financières. Mais Liang Wenfeng ne compte pas utiliser la promesse de commercialisation pour attirer les investisseurs, il insiste sur l'open source et poursuit l'AGI. Cette baisse de prix, c'est vraiment tenir parole. La dernière fois qu'une entreprise a déclaré aussi courageusement qu'elle ne voulait pas gagner d'argent, c'était Pinduoduo. En 2024, son co-fondateur a clairement déclaré lors d'une conférence téléphonique aux investisseurs : « À partir du T3, nos bénéfices vont progressivement baisser et ne rebondiront pas à court terme. À long terme, la baisse de la rentabilité est inévitable. » Le cours de l'action a chuté.

Sam Altman parle sans cesse de démocratisation de l'IA, mais OpenAI se dirige à toute vitesse vers l'inverse de son nom : CloseAI. Liang Wenfeng, quant à lui, met en pratique son engagement pour que chaque individu, chaque entreprise, puisse utiliser l'IA de manière aussi accessible et équitable que possible. Mais Liang Wenfeng est-il vraiment un bodhisattva vivant ? Non. C'est un entrepreneur, l'open source et l'accessibilité ne sont qu'un choix de modèle commercial, ce qui est précieux actuellement et deviendra de plus en plus rare à l'avenir.

Car : L'IA devient de plus en plus chère.

Cette semaine, Microsoft a annulé ses licences internes pour Claude Code, car la facturation basée sur les tokens était trop élevée pour qu'elle puisse y faire face. Microsoft a lourdement soutenu OpenAI, fournit également des services cloud Azure à A (probablement Anthropic), et possède des ressources en cloud computing que toutes les entreprises envient. Mais le coût des tokens lui fait encore mal. Par un hasard révélateur, le CTO d'Uber a rapporté en avril à la direction une situation embarrassante : le budget alloué par l'entreprise pour l'IA pour l'année 2026 avait été dépensé en quatre mois, 95% des ingénieurs utilisant des outils de programmation par IA chaque mois, 70% du code soumis étant généré par IA. Ses propres mots étaient : « Je retourne à la planche à dessin car le budget que je pensais avoir besoin est déjà parti en fumée. ».

Le fait que les budgets token des grandes entreprises brûlent beaucoup plus vite que prévu est certes dû en partie au fait que les employés utilisent les tokens sans compter, « ne faisant pas attention aux coûts », mais la racine de la tension budgétaire est que l'IA devient plus chère. Le prix des logiciels d'IA aux États-Unis a augmenté de 20% à 37% au cours de la dernière année. Les trois grands – Anthropic, OpenAI et Google – ont tous discrètement augmenté le prix réel de la même sortie d'IA au cours des six derniers mois.

(Source : X)

L'idée populaire précédente était « plus l'IA est utilisée à grande échelle, plus son industrialisation est élevée, plus les coûts sont bas, plus les entreprises sont contentes ». Résultat : on a été naïfs.

Et cette tendance ne va pas s'inverser. Le prix est déterminé par l'offre et la demande, pas par le coût, mais la relation offre/demande pour l'IA a complètement basculé en 2026. Avant, les grandes entreprises suppliaient les gens d'utiliser l'IA, pour éduquer le marché, promouvoir la technologie, l'IA était subventionnée. Combien de tasses de lait/thé de Tongyi Qianwen avez-vous bues ? Maintenant ? Les gens l'utilisent de plus en plus activement, « une fois qu'on a pris la première bouffée, on ne peut plus s'en passer ». La programmation par IA, les documents par IA, la génération de contenu par IA et même la recherche par IA deviennent de plus en plus courants. L'ère des subventions à l'IA est définitivement terminée.

Plus il y a d'utilisateurs, plus la demande est grande, plus les ressources en tokens sont tendues. Ainsi, la pénurie de puissance de calcul s'est propagée des GPU aux CPU, au stockage, voire à la bande passante. Intel, Micron, SK Hynix, Samsung Electronics, SanDisk ainsi que les entreprises chinoises comme Longsys et les deux « chang » (probablement ChangXin et autre) suivent Nvidia pour manger leur part du gâteau. D'où viennent les revenus multipliés des géants des semi-conducteurs en 2026 ? Ce n'est fondamentalement pas du tout de la boucle d'investissement triangulaire OpenAI-Oracle-Microsoft, n'est-ce pas ? Et les douleurs des entreprises ne font que commencer. De plus, l'accent mis par des produits comme ChatGPT, Claude, Gemini, Doubao sur la distinction stricte entre version gratuite et payante va rendre les utilisateurs individuels de plus en plus perplexes.

C'est comme le covoiturage : pendant la folie, vous pouviez prendre des voitures de luxe gratuitement pour aller au travail, le capital payait pour vous. Une fois les habitudes des utilisateurs établies, les subventions prennent fin, les prix reviennent à des niveaux normaux, ceux qui doivent prendre le métro le prennent à nouveau. Il en va de même pour l'IA. Ainsi, dans le contexte général de hausse des prix des tokens, le fait que DeepSeek persiste à baisser ses prix n'est plus seulement une question de courage personnel de « bodhisattva cybernétique », mais démontre un pouvoir de fixation des prix inverse : je peux être aussi bon marché, fonctionner normalement, et la qualité ne baisse pas.

Si Liang Wenfeng le voulait, DeepSeek n'aurait absolument pas besoin d'être aussi bon marché. Alors les gens commencent à s'inquiéter : DeepSeek deviendra-t-il le Linux de l'ère de l'IA ? Une influence énorme, mais incapable de gagner beaucoup d'argent. La contribution de Linux à l'industrie informatique est bien plus grande que celle de Windows ou d'Android (Android lui-même est basé sur le noyau Linux), mais il est open source et n'a pas donné naissance à des géants commerciaux comme Microsoft ou Google. L'influence actuelle de DeepSeek est énorme, mais ses capacités commerciales sont loin derrière celles des trois grands de la Silicon Valley, et même inférieures à celles des trois entreprises chinoises Kimi, MiniMax et Zhipu AI. Classement des revenus des quatre « petits dragons » en 2025 : Zhipu AI (revenus 2025 : 7,24 milliards de yuans) > MiniMax (revenus 2025 : environ 5,6 milliards de yuans) > Moonshot AI (environ 2 milliards de yuans) > DeepSeek (inconnu mais inférieur).

Liang Wenfeng gagne de l'argent grâce à l'IA quantitative, il peut personnellement investir 200 milliards dans DeepSeek, mais l'histoire du « travail par passion » ne peut pas durer éternellement.

En outre, avec le modèle open source, d'autres peuvent aussi distiller, déployer, réentraîner, la barrière technologique de DeepSeek pourrait s'amincir. C'est pourquoi on voit souvent ce genre de nouvelles de « classement » : après l'ouverture de GLM-5.1 de Zhipu AI, il a battu un record mondial dans le benchmark SWE-bench Pro, le MiMo-V2.5-Pro de Xiaomi est arrivé en tête du classement mondial des grands modèles open source... Un rapport conjoint du MIT et de Hugging Face montre qu'au cours de l'année écoulée, les modèles open source développés en Chine ont représenté 17,1 % des téléchargements mondiaux, dépassant les 15,8 % des États-Unis, première place mondiale.

Pas étonnant que de plus en plus de voix dans la Silicon Valley disent : il faut absolument une version américaine de DeepSeek, on ne peut pas rester les bras croisés à regarder l'industrie de l'IA revivre l'histoire de Shein, Temu ou TikTok. « Si les États-Unis ne voient pas émerger un champion open source, le monde fonctionnera avec des modèles open source et des logiciels open source provenant du pays qui peut produire les modèles les plus puissants, les plus stables, les moins chers, personnalisables, évolutifs, adaptés aux besoins individuels et commerciaux. » Les sujets impliquant la concurrence entre grandes puissances sont souvent un peu vastes, mais la concurrence qui se cache derrière est bien réelle.

Derrière l'essor de DeepSeek, il y a déjà un récit de substitution autonome. Le support d'Ascend par V4 a été accueilli avec joie, propulsé par les capacités de calcul nationales, la compétitivité tarifaire actuellement démontrée par DeepSeek n'est que l'apéritif. Dans son rapport technique, DeepSeek a indiqué qu'après la mise sur le marché en série des super-nœuds Ascend 950 au second semestre, le prix de V4-Pro sera encore considérablement réduit, les beaux jours sont encore à venir.

Il y a aussi l'avantage des talents en IA de haut niveau. Les talents en IA sont chers à un niveau « luxueux », mais ils sont relativement moins chers en Chine. Que Lei Jun ait recruté Luo Fuli chez DeepSeek avec un salaire annuel de 10 millions de yuans est devenu une nouvelle, tandis qu'au même moment, Mark Zuckerberg devait dépenser 1 milliard de dollars pour recruter des gens, y compris par des acquisitions de talents. Mais la différence entre ce que produisent les personnes à 1 milliard de dollars et celles à 10 millions de yuans n'est évidemment pas de 700 fois. L'écart de prix des talents en IA se traduira en fait en un écart systématique dans le système de production des tokens.

Une compétitivité encore plus grande réside dans le système énergétique, c'est la première couche du gâteau à cinq étages de l'IA de Jensen Huang.

La fin de l'IA, c'est la puissance de calcul. La fin de la puissance de calcul, c'est l'électricité. En avril 2026, DeepSeek a publié des offres d'emploi pour des ingénieurs d'exploitation senior et des chefs de projet de livraison senior pour un centre de données à Ulanqab, en Mongolie-Intérieure. Cela signifie qu'il va construire des « usines à tokens » dans l'ouest, étendant son avantage en termes de coûts de la couche logicielle à la couche physique. La dernière fois que j'ai écrit un article mentionnant Ulanqab, c'était quand Kuaishou y construisait un centre de données : proche des centrales électriques, climat adapté pour un bon refroidissement. De plus, le prix de l'électricité verte dans l'ouest de la Chine est d'environ 0,2-0,3 yuan/kWh, soit seulement 1/5 à 1/4 de celui de l'Europe et des États-Unis.

Ce n'est pas seulement l'électricité verte de l'ouest qui est compétitive. Les données 2025 de l'Agence internationale de l'énergie montrent que la capacité totale installée de production d'électricité en Chine a dépassé 2300 GW, représentant environ 22 % du total mondial, première place mondiale ; environ 1300 GW pour les États-Unis. Plus crucial encore, la Chine possède la structure électrique la plus complète au monde : thermique, hydroélectrique, éolien, nucléaire, photovoltaïque, tous présents. Les données montrent que le prix industriel de l'électricité en Chine est maintenu à long terme entre 0,06 et 0,08 $/kWh. Le prix industriel de l'électricité en Californie approche déjà 0,18 $/kWh, et dans certaines parties de l'Allemagne, il dépasse même 0,25 $/kWh. Cela signifie qu'entraîner un cluster de dix mille cartes, en Chine, coûte naturellement des dizaines de points de pourcentage moins cher qu'en Europe et aux États-Unis.

Dans les coûts d'exploitation des grands modèles d'IA, le coût de l'électricité représente jusqu'à 60%-70 % du coût opérationnel total. Ce n'est pas seulement pour faire tourner le modèle qu'il faut de l'électricité, mais aussi pour le refroidissement, qui est un poste important. Le « monstre des infrastructures » a même construit des centres de données directement au fond de la mer, avec l'énergie éolienne offshore à proximité comme source d'électricité et l'eau de mer en circulation pour le refroidissement gratuit. Il y a aussi les grands projets comme « l'électricité de l'ouest envoyée à l'est » et « les calculs de l'est traités à l'ouest ». La capacité de régulation régionale de l'électricité et de la puissance de calcul est extrêmement forte. Le Guizhou, la Mongolie-Intérieure, le Ningxia sont déjà des nœuds clés de « l'est calcule, l'ouest traite », la voie est toute tracée pour déplacer les centres de calcul d'IA vers l'ouest.

Utiliser l'IA chinoise, c'est essentiellement utiliser une IA entraînée par un système énergétique plus compétitif – une IA plus économique, plus accessible. C'est l'une des raisons pour lesquelles les revenus à l'étranger de kimi, minimax, etc. ont explosé après le Nouvel An chinois. Ce n'est pas seulement que les algorithmes sont plus puissants, mais qu'ils bénéficient d'un avantage sur le prix de l'électricité.

Nvidia peut définir le prix de la puissance de calcul haut de gamme, mais DeepSeek et ses pairs s'emparent du pouvoir de fixation des prix des tokens. Vous pourriez dire : ce qui est bon marché en IA n'est pas de bonne qualité. L'IA est effectivement à la qualité, au prix. DeepSeek V4 a seulement réduit l'écart entre l'open source et le propriétaire au niveau le plus faible de l'histoire. L'entreprise reconnaît officiellement l'écart objectif avec les modèles de pointe comme GPT, et il n'est pas multimodal non plus : il peut reconnaître des images, mais ne peut pas en générer.

Mais cela n'a pas empêché la communauté de se tourner vers DeepSeek. La raison : la plupart des scénarios commerciaux réels n'ont pas besoin d'appeler à chaque fois le modèle le plus puissant au monde. Le conseil, le service client, le résumé, la traduction, la complétion de code, les bases de connaissances d'entreprise, les processus d'automatisation, tout cela ne nécessite pas l'intelligence la plus élevée, mais « un niveau suffisant + assez bon marché + assez stable ». Lorsque le coût d'inférence de DeepSeek V4 n'est qu'environ 1 % (Flash) à 11 % (Pro) de celui de GPT-5.5, une entreprise avec le même budget peut appeler des dizaines de fois plus de tokens, essayer plus de chaînes de prompts, itérer sur plus de flux de travail d'agents, et finalement produire un travail qui peut potentiellement être meilleur. Après tout, l'IA est elle-même un jeu de « probabilités ». Tant que c'est assez bon marché, s'arranger avec un niveau acceptable pour obtenir un résultat, pourquoi pas ?

Ainsi, plus l'IA est chère, plus la bon marchéé de DeepSeek a de la valeur, plus la société DeepSeek a de la valeur. Liang Wenfeng et ses investisseurs y voient plus clair que quiconque.

Questions liées

QPourquoi DeepSeek annonce-t-il une baisse permanente des prix de ses API, alors que la tendance générale de l'IA est à la hausse des coûts ?

ADeepSeek baisse ses prix de manière permanente pour affirmer sa compétitivité en matière de coûts et démontrer sa capacité à fournir des modèles de haute qualité à un prix accessible. Contrairement à la tendance générale où les prix de l'IA augmentent en raison de la demande croissante et de la pénurie de ressources en calcul, DeepSeek s'appuie sur des avantages systémiques tels que des coûts énergétiques plus bas en Chine, une main-d'œuvre spécialisée moins chère et une optimisation de l'infrastructure (comme l'utilisation de puces domestiques comme le Sheng Teng) pour réduire ses coûts opérationnels. Cette stratégie vise à rendre l'IA plus démocratique et à capturer des parts de marché en offrant une alternative économique.

QQuels sont les avantages concurrentiels de DeepSeek qui lui permettent de maintenir des prix bas ?

ALes avantages concurrentiels de DeepSeek incluent : 1) Des coûts énergétiques réduits grâce à l'accès à une électricité bon marché en Chine, en particulier l'énergie verte de l'Ouest, où les prix sont 5 à 4 fois inférieurs à ceux de l'Europe et des États-Unis. 2) Une main-d'œuvre spécialisée en IA relativement moins chère par rapport aux salaires élevés du marché mondial. 3) L'utilisation de technologies domestiques comme les puces Sheng Teng, réduisant la dépendance aux fournisseurs étrangers. 4) Une infrastructure optimisée, comme les centres de données situés dans des régions à climat froid (par exemple, en Mongolie-Intérieure) pour minimiser les coûts de refroidissement. 5) Une philosophie d'open source et de démocratisation de l'IA, alignée sur une stratégie commerciale à long terme.

QEn quoi la stratégie de DeepSeek diffère-t-elle de celle d'OpenAI et d'autres acteurs majeurs de l'IA ?

ALa stratégie de DeepSeek diffère de celle d'OpenAI et d'autres grands acteurs de l'IA par son approche centrée sur l'open source, la réduction des coûts et l'accessibilité. Alors qu'OpenAI et d'autres entreprises comme Anthropic et Google augmentent leurs prix et adoptent des modèles plus fermés, DeepSeek s'engage à maintenir des prix bas et à rendre ses modèles accessibles au plus grand nombre. De plus, DeepSeek mise sur des avantages structurels comme les coûts énergétiques bas et les technologies domestiques pour réduire ses dépenses, tandis que les acteurs traditionnels dépendent souvent d'infrastructures cloud coûteuses et de ressources en calcul internationales.

QQuels sont les défis auxquels DeepSeek pourrait être confronté en maintenant une stratégie de prix bas et d'open source ?

ALes défis pour DeepSeek incluent : 1) La difficulté à générer des revenus suffisants pour soutenir la recherche et le développement à long terme, surtout en comparaison avec des concurrents comme OpenAI ou des entreprises chinoises comme Kimi et MiniMax. 2) Le risque d'érosion de son avantage technologique, car l'open source permet à d'autres entreprises de raffiner et d'adapter ses modèles, réduisant potentiellement sa différenciation. 3) La pression concurrentielle croissante, notamment de la part d'acteurs internationaux qui pourraient développer des modèles open source similaires. 4) La nécessité de maintenir une qualité élevée tout en réduisant les coûts, ce qui pourrait limiter ses capacités à rivaliser avec les modèles de pointe fermés.

QComment l'avantage énergétique de la Chine influence-t-il la compétitivité des entreprises d'IA comme DeepSeek ?

AL'avantage énergétique de la Chine influence fortement la compétitivité des entreprises d'IA comme DeepSeek en réduisant significativement les coûts opérationnels. La Chine dispose d'électricité industrielle à bas prix (environ 0,06 à 0,08 USD/kWh contre 0,18 USD/kWh en Californie et plus de 0,25 USD/kWh en Allemagne), en particulier dans les régions de l'Ouest où l'énergie verte est abondante et peu coûteuse. De plus, des projets comme 'West-East Electricity Transfer' et 'East Data West Computing' optimisent la distribution de l'énergie et des ressources de calcul. Ces avantages permettent à DeepSeek de former et d'exploiter des modèles d'IA à un coût bien inférieur à celui de ses concurrents internationaux, renforçant ainsi sa capacité à offrir des services à bas prix tout en maintenant une qualité compétitive.

Lectures associées

Trois ans plus tard : Retour sur mon jugement de 2023 concernant ChatGPT

Trois ans après ses prédictions sur ChatGPT en mars 2023, Wang Jianshuo revient sur ses vingt affirmations initiales, évaluées en mai 2026 par des agents IA. Sur les vingt points, la majorité des tendances de fond étaient correctes : l'essor du RAG comme architecture dominante pour l'injection de connaissances, le rôle central de l'interface utilisateur en langage naturel (LUI), l'émergence de protocoles pour un "réseau d'agents", et le rattrapage technologique rapide des modèles chinois. Des erreurs notables portent sur des chiffres précis, comme les 100 billions de paramètres supposés de GPT-4 (en réalité environ 1,8 billion) ou une estimation trop basse des coûts de formation des grands modèles. Certaines prévisions se sont révélées trop absolues ("l'IA ne fera jamais de mathématiques pures") ou ont négligé les disparités (aucune vague de chômage massif, mais un impact sévère sur les jeunes diplômés). L'analyse révèle que les intuitions sur les mécanismes et les directions se sont avérées bien plus fiables que les prédictions numériques ou temporelles, souvent trop optimistes à court terme. La prudence dans les formulations et la reconnaissance des incertitudes se sont montrées précieuses avec le recul. Ce bilan offre des leçons pour les futurs pronostics : privilégier les tendances aux chiffres, anticiper les effets distributifs et accepter que certaines questions demandent plus de trois ans pour être tranchées.

marsbitIl y a 7 h

Trois ans plus tard : Retour sur mon jugement de 2023 concernant ChatGPT

marsbitIl y a 7 h

Trois ans plus tard : un retour sur mes prédictions de 2023 concernant ChatGPT

Trois ans après ses prédictions sur le ChatGPT en mars 2023, Wang Jianshuo revient sur ses 20 affirmations initiales. Évaluées en mai 2026 par des agents IA, la plupart de ses intuitions sur les grandes tendances se sont révélées justes : le RAG est devenu l'architecture standard pour intégrer des connaissances, l'Interface Utilisateur en Langage Naturel (LUI) a créé un nouvel écosystème, et les modèles chinois ont presque rattrapé les leaders mondiaux. Des concepts comme les réseaux d'agents et la nature limitée du test de Turing se sont également matérialisés. Cependant, les prévisions quantitatives et les affirmations trop absolues ont souvent échoué. Le paramétrage supposé du GPT-4 (100T) était inexact, et les coûts de développement des modèles ont dépassé les estimations. Il a sous-estimé la vitesse de personnalisation des IA et l'impact distribué sur l'emploi des jeunes. La capture de valeur a surtout bénéficié à la couche matérielle (comme Nvidia), et non aux seules applications. Les leçons clés sont que les mécanismes et les directions sont plus fiables que les chiffres précis, que l'optimisme à court terme doit être tempéré, et que les nuances ("peut-être", "pour l'instant") rendent les prédictions plus robustes. Cette rétrospective souligne l'importance de distinguer les tendances confirmées des questions toujours ouvertes.

链捕手Il y a 10 h

Trois ans plus tard : un retour sur mes prédictions de 2023 concernant ChatGPT

链捕手Il y a 10 h

Du Token à la main-d'œuvre machine : l'IA passe d'outil à « travailleur »

Alors que l'IA écrit du code, traite des tickets clients et révise des documents juridiques, elle ne se contente plus d'être un outil mais devient une source directe de travail. La commercialisation de l'IA évolue ainsi d'un marché de « jetons » (tokens) ou d'heures de GPU vers un nouveau marché : celui de la « main-d'œuvre machine ». Dans ce marché, le jeton n'est qu'une unité de mesure, le GPU un intrant, et le modèle un outil de production. L'objet véritablement tarifé et échangé est le travail économique accompli directement par le logiciel. Le mécanisme de prix de l'IA devrait évoluer des jetons bruts vers des capacités de modèles standardisées, puis vers une main-d'œuvre sectorielle, et enfin vers un marché de résultats programmables. À l'avenir, les entreprises pourraient ne plus se soucier du modèle ou du GPU spécifique utilisé, mais uniquement du fait que la tâche soit livrée dans des délais, avec un taux de précision, une fiabilité et un coût conformes aux standards. Ce changement ne signifie pas un simple remplacement du travail humain. Alors que la machine assume des tâches standardisées et vérifiables, le rôle humain pourrait se déplacer vers la supervision, la responsabilité finale, la gestion du contexte et les jugements critiques. Dans certains cas, les 1% de jugement humain final pourraient gagner en valeur, car ils permettent de débloquer les 99% d'automatisation à grande échelle. Le marché évolue donc vers une couche où le « travail » lui-même devient l'unité stable, standardisée, vérifiable et négociable. La prochaine phase de concurrence ne portera pas seulement sur la puissance des modèles ou le prix du calcul, mais sur la capacité à standardiser, vérifier et tarifer le « travail » accompli, faisant de la main-d'œuvre machine une nouvelle ressource productive que l'on peut acheter, facturer et échanger.

marsbitIl y a 11 h

Du Token à la main-d'œuvre machine : l'IA passe d'outil à « travailleur »

marsbitIl y a 11 h

La réduction de 99% du prix de Xiaomi MiMo n'est pas un coup marketing ! Luo Fuli répond aux détracteurs sur X

Dans un article intitulé "La réduction de 99% du prix de MiMo de Xiaomi n'est pas du marketing ! Luo Fuli répond aux détracteurs sur X", Luo Fuli, responsable de MiMo, a publié un billet de blog technique de 5000 mots pour expliquer la baisse drastique des prix de l'API MiMo-V2.5. Contrairement aux interprétations initiales d'une guerre des prix ou d'une stratégie de perte, cette réduction de 99% concerne spécifiquement le coût des entrées en cache ("Input Cache Hit"), c'est-à-dire la relecture du contexte historique dans les conversations longues. Le billet détaille six piliers d'ingénierie ayant permis cette réduction : 1. **Architecture Hybride SWA** : Réduction du volume de la mémoire cache (KVCache) à 1/7 grâce à une attention par fenêtre glissante sur 60 des 70 couches du modèle. 2. **Gestion en double pool** : Allocation efficace de la mémoire pour matérialiser les gains théoriques du SWA, multipliant par 5 le nombre d'utilisateurs simultanés par GPU. 3. **Cache de préfixe optimisé** : Augmentation du taux de réussite du cache à 93-95% en moyenne, évitant de recalculer les contextes répétés. 4. **Système de cache distribué GCache** : Stockage des données sur les SSD des machines GPU existantes, réduisant les coûts de stockage additionnels à zéro. 5. **Système de routage LLM-Router** : Optimisation de l'acheminement des requêtes pour maximiser l'utilisation du cache et améliorer les performances. 6. **Prédiction Multi-Token (MTP)** : Accélération de la génération des réponses du modèle, réduisant également les coûts de sortie. Cette chaîne d'optimisations systémiques a réduit le temps GPU par requête d'un ordre de grandeur, permettant une baisse de prix de 99% tout en maintenant une marge positive. Luo Fuli souligne qu'il s'agit d'un accomplissement d'ingénierie validé en production, et non d'une simple manœuvre marketing, offrant une référence pour réduire les coûts dans le secteur de l'IA.

marsbitIl y a 13 h

La réduction de 99% du prix de Xiaomi MiMo n'est pas un coup marketing ! Luo Fuli répond aux détracteurs sur X

marsbitIl y a 13 h

Trading

Spot
Futures
活动图片