Année de l'inflation de la puissance de calcul : Plus DeepSeek est abordable, plus cette hausse des prix sera difficile à arrêter
Ces trois dernières semaines, les trois principaux fournisseurs de cloud chinois — Alibaba Cloud, Baidu AI Cloud et Tencent Cloud — ont annoncé des hausses de prix de 20 à 30 % sur leurs services d’IA, malgré une baisse mondiale des coûts de calcul. Ce mouvement s’explique par le « paradoxe de Jevons » : la chute des coûts unitaires (notamment avec des modèles comme DeepSeek-R1) a déclenché une explosion de la demande, en particulier avec l’émergence des agents IA et des modèles de raisonnement, qui consomment bien plus de tokens.
Bien que les poids des modèles soient open source, les optimisations logicielles de推理 (comme le speculative decoding) restent maîtrisées par les grands acteurs du cloud, creusant l’écart de performance. Chaque cloud a sa stratégie : Alibaba vise la rentabilité, Baidu sélectionne sa clientèle, Tencent rattrape sa marge et VolEngine (ByteDance) profite de sa capacité d’absorption interne pour attirer les clients.
Une conséquence inattendue : les grandes entreprises, face à des factures mensuelles élevées, envisagent désormais davantage l’auto-hébergement de leur infrastructure. La hausse pourrait durer de 2 à 3 ans, le temps que l’efficacité des puces chinoises rattrape celle de Nvidia. En attendant, les fournisseurs de cloud verrouillent leurs tarifs à la hausse. La vraie compétitivité, pour les entreprises, consistera à optimiser leur consommation de tokens.
marsbitIl y a 37 mins