Le secteur des grands modèles dans le monde est en proie à une frénésie de financement que les acteurs du secteur définissent comme "la veille de la purge".
Rien qu'en mai (mois pas encore terminé), trois transactions totalisant plus de 70 milliards de dollars ont afflué sur le marché chinois : Kimi a bouclé un financement d'environ 20 milliards de dollars début mai, StepFun aurait été proche de finaliser un financement d'environ 25 milliards de dollars, et DeepSeek, après avoir accepté un premier financement externe, a vu sa valorisation estimée entre 450 et 500 milliards de dollars.
Sur les marchés américain et européen, OpenAI, Anthropic ainsi que SpaceX (après fusion avec xAI) dirigée par Elon Musk devraient entrer en bourse cette année, les trois entreprises affichant une valorisation combinée de plus de 3 000 milliards de dollars.
Ce torrent de capitaux trans-Pacifique se déverse à une vitesse et une échelle sans précédent vers les derniers acteurs majeurs du secteur des grands modèles. Il est important de noter que toutes les entreprises n'arrivent pas à obtenir des fonds. Au contraire, pour la grande majorité, la musique s'est arrêtée.
Mais pour celles qui parviennent à lever des fonds, il s'agit peut-être du dernier train pour accéder à l'étape suivante.
01
Le jeu des chaises musicales entre dans sa phase finale
Depuis le début de l'année, le secteur chinois des grands modèles a remis deux rapports importants au marché des capitaux.
D'abord, le 8 janvier, Zhipu AI, fondé il y a six ans, a officiellement fait son entrée à la Bourse de Hong Kong. Avec un prix d'émission de 11,6 milliards de dollars HK par action, il a décroché le titre de "première action mondiale de grand modèle". Le premier jour, son cours a clôturé en hausse de 13,17 %, portant sa capitalisation à 579 milliards de dollars HK.
À peine un jour plus tard, MiniMax, fondé début 2022, a également été introduit à la Bourse de Hong Kong. Son cours a bondi de 109,09 % dès le premier jour, propulsant sa valorisation au-dessus des 1 000 milliards de dollars HK et établissant un nouveau record mondial de vitesse de création à l'introduction en bourse pour une entreprise d'IA.
De plus, après leur introduction, les cours de ces deux entreprises ont continué à monter. Au 15 mai, Zhipu AI était passé de son prix d'émission de 116,2 dollars HK à un maximum de 1 229 dollars HK, multipliant sa valeur par plus de 10 en quatre mois. MiniMax a également suivi une courbe de croissance quasi verticale.
Dans un rapport récent, JPMorgan a maintenu sa recommandation "surpondérer" pour ces deux entreprises, mais a émis un jugement plus mesuré : leur valorisation boursière intègre déjà l'hypothèse que Zhipu AI atteigne un chiffre d'affaires récurrent annuel (ARR) de 10 milliards de dollars d'ici fin 2026, et MiniMax, 7 milliards de dollars.
L'euphorie du marché secondaire s'est rapidement propagée au marché primaire.
Le 6 mai, il a été révélé que Moonshot AI (Kimi) était sur le point de finaliser un nouveau tour de financement d'environ 20 milliards de dollars, portant sa valorisation post-money à plus de 200 milliards de dollars. Ce tour était mené par Meituan Longzhu, avec la participation de China Mobile, CPE (CITIC Private Equity Funds Management), entre autres. Longzhu a investi plus de 2 milliards de dollars.
En comptant les trois tours de financement depuis fin de l'année dernière, Moonshot AI a levé plus de 39 milliards de dollars en six mois, avec un financement total dépassant 376 milliards de yuans, devenant ainsi l'entreprise startup de grands modèles ayant levé le plus de fonds en Chine.
Une autre star, DeepSeek, qui a créé une tempête dans le milieu mondial de l'IA en 2025 avec son modèle DeepSeek-R1, avait toujours suivi une ligne "sans financement externe". Mais ce printemps, le vent a tourné.
Selon le Wall Street Journal du 7 mai, DeepSeek cherchait à lever des dizaines de milliards de dollars auprès d'investisseurs soutenus par l'État, le Fonds national d'investissement de l'industrie de l'intelligence artificielle étant en négociations avancées pour participer.
Des sources informées ont révélé que Liang Wenfeng, le fondateur lui-même, prévoyait même de souscrire personnellement pour 200 milliards de yuans. Selon les estimations du secteur, la valorisation post-money pourrait dépasser les 500 milliards de dollars.
Par ailleurs, StepFun aurait été proche de finaliser un financement d'environ 25 milliards de dollars, ayant déjà démantelé sa structure VIE (Variable Interest Entity) pour se préparer à une introduction en bourse à Hong Kong. Parmi ses investisseurs figurent des entreprises de la chaîne d'approvisionnement en électronique grand public comme Huaqin, Longcheer et ZTE.
Shengshu Technology a successivement complété un tour Série A+ de plus de 6 milliards de yuans et un tour Série B d'environ 20 milliards de yuans en 2026, levant ainsi près de 26 milliards de yuans en moins de 4 mois.
Le fournisseur d'infrastructure native IA, InfiniFlow, a également annoncé officiellement le 7 mai avoir complété un tour Série B de plus de 7 milliards de yuans.
Si l'on tourne le regard de la Chine vers l'autre côté du Pacifique, les protagonistes de ce festin de capitaux sont encore plus imposants.
D'après les informations publiques actuelles, SpaceX prévoit d'entrer au NASDAQ en juin, avec une valorisation cible de 1 750 milliards de dollars, ce qui en ferait la plus grande introduction en bourse de l'histoire, dépassant Saudi Aramco. OpenAI prévoit une introduction au quatrième trimestre, avec une valorisation d'environ 852 milliards de dollars. Anthropic prévoit également d'entrer en bourse cette année, sa valorisation sur le marché secondaire dépassant déjà les 1 000 milliards de dollars.
Rien que dans les financements sur le marché primaire achevés en février et mars, OpenAI et Anthropic ont chacun absorbé des centaines de milliards de dollars. La valorisation combinée de ces trois géants dépasse les 3 000 milliards de dollars, dépassant de loin toute combinaison précédente d'introductions en bourse technologiques.
Cette série de chiffres en pleine croissance dessine un fait central : le capital se concentre à une vitesse irréversible vers un nombre extrêmement restreint d'acteurs majeurs du secteur.
Rétrospectivement, pendant la "guerre des cent modèles" en 2023, des centaines de startups rivalisaient sur la même scène. Mais en 2025, selon des statistiques médiatiques, les entreprises de la couche modèle IA n'ont réalisé que 22 levées de fonds, pour un montant total déclaré de 94 milliards de yuans. La part des financements de grands modèles dans l'investissement total en IA est passée de 51 % en 2024 à 14 %, signe que la "battle royale" du secteur a déjà éliminé plus de 90 % des acteurs.
Cependant, lorsque plus de 70 milliards de dollars ont afflué simultanément vers trois entreprises leaders en trois jours en mai 2026, le signal émis par le secteur est devenu clair : le capital ne vise plus à "transfuser" tout le secteur, mais à "faire le plein" pour les derniers participants en lice.
02
L'économie des usines à jetons
Cette vague de capitaux ne surgit pas de nulle part. Elle est portée par une double impulsion : la transformation de la voie technologique et la refonte de la logique de marché. Pour la comprendre, il faut l'envisager sous deux angles : les causes internes et externes.
Le récit du secteur a basculé fondamentalement au cours de la dernière année.
Avant 2024, l'histoire centrale des grands modèles était "qui a le plus de paramètres, qui est le plus intelligent", les fabricants rivalisant en brûlant de l'argent pour entraîner des modèles et mesurer leur plafond d'intelligence.
Mais l'émergence d'agents à long terme comme OpenClaw (surnommé "le homard") en février 2026 a ouvert la "boîte de Pandore" de la consommation de puissance de calcul. Un agent traitant une tâche complexe nécessite des dizaines, voire des centaines d'appels au modèle, faisant passer la consommation de jetons de quelques milliers pour un dialogue simple à des centaines de milliers, voire des millions.
Le secteur ne se compare plus sur le "plafond d'intelligence" des modèles, mais sur qui peut produire des masses de jetons de manière plus stable et à moindre coût. Comme l'a défini Jensen Huang, fondateur de NVIDIA, avec "l'économie des usines à jetons", il s'agit d'une révolution industrielle entraînée par l'explosion de la demande réelle, le déséquilibre structurel de l'offre et de la demande, et la compétition mondiale pour la puissance de calcul.
Les données de l'Administration nationale des données (Chine) illustrent clairement la brutalité de cette explosion : le volume quotidien d'appels de jetons en Chine est passé de 100 milliards début 2024 à 140 000 milliards en mars 2026, soit une multiplication par plus de 1 000 en deux ans.
Depuis début 2026, le segment de la puissance de calcul IA sur le marché actions A a augmenté de plus de 55 %. Les revenus mensuels des principaux acteurs des grands modèles ont dépassé les 10 milliards de yuans, certaines entreprises atteignant en 20 jours des revenus supérieurs à ceux de toute l'année 2025.
Le déséquilibre structurel du côté de l'offre a provoqué une violente dérive du pouvoir de fixation des prix des jetons vers l'amont.
La mémoire HBM à large bande passante est dominée par Samsung, SK Hynix et Micron, avec des cycles d'expansion de 24 à 36 mois, entraînant un déficit de plus de 40 % en 2026. Le coût de l'électricité représente plus de 60 % du coût de production des jetons, et la construction de l'infrastructure électrique pour les grands centres de données prend de 3 à 5 ans.
Cela introduit en réalité une "logique de premier principe" qui détermine aujourd'hui l'orientation du secteur des grands modèles : les grands modèles actuels ne sont plus seulement des logiciels, mais un hybride de "logiciel + cloud computing + industrie d'actifs lourds". Chaque conversation, recherche ou réponse d'un utilisateur brûle en temps réel du GPU et de l'électricité.
Lorsque le "coût marginal" du modèle ne tend plus vers zéro, celui qui possède le plus de ressources de calcul et peut produire des jetons au coût le plus bas détient le pouvoir de fixation des prix. Et la lutte pour ces ressources ne concerne pas l'algorithme, mais bel et bien l'argent.
Au niveau macro, les investissements colossaux des géants technologiques internationaux dans l'infrastructure IA ont également intensifié la mise sur les points de compétition actuels du secteur.
Selon les dernières directives en matière de dépenses en capital (capex) publiées par les entreprises lors de la saison des résultats du premier trimestre 2026, les dépenses en capital d'infrastructure IA de Microsoft pour l'année devraient atteindre 1 900 milliards de dollars. Alphabet a relevé ses prévisions de capex annuel à 1 800 - 1 900 milliards de dollars, révisant à la hausse par rapport à ses prévisions de février. Meta a également relevé ses prévisions le 29 avril lors de la publication de ses résultats, à 1 250 - 1 450 milliards de dollars, citant la hausse des prix des composants et des coûts de construction des centres de données. Amazon, quant à elle, maintient ses prévisions autour de 2 000 milliards de dollars.
En prenant la limite supérieure des prévisions, le capex combiné des quatre géants pour 2026 s'élève à environ 7 250 milliards de dollars. Il ne s'agit clairement pas seulement des dépenses d'un secteur, mais de la finalisation du système d'alimentation d'une nouvelle ère intelligente, de la mise en place du "réseau électrique" de calcul pour toutes les applications d'IA.
D'autre part, l'effet de fenêtre d'introduction en bourse apporté par certaines startups a également accéléré le rythme des financements sur le marché primaire VC (capital-risque) en Chine et aux États-Unis. En particulier, la flambée boursière de Zhipu AI et MiniMax après leurs introductions a établi une référence sur le marché secondaire pour "la valorisation des grandes entreprises de modèles". Cela a stimulé l'anxiété des entreprises non encore cotées quant à leur avenir. Si elles ne profitent pas de la fenêtre pour fixer leur prix, une fois que le marché se sera lassé et que les valorisations auront corrigé...
Ainsi, StepFun a accompli en quelques mois toutes les étapes, du démantèlement de sa structure VIE à la transformation en société par actions, en passant par la course à l'introduction à Hong Kong. Quant à la valorisation de Kimi, passée d'environ 43 milliards de dollars à plus de 200 milliards, elle reflète à la fois une amélioration des fondamentaux et l'accélération des capitaux pour s'assurer des parts dans la "prochaine entreprise à entrer en bourse".
03
La victoire future
D'un côté, la frénésie des capitaux ; de l'autre, la redirection des points de compétition. Le secteur s'accorde généralement à penser que la compétition future se concentrera principalement sur trois aspects.
Premièrement, la monétisation commerciale deviendra la "priorité absolue" de chaque entreprise.
Il faut reconnaître qu'un changement fondamental est en cours dans le secteur des grands modèles en 2026 : la "prime AGI" est en train de se refroidir.
Ces deux dernières années, la valorisation élevée des entreprises d'IA par le marché des capitaux reposait sur une prémisse clé implicite : la loi de mise à l'échelle (Scaling Law) reste valide, les capacités des modèles progressent rapidement avec l'investissement en puissance de calcul, et l'AGI n'est qu'une question de temps. Les investisseurs étaient prêts à accepter des pertes à court terme, à anticiper la "révolution de l'efficacité future" dans le cours actuel des actions.
Mais en 2026, l'IA progresse toujours, mais la forme de cette progression semble moins linéaire qu'avant – OpenAI a modifié ses principes, réduisant les mentions directes à l'AGI ; Demis Hassabis de DeepMind a également reconnu publiquement que les systèmes actuels présentaient encore des lacunes évidentes en matière d'apprentissage continu et de planification à long terme.
Désormais, l'attention du marché est passée de "Qui se rapproche le plus de l'AGI ?" à "Qui peut faire payer les clients ? Qui peut réduire les coûts d'inférence ? Qui peut survivre ?".
En effet, les signaux de commercialisation émis par certains acteurs majeurs sont déjà très clairs. Doubao de ByteDance, qui a longtemps adopté un modèle gratuit avec 345 millions d'utilisateurs actifs mensuels, a discrètement lancé sur l'App Store d'Apple une offre payante allant jusqu'à 5 088 yuans par an. OpenAI, quant à lui, a considérablement renforcé les capacités payantes de Codex pour les entreprises, tout en limitant activement l'utilisation de haut niveau par les utilisateurs gratuits.
Cela marque l'entrée de l'industrie mondiale des grands modèles dans une phase de maturité rationnelle, passant de "brûler de l'argent pour obtenir du trafic" à une phase où la compétition pivote de "quel modèle est le plus puissant" vers "quel modèle est le premier à générer des profits".
Deuxièmement, le coût de la puissance de calcul devient l'indicateur clé de performance ultime.
Avec le développement du secteur des grands modèles, dans un futur prévisible, les capacités d'inférence, les longs contextes et la multimodalité ne sont plus des remparts. Après que DeepSeek V4 a porté les modèles open source à un niveau proche de GPT-4, le secteur a pris conscience pour la première fois de manière systémique que les capacités des modèles elles-mêmes sont plus faciles à rattraper qu'on ne le pensait.
Alors que les modèles se "commoditisent" progressivement, le marché des capitaux commence à demander : à part le modèle, qu'avez-vous d'autre ?
Cela a accéléré le transfert du récit du secteur.
En 2023, on comparait "qui a plus de paramètres, un contexte plus long". Aujourd'hui, les entreprises commencent à parler des terminaux qu'elles contrôlent, des chaînes d'approvisionnement auxquelles elles sont liées, des points d'entrée utilisateurs qu'elles maîtrisent.
Dans son rapport de recherche, JPMorgan note que la valorisation de Zhipu AI intègre déjà l'hypothèse d'un ARR d'environ 10 milliards de dollars d'ici fin 2026. Dans ce nouveau cadre d'évaluation, la valeur d'une entreprise ne se juge plus seulement à ses scores de benchmark, mais à ses clients, à la santé de sa trésorerie, au nombre de scénarios payants ouverts, et au degré d'irremplaçabilité qu'elle a construit auprès de ses partenaires.
Troisièmement, l'explosion des agents et la divergence des voies.
L'année 2026 est largement considérée comme l'année d'explosion des agents. Alors que nous observons le nombre et la vitesse de lancement des agents par les fabricants, il est plus pertinent de se concentrer sur la future divergence entre les voies B2B et B2C.
Une voie suit la direction de l'"intégration dans le processus de production", misant sur l'amélioration certaine de la productivité ; l'autre s'oriente vers les scénarios réels de la vie personnelle, misant sur l'état d'esprit (mindshare) et l'échelle à long terme.
Les deux voies ne sont ni bonnes ni mauvaises, mais elles impliquent des rythmes de consommation de capitaux et des exigences de maturité du modèle commercial radicalement différents. Servir les clients entreprises nécessite de former un triangle de fer entre fiabilité, intégration et sécurité, ce qui est une construction de confiance à long terme. Les scénarios B2C, quant à eux, dépendent de l'effet boule de neige des données et du renforcement par l'état d'esprit des utilisateurs, coûteux au début mais générant un effet d'échelle extrêmement fort par la suite.
Dans un contexte de facture de calcul élevée et de concentration des financements à un niveau sans précédent, la capacité à créer une boucle vertueuse et une trésorerie positive sur sa propre voie déterminera directement le classement après la "veille de la purge" de 2026.
04
Conclusion
Pour les investisseurs d'aujourd'hui, il ne s'agit plus d'un choix à option multiple sur "quel secteur investir", mais d'un jeu de redistribution de "mise finale" sur un nombre limité de principaux acteurs. La voie technologique, le choix des scénarios, l'endurance financière – ces trois variables détermineront ensemble qui restera à table et qui sera éliminé.
À une époque où les modèles se commoditisent de plus en plus, le facteur décisif réel n'est peut-être plus seulement la capacité technologique elle-même, mais la manière de transformer cette capacité en un service que les clients sont prêts à payer continuellement, de convertir l'investissement en puissance de calcul en un rendement vérifiable, et de faire d'un produit une entreprise saine.
Cet article provient du compte WeChat "Dongjian New Research" (ID : DJXYS-0309), auteur : Chen Wen





