Ces vingt dernières années, l'internet chinois n'a fait qu'une chose : tenter de regrouper le plus de capacités possible dans une entreprise surpuissante.
Tencent s'est lancé dans les réseaux sociaux, puis dans les paiements, les jeux, le cloud computing ; Alibaba dans le e-commerce, puis la logistique, la finance, le divertissement ; Baidu dans la recherche, puis les cartes, les voitures autonomes, et la course aux grands modèles de langage.
La logique de l'époque était de régner en maître absolu. Celui qui possédait le plus de portails d'entrée et d'utilisateurs était le gagnant.
Mais lorsque l'on rassemble plusieurs nouvelles récentes apparemment isolées, le vent a complètement tourné.
Baidu prévoit de scinder Kunlunxin pour une introduction en bourse à Hong Kong, avec une valorisation cible d'environ 500 milliards de dollars.
Qu'est-ce que cela signifie ? Actuellement, la capitalisation boursière totale de Baidu est d'environ 360 milliards de dollars. Une filiale qui vaut près de 40 % de plus que la maison mère.
Quasi simultanément, T-Head, filiale d'Alibaba, aurait également un projet d'introduction en bourse indépendante.
Ce qui est encore plus révélateur, c'est que The Information rapporte que Tencent est devenu un client important de Kunlunxin.
Parallèlement, selon le rapport, Kunlunxin a posé une condition extrêmement stricte lors de ses roadshows : pour souscrire à des actions lors de l'IPO, il faut d'abord s'engager à acheter des puces pour un montant représentant 3 à 7 fois le montant souscrit. « Pour être actionnaire, il faut d'abord être client ».
Beaucoup voient cela comme un simple jeu d'argent. Mais selon moi, ces événements indiquent ensemble un changement de logique fondamentale pour l'internet chinois.
Hier, les géants construisaient leurs douves par la fermeture et le monopole ; aujourd'hui, ils doivent s'ouvrir et se spécialiser pour atteindre une échelle significative.
I. Les puces passent du gouffre financier à la machine à billets
Pourquoi les grands groupes se lançaient-ils dans les puces auparavant ?
La réponse est simple : pour économiser de l'argent.
Baidu devait entraîner ses algorithmes de recherche et ses grands modèles, et développer ses propres puces coûtait moins cher que d'acheter chez Nvidia ; Alibaba devait soutenir son énorme infrastructure cloud, et fabriquer ses propres puces permettait de réduire les coûts matériels.
Auparavant, les départements puces relevaient de la R&D au sein du groupe, des centres de coûts purs. Ils dépensaient mais ne généraient pas directement de revenus. Il était donc logique de les garder en interne pour un usage propre.
Aujourd'hui, ce calcul a été refait.
L'émergence des agents (Agent) a fait prendre conscience à toute l'industrie d'une réalité cruelle : la consommation la plus effrayante de l'IA ne se situe pas dans la R&D des grands modèles, mais dans l'inférence à haute fréquence.
Chaque réponse de l'IA, chaque exécution de tâche par un Agent, chaque génération de code, consomme frénétiquement des tokens. À la base des tokens, il y a les GPU, les puces d'inférence, le réseau et les centres de données.
Lorsque le nombre d'utilisateurs côté application franchit un seuil d'explosion, les appels d'API se transforment en un flux de trésorerie bien réel. Ainsi, un département de développement matériel autrefois cantonné en interne et peu visible acquiert soudainement un modèle économique indépendant et attrayant : les puces elles-mêmes deviennent une affaire très lucrative.
Selon des informations publiques, la puce Kunlun P800 a achevé sa validation à grande échelle, a livré plusieurs clusters de dizaines de milliers de cartes depuis 2025, et a permis d'entraîner ERNIE 5.1 sur des clusters entièrement produits localement. Sa liste de clients s'est rapidement étendue de l'usage interne de Baidu à China Mobile, Geely, China Southern Power Grid, China Merchants Bank, et Tencent.
Lorsque le département puce passe d'un centre de coûts à une activité génératrice de revenus, la scission et l'indépendance ne sont plus seulement un outil financier, mais une nécessité stratégique incontournable.
II. Le fait que Tencent achète les puces de Baidu est plus important que l'introduction en bourse elle-même
Dans le rapport de The Information, l'apparition de Tencent est le détail le plus riche en tension dramatique.
Ces vingt dernières années, les géants de l'internet chinois ne s'échangeaient presque rien au niveau de l'infrastructure. Le cloud d'Alibaba ne se vendait pas à Tencent, la technologie de Tencent n'utilisait pas les couches basses de Baidu. Chaque entreprise refaisait sa propre roue, de la manière la plus coûteuse.
Aujourd'hui, Tencent commence à acheter les puces Kunlunxin de Baidu. Cela marque la première formation d'une véritable division du travail mature dans l'industrie chinoise de l'IA.
L'infrastructure de l'ère de l'IA est trop chère. Le cycle de R&D des puces est long, les investissements en capital lourds, les barrières à l'entrée en termes de talents élevées. Si les grands groupes ne les fabriquent que pour leur usage interne, les économies d'échelle ne seront jamais atteintes, et le coût unitaire d'une puce ne pourra être amorti.
Finalement, si l'on veut tout fabriquer soi-même, on finit par ne rien bien fabriquer.
Ainsi, le secteur commence à bouger. L'achat de puces Kunlunxin par Tencent signifie que les principaux acteurs commencent à accepter une idée : le meilleur écosystème d'IA ne nécessite pas de tout contrôler en circuit fermé.
Cela ressemble beaucoup à Apple et Samsung dans le secteur de la téléphonie mobile. Ils se livrent une concurrence féroce sur le marché des terminaux, mais l'écran OLED, composant clé de l'iPhone, dépend toujours des usines de Samsung.
L'achat par un concurrent est le plus haut niveau de validation. Si Tencent est prêt à confier une partie de sa base de puissance de calcul à Kunlunxin, cela signifie que les puces d'IA chinoises ont passé le test le plus rigoureux, celui de la pratique, au point qu'un concurrent les juge utilisables et fiables.
III. Les marchés financiers commencent à revaloriser la puissance de calcul
Kunlunxin a été fondée en 2011. Pourquoi accélère-t-elle soudainement son introduction en bourse en 2026 ?
La réponse ne se trouve pas chez Baidu, mais dans le changement de cible des marchés financiers.
Il y a cinq ans, les puces d'IA n'étaient qu'une ligne de dépenses de R&D dans les rapports financiers des grands groupes. Sans un volume commercial suffisant, les marchés financiers n'auraient jamais accordé une valorisation élevée à une entreprise de matériel.
Aujourd'hui, tout a changé. Nvidia, Samsung, SK ont tous brisé des mythes boursiers, fixant un nouveau point d'ancrage aux marchés financiers mondiaux : les plus grands gagnants de l'ère de l'IA sont souvent ceux qui vendent les pelles.
Surtout avec l'explosion des agents (Agent) et des applications multimodales cette année, la demande d'inférence connaît une croissance exponentielle. Tout l'univers de l'investissement commence à recalculer la valeur des entreprises d'IA. Hier, on parlait de paramètres et de scores ; aujourd'hui, on ne calcule plus que le coût par token, l'efficacité de l'inférence et le taux d'utilisation des centres de données.
Pour la première fois, l'infrastructure d'IA possède un modèle de retour sur investissement extrêmement clair et viable.
Kunlunxin n'a pas soudainement décidé d'entrer en bourse aujourd'hui. C'est qu'aujourd'hui seulement, les marchés financiers ont enfin compris, et sont prêts à fixer un prix suffisamment élevé aux puces d'IA chinoises.
En fait, cela est devenu une longue marche collective du capital. T-Head d'Alibaba lance son introduction en bourse indépendante ; Cambricon a fait ses preuves sur le marché boursier chinois ; les entreprises chinoises de GPU comme Biren, Moore Threads, Moore Threads, MetaX, et Enflame sont également entrées dans de nouveaux cycles d'IPO.
Ces dernières années, le défi le plus difficile pour les entreprises chinoises de puces était de prouver qu'elles pouvaient fabriquer des produits et que quelqu'un les utiliserait.
Aujourd'hui, cette étape est passée. Elles doivent maintenant prouver autre chose : à part Nvidia, qui peut devenir la base de puces chinoises de l'ère de l'IA ?
IV. La guerre de certitude des géants mondiaux
En élargissant la perspective au monde, on s'aperçoit que tous font exactement la même chose.
Pourquoi OpenAI fabrique-t-il ses propres puces ? Essentiellement parce que le volume d'appels de ses utilisateurs mensuels actifs est énorme, et chaque appel coûte de l'argent réel. Développer ses propres puces, même pour améliorer les performances par watt de seulement 20 %, pourrait économiser des milliards de dollars par an. Plus important encore, ils savent que leur destin ne peut dépendre d'un seul fournisseur, Nvidia.
Regardez les autres géants. Le TPU de Google en est à sa 8e génération, c'est le système de puces maison le plus mature au monde ; Amazon a Trainium et Graviton ; Microsoft a Maia ; Meta a MTIA.
Tous les principaux acteurs mondiaux de l'IA ont étendu leurs tentacules vers le matériel le plus fondamental.
La raison est extrêmement directe. Le coût de l'inférence est la plus grande dépense unique d'une entreprise d'IA. Celui qui peut réduire les coûts matériels verra son modèle économique devenir réellement viable. De plus, lorsque l'on contrôle à la fois l'architecture du grand modèle et celle de la puce, l'optimisation conjointe logicielle/matériel que l'on peut réaliser constitue une barrière que l'achat de GPU externes génériques ne pourra jamais atteindre.
L'IPO de Kunlunxin n'est qu'un signal. Elle annonce que l'infrastructure d'IA chinoise sort officiellement des jardins secrets des grands groupes pour entrer sur le marché public.
V. La dimension de la concurrence s'enfonce radicalement
Ces deux dernières années, tout le monde parlait de GPT, Claude, DeepSeek. On pensait instinctivement que les paramètres et les scores des grands modèles étaient toute la concurrence en IA.
Mais aujourd'hui, les modèles ressemblent de plus en plus à des systèmes d'exploitation. Ils sont cruciaux, mais ils ne sont plus la seule variable qui détermine le vainqueur.
Ce qui déterminera vraiment combien d'argent une entreprise d'IA pourra gagner à l'avenir, et combien de temps elle survivra, ce sont des indicateurs plus fondamentaux, plus arides :
Qui peut réduire au maximum le coût d'un token unique ? Qui a l'efficacité de cluster d'inférence la plus élevée ? Qui peut disposer d'un approvisionnement continu et non perturbé en puissance de calcul ?
2023 était la guerre des modèles, on comparait qui était le plus intelligent ; 2024 était la guerre des applications, on comparait qui était le plus utile.
En 2025-2026, la guerre s'est enfoncée au niveau le plus bas. La concurrence mondiale en IA entre officiellement dans une guerre d'usure des infrastructures.
Mot de [Hors des marges] :
Par le passé, nous avions l'habitude de voir les géants de l'internet chinois avec une perspective d'empire et de monopole.
Ils étaient comme des trous noirs dévorant tout, étendant leurs tentacules dans chaque recoin, tentant d'achever toutes leurs boucles commerciales au sein de leurs propres murs élevés. C'était vingt ans où les grands groupes devenaient de plus en plus grands, et les écosystèmes de plus en plus fermés.
Mais la scission de Kunlunxin et de T-Head, et la commande de Tencent, mettent fin à cette ère de leurs propres mains.
Derrière cela, ce n'est pas le déclin de Baidu ou d'Alibaba, mais un destin inévitable : la chaîne industrielle de l'IA est tout simplement trop vaste, trop vaste pour qu'aucune super-entreprise puisse à elle seule absorber l'intégralité de l'infrastructure.
Les modèles évoluent chaque jour, les applications se renouvellent tous les trois mois, mais les puces, le réseau et les centres de données sous-jacents, une fois construits, forment une base industrielle pour dix ans.
Aujourd'hui, en surface, on dirait que Baidu et Alibaba « démontent leur maison ». Mais en réalité, c'est l'internet chinois qui achève un processus de découplage qui dure depuis vingt ans.
À l'ère de l'internet, les grands groupes devenaient de plus en plus grands. À l'ère de l'IA, les grands groupes deviennent au contraire de plus en plus petits.
Ils commencent à libérer leurs capacités pour former une industrie plus grande.
Cet article provient du compte WeChat public : Hors des marges, auteur : Huahua





