Au cours des trois dernières années, l'histoire de la puissance de calcul IA s'est presque entièrement concentrée sur le GPU.
Du H100 et H200 de Nvidia, aux GB200, GB300, en passant par les clusters de centaines de milliers de cartes que les fournisseurs de cloud s'arrachent pour étendre – tous les récits industriels racontent la même chose : le goulot d'étranglement de la puissance de calcul se situe au niveau du GPU. Dans cette histoire, le CPU a longtemps été considéré par défaut comme un rôle « d'accompagnement » moins important, suivant le GPU pour s'occuper des tâches que ce dernier ne veut pas faire.
Mais à partir de 2026, ce récit commence à se fissurer.
Le 1er juin, Intel a lancé à Pékin le processeur Xeon 6+, spécialement conçu pour les charges de travail cloud native, d'IA agent et intensives en réseau. Il s'agit du premier CPU pour centres de données fabriqué en technologie Intel 18A.
Dans la description qu'en fait Intel, le Xeon 6+ n'est pas un simple « accompagnement » du GPU, mais le « plan de contrôle » de l'infrastructure IA, responsable de l'orchestration, de la concurrence et du flux des données.
« La voie de l'expansion de l'IA ne réside pas dans l'ajout de composants, mais dans le fonctionnement collaboratif du système. », a déclaré Kevork Kechichian, vice-président exécutif d'Intel et directeur général du groupe Data Center and AI, lors de la conférence. « Alors que l'IA entre dans l'ère des agents, l'orchestration, la concurrence et le flux des données deviennent les nouveaux facteurs limitants. Cela renforce à nouveau un fait central : le CPU reste le plan de contrôle de l'infrastructure IA moderne. »
Ce n'est pas seulement le jugement d'Intel. En février de cette année, le cabinet de recherche indépendant SemiAnalysis a publié un rapport intitulé « The CPU Comeback », une cartographie des CPU pour centres de données en 2026, dont le jugement était tout aussi direct. Alors que l'entraînement et l'inférence IA se déploient à grande échelle, le CPU est à nouveau nécessaire d'une manière radicalement différente de celle des trois dernières années.
Mais ce « retour » doit être examiné de près. Il ne s'agit pas du CPU qui redevient le personnage principal, mais du CPU qui est redéfini dans une nouvelle position.
I. Les fissures du narratif centré sur le GPU
Pour comprendre pourquoi le CPU « revient », il faut d'abord revenir aux changements en cours dans la nature même des charges de travail IA.
Ces deux dernières années, le récit dominant de la puissance de calcul IA était l'entraînement. La taille des grands modèles augmentant de quatre à dix fois par an, l'entraînement nécessitait un volume colossal de calculs parallèles, domaine où le GPU était incontestablement le roi. Mais l'entraînement n'est pas la totalité des charges de travail IA.
Selon l'analyse d'Intel lors de la conférence, l'ensemble des charges de travail de calcul IA peut être grossièrement divisé en trois catégories :
La première catégorie concerne les charges de travail fondamentales. Le stockage, les bases de données, le Web, les microservices, le CDN – ce ne sont pas de l'IA, mais ce sont les services de base nécessaires au fonctionnement de l'IA. Cette partie reste le champ de bataille traditionnel des CPU.
La deuxième catégorie est l'entraînement. L'entraînement des modèles de pointe dépend presque entièrement des GPU et des accélérateurs dédiés. C'est la partie qui a fait l'objet de toutes les convoitises ces trois dernières années.
La troisième catégorie est l'inférence et les agents intelligents. Cette partie est en croissance rapide, et diffère significativement de l'entraînement.
La différence clé de la troisième catégorie réside dans la forme de la charge de travail elle-même. L'entraînement est le processus de « calcul » d'un modèle à partir de rien, avec un parallélisme extrême et un besoin énorme en puissance de calcul de pointe ponctuelle. Mais l'inférence et les agents intelligents, ce n'est pas cela – il s'agit de déployer le modèle déjà entraîné pour qu'il fonctionne dans des applications réelles.
Cela signifie qu'une grande partie du travail n'est pas du « calcul », mais de l'orchestration : planifier la collaboration de plusieurs modèles, gérer le contexte, coordonner les flux de données entre différents agents, traiter les requêtes concurrentes des utilisateurs, garantir une latence prévisible.
Ces tâches, le GPU n'y est pas doué.
« Dans ce scénario, nous observons des charges de travail qui combinent une accélération de niveau GPU, mais dont le cœur reste traditionnellement basé sur le CPU. », a déclaré Kevork Kechichian.
Derrière cela se cache un fait industriel plus concret. SemiAnalysis donne un exemple dans son rapport « CPU Comeback » : dans le centre de données « Fairwater » que Microsoft a construit pour OpenAI, un bâtiment CPU et stockage de 48 mégawatts soutient un cluster GPU de 295 mégawatts.
Autrement dit, pour que ce cluster GPU de 295 mégawatts fonctionne réellement, il faut des milliers de CPU à côté pour traiter les flux de données au niveau pétaoctet générés par les GPU, planifier les tâches, gérer le stockage.
Plus la puissance de calcul du GPU est poussée, plus grand est le « besoin de puissance de calcul périphérique » qu'il génère. Et ces besoins en puissance de calcul périphérique finissent par retomber sur le CPU.
En résumé, le retour du CPU n'est pas un « le CPU redevient plus rapide que le GPU ». C'est que lorsque la forme de la puissance de calcul IA passe de « l'entraînement d'un grand modèle » à « l'exécution de milliers d'agents intelligents », l'orchestration et le flux des données redeviennent le goulot d'étranglement. Le GPU ne peut pas résoudre cela, le CPU peut.
C'est l'autre facette, négligée dans le récit de l'IA des trois dernières années.
II. Sur quelle voie le Xeon 6+ parie-t-il ?
Le pari d'Intel se reflète dans la définition du produit Xeon 6+.
Le chiffre le plus parlant est : jusqu'à 288 cœurs, et tous sont des cœurs efficaces (E-core).
Les E-core et P-core sont la bifurcation architecturale qu'Intel a opérée sur les CPU ces dernières années. Les P-core sont les cœurs performance, visant l'excellence de la performance monocœur, l'objectif traditionnel des CPU serveurs. Les E-core sont les cœurs efficaces, moins performants individuellement, mais plus petits, moins gourmands en énergie, permettant d'en intégrer davantage sur la même surface de puce.
Le Xeon 6+ pousse cette bifurcation à l'extrême. 288 cœurs efficaces. Cela signifie qu'Intel mise sur « combien de cœurs peut-on mettre sur un CPU » plutôt que sur « la vitesse de chaque cœur ».
La logique de cette définition de produit est la suivante : les charges de travail de l'IA agent ne sont pas une question de vitesse monocœur, mais de capacité à exécuter simultanément des milliers de tâches légères. Lorsqu'un serveur doit orchestrer simultanément des centaines d'agents, traiter des milliers de requêtes d'inférence, maintenir des dizaines de milliers de connexions concurrentes, la capacité de débit de 288 E-core est bien plus importante que la performance monocœur de 64 P-core.
C'est une définition de produit à contre-courant. Depuis des décennies, le récit dominant des CPU serveurs était la performance monocœur : fréquence plus élevée, IPC plus fort, cache plus grand. La voie des E-core reconnaît essentiellement que ce récit est peut-être terminé.
Mais plusieurs éléments doivent être pris en compte.
Premièrement, la voie des E-core n'est pas exclusive à Intel. AMD avait lancé Bergamo en 2023, basé sur des cœurs Zen 4c optimisés pour la densité. Les séries Graviton d'AWS et AmpereOne d'Ampere suivaient déjà la voie « cœurs haute densité + priorité à l'efficacité énergétique ». Dans sa feuille de route AmpereOne Aurora dévoilée en 2024, Ampere annonçait déjà 512 cœurs.
Autrement dit, le Xeon 6+ représente pour Intel un rattrapage d'une direction industrielle déjà existante – Intel n'est pas le leader, mais un joueur qui revient dans une direction industrielle.
Deuxièmement, le Xeon 6+ est le premier CPU pour centres de données en technologie Intel 18A, ce qui, dans le contexte d'Intel, est peut-être plus important que « 288 cœurs E-core ».
Intel 18A est le plus gros pari d'Intel ces dernières années. Il ne s'agit pas seulement d'un CPU, mais de savoir si Intel Foundry, l'activité de fonderie d'Intel, pourra s'imposer. Si le procédé 18A ne peut pas livrer un produit compétitif, l'histoire d'Intel Foundry ne tiendra pas.
Le Xeon 6+, fabriqué en 18A, portant le nombre de cœurs efficaces à 288, annoncé comme « leader de l'industrie en densité de performance », c'est l'une des réponses qu'Intel présente au marché. Sera-t-il accepté par le marché ? Pourra-t-il tenir face à la concurrence de la même génération, comme le N2 de TSMC ou le 2 nm de Samsung ? C'est une autre question.
Troisièmement, la liste des clients du Xeon 6+ comprend des noms significatifs d'un point de vue industriel – Ericsson le teste pour son cœur de réseau 5G, et T-Systems, filiale de Deutsche Telekom, l'utilise pour construire son infrastructure privée d'IA agent. Ces deux clients sont des acheteurs traditionnels et stables de CPU pour centres de données, leur choix d'achat est en soi un signal de marché.
En combinant ces trois éléments, le Xeon 6+ parie sur la voie suivante : obtenir un avantage énergétique grâce au procédé 18A, obtenir une densité de cœurs grâce aux 288 E-core, et miser sur les charges de travail de type « haute densité, haute efficacité énergétique, haut débit » dans les scénarios d'inférence IA et d'agents intelligents.
Ce n'est pas l'histoire d'un CPU qui revient sur le devant de la scène du calcul, mais d'un CPU qui trouve une nouvelle place.
III. Ce récit est-il vraiment valable ?
Le récit de ce « retour du CPU » prôné par Intel, est-il vraiment valable ? Il faut examiner plusieurs autres variables dans l'industrie.
La première variable est la réaction des fabricants de GPU.
Nvidia a également travaillé ces deux dernières années sur des éléments liés à « l'orchestration ». La combinaison Grace CPU + Hopper GPU est en soi la manière dont Nvidia comble la partie CPU. Si les fabricants de GPU eux-mêmes rendent la solution globale « CPU + GPU » dominante, la place des fabricants de CPU indépendants en sera réduite. C'est l'adversaire principal du récit d'Intel selon lequel « le CPU est le plan de contrôle » – pas AMD, mais Nvidia lui-même.
La deuxième variable est le développement de CPU sur-mesure par les fournisseurs de cloud.
AWS Graviton est déjà déployé à grande échelle dans les centres de données d'AWS, prenant en charge une part significative des charges de travail de calcul générique internes. Microsoft développe Cobalt, Google Axion, Alibaba Yitian, presque tous les principaux fournisseurs de cloud développent leurs propres CPU serveurs basés sur l'architecture ARM.
Ces CPU sur-mesure suivent également la voie « haute densité, priorité à l'efficacité énergétique » – ce qui les place en concurrence directe avec le Xeon 6+ en termes de définition de produit.
Autrement dit, le marché que le Xeon 6+ cherche à conquérir, les fournisseurs de cloud sont en train de le fabriquer eux-mêmes. Intel doit prouver qu'il existe un marché suffisamment important en dehors des CPU sur-mesure des cloud providers. Par exemple, les opérateurs télécoms, les clouds privés, les centres de données sectoriels verticaux.
La troisième variable est le procédé 18A lui-même.
Le Xeon 6+ étant le premier CPU pour centres de données en Intel 18A, cela signifie que cette puce porte une signification industrielle bien au-delà du produit lui-même. Si le procédé 18A rencontre des problèmes de rendement en production, de stabilité des performances ou de validation client, les performances commerciales du Xeon 6+ en pâtiront. À l'inverse, si le 18A est stable, le Xeon 6+ pourrait au contraire offrir un répit à Intel Foundry.
Mais le 18A n'évolue pas dans le vide – le procédé N2 de TSMC entrera en production en deuxième moitié d'année 2026, le 2 nm de Samsung est également en approche. Intel 18A ne cherche pas seulement à « réussir », mais à « réussir et rester en tête », ce qui est une norme plus élevée.
En combinant ces trois variables, la réussite finale du Xeon 6+ ne dépend pas seulement de lui-même, mais aussi de savoir si Nvidia s'appropriera le rôle du CPU, si les fournisseurs de cloud continueront à développer leurs propres CPU, et si Intel 18A tiendra face à la concurrence de la même génération de TSMC et Samsung.
C'est pourquoi, concernant cette affaire de « retour du CPU », du point de vue du jugement industriel, c'est valable, mais du point de vue de la capacité d'Intel à capter ce regain, cela reste une inconnue.
La bataille pour la place du CPU sur la scène du calcul IA dure depuis trois ans.
Le scénario des trois dernières années était « le GPU au centre, le CPU en accompagnement ». Ce scénario commence à s'effriter en 2026 – pas parce que le CPU redevient plus rapide que le GPU, mais parce que la nature même du calcul IA change. Alors que l'IA passe de « l'entraînement d'un modèle » à « l'exécution de milliers d'agents intelligents », l'orchestration, la concurrence, le flux des données redeviennent les goulots d'étranglement du système, et le CPU redevient incontournable dans cette position.
Intel a parié sur cela, et le Xeon 6+ est sa réponse. Mais la validité de ce pari, et la capacité d'Intel lui-même à en tirer profit, ne trouveront finalement une réponse que dans les salles informatiques des clients en 2027 et 2028. AMD, le camp ARM, les CPU sur-mesure des cloud providers, Nvidia fabriquant ses propres CPU – chaque variable peut changer le cours du scénario.
Le retour du CPU est réel, mais qui dirigera ce retour n'est pas encore déterminé.






