Auteur : Recherche Chaoxiang
Lorsqu'un agent IA est activé, il n'attend pas une simple réponse. Il doit rechercher des informations, planifier des étapes, appeler des outils, raisonner sur des résultats intermédiaires, rappeler des modèles, et enfin exécuter des actions. L'ensemble de ce processus nécessite une puissance de calcul CPU bien supérieure à celle d'une simple conversation avec ChatGPT.
L'équipe dirigée par l'analyste David Dai de Bernstein a publié le 17 juin un rapport intitulé « Semiconducteurs mondiaux : Renaissance du CPU ? ». L'analyse centrale est que l'IA évolue de l'ère des chatbots vers l'ère de l'IA agentique, et que le rôle du CPU dans les datacenters passe de celui d'accompagnateur du GPU à celui de protagoniste. Cela devrait propulser le marché adressable total (TAM) du CPU serveur à 223 milliards de dollars d'ici 2030, soit 6 fois les 37 milliards de dollars de 2025.
L'inférence n'est plus une « question-réponse unique », le CPU est en train de renverser la vapeur
Depuis l'essor des grands modèles de langage, le GPU/accélérateur IA a été le cœur du calcul IA. Dans les clusters d'inférence dédiés comme le Google TPU v6e et le Meta Grand Teton, le ratio GPU/CPU a atteint 8:1.
Mais Bernstein estime qu'avec l'IA agentique devenant dominante, ce ratio s'inverse.
La caractéristique essentielle de l'IA agentique est la « boucle d'inférence » : une seule requête peut déclencher une recherche, une planification, un appel d'outil, un raisonnement intermédiaire, un nouvel appel de modèle, une exécution d'action. Le GPU s'occupe des calculs mathématiques intensifs, mais le CPU détermine si le système peut orchestrer efficacement le flux de travail, planifier les tâches, gérer la mémoire et éviter l'inactivité des accélérateurs. Si le CPU est trop faible, les GPU coûteux seront forcés d'attendre, et l'efficacité globale du système en pâtira considérablement.
Bernstein prédit que le ratio GPU:CPU dans les clusters d'inférence des CSP passera de 8:1 en 2025 à 1:1 d'ici 2029. Dans les charges de travail d'IA agentique, la part de calcul du CPU bondira de 14% dans les LLM traditionnels à 50%, à égalité avec le GPU.
Le rapport souligne que les feuilles de route matérielles confirment déjà cette direction. Le nouveau « compute tray » Venice d'AMD associe 1 CPU à 4 GPU MI455X, le super-puce Vera de Nvidia associe 1 CPU Vera à 2 GPU Rubin, et l'unité d'extension Google TPU v7x associe 1 CPU à 4 TPU. Le ratio physique des CPU est déjà en train de remonter, ce n'est pas une prédiction, c'est un fait en train de se produire.
Comment est calculé un marché de 223 milliards de dollars ?
Bernstein a relevé sa prévision de TAM du CPU serveur pour 2030 de 137 à 223 milliards de dollars, en s'appuyant sur les hypothèses clés suivantes :
- Les dépenses en capital (CAPEX) IA atteindront 3 500 milliards de dollars en 2030, correspondant à un déploiement de 70 GW de datacenters IA.
- Le marché des accélérateurs IA atteindra 1 600 milliards de dollars, soit 45% du CAPEX des datacenters IA.
- La part de l'inférence passera de 35% à 70%, avec un ratio CPU:GPU de 1:1 en scénario d'inférence et de 0.5:1 en scénario d'entraînement.
- Le prix unitaire du CPU équivaut à 13% de celui du GPU.
Dans ce cadre, le TAM de 223 milliards de dollars comprend 174 milliards de dollars provenant des charges de travail d'IA agentique et 49 milliards de dollars provenant des CPU serveurs traditionnels non-IA. Par rapport aux niveaux actuels, en 2025, l'ensemble du marché du CPU serveur ne représente que 37 milliards de dollars, dont seulement 6 milliards liés à l'IA. Cela signifie que, selon les prévisions de Bernstein, le marché du CPU connaîtra une expansion multipliée par 6 au cours des cinq prochaines années, avec un taux de croissance annuel composé (TCAC) de 43%, ce qui est presque sans précédent dans l'histoire de l'industrie des semiconducteurs. Bernstein donne également des fourchettes de scénarios haussier (330 milliards de dollars, hypothèse d'un CAPEX IA de 4 000 milliards + ratio d'inférence de 1.5:1) et baissier (137 milliards de dollars, hypothèse d'un CAPEX de 3 000 milliards + ratio d'inférence de 0.5:1).
Une vérification croisée intéressante provient du nombre de cœurs CPU serveur : les données d'Arm montrent que l'IA agentique nécessite 120 millions de cœurs CPU par GW, soit 4 fois plus qu'un datacenter traditionnel. Sur cette base, le déploiement IA de 70 GW en 2030 nécessiterait 8,4 milliards de cœurs CPU, correspondant à un TAM CPU IA de 168 milliards de dollars, ce qui coïncide largement avec le modèle précédent.
Pourquoi Arm est le plus grand gagnant ? Ce n'est pas seulement de l'IP, ils fabriquent des puces maintenant
Bernstein désigne Arm comme le bénéficiaire structurel de la renaissance du CPU. L'architecture Arm, avec son rapport performance par watt, devient de plus en plus attractive dans les datacenters IA. L'instance AWS Graviton offre un rapport prix/performance 40% supérieur et une consommation 60% inférieure par rapport aux instances x86.
Plus crucial encore, en mars 2026, Arm a annoncé une transformation stratégique : passer d'un simple fournisseur de licences IP à un fabricant autonome de CPU, visant un chiffre d'affaires puces de 150 milliards de dollars d'ici 2030. Le CPU AGI d'Arm a déjà verrouillé Meta comme premier client et co-développeur, avec OpenAI, Cerebras, Cloudflare, etc. comme partenaires. Bernstein relève ainsi son EPS ajusté pour l'exercice 2030 d'Arm à 11,79 dollars (contre 9,83 dollars précédemment) et estime que ses prévisions de revenus puces pourraient atteindre 220 milliards de dollars, dépassant l'objectif d'Arm lui-même. Sur la base d'un PER de 42x, l'objectif de cours est fixé à 500 dollars (contre 300 dollars auparavant).
Cela entraîne également une révision à la hausse de l'objectif de cours de SoftBank (détenant environ 90% d'Arm) de 8 200 à 11 200 yens, impliquant une hausse potentielle de 58%. L'évaluation de SoftBank par Bernstein est basée sur une décote de 30% sur la valeur nette d'inventaire (NAV) de ses actifs détenus, la décote s'étant réduite par rapport à précédemment, reflétant l'augmentation de la valeur des actions Arm et l'amélioration des activités propres de SoftBank.
AMD, Intel, Hygon : Qui en bénéficie ?
AMD (Surpondéré, objectif 600 $) : Ses produits restent leaders au sein du camp x86 et devraient continuer à gagner des parts de marché. Son modèle existant intègre déjà des hypothèses CPU solides. Après un roulement de la valorisation sur la moyenne CY27/28, l'objectif de cours est relevé à 600 $.
Intel (À la hauteur du marché, objectif 100 $) : Bénéficiera d'une demande de CPU serveur plus robuste et plus durable, avec des prévisions de bénéfices substantiellement relevées. Bernstein passe les hypothèses de son modèle Intel d'un scénario conservateur à un scénario aligné avec l'industrie, relevant l'objectif de cours de 65 $ à 100 $.
Hygon Information (Surpondéré, objectif 450 RMB) : Bernstein estime que la demande chinoise en CPU x86 dépassera la croissance mondiale. La part de marché d'Hygon sur le marché chinois des CPU serveur continuera de s'étendre, dépassant 35% d'ici 2030, avec non seulement des clients gouvernementaux et d'État, mais aussi une pénétration croissante auprès des CSP. L'objectif de cours est fortement relevé de 280 RMB à 450 RMB.
Source des données : Bernstein
Analyse Chaoxiang
Dans l'argumentaire de Bernstein, le maillon le plus faible ne se situe peut-être pas du côté de la demande, mais de l'offre.
Le rapport reconnaît en note de bas de page qu'« il évalue encore si les capacités des fonderies et de la mémoire sont suffisantes pour soutenir la croissance du CPU », ce qui constitue la plus grande incertitude du rapport. Porter le TAM du CPU de 37 à 223 milliards de dollars implique qu'il faudra environ 30 milliards de dollars supplémentaires de capacité de production de CPU par an d'ici 2030.
Les capacités 3nm/5nm de TSMC sont déjà saturées par les accélérateurs IA et les puces pour smartphones. Le rapport ne fournit pas de cartographie précise de la capacité pour déterminer si l'offre de production dédiée aux CPU serveur a assez d'élasticité. De plus, l'hypothèse centrale du rapport s'appuie sur l'orientation de Nvidia selon laquelle « les dépenses annuelles en infrastructure IA dépasseront 1 000 milliards de dollars en 2027 », ce qui est déjà la prévision la plus optimiste des vendeurs. Utiliser cela comme point de départ de la demande pour un autre rapport d'analyse comporte le risque d'un empilement d'attentes.
Un autre signal à surveiller : le CPU Vera de Nvidia utilise une architecture Arm développée en interne. Cela signifie que Nvidia pourrait jouer à la fois le rôle de partenaire et de concurrent d'Arm dans le domaine des CPU, ce qui pourrait affecter subtilement la capacité d'Arm à atteindre sa part de marché prévue de 54% à long terme.
Pour les investisseurs attentifs, la valeur de ce rapport ne réside pas seulement dans un objectif de cours spécifique. Il fournit un cadre d'analyse clair : si vous croyez que l'IA agentique est la véritable prochaine étape, la configuration du CPU doit être réévaluée, passant de « suffisamment bonne » à une valorisation stratégique. Cela signifie que la carte d'investissement dans les semiconducteurs doit évoluer d'une focalisation exclusive sur le GPU vers un récit plus équilibré CPU+GPU.
Avertissement sur les risques
Cet article est une synthèse et une interprétation par Chaoxiang Research d'un rapport d'analyse d'un courtier tiers. Les notations, objectifs de cours, prévisions de bénéfices et jugements connexes cités dans le texte sont les opinions de l'analyste de ce courtier, ne représentent que la position de son institution, ne reflètent pas le point de vue de Chaoxiang Research et ne constituent en aucun cas une recommandation d'investissement.







