Rédaction : Chaoxiang Research
Le 4 juin à l'aube, SemiAnalysis, l'institut de recherche indépendant le plus influent de l'industrie des semi-conducteurs, a publié un bulletin du matin.
L'information principale tenait en une seule phrase : la capacité DRAM SOCAMM par baie du NVL72 Vera Rubin de Nvidia pourrait passer des 55TB environ précédemment anticipés à environ 28TB. La majorité des systèmes Rubin adopteraient des modules SOCAMM de 96GB, et non les 192GB généralement attendus par le marché.
Une fois la nouvelle diffusée, la réaction du marché fut simple et brutale : demande de mémoire divisée par deux, c'est négatif pour Micron. MU a plongé de plus de 10% en séance, passant du record historique de 1089$ atteint la veille à 971$, effaçant plus de 100 milliards de dollars de capitalisation en une seule journée.
La panique était réelle, mais la question est : était-elle justifiée ?
D'abord, faisons le calcul
Le Vera Rubin NVL72 est le futur supercalculateur IA phare de Nvidia par baie. Chaque baie contient 72 GPU Rubin et 36 CPU Vera. Les GPU utilisent de l'HBM4, 288GB par puce, soit environ 20.7TB par baie, cette partie ne change pas. Ce qui change, c'est du côté des CPU.
Chaque CPU Vera est équipé de 8 emplacements SOCAMM, chacun pouvant accueillir des modules de capacités différentes. Les spécifications officielles dévoilées par Nvidia au CES 2026 indiquent "jusqu'à 1.5TB de LPDDR5X par CPU Vera", correspondant à la configuration avec 8 modules de 192GB. Avec 36 CPU, cela fait 54TB.
Le rapport de SemiAnalysis dit ceci : La configuration de livraison réelle ne sera probablement pas au maximum. La plupart des systèmes utiliseront des modules de 96GB, 8×96GB=768GB par CPU, soit environ 28TB pour les 36 CPU.
De 55TB à 28TB, la capacité est presque divisée par deux, ce qui donne des titres accrocheurs du type "demande de mémoire divisée par deux".
Mais dans ce calcul, le marché s'est trompé sur une variable clé.
Les failles de la logique panique
Premièrement, le SOCAMM est un design à emplacement (slot), il n'est pas soudé.
C'est le détail technique le plus facilement ignoré dans toute cette histoire. Contrairement à la LPDDR soudée sur la carte mère des GB300 Blackwell Ultra, la plateforme Vera Rubin adopte des modules SOCAMM2 standardisés par le JEDEC, amovibles, remplaçables à chaud, et pouvant être mis à niveau ultérieurement. Aujourd'hui avec 96GB, demain si le client en a besoin, on peut remplacer par du 192GB voire du 256GB, aussi simplement que changer des barrettes de mémoire.
Nvidia l'a spécifiquement souligné au CES 2026 : le temps d'assemblage du plateau de calcul est passé de 2 heures à 5 minutes. La modularité, la maintenabilité et l'évolutivité sont parmi les plus grandes évolutions architecturales de Vera Rubin par rapport à Blackwell.
Réduire la configuration de livraison initiale n'équivaut pas à une disparition permanente de la demande. Cela ressemble plus à une stratégie de "monter à bord maintenant, payer le supplément plus tard".
Deuxièmement, la raison de la réduction de capacité n'est pas un manque de besoin, mais "un manque de disponibilité".
Dylan Patel, le fondateur de SemiAnalysis, a tweeté une phrase lourde de sens : "J'aime beaucoup une chose, c'est que ceux qui relayent notre rapport omettent la majeure partie de son contenu. Cela arrive souvent."
Les commentaires des lecteurs sur Digg à propos de cette nouvelle sont également révélateurs : 77,8% des commentaires estimaient que la diffusion secondaire était du sensationnalisme décontextualisé.
Qu'est-ce qui a été omis ? Le contexte.
En 2026, l'offre mondiale de LPDDR5X est extrêmement tendue. Micron l'a clairement indiqué fin mai lors de la conférence Wolfe : la demande de mémoire dépasse significativement les capacités de production, une situation qui devrait durer au-delà de 2026. La capacité HBM de l'exercice fiscal 2026 de Micron est déjà entièrement vendue, le prix moyen du DRAM a augmenté de plus de 110% en glissement annuel, et la marge brute a bondi à 74%. Samsung et SK Hynix sont également en pleine production et ventes.
Dans ce contexte, le problème de Nvidia n'est pas que les clients ne veulent pas plus de mémoire, mais qu'"ils ne peuvent pas obtenir suffisamment de puces LPDDR5X pour remplir chaque emplacement".
Réduire la configuration SOCAMM par défaut par baie est essentiellement une gestion de la chaîne d'approvisionnement au niveau de l'ingénierie : Plutôt que de retarder la livraison de toute la baie à cause d'une pénurie de mémoire, il vaut mieux expédier d'abord avec une configuration plus basse, pour mettre la puissance de calcul en ligne plus rapidement.
Ce n'est pas un signal de contraction de la demande, bien au contraire, c'est un signal que la demande écrase l'offre.
Troisièmement, moins de mémoire ≠ moins de baies.
Le marché a fait une simple multiplication : mémoire par baie divisée par deux → demande totale divisée par deux. Mais cette équation a une autre variable : les volumes d'expédition.
Si le SOCAMM par baie passe de 55TB à 28TB, Nvidia, avec les mêmes contraintes d'approvisionnement en LPDDR5X, peut assembler plus de baies. Un lot de mémoire qui suffisait pour 100 baies peut maintenant en servir près de 200.
La consommation totale de LPDDR5X n'a pas diminué, elle est simplement répartie sur plus de baies. Pour Nvidia, c'est un choix pragmatique pour déployer Rubin plus rapidement sur le marché ; pour les fabricants de mémoire, le volume total de commandes ne diminue pas forcément.
De plus, la demande de mémoire côté CPU pour les scénarios d'inférence est très élastique. Toutes les charges de travail n'ont pas besoin de 1,5 To de LPDDR5X. L'entraînement de grands modèles consomme effectivement beaucoup de mémoire, mais pour de nombreuses tâches d'inférence, notamment l'IA agentique et l'inférence à contexte long, le cache KV peut être géré de manière flexible entre la HBM et la LPDDR via NVLink-C2C. Pour beaucoup de clients, 768 Go de mémoire côté CPU suffisent déjà.
Alors pourquoi Micron a quand même chuté de 10% ?
Parce que le rapport de SemiAnalysis n'était que la deuxième paille qui a brisé le dos du chameau.
La première paille était Broadcom. Le 4 juin, avant l'ouverture des marchés américains, Broadcom a publié ses résultats du Q2. Les chiffres en eux-mêmes n'étaient pas mauvais : chiffre d'affaires de 22,19 milliards de dollars, en hausse de 48% sur un an, EPS Non-GAAP de 2,44$ supérieur aux attentes. Mais le PDG Tan Hock Eng n'a pas relevé l'objectif de revenus annuels de 1000 milliards de dollars pour les puces IA, le marché a trouvé cela "insuffisant". L'action Broadcom a chuté de 15%, entraînant une baisse collective de tout le secteur des semi-conducteurs.
Il n'y avait aucune nouvelle négative spécifique à Micron ce jour-là. Plusieurs médias comme TipRanks, Motley Fool, 24/7 Wall St. ont clairement indiqué qu'il s'agissait d'une chute "collatérale" en réaction. Micron, en tant qu'acteur clé de la chaîne de valeur mémoire pour l'IA, est fortement corrélé au sentiment sur les dépenses en capital de l'IA. L'orientation de Broadcom a poussé le marché à réévaluer les taux de croissance attendus de toute la chaîne d'approvisionnement des puces IA.
Le rapport de SemiAnalysis s'est propagé le même jour, offrant aux traders qui cherchaient déjà une raison de vendre un récit parfait : non seulement le sentiment général sur l'IA s'affaiblit, mais même les chiffres concrets de la demande mémoire se contractent.
Une action à mille milliards de dollars de capitalisation, qui a bondi de 900% au cours de l'année écoulée, venait d'atteindre un record historique la veille. À ce niveau, tout titre négatif est un catalyseur de prises de bénéfices. La panique n'a pas besoin d'être correcte, elle a juste besoin d'un prétexte.
Analyse de Chaoxiang
Trois jugements.
Premièrement, le rapport de SemiAnalysis est exact en lui-même, mais l'interprétation qu'en fait le marché est erronée. La configuration SOCAMM par défaut du NVL72 Rubin sera très probablement inférieure au maximum théorique, c'est une réalité dictée à la fois par les contraintes de la chaîne d'approvisionnement et l'élasticité de la demande client. Mais entre "configuration par défaut réduite" et "contraction de la demande mémoire", il y a une architecture modulaire à mise à niveau amovible, et une réalité industrielle où la demande dépasse largement l'offre.
Deuxièmement, le risque principal de Micron actuellement n'est pas dans le SOCAMM, mais dans l'HBM4. SemiAnalysis avait déjà rapporté en février que dans les commandes HBM4 pour la plateforme Rubin de Nvidia, la part de Micron était nulle, SK Hynix prenant 70% et Samsung 30%. Bien que Micron ait annoncé la production en série de l'HBM4 en mars, sa part de marché estimée n'est que de 18%. En revanche, la position de Micron dans le domaine SOCAMM est très solide : c'est le premier fabricant à avoir lancé un SOCAMM2 de 256 Go, et un partenaire clé de Nvidia pour la solution SOCAMM depuis cinq ans. L'impact réel de la réduction de configuration SOCAMM sur Micron est bien inférieur à celui de la marginalisation de sa part sur l'HBM4.
Troisièmement, la nature de cette chute est une prise de bénéfices sur une action à mille milliards de dollars après un record historique, amplifiée par deux catalyseurs indépendants. Broadcom a fourni le choc émotionnel, SemiAnalysis a fourni la munition narrative. Leur combinaison a fait reculer de 10% une action qui a été multipliée par 10 au cours des 12 derniers mois. D'un point de vue transactionnel, cela ne s'appelle pas de la "panique", cela s'appelle du "normal".
Le tweet de Dylan Patel a raison : la plupart de ceux qui ont relayé son rapport ont effectivement omis la partie la plus importante de celui-ci.
La chose la plus dangereuse dans l'investissement en semi-conducteurs n'est pas de se tromper de direction, mais de bien lire le titre, mais de se tromper dans le calcul de la formule.






