Alors que des applications d'IA phénoménales comme DeepSeek, Seedance 2.0 se déploient les unes après les autres, la demande mondiale en puissance de calcul s'envole à une vitesse qui dépasse largement les prévisions. Cependant, derrière cette course aux armements en matière de calcul, la chaîne industrielle des infrastructures d'IA (AI Infra) rencontre des obstructions systémiques sans précédent. De l'équipement central de fabrication des puces à un simple câble en cuivre dans un centre de données, en passant par les matériaux spéciaux et les salles blanches, presque chaque maillon critique affiche un « feu rouge ».
Les quatre "murs" du développement de la puissance de calcul
Le développement de la puissance de calcul de l'IA n'est pas une simple amélioration des performances des puces, mais un projet d'ingénierie complexe impliquant le calcul, le stockage, la transmission et l'énergie.
(一) Mur de la mémoire : La première entrave à l'ère de l'inférence de l'IA
Actuellement, l'industrie de l'IA passe de la formation de grands modèles à l'inférence, et on prévoit qu'en 2026, la demande mondiale d'inférence de l'IA dépassera celle de la formation. L'explosion de la demande côté inférence de l'IA tire directement les besoins en mémoire à haute bande passante (HBM) et en DRAM de grande capacité.
Bien que les principaux fabricants de puces mémoire prévoient d'augmenter leur capacité de production, il faut au moins deux ans entre l'investissement et la mise en service effective des lignes de production, ce qui détermine que la situation de pénurie sera difficile à résoudre à court terme. Les nouvelles capacités seront principalement libérées en 2027 et au-delà, et en 2026, le secteur présentera un déséquilibre structurel entre une demande en croissance rapide et une offre qui tarde à se matérialiser.
(二) Mur de la bande passante : "L'obstruction des capillaires" du flux de données
La vitesse d'amélioration de la puissance de calcul dépasse largement la vitesse de transmission des données. Cette contradiction a conduit à un grave problème de "mur de la bande passante" — le flux de données à l'intérieur des puces, entre les puces, à l'intérieur des baies et entre les centres de données est devenu le goulot d'étranglement des performances de l'ensemble du système de calcul.
Le goulot d'étranglement actuel de la bande passante est multi-niveaux : à l'intérieur de la puce, la latence et la consommation d'énergie des interconnexions entre transistors ne cessent d'augmenter ; entre les puces, l'interconnexion traditionnelle sur carte PCB ne peut plus répondre aux besoins de haute bande passante et de faible latence entre les puces d'IA ; à l'intérieur de la baie, la bande passante d'interconnexion entre serveurs devient une contrainte pour la montée en puissance (Scale Up) ; entre les centres de données, la bande passante et la latence sur de longues distances limitent l'extension (Scale Out) et l'efficacité de l'allocation de la puissance de calcul transrégionale.
Selon les estimations, dans les clusters d'entraînement d'IA actuels, l'énergie consommée pour le déplacement des données dépasse déjà celle consommée par le calcul lui-même. Comment fluidifier les "capillaires" du flux de données, réduire la latence de transmission et la consommation d'énergie est un problème que le développement de l'IA Infra doit résoudre.
(三) Mur du calcul : La fabrication de puces haut de gamme est une contrainte fondamentale
L'itération des performances des puces d'IA dépend fortement des procédés de fabrication avancés, et la capacité de production des procédés avancés est entièrement tributaire des équipements de fabrication haut de gamme en amont, en particulier des machines de lithographie EUV (ultraviolet extrême).
Actuellement, seule ASML dans le monde est capable de produire des machines de lithographie EUV, dont la capacité est extrêmement limitée et soumise à de strictes contrôles à l'exportation. Cela entraîne directement une grave pénurie de capacité de production pour les procédés avancés en dessous de 7 nm, incapables de satisfaire la demande explosive de puces d'IA. NVIDIA, leader mondial des puces d'IA, voit les livraisons de ses puces haut de gamme comme le H100, le H200, etc., contraintes par la capacité de production en procédés avancés de TSMC, avec des délais de livraison de plusieurs mois, voire plus d'un an.
Plus grave encore, la fabrication de puces est une chaîne industrielle hautement mondialisée, et la rupture d'un seul maillon affecte l'ensemble de la production. Des matières premières comme les résines photosensibles, les cibles, les gaz spéciaux électroniques, aux équipements clés comme les machines de gravure et de dépôt, il existe différents degrés de monopole et de limitations d'approvisionnement. Cela fait de la capacité de fabrication de puces haut de gamme le goulot d'étranglement le plus difficile à surmonter dans la chaîne industrielle de l'IA Infra.
(四) Mur électrique : Un défi à court terme relativement maîtrisable
Comparé aux trois précédents, le mur électrique est un goulot d'étranglement relativement plus facile à résoudre. Les centres de données d'IA sont de grands consommateurs d'énergie ; la consommation annuelle d'électricité d'un très grand parc de centres de données peut même dépasser celle d'une ville moyenne de plusieurs centaines de milliers d'habitants. Actuellement, la consommation électrique totale des centres de données dans le monde représente 2 % à 3 % de la consommation électrique mondiale et continue d'augmenter. Mais le problème de l'électricité est essentiellement un problème d'infrastructure, qui peut être résolu par des moyens d'approvisionnement énergétique diversifiés comme les turbines à gaz, les piles à combustible, le photovoltaïque, etc.
À long terme, avec le développement des technologies d'énergie renouvelable et l'amélioration des infrastructures énergétiques, l'approvisionnement en électricité ne deviendra pas le plus grand goulot d'étranglement au développement de la puissance de calcul de l'IA à moyen et long terme. Mais dans certaines régions, en raison du retard dans la construction des réseaux électriques, des pressions d'approvisionnement à court terme existent encore et pourraient limiter la vitesse de construction des centres de données.
Le "tueur invisible" de l'expansion : Pénurie généralisée des équipements et des matériaux
La vitesse d'expansion de la production de puces d'IA est bien inférieure aux attentes, la contrainte centrale n'étant pas les puces elles-mêmes, mais la pénurie généralisée des équipements et des matériaux en amont.
(一) La demande en équipements de test croît rapidement
La mise à niveau technologique des puces d'IA augmente les exigences de précision et d'efficacité des équipements de test. Par rapport aux puces logiques ordinaires, le nombre de ports de signal des GPU d'IA explose, consommant plus de ressources de canaux de signal des testeurs ; parallèlement, le nombre de transistors augmente considérablement, ce qui entraîne une augmentation correspondante de l'échelle des vecteurs de test et de la durée de test par puce. Plus crucial encore, dans le domaine de l'électronique grand public, seule une certaine proportion des puces est testée, mais pour les puces d'intelligence artificielle, toutes les puces doivent être testées à 100 %, et généralement à travers plusieurs étapes, pour garantir le fonctionnement normal de l'ensemble du jeu de puces. Sous l'impulsion forte de la demande en puissance de calcul de l'IA, combinée à l'explosion du marché de la mémoire, les équipements de test semi-conducteurs (ATE) sont presque devenus la catégorie à la croissance la plus rapide en termes de volume d'expédition dans tout le secteur des équipements semi-conducteurs.
Le plus grand fournisseur mondial d'équipements de test de puces, Advantest, a également indiqué qu'il prévoyait un record historique pour l'exercice se terminant en mars 2026, avec des revenus attendus en hausse de 37 % et un bénéfice net plus du double de celui de l'année précédente.
(二) Substrat IC / substrat d'emballage : Le maillon "goulot" plus cher que la puce
De manière surprenante, le plus gros point de douleur dans la chaîne d'approvisionnement des fabricants de puces de premier plan comme NVIDIA n'est pas la puce elle-même, mais le substrat IC (substrat d'emballage). Le substrat IC est un composant clé connectant la puce et la carte PCB, jouant un rôle de connexion électrique et de support physique. Les puces d'IA exigent énormément du substrat IC — une surface plus grande, une densité de câblage plus élevée, de meilleures performances de dissipation thermique et une perte de signal plus faible. Cela signifie aussi que sa valeur doit nécessairement être bien plus élevée qu'un PCB ordinaire. Selon les estimations, le coût du substrat IC représente environ 50 % du coût total de l'emballage, et dans les emballages avancés flip-chip, cette proportion peut même atteindre 70 à 80 %. Selon la résine choisie, les substrats IC sont principalement divisés en substrats BT et substrats ABF. Les substrats BT sont principalement utilisés pour les diverses puces mémoire ; tandis que l'ABF est plus concentré sur les puces logiques, comme les CPU, GPU, FPGA, ASIC, etc.
Selon des statistiques incomplètes, depuis 2025, le prix des substrats IC a augmenté de plus de 30 % cumulé. La hausse des prix a deux raisons principales : premièrement, la transmission des coûts des matières premières en amont, les tissus de verre haut de gamme, les feuilles de cuivre et autres matières premières clés sont en pénurie continue depuis 2025, l'écart de capacité ne cessant de se creuser ; deuxièmement, l'explosion de la demande pour l'emballage avancé 2.5D/3D, les GPU et autres puces haut de gamme utilisant普遍ement une architecture multicouches de puces, l'augmentation significative du nombre de couches et de la surface des puces pousse directement la demande de surface de substrat.
Contrairement aux PCB ordinaires, les substrats IC ont des barrières technologiques élevées et une grande complexité de processus, la capacité mondiale de production de substrats IC haut de gamme est principalement concentrée entre les mains de quelques fabricants taïwanais comme Unimicron Technology, Nan Ya Printed Circuit Board, etc., avec un cycle d'expansion de capacité长达 de 18 à 24 mois. Cela signifie que la situation de pénurie des substrats IC sera difficile à résoudre fondamentalement dans les deux prochaines années.
(三) Matériaux spéciaux clés : Le "glutamate monosodique industriel" extrêmement rare
Certains matériaux spéciaux, apparemment insignifiants, deviennent le "point faible fatal" de la chaîne industrielle de l'IA. La fibre de verre Low-CTE (faible coefficient de dilatation thermique), la feuille de cuivre spéciale, les forets haut de gamme et autres matériaux, bien que utilisés en petites quantités, sont le "glutamate monosodique industriel" indispensable à la fabrication de substrats IC et de cartes PCB haut de gamme.
La haute puissance et les hautes performances des puces d'IA exigent que les substrats et les cartes PCB utilisent des matériaux avec un coefficient de dilatation thermique très bas pour éviter toute déformation dans des environnements de travail à haute température. Parallèlement, comme le remplissage devient plus dur, la durée de vie des forets utilisés pendant le processus d'usinage est considérablement réduite à 1/5 - 1/7 de l'original, entraînant une croissance explosive de la demande en forets.
La barrière technologique de ces matériaux spéciaux est extrêmement élevée, la capacité mondiale est hautement concentrée, et l'expansion de la production est difficile. Une interruption de l'approvisionnement affecterait directement le fonctionnement normal de toute la chaîne industrielle de l'IA.
(四) Salle blanche haut de gamme : Le maillon à haute barrière négligé
Dans le processus d'expansion de la production de la chaîne industrielle de l'IA, la salle blanche haut de gamme est un autre maillon à haute barrière gravement négligé. Les puces en procédés avancés et les emballages avancés exigent un environnement de production d'une propreté extrême, où un seul grain de poussière dans l'air peut entraîner la perte de toute une tranche de wafer.
La construction d'une salle blanche haut de gamme nécessite non seulement d'énormes investissements financiers, mais aussi un niveau technologique très élevé. Du système de purification de l'air aux installations anti-statiques, du contrôle de la température et de l'humidité à l'isolation des vibrations, chaque maillon a des normes strictes. Actuellement, le marché mondial des salles blanches haut de gamme est principalement dominé par des fabricants étrangers, avec une marge nette pouvant atteindre plus de 20 %, bien supérieure à celle des concurrents nationaux.
Avec l'expansion de la production mondiale de puces d'IA, la demande en salles blanches haut de gamme reste forte, devenant un maillon de haute景气 à forte certitude dans la chaîne industrielle.
La "guerre des routes" de la technologie de connexion : Retour du cuivre et fusion optique-électronique
Au-delà des goulots d'étranglement de la puissance de calcul et de l'expansion, la technologie de connexion à l'intérieur des centres de données subit également une transformation profonde. La guerre des routes technologiques entre le cuivre et la lumière, ainsi que la mise à niveau technologique des PCB/substrats, remodelant le paysage de connexion de l'IA Infra.
(一) Concurrence et substitution contextuelles du cuivre et de la lumière
Pendant longtemps, les modules optiques ont été considérés comme l'avenir de l'interconnexion haute vitesse dans les centres de données. Mais avec l'explosion de la demande en puissance de calcul de l'IA, la technologie du câble en cuivre connaît un "retour", le cuivre et la lumière formant une relation de complémentarité et de substitution selon les scénarios.
Courte distance (≤7 m) : Le câble en cuivre (AEC, câble cuivré actif), avec ses avantages de faible coût, haute fiabilité et faible latence, remplace全面ement les modules optiques basés sur laser. Dans les scénarios d'interconnexion courte distance à l'intérieur des serveurs et des baies, le rapport qualité-prix du câble en cuivre est très apparent.
Distance moyenne (~30 m) : Le câble optique Micro LED est devenu une solution de compromis. Il combine les avantages du câble en cuivre et des modules optiques, avec une fiabilité supérieure aux modules optiques laser et un coût inférieur aux modules optiques traditionnels, adapté à l'interconnexion à distance moyenne entre baies.
Longue distance (entre centres de données) : Les modules optiques amovibles traditionnels et la fibre optique restent dominants. La technologie CPO (co-emballage optique-électronique) est considérée comme la direction future, elle intègre le moteur optique et la puce dans le même emballage, pouvant considérablement augmenter la bande passante et réduire la consommation d'énergie, mais elle fait toujours face à des défis comme le coût élevé et la faible fiabilité, sa commercialisation à grande scale需要 encore du temps.
Il est à noter que l'échelle d'achat de fibres optiques et les exigences de performance des centres de données d'IA forment déjà un écart de量级 par rapport aux réseaux de télécommunications traditionnels. Pour répondre aux besoins d'interconnexion à faible latence et haute bande passante des clusters GPU, la demande pour des fibres optiques spéciales comme le G.657.A2 continue d'augmenter, et des solutions de fibres à cœur creux plus avant-gardistes sont déjà entrées en phase de déploiement réel. La fibre à cœur creux remplace le noyau de verre traditionnel par de l'air, optimisant significativement les performances de transmission : la perte de transmission peut être réduite de 0,14 dB/km常规 à moins de 0,1 dB/km, la latence de transmission passe de 5 μs/km à 3,46 μs/km, tout en tolérant une puissance optique plus élevée.
Actuellement, le nombre de fabricants participants sur le marché des fibres à cœur creux s'agrandit rapidement, mais les prix restent relativement stables, environ 30 000 - 40 000 yuans/kilomètre, bien supérieurs à ceux des fibres ordinaires.
(二) Pression de la mise à niveau technologique des PCB/substrats
Pour répondre aux besoins de haute bande passante des puces d'IA, la technologie des PCB et des substrats ne cesse de se perfectionner. Actuellement, les PCB/substrats évoluent vers une structure n+m, des substrats en verre, et le procédé semi-additif (mSAP).
La structure n+m augmente le nombre de couches et la densité de câblage, améliorant la capacité de bande passante du substrat ; le substrat en verre a un coefficient de dilatation thermique plus bas et de meilleures performances hautes fréquences, c'est une direction importante pour le développement futur des substrats haut de gamme ; le procédé mSAP permet un câblage de circuits plus fin, répondant aux besoins d'interconnexion haute densité.
Ces mises à niveau technologiques imposent de nouvelles exigences aux équipements, matériaux et procédés de fabrication en amont, et apportent également de nouvelles opportunités et défis industriels.
Résumé
La chaîne industrielle de l'IA Infra fait face à des contraintes multidimensionnelles entrelacées. Du mur de la mémoire, du mur de la bande passante, du mur du calcul, du mur électrique au niveau de la puissance de calcul, à la pénurie d'équipements de test, de substrats IC, de matériaux spéciaux, de salles blanches au niveau de l'expansion, en passant par la guerre des routes technologiques au niveau de la connexion, chaque maillon influence le déploiement à scale de la puissance de calcul de l'IA.
La capacité de fabrication de puces haut de gamme est la contrainte la plus fondamentale, elle détermine la limite supérieure des performances et l'échelle de production des puces d'IA. Et les équipements de test, les substrats IC haut de gamme, les matériaux spéciaux clés, etc., sont actuellement les maillons où la certitude est la plus forte et les contradictions entre l'offre et la demande les plus saillantes. À long terme, le développement de l'IA Infra présentera deux grandes tendances : premièrement, l'évolution technologique du retour du cuivre et de la fusion optique-électronique, différentes routes technologiques coexisteront dans leurs scénarios avantageux respectifs ; deuxièmement, la重构 de la chaîne industrielle mondiale et l'accélération de la localisation, les entreprises nationales pourraient réaliser des percées dans certains domaines细分.
Cet article provient du compte WeChat "半导体产业纵横" (ID: ICViews), auteur : Peng Cheng






