Où se trouve le goulot d'étranglement dans la chaîne industrielle de l'IA Infra ?

marsbitPublié le 2026-04-21Dernière mise à jour le 2026-04-21

Résumé

L'industrie de l'infrastructure IA (AI Infra) fait face à des goulots d'étranglement systémiques à presque tous les niveaux, entravant le déploiement massif de la puissance de calcul nécessaire aux applications d'intelligence artificielle. Quatre principaux obstacles sont identifiés : Le « mur de la mémoire » : La demande croissante en mémoire à large bande (HBM) et DRAM pour l'inférence IA dépasse l'offre, les nouvelles capacités de production n'étant attendues qu'à partir de 2027. Le « mur de la bande passante » : La vitesse de calcul dépasse celle du transfert des données, créant des goulots à tous les niveaux (puces, serveurs, centres de données). L'énergie nécessaire pour déplacer les données dépasse parfois celle utilisée pour les calculs. Le « mur de calcul » : La fabrication de puces haut de gamme est limitée par la disponibilité des équipements de production avancés, notamment les machines de lithographie EUV (ASML), et par la chaîne d'approvisionnement mondiale complexe en matériaux et équipements spécialisés. Le « mur électrique » : Bien que la consommation énergétique des data centers IA soit énorme, ce défi est considéré comme plus gérable à moyen et long terme grâce aux énergies renouvelables. Au-delà de ces murs, l'expansion de la production est freinée par des pénuries en amont : * **Équipements de test (ATE)** : Essentiels pour tester à 100% les puces IA complexes, leur demande explose. * **Substrats IC/porteurs** : Un point de rupture critique. Ces...

Alors que des applications d'IA phénoménales comme DeepSeek, Seedance 2.0 se déploient les unes après les autres, la demande mondiale en puissance de calcul s'envole à une vitesse qui dépasse largement les prévisions. Cependant, derrière cette course aux armements en matière de calcul, la chaîne industrielle des infrastructures d'IA (AI Infra) rencontre des obstructions systémiques sans précédent. De l'équipement central de fabrication des puces à un simple câble en cuivre dans un centre de données, en passant par les matériaux spéciaux et les salles blanches, presque chaque maillon critique affiche un « feu rouge ».

Les quatre "murs" du développement de la puissance de calcul

Le développement de la puissance de calcul de l'IA n'est pas une simple amélioration des performances des puces, mais un projet d'ingénierie complexe impliquant le calcul, le stockage, la transmission et l'énergie.

(一) Mur de la mémoire : La première entrave à l'ère de l'inférence de l'IA

Actuellement, l'industrie de l'IA passe de la formation de grands modèles à l'inférence, et on prévoit qu'en 2026, la demande mondiale d'inférence de l'IA dépassera celle de la formation. L'explosion de la demande côté inférence de l'IA tire directement les besoins en mémoire à haute bande passante (HBM) et en DRAM de grande capacité.

Bien que les principaux fabricants de puces mémoire prévoient d'augmenter leur capacité de production, il faut au moins deux ans entre l'investissement et la mise en service effective des lignes de production, ce qui détermine que la situation de pénurie sera difficile à résoudre à court terme. Les nouvelles capacités seront principalement libérées en 2027 et au-delà, et en 2026, le secteur présentera un déséquilibre structurel entre une demande en croissance rapide et une offre qui tarde à se matérialiser.

(二) Mur de la bande passante : "L'obstruction des capillaires" du flux de données

La vitesse d'amélioration de la puissance de calcul dépasse largement la vitesse de transmission des données. Cette contradiction a conduit à un grave problème de "mur de la bande passante" — le flux de données à l'intérieur des puces, entre les puces, à l'intérieur des baies et entre les centres de données est devenu le goulot d'étranglement des performances de l'ensemble du système de calcul.

Le goulot d'étranglement actuel de la bande passante est multi-niveaux : à l'intérieur de la puce, la latence et la consommation d'énergie des interconnexions entre transistors ne cessent d'augmenter ; entre les puces, l'interconnexion traditionnelle sur carte PCB ne peut plus répondre aux besoins de haute bande passante et de faible latence entre les puces d'IA ; à l'intérieur de la baie, la bande passante d'interconnexion entre serveurs devient une contrainte pour la montée en puissance (Scale Up) ; entre les centres de données, la bande passante et la latence sur de longues distances limitent l'extension (Scale Out) et l'efficacité de l'allocation de la puissance de calcul transrégionale.

Selon les estimations, dans les clusters d'entraînement d'IA actuels, l'énergie consommée pour le déplacement des données dépasse déjà celle consommée par le calcul lui-même. Comment fluidifier les "capillaires" du flux de données, réduire la latence de transmission et la consommation d'énergie est un problème que le développement de l'IA Infra doit résoudre.

(三) Mur du calcul : La fabrication de puces haut de gamme est une contrainte fondamentale

L'itération des performances des puces d'IA dépend fortement des procédés de fabrication avancés, et la capacité de production des procédés avancés est entièrement tributaire des équipements de fabrication haut de gamme en amont, en particulier des machines de lithographie EUV (ultraviolet extrême).

Actuellement, seule ASML dans le monde est capable de produire des machines de lithographie EUV, dont la capacité est extrêmement limitée et soumise à de strictes contrôles à l'exportation. Cela entraîne directement une grave pénurie de capacité de production pour les procédés avancés en dessous de 7 nm, incapables de satisfaire la demande explosive de puces d'IA. NVIDIA, leader mondial des puces d'IA, voit les livraisons de ses puces haut de gamme comme le H100, le H200, etc., contraintes par la capacité de production en procédés avancés de TSMC, avec des délais de livraison de plusieurs mois, voire plus d'un an.

Plus grave encore, la fabrication de puces est une chaîne industrielle hautement mondialisée, et la rupture d'un seul maillon affecte l'ensemble de la production. Des matières premières comme les résines photosensibles, les cibles, les gaz spéciaux électroniques, aux équipements clés comme les machines de gravure et de dépôt, il existe différents degrés de monopole et de limitations d'approvisionnement. Cela fait de la capacité de fabrication de puces haut de gamme le goulot d'étranglement le plus difficile à surmonter dans la chaîne industrielle de l'IA Infra.

(四) Mur électrique : Un défi à court terme relativement maîtrisable

Comparé aux trois précédents, le mur électrique est un goulot d'étranglement relativement plus facile à résoudre. Les centres de données d'IA sont de grands consommateurs d'énergie ; la consommation annuelle d'électricité d'un très grand parc de centres de données peut même dépasser celle d'une ville moyenne de plusieurs centaines de milliers d'habitants. Actuellement, la consommation électrique totale des centres de données dans le monde représente 2 % à 3 % de la consommation électrique mondiale et continue d'augmenter. Mais le problème de l'électricité est essentiellement un problème d'infrastructure, qui peut être résolu par des moyens d'approvisionnement énergétique diversifiés comme les turbines à gaz, les piles à combustible, le photovoltaïque, etc.

À long terme, avec le développement des technologies d'énergie renouvelable et l'amélioration des infrastructures énergétiques, l'approvisionnement en électricité ne deviendra pas le plus grand goulot d'étranglement au développement de la puissance de calcul de l'IA à moyen et long terme. Mais dans certaines régions, en raison du retard dans la construction des réseaux électriques, des pressions d'approvisionnement à court terme existent encore et pourraient limiter la vitesse de construction des centres de données.

Le "tueur invisible" de l'expansion : Pénurie généralisée des équipements et des matériaux

La vitesse d'expansion de la production de puces d'IA est bien inférieure aux attentes, la contrainte centrale n'étant pas les puces elles-mêmes, mais la pénurie généralisée des équipements et des matériaux en amont.

(一) La demande en équipements de test croît rapidement

La mise à niveau technologique des puces d'IA augmente les exigences de précision et d'efficacité des équipements de test. Par rapport aux puces logiques ordinaires, le nombre de ports de signal des GPU d'IA explose, consommant plus de ressources de canaux de signal des testeurs ; parallèlement, le nombre de transistors augmente considérablement, ce qui entraîne une augmentation correspondante de l'échelle des vecteurs de test et de la durée de test par puce. Plus crucial encore, dans le domaine de l'électronique grand public, seule une certaine proportion des puces est testée, mais pour les puces d'intelligence artificielle, toutes les puces doivent être testées à 100 %, et généralement à travers plusieurs étapes, pour garantir le fonctionnement normal de l'ensemble du jeu de puces. Sous l'impulsion forte de la demande en puissance de calcul de l'IA, combinée à l'explosion du marché de la mémoire, les équipements de test semi-conducteurs (ATE) sont presque devenus la catégorie à la croissance la plus rapide en termes de volume d'expédition dans tout le secteur des équipements semi-conducteurs.

Le plus grand fournisseur mondial d'équipements de test de puces, Advantest, a également indiqué qu'il prévoyait un record historique pour l'exercice se terminant en mars 2026, avec des revenus attendus en hausse de 37 % et un bénéfice net plus du double de celui de l'année précédente.

(二) Substrat IC / substrat d'emballage : Le maillon "goulot" plus cher que la puce

De manière surprenante, le plus gros point de douleur dans la chaîne d'approvisionnement des fabricants de puces de premier plan comme NVIDIA n'est pas la puce elle-même, mais le substrat IC (substrat d'emballage). Le substrat IC est un composant clé connectant la puce et la carte PCB, jouant un rôle de connexion électrique et de support physique. Les puces d'IA exigent énormément du substrat IC — une surface plus grande, une densité de câblage plus élevée, de meilleures performances de dissipation thermique et une perte de signal plus faible. Cela signifie aussi que sa valeur doit nécessairement être bien plus élevée qu'un PCB ordinaire. Selon les estimations, le coût du substrat IC représente environ 50 % du coût total de l'emballage, et dans les emballages avancés flip-chip, cette proportion peut même atteindre 70 à 80 %. Selon la résine choisie, les substrats IC sont principalement divisés en substrats BT et substrats ABF. Les substrats BT sont principalement utilisés pour les diverses puces mémoire ; tandis que l'ABF est plus concentré sur les puces logiques, comme les CPU, GPU, FPGA, ASIC, etc.

Selon des statistiques incomplètes, depuis 2025, le prix des substrats IC a augmenté de plus de 30 % cumulé. La hausse des prix a deux raisons principales : premièrement, la transmission des coûts des matières premières en amont, les tissus de verre haut de gamme, les feuilles de cuivre et autres matières premières clés sont en pénurie continue depuis 2025, l'écart de capacité ne cessant de se creuser ; deuxièmement, l'explosion de la demande pour l'emballage avancé 2.5D/3D, les GPU et autres puces haut de gamme utilisant普遍ement une architecture multicouches de puces, l'augmentation significative du nombre de couches et de la surface des puces pousse directement la demande de surface de substrat.

Contrairement aux PCB ordinaires, les substrats IC ont des barrières technologiques élevées et une grande complexité de processus, la capacité mondiale de production de substrats IC haut de gamme est principalement concentrée entre les mains de quelques fabricants taïwanais comme Unimicron Technology, Nan Ya Printed Circuit Board, etc., avec un cycle d'expansion de capacité长达 de 18 à 24 mois. Cela signifie que la situation de pénurie des substrats IC sera difficile à résoudre fondamentalement dans les deux prochaines années.

(三) Matériaux spéciaux clés : Le "glutamate monosodique industriel" extrêmement rare

Certains matériaux spéciaux, apparemment insignifiants, deviennent le "point faible fatal" de la chaîne industrielle de l'IA. La fibre de verre Low-CTE (faible coefficient de dilatation thermique), la feuille de cuivre spéciale, les forets haut de gamme et autres matériaux, bien que utilisés en petites quantités, sont le "glutamate monosodique industriel" indispensable à la fabrication de substrats IC et de cartes PCB haut de gamme.

La haute puissance et les hautes performances des puces d'IA exigent que les substrats et les cartes PCB utilisent des matériaux avec un coefficient de dilatation thermique très bas pour éviter toute déformation dans des environnements de travail à haute température. Parallèlement, comme le remplissage devient plus dur, la durée de vie des forets utilisés pendant le processus d'usinage est considérablement réduite à 1/5 - 1/7 de l'original, entraînant une croissance explosive de la demande en forets.

La barrière technologique de ces matériaux spéciaux est extrêmement élevée, la capacité mondiale est hautement concentrée, et l'expansion de la production est difficile. Une interruption de l'approvisionnement affecterait directement le fonctionnement normal de toute la chaîne industrielle de l'IA.

(四) Salle blanche haut de gamme : Le maillon à haute barrière négligé

Dans le processus d'expansion de la production de la chaîne industrielle de l'IA, la salle blanche haut de gamme est un autre maillon à haute barrière gravement négligé. Les puces en procédés avancés et les emballages avancés exigent un environnement de production d'une propreté extrême, où un seul grain de poussière dans l'air peut entraîner la perte de toute une tranche de wafer.

La construction d'une salle blanche haut de gamme nécessite non seulement d'énormes investissements financiers, mais aussi un niveau technologique très élevé. Du système de purification de l'air aux installations anti-statiques, du contrôle de la température et de l'humidité à l'isolation des vibrations, chaque maillon a des normes strictes. Actuellement, le marché mondial des salles blanches haut de gamme est principalement dominé par des fabricants étrangers, avec une marge nette pouvant atteindre plus de 20 %, bien supérieure à celle des concurrents nationaux.

Avec l'expansion de la production mondiale de puces d'IA, la demande en salles blanches haut de gamme reste forte, devenant un maillon de haute景气 à forte certitude dans la chaîne industrielle.

La "guerre des routes" de la technologie de connexion : Retour du cuivre et fusion optique-électronique

Au-delà des goulots d'étranglement de la puissance de calcul et de l'expansion, la technologie de connexion à l'intérieur des centres de données subit également une transformation profonde. La guerre des routes technologiques entre le cuivre et la lumière, ainsi que la mise à niveau technologique des PCB/substrats, remodelant le paysage de connexion de l'IA Infra.

(一) Concurrence et substitution contextuelles du cuivre et de la lumière

Pendant longtemps, les modules optiques ont été considérés comme l'avenir de l'interconnexion haute vitesse dans les centres de données. Mais avec l'explosion de la demande en puissance de calcul de l'IA, la technologie du câble en cuivre connaît un "retour", le cuivre et la lumière formant une relation de complémentarité et de substitution selon les scénarios.

Courte distance (≤7 m) : Le câble en cuivre (AEC, câble cuivré actif), avec ses avantages de faible coût, haute fiabilité et faible latence, remplace全面ement les modules optiques basés sur laser. Dans les scénarios d'interconnexion courte distance à l'intérieur des serveurs et des baies, le rapport qualité-prix du câble en cuivre est très apparent.

Distance moyenne (~30 m) : Le câble optique Micro LED est devenu une solution de compromis. Il combine les avantages du câble en cuivre et des modules optiques, avec une fiabilité supérieure aux modules optiques laser et un coût inférieur aux modules optiques traditionnels, adapté à l'interconnexion à distance moyenne entre baies.

Longue distance (entre centres de données) : Les modules optiques amovibles traditionnels et la fibre optique restent dominants. La technologie CPO (co-emballage optique-électronique) est considérée comme la direction future, elle intègre le moteur optique et la puce dans le même emballage, pouvant considérablement augmenter la bande passante et réduire la consommation d'énergie, mais elle fait toujours face à des défis comme le coût élevé et la faible fiabilité, sa commercialisation à grande scale需要 encore du temps.

Il est à noter que l'échelle d'achat de fibres optiques et les exigences de performance des centres de données d'IA forment déjà un écart de量级 par rapport aux réseaux de télécommunications traditionnels. Pour répondre aux besoins d'interconnexion à faible latence et haute bande passante des clusters GPU, la demande pour des fibres optiques spéciales comme le G.657.A2 continue d'augmenter, et des solutions de fibres à cœur creux plus avant-gardistes sont déjà entrées en phase de déploiement réel. La fibre à cœur creux remplace le noyau de verre traditionnel par de l'air, optimisant significativement les performances de transmission : la perte de transmission peut être réduite de 0,14 dB/km常规 à moins de 0,1 dB/km, la latence de transmission passe de 5 μs/km à 3,46 μs/km, tout en tolérant une puissance optique plus élevée.

Actuellement, le nombre de fabricants participants sur le marché des fibres à cœur creux s'agrandit rapidement, mais les prix restent relativement stables, environ 30 000 - 40 000 yuans/kilomètre, bien supérieurs à ceux des fibres ordinaires.

(二) Pression de la mise à niveau technologique des PCB/substrats

Pour répondre aux besoins de haute bande passante des puces d'IA, la technologie des PCB et des substrats ne cesse de se perfectionner. Actuellement, les PCB/substrats évoluent vers une structure n+m, des substrats en verre, et le procédé semi-additif (mSAP).

La structure n+m augmente le nombre de couches et la densité de câblage, améliorant la capacité de bande passante du substrat ; le substrat en verre a un coefficient de dilatation thermique plus bas et de meilleures performances hautes fréquences, c'est une direction importante pour le développement futur des substrats haut de gamme ; le procédé mSAP permet un câblage de circuits plus fin, répondant aux besoins d'interconnexion haute densité.

Ces mises à niveau technologiques imposent de nouvelles exigences aux équipements, matériaux et procédés de fabrication en amont, et apportent également de nouvelles opportunités et défis industriels.

Résumé

La chaîne industrielle de l'IA Infra fait face à des contraintes multidimensionnelles entrelacées. Du mur de la mémoire, du mur de la bande passante, du mur du calcul, du mur électrique au niveau de la puissance de calcul, à la pénurie d'équipements de test, de substrats IC, de matériaux spéciaux, de salles blanches au niveau de l'expansion, en passant par la guerre des routes technologiques au niveau de la connexion, chaque maillon influence le déploiement à scale de la puissance de calcul de l'IA.

La capacité de fabrication de puces haut de gamme est la contrainte la plus fondamentale, elle détermine la limite supérieure des performances et l'échelle de production des puces d'IA. Et les équipements de test, les substrats IC haut de gamme, les matériaux spéciaux clés, etc., sont actuellement les maillons où la certitude est la plus forte et les contradictions entre l'offre et la demande les plus saillantes. À long terme, le développement de l'IA Infra présentera deux grandes tendances : premièrement, l'évolution technologique du retour du cuivre et de la fusion optique-électronique, différentes routes technologiques coexisteront dans leurs scénarios avantageux respectifs ; deuxièmement, la重构 de la chaîne industrielle mondiale et l'accélération de la localisation, les entreprises nationales pourraient réaliser des percées dans certains domaines细分.

Cet article provient du compte WeChat "半导体产业纵横" (ID: ICViews), auteur : Peng Cheng

Questions liées

QQuels sont les quatre principaux goulots d'étranglement (murs) identifiés dans le développement de l'infrastructure d'IA (AI Infra) ?

ALes quatre murs identifiés sont : 1) Le Mur de la Mémoire (Memory Wall) : Goulot d'étranglement dû à la demande explosive de mémoire HBM et DRAM pour l'inférence IA. 2) Le Mur de la Bande Passante (Bandwidth Wall) : Problème de performance dû à la vitesse de transfert des données inférieure à la vitesse de calcul. 3) Le Mur du Calcul (Compute Wall) : Contrainte fondamentale due aux limitations de la fabrication de puces haut de gamme, notamment par les machines de photolithographie EUV. 4) Le Mur Énergétique (Power Wall) : Défi à relativement court terme lié à la consommation électrique massive des data centers d'IA, considéré comme plus facile à résoudre à long terme.

QPourquoi les substrats de circuits intégrés (IC载板/Substrats d'empaquetage) sont-ils un point de contention critique dans la chaîne d'approvisionnement de l'IA ?

ALes substrats de circuits intégrés (IC载板) sont un point de contention critique car ils sont essentiels pour connecter la puce à la carte PCB, assurant la connexion électrique et le support physique. Les puces IA exigent des substrats de plus grande taille, une densité de câblage plus élevée, de meilleures performances de dissipation thermique et une perte de signal plus faible. Leur fabrication est complexe, le cycle d'expansion de la production est long (18-24 mois), et le marché est dominé par un petit nombre de fabricants taïwanais, créant une pénurie d'approvisionnement et une hausse des prix de plus de 30% depuis 2025.

QQuel est l'impact de la demande d'IA sur l'équipement de test des semi-conducteurs (ATE) ?

ALa demande d'IA a un impact significatif sur l'équipement de test des semi-conducteurs (ATE). Les puces IA, comme les GPU, ont un nombre de ports de signal bien plus élevé, consomment plus de ressources de canaux de signal des testeurs, et nécessitent des schémas de test plus complexes et des temps de test par puce plus longs. Contrairement aux puces pour l'électronique grand public, les puces IA doivent subir un test à 100% et souvent à plusieurs étapes. Cela fait de l'ATE l'une des catégories d'équipements semi-conducteurs à la croissance la plus rapide, comme en témoignent les prévisions de records de revenus pour des sociétés comme Advantest.

QComment la concurrence entre les technologies de connexion cuivre et lumière (optique) évolue-t-elle dans les data centers d'IA ?

ALa concurrence entre le cuivre et la lumière évolue vers une complémentarité selon la distance : 1) Courte distance (≤7m) : Les câbles en cuivre actifs (AEC) sont privilégiés pour leur faible coût, haute fiabilité et faible latence, remplaçant les modules optiques. 2) Distance moyenne (~30m) : Les câbles optiques à Micro LED offrent un compromis, avec une meilleure fiabilité que les modules laser et un coût inférieur aux modules optiques traditionnels. 3) Longue distance (entre data centers) : Les modules optiques traditionnels amovibles et la fibre optique restent la norme. La technologie CPO (Co-Packaged Optics) est une future direction mais fait face à des défis de coût et de fiabilité.

QQuel rôle jouent les matériaux spéciaux, surnommés 'assaisonnement industriel', dans la chaîne d'approvisionnement de l'IA ?

ALes matériaux spéciaux, ou 'assaisonnement industriel', jouent un rôle crucial bien que leur utilisation soit en faible volume. Il s'agit notamment de fibres de verre à faible coefficient de dilatation thermique (Low-CTE), de feuilles de cuivre spéciales et de forets de précision haut de gamme. Ils sont indispensables pour fabriquer des substrats IC et des PCB haute performance pour les puces IA, garantissant une stabilité dimensionnelle sous haute température et permettant une usinage de précision. Leurs procédés de fabrication présentent des barrières technologiques élevées, la production mondiale est très concentrée, et toute interruption d'approvisionnement peut paralyser toute la chaîne de production de l'IA.

Lectures associées

Trading

Spot
Futures
活动图片