Ce créneau de puces est devenu incandescent

marsbitPublié le 2026-05-18Dernière mise à jour le 2026-05-18

Résumé

Le marché mondial des puces IA connaît un changement profond, avec une transition majeure des GPU vers les ASIC pour l'inférence, portée par des gains d'efficacité énergétique et de coût. Des signaux forts émergent en 2026 : la part des TPU de Google atteint 78% dans les serveurs, OpenAI déploie des ASIC personnalisés avec Broadcom, et des acteurs comme MediaTek et Qualcomm entrent agressivement sur ce marché. Les prévisions indiquent que les ASIC pourraient représenter 45% du marché des puces IA d'ici 2027. Cette ruée est motivée par l'explosion des charges de travail d'inférence IA, où les ASIC surclassent les GPU en latence et efficacité. L'architecture Transformer, désormais standard, offre un marché large et stable pour ces puces spécialisées. Les hyperscalers (Google, AWS, Meta...) poussent cette tendance via des puces sur mesure pour contrôler leur chaîne d'approvisionnement et leurs coûts. Le paysage se recompose. MediaTek et Qualcomm, issus du mobile, deviennent des acteurs majeurs aux côtés des leaders historiques Broadcom et Marvell. En Chine, des sociétés comme VeriSilicon et ASR voient leurs activités de services ASIC exploser. Cependant, des défis persistent : coûts de développement élevés, écosystème logiciel à construire face à CUDA, et dépendance aux capacités d'emballage avancé de TSMC. L'avenir ne verra pas le remplacement pur des GPU, mais plutôt une spécialisation : GPU pour l'entraînement, ASIC pour l'inférence à grande échelle, dans un écosystème plu...

Actuellement, le marché mondial des puces IA subit une transformation paradigmatique profonde.

Pendant longtemps, le GPU a été considéré comme l'option par défaut pour l'entraînement de l'IA. Cependant, à partir d'environ 2025, un changement industriel majeur autour des ASIC a commencé à prendre une ampleur considérable.

ASIC, un signal et des données d'un point d'inflexion industriel

Au premier trimestre 2026, la part du TPU de Google dans les expéditions de serveurs IA a grimpé en flèche pour atteindre 78 %, dépassant de loin la part des GPU ; OpenAI a annoncé qu'il déploierait des ASIC personnalisés Broadcom de la mi-2026 à 2027 pour construire un cluster de calcul de 10 gigawatts, réduisant le coût unitaire du calcul d'environ 35 %.

Derrière ces signaux se cache un transfert historique du centre de gravité de la puissance de calcul IA, passant d'une course aux armements pour l'entraînement à un déploiement à grande échelle pour l'inférence.

Parallèlement, Rick Tsai, vice-président de MediaTek, a clairement désigné les ASIC pour centres de données comme le "moteur de croissance le plus prometteur de l'entreprise" lors de la conférence téléphonique sur les résultats financiers, relevant l'objectif de chiffre d'affaires, indiquant que les commandes de ses très grands clients se concrétisaient à un rythme accéléré.

Qualcomm a annoncé son entrée dans l'arène des centres de données, et grâce à la propriété intellectuelle accumulée via l'acquisition d'AlphaWave, il a décroché un grand client clé, affichant sa détermination à défier frontalement NVIDIA.

Sur le marché intérieur chinois, la société VeriSilicon (芯原股份) a connu une croissance explosive de ses activités de production en volume d'ASIC, tandis qu'ASR Microelectronics (翱捷科技) a pour la première fois positionné ses activités d'ASIC personnalisés comme sa "deuxième courbe de croissance". Ces deux principaux fournisseurs indépendants de services de conception de circuits intégrés ont concrétisé une logique de croissance élevée dans leurs résultats financiers.

Ces signaux diffusés de manière rapprochée pointent tous vers le même fait en train de se former : l'industrie des ASIC entre dans un "âge d'or". Il ne s'agit pas d'un choix stratégique de quelques entreprises, mais d'un point d'inflexion industriel global.

Les dernières données de Deloitte révèlent ce point d'inflexion : la part de charge de travail d'inférence IA est passée de 1/3 en 2023 à 2/3 en 2026, et devrait encore augmenter à long terme, avec un marché de 2 à 3 fois plus grand que celui du matériel d'entraînement. Goldman Sachs prédit même qu'en 2026, la part des ASIC dans les puces IA atteindra 40 %, pour dépasser 45 % en 2027, rivalisant presque à égalité avec les GPU. Counterpoint Research indique que la taille du marché des ASIC IA passera de 120 milliards de dollars en 2024 à 300 milliards de dollars en 2027, avec un taux de croissance annuel composé (TCAC) de 34 %.

Dans l'ensemble, le marché des accélérateurs IA en 2026 se trouve à un tournant crucial - la concurrence s'est étendue du simple affrontement sur la puissance de calcul d'une puce à une confrontation globale englobant l'interconnexion, les commutateurs, l'écosystème logiciel et l'architecture système.

Le décollage des ASIC, pourquoi maintenant ?

Si l'on devait trouver un point d'appui à l'essor des ASIC, la réponse se cacherait peut-être dans les calculs économiques les plus fondamentaux de l'industrie de l'IA.

Avec l'optimisation des grands modèles d'IA réduisant considérablement les coûts d'inférence, la programmation IA et les agents IA entrant largement dans les processus de production industrielle, l'inférence IA a véritablement explosé au second semestre 2025 et est devenue un consensus industriel. Un simple fait physique est devenu progressivement incontournable : lorsqu'on déploie des modèles à l'échelle de centaines de millions d'utilisateurs, utiliser des GPU génériques coûtant des dizaines de milliers de dollars pour de l'inférence instantanée à haut niveau de concurrence revient à "utiliser un canon pour tuer une mouche" - ce n'est pas impossible, mais structurellement peu rentable.

C'est précisément là que réside l'opportunité pour les ASIC.

À mesure que les besoins en puissance de calcul IA passent d'une structure dominée par l'entraînement à une structure dominée par l'inférence, les avantages en termes d'efficacité énergétique et de coût des puces personnalisées deviennent le moteur central. Dans les scénarios d'inférence, les puces ASIC offrent une latence plus faible, une consommation d'énergie réduite et un coût unitaire optimisé, suffisants pour remettre fondamentalement en cause le modèle de coût établi par les GPU pendant plus d'une décennie.

Les GPU génériques présentent un double goulot d'étranglement en termes de consommation d'énergie et de coût dans les scénarios d'inférence, en particulier lorsque l'explosion des agents IA a entraîné une multiplication par 10 à 100 de la consommation de tokens, rendant cette contradiction de plus en plus aiguë. En personnalisant leur architecture, les ASIC consacrent toutes les ressources des transistors à des calculs spécifiques, éliminent les fonctions redondantes, et réalisent une amélioration de l'efficacité énergétique de 3 à 5 fois, avec une réduction du coût total de possession (TCO) de 40 à 60 %, s'adaptant parfaitement aux scénarios d'inférence à grande échelle.

Pour illustrer, la puce d'inférence personnalisée lancée par OpenAI en collaboration avec Broadcom affiche une efficacité énergétique de 6,8 TOPS/W, tandis que l'indicateur correspondant pour le GB200 de NVIDIA n'est que de 4,5 TOPS/W, la différence est évidente. Le nouveau responsable de l'infrastructure IA d'Amazon a déclaré sans ambages : "Si nous pouvons construire des modèles sur nos propres puces, nous pouvons accomplir ces tâches pour une fraction du coût des fournisseurs de modèles d'IA purs."

Plus important encore, cette vague d'ASIC ne constitue pas une explosion désordonnée à partir de zéro, mais s'appuie sur un consensus désormais mature concernant la charge de travail IA.

On sait que l'architecture Transformer domine le monde des grands modèles à long terme, ce qui libère la conception dédiée des ASIC du "sorcier classique" d'une "surface d'application trop étroite" - toute architecture dédiée hautement optimisée pour Transformer peut capitaliser sur ses avantages en matière de coût et d'efficacité énergétique dans un espace de marché suffisamment vaste.

Historiquement, les ASIC étaient longtemps confinés à des scénarios de niche en raison de leur "investissement élevé et risque important", mais cette prémisse a changé : lorsque la conception dédiée fait face à un marché adressable de plusieurs dizaines de milliards de dollars et que la structure de la charge de travail est hautement unifiée, les ASIC passent d'une solution de remplacement à moindre coût des GPU à une option inévitable pour l'évolution de l'infrastructure IA.

Parallèlement, le virage collectif des principaux fournisseurs de services cloud (CSP) constitue le signal de marché le plus crucial.

En tant que plus grand groupe d'acheteurs de puissance de calcul au monde, les principaux CSP comme Google, AWS, Microsoft, Meta, etc., s'orientent uniformément vers des ASIC auto-conçus ou personnalisés. TrendForce estime que la demande de serveurs IA des CSP et des clouds souverains restera forte en 2026, et le taux de croissance des expéditions de serveurs ASIC (44,6 %) dépassera nettement celui des serveurs GPU (16,1 %).

Il ne s'agit pas simplement d'une pensée de "réduction des coûts" - à une époque où l'infrastructure IA devient une ressource stratégique centrale, détenir le pouvoir de définition des puces signifie détenir le pouvoir de tarification de la puissance de calcul et l'autonomie de la chaîne d'approvisionnement. Voter pour les ASIC avec de l'argent réel est devenu une action stratégique incontournable pour les fournisseurs cloud, passant d'un approvisionnement passif à une définition active.

Forces anciennes et nouvelles s'entremêlent, la carte mondiale des ASIC se restructure

En plus de l'explosion de la demande de puissance de calcul IA, un autre signe de l'âge d'or des ASIC est que le nombre de joueurs sur scène a soudainement augmenté.

Dans le passé, le récit autour des ASIC tournait principalement autour de deux acteurs historiques, Broadcom et Marvell ; aujourd'hui, des géants des puces pour téléphones comme MediaTek et Qualcomm franchissent les frontières et réécrivent le paysage concurrentiel des ASIC.

MediaTek marque un premier point, mise gros sur les ASIC

L'histoire de la transformation de MediaTek est peut-être l'échantillon le plus dramatique de cette vague d'ASIC.

Dans un contexte où le marché des téléphones atteint un plafond de croissance et où la marge brute a chuté à son plus bas niveau en quatre ans à 47,5 % en 2025, le PDG de MediaTek, Rick Tsai, a identifié avec détermination les ASIC pour centres de données comme le moteur de croissance le plus prometteur de l'entreprise. Lors de la conférence téléphonique sur les résultats financiers en juillet dernier, il a annoncé au marché que le premier projet d'ASIC serait finalisé au cours du trimestre, commençant à contribuer au chiffre d'affaires à partir de 2026 ; en février 2026, Rick Tsai pouvait déjà utiliser le mot "très" pour qualifier sa confiance dans l'objectif - le chiffre d'affaires des ASIC pour centres de données dépassera absolument 10 milliards de dollars en 2026, et pourrait atteindre des dizaines de milliards de dollars en 2027.

La vitesse à laquelle cet objectif se concrétise a même dépassé les attentes des analystes. Selon des rapports publics, la réussite de MediaTek à décrocher la commande d'ASIC pour le centre de données de Google constitue le résultat central de son premier coup réussi dans ce pari audacieux.

Rick Tsai lui-même a émis un jugement remarquable : le marché mondial des ASIC pour centres de données pourrait atteindre 70 milliards de dollars d'ici 2028, et l'objectif de MediaTek n'est pas seulement d'obtenir la part de marché précédemment estimée de 10 à 15 % - "Nous viserons plus haut." Pour soutenir cette ambition, MediaTek a déjà accru ses investissements dans plusieurs domaines technologiques clés tels que les SerDes haute vitesse 400G, l'optique copackagée (CPO), l'encapsulation avancée 3,5D et la mémoire HBM personnalisée.

La dernière prévision de Goldman Sachs indique : en 2027, le chiffre d'affaires des ASIC IA de MediaTek pourrait atteindre jusqu'à 12,3 milliards de dollars, correspondant à 10-15 % de part de marché ; d'ici 2028, la part des activités IA dépassera 60 % (66 %), et le chiffre d'affaires des ASIC IA pourrait atteindre 48 milliards de dollars. Counterpoint Research est encore plus optimiste, prévoyant qu'en 2028, MediaTek captera 26 % de la part de marché des ASIC IA, avec des expéditions multipliées par 10 entre 2026 et 2028, devenant ainsi le deuxième fournisseur mondial, juste derrière Broadcom.

On peut dire que MediaTek est en train de réaliser un saut du périphérique au cloud, prouvant que ses capacités d'intégration de SoC accumulées à l'ère de la 5G peuvent également ouvrir un vaste espace d'imagination dans le domaine des centres de données.

Qualcomm : arrivé tard mais en tête, visant le cœur de l'inférence

Si MediaTek est le pionnier méthodique, alors Qualcomm est le perturbateur agressif.

En 2025, Qualcomm a acquis à 100 % pour 2,4 milliards de dollars l'entreprise de technologie de connexion filaire haute vitesse AlphaWave Semi, finalisant la transaction au premier trimestre 2026. L'intention de cette manœuvre est extrêmement claire : utiliser les actifs de propriété intellectuelle accumulés par AlphaWave pour combler les lacunes clés dans les domaines de l'interconnexion haute performance des centres de données et de la conception de puces personnalisées, préparant le terrain pour une entrée à grande échelle sur le marché des puces personnalisées côté cloud.

L'approche de Qualcomm est rapide.

Le 30 avril 2026, le PDG de Qualcomm, Cristiano Amon, a confirmé publiquement que la société collaborait avec un fournisseur de services cloud hyperscale de premier plan pour développer une puce personnalisée, avec les premières expéditions prévues pour le trimestre de décembre, se concentrant sur l'optimisation des scénarios d'inférence IA.

Plus remarquable encore est la stratégie de "trois voies parallèles" de Qualcomm : développer simultanément un CPU universel, un accélérateur conçu spécifiquement pour l'inférence IA et une puce ASIC entièrement personnalisée, ces trois types de produits formant une matrice complète de solutions pour centres de données. On sait qu'en octobre 2025, Qualcomm a lancé le duo AI200/AI250 pour l'inférence dans les centres de données, l'AI200 devant être commercialisé en 2026 et l'AI250 prévu pour 2027. En avril 2026, Qualcomm a confirmé que le projet d'ASIC personnalisé en collaboration avec un fournisseur cloud hyperscale de premier plan commencerait ses premières expéditions cette année.

Dans un contexte où des clients clés comme Apple et Samsung accélèrent le développement de leurs propres puces et où les activités d'électronique grand public font face à des pressions structurelles, Qualcomm a choisi de s'engager de cette manière dans un tout nouveau marché dont la taille est estimée à des milliers de milliards de dollars. La déclaration d'Amon à ce sujet est simple et puissante : "On peut dire que nous avons touché le fond."

L'avantage différenciateur de Qualcomm réside également dans l'intégration de l'écosystème périphérique-cloud. Ses ASIC peuvent non seulement exécuter efficacement des tâches d'inférence cloud, mais aussi s'intégrer de manière transparente avec la plateforme mobile Snapdragon et les puces IoT, offrant aux clients une solution IA complète de la périphérie au cloud.

Broadcom et Marvell : le paysage de maîtrise des deux géants

Alors que les nouvelles forces progressent à grands pas, les deux géants traditionnels ne sont pas non plus restés immobiles.

Dans le domaine des ASIC, Broadcom est depuis longtemps le leader reconnu.

Grâce à la croissance de ses activités de puces personnalisées et de produits réseau IA, le chiffre d'affaires de Broadcom est passé à 39,7 milliards de dollars en 2025, soit une augmentation de 30 % sur un an. Ses résultats financiers montrent que le centre de gravité de la valeur des semi-conducteurs IA s'est étendu des GPU aux puces IA personnalisées et à l'ensemble de l'architecture réseau, incluant les équipements réseau Ethernet et les contrôleurs d'interface réseau (NIC).

La structure des revenus de Broadcom est en train de changer fondamentalement : au premier trimestre de l'exercice 2026, les revenus liés à l'IA de Broadcom ont atteint 8,4 milliards de dollars, en hausse de 106 % sur un an, et leur part dans ses revenus de semi-conducteurs continue d'augmenter.

Parallèlement, le PDG de Broadcom, Hock Tan, a lancé une prédiction encore plus étonnante lors de la conférence téléphonique sur les résultats financiers : d'ici 2027, le chiffre d'affaires des seules puces IA (ASIC personnalisés) dépassera 1 000 milliards de dollars, avec un volume total d'expédition proche de 10 gigawatts. Cet objectif dépasse largement les attentes précédentes du marché.

Les sociétés de plateformes de modèles de langage de grande taille (LLM) comme Google, Meta, OpenAI, Anthropic, etc., construisent leurs propres XPU personnalisés. Broadcom révèle qu'il collabore actuellement étroitement avec six clients principaux pour développer conjointement des processeurs dédiés à l'IA. Ces clients incluent :

  • Google : un partenaire important pour les puces TPU, l'ampleur des commandes continue de s'élargir.
  • Meta : la feuille de route de la série de puces MTIA progresse bien, les livraisons atteindront plusieurs gigawatts en 2027.
  • Anthropic : prévoit de déployer plus de 3 gigawatts de puissance de calcul TPU d'ici 2027.
  • OpenAI : a annoncé le déploiement de sa première génération d'XPU à partir de 2027, avec une capacité de calcul dépassant 1 gigawatt la première année.

Il est à noter que la collaboration de Broadcom avec ses clients n'est pas une transaction ponctuelle, mais un engagement stratégique plurigénérationnel, avec des cycles de coopération allant jusqu'à 2 à 4 ans de planification continue. La déclaration d'un cadre de Broadcom à ce sujet est emblématique : "Il s'agit de demandes réelles de clients, et l'ampleur des affaires continuera de croître."

D'autre part, la présence de Marvell dans le domaine des ASIC est également profonde.

En 2019, Marvell a finalisé l'acquisition de la division ASIC d'Avera de GlobalFoundries, posant les bases de ses activités de puces personnalisées. Avec la croissance de la demande de puissance de calcul IA, les activités de puces personnalisées (ASIC) de Marvell sont devenues un moteur de croissance central.

Le 31 mars 2026, NVIDIA a annoncé un investissement de 2 milliards de dollars dans Marvell, établissant un partenariat stratégique via la technologie NVLink Fusion, intégrant Marvell dans l'écosystème AI Factory et AI-RAN de NVIDIA. Marvell fournira des XPU personnalisés et des solutions réseau compatibles NVLink Fusion, collaborant au développement de la prochaine génération d'infrastructures et de technologies de photonique sur silicium.

Le 2 décembre 2025, Marvell a annoncé l'acquisition de la société de technologie d'interconnexion optique Celestial AI pour environ 3,25 milliards de dollars, la transaction étant finalisée au premier trimestre 2026. La technologie Photonic Fabric de Celestial AI offre une efficacité énergétique deux fois supérieure à celle de l'interconnexion en cuivre et peut supporter des connexions à faible latence et à haut débit pour les systèmes IA à grande échelle. Marvell a simultanément lancé sa série de produits DSP optiques 1,6T, ainsi que le COLORZ 1600 étendu en mars 2026, offrant une solution d'interconnexion optique de bout en bout pour les centres de données IA.

Selon les résultats financiers, le chiffre d'affaires total de Marvell pour l'exercice 2026 s'élève à 8,195 milliards de dollars, en hausse de 42 % sur un an ; les revenus des centres de données, incluant les ASIC, ont atteint 6,1 milliards de dollars, représentant environ 74 % du chiffre d'affaires total. Alors qu'au cours de l'exercice 2024, la part des revenus des centres de données n'était que d'environ 40 %. Cela signifie qu'environ deux ans seulement, la structure des activités de Marvell a subi un changement notable.

On sait que le plus grand client d'ASIC de Marvell est Amazon AWS (apportant une propriété intellectuelle clé pour les puces Trainium) ; Google, Microsoft et Meta sont tous des partenaires confirmés : Google développe conjointement le CPU Arm Axion avec Marvell, le prochain accélérateur IA Maia de Microsoft est conçu avec une participation approfondie de Marvell, et Meta collabore dans la direction des XPU IA personnalisés. Marvell affirme avoir obtenu des commandes de conception d'ASIC IA auprès de plus de 20 clients.

La différence essentielle avec Broadcom réside dans le modèle de service : Broadcom propose une solution de bout en bout étroitement liée à son portefeuille de produits réseau, créant une forte dépendance à son écosystème une fois les clients intégrés ; Marvell propose une approche plus flexible de combinaison à la demande, mieux adaptée aux clients souhaitant maîtriser leur propre architecture.

Le PDG de Marvell, Matt Murphy, déclare : "L'interconnexion haute vitesse et l'interconnexion optique deviennent de plus en plus importantes pour la mise à l'échelle de l'IA. Marvell combine la personnalisation des ASIC avec la technologie d'interconnexion haute vitesse, offrant aux clients des solutions de connectivité haute performance et d'ASIC, avec pour objectif de porter la part des revenus liés à l'IA au-dessus de 50 % et de devenir un acteur clé dans le domaine de l'infrastructure IA."

Il est à noter que la collaboration de Broadcom et Marvell avec des entreprises comme OpenAI, Meta, etc., révèle une logique industrielle plus profonde : pour les entreprises d'IA de premier plan, la considération première du développement d'ASIC personnalisés n'est peut-être pas le coût, mais la sécurité de la chaîne d'approvisionnement et l'autonomie architecturale. "Détenir le pouvoir de définition des puces" devient une ligne de démarcation stratégique claire.

Dans cette partie, le coût n'est qu'un facteur superficiel, la souveraineté architecturale est le centre de gravité plus profond.

En examinant la carte des ASIC : premièrement, les fabricants de puces pour téléphones, forts de leur expérience approfondie en conception de SoC, réalisent une transformation transfrontalière de la périphérie au centre. L'histoire de MediaTek illustre la réutilisation transfrontalière des capacités d'intégration système, tandis que celle de Qualcomm montre une transformation via des acquisitions et une adaptation. Les deux voies convergent vers la même conclusion : la structure des acteurs dans le domaine des ASIC est en train de connaître un renouvellement générationnel ; deuxièmement, les douves des deux géants traditionnels des ASIC sont beaucoup plus profondes et larges que prévu ; troisièmement, les fournisseurs cloud eux-mêmes passent également rapidement du statut d'acheteurs à celui de développeurs, réécrivant fondamentalement la dynamique de négociation de la chaîne industrielle.

Dans la vague des ASIC, la montée en puissance des forces chinoises

Plus intrigant encore, les participants à ce festin des ASIC ne se limitent pas aux géants américains et européens. Au sein de la chaîne d'approvisionnement des semi-conducteurs continentaux en Chine, les fournisseurs indépendants de services de conception de circuits intégrés, représentés par VeriSilicon (芯原股份) et ASR Microelectronics (翱捷科技), deviennent une nouvelle force non négligeable.

VeriSilicon : le "vendeur de pelles" des ASIC IA

2025 a été une année de transformation qualitative pour VeriSilicon. Le montant total des nouvelles commandes pour l'année a atteint 5,96 milliards de yuans, en hausse de 103,41 % par rapport à l'année précédente. Parmi celles-ci, les commandes liées à la puissance de calcul IA représentaient déjà plus de 73 %, et les commandes dans le domaine du traitement des données plus de 50 %, provenant principalement d'ASIC IA côté cloud et de propriété intellectuelle. À fin d'année, le carnet de commandes de VeriSilicon s'élevait à 5,075 milliards de yuans, restant à un niveau élevé pendant neuf trimestres consécutifs, avec plus de 80 % de ces commandes devant être converties en revenus dans l'année.

Ces chiffres sont déjà impressionnants, mais en avril 2026, l'annonce de commandes par VeriSilicon a stupéfié l'industrie : de janvier à avril, les nouvelles commandes s'élèvent à 8,24 milliards de yuans, avec les commandes liées à la puissance de calcul IA représentant 91,37 %, et en seulement 9 jours, 3,724 milliards de yuans de commandes d'ASIC IA ont été ajoutés. Les résultats du premier trimestre montrent que les revenus de VeriSilicon sont de 836 millions de yuans, en hausse de 114,47 % sur un an, et les activités de personnalisation de puces clés en main ont augmenté de 145,90 %.

Ces données valident commercialement l'explosion continue de la demande mondiale d'ASIC IA et fournissent également un support de commandes clair et prévisible pour la croissance future de VeriSilicon.

La force centrale de VeriSilicon réside dans sa capacité de service ASIC complète. De l'octroi de licences de propriété intellectuelle à la conception de puces en passant par les activités de production en volume, VeriSilicon propose des solutions clés en main, se concentrant sur les ASIC IA côté cloud, avec des clients couvrant les principaux fournisseurs cloud mondiaux, tout en s'engageant activement dans des scénarios émergents côté périphérique comme les lunettes IA et les jouets IA. Plus intéressant encore, la collaboration de VeriSilicon avec Google sur l'IP du processeur neuronal Coral à très basse consommation (basé sur l'ensemble d'instructions RISC-V) a ouvert la voie aux ASIC dédiés pour les scénarios IA côté périphérique.

Le PDG de VeriSilicon, Wayne Dai (戴伟民), a déclaré lors de la présentation des résultats du premier trimestre 2026 : "L'explosion du marché des ASIC IA dépasse les attentes des clients. Fort de 20 ans d'accumulation de propriété intellectuelle et d'expérience en conception de puces, VeriSilicon est devenu le partenaire privilégié pour la personnalisation d'ASIC des fournisseurs cloud et des entreprises d'IA mondiaux. En 2026, les commandes liées à l'IA représenteront plus de 90 %, marquant la transformation réussie de VeriSilicon en fournisseur de services d'infrastructure de puissance de calcul IA."

On peut voir que le rôle de VeriSilicon évolue de simple fournisseur de propriété intellectuelle vers une entreprise plateforme ASIC IA de bout en bout, jouant un rôle de pivot "d'habilitation" au sein de la chaîne industrielle.

ASR Microelectronics : le géant des modems cellulaires exploite sa deuxième courbe de croissance

En tant qu'acteur établi dans le domaine des puces de communication, ASR Microelectronics (翱捷科技) a trouvé sa deuxième courbe de croissance dans la voie des ASIC.

À partir du second semestre 2024, la demande de personnalisation pour les wearables intelligents, l'IA côté périphérique et les puces RISC-V a continué d'augmenter. ASR a entrepris plusieurs projets de personnalisation utilisant des procédés de fabrication avancés, avec un carnet de commandes bien rempli. En 2025, le chiffre d'affaires d'ASR a augmenté de 12,73 % pour atteindre 3,817 milliards de yuans, et les pertes se sont considérablement réduites de plus de 300 millions de yuans.

Au premier trimestre 2026, les revenus des activités de personnalisation d'ASIC d'ASR étaient de 188 millions de yuans, en hausse de 73 % sur un an, représentant 23 % du chiffre d'affaires total. Pour accélérer le déploiement, ASR a créé une filiale entièrement dédiée aux activités ASIC, affectant 20 % de ses ressources de R&D aux activités de personnalisation, couvrant les domaines de l'IA côté cloud, côté périphérique, des wearables et du RISC-V.

L'avantage différenciateur d'ASR réside dans sa capacité à fournir des solutions ASIC de niveau système. Fort de son expérience technique de plusieurs années dans le domaine des SoC modems, ASR peut offrir des services complets allant de la conception de puces à l'optimisation système, en utilisant sa bibliothèque de propriété intellectuelle mature et ses canaux d'approvisionnement pour aider les clients à raccourcir les cycles de développement et réduire les coûts.

En comparaison, VeriSilicon et ASR ont une caractéristique commune : elles ne misent pas sur un seul client ou un seul projet, mais s'intègrent dans le grand écosystème de l'industrie IA grâce à des combinaisons systématiques de propriété intellectuelle et des capacités de personnalisation, jouant le rôle de "vendeurs de pelles".

Dans l'ambiance de ruée vers l'or de l'IA, ceux qui vendent les pelles gagnent souvent de manière plus stable. VeriSilicon et ASR sont en train d'établir leur fenêtre d'or entre les identités de "vendeur de pelles" et "d'habiliteur" des ASIC IA, s'appuyant sur les riches ressources de la chaîne d'approvisionnement et les scénarios d'application en Chine pour revendiquer une plus grande voix dans la concurrence mondiale des puces IA.

De l'usage interne à la vente externe, restructuration fondamentale de la chaîne industrielle IA

La caractéristique profonde de l'âge d'or des ASIC ne réside pas seulement dans ce qui a augmenté, mais aussi dans ce qui a changé.

Parmi les signaux dramatiques, l'un est apparu fin 2025. Selon des rapports, Google négocie avec Meta pour lui vendre directement ses puces TPU auto-conçues. Si cette transaction de plusieurs milliards de dollars se concrétise, elle marquera la transition du TPU d'un outil interne privé de Google vers une commercialisation externe - Meta prévoit de louer de la puissance de calcul TPU auprès de Google Cloud en 2026, et d'investir directement pour acheter le matériel en 2027 pour le déployer dans ses propres centres de données.

Dans un contexte où les GPU de NVIDIA conservent une part de marché supérieure à 90 % depuis longtemps, la substance de cette collaboration est que les fournisseurs cloud votent avec de l'argent réel pour construire une chaîne d'approvisionnement ouverte de puissance de calcul "auto-conçue + achetée à l'extérieur", afin de briser la dépendance à un fournisseur unique.

Parallèlement, les écosystèmes de services de conception d'ASIC matures représentés par Broadcom, Marvell, MediaTek, etc., ont formé une boucle de division du travail hautement spécialisée : les CSP définissent les spécifications, les fabricants de puces font la conception, et TSMC s'occupe de l'encapsulation avancée. Ce système de fabrication sous contrat précis permet à toute grande entreprise ayant des besoins suffisants en puissance de calcul, qu'il s'agisse d'OpenAI, d'Apple ou de nouveaux acteurs en planification, de potentiellement devenir le propriétaire du prochain ASIC auto-conçu.

Le marché mondial des puces IA évolue de la domination d'un seul joueur, NVIDIA, vers une véritable concurrence de cent écoles de pensée.

L'autre facette de cette transformation est la mise à niveau synergique complète des technologies fondamentales de la chaîne industrielle.

L'explosion des ASIC pilotée par l'IA impose des exigences plus élevées sur l'architecture de calcul. La capacité mensuelle d'encapsulation avancée CoWoS de TSMC devrait passer d'environ 65 000 à 70 000 tranches fin 2025 à 120 000-130 000 tranches fin 2026, et même ainsi, elle ne pourra pas entièrement satisfaire la demande vigoureuse des clients.

Simultanément, Broadcom a lancé la première plateforme SoC de calcul face-à-face 3,5D XDSiP de l'industrie, permettant une expansion indépendante du calcul, du stockage et des entrées/sorties dans un facteur de forme compact, pour répondre aux énormes besoins des clusters de puissance de calcul IA de l'ordre du gigawatt.

Ces avancées technologiques fondamentales synchrones montrent que l'essor des ASIC ne se produit pas de manière isolée, mais s'insère dans l'évolution de toute la chaîne industrielle, des procédés avancés à l'encapsulation avancée en passant par l'interconnexion haute vitesse - le point focal de la concurrence dans l'infrastructure IA est passé de "la course à la puissance de calcul ponctuelle" à la course à l'efficacité de l'architecture système.

Les ASIC font face à des défis et des jeux de pouvoir coexistants

Derrière les lumières, toute tendance a son autre face claire et froide, et les ASIC ne font pas exception.

Des professionnels de l'industrie ont déclaré à l'auteur : "Les coûts de développement et les risques de production de tranches (tape-out) sont l'épée de Damoclès suspendue au-dessus de la tête de chaque acteur des ASIC." Une puce ASIC IA en procédé de fabrication avancé, de la conception à la production, coûte facilement des centaines de millions de dollars, et si le jugement sur la voie technologique est erroné ou si le rythme de la demande ne répond pas aux attentes, des investissements de plusieurs milliards de dollars risquent d'échouer.

Cela est visible dans les résultats financiers de sociétés comme Broadcom et Marvell, où la nature d'investissement lourd en amont des activités d'ASIC personnalisés exerce effectivement une pression structurelle de traînée sur la marge brute globale - une pression qui n'est pas négligeable à court terme.

Les douves de l'écosystème logiciel sont la barrière la plus tenace à laquelle les ASIC sont confrontés.

Comme on le sait, la véritable douve de NVIDIA n'a jamais été limitée au matériel, mais réside dans l'immense pile logicielle construite par CUDA après plus de dix ans de perfectionnement : des millions de développeurs, d'innombrables bibliothèques et cadres accumulés, un écosystème d'opérateurs optimisé au fil des ans. Bien qu'AWS ait annoncé que la prochaine génération de Trainium serait compatible avec la technologie d'interconnexion NVLink de NVIDIA, tentant ainsi d'affaiblir cette barrière en pénétrant l'écosystème dominant, le chemin pour que l'écosystème des ASIC rattrape la maturité de CUDA depuis zéro est encore long.

Il existe également une contrainte structurelle qui ne peut être ignorée : la dépendance concentrée des commandes mondiales de puces IA à l'encapsulation avancée CoWoS de TSMC. Bien que TSMC augmente sa capacité à un rythme sans précédent, dans un contexte où tous les géants passent des commandes simultanément, le risque d'encombrement de la planification de production reste significatif. S'ajoute à cela l'influence de la géopolitique et des incertitudes de la chaîne d'approvisionnement, ce qui n'est pas une variable à négliger facilement.

De plus, l'épreuve plus profonde réside dans le jeu classique entre la personnalisation complète et la flexibilité programmable. Lorsque les expéditions d'ASIC devraient dépasser en nombre réel les GPU commerciaux d'ici 2028, ce qui sera testé ne sera plus la capacité brute de mise à l'échelle, mais comment équilibrer l'efficacité extrême dédiée et l'adaptabilité élastique universelle - la première est la raison d'être des ASIC, la seconde est un avantage que le marché ne veut pas abandonner.

Pour le consensus industriel actuel, il n'existe peut-être pas de réponse parfaite, et le choix final de l'industrie sur la direction à prendre ne peut être validé que par le marché et le temps.

Pour conclure

En regardant en arrière depuis 2026, un jugement plus nuancé se précise : le résultat final n'est pas que les ASIC remplacent complètement les GPU, mais que les deux trouvent leurs propres niches irremplaçables dans une nouvelle configuration de coexistence.

En synthétisant les prédictions de plusieurs institutions, le paysage concurrentiel du marché des accélérateurs IA évolue vers une division du travail spécialisée "l'entraînement repose sur les GPU, l'inférence sur les ASIC", ou vers un réseau mixte d'ASIC et de GPU dans des clusters IA à plus grande échelle.

Il est également intéressant de noter que plusieurs variables clés détermineront jusqu'où le récit des ASIC pourra aller à l'ère de l'IA.

  • La direction de l'évolution de la charge de travail IA : la continuité de l'architecture Transformer concerne directement le plafond de rendement de la conception dédiée des ASIC - chaque changement dramatique de l'architecture est une fissure potentielle dans la logique d'investissement des ASIC.
  • Le degré d'ouverture de l'écosystème des fournisseurs cloud : le signal de Google vendant des TPU à Meta est extrêmement important. Si les puces auto-conçues par les CSP passent d'une réduction des coûts internes à une véritable offre externe, les ASIC évolueront d'une histoire de coûts vers une véritable histoire de marché.
  • Le rythme de l'innovation de l'architecture système : la capacité d'optimisation complète, de la puce au rack, de la puissance de calcul à l'interconnexion, est en train de remplacer les TOPS d'une seule puce pour devenir la nouvelle mesure centrale de la concurrence industrielle. Celui qui pourra trouver la solution optimale en premier dans la matrice globale de la capacité CoWoS, de l'encapsulation 3,5D et des SerDes haute vitesse pourra verrouiller la position de leader de la prochaine étape de l'âge d'or.

L'âge d'or des ASIC est essentiellement un mouvement de "démocratisation" de la puissance de calcul IA.

Que ce soit l'incursion transfrontalière de MediaTek, la contre-attaque désespérée de Qualcomm, la mise en œuvre approfondie de Broadcom et Marvell, ou la percée de VeriSilicon et ASR, les forces de toutes parts dessinent ensemble la véritable couleur de fond de cette ère de coexistence diversifiée.

Cela fait passer le pouvoir de définition de la puissance de calcul d'un géant des puces concentré en un seul pôle, pour commencer à revenir entre les mains des fournisseurs cloud, des fabricants d'équipements, voire des utilisateurs finaux de toutes les industries. Cela annonce le relâchement d'un ancien écosystème et l'entrée en scène d'une nouvelle logique : sur la question du choix des puces, l'industrie a enfin plus de droits de choisir.

Cet article provient du compte WeChat "Semiconductor Industry Watch" (ID : icbank), auteur : L Chenguang

Questions liées

QQuels sont les principaux indicateurs qui montrent que l'industrie des ASIC connaît un "âge d'or" depuis 2026 ?

APlusieurs indicateurs montrent cet essor : la part de marché des TPU de Google a atteint 78% dans les serveurs IA, OpenAI déploie des ASIC sur mesure de Broadcom pour réduire les coûts de 35%, et des sociétés comme MediaTek et Qualcomm s'engagent massivement. Les prévisions des cabinets d'études comme Deloitte et Goldman Sachs confirment cette croissance explosive.

QPourquoi les ASIC deviennent-ils cruciaux pour l'inférence IA par rapport aux GPU ?

ALes ASIC sont plus adaptés à l'inférence IA à grande échelle car leur architecture sur mesure, optimisée pour des charges de travail spécifiques comme Transformer, offre un rapport performance/énergie 3 à 5 fois supérieur et réduit le coût total de possession (TCO) de 40 à 60% par rapport aux GPU génériques, plus coûteux et gourmands en énergie pour cette tâche.

QComment les géants traditionnels comme Broadcom et Marvell maintiennent-ils leur domination face aux nouveaux entrants comme MediaTek et Qualcomm dans le secteur des ASIC ?

ABroadcom et Marvell consolident leur position grâce à des partenariats stratégiques à long terme (2-4 ans) avec les principaux acteurs de l'IA (Google, Meta, OpenAI), une offre intégrée allant des puces aux solutions réseau, et des investissements continus dans des technologies clés comme l'interconnexion photonique et les emballages avancés (ex: plateforme 3.5D de Broadcom).

QQuel rôle jouent les sociétés chinoises comme VeriSilicon et ASR dans l'écosystème mondial des ASIC pour l'IA ?

AVeriSilicon et ASR agissent comme des "fournisseurs de pelles" (enablers) essentiels dans l'écosystème. Elles offrent des services de conception sur mesure (ASIC) et des bibliothèques d'IP à des clients mondiaux, notamment des hyperscalers. Leur modèle basé sur une expertise en conception et une large palette d'IP leur permet de capitaliser sur la demande explosive sans dépendre d'un seul client.

QQuels sont les principaux défis et limites auxquels est confrontée l'adoption massive des ASIC pour l'IA ?

ALes défis majeurs sont : 1) Le coût et le risque élevés de développement et de masquage (plusieurs milliards de dollars). 2) L'écosystème logiciel mature autour de CUDA de NVIDIA, difficile à rattraper. 3) La dépendance à la capacité limitée d'emballage avancé (CoWoS) de TSMC. 4) Le compromis entre l'efficacité extrême de l'ASIC et la flexibilité de la programmation des GPU.

Lectures associées

Du financement parallèle au financement traditionnel : l’ère des titres financiers sur chaîne entre dans une fenêtre historique

Auteur : Climber, CryptoPulse Labs Depuis plus de dix ans, le secteur de la cryptographie a mené une expérience financière parallèle au monde réel, avec son propre système monétaire, ses marchés et sa logique d'évaluation. Des ICO à la finance décentralisée (DeFi), en passant par les NFT et les dérivés sur chaîne, un écosystème financier quasi complet s'est construit. Cependant, un mur séparait toujours la cryptographie de la finance traditionnelle. Aujourd'hui, ce mur commence à s'effondrer. La prochaine décennie verra l'émergence d'une ère de courtage en titres natifs sur chaîne, fusionnant les systèmes financiers mondiaux. La première phase de la cryptographie était une évolution en circuit fermé, où capitaux et utilisateurs circulaient majoritairement à l'intérieur de l'écosystème, limitant l'afflux de capitaux externes massifs. L'arrivée des ETF Bitcoin a ouvert une porte, mais l'histoire la plus significative est ailleurs : la tokenisation des actifs réels (actions, obligations, fonds) sur la blockchain. Cette innovation pourrait révolutionner l'infrastructure financière en simplifiant radicalement les processus complexes de transaction, de règlement et de garde, les rendant quasi instantanés via des contrats intelligents. Le prochain enjeu majeur ne sera pas la guerre des blockchains pour la vitesse, mais la bataille pour attirer des actifs de qualité et de la liquidité. Si des actifs mondiaux comme des actions de grandes entreprises viennent sur chaîne, la frontière entre finance traditionnelle et cryptographique disparaîtra. Le marché potentiel passe alors des billions de dollars de la cryptographie aux centaines de billions des marchés actions et obligataires mondiaux. En conclusion, après avoir tenté de créer un nouveau monde, le secteur de la cryptographie est sur le point de s'intégrer directement au système financier existant. La plus grande histoire de croissance commence peut-être seulement maintenant, avec la fusion réelle de la finance traditionnelle et de l'écosystème cryptographique.

marsbitIl y a 26 mins

Du financement parallèle au financement traditionnel : l’ère des titres financiers sur chaîne entre dans une fenêtre historique

marsbitIl y a 26 mins

Wang Chuan : Quand Lao Wang, le voisin, a gagné trente fois sur les actions de stockage, comment ne pas s'inquiéter encore (6) - Le piège des produits homogènes

**Résumé : Le piège des produits homogènes dans l’industrie du stockage** L’article utilise l’exemple historique d’Iomega, dont l’action a chuté de plus de 97% après un pic spéculatif dans les années 1990, pour illustrer les risques inhérents aux investissements dans le secteur du stockage. Ce secteur est caractérisé par des produits très homogènes (comme la DRAM), sans prime de marque, où les prix sont extrêmement volatils en raison du décalage entre une demande élastique et une offre rigide à fort investissement et long cycle de production. L’auteur explique que la forte hausse des actions du secteur observée à partir de septembre 2025 est principalement due à une demande AI soudaine (notamment pour la HBM) face à une offre limitée à court terme, permettant aux fabricants comme SanDisk et Micron d’afficher des marges bénéficiaires très élevées (près de 80%). Cependant, ces marges élevées contiennent les germes de leur propre disparition : elles incitent à d’importantes augmentations de capacités (débutées en 2026) et poussent les clients à trouver des alternatives technologiques pour réduire leur besoin en mémoire. L’article met en garde contre plusieurs pièges : la fausse sécurité des accords à long terme signés en période de tension (comparés au pacte germano-soviétique de 1939), le risque asymétrique où les facteurs pouvant faire chuter les prix (nouveaux entrants, récession, innovation) sont nombreux et imprévisibles, et l’illusion de la faible valorisation (FAIBLE P/E) au sommet du cycle, qui précède souvent un effondrement des bénéfices. En conclusion, le secteur du stockage, malgré ses périodes de profits exceptionnels, reste un piège pour les investisseurs naïfs en raison de sa nature cyclique brutale et de l’absence de barrières durables contre la concurrence par les prix.

链捕手Il y a 52 mins

Wang Chuan : Quand Lao Wang, le voisin, a gagné trente fois sur les actions de stockage, comment ne pas s'inquiéter encore (6) - Le piège des produits homogènes

链捕手Il y a 52 mins

AI PC arrive, défie localement un grand modèle de 120B ! Nvidia redéfinit le socle de l’« ordinateur personnel IA » avec le RTX Spark

Ces deux dernières années, les fabricants de PC ont largement mis en avant la puissance des NPU (processeurs neuronaux) pour les "AI PC", mais leurs performances restaient modestes (environ 45 à 50 TOPS). Lors du GTC 2026, NVIDIA a présenté la puce RTX Spark, qui repousse radicalement cette limite avec une puissance annoncée de 1 pétaflop (1000 TOPS) pour l'IA. Cette SoC intègre un GPU Blackwell et un CPU Arm Grace conçu avec MediaTek, et surtout, elle adopte une architecture de mémoire unifiée allant jusqu'à 128 GB, partagée entre le CPU et le GPU. L'objectif principal est de permettre l'exécution locale de grands modèles de langage (LLM) de 120 milliards de paramètres, avec des fenêtres de contexte pouvant atteindre un million de tokens, ce qui redéfinit les capacités de l'IA de bord. NVIDIA a également annoncé des collaborations majeures avec Microsoft pour renforcer la sécurité Windows et intégrer le bac à sable OpenShell, ainsi qu'avec Adobe qui adapte en profondeur des logiciels comme Photoshop pour tirer parti de cette nouvelle architecture. Plusieurs grands fabricants d'ordinateurs (ASUS, Dell, HP, Lenovo, Microsoft Surface, MSI) prévoient de commercialiser des PC portables fins et des mini-desktops équipés du RTX Spark dès l'automne. Cette initiative marque un changement potentiel dans l'industrie du PC, faisant passer l'accent du processeur x86 traditionnel à une plateforme SoC centrée sur le GPU. Cependant, des questions pratiques concernant la dissipation thermique, l'autonomie, les performances réelles et la stratégie de tarification des OEM restent en suspens et détermineront le succès final de cette nouvelle norme matérielle.

marsbitIl y a 1 h

AI PC arrive, défie localement un grand modèle de 120B ! Nvidia redéfinit le socle de l’« ordinateur personnel IA » avec le RTX Spark

marsbitIl y a 1 h

Trading

Spot
Futures

Articles tendance

Comment acheter CHIP

Bienvenue sur HTX.com ! Nous vous permettons d'acheter USD.AI (CHIP) de manière simple et pratique. Suivez notre guide étape par étape pour commencer votre parcours crypto.Étape 1 : Création de votre compte HTXUtilisez votre adresse e-mail ou votre numéro de téléphone pour ouvrir un compte sur HTX gratuitement. L'inscription se fait en toute simplicité et débloque toutes les fonctionnalités.Créer mon compteÉtape 2 : Choix du mode de paiement (rubrique Acheter des cryptosCarte de crédit/débit : utilisez votre carte Visa ou Mastercard pour acheter instantanément USD.AI (CHIP).Solde :utilisez les fonds du solde de votre compte HTX pour trader en toute simplicité.Prestataire tiers :pour accroître la commodité d'utilisation, nous avons ajouté des modes de paiement populaires tels que Google Pay et Apple Pay.P2P :tradez directement avec d'autres utilisateurs sur HTX.OTC (de gré à gré) : nous offrons des services personnalisés et des taux de change compétitifs aux traders.Étape 3 : stockage de vos USD.AI (CHIP)Après avoir acheté vos USD.AI (CHIP), stockez-les sur votre compte HTX. Vous pouvez également les envoyer ailleurs via un transfert sur la blockchain ou les utiliser pour trader d'autres cryptos.Étape 4 : tradez des USD.AI (CHIP)Tradez facilement USD.AI (CHIP) sur le marché Spot de HTX. Il vous suffit d'accéder à votre compte, de sélectionner la paire de trading, d'exécuter vos trades et de les suivre en temps réel. Nous offrons une expérience conviviale aux débutants comme aux traders chevronnés.

275 vues totalesPublié le 2026.04.21Mis à jour le 2026.04.21

Comment acheter CHIP

Discussions

Bienvenue dans la Communauté HTX. Ici, vous pouvez vous tenir informé(e) des derniers développements de la plateforme et accéder à des analyses de marché professionnelles. Les opinions des utilisateurs sur le prix de CHIP (CHIP) sont présentées ci-dessous.

活动图片