SemiAnalysis décortique le Kirin 9030 de Huawei : La finesse de gravure stagne, on plie la puce

marsbit发布于2026-06-15更新于2026-06-15

文章摘要

SemiAnalysis, via son laboratoire STEEL, a publié sa première analyse de démontage publique, ciblant le Kirin 9030 Pro de Huawei (fabriqué par SMIC en procédé N+3). Le rapport révèle que le pas métallique minimum (M0 pitch) du N+3 est de 32,5 nm, plus fin que celui de l'Intel 18A. Cependant, ceci est un indicateur isolé et la densité logique globale (113,4 MTr/mm²) est similaire au N6 de TSMC, mais obtenue à un coût bien supérieur en raison de l'utilisation d'une quadruple modélisation (SAQP) avec des DUV uniquement, sans EUV. Le Kirin 9030, de taille similaire à son prédécesseur, intègre plus de cœurs CPU/GPU/NPU et de cache grâce à la densité améliorée. Ses performances GPU rattrapent environ les flagships de 2022, mais le CPU, basé sur une architecture de type Cortex-X2 (2021), accuse un retard en IPC et en fréquence dû aux limitations du procédé de fabrication. Face à ces contraintes, Huawei mise sur une nouvelle voie : l'échelle Tau et le "LogicFolding" (pliage logique). Cette approche consiste à empiler verticalement des blocs logiques pour raccourcir les interconnexions, visant à atteindre 5 GHz et une densité équivalente élevée d'ici 2031. Bien que le calcul de densité pour la 3D diffère des méthodes traditionnelles, cette direction est stratégique. En conclusion, les contrôles à l'exportation n'ont pas arrêté les progrès sino-sémiconducteurs, mais en ont changé la trajectoire et le coût. SMIC prouve qu'une densité avancée est possible sans EUV, mais à un prix élev...

Rédaction : Chao Xiang Research

Dans le domaine de la rétro-ingénierie des semi-conducteurs, TechInsights a régné pendant des décennies. Ce week-end, Dylan Patel de SemiAnalysis a officiellement publié le premier rapport de démontage public de son laboratoire STEEL (Teardown Engineering & Evaluation Lab), ciblant directement l'une des puces les plus scrutées au monde : le Kirin 9030 Pro qui équipe le Huawei Mate 80 Pro, fabriqué en procédé N+3 le plus avancé de SMIC.

Le timing est révélateur. TechInsights est en cours de vente par des fonds de capital-investissement, tandis que les revenus de SemiAnalysis ont déjà dépassé ceux de ce vieux géant. Dylan a choisi ce moment pour dégainer, avec un rapport de démontage techniquement très dense, accompagné de photos réelles de la puce prises dans le laboratoire de l'Oregon.

Le titre du rapport est une bombe : Le pas minimum métallique (M0 pitch) du procédé N+3 de SMIC n'est que de 32,5 nm, plus fin que les 36 nm du procédé 18A utilisé par Intel dans son dernier processeur Panther Lake.

SMIC a réalisé un pas métallique plus fin qu'Intel sans machine de lithographie EUV ?

Cette information, si l'on ne regarde que le titre, serait suffisante pour faire exploser tout le monde des semi-conducteurs, mais SemiAnalysis lui-même tempère l'enthousiasme dès le deuxième paragraphe du rapport : c'est une "metrique choisie à dessein" (cherry picked metric).

Cet article vous décrypte ce rapport de démontage,

Densité rattrapée, coût élevé

Le procédé N+3 de SMIC a effectivement rattrapé la densité de transistors du N6 de TSMC.

Par analyse en coupe TEM (microscope électronique à transmission), le laboratoire STEEL a mesuré une densité Bohr de 113,4 MTr/mm² pour le N+3, légèrement supérieure aux 107,7 MTr/mm² du N6 de TSMC. La hauteur des cellules a été réduite de 252 nm (N+2) à 228 nm, et l'espacement entre grilles de contact (CGP) de 63 nm à 57 nm. Ces chiffres, pris ensemble, signifient que SMIC, sans EUV et uniquement avec de la lithographie DUV, a atteint une densité logique comparable au niveau du 7nm mature de TSMC.

À quel prix ?

La couche M0 de SMIC utilise un motif quadruple auto-aligné (SAQP), c'est-à-dire qu'un seul masque est traité quatre fois pour obtenir des lignes plus fines. TSMC N6 n'a besoin que d'un motif double (SADP) pour la même couche. Le quadruple signifie plus de masques, des exigences d'alignement plus strictes, des processus de fabrication plus complexes et un coût plus élevé.

SemiAnalysis voit directement le prix du SAQP dans les coupes : les tranchées M0 du N+3 présentent un profil en trapèze inversé marqué (le bas plus étroit que le haut), avec une bande d'enrichissement en couche barrière claire au fond. Cette morphologie aide au remplissage en cuivre, mais à un pas de 32,5 nm, la difficulté de contrôle du processus augmente considérablement.

Pour faire une analogie qu'un trader comprendrait : SMIC imprime des billets de la même valeur faciale, mais le coût d'impression de chacun est plusieurs fois supérieur à celui de TSMC, avec en plus un risque de rendement plus élevé. Densité égale, économie différente.

Kirin 9030 : Dans des conditions contraintes, exploiter chaque millimètre carré de silicium

Les capacités de conception de puces de HiSilicon (Huawei) relèvent d'une autre dimension.

En termes de surface de puce, le Kirin 9030 est presque aussi grand que le 9020 de la génération précédente (environ 140 mm²), mais on y a entassé plus d'éléments : le CPU est passé de 1 cœur large + 3 moyens à 1 large + 4 moyens, les unités de calcul du GPU sont passées de 4 à 6, le NPU a gagné un cœur Tiny supplémentaire, et les caches à tous les niveaux ont été augmentés. L'augmentation de densité du N+3 a permis à Huawei de caser plus d'unités logiques dans la même taille de puce.

En termes de performances, le laboratoire STEEL cite des données de benchmark publiques et donne un positionnement clair : Les performances GPU du Kirin 9030 (Maleoon 935) rattrapent globalement le niveau haut de gamme de 2022, avec un score 3DMark WLE en hausse de 70% par rapport à la génération précédente, légèrement supérieur au Snapdragon 8+ Gen 1, mais avec un écart de 2,4 à 2,6 fois par rapport au haut de gamme actuel, le Snapdragon 8 Elite Gen 5.

La situation du CPU est encore plus parlante. Les performances par cycle (IPC) du cœur large TaiShan Prime se situent globalement au niveau de l'Arm Cortex-X2, une conception de 2021. Le cœur Firestorm du M1 d'Apple, sorti en 2020, conserve un IPC supérieur de 35%. Le dernier cœur P de l'Apple M5 présente un IPC supérieur de 60%, avec des performances absolues 2,7 fois supérieures.

La source de l'écart n'est pas dans la conception, mais dans le procédé de fabrication. Apple et Qualcomm utilisent les procédés N4, N3P de TSMC, qui offrent un avantage fondamental sur la courbe tension-fréquence : on peut caser plus de transistors sur la même surface, et atteindre des fréquences plus élevées pour la même consommation. Le niveau de conception des cœurs de Huawei est comparable à celui de l'avant-dernière génération de l'industrie de pointe, mais ils sont enfermés dans un procédé de fabrication vieux de deux générations.

Quand la finesse de gravure stagne, Huawei se prépare à "plier"

La partie la plus prospective du rapport concerne la loi d'échelle τ et la feuille de route LogicFolding présentées par Huawei lors de la conférence ISCAS 2026.

La miniaturisation traditionnelle des semi-conducteurs progresse sur un plan bidimensionnel : réduire la taille des transistors et affiner les lignes métalliques. La loi de Moore a fonctionné pendant des décennies en faisant essentiellement cela. L'échelle τ proposée par Huawei déplace désormais l'objectif d'optimisation du domaine spatial vers le domaine temporel, l'essentiel étant de réduire le coût temporel du déplacement et du traitement des données, y compris le délai de commutation des transistors, le délai de propagation du signal, et les délais de calcul et de stockage.

LogicFolding est la mise en œuvre technique de cette théorie. En simplifiant, il s'agit de diviser un même module logique en deux couches, empilées face à face et connectées par des liaisons hybrides à pas ultra-fin. L'avantage direct est de raccourcir les trajets de signaux les plus longs. Dans les puces modernes, une part importante de la consommation et du délai est consacrée à piloter les interconnexions longues et les répéteurs. En pliant la logique verticalement, les chemins critiques se raccourcissent, la fréquence peut augmenter et la consommation diminuer.

Huawei présente une feuille de route ambitieuse : La fréquence du cœur large du Kirin 9030 est de 2,75 GHz, des échantillons de laboratoire ont déjà atteint 3,39 GHz, avec pour objectif d'atteindre 5 GHz d'ici 2031, tout en poussant la densité équivalente à 295 MTr/mm² via l'empilement 3D, visant un niveau comparable au 14A de TSMC.

SemiAnalysis reste prudent face à cela. Ils soulignent que la méthode de calcul de la densité de Huawei diffère de celle des fondeurs traditionnels : la densité en empilement 3D est calculée sur la surface du package ; en empilant plusieurs couches de logique active, on obtient naturellement un chiffre plus élevé. En utilisant la même méthode pour calculer celle du MI450X d'AMD (couche supérieure N2 + couche inférieure N3P), la densité théorique atteindrait 460,2 MTr/mm², dépassant largement l'objectif 2031 de Huawei.

Mais la direction en elle-même mérite attention. En prenant cette voie, Huawei s'attaque essentiellement, dans un contexte de contraintes process, à un travail qui relève habituellement des fondeurs. Le V-Cache d'AMD réalise un empilement 3D sur le cache, le MI350X d'AMD déplace les E/S et l'interconnexion vers la puce inférieure. Ce que Huawei veut faire est plus radical : diviser directement un même bloc logique et le répartir verticalement, ce qui représente un défi d'ingénierie d'un autre ordre.

Les contrôles à l'exportation redéfinissent les dimensions de la course

La conclusion de SemiAnalysis est directe : Les contrôles à l'exportation n'ont pas arrêté les progrès des puces chinoises, mais ils ont changé la trajectoire et le coût de ces progrès.

Le N+3 de SMIC prouve qu'on peut atteindre une densité logique de niveau N6 sans EUV. Mais cette voie est plus coûteuse, le processus est plus complexe et le rendement plus difficile à maîtriser. Pour aller plus loin, la difficulté marginale augmente à chaque étape : plus de masques, une précision d'alignement plus stricte, des motifs multiples plus coûteux. En théorie, le N+4 pourrait atteindre 137,8 MTr/mm² (visant le N5 de TSMC), et le N+5, avec l'ajout d'une alimentation par l'arrière, pourrait même s'approcher des bibliothèques HP de l'Intel 18A. Mais chaque étape est plus difficile, plus coûteuse et laisse moins de marge d'erreur que la précédente.

Parallèlement, les procédés N+2 et N+3 de SMIC sont en cours de transfert vers Huahong, et des sociétés de conception comme Alibaba's T-Head ou Cambricon pourraient également en bénéficier. La connaissance de la fabrication de puces se diffuse d'un seul fondeur vers un écosystème, ce qui dilue encore l'efficacité des sanctions ciblant une entreprise unique.

Et côté conception, Huawei et l'Université de Pékin développent déjà des prototypes d'outils EDA domestiques pour le LogicFolding. Cela ne remplace pas les chaînes d'outils complètes de Synopsys et Cadence, mais les EDA domestiques évoluent vers une "optimisation conjointe architecture-processus-packaging".

Un détail intéressant : STEEL a découvert lors du démontage que la DRAM du Kirin 9030 Pro provenait de Samsung (K4L2E165YD, LPDDR5X-9600, nœud 1a), tandis que la version Pro Max 16 Go présentait simultanément des puces emballées de Samsung et de ChangXin Memory (CXMT). La puce de CXMT portait une date d'emballage de la semaine 45 de 2025, avec une densité de procédé équivalente au niveau 1z de l'industrie. Cela signifie que les puces mémoire chinoises commencent à entrer dans la chaîne d'approvisionnement des flagships de Huawei, même si le procédé reste en retard d'une à deux générations sur Samsung et SK Hynix.

Pour les investisseurs, le signal véritablement intéressant à suivre est de savoir si la feuille de route d'empilement 3D de Huawei pourra, à un coût maîtrisé, permettre aux puces d'origine chinoise d'atteindre le seuil de "suffisance" dans des scénarios comme les smartphones, l'inférence IA ou les équipements réseau.

Une fois ce seuil de suffisance atteint, la valeur stratégique de cette chaîne d'approvisionnement sera réévaluée.

相关问答

QQuelle est la signification de la découverte selon laquelle le pas métallique (M0 pitch) du procédé SMIC N+3 est de 32,5 nm, et pourquoi ce chiffre est-il considéré comme une métrique choisie à dessein (cherry picked) ?

ALe pas métallique de 32,5 nm du procédé SMIC N+3 est plus fin que celui de 36 nm du procédé Intel 18A. Cette métrique, isolée, suggérerait une supériorité technique. Cependant, elle est qualifiée de 'cherry picked' car elle ne reflète pas la réalité globale du procédé. Pour atteindre cette finesse sans machine EUV, SMIC utilise un modèle complexe et coûteux d'auto-alignement quadruple (SAQP), contrairement aux procédés plus avancés comme ceux d'Intel ou de TSMC qui utilisent des méthodes plus simples et offrent de meilleures performances globales (fréquence, consommation).

QQuels sont les compromis et les coûts associés à la réalisation par SMIC d'une densité transistor équivalente au procédé N6 de TSMC sans utiliser de lithographie EUV ?

APour égaler la densité du N6 de TSMC sans EUV, SMIC utilise le procédé N+3 basé uniquement sur la lithographie DUV. Le principal compromis est l'utilisation intensive de la quadruple photolithographie par auto-alignement (SAQP) pour les couches métalliques les plus fines, nécessitant bien plus d'étapes de masquage et de gravure que les procédés concurrents. Cela entraîne une complexité manufacturière accrue, des risques de défauts plus élevés, une maîtrise de la morphologie des tranchées plus difficile et, en fin de compte, un coût de production par puce bien supérieur à celui des fonderies utilisant l'EUV.

QD'après le rapport, comment se positionnent les performances du SoC Kirin 9030 par rapport aux puces concurrentes récentes, et quelles en sont les principales limitations ?

ALe Kirin 9030 atteint des performances de GPU comparables à celles d'un haut de gamme de 2022 (dépassant le Snapdragon 8+ Gen 1) mais reste 2,4 à 2,6 fois moins performant que les GPU de pointe actuels (Snapdragon 8 Elite Gen 5). Son cœur CPU TaiShan Prime a une performance par cycle (IPC) proche du Cortex-X2 de 2021, mais est nettement devancé par les cœurs Apple récents (35% derrière le M1, 60% derrière le M5). La limitation principale n'est pas la conception, mais le processus de fabrication (N+3 de SMIC), qui est en retard de deux générations par rapport aux N4/N3P de TSMC utilisés par Apple et Qualcomm, limitant la fréquence et l'efficacité énergétique.

QQue signifient les concepts de 'loi d'échelle τ (tau)' et de 'LogicFolding' présentés par Huawei, et quel est leur objectif stratégique ?

ALa 'loi d'échelle τ' et le 'LogicFolding' sont des concepts présentés par Huawei pour contourner les limitations des progrès en finesse de gravure. Au lieu de se concentrer uniquement sur la miniaturisation 2D, ils visent à optimiser les délais temporels (τ) en réduisant les distances de déplacement des données. Le 'LogicFolding' est sa mise en œuvre : il s'agit d'empiler verticalement (3D) deux couches d'un même bloc logique, connectées par des liaisons hybrides à très faible espacement. Cela raccourcit les chemins de signaux critiques, permettant potentiellement d'augmenter la fréquence, de réduire la consommation, et d'atteindre une densité équivalente plus élevée par unité de surface de package. L'objectif stratégique est de continuer à progresser en performances lorsque l'accès aux procédés de fabrication de pointe (comme les nœuds avancés d'après le 3 nm) est entravé.

QQuelle est la conclusion principale du rapport de SemiAnalysis concernant l'impact des contrôles à l'exportation sur le progrès des semi-conducteurs en Chine ?

ALa conclusion principale est que les contrôles à l'exportation n'ont pas arrêté les progrès des semi-conducteurs en Chine, mais qu'ils en ont radicalement modifié la trajectoire et le coût. La voie choisie (comme le N+3 de SMIC sans EUV) permet d'atteindre des densités comparables, mais à un coût bien plus élevé, avec une complexité de fabrication accrue et des marges de progression futures plus difficiles. Parallèlement, ces restrictions stimulent l'innovation dans des domaines alternatifs comme le 3D stacking (LogicFolding) et le développement d'outils EDA domestiques, et favorisent la diffusion des connaissances à travers l'écosystème chinois (transfert de procédés à d'autres fonderies, intégration de mémoires nationales). L'enjeu futur est de savoir si ces nouvelles approches pourront produire des puces 'suffisantes' à un coût viable pour les applications clés.

你可能也喜欢

USDe 绕开 GENIUS Act 收益禁令:合成美元如何成为加密最成功的灰色地带?

本文探讨了Ethena发行的合成美元稳定币USDe如何巧妙避开美国《GENIUS Act》中关于禁止支付型稳定币向持有人支付收益的规定。 USDe的核心机制并非持有法币或国债储备,而是通过收取加密抵押品并同时开设对冲的永续期货空头仓位,来维持美元价值稳定并赚取收益。持有人通过质押USDe获得sUSDe即可分享这部分收益。由于其本质是对冲衍生品交易策略而非传统储备模型,USDe不符合《GENIUS Act》对“支付型稳定币”的法定定义,从而置身于该法案的监管范围之外。 USDe曾一度成为市值第三大的美元计价加密资产,其收益来源于衍生品市场的资金费率与基差利差。这种设计使其在法律上区别于由发行人支付利息的传统稳定币。Ethena同时运营着完全合规、不支付收益的稳定币USDtb,突显了监管现状下的双重路径。 监管态度呈现分歧:德国BaFin将其视为未注册证券并禁止销售,而美国大型资产管理公司Janus Henderson则已与Ethena合作,将USDe用于现金管理。文章指出,USDe的成功反映了市场对收益型美元产品的真实需求,但其与USDC等储备型稳定币存在本质不同——前者依赖衍生品策略,后者依赖法币储备,风险特征迥异。 文章最终提出核心问题:监管机构是否会为“合成美元”这一类新兴工具专门划定监管边界,还是任由收益型产品持续流向现有法规的灰色地带。

Foresight News7分钟前

USDe 绕开 GENIUS Act 收益禁令:合成美元如何成为加密最成功的灰色地带?

Foresight News7分钟前

Lido V3 通过与 Luganodes 的 stVaults 扩展机构以太坊质押

Lido的机构质押业务新增基础设施支持,专业节点运营商Luganodes已集成Lido V3,并基于该协议新的stVaults原语推出了以太坊质押金库。 该集成面向那些希望在保持与更广泛的stETH生态系统连接的同时,对验证节点风险敞口、风险设置、费用结构和运营要求拥有更多控制权的机构用户。 **摘要要点:** * Luganodes 已集成 Lido V3。 * 该方案使用了 Lido 新的 stVaults 原语。 * 该产品主要面向机构以太坊质押用户。 * 目标是在保留 stETH 流动性优势的同时,提供更灵活的验证节点控制。 **背景与意义:** Lido V3 正朝着模块化质押方向发展。其新的 stVaults 原语旨在为不同用户提供更定制化的质押配置,而非强制所有人使用同一个通用资金池。这对于有特定节点运营商、费用安排、合规框架等需求的资产管理公司、ETP发行商和大型机构而言至关重要。 以太坊质押正成为机构投资组合的一部分,但机构通常需要了解验证节点表现、罚没风险、运营风险等更多细节。模块化的金库设计有助于解决这些问题,同时保持与stETH流动性的连接,从而在定制化质押和流动性访问之间取得平衡。 此次集成表明,以太坊质押生态正逐渐成熟,从早期吸引普通持有者参与,转向构建能够支持更大型、更受监管、操作更复杂的用户的产品。这对于以太坊作为DeFi、资产代币化和机构加密基础设施主要结算层的长期发展具有重要意义,意味着其质押市场正变得更加细分、可配置,并与机构资本更紧密地结合。

bitcoinist19分钟前

Lido V3 通过与 Luganodes 的 stVaults 扩展机构以太坊质押

bitcoinist19分钟前

渣打银行开出40倍“赌盘”,喊单UNI涨至100美元

渣打银行全球数字资产研究主管Geoff Kendrick近日发布报告,首次覆盖去中心化交易所Uniswap及其治理代币UNI,并给出了一个激进的长期预测:到2030年底,UNI价格有望从当前的约2.6美元飙升至100美元,涨幅近40倍。 报告的核心逻辑基于几条宏观主线:首先,全球链上代币化资产(RWA)规模预计将从目前的约3400亿美元激增至2028年的4万亿美元。其次,流入DeFi生态的代币化资产比例将从目前的约3.5%提升至2030年的30%,推动整体DeFi总锁仓价值(TVL)增长约37倍,达到2.7万亿美元。Uniswap作为核心流动性基础设施,将成为这波资金洪流的最大受益者。 此外,UNI的价值支撑已发生根本转变。自去年底激活“费用开关”并启动代币销毁机制后,UNI从纯粹的治理代币转变为具有通缩属性的生产性资产,能够直接捕获协议费用。报告将Uniswap比作YouTube式的开放平台,其网络效应和低边际成本模式相比Coinbase(Netflix模式)更具长尾优势。贝莱德、富达等传统机构已开始将Uniswap作为合规资产上链的交易接口,进一步巩固了其“链上纽交所”的潜在地位。 然而,报告也指出了UNI面临的挑战:一方面,Solana生态DEX及各类聚合器正在争夺用户流量;另一方面,RWA代币化的全球立法与合规进程若不及预期,将延迟宏大叙事的兑现。目前UNI价格较历史高点下跌超92%,市场对DeFi叙事仍显冷淡。 渣打银行的此次覆盖,标志着传统金融正以新的估值框架审视DeFi资产,关注点从投机转向网络效应与现金流。但通往2030年100美元目标的道路,注定充满不确定性。

marsbit26分钟前

渣打银行开出40倍“赌盘”,喊单UNI涨至100美元

marsbit26分钟前

交易

现货
合约

热门文章

如何购买CHIP

欢迎来到HTX.com!我们已经让购买USD.AI(CHIP)变得简单而便捷。跟随我们的逐步指南,放心开始您的加密货币之旅。第一步:创建您的HTX账户使用您的电子邮件、手机号码注册一个免费账户在HTX上。体验无忧的注册过程并解锁所有平台功能。立即注册第二步:前往买币页面,选择您的支付方式信用卡/借记卡购买:使用您的Visa或Mastercard即时购买USD.AI(CHIP)。余额购买:使用您HTX账户余额中的资金进行无缝交易。第三方购买:探索诸如Google Pay或Apple Pay等流行支付方法以增加便利性。C2C购买:在HTX平台上直接与其他用户交易。HTX场外交易台(OTC)购买:为大量交易者提供个性化服务和竞争性汇率。第三步:存储您的USD.AI(CHIP)购买完您的USD.AI(CHIP)后,将其存储在您的HTX账户钱包中。您也可以通过区块链转账将其发送到其他地方或者用于交易其他加密货币。第四步:交易USD.AI(CHIP)在HTX的现货市场轻松交易USD.AI(CHIP)。访问您的账户,选择您的交易对,执行您的交易,并实时监控。HTX为初学者和经验丰富的交易者提供了友好的用户体验。

573人学过发布于 2026.04.21更新于 2026.06.02

如何购买CHIP

相关讨论

欢迎来到HTX社区。在这里,您可以了解最新的平台发展动态并获得专业的市场意见。以下是用户对CHIP(CHIP)币价的意见。

活动图片