SemiAnalysis décortique le Kirin 9030 de Huawei : La finesse de gravure stagne, on plie la puce

marsbit发布于2026-06-15更新于2026-06-15

文章摘要

SemiAnalysis, via son laboratoire STEEL, a publié sa première analyse de démontage publique, ciblant le Kirin 9030 Pro de Huawei (fabriqué par SMIC en procédé N+3). Le rapport révèle que le pas métallique minimum (M0 pitch) du N+3 est de 32,5 nm, plus fin que celui de l'Intel 18A. Cependant, ceci est un indicateur isolé et la densité logique globale (113,4 MTr/mm²) est similaire au N6 de TSMC, mais obtenue à un coût bien supérieur en raison de l'utilisation d'une quadruple modélisation (SAQP) avec des DUV uniquement, sans EUV. Le Kirin 9030, de taille similaire à son prédécesseur, intègre plus de cœurs CPU/GPU/NPU et de cache grâce à la densité améliorée. Ses performances GPU rattrapent environ les flagships de 2022, mais le CPU, basé sur une architecture de type Cortex-X2 (2021), accuse un retard en IPC et en fréquence dû aux limitations du procédé de fabrication. Face à ces contraintes, Huawei mise sur une nouvelle voie : l'échelle Tau et le "LogicFolding" (pliage logique). Cette approche consiste à empiler verticalement des blocs logiques pour raccourcir les interconnexions, visant à atteindre 5 GHz et une densité équivalente élevée d'ici 2031. Bien que le calcul de densité pour la 3D diffère des méthodes traditionnelles, cette direction est stratégique. En conclusion, les contrôles à l'exportation n'ont pas arrêté les progrès sino-sémiconducteurs, mais en ont changé la trajectoire et le coût. SMIC prouve qu'une densité avancée est possible sans EUV, mais à un prix élev...

Rédaction : Chao Xiang Research

Dans le domaine de la rétro-ingénierie des semi-conducteurs, TechInsights a régné pendant des décennies. Ce week-end, Dylan Patel de SemiAnalysis a officiellement publié le premier rapport de démontage public de son laboratoire STEEL (Teardown Engineering & Evaluation Lab), ciblant directement l'une des puces les plus scrutées au monde : le Kirin 9030 Pro qui équipe le Huawei Mate 80 Pro, fabriqué en procédé N+3 le plus avancé de SMIC.

Le timing est révélateur. TechInsights est en cours de vente par des fonds de capital-investissement, tandis que les revenus de SemiAnalysis ont déjà dépassé ceux de ce vieux géant. Dylan a choisi ce moment pour dégainer, avec un rapport de démontage techniquement très dense, accompagné de photos réelles de la puce prises dans le laboratoire de l'Oregon.

Le titre du rapport est une bombe : Le pas minimum métallique (M0 pitch) du procédé N+3 de SMIC n'est que de 32,5 nm, plus fin que les 36 nm du procédé 18A utilisé par Intel dans son dernier processeur Panther Lake.

SMIC a réalisé un pas métallique plus fin qu'Intel sans machine de lithographie EUV ?

Cette information, si l'on ne regarde que le titre, serait suffisante pour faire exploser tout le monde des semi-conducteurs, mais SemiAnalysis lui-même tempère l'enthousiasme dès le deuxième paragraphe du rapport : c'est une "metrique choisie à dessein" (cherry picked metric).

Cet article vous décrypte ce rapport de démontage,

Densité rattrapée, coût élevé

Le procédé N+3 de SMIC a effectivement rattrapé la densité de transistors du N6 de TSMC.

Par analyse en coupe TEM (microscope électronique à transmission), le laboratoire STEEL a mesuré une densité Bohr de 113,4 MTr/mm² pour le N+3, légèrement supérieure aux 107,7 MTr/mm² du N6 de TSMC. La hauteur des cellules a été réduite de 252 nm (N+2) à 228 nm, et l'espacement entre grilles de contact (CGP) de 63 nm à 57 nm. Ces chiffres, pris ensemble, signifient que SMIC, sans EUV et uniquement avec de la lithographie DUV, a atteint une densité logique comparable au niveau du 7nm mature de TSMC.

À quel prix ?

La couche M0 de SMIC utilise un motif quadruple auto-aligné (SAQP), c'est-à-dire qu'un seul masque est traité quatre fois pour obtenir des lignes plus fines. TSMC N6 n'a besoin que d'un motif double (SADP) pour la même couche. Le quadruple signifie plus de masques, des exigences d'alignement plus strictes, des processus de fabrication plus complexes et un coût plus élevé.

SemiAnalysis voit directement le prix du SAQP dans les coupes : les tranchées M0 du N+3 présentent un profil en trapèze inversé marqué (le bas plus étroit que le haut), avec une bande d'enrichissement en couche barrière claire au fond. Cette morphologie aide au remplissage en cuivre, mais à un pas de 32,5 nm, la difficulté de contrôle du processus augmente considérablement.

Pour faire une analogie qu'un trader comprendrait : SMIC imprime des billets de la même valeur faciale, mais le coût d'impression de chacun est plusieurs fois supérieur à celui de TSMC, avec en plus un risque de rendement plus élevé. Densité égale, économie différente.

Kirin 9030 : Dans des conditions contraintes, exploiter chaque millimètre carré de silicium

Les capacités de conception de puces de HiSilicon (Huawei) relèvent d'une autre dimension.

En termes de surface de puce, le Kirin 9030 est presque aussi grand que le 9020 de la génération précédente (environ 140 mm²), mais on y a entassé plus d'éléments : le CPU est passé de 1 cœur large + 3 moyens à 1 large + 4 moyens, les unités de calcul du GPU sont passées de 4 à 6, le NPU a gagné un cœur Tiny supplémentaire, et les caches à tous les niveaux ont été augmentés. L'augmentation de densité du N+3 a permis à Huawei de caser plus d'unités logiques dans la même taille de puce.

En termes de performances, le laboratoire STEEL cite des données de benchmark publiques et donne un positionnement clair : Les performances GPU du Kirin 9030 (Maleoon 935) rattrapent globalement le niveau haut de gamme de 2022, avec un score 3DMark WLE en hausse de 70% par rapport à la génération précédente, légèrement supérieur au Snapdragon 8+ Gen 1, mais avec un écart de 2,4 à 2,6 fois par rapport au haut de gamme actuel, le Snapdragon 8 Elite Gen 5.

La situation du CPU est encore plus parlante. Les performances par cycle (IPC) du cœur large TaiShan Prime se situent globalement au niveau de l'Arm Cortex-X2, une conception de 2021. Le cœur Firestorm du M1 d'Apple, sorti en 2020, conserve un IPC supérieur de 35%. Le dernier cœur P de l'Apple M5 présente un IPC supérieur de 60%, avec des performances absolues 2,7 fois supérieures.

La source de l'écart n'est pas dans la conception, mais dans le procédé de fabrication. Apple et Qualcomm utilisent les procédés N4, N3P de TSMC, qui offrent un avantage fondamental sur la courbe tension-fréquence : on peut caser plus de transistors sur la même surface, et atteindre des fréquences plus élevées pour la même consommation. Le niveau de conception des cœurs de Huawei est comparable à celui de l'avant-dernière génération de l'industrie de pointe, mais ils sont enfermés dans un procédé de fabrication vieux de deux générations.

Quand la finesse de gravure stagne, Huawei se prépare à "plier"

La partie la plus prospective du rapport concerne la loi d'échelle τ et la feuille de route LogicFolding présentées par Huawei lors de la conférence ISCAS 2026.

La miniaturisation traditionnelle des semi-conducteurs progresse sur un plan bidimensionnel : réduire la taille des transistors et affiner les lignes métalliques. La loi de Moore a fonctionné pendant des décennies en faisant essentiellement cela. L'échelle τ proposée par Huawei déplace désormais l'objectif d'optimisation du domaine spatial vers le domaine temporel, l'essentiel étant de réduire le coût temporel du déplacement et du traitement des données, y compris le délai de commutation des transistors, le délai de propagation du signal, et les délais de calcul et de stockage.

LogicFolding est la mise en œuvre technique de cette théorie. En simplifiant, il s'agit de diviser un même module logique en deux couches, empilées face à face et connectées par des liaisons hybrides à pas ultra-fin. L'avantage direct est de raccourcir les trajets de signaux les plus longs. Dans les puces modernes, une part importante de la consommation et du délai est consacrée à piloter les interconnexions longues et les répéteurs. En pliant la logique verticalement, les chemins critiques se raccourcissent, la fréquence peut augmenter et la consommation diminuer.

Huawei présente une feuille de route ambitieuse : La fréquence du cœur large du Kirin 9030 est de 2,75 GHz, des échantillons de laboratoire ont déjà atteint 3,39 GHz, avec pour objectif d'atteindre 5 GHz d'ici 2031, tout en poussant la densité équivalente à 295 MTr/mm² via l'empilement 3D, visant un niveau comparable au 14A de TSMC.

SemiAnalysis reste prudent face à cela. Ils soulignent que la méthode de calcul de la densité de Huawei diffère de celle des fondeurs traditionnels : la densité en empilement 3D est calculée sur la surface du package ; en empilant plusieurs couches de logique active, on obtient naturellement un chiffre plus élevé. En utilisant la même méthode pour calculer celle du MI450X d'AMD (couche supérieure N2 + couche inférieure N3P), la densité théorique atteindrait 460,2 MTr/mm², dépassant largement l'objectif 2031 de Huawei.

Mais la direction en elle-même mérite attention. En prenant cette voie, Huawei s'attaque essentiellement, dans un contexte de contraintes process, à un travail qui relève habituellement des fondeurs. Le V-Cache d'AMD réalise un empilement 3D sur le cache, le MI350X d'AMD déplace les E/S et l'interconnexion vers la puce inférieure. Ce que Huawei veut faire est plus radical : diviser directement un même bloc logique et le répartir verticalement, ce qui représente un défi d'ingénierie d'un autre ordre.

Les contrôles à l'exportation redéfinissent les dimensions de la course

La conclusion de SemiAnalysis est directe : Les contrôles à l'exportation n'ont pas arrêté les progrès des puces chinoises, mais ils ont changé la trajectoire et le coût de ces progrès.

Le N+3 de SMIC prouve qu'on peut atteindre une densité logique de niveau N6 sans EUV. Mais cette voie est plus coûteuse, le processus est plus complexe et le rendement plus difficile à maîtriser. Pour aller plus loin, la difficulté marginale augmente à chaque étape : plus de masques, une précision d'alignement plus stricte, des motifs multiples plus coûteux. En théorie, le N+4 pourrait atteindre 137,8 MTr/mm² (visant le N5 de TSMC), et le N+5, avec l'ajout d'une alimentation par l'arrière, pourrait même s'approcher des bibliothèques HP de l'Intel 18A. Mais chaque étape est plus difficile, plus coûteuse et laisse moins de marge d'erreur que la précédente.

Parallèlement, les procédés N+2 et N+3 de SMIC sont en cours de transfert vers Huahong, et des sociétés de conception comme Alibaba's T-Head ou Cambricon pourraient également en bénéficier. La connaissance de la fabrication de puces se diffuse d'un seul fondeur vers un écosystème, ce qui dilue encore l'efficacité des sanctions ciblant une entreprise unique.

Et côté conception, Huawei et l'Université de Pékin développent déjà des prototypes d'outils EDA domestiques pour le LogicFolding. Cela ne remplace pas les chaînes d'outils complètes de Synopsys et Cadence, mais les EDA domestiques évoluent vers une "optimisation conjointe architecture-processus-packaging".

Un détail intéressant : STEEL a découvert lors du démontage que la DRAM du Kirin 9030 Pro provenait de Samsung (K4L2E165YD, LPDDR5X-9600, nœud 1a), tandis que la version Pro Max 16 Go présentait simultanément des puces emballées de Samsung et de ChangXin Memory (CXMT). La puce de CXMT portait une date d'emballage de la semaine 45 de 2025, avec une densité de procédé équivalente au niveau 1z de l'industrie. Cela signifie que les puces mémoire chinoises commencent à entrer dans la chaîne d'approvisionnement des flagships de Huawei, même si le procédé reste en retard d'une à deux générations sur Samsung et SK Hynix.

Pour les investisseurs, le signal véritablement intéressant à suivre est de savoir si la feuille de route d'empilement 3D de Huawei pourra, à un coût maîtrisé, permettre aux puces d'origine chinoise d'atteindre le seuil de "suffisance" dans des scénarios comme les smartphones, l'inférence IA ou les équipements réseau.

Une fois ce seuil de suffisance atteint, la valeur stratégique de cette chaîne d'approvisionnement sera réévaluée.

你可能也喜欢

西班牙被佛得角逼平，Jucom预测市场见证历史最大冷门

北京时间6月16日，2026年世界杯H组首轮爆出大冷门，夺冠热门西班牙队在占据压倒性数据优势（27次射门、74%控球率）的情况下，被世界杯新军佛得角0比0逼平。赛前，Jucom预测市场数据显示，市场押注西班牙获胜的概率高达92%，而实际结果与此高度一致的预期形成强烈反差。佛得角40岁门将沃齐尼亚贡献7次扑救，是球队逼平对手的关键。这场冷门事件迅速引发预测市场对相关预期的重新定价。市场正在重新评估西班牙队的小组头名出线概率、夺冠概率，以及佛得角队的小组出线可能性。这揭示了预测市场的核心机制：通过交易价格反映集体判断，并随着新信息的出现（如比赛结果）而快速调整预期。预测市场的价值不在于准确预知每一场比赛，而在于通过价格的实时变化，动态反映全球参与者对赛事发展的最新共识。随着世界杯赛事推进，市场将持续消化每一场比赛的结果，为观察赛事提供独特的动态视角。

链捕手1分钟前

链捕手1分钟前

USDe 绕开 GENIUS Act 收益禁令：合成美元如何成为加密最成功的灰色地带？

本文探讨了Ethena发行的合成美元稳定币USDe如何巧妙避开美国《GENIUS Act》中关于禁止支付型稳定币向持有人支付收益的规定。 USDe的核心机制并非持有法币或国债储备，而是通过收取加密抵押品并同时开设对冲的永续期货空头仓位，来维持美元价值稳定并赚取收益。持有人通过质押USDe获得sUSDe即可分享这部分收益。由于其本质是对冲衍生品交易策略而非传统储备模型，USDe不符合《GENIUS Act》对“支付型稳定币”的法定定义，从而置身于该法案的监管范围之外。 USDe曾一度成为市值第三大的美元计价加密资产，其收益来源于衍生品市场的资金费率与基差利差。这种设计使其在法律上区别于由发行人支付利息的传统稳定币。Ethena同时运营着完全合规、不支付收益的稳定币USDtb，突显了监管现状下的双重路径。监管态度呈现分歧：德国BaFin将其视为未注册证券并禁止销售，而美国大型资产管理公司Janus Henderson则已与Ethena合作，将USDe用于现金管理。文章指出，USDe的成功反映了市场对收益型美元产品的真实需求，但其与USDC等储备型稳定币存在本质不同——前者依赖衍生品策略，后者依赖法币储备，风险特征迥异。文章最终提出核心问题：监管机构是否会为“合成美元”这一类新兴工具专门划定监管边界，还是任由收益型产品持续流向现有法规的灰色地带。

Foresight News7分钟前

USDe 绕开 GENIUS Act 收益禁令：合成美元如何成为加密最成功的灰色地带？

Foresight News7分钟前

Lido V3 通过与 Luganodes 的 stVaults 扩展机构以太坊质押

Lido的机构质押业务新增基础设施支持，专业节点运营商Luganodes已集成Lido V3，并基于该协议新的stVaults原语推出了以太坊质押金库。该集成面向那些希望在保持与更广泛的stETH生态系统连接的同时，对验证节点风险敞口、风险设置、费用结构和运营要求拥有更多控制权的机构用户。 **摘要要点：** * Luganodes 已集成 Lido V3。 * 该方案使用了 Lido 新的 stVaults 原语。 * 该产品主要面向机构以太坊质押用户。 * 目标是在保留 stETH 流动性优势的同时，提供更灵活的验证节点控制。 **背景与意义：** Lido V3 正朝着模块化质押方向发展。其新的 stVaults 原语旨在为不同用户提供更定制化的质押配置，而非强制所有人使用同一个通用资金池。这对于有特定节点运营商、费用安排、合规框架等需求的资产管理公司、ETP发行商和大型机构而言至关重要。以太坊质押正成为机构投资组合的一部分，但机构通常需要了解验证节点表现、罚没风险、运营风险等更多细节。模块化的金库设计有助于解决这些问题，同时保持与stETH流动性的连接，从而在定制化质押和流动性访问之间取得平衡。此次集成表明，以太坊质押生态正逐渐成熟，从早期吸引普通持有者参与，转向构建能够支持更大型、更受监管、操作更复杂的用户的产品。这对于以太坊作为DeFi、资产代币化和机构加密基础设施主要结算层的长期发展具有重要意义，意味着其质押市场正变得更加细分、可配置，并与机构资本更紧密地结合。

bitcoinist19分钟前

Lido V3 通过与 Luganodes 的 stVaults 扩展机构以太坊质押

bitcoinist19分钟前

渣打银行开出40倍“赌盘”，喊单UNI涨至100美元

渣打银行全球数字资产研究主管Geoff Kendrick近日发布报告，首次覆盖去中心化交易所Uniswap及其治理代币UNI，并给出了一个激进的长期预测：到2030年底，UNI价格有望从当前的约2.6美元飙升至100美元，涨幅近40倍。报告的核心逻辑基于几条宏观主线：首先，全球链上代币化资产（RWA）规模预计将从目前的约3400亿美元激增至2028年的4万亿美元。其次，流入DeFi生态的代币化资产比例将从目前的约3.5%提升至2030年的30%，推动整体DeFi总锁仓价值（TVL）增长约37倍，达到2.7万亿美元。Uniswap作为核心流动性基础设施，将成为这波资金洪流的最大受益者。此外，UNI的价值支撑已发生根本转变。自去年底激活“费用开关”并启动代币销毁机制后，UNI从纯粹的治理代币转变为具有通缩属性的生产性资产，能够直接捕获协议费用。报告将Uniswap比作YouTube式的开放平台，其网络效应和低边际成本模式相比Coinbase（Netflix模式）更具长尾优势。贝莱德、富达等传统机构已开始将Uniswap作为合规资产上链的交易接口，进一步巩固了其“链上纽交所”的潜在地位。然而，报告也指出了UNI面临的挑战：一方面，Solana生态DEX及各类聚合器正在争夺用户流量；另一方面，RWA代币化的全球立法与合规进程若不及预期，将延迟宏大叙事的兑现。目前UNI价格较历史高点下跌超92%，市场对DeFi叙事仍显冷淡。渣打银行的此次覆盖，标志着传统金融正以新的估值框架审视DeFi资产，关注点从投机转向网络效应与现金流。但通往2030年100美元目标的道路，注定充满不确定性。

marsbit26分钟前

marsbit26分钟前

对山寨币还有执念的人，冲HOOD就行了

本文分析了Robinhood（HOOD）近期股价走强的原因，并建议对山寨币仍有执念的投资者可考虑转投HOOD。文章指出，HOOD近期上涨源于多个维度利好：基本面方面，平台五月多项运营数据创历史新高；消息面上，其自建预测市场可截流收入、获批担任IPO承销商、并被选为“特朗普账户”的默认券商，均带来增长潜力；市场动向方面，公司董事持续增持，多家机构上调目标价。作者核心观点在于，HOOD正逐渐摆脱对加密货币业务的依赖。历史数据显示，其加密收入占比呈下降趋势，股价与比特币的关联性近期也出现背离。这意味着，即便加密市场持续低迷，HOOD的股票交易、预测市场、IPO承销等业务仍能支撑增长；而若加密牛市回归，HOOD同样能受益。因此，对于仍看好加密赛道但担心山寨币风险的投资者而言，HOOD提供了一个风险相对更低、且能双向受益于传统金融与加密市场发展的替代选择。

marsbit34分钟前

marsbit34分钟前

交易

现货

合约

SemiAnalysis décortique le Kirin 9030 de Huawei : La finesse de gravure stagne, on plie la puce

文章摘要

Densité rattrapée, coût élevé

Kirin 9030 : Dans des conditions contraintes, exploiter chaque millimètre carré de silicium

Quand la finesse de gravure stagne, Huawei se prépare à "plier"

Les contrôles à l'exportation redéfinissent les dimensions de la course

相关问答

你可能也喜欢

西班牙被佛得角逼平，Jucom预测市场见证历史最大冷门

USDe 绕开 GENIUS Act 收益禁令：合成美元如何成为加密最成功的灰色地带？

Lido V3 通过与 Luganodes 的 stVaults 扩展机构以太坊质押

渣打银行开出40倍“赌盘”，喊单UNI涨至100美元

对山寨币还有执念的人，冲HOOD就行了

交易

热门文章

如何购买CHIP

USD.AI：为GPU搭建链上结构化融资基础设施

成长学院：学习 CHIP，瓜分价值 5000 USDT代币奖励

相关讨论

热门问答

热门分类

热门标签