SemiAnalysis décortique le Kirin 9030 de Huawei : La finesse de gravure stagne, on plie la puce

marsbitDipublikasikan tanggal 2026-06-15Terakhir diperbarui pada 2026-06-15

Abstrak

SemiAnalysis, via son laboratoire STEEL, a publié sa première analyse de démontage publique, ciblant le Kirin 9030 Pro de Huawei (fabriqué par SMIC en procédé N+3). Le rapport révèle que le pas métallique minimum (M0 pitch) du N+3 est de 32,5 nm, plus fin que celui de l'Intel 18A. Cependant, ceci est un indicateur isolé et la densité logique globale (113,4 MTr/mm²) est similaire au N6 de TSMC, mais obtenue à un coût bien supérieur en raison de l'utilisation d'une quadruple modélisation (SAQP) avec des DUV uniquement, sans EUV. Le Kirin 9030, de taille similaire à son prédécesseur, intègre plus de cœurs CPU/GPU/NPU et de cache grâce à la densité améliorée. Ses performances GPU rattrapent environ les flagships de 2022, mais le CPU, basé sur une architecture de type Cortex-X2 (2021), accuse un retard en IPC et en fréquence dû aux limitations du procédé de fabrication. Face à ces contraintes, Huawei mise sur une nouvelle voie : l'échelle Tau et le "LogicFolding" (pliage logique). Cette approche consiste à empiler verticalement des blocs logiques pour raccourcir les interconnexions, visant à atteindre 5 GHz et une densité équivalente élevée d'ici 2031. Bien que le calcul de densité pour la 3D diffère des méthodes traditionnelles, cette direction est stratégique. En conclusion, les contrôles à l'exportation n'ont pas arrêté les progrès sino-sémiconducteurs, mais en ont changé la trajectoire et le coût. SMIC prouve qu'une densité avancée est possible sans EUV, mais à un prix élev...

Rédaction : Chao Xiang Research

Dans le domaine de la rétro-ingénierie des semi-conducteurs, TechInsights a régné pendant des décennies. Ce week-end, Dylan Patel de SemiAnalysis a officiellement publié le premier rapport de démontage public de son laboratoire STEEL (Teardown Engineering & Evaluation Lab), ciblant directement l'une des puces les plus scrutées au monde : le Kirin 9030 Pro qui équipe le Huawei Mate 80 Pro, fabriqué en procédé N+3 le plus avancé de SMIC.

Le timing est révélateur. TechInsights est en cours de vente par des fonds de capital-investissement, tandis que les revenus de SemiAnalysis ont déjà dépassé ceux de ce vieux géant. Dylan a choisi ce moment pour dégainer, avec un rapport de démontage techniquement très dense, accompagné de photos réelles de la puce prises dans le laboratoire de l'Oregon.

Le titre du rapport est une bombe : Le pas minimum métallique (M0 pitch) du procédé N+3 de SMIC n'est que de 32,5 nm, plus fin que les 36 nm du procédé 18A utilisé par Intel dans son dernier processeur Panther Lake.

SMIC a réalisé un pas métallique plus fin qu'Intel sans machine de lithographie EUV ?

Cette information, si l'on ne regarde que le titre, serait suffisante pour faire exploser tout le monde des semi-conducteurs, mais SemiAnalysis lui-même tempère l'enthousiasme dès le deuxième paragraphe du rapport : c'est une "metrique choisie à dessein" (cherry picked metric).

Cet article vous décrypte ce rapport de démontage,

Densité rattrapée, coût élevé

Le procédé N+3 de SMIC a effectivement rattrapé la densité de transistors du N6 de TSMC.

Par analyse en coupe TEM (microscope électronique à transmission), le laboratoire STEEL a mesuré une densité Bohr de 113,4 MTr/mm² pour le N+3, légèrement supérieure aux 107,7 MTr/mm² du N6 de TSMC. La hauteur des cellules a été réduite de 252 nm (N+2) à 228 nm, et l'espacement entre grilles de contact (CGP) de 63 nm à 57 nm. Ces chiffres, pris ensemble, signifient que SMIC, sans EUV et uniquement avec de la lithographie DUV, a atteint une densité logique comparable au niveau du 7nm mature de TSMC.

À quel prix ?

La couche M0 de SMIC utilise un motif quadruple auto-aligné (SAQP), c'est-à-dire qu'un seul masque est traité quatre fois pour obtenir des lignes plus fines. TSMC N6 n'a besoin que d'un motif double (SADP) pour la même couche. Le quadruple signifie plus de masques, des exigences d'alignement plus strictes, des processus de fabrication plus complexes et un coût plus élevé.

SemiAnalysis voit directement le prix du SAQP dans les coupes : les tranchées M0 du N+3 présentent un profil en trapèze inversé marqué (le bas plus étroit que le haut), avec une bande d'enrichissement en couche barrière claire au fond. Cette morphologie aide au remplissage en cuivre, mais à un pas de 32,5 nm, la difficulté de contrôle du processus augmente considérablement.

Pour faire une analogie qu'un trader comprendrait : SMIC imprime des billets de la même valeur faciale, mais le coût d'impression de chacun est plusieurs fois supérieur à celui de TSMC, avec en plus un risque de rendement plus élevé. Densité égale, économie différente.

Kirin 9030 : Dans des conditions contraintes, exploiter chaque millimètre carré de silicium

Les capacités de conception de puces de HiSilicon (Huawei) relèvent d'une autre dimension.

En termes de surface de puce, le Kirin 9030 est presque aussi grand que le 9020 de la génération précédente (environ 140 mm²), mais on y a entassé plus d'éléments : le CPU est passé de 1 cœur large + 3 moyens à 1 large + 4 moyens, les unités de calcul du GPU sont passées de 4 à 6, le NPU a gagné un cœur Tiny supplémentaire, et les caches à tous les niveaux ont été augmentés. L'augmentation de densité du N+3 a permis à Huawei de caser plus d'unités logiques dans la même taille de puce.

En termes de performances, le laboratoire STEEL cite des données de benchmark publiques et donne un positionnement clair : Les performances GPU du Kirin 9030 (Maleoon 935) rattrapent globalement le niveau haut de gamme de 2022, avec un score 3DMark WLE en hausse de 70% par rapport à la génération précédente, légèrement supérieur au Snapdragon 8+ Gen 1, mais avec un écart de 2,4 à 2,6 fois par rapport au haut de gamme actuel, le Snapdragon 8 Elite Gen 5.

La situation du CPU est encore plus parlante. Les performances par cycle (IPC) du cœur large TaiShan Prime se situent globalement au niveau de l'Arm Cortex-X2, une conception de 2021. Le cœur Firestorm du M1 d'Apple, sorti en 2020, conserve un IPC supérieur de 35%. Le dernier cœur P de l'Apple M5 présente un IPC supérieur de 60%, avec des performances absolues 2,7 fois supérieures.

La source de l'écart n'est pas dans la conception, mais dans le procédé de fabrication. Apple et Qualcomm utilisent les procédés N4, N3P de TSMC, qui offrent un avantage fondamental sur la courbe tension-fréquence : on peut caser plus de transistors sur la même surface, et atteindre des fréquences plus élevées pour la même consommation. Le niveau de conception des cœurs de Huawei est comparable à celui de l'avant-dernière génération de l'industrie de pointe, mais ils sont enfermés dans un procédé de fabrication vieux de deux générations.

Quand la finesse de gravure stagne, Huawei se prépare à "plier"

La partie la plus prospective du rapport concerne la loi d'échelle τ et la feuille de route LogicFolding présentées par Huawei lors de la conférence ISCAS 2026.

La miniaturisation traditionnelle des semi-conducteurs progresse sur un plan bidimensionnel : réduire la taille des transistors et affiner les lignes métalliques. La loi de Moore a fonctionné pendant des décennies en faisant essentiellement cela. L'échelle τ proposée par Huawei déplace désormais l'objectif d'optimisation du domaine spatial vers le domaine temporel, l'essentiel étant de réduire le coût temporel du déplacement et du traitement des données, y compris le délai de commutation des transistors, le délai de propagation du signal, et les délais de calcul et de stockage.

LogicFolding est la mise en œuvre technique de cette théorie. En simplifiant, il s'agit de diviser un même module logique en deux couches, empilées face à face et connectées par des liaisons hybrides à pas ultra-fin. L'avantage direct est de raccourcir les trajets de signaux les plus longs. Dans les puces modernes, une part importante de la consommation et du délai est consacrée à piloter les interconnexions longues et les répéteurs. En pliant la logique verticalement, les chemins critiques se raccourcissent, la fréquence peut augmenter et la consommation diminuer.

Huawei présente une feuille de route ambitieuse : La fréquence du cœur large du Kirin 9030 est de 2,75 GHz, des échantillons de laboratoire ont déjà atteint 3,39 GHz, avec pour objectif d'atteindre 5 GHz d'ici 2031, tout en poussant la densité équivalente à 295 MTr/mm² via l'empilement 3D, visant un niveau comparable au 14A de TSMC.

SemiAnalysis reste prudent face à cela. Ils soulignent que la méthode de calcul de la densité de Huawei diffère de celle des fondeurs traditionnels : la densité en empilement 3D est calculée sur la surface du package ; en empilant plusieurs couches de logique active, on obtient naturellement un chiffre plus élevé. En utilisant la même méthode pour calculer celle du MI450X d'AMD (couche supérieure N2 + couche inférieure N3P), la densité théorique atteindrait 460,2 MTr/mm², dépassant largement l'objectif 2031 de Huawei.

Mais la direction en elle-même mérite attention. En prenant cette voie, Huawei s'attaque essentiellement, dans un contexte de contraintes process, à un travail qui relève habituellement des fondeurs. Le V-Cache d'AMD réalise un empilement 3D sur le cache, le MI350X d'AMD déplace les E/S et l'interconnexion vers la puce inférieure. Ce que Huawei veut faire est plus radical : diviser directement un même bloc logique et le répartir verticalement, ce qui représente un défi d'ingénierie d'un autre ordre.

Les contrôles à l'exportation redéfinissent les dimensions de la course

La conclusion de SemiAnalysis est directe : Les contrôles à l'exportation n'ont pas arrêté les progrès des puces chinoises, mais ils ont changé la trajectoire et le coût de ces progrès.

Le N+3 de SMIC prouve qu'on peut atteindre une densité logique de niveau N6 sans EUV. Mais cette voie est plus coûteuse, le processus est plus complexe et le rendement plus difficile à maîtriser. Pour aller plus loin, la difficulté marginale augmente à chaque étape : plus de masques, une précision d'alignement plus stricte, des motifs multiples plus coûteux. En théorie, le N+4 pourrait atteindre 137,8 MTr/mm² (visant le N5 de TSMC), et le N+5, avec l'ajout d'une alimentation par l'arrière, pourrait même s'approcher des bibliothèques HP de l'Intel 18A. Mais chaque étape est plus difficile, plus coûteuse et laisse moins de marge d'erreur que la précédente.

Parallèlement, les procédés N+2 et N+3 de SMIC sont en cours de transfert vers Huahong, et des sociétés de conception comme Alibaba's T-Head ou Cambricon pourraient également en bénéficier. La connaissance de la fabrication de puces se diffuse d'un seul fondeur vers un écosystème, ce qui dilue encore l'efficacité des sanctions ciblant une entreprise unique.

Et côté conception, Huawei et l'Université de Pékin développent déjà des prototypes d'outils EDA domestiques pour le LogicFolding. Cela ne remplace pas les chaînes d'outils complètes de Synopsys et Cadence, mais les EDA domestiques évoluent vers une "optimisation conjointe architecture-processus-packaging".

Un détail intéressant : STEEL a découvert lors du démontage que la DRAM du Kirin 9030 Pro provenait de Samsung (K4L2E165YD, LPDDR5X-9600, nœud 1a), tandis que la version Pro Max 16 Go présentait simultanément des puces emballées de Samsung et de ChangXin Memory (CXMT). La puce de CXMT portait une date d'emballage de la semaine 45 de 2025, avec une densité de procédé équivalente au niveau 1z de l'industrie. Cela signifie que les puces mémoire chinoises commencent à entrer dans la chaîne d'approvisionnement des flagships de Huawei, même si le procédé reste en retard d'une à deux générations sur Samsung et SK Hynix.

Pour les investisseurs, le signal véritablement intéressant à suivre est de savoir si la feuille de route d'empilement 3D de Huawei pourra, à un coût maîtrisé, permettre aux puces d'origine chinoise d'atteindre le seuil de "suffisance" dans des scénarios comme les smartphones, l'inférence IA ou les équipements réseau.

Une fois ce seuil de suffisance atteint, la valeur stratégique de cette chaîne d'approvisionnement sera réévaluée.

Pertanyaan Terkait

QQuelle est la signification de la découverte selon laquelle le pas métallique (M0 pitch) du procédé SMIC N+3 est de 32,5 nm, et pourquoi ce chiffre est-il considéré comme une métrique choisie à dessein (cherry picked) ?

ALe pas métallique de 32,5 nm du procédé SMIC N+3 est plus fin que celui de 36 nm du procédé Intel 18A. Cette métrique, isolée, suggérerait une supériorité technique. Cependant, elle est qualifiée de 'cherry picked' car elle ne reflète pas la réalité globale du procédé. Pour atteindre cette finesse sans machine EUV, SMIC utilise un modèle complexe et coûteux d'auto-alignement quadruple (SAQP), contrairement aux procédés plus avancés comme ceux d'Intel ou de TSMC qui utilisent des méthodes plus simples et offrent de meilleures performances globales (fréquence, consommation).

QQuels sont les compromis et les coûts associés à la réalisation par SMIC d'une densité transistor équivalente au procédé N6 de TSMC sans utiliser de lithographie EUV ?

APour égaler la densité du N6 de TSMC sans EUV, SMIC utilise le procédé N+3 basé uniquement sur la lithographie DUV. Le principal compromis est l'utilisation intensive de la quadruple photolithographie par auto-alignement (SAQP) pour les couches métalliques les plus fines, nécessitant bien plus d'étapes de masquage et de gravure que les procédés concurrents. Cela entraîne une complexité manufacturière accrue, des risques de défauts plus élevés, une maîtrise de la morphologie des tranchées plus difficile et, en fin de compte, un coût de production par puce bien supérieur à celui des fonderies utilisant l'EUV.

QD'après le rapport, comment se positionnent les performances du SoC Kirin 9030 par rapport aux puces concurrentes récentes, et quelles en sont les principales limitations ?

ALe Kirin 9030 atteint des performances de GPU comparables à celles d'un haut de gamme de 2022 (dépassant le Snapdragon 8+ Gen 1) mais reste 2,4 à 2,6 fois moins performant que les GPU de pointe actuels (Snapdragon 8 Elite Gen 5). Son cœur CPU TaiShan Prime a une performance par cycle (IPC) proche du Cortex-X2 de 2021, mais est nettement devancé par les cœurs Apple récents (35% derrière le M1, 60% derrière le M5). La limitation principale n'est pas la conception, mais le processus de fabrication (N+3 de SMIC), qui est en retard de deux générations par rapport aux N4/N3P de TSMC utilisés par Apple et Qualcomm, limitant la fréquence et l'efficacité énergétique.

QQue signifient les concepts de 'loi d'échelle τ (tau)' et de 'LogicFolding' présentés par Huawei, et quel est leur objectif stratégique ?

ALa 'loi d'échelle τ' et le 'LogicFolding' sont des concepts présentés par Huawei pour contourner les limitations des progrès en finesse de gravure. Au lieu de se concentrer uniquement sur la miniaturisation 2D, ils visent à optimiser les délais temporels (τ) en réduisant les distances de déplacement des données. Le 'LogicFolding' est sa mise en œuvre : il s'agit d'empiler verticalement (3D) deux couches d'un même bloc logique, connectées par des liaisons hybrides à très faible espacement. Cela raccourcit les chemins de signaux critiques, permettant potentiellement d'augmenter la fréquence, de réduire la consommation, et d'atteindre une densité équivalente plus élevée par unité de surface de package. L'objectif stratégique est de continuer à progresser en performances lorsque l'accès aux procédés de fabrication de pointe (comme les nœuds avancés d'après le 3 nm) est entravé.

QQuelle est la conclusion principale du rapport de SemiAnalysis concernant l'impact des contrôles à l'exportation sur le progrès des semi-conducteurs en Chine ?

ALa conclusion principale est que les contrôles à l'exportation n'ont pas arrêté les progrès des semi-conducteurs en Chine, mais qu'ils en ont radicalement modifié la trajectoire et le coût. La voie choisie (comme le N+3 de SMIC sans EUV) permet d'atteindre des densités comparables, mais à un coût bien plus élevé, avec une complexité de fabrication accrue et des marges de progression futures plus difficiles. Parallèlement, ces restrictions stimulent l'innovation dans des domaines alternatifs comme le 3D stacking (LogicFolding) et le développement d'outils EDA domestiques, et favorisent la diffusion des connaissances à travers l'écosystème chinois (transfert de procédés à d'autres fonderies, intégration de mémoires nationales). L'enjeu futur est de savoir si ces nouvelles approches pourront produire des puces 'suffisantes' à un coût viable pour les applications clés.

Bacaan Terkait

7 Pertanyaan Kunci tentang "DeepSeek Selesaikan Pendanaan Lebih dari 50 Miliar Yuan"

DeepSeek dikabarkan telah menyelesaikan putaran pendanaan pertamanya dengan nilai lebih dari 50 miliar yuan RMB, mendorong valuasi perusahaan melampaui 50 miliar dolar AS. Laporan dari The Information menyebutkan pendanaan ini belum dikonfirmasi secara resmi. Putaran pendanaan yang dimulai April 2026 ini menonjol karena struktur khususnya: sebagian besar investor, termasuk Tencent, CATL, JD.com, dan IDG Capital, menanamkan dana ke dalam kemitraan terbatas yang dikendalikan oleh pendiri DeepSeek Liang Wenfeng, dengan periode penguncian saham 5 tahun dan tanpa hak suara. Pengecualian diberikan kepada Dana Industri Kecerdasan Buatan Nasional yang berinvestasi langsung dengan hak suara. Struktur ini dirancang untuk mempertahankan kendali absolut Liang Wenfeng atas perusahaan dan memastikan investor adalah modal sabar yang sejalan dengan visi jangka panjang DeepSeek menuju AGI (Kecerdasan Buatan Umum), bukan keuntungan jangka pendek. Investasi strategis dari Tencent didasari sinergi bisnis yang ada, sementara CATL tertarik pada potensi solusi energi untuk pusat data AI DeepSeek. Keikutsertaan dana negara mencerminkan pentingnya strategis DeepSeek dalam lanskap AI nasional. Dana yang terkumpul akan digunakan untuk pengembangan model baru (termasuk dukungan gambar/audio), infrastruktur seperti pusat data di Mongolia Dalam, dan perekrutan talenta. Tantangan ke depan adalah menyeimbangkan visi idealis pendiri dengan ekspektasi komersial dari investor.

marsbit20m yang lalu

7 Pertanyaan Kunci tentang "DeepSeek Selesaikan Pendanaan Lebih dari 50 Miliar Yuan"

marsbit20m yang lalu

Piala Dunia Tiba, Perang Pintu Masuk Pasar Prediksi Telah Dimulai

Dengan dimulainya Piala Dunia 2026, pasar prediksi (Prediction Market) menjadi sorotan sebagai alat baru bagi penggemar untuk terlibat lebih dari sekadar menonton. Platform seperti Polymarket memungkinkan orang bertaruh pada berbagai hasil, mulai dari juara hingga pencetak gol terbanyak, mengubah kebijaksanaan kolektif menjadi peluang finansial. Namun, tantangan utama adopsi massal adalah kompleksitas teknis seperti dompet kripto dan transaksi on-chain. Di sinilah peran bursa terpusat (CEX) seperti Gate menjadi krusial. Gate, sebagai CEX pertama yang mengintegrasikan Polymarket, menyederhanakan prosesnya. Pengguna dapat berpartisipasi hanya dengan akun Gate dan USDT, menghilangkan hambatan seperti pembuatan dompet dan biaya gas. Platform ini menawarkan dua mode: mode "Prediksi" yang sederhana untuk pemula dan mode "Perdagangan" yang lebih canggih dengan buku pesanan dan grafik. Gate juga membangun ekosistem pendukung yang mencakup peringkat "uang pintar" (smart money), pelacakan alamat dompet, umpan Live, dan analisis AI untuk membantu pengguna membuat keputusan berdasarkan informasi. Menyambut Piala Dunia, Gate meluncurkan hub khusus yang mengagregat jadwal, klasemen, dan pasar prediksi terkait turnamen, menyatukan pengalaman menonton dan berpartisipasi. Intinya, masa depan pasar prediksi terletak pada kemampuan menjangkau audiens yang lebih luas. Dengan menyembunyikan kompleksitas blockchain dan memberikan pengalaman pengguna yang lancar, gatekeeper seperti Gate berperan penting dalam mentransformasi pasar prediksi dari alat niche di ekosistem kripto menjadi pasar yang dapat diakses oleh publik mainstream, di mana setiap orang dapat memperdagangkan penilaian dan pengetahuan mereka.

Odaily星球日报30m yang lalu

Piala Dunia Tiba, Perang Pintu Masuk Pasar Prediksi Telah Dimulai

Odaily星球日报30m yang lalu

Trading

Spot
Futures

Artikel Populer

Cara Membeli CHIP

Selamat datang di HTX.com! Kami telah membuat pembelian USD.AI (CHIP) menjadi mudah dan nyaman. Ikuti panduan langkah demi langkah kami untuk memulai perjalanan kripto Anda.Langkah 1: Buat Akun HTX AndaGunakan alamat email atau nomor ponsel Anda untuk mendaftar akun gratis di HTX. Rasakan perjalanan pendaftaran yang mudah dan buka semua fitur.Dapatkan Akun SayaLangkah 2: Buka Beli Kripto, lalu Pilih Metode Pembayaran AndaKartu Kredit/Debit: Gunakan Visa atau Mastercard Anda untuk membeli USD.AI (CHIP) secara instan.Saldo: Gunakan dana dari saldo akun HTX Anda untuk melakukan trading dengan lancar.Pihak Ketiga: Kami telah menambahkan metode pembayaran populer seperti Google Pay dan Apple Pay untuk meningkatkan kenyamanan.P2P: Lakukan trading langsung dengan pengguna lain di HTX.Over-the-Counter (OTC): Kami menawarkan layanan yang dibuat khusus dan kurs yang kompetitif bagi para trader.Langkah 3: Simpan USD.AI (CHIP) AndaSetelah melakukan pembelian, simpan USD.AI (CHIP) di akun HTX Anda. Selain itu, Anda dapat mengirimkannya ke tempat lain melalui transfer blockchain atau menggunakannya untuk memperdagangkan mata uang kripto lainnya.Langkah 4: Lakukan trading USD.AI (CHIP)Lakukan trading USD.AI (CHIP) dengan mudah di pasar spot HTX. Cukup akses akun Anda, pilih pasangan perdagangan, jalankan trading, lalu pantau secara real-time. Kami menawarkan pengalaman yang ramah pengguna baik untuk pemula maupun trader berpengalaman.

266 Total TayanganDipublikasikan pada 2026.04.21Diperbarui pada 2026.06.02

Cara Membeli CHIP

Diskusi

Selamat datang di Komunitas HTX. Di sini, Anda bisa terus mendapatkan informasi terbaru tentang perkembangan platform terkini dan mendapatkan akses ke wawasan pasar profesional. Pendapat pengguna mengenai harga CHIP (CHIP) disajikan di bawah ini.

活动图片