SemiAnalysis desmonta el Kirin 9030 de Huawei: Cuando la evolución del proceso se estanca, se pliega el chip

marsbit發佈於 2026-06-15更新於 2026-06-15

文章摘要

El informe de SemiAnalysis sobre el chip Kirin 9030 de Huawei revela que el proceso N+3 de SMIC logra una densidad lógica similar a la de N6 de TSMC (113.4 MTr/mm²), pero con un coste mayor al usar SAQP con DUV en lugar de EUV. Aunque la densidad mejora, el rendimiento del chip, comparable al de diseños de 2021-2022, sigue rezagado frente a los chips actuales fabricados en nodos avanzados (como N3P de TSMC), debido a limitaciones de proceso. Para superar estas barreras, Huawei apuesta por la "escalado τ" y "LogicFolding": apilar lógicamente módulos en 3D para reducir rutas de señal, mejorar frecuencia (objetivo de 5GHz para 2031) y aumentar densidad equivalente. El informe concluye que las sanciones no han detenido el avance chino, pero sí lo han encarecido y redirigido hacia soluciones de diseño y empaquetado más complejas.

Autor: Investigación Chao Xiang

En el campo de la ingeniería inversa de semiconductores, TechInsights ha dominado durante décadas. El fin de semana pasado, Dylan Patel de SemiAnalysis publicó oficialmente el primer informe público de desmontaje de su laboratorio STEEL (Teardown Engineering & Evaluation Lab), dirigiéndose directamente a uno de los chips más observados del mundo: el Kirin 9030 Pro, que utiliza el proceso N+3 más avanzado de SMIC, instalado en el Huawei Mate 80 Pro.

El momento es intrigante. TechInsights está siendo vendido por capital privado, mientras que los ingresos de SemiAnalysis ya han superado a los de este gigante consolidado. Dylan eligió este momento para mostrar sus cartas con un informe de desmontaje de alto contenido técnico, acompañado de fotografías reales del chip tomadas en un laboratorio de Oregón.

El título del informe es una bomba: El espaciado mínimo de metal (pitch M0) del proceso N+3 de SMIC es de solo 32.5 nm, más fino que los 36 nm del proceso 18A de Intel utilizado en su procesador Panther Lake más reciente.

¿SMIC ha logrado un espaciado de metal más fino que Intel sin máquinas de litografía EUV?

Esta noticia, si solo se lee el titular, sería suficiente para hacer estallar la industria de los semiconductores, pero el propio SemiAnalysis enfría los ánimos en el segundo párrafo del informe: se trata de una "métrica seleccionada a propósito" (cherry picked metric).

Este artículo interpretará ese informe de desmontaje,

Densidad igualada, costo elevado

El proceso N+3 de SMIC iguala efectivamente la densidad de transistores del N6 de TSMC.

El laboratorio STEEL, mediante análisis de secciones transversales con TEM (microscopio electrónico de transmisión), midió que la densidad Bohr de N+3 es de 113.4 MTr/mm², ligeramente superior a los 107.7 MTr/mm² del N6 de TSMC. La altura de celda se redujo de 252 nm en N+2 a 228 nm, y el espaciado de puerta de contacto (CGP) de 63 nm a 57 nm. Estos números juntos significan que SMIC, sin EUV, utilizando solo litografía DUV, ha llevado la densidad lógica a un nivel comparable al proceso maduro de 7 nm de TSMC.

¿Cuál es el costo?

La capa M0 de SMIC utiliza patrones cuádruples autocalineados (SAQP), que procesan un patrón de máscara cuatro veces para lograr líneas más finas. El N6 de TSMC en la misma capa solo necesita patrones dobles (SADP). Cuádruple significa más máscaras, requisitos de alineación más estrictos, flujos de proceso más complejos y mayor coste.

SemiAnalysis vio directamente el costo del SAQP en las imágenes de la sección transversal: las zanjas M0 de N+3 muestran un perfil claramente trapezoidal invertido (más estrechas en el fondo que en la parte superior), y el fondo de la zanja tiene una banda clara de acumulación de capa de barrera. Esta morfología ayuda al relleno de cobre, pero a un espaciado de 32.5 nm, la dificultad de control del proceso aumenta drásticamente.

En una analogía que un trader entendería: SMIC está imprimiendo billetes del mismo valor nominal, pero el coste de impresión de cada uno es varias veces mayor que el de TSMC, y el riesgo de rendimiento es mayor. La densidad es la misma, la economía es completamente diferente.

Kirin 9030: Exprimiendo cada milímetro cuadrado de silicio bajo restricciones

La capacidad de diseño de chips de HiSilicon (Huawei) es una historia de otra dimensión.

Por área del chip, el Kirin 9030 y la generación anterior 9020 son casi del mismo tamaño (~140 mm²), pero se ha metido más dentro: la CPU pasó de 1 núcleo grande + 3 medianos a 1 grande + 4 medianos, las unidades de cálculo de la GPU aumentaron de 4 a 6, la NPU ganó un núcleo Tiny adicional y las cachés de todos los niveles se ampliaron. La mejora de densidad de N+3 permite a Huawei empaquetar más lógica en el mismo tamaño de chip.

En rendimiento, el laboratorio STEEL cita datos de benchmarks públicos, dando una posición clara: el rendimiento de la GPU del Kirin 9030 (Maleoon 935) se acerca aproximadamente al nivel *flagship* de 2022. El benchmark 3DMark WLE mejora un 70% respecto a la generación anterior, superando ligeramente al Snapdragon 8+ Gen 1, pero en comparación con el *flagship* actual Snapdragon 8 Elite Gen 5, la diferencia es de 2.4 a 2.6 veces.

La situación de la CPU ilustra mejor el problema. El rendimiento por ciclo (IPC) del núcleo grande TaiShan Prime está aproximadamente al nivel del Arm Cortex-X2, un diseño de 2021. El núcleo Firestorm del Apple M1, lanzado en 2020, todavía supera en IPC en un 35%. El núcleo P más reciente, el Apple M5, supera en IPC en un 60%, y su rendimiento absoluto es 2.7 veces mayor.

La raíz de la brecha no está en el diseño, sino en el proceso. Apple y Qualcomm usan N4, N3P de TSMC, procesos que tienen una ventaja fundamental en la curva voltaje-frecuencia: en la misma área se pueden meter más transistores, con la misma potencia se puede correr a mayor frecuencia. El nivel de diseño de núcleos de Huawei es comparable a la generación anterior de la industria líder, pero está atrapado en un proceso de fabricación dos generaciones atrás.

Cuando el proceso se estanca, Huawei se prepara para "plegar"

La parte más visionaria del informe es la Ley de Escalado τ y la hoja de ruta LogicFolding presentadas por Huawei en la conferencia ISCAS 2026.

La reducción tradicional de semiconductores avanza en el plano bidimensional: hacer transistores más pequeños, líneas de metal más finas. La Ley de Moore ha hecho esto durante décadas. El escalado τ propuesto por Huawei ahora traslada el objetivo de optimización del dominio espacial al dominio temporal, centrándose en reducir el coste temporal del movimiento y procesamiento de datos, incluyendo el retardo de conmutación del transistor, el retardo de propagación de señales y los retardos de cálculo y almacenamiento.

LogicFolding es la implementación de ingeniería de esta teoría. En pocas palabras, consiste en dividir el mismo módulo lógico en dos capas superior e inferior, apiladas cara a cara y conectadas mediante uniones híbridas de espaciado ultrafino. El beneficio directo es acortar las rutas de señal más largas. En los chips modernos, una gran parte de la potencia y el retardo se gastan en conducir interconexiones largas y repetidores intermedios. Al plegar verticalmente la lógica, las rutas críticas se acortan, la frecuencia puede aumentar y el consumo de energía puede bajar.

Huawei presenta una hoja de ruta agresiva: La frecuencia del núcleo grande del Kirin 9030 es de 2.75 GHz, en el laboratorio ya han probado obleas a 3.39 GHz, y el objetivo para 2031 es alcanzar 5 GHz, empujando simultáneamente la densidad equivalente a 295 MTr/mm² mediante apilamiento 3D, a un nivel comparable al 14A de TSMC.

SemiAnalysis mantiene cautela ante esto. Señalan que el método de cálculo de densidad de Huawei difiere del de las fundiciones tradicionales: la densidad del apilamiento 3D se calcula sobre el área del paquete; al apilar múltiples capas de lógica activa, naturalmente se obtiene un número mayor. Si se usara el mismo método para calcular el MI450X de AMD (capa superior N2 + capa inferior N3P), la densidad teórica alcanzaría 460.2 MTr/mm², muy por encima del objetivo de Huawei para 2031.

Pero la dirección en sí merece atención. Al tomar este camino, Huawei esencialmente está asumiendo el trabajo de la fundición como empresa de diseño de sistemas. El V-Cache de AMD hace apilamiento 3D en caché, el MI350X de AMD mueve E/S e interconexiones al chip inferior. Lo que Huawei pretende hacer es más radical: dividir directamente el mismo bloque lógico y distribuirlo verticalmente. Esto supone un desafío de ingeniería de otro nivel de dificultad.

Las restricciones a la exportación remodelan las dimensiones de la carrera

La conclusión final de SemiAnalysis es directa: Las restricciones a la exportación no han detenido el progreso de los chips chinos, pero han cambiado su camino y costo.

El N+3 de SMIC demuestra que se puede lograr densidad lógica de nivel N6 sin EUV. Pero este camino es más caro, el proceso más complejo y el rendimiento más difícil de controlar. Avanzar más agranda la dificultad marginal en cada paso: más máscaras, alineación más estricta, patrones múltiples más costosos. Teóricamente, N+4 podría alcanzar 137.8 MTr/mm² (equivalente al N5 de TSMC), y N+5, si incorpora alimentación por la parte trasera, podría acercarse incluso a las bibliotecas HP del 18A de Intel. Pero cada paso será más difícil, más caro y con menos margen de error que el anterior.

Mientras tanto, los procesos N+2 y N+3 de SMIC se están transfiriendo a Huahong, y compañías de diseño como Alibaba PingTouGe y Cambricon también podrían beneficiarse. El conocimiento de fabricación de chips se está difundiendo desde una única fundición hacia un ecosistema, lo que diluye aún más la eficacia de las sanciones dirigidas a una sola empresa.

En el extremo del diseño, Huawei y la Universidad de Pekín ya están desarrollando prototipos de herramientas EDA nacionales para LogicFolding. Esto no equivale a reemplazar la cadena completa de herramientas de Synopsys y Cadence, pero el EDA nacional está evolucionando hacia la "optimización conjunta de arquitectura-proceso-encapsulado".

Un detalle interesante: STEEL descubrió en el desmontaje que la DRAM del Kirin 9030 Pro proviene de Samsung (K4L2E165YD, LPDDR5X-9600, nodo de proceso 1a), mientras que la versión Pro Max de 16 GB mostró encapsulados tanto de Samsung como de ChangXin Memory (CXMT). El chip de CXMT estaba fechado en la semana 45 de 2025, con una densidad de proceso equivalente al nivel 1z de la industria. Esto significa que los chips de memoria chinos ya están entrando en la cadena de suministro de los *flagships* de Huawei, aunque el proceso sigue estando una o dos generaciones por detrás de Samsung y SK Hynix.

Para los inversores, la señal verdaderamente digna de seguir es si la hoja de ruta de apilamiento 3D de Huawei puede, bajo un coste controlable, permitir que los chips de fabricación china alcancen el umbral de "suficiente" en escenarios como teléfonos móviles, inferencia de IA o equipos de red.

Una vez que se establezca que son "suficientes", el valor estratégico de esta cadena de suministro será reevaluado.

相關問答

Q¿Qué revela el informe de SemiAnalysis sobre el proceso N+3 de SMIC en comparación con el proceso 18A de Intel?

AEl informe revela que el espaciado mínimo de metal (M0 pitch) del proceso N+3 de SMIC es de 32.5nm, que es más pequeño que los 36nm del proceso 18A de Intel utilizado en Panther Lake. Sin embargo, SemiAnalysis señala que esta es una métrica seleccionada intencionadamente y no refleja completamente la competitividad general del proceso, ya que SMIC logra esto mediante técnicas de patrón cuádruple autoalineado (SAQP) más complejas y costosas, en lugar de usar litografía EUV.

Q¿Qué sacrificios o desventajas implica que SMIC alcance una densidad de transistores similar a la del N6 de TSMC sin máquinas de litografía EUV?

APara alcanzar una densidad de transistores comparable al proceso N6 de TSMC, SMIC debe utilizar técnicas de patrón cuádruple autoalineado (SAQP) en la capa M0, en lugar del patrón doble (SADP) que usa TSMC. Esto significa un mayor número de máscaras fotolitográficas, requisitos de alineación más estrictos, un flujo de proceso más complejo, costos más elevados y mayores riesgos de rendimiento. El perfil de las zanjas M0 también muestra dificultades en el control del proceso.

Q¿Cómo evalúa el informe el rendimiento del Kirin 9030 de Huawei en comparación con los chips actuales de Apple y Qualcomm?

AEl informe posiciona el rendimiento de la GPU del Kirin 9030 (Maleoon 935) a la par con los chips flagship de 2022, superando ligeramente al Snapdragon 8+ Gen 1, pero con una diferencia de 2.4 a 2.6 veces respecto al Snapdragon 8 Elite Gen 5 actual. En CPU, el núcleo grande TaiShan Prime tiene un IPC similar al Cortex-X2 de Arm (diseño de 2021), estando un 35% por detrás del núcleo Firestorm del Apple M1 (2020) y un 60% por detrás del núcleo P del Apple M5. La brecha se atribuye principalmente al proceso de fabricación limitado.

Q¿Qué es la 'Ley de Escalado τ' y 'LogicFolding' que propone Huawei, y cuál es su objetivo?

ALa 'Ley de Escalado τ' de Huawei traslada el objetivo de optimización del dominio espacial al temporal, enfocándose en reducir las demoras en el movimiento y procesamiento de datos. 'LogicFolding' es su implementación práctica: consiste en dividir un módulo lógico en dos capas y apilarlas cara a cara mediante uniones híbridas de ultra alta densidad. Esto acorta las rutas de señal críticas, permitiendo potencialmente mayor frecuencia y menor consumo. Su hoja de ruta apunta a alcanzar 5 GHz y una densidad equivalente de 295 MTr/mm² para 2031, comparable al nivel 14A de TSMC.

QSegún el informe, ¿qué efecto han tenido las restricciones a la exportación en el progreso de los semiconductores chinos?

AEl informe concluye que las restricciones a la exportación no han detenido el progreso de los chips chinos, pero sí han alterado su trayectoria y han incrementado su coste. Procesos como el N+3 de SMIC demuestran que se pueden lograr densidades avanzadas sin EUV, pero mediante métodos más complejos y costosos. Además, el conocimiento de fabricación se está difundiendo a otras empresas (como Hua Hong), y los diseñadores como Huawei están explorando vías alternativas como el apilamiento 3D y el desarrollo de herramientas EDA locales, cambiando así las dimensiones de la competencia.

你可能也喜歡

PANews专栏注册与发稿指南

PANews专栏注册与发稿指南 **专栏申请** * **内容要求**:专栏面向Crypto、Web3及相关领域的深度内容(如数据分析、观点洞察)。品牌介绍、软文或主要由AI生成的内容将无法通过审核,此类内容建议通过商务通道提交。 * **网页版申请**: 1. 访问PANews官网,在页面底部点击“申请专栏”。 2. 使用手机号或邮箱注册/登录(无需密码,通过验证码登录)。 3. 填写专栏名称、简介,上传头像,并提交已发表的文章链接以供审核。 * **手机版申请**:在APP内进入“我的”页面,找到“投稿与创作”功能进行申请。 **文章发布教程** 1. 登录PANews官网,进入“个人主页”。 2. 点击进入“创作者中心”。 3. 使用编辑器创建并发布文章。 **视频上传方法** 目前支持嵌入第三方平台(如B站)的视频代码。 1. 在视频平台(如B站)获取视频的“嵌入代码”。 2. 在文章编辑器中点击“插入/编辑媒体”按钮。 3. 选择“嵌入”标签,粘贴代码并保存。 4. 可选中视频后再次点击“插入/编辑媒体”调整尺寸,建议宽度设为100%,高度设为560px,发布后显示正常。 **PANews Skills (AI发文工具)** PANews提供官方AI技能集,支持热点追踪、内容发布和网页解析。 * **panews-creator技能**:可协助管理专栏、发布文章、上传图片。 * **使用方法**:需从PANews网站登录后,在浏览器开发者工具的Network选项中获取API授权凭证(Token),用于配置该技能。详细安装与使用指南请访问GitHub项目页面。

marsbit13 分鐘前

PANews专栏注册与发稿指南

marsbit13 分鐘前

交易

現貨
合約

熱門文章

如何購買CHIP

歡迎來到HTX.com!在這裡,購買USD.AI (CHIP)變得簡單而便捷。跟隨我們的逐步指南,放心開始您的加密貨幣之旅。第一步:創建您的HTX帳戶使用您的 Email、手機號碼在HTX註冊一個免費帳戶。體驗無憂的註冊過程並解鎖所有平台功能。立即註冊第二步:前往買幣頁面,選擇您的支付方式信用卡/金融卡購買:使用您的Visa或Mastercard即時購買USD.AI (CHIP)。餘額購買:使用您HTX帳戶餘額中的資金進行無縫交易。第三方購買:探索諸如Google Pay或Apple Pay等流行支付方式以增加便利性。C2C購買:在HTX平台上直接與其他用戶交易。HTX 場外交易 (OTC) 購買:為大量交易者提供個性化服務和競爭性匯率。第三步:存儲您的USD.AI (CHIP)購買USD.AI (CHIP)後,將其存儲在您的HTX帳戶中。您也可以透過區塊鏈轉帳將其發送到其他地址或者用於交易其他加密貨幣。第四步:交易USD.AI (CHIP)在HTX的現貨市場輕鬆交易USD.AI (CHIP)。前往您的帳戶,選擇交易對,執行交易,並即時監控。HTX為初學者和經驗豐富的交易者提供了友好的用戶體驗。

535 人學過發佈於 2026.04.21更新於 2026.06.02

如何購買CHIP

相關討論

歡迎來到 HTX 社群。在這裡,您可以了解最新的平台發展動態並獲得專業的市場意見。 以下是用戶對 CHIP (CHIP)幣價的意見。

活动图片