Reporte de 6月3日 de 芯东西, Rene Haas, CEO de Arm, pronunció un discurso de apertura ayer durante Computex 2026, anunciando que ByteDance y Oracle han adoptado el chip de CPU para centros de datos desarrollado internamente por Arm, Arm AGI.
El mes pasado, Arm duplicó sus expectativas de demanda para la CPU Arm AGI, proyectando que alcanzará 20 mil millones de dólares (aproximadamente 135 mil millones de RMB) en los años fiscales 2027 y 2028, y se espera que el producto genere 150 mil millones de dólares (aproximadamente 1016 mil millones de RMB) en ingresos anuales en aproximadamente cinco años.
Rene Haas comentó en una entrevista con medios extranjeros ayer que es "casi imposible" que Estados Unidos impida la exportación de CPUs para IA a China, ya que las CPUs para IA tienen aplicaciones amplias, y es difícil determinar cuáles están específicamente diseñadas para IA, siendo complicado establecer umbrales de rendimiento y límites de ancho de banda de memoria específicos como se hace con los chips de IA.
El lunes, NVIDIA lanzó el superchip RTX Spark basado en arquitectura Arm y la CPU para centros de datos Vera. La noche del lunes, la acción de Arm subió continuamente, registrando un aumento del 16% al cierre del martes. Hasta ahora este año, la acción de Arm ha acumulado un incremento del 263%.
Jensen Huang, fundador y CEO de NVIDIA, también hizo una aparición en el discurso de Rene Haas el martes, y al subir al escenario bromeó: "Mira su precio de acción, cada vez que lanzo un producto, su acción sube, pero la mía no hace nada."
Rene Haas respondió con ingenio: "Tú eras accionista, y luego vendiste tus acciones."
Jensen Huang respondió al instante: "Sí, sí, ay, necesitaba efectivo."
Ambos parecen viejos conocidos, charlando animadamente durante 15 minutos, improvisando sketches y lanzando chistes que provocaron risas continuas en la audiencia, ellos mismos también se rieron mucho mostrando sus dientes.
Esta es realmente la conversación más animada que he visto recientemente en el ámbito tecnológico.
Por ejemplo, después de elogiar extensamente las CPUs Arm, Jensen Huang resumió: "La palabra clave es 'Arm es perfecto'."
Rene Haas respondió: "Otra palabra clave es 'gracias'."
Jensen Huang inmediatamente habló en chino: "哪里,哪里,不要客气啦" (Nǎli, nǎli, bùyào kèqì la).
Entonces Rene Haas bromeó: "Ahora esto es injusto." (refiriéndose a que es injusto que Jensen hable chino)
Luego Jensen Huang añadió consideradamente: "You're welcome" (De nada).
Jensen Huang también bromeó diciendo que "una de las mayores ventajas de Arm es que no tienes que preocuparte por problemas de cadena de suministro", la cadena de suministro de IP es electrónica, puedes usar tantos electrones como quieras.
"Así que me encanta su modelo de negocio," Jensen Huang comenzó a recordar el pasado. "¿Saben? Lo intenté, traté de convertirme en Arm, solía trabajar con Rene, y luego intentamos colaborar de nuevo, pero tampoco fue gran cosa, aún me siento muy apenado."
Rene Haas dijo: "Si las dos empresas se fusionaran, seríamos la empresa más grande del mundo."
"Me gusta eso," Jensen Huang se rió. "Esa es una buena idea."
Parece que ambos lamentan profundamente que NVIDIA no pudiera adquirir Arm.
Finalmente, en la sesión de intercambio de regalos, Rene Haas jugó con la "nostalgia", regalando a Jensen Huang una computadora portátil Microsoft Surface RT con el chip NVIDIA Tegra 3, e imitando la firma de Jensen Huang, escribió su propio nombre.
NVIDIA Tegra 3 es el primer procesador móvil de cuatro núcleos Arm del mundo lanzado por NVIDIA hace algunos años.
Jensen Huang señaló la foto en la pantalla grande y se alabó a sí mismo: "¿Qué pasó cuando éramos jóvenes? Tengo que decir, creo que luzco más joven. ¿Están de acuerdo? Creo que me he mantenido bastante bien."
Rene Haas se rió tanto que se desenfocó.
Luego Jensen Huang arrebató el regalo y dijo con tono alegre: "¿Esto es para mí? Si lo firmo y te lo devuelvo, será un tesoro."
Rene Haas dijo: "No, si lo firmas y me lo devuelves, aquí hay un contrato, una factura, no podemos hacer eso. Conocemos ese juego."
Volviendo a temas serios de la industria, en este discurso, Rene Haas le hizo a Jensen Huang varias preguntas clave:
1. ¿Por qué hacer RTX Spark?
2. ¿Cómo equilibrar los agentes locales y los agentes en la nube?
3. ¿Realmente pueden los agentes trabajar de forma independiente, separándose del sistema operativo subyacente?
4. ¿Qué piensa Jensen Huang sobre los factores que limitarán el crecimiento en los próximos años?
Jensen Huang también "pintó un panorama prometedor" para el desarrollo del mercado: actualmente, la industria informática está limitada por el número de personas que usan computadoras, pero con agentes que pueden usar computadoras de forma autónoma, ya no serán mil millones de personas usando computadoras, sino decenas o cientos de miles de millones, incluso probablemente más agentes, robots y vehículos autónomos usando computadoras.
Entonces la pregunta es, ¿qué tan grande puede ser realmente la escala de los productos informáticos?
"Siento que, hasta ahora, el desenlace ya está determinado, esta industria de billones de dólares podría ser diez veces más grande, estamos en camino." dijo Jensen Huang.
Rene Haas también compartió los últimos avances y planes futuros de Arm en el campo de los PCs agentes y las CPUs para centros de datos.
También mencionó que esta semana, al hablar con C.C. Wei, presidente y director ejecutivo de TSMC, y Zhang Xiaogiang, vicepresidente senior y COO, dijeron que nunca habían visto un ciclo de la industria de semiconductores tan próspero durante cuatro años consecutivos.
01. La clase de Jensen Huang: ¿Cómo diseñar un PC agente?
Jensen Huang respondió una por una las preguntas clave planteadas por Rene Haas, y estos puntos de vista son muy referenciales para el desarrollo futuro de los AI PC y las ideas de diseño de chips.
1. ¿Por qué hacer el producto RTX Spark?
Los PCs y sistemas operativos han existido durante 40 años, la programación manual será reemplazada por aplicaciones de agentes, y estos agentes usarán las herramientas en el PC. Entonces, ¿cómo reestructurar la arquitectura, cambiar el sistema operativo, reinventar la computadora en el futuro?
NVIDIA se dio cuenta de que el sistema de agentes necesita una CPU excelente, por eso se adoptó Arm.
El superchip RTX Spark está equipado con una CPU de 20 núcleos, tiene un rendimiento de un solo hilo excelente, y la memoria necesita almacenar muchos parámetros.
Por lo tanto, NVIDIA creó un nuevo formato de datos llamado NVFP4 para comprimir los modelos de lenguaje grandes, construir tantos modelos como sea posible e integrar IA muy inteligente en la memoria del sistema.
NVIDIA también espera combinar CUDA para computación acelerada y CUDA Tile, integrando el procesamiento de núcleos tensoriales en un solo procesador.
2. ¿Cómo equilibrar los agentes que se ejecutan localmente y los que se ejecutan en la nube?
Estos PCs Arm se convertirán en agentes que siempre funcionarán de forma autónoma.
Hoy, si dejas tu portátil en casa o en el hotel, no puedes usarlo.
Pero en el futuro, solo necesitarás tomar tu teléfono y podrás hablar con el PC de forma remota, dirigiendo al agente para que trabaje.
Jensen Huang dijo: "La esencia de los dispositivos de computación personal es que puedes hacer cualquier cosa con este dispositivo, sin perder tiempo."
Si necesitas usar algunas APIs en la nube, simplemente las invocas. Todo lo que se pueda hacer localmente, se hará en la computadora.
3. Al ejecutar agentes, ¿es importante el sistema operativo? Si se considera al agente como un sistema operativo, ¿realmente puede trabajar de forma independiente y no depender demasiado del sistema operativo subyacente?
La importancia del sistema operativo no disminuye en absoluto, incluso podría ser más importante que antes.
Este también es el punto controvertido que la gente menciona a menudo cuando aparece la IA: "el software ha muerto". Jensen Huang cree que no hay nada más ridículo que eso.
El conocimiento de las personas sobre muchas funciones de las herramientas puede ser solo del uno o dos por ciento.
Pero ahora, puedes decirle al agente lo que quieres.
El agente sabe muy bien cómo usar estas herramientas porque ha leído los archivos de Skills. Skills es esencialmente leer el manual de uso de esa herramienta, por lo que ahora usará el MCP o CLI conectado a esa herramienta, desbloqueando todas estas herramientas para satisfacer tus necesidades.
Estas herramientas serán más valiosas que nunca, se ejecutan en el sistema operativo, por lo que necesitamos el sistema Windows, necesitaremos estas APIs y herramientas durante mucho tiempo.
4. ¿Cuáles son los factores que limitarán el crecimiento en los próximos años?
"Casi en todos los aspectos vemos limitaciones." dijo Jensen Huang. NVIDIA hizo planes con anticipación, la planificación de la cadena de suministro fue buena, este año el crecimiento interanual es de casi el 100%, el próximo año logrará un crecimiento muy rápido, y la cadena de suministro puede respaldar el crecimiento de NVIDIA.
Pero la demanda es en realidad mayor.
Jensen Huang comentó que el nuevo modelo de aplicación de computación realmente necesita una nueva arquitectura, y un gran avance ahora es que los agentes pueden producir IA práctica, por eso el crecimiento de todos es tan increíble.
Cuando la IA se vuelve práctica, los tokens generados pueden generar ganancias. Cuando generar tokens es rentable, todos quieren generar billones de veces más tokens.
Ahora la IA no es solo un chatbot que responde preguntas, puede pensar, usar herramientas, leer, seguir pensando, planificar, intentar, la cantidad de tokens que necesita generar aumenta drásticamente, y la rentabilidad de los tokens está impulsando la demanda de potencia de cálculo, creando un efecto multiplicador.
02. Chips Arm para PC: Apple, Google y Qualcomm lo aprueban, colaboración estrecha con NVIDIA y MediaTek
En el campo de los PCs, Google, Apple, NVIDIA, Qualcomm, etc., han desarrollado chips para PC basados en arquitectura Arm. Arm ha colaborado durante décadas con Apple, Google, Microsoft, etc.
Rene Haas comentó que Arm se siente honrado de colaborar con NVIDIA en el desarrollo del superchip RTX Spark basado en arquitectura Arm. La CPU Grace personalizada de este chip tiene 20 núcleos, cada uno basado en arquitectura Arm.
"Creo que esta es la CPU para portátiles con más núcleos actualmente en el mercado." dijo Rene Haas. Cuando la combinas con la GPU Blackwell, este chip ofrece un rendimiento de IA FP4 de 1 PFLOPS, tiene una capacidad de memoria unificada de 128 GB, soporte nativo completo para Windows en plataformas Arm.
El papel de Arm en esto es colaborar estrechamente con NVIDIA y MediaTek, utilizando la estrategia de subsistemas de computación (CSS) de Arm.
El subsistema de computación combina todos los componentes necesarios para construir un SoC personalizado (CPU, GPU, IP del sistema, controlador de memoria), construyendo un sistema de solución terminal completo.
Arm completó este trabajo en colaboración con MediaTek, y MediaTek puede proporcionar la solución completa.
Rene Haas también mostró la hoja de ruta de Arm CSS para PCs agentes, donde la próxima generación optimizará núcleos de CPU personalizados diseñados específicamente para PC.
03. CPU agente desarrollada por Arm: OpenAI y ByteDance son socios
Rene Haas dijo que más de 25 mil millones de chips Arm se fabricaron en Taiwán, China. La primera CPU desarrollada por Arm, Arm AGI, lanzada en marzo de este año, fue producida por TSMC en Taiwán, China.
La CPU Arm AGI está diseñada específicamente para infraestructuras de agentes de IA, utiliza el proceso de fabricación de 3nm de TSMC, diseño de dos chiplets, una sola CPU integra 136 núcleos de alto rendimiento Arm Neoverse V3, está equipada con 2 MB de caché L2, soporta una frecuencia principal de 3.7 GHz, proporciona un ancho de banda de memoria de 6 GB/s por núcleo, una latencia de memoria inferior a 100 ns, utiliza interfaz PCIe Gen 6 de 96 canales, soporta el protocolo CXL 3, y tiene un TDP de 300W.
Los socios de la CPU Arm AGI incluyen a OpenAI, Meta, Cerebras, SAP, SK telecom, Rebellions, etc. Rene Haas anunció que la demanda de mercado de este chip es más fuerte que cuando se lanzó, Oracle y ByteDance también se han unido a esta familia, validando que la CPU Arm AGI puede resolver problemas del mundo real.
Por supuesto, no todas las empresas quieren comprar la CPU Arm AGI. Para las empresas interesadas en desarrollar sus propios chips, Arm proporciona múltiples IPs y subsistemas de computación (CSS), comprometiéndose a ofrecer cualquier solución que sus clientes deseen.
En los centros de datos, la CPU Axion, que se conecta con los últimos chips de IA de Google, TPU 8t y TPU 8i, es un chip que utiliza tecnología Arm Neoverse. Con el mismo rendimiento, el consumo de energía puede reducirse en un 60% en comparación con las CPUs x86.
La CPU Graviton desarrollada internamente por Amazon también utiliza arquitectura Arm. Andy Jassy, CEO de Amazon, reveló: "Dos grandes clientes preguntaron si podían comprar todas nuestras instancias de Graviton para 2026."
NVIDIA también acaba de lanzar la nueva CPU Vera basada en Arm esta semana.
Arm planea hacer de la CPU desarrollada internamente una empresa a largo plazo y presentó una hoja de ruta de tres años.
La segunda generación de la CPU Arm AGI ya está en desarrollo, teniendo más núcleos, mayor eficiencia energética y mejor rendimiento en comparación con la generación anterior.
La tercera generación de la CPU Arm AGI también está por llegar.
Todas estas se basan en los subsistemas de computación que Arm pretende entregar junto con los chips.
04. Conclusión: Después de la explosión de agentes, el foco de la competencia de potencia de cálculo se centra en la CPU
Los discursos de los líderes de los gigantes de chips como Jensen Huang, Chen Lifu y Rene Haas esta semana reflejan algunas tendencias comunes en la industria de las CPUs: los agentes cambian la lógica de la computación, abriendo una puerta completamente nueva de oportunidades de mercado para las CPUs.
En los últimos años, el foco de la competencia en potencia de cálculo ha estado principalmente en las GPUs indispensables para el entrenamiento de IA. Pero este año, después de la explosión de aplicaciones de agentes, la demanda de inferencia de agentes es cada vez más fuerte, requiriendo mucha gestión de estado, invocación de herramientas y organización de procesos, estas son tareas intensivas en CPU.
Intel y AMD aún están consolidando la ventaja de los procesadores x86 en el campo de centros de datos. Y los nuevos participantes, incluyendo Amazon, Google, NVIDIA, etc., básicamente están apostando por la ruta de CPUs Arm. Incluso Arm tomó una "decisión que va en contra de sus antepasados", ingresando oficialmente este año en la carrera de CPUs para centros de datos.
Un fenómeno muy interesante es que la industria de chips está formando una nueva tendencia de integración vertical.
Los gigantes de chips con líneas de productos ricas como NVIDIA, Intel y AMD enfatizan cada vez más sus características de pila completa, y las ventajas de sus propias soluciones también convergen: mayor eficiencia energética, tienen todo lo que necesitas, pueden ahorrar más dinero.
Las empresas líderes de diversas industrias también están "cruzando límites": los gigantes de la nube se extienden hacia abajo para desarrollar chips propios, las empresas de chips se extienden hacia arriba para hacer soluciones de máquinas completas, y las empresas de IP de semiconductores se extienden hacia arriba para desarrollar chips.
En el contexto donde los tokens se convierten en la nueva moneda de competencia y la demanda de potencia de cálculo crece explosivamente, cómo hacer que cada vatio genere más computación efectiva será el eje principal de la competencia de chips en el futuro.
Este artículo proviene de la cuenta pública de WeChat "芯东西", autor: ZeR0, editor: 漠影






















