Autor original: Li Hailun, Su Yang
Editor original: Xu Qingyang
Fuente original: Tencent Tech
El 1 de junio de 2026, durante la conferencia NVIDIA GTC Taipei celebrada en el marco de COMPUTEX 2026, Jensen Huang, fundador y CEO de NVIDIA, pronunció un discurso de apertura.
Solo han pasado tres meses desde la última GTC.
En aquella ocasión, NVIDIA lanzó el 'paquete completo de chips' Vera Rubin, que incluye: CPU Vera, GPU Rubin, LPU Groq 3, ConnectX-9, DPU BlueField-4 y el conmutador Spectrum-6. Estos seis chips forman un superordenador de IA a nivel de rack, y se anunció que el número de GPUs necesarias para entrenar grandes modelos MoE se reducía a una cuarta parte, el rendimiento de inferencia por vatio mejoraba 10 veces y el coste por token descendía a una décima parte.
A diferencia de los anteriores énfasis en soluciones de nivel de sistema como el 'paquete completo de chips' o el 'paquete completo de potencia de cálculo', en esta COMPUTEX de tres meses después, Huang centró su atención en el objetivo al que servirán estas infraestructuras: los Agent (Agentes).
Huang reveló en su discurso: Vera Rubin ha entrado oficialmente en producción, la CPU Vera ha comenzado a entregarse a nivel mundial, DGX Station entra por primera vez en los escritorios empresariales con una forma de Windows, Cosmos 3 reestructura el marco de percepción de la IA física, y DSX se convierte en el sistema operativo de funcionamiento de la fábrica de IA. NVIDIA también anunció conjuntamente con Unitree el H2 Plus, el primer diseño de referencia de robot humanoide basado en Isaac GR00T, extendiendo la frontera de los Agent desde el mundo digital hasta la forma física.
NVIDIA está reorganizando su sistema tecnológico completo, desde chips y centros de datos hasta modelos, software y plataformas robóticas, en torno al ecosistema de los Agent.
Huang dijo: "La era de la IA de agentes y la inteligencia artificial práctica ha llegado. Ahora el token (también llamado 'unidad léxica') es la unidad de beneficio, la IA es el 'generador' del PIB, y el número de ingenieros de software está aumentando. Se habla de que la IA reduce puestos de trabajo, lo cual es completamente absurdo; en realidad, se están contratando más ingenieros de software".
La misma fábrica de IA, ejecuta 10 veces más tareas de Agent
La plataforma Vera Rubin ya está en plena producción.
A diferencia del pasado, cuando se orientaba principalmente al entrenamiento e inferencia de grandes modelos, Vera Rubin desde su diseño inicial ha considerado a los Agent como una carga de trabajo clave.
Huang indicó en su discurso que una tarea de Agent a menudo no es solo una inferencia de modelo, sino que incluye múltiples pasos como inferencia, búsqueda, llamada a herramientas, ejecución de código y verificación de resultados, lo que puede implicar miles de pasos en segundo plano. En el futuro, lo que los centros de datos necesitarán procesar no serán solo peticiones de modelos individuales, sino más bien una gran cantidad de tareas de Agent que se ejecuten de forma continua y colaborativa.
Esta plataforma se define como una enorme y unificada supercomputadora de IA a nivel de unidad de cálculo, construida específicamente para manejar cargas de trabajo de agentes inteligentes, desde inferencia y recuperación hasta el uso de herramientas. En centros de datos hiperescala de tamaño similar, utilizar la nueva plataforma Vera Rubin para ejecutar tareas de agentes de IA autónomos ofrece una eficiencia de procesamiento 10 veces mayor que la de la plataforma Grace Blackwell anterior.
Además de la propia plataforma de cálculo, la red también se ha convertido en un foco de mejora para Vera Rubin.
En el pasado, la transmisión de datos entre GPUs en los centros de datos dependía principalmente de módulos ópticos tradicionales y arquitecturas de conmutadores, pero a medida que el tamaño del clúster continúa expandiéndose, el consumo energético, la disipación de calor y la complejidad del despliegue aumentan rápidamente. Por ello, NVIDIA ha introducido en la plataforma Vera Rubin el sistema de red Spectrum-X Ethernet Photonics.
Esta es la primera vez que NVIDIA introduce a gran escala la tecnología de óptica coempaquetada (CPO) en las redes de centros de datos de IA.
En pocas palabras, mientras que los esquemas tradicionales requieren insertar módulos ópticos externamente en el conmutador, CPO integra directamente los dispositivos ópticos en el interior del conmutador, reduciendo así el consumo energético y la pérdida de señal.
Además, la seguridad es otra capacidad central enfatizada en esta plataforma Vera Rubin.
Para ello, NVIDIA ha extendido las capacidades de computación confidencial (Confidential Computing) a toda la plataforma Vera Rubin. A través de entornos de ejecución confiables, verificación a nivel de hardware y mecanismos de cifrado de extremo a extremo, las empresas pueden obtener un mayor nivel de garantía de seguridad al procesar datos privados, información sensible de la industria y modelos críticos.
Huang reveló que Vera Rubin ya ha entrado en la fase de producción. Como sistema de tercera generación a nivel de rack MGX, detrás de él hay más de 150 socios, más de 350 fábricas y una cadena de suministro que cubre más de 30 países y regiones. Según el plan anunciado por NVIDIA, Vera Rubin comenzará a enviarse oficialmente este otoño.
El procesador "nacido para los Agent"
NVIDIA ha lanzado el nuevo procesador Vera, diseñado específicamente para la era de los agentes inteligentes, y ya está en plena producción.
Huang señaló que los avances en los sistemas de memoria impulsarán la innovación y modernización de los sistemas de almacenamiento. Hasta la fecha, todas las CPU han sido diseñadas para los humanos, mientras que Vera es una CPU diseñada para la era de la IA, construida para los agentes inteligentes.
Como sucesor de Grace, Vera adopta la arquitectura de núcleo CPU "Olympus" diseñada por NVIDIA, aumentando el número de núcleos de 72 a 88, y mejorando significativamente la capacidad de memoria y procesamiento de datos. Según NVIDIA, en pruebas de cargas de trabajo relacionadas con Agent, la velocidad de ejecución de tareas de Vera alcanza 1.8 veces la de las CPU de servidor x86 de la misma generación.
Más importante que la mera mejora de rendimiento es el cambio en la relación entre Vera y la GPU Rubin: Vera se conecta a la GPU Rubin mediante NVLink-C2C de segunda generación, con un ancho de banda de interconexión de 1.8 TB/s, reduciendo aún más la sobrecarga de transferencia de datos entre CPU y GPU durante la ejecución de Agent.
Huang afirmó que Vera Rubin utiliza HBM (High Bandwidth Memory) de Micron, SK Hynix y Samsung, y que la escala de la cadena de suministro es el "doble" de la de la generación anterior Blackwell. Sin embargo, mientras desplegar un gran rack de Blackwell requería dos horas, el tiempo para Vera Rubin se ha reducido al nivel de los 5 minutos.
Llevando la fábrica de IA de la 'construcción' a la 'operación'
El DSX lanzado por NVIDIA esta vez puede entenderse como un 'kit de herramientas para la construcción y operación de fábricas de IA'.
En el pasado, para construir un centro de datos de IA, los clientes necesitaban considerar por separado servidores, red, electricidad, refrigeración, diseño de sala y sistemas de operación y mantenimiento, con muchos pasos dependiendo de la coordinación de diferentes proveedores. Lo que DSX pretende hacer es integrar estos procesos originalmente dispersos en un mismo marco, ofreciendo a los clientes un esquema estándar de referencia y verificación desde el diseño y simulación hasta la construcción y operación.
Huang declaró en el escenario de la presentación: "NVIDIA no solo vende chips, sino que ofrece a los constructores de infraestructuras un plano completo para la fábrica de IA".
Las dos capacidades más importantes añadidas a DSX esta vez son principalmente las siguientes.
La primera es DSX MaxLPS. Resuelve el problema más real de la fábrica de IA: cómo colocar más GPUs y generar más tokens con un presupuesto eléctrico fijo.
Según NVIDIA, MaxLPS, combinando refrigeración líquida y optimización del consumo energético dentro del rack, puede permitir a los operadores ejecutar hasta un 40% más de GPUs sin afectar significativamente el rendimiento.
La segunda es DSX OS. Equivale al software operativo de la fábrica de IA, responsable de la gestión del ciclo de vida, programación inteligente, monitorización de salud, recuperación de fallos, gestión multiinquilino, etc. En pocas palabras, si la fábrica de IA es una planta compleja, DSX OS se encarga de que esta funcione de forma continua y estable.
En la matriz de productos DSX, Reference Design proporciona el diseño de referencia de la fábrica de IA, indicando al cliente cómo debe construirse la sala, el rack, la red, el sistema eléctrico y de refrigeración; DSX Sim se encarga de la simulación, permitiendo al cliente verificar la viabilidad del diseño antes de la construcción; DSX Flex conecta la fábrica de IA a la red eléctrica, permitiendo que el centro de datos ajuste las tareas según las señales de precio de la electricidad, carga y respuesta a la demanda; DSX Exchange se encarga de conectar las interfaces de datos entre los sistemas de TI, los sistemas operativos, y los sistemas de energía y refrigeración.
En cuanto al ecosistema, socios en la nube como CoreWeave, Crusoe, Lambda están desplegando DSX Sim, MaxLPS y DSX OS para reducir riesgos y mejorar la utilización de las GPUs. Fabricantes como Dell, HPE, Lenovo, Supermicro, así como ASUS, Foxconn, Gigabyte, QCT, están construyendo sistemas compatibles con DSX.
Aliándose con Windows y ARM
En el discurso en directo, Huang anunció oficialmente la aparición en escena de la estación de trabajo "DGX Station for Windows", definida por NVIDIA como el superordenador de IA de escritorio orientado al ecosistema Windows.
En hardware, está equipada con GB300 Grace Blackwell Ultra Desktop Superchip, conectando a través de NVLink-C2C la GPU Blackwell Ultra con la CPU Grace de 72 núcleos, ofreciendo hasta 748 GB de memoria unificada y 20 PFLOPS de rendimiento FP4, y capacidad de red de hasta 800 Gb/s.
El foco de este producto radica en el cambio en el modo de despliegue de los Agent.
NVIDIA espera que las empresas puedan ejecutar múltiples Agent en entornos Windows locales, seguros y gestionables, e integrarlos en flujos de trabajo como diseño, ingeniería, ciencia de datos, inferencia e IA física. OpenShell, lanzado simultáneamente, se encarga de la seguridad de ejecución de los Agent, mediante sandbox de aislamiento y control de políticas a nivel de sistema, limitando operaciones no autorizadas o la filtración de credenciales y datos privados por parte del Agent.
Además del producto orientado a escritorios empresariales, Huang también presentó en la conferencia un SoC a nivel de sistema: RTX Spark SoC, que integra la CPU N1X y la GPU Blackwell en un solo chip, con arquitectura de memoria unificada, diseñado específicamente para portátiles ultradelgados y pequeños equipos de sobremesa.
Entre ellos, N1X es el primer procesador para PC creado conjuntamente por NVIDIA y Microsoft. Está basado en la arquitectura Arm, diseñado a medida por MediaTek y fabricado con el proceso de 3 nm de TSMC. Se lanzará por primera vez este otoño en portátiles de Microsoft, Dell, HP, ASUS, Lenovo y MSI, con más de 30 modelos iniciales, enfocados en portátiles ultradelgados de gama alta.
Este es el 'súper chip' que NVIDIA prepara para la era de los PC con IA, considerado por Huang como una importante reestructuración de la forma del PC.
Los 'dos cerebros' del Agent
En esta presentación, NVIDIA anunció los últimos avances de sus dos líneas principales de productos de modelos, correspondientes a dos escenarios del Agent: uno que se ejecuta en sistemas empresariales y otro en el mundo físico.
NVIDIA lanzó un modelo de experto mixto con 550 mil millones de parámetros, Nemotron 3 Ultra, que puede proporcionar capacidades de inteligencia de primer nivel para agentes de larga duración en desarrollo de código, investigación científica y procesos empresariales. En comparación con los principales modelos de vanguardia de código abierto del mismo nivel, este modelo mejora la velocidad de inferencia hasta 5 veces y reduce los costes de uso hasta un 30%, ayudando a los agentes a completar tareas de manera más eficiente y económica.
En torno al modelo abierto Nemotron, NVIDIA anunció una serie de avances en software, modelos de código abierto y colaboraciones, con el objetivo de permitir a las empresas construir 'colegas digitales' que ayuden a los empleados en escenarios como ingeniería de diseño, salud, desarrollo de software y operaciones empresariales.
En este conjunto, Nemotron proporciona la capacidad del modelo base, NemoClaw organiza el modelo como Agent, OpenShell se encarga de la seguridad en tiempo de ejecución, y Agent Toolkit convierte bibliotecas de software de NVIDIA como CUDA-X en herramientas que el Agent puede llamar directamente. El Agent puede usar herramientas, invocar datos, ejecutar tareas en entornos controlados e integrarse en los sistemas existentes de la empresa.
Huang afirmó que las empresas de software de todo el mundo están introduciendo agentes de IA en sistemas de trabajo reales, ayudando a los empleados a completar tareas complejas más rápidamente. NemoClaw proporciona los componentes abiertos necesarios para construir Agent de ejecución prolongada, incluyendo capacidades de orquestación, contexto, memoria, llamada a herramientas y control de seguridad.
En el pasado, cuando las empresas discutían sobre IA, se centraban más en qué podía responder el modelo; ahora NVIDIA busca resolver cómo el Agent puede integrarse de forma segura en herramientas, datos y procesos empresariales, y funcionar de manera continua en el trabajo real.
También está Cosmos 3, lanzado oficialmente como la tercera generación de la serie Cosmos, lo que también supone una reestructuración a nivel de arquitectura.
Cosmos 3 es un modelo base del mundo orientado a la IA física, que proporciona capacidades subyacentes para "comprender el mundo físico, predecir lo que sucederá y decidir cómo actuar".
En comparación con Cosmos anterior, las versiones iniciales se orientaban principalmente a desarrolladores de robótica y conducción autónoma, centrándose en la generación de video y simulación del mundo físico, siendo esencialmente un marco generativo relativamente unimodal. Cosmos 3 cambia de arquitectura: Transformer híbrido, unificando por primera vez en un solo sistema el razonamiento visual, la generación del mundo y la predicción de acciones.
Puede comprender y generar de forma nativa texto, imágenes, video, sonidos ambientales y acciones, alcanzando un nivel líder en precisión física. Es el primer modelo omnicompetente completamente abierto a nivel mundial. NVIDIA afirma que tiene el potencial de comprimir el ciclo de entrenamiento y evaluación de la IA física de meses a días.
class="ql-align-justify">Huang predice que, gracias a los avances en el lenguaje de razonamiento multimodal, la visión y los modelos del mundo, la gran explosión de la IA física está a punto de llegar.La serie Cosmos 3 de modelos omnicompetentes de vanguardia abiertos proporciona a los desarrolladores capacidades de mejora generacional para construir robots, vehículos autónomos e IA visual que puedan percibir, razonar, planificar y actuar en el mundo físico.
Reduciendo el umbral de la IA física
NVIDIA y Unitree anunciaron conjuntamente el H2 Plus: un robot humanoide modelo preparado para investigación y desarrolladores.
'Modelo' significa: Unitree se encarga del cuerpo del robot, NVIDIA del software y la plataforma de cálculo, integrando previamente hardware y software para que los equipos de desarrollo puedan comenzar directamente con el desarrollo de habilidades sin tener que resolver problemas de integración subyacentes. También es el primer robot humanoide abierto del mundo construido sobre la plataforma de desarrollo NVIDIA Isaac GR00T.
Este robot modelo aborda un dolor de cabeza persistente en el desarrollo de robots humanoides: la integración de hardware, adquisición de datos, simulación, entrenamiento, evaluación y despliegue son procesos altamente fragmentados y operados por separado.
NVIDIA afirma que cuando un equipo de investigación recibe un cuerpo robótico, a menudo dedica mucho tiempo a ensamblar elementos subyacentes, posponiendo repetidamente el desarrollo real de habilidades. Lo que H2 Plus intenta hacer es conectar este camino, permitiendo a los equipos de investigación saltarse la integración subyacente y pasar directamente al desarrollo de habilidades y validación en escenarios reales.
Según Huang, los robots humanoides traerán IA física a la industria más grande del mundo, abriendo oportunidades económicas de billones de dólares, y H2 Plus es el punto de partida para llevar la investigación de vanguardia a escenarios reales como fábricas, almacenes y sistemas logísticos.
Además, NVIDIA anunció la apertura oficial de un conjunto de herramientas de habilidades (Skills) de IA física, que cubre escenarios clave como robótica, conducción autónoma, IA visual y gemelos digitales industriales.
Lo que se entiende por 'habilidades' puede verse como NVIDIA estandarizando el uso de sus plataformas como Cosmos, Omniverse, Isaac, Metropolis y escribiéndolas como instrucciones operativas que los agentes inteligentes pueden entender y ejecutar directamente. Al empaquetar y abrir estas instrucciones, se obtiene el conjunto de herramientas anunciado.
Cuando un agente recibe una tarea, como generar un conjunto de datos de entrenamiento para detectar defectos, sabe qué modelo invocar, qué formato de salida producir y cómo verificar los resultados, ejecutando todo el proceso automáticamente sin necesidad de que una persona opere paso a paso cada enlace.
Actualizando el almacenamiento de IA: de 'rápido' a 'controlable'
En la GTC de San José de marzo, NVIDIA lanzó Vera BlueField-4 STX, donde Huang se centró en la 'arquitectura de almacenamiento nativa para IA', con el argumento principal de proporcionar soporte de almacenamiento KV Cache de alto rendimiento para el razonamiento de contexto largo de los agentes inteligentes.
Ahora, NVIDIA anunció sobre la base de STX la adición de un conjunto de capacidades de seguridad, cambiando el enfoque de 'rendimiento de almacenamiento' a 'seguridad del almacenamiento'.
La lógica y reflexión central aquí se debe a que el contexto es el cambio en el modo de uso de la IA empresarial. Ahora muchas empresas despliegan activamente agentes inteligentes. Cuando un Agent se integra en sistemas empresariales, accediendo y compartiendo información continuamente entre sistemas sin supervisión directa —quién accede a qué datos, si hay exceso de privilegios o fugas—, estos son problemas que preocupan a las empresas.
La solución de NVIDIA es añadir una capa de capacidad de seguridad sobre el almacenamiento acelerado: mediante un software de seguridad unificado NVIDIA DOCA, y la ejecución forzosa de políticas directamente en el chip BlueField-4, las plataformas basadas en STX pueden inspeccionar y controlar en tiempo real la interacción entre agentes, datos y memoria contextual, ayudando a las empresas a lograr una aplicación continua de políticas en la ruta de datos de IA.
Huang explicó: "Los agentes convierten los datos empresariales en un sistema vivo y en tiempo real, y este sistema debe protegerse donde se mueven los datos, donde se almacena el contexto y donde actúan los agentes. Lo que Vera BlueField-4 STX pretende hacer es ejecutar la confianza a la velocidad de la IA en el chip, con un diseño inherentemente seguro".
TSMC y NVIDIA 'se proveen mutuamente'
Un punto muy interesante de esta conferencia fue la colaboración entre NVIDIA y TSMC: actualmente, TSMC está utilizando tecnología NVIDIA para mejorar el tiempo de respuesta, eficiencia energética, rendimiento y productividad operativa de sus avanzadas fábricas de obleas.
La relación entre TSMC y NVIDIA durante los últimos treinta años tenía solo una forma: TSMC fabricaba chips para NVIDIA. Pero ahora, el rol ha cambiado sutilmente, y NVIDIA comienza a ayudar a TSMC a 'gestionar la fábrica'.
Huang afirmó: "NVIDIA y TSMC han colaborado durante casi treinta años, impulsando continuamente los límites de la computación. TSMC está introduciendo la IA y la computación acelerada de NVIDIA dentro de sus propias fábricas de obleas, enfrentando los desafíos de diseño y fabricación más complejos del mundo a través de simulación, optimización e IA, para mejorar la velocidad, eficiencia y rendimiento de la próxima generación de chips".
Su relación ha pasado de ser unidireccional cliente-proveedor a una interdependencia bidireccional.
Conclusión
Mirando hacia atrás en esta presentación, NVIDIA está ensamblando un nuevo plan en torno a los 'Agent'.
La CPU Vera programa tareas para el Agent, Vera Rubin proporciona potencia de cálculo al Agent, BlueField-4 STX protege la seguridad de los datos del Agent, Cosmos 3 permite al Agent comprender el mundo físico, Nemotron+NemoClaw+OpenShell permite que el Agent sea organizado, invocado y restringido, DGX Station for Windows lleva al Agent al escritorio de los empleados empresariales, H2 Plus da cuerpo al Agent, y DSX y Skills permiten que todo esto pueda ser producido y desplegado en masa.
Desde esta perspectiva, Huang intenta esbozar una nueva era de la computación. Esto también responde a lo que mencionó al inicio: 'La era de la IA de agentes y la inteligencia artificial práctica ha llegado'.
En última instancia, lo que Huang quiso transmitir esta vez es una cosa: cuando el Agent se convierte en infraestructura de IA, NVIDIA puede estar presente en cada capa.











