Organización y compilación: Deepchain TechFlow
Invitado: Jensen Huang, CEO de NVIDIA
Fuente del podcast: Bonnie Blockchain
Título original: Los 7 puntos clave del discurso de Jensen Huang en GTC Taipei 2026 y un resumen de los últimos movimientos de NVIDIA!【Bonnie Blockchain】
Fecha de emisión: 2 de junio de 2026
Resumen de puntos clave
En su discurso en GTC Taipei 2026, Jensen Huang centró la próxima fase estratégica de NVIDIA en una premisa fundamental: la IA ha pasado de generar contenido a una era de agentes capaces de realizar trabajo. El Token ya no es solo un indicador técnico, sino una unidad productora de ingresos, ganancias y PIB. En torno a este cambio, NVIDIA lanzó Vera Rubin, la CPU Vera, un kit de herramientas empresarial para agentes, una nueva generación de PC en colaboración con Microsoft, y para la IA física, Cosmos 3, Alpamayo 2 e Isaac GR00T. Huang enfatizó que el modelo de cómputo de la próxima década estará constituido por modelos, marcos de agentes, herramientas con habilidades y tiempos de ejecución, y se expandirá desde la nube, las empresas y las PC locales hacia robots, fábricas, satélites y dispositivos periféricos. Para la cadena de suministro de Taiwán, esto significa que las fábricas de IA, la eficiencia energética, la velocidad de entrega de infraestructura y la capacidad de colaboración full-stack se convertirán en la clave para la próxima ola de crecimiento industrial.
Extracto de puntos de vista destacados
La llegada de la era de los agentes de IA
- "La IA útil ha llegado, la IA ahora es un generador de ganancias y también un generador de PIB. Detrás no solo hay modelos de lenguaje grandes, sino un nuevo modelo de cómputo: el agente."
- "Un agente está compuesto por un modelo de lenguaje grande y un marco de agente. El marco, como un sistema operativo, conecta memoria, herramientas, razonamiento, planificación y acción."
- "El avance en los sistemas de agentes proviene de que los modelos de lenguaje grandes ya pueden pensar, razonar, planificar y usar herramientas, y también de que los marcos de agentes pueden gestionar memoria, coordinar procesos y programar herramientas."
- "Cada empresa se convertirá en una empresa de agentes, dentro de cada empresa operarán agentes, y todas necesitarán su propio sistema operativo de agentes."
Tokens, fábricas de IA y economía de la infraestructura
- "El Token ahora es una unidad de ingresos rentable. Las empresas de IA, queriendo producir más Tokens, construirán más fábricas de IA, precisamente la razón del aumento explosivo de la demanda de cómputo en Taiwán."
- "El cómputo son ingresos, el cómputo son ganancias. Sin ingresos y ganancias, hay pérdidas."
- "Si una fábrica de IA tiene solo 1 gigavatio de electricidad, ese es su límite máximo; bajo esta premisa, el rendimiento por vatio son ingresos, porque cada Token tiene valor."
- "Elegir una arquitectura errónea solo porque un chip es más barato no se traducirá en beneficios reales, necesitas asegurar los ingresos por vatio. Cuanto más compres, más ganarás."
Vera Rubin y la transformación de infraestructura de NVIDIA
- "Vera Rubin no es un solo chip, ni solo una GPU, sino un sistema completo construido de extremo a extremo."
- "NVIDIA solía ser una empresa de GPU, luego se convirtió en una empresa de sistemas, y ahora está evolucionando hacia una empresa de infraestructura, ayudando a los clientes a construir fábricas de IA."
- "Vera Rubin es el proyecto de ingeniería más ambicioso en la historia de NVIDIA, los 40,000 ingenieros de la compañía participaron en él, y la cadena de suministro de Taiwán también contribuyó a la creación de este sistema."
- "Grace Blackwell fue creada para procesar IA, especialmente inferencia; Vera Rubin fue creada para ejecutar agentes."
La CPU Vera y las necesidades de cómputo de los agentes
- "Todas las CPU anteriores fueron creadas para humanos, esta CPU es para agentes."
- "Los agentes no tienen paciencia. No viven en un mundo de segundos, sino de nanosegundos. Cuando un agente usa una herramienta, quiere una respuesta inmediata; cuando accede a una base de datos, quiere resultados al instante."
- "La CPU Vera es una CPU creada para agentes, enfatiza el rendimiento de un solo hilo, instrucciones por ciclo, ancho de banda por núcleo y ancho de banda total del sistema."
- "Este mercado será sin duda más grande que el anterior, porque el número de agentes superará con creces al de humanos, y los agentes son muy impacientes. Esta es la CPU NVIDIA Vera."
La próxima generación de computadoras personales
- "El futuro modelo de cómputo de agentes operará en la nube de IA, dentro de las empresas, y también en tu PC."
- "El nuevo sistema operativo será el sistema operativo tradicional más el modelo de lenguaje grande; el modelo de lenguaje grande es, en muchos sentidos, la versión moderna de DirectX, una extensión inteligente de la computadora."
- "Las aplicaciones serán reemplazadas por tiempos de ejecución de agentes; la aplicación moderna se convertirá en un agente."
- "NVIDIA y Microsoft están reinventando la PC, lanzando una nueva generación de máquinas Windows que cubren escritorio, portátiles y estaciones de trabajo."
IA física, conducción autónoma y robótica
- "Los modelos de lenguaje se entrenan con datos desde la perspectiva humana, pero los robots necesitan comprender el mundo desde su propia perspectiva; el mayor problema de la IA física son los datos."
- "Cosmos 3 es el modelo base de vanguardia para IA física, puede comprender, razonar, generar, simular en bucle cerrado e incluso convertirse en la estrategia misma."
- "Con la IA, el cómputo mismo también se convierte en datos; puedes usar Cosmos 3 para entrenar más modelos de IA y potenciarlo como tu modelo propietario."
- "Ya sea un agente en la nube, un agente en PC, un sistema de conducción autónoma o un robot humanoide, el modelo de cómputo subyacente es el mismo: modelo, marco, herramientas con habilidades y tiempo de ejecución."
Los snacks favoritos de Jensen Huang se convierten en la cadena de suministro de IA
Jensen Huang:
Es realmente increíble cómo ha crecido el ecosistema de Taiwán hasta el día de hoy. Cuando la mayoría de la gente habla del ecosistema, primero piensa en nuestra pila de software, en el ecosistema de desarrolladores sobre los sistemas de cómputo de NVIDIA. Pero el ecosistema de NVIDIA no termina ahí, se extiende hacia arriba hasta la cadena de suministro de Taiwán, donde todo comenzó; y se extiende hacia abajo hasta el centro de datos, llegando finalmente al usuario final.
Hoy, prácticamente hablaremos de cada eslabón de este ecosistema. Hay tantas personas a quienes agradecer. Amo este ecosistema, hay una gran cantidad de empresas, y muchos de mis socios ecológicos favoritos están aquí. Taiwán tiene un ecosistema extremadamente rico, es la mejor cadena de suministro ecosistémica del mundo.
Llega la era de los agentes de IA
Jensen Huang:
Cuando vine hace dos años, comencé a hablar sobre cómo la IA pasaría de ser generativa a la próxima ola, la próxima IA sería la IA de agentes. Hoy podemos decir que la IA de agentes ha llegado, la IA útil ha llegado.
Desde una perspectiva industrial, esto significa que la demanda de Tokens se está volviendo extremadamente alta. Porque si la IA puede realmente hacer cosas, la gente querrá producir más de esta capacidad. El Token ahora es una unidad rentable, una unidad capaz de generar ingresos. Dado que puede generar dinero, las empresas de IA querrán construir más Tokens, generar más Tokens, construir más fábricas de IA, y esta es la razón del aumento explosivo en la demanda de cómputo en Taiwán.
Esta es precisamente la razón por la que están tan ocupados y su negocio va tan bien. De hecho, también parece reflejarse en el precio de las acciones de algunas de sus empresas. El modelo de cómputo ha cambiado, todo ha cambiado.
Primer punto clave: La IA útil ha llegado, la IA ahora es un generador de ganancias y también un generador de PIB. Detrás hay un nuevo modelo de cómputo. No es solo el modelo de lenguaje grande, es el agente. Casi todo lo que compartiremos hoy se basará en esta premisa.
Permítanme tomarme un momento para explicar qué quiero decir. Aquí dentro hay un agente, una aplicación de agente. En el pasado, aquí habría una aplicación, código, un sistema operativo, es decir, el código dentro de la aplicación ejecutándose sobre un sistema operativo. Hoy, es un agente, compuesto por uno o más modelos de lenguaje grandes, y colocado dentro de un marco de agente. Este marco lo ayudará a coordinar su trabajo, permitiéndole realmente realizar tareas productivas.
Cuando una entrada llega al sistema, el agente debe comprender, observar, razonar, actuar y usar herramientas. Las herramientas pueden ser hojas de cálculo, navegadores web, motores de procesamiento de datos o motores de bases de datos. Cada flujo de información, ya sea para procesar el contexto, entender lo que está sucediendo, razonar sobre el siguiente paso o formar un plan ejecutable, necesita ser coordinado por algún software.
Así que la esencia de un agente es un sistema como este. Procesa memoria a corto plazo, memoria de trabajo, y también memoria a largo plazo, como los humanos. El sistema de gestión de memoria se vuelve extremadamente importante. Todo el sistema se llama agente. El modelo de lenguaje grande se encarga del pensamiento, el marco de agente conecta todo, como un sistema operativo.
Este es el nuevo modelo de cómputo, y la razón por la que los agentes pueden realizar tareas asombrosas. Este es un gran avance: los modelos de lenguaje grandes ya pueden pensar, razonar, planificar y usar herramientas muy bien; simultáneamente, también tenemos marcos de agentes que pueden gestionar memoria, coordinar procesos e invocar herramientas. Por lo tanto, ahora podemos hacer muchas cosas que antes no podíamos.
¿Qué es un Token en una fábrica de IA?
Jensen Huang:
Token, DSX, GPU, CPU, Vera... Hemos construido el próximo sistema: Vera Rubin. Vera Rubin no es un solo chip, ni solo una GPU. Comienza con la GPU, pero va mucho más allá. El sistema completo de extremo a extremo es Vera Rubin.
Incluye la GPU, Vera Rubin NVLink 72, y es coordinado por la CPU Vera que presentaré más adelante. También incluye el revolucionario sistema de almacenamiento Vera, CX9, nuestra pila de software DOCA y el procesador de seguridad integrado. Todos los datos en el sistema, ya sea en reposo, en tránsito o en uso, están encriptados. Todo el sistema es seguro porque los modelos de IA son extremadamente valiosos. Por eso todo el sistema sigue el paradigma de cómputo confidencial.
Cualquiera de estos sistemas, por sí solo, podría ser una revolución completa. Vera Rubin es el proyecto de ingeniería más ambicioso en la historia de NVIDIA. Los 40,000 ingenieros de toda la empresa participaron en el trabajo de Vera Rubin, sin mencionar que todos ustedes aquí también participaron en la creación de todo el sistema. Vera Rubin es realmente un milagro, no es solo un chip, sino un sistema compuesto por muchos componentes.
Y eso no es todo. Hace mucho tiempo, NVIDIA era una empresa de GPU; en estos años, hemos evolucionado gradualmente hacia una empresa de sistemas. Lo que ven ahora es el sistema más complejo que hemos diseñado desde cero. Pero al final, nuestros clientes y socios no quieren comprar computadoras, quieren construir fábricas de IA.
Esta es la razón por la que NVIDIA está comenzando otra transformación. Como pueden ver, muchas de nuestras tecnologías se han expandido a la escala de infraestructura completa. Nuestros socios también operan a escala de infraestructura: plantas de energía, sistemas de refrigeración, proveedores de redes eléctricas y muchas empresas industriales ahora forman parte de nuestro ecosistema. En última instancia, debemos construir la pila tecnológica completa, como cuando construimos la GPU, Grace Blackwell, NVLink 72; ahora, debemos construir sistemas full-stack que permitan a los clientes crear una infraestructura de IA excepcional.
Hacerlo bien, ayudar a los clientes a construir y desplegar fábricas de IA, se vuelve extremadamente importante. La razón es simple: el cómputo son ingresos, el cómputo son ganancias. Sin ingresos y ganancias, hay pérdidas.
Deben entender una cosa: cuando una infraestructura de IA se pone en línea, puede hacerlo rápidamente o tardar mucho; el rendimiento puede ser alto o bajo; la elasticidad y confiabilidad pueden ser buenas o malas; la vida útil efectiva puede ser larga o corta. Como esto representa una inversión de 50, 60, incluso 100 mil millones de dólares, esta curva es extremadamente importante.
Esta es también la razón por la que NVIDIA es un gran socio. Tenemos capacidades de integración completa, no solo hicimos una presentación, sino que realmente creamos toda la infraestructura, conectamos todo y construimos a gran escala nosotros mismos, asegurando que el sistema funcione bien. Por lo tanto, nuestro primer tiempo de Token, primer tiempo de inferencia, tiempo de inicio de entrenamiento son más rápidos.
Segundo, nuestro rendimiento por vatio, Tokens por vatio es de clase mundial. La razón es que integramos todo, diseñamos todo desde cero, simulamos todo el sistema y empleamos co-diseño extremo. Como mostré con el gabinete Vera Rubin, todo está diseñado para lograr un rendimiento asombroso.
Si tu centro de datos, tu fábrica, tiene 1 gigavatio de electricidad, no obtendrá más, esa es toda la capacidad de generación que tendrás. Con 1 gigavatio de electricidad, el rendimiento por vatio son tus ingresos, porque cada Token puede generar ganancias, cada Token son ingresos.
Este es el futuro. El cómputo son ingresos, el rendimiento por vatio son tus ingresos. Elegir una arquitectura errónea solo porque un chip es más barato no se traducirá en beneficios reales, necesitas asegurar los ingresos por vatio. Cuanto más compres, más ganarás.
Ahora, puedo decírselos: Vera Rubin está en plena producción. La escala de la cadena de suministro que hemos establecido para Vera Rubin es el doble que la de Grace Blackwell. Antes, ensamblar un gabinete Grace Blackwell tomaba dos horas, ahora toma solo cinco minutos. Así que no solo la capacidad de producción es mayor, sino que el rendimiento de producción es mucho más rápido, y necesitamos todo esto para satisfacer la demanda.
Este ecosistema es extraordinario. Para respaldar a Grace Blackwell y preparar la escalada de Vera Rubin, ya se han puesto en línea millones de pies cuadrados de capacidad. Quiero agradecerles a todos. Vera Rubin está en plena producción. Gracias a todos.
Presentación del sistema Vera Rubin
Jensen Huang:
Vera Rubin no fue construido solo para IA. Vera Rubin no fue construido solo para ejecutar IA, fue construido para ejecutar agentes. Este es un sistema de agentes. Imaginen la complejidad. Y precisamente por eso, el agente es el último avance en ciencias de la computación. Tomó tantos años finalmente realizar su potencial y volverse útil. La computadora que puede ejecutarlo también debería ser la más avanzada del mundo.
Este es Vera Rubin. Veamos. Traigan a Vera Rubin, por favor.
Este es Vera Rubin, Vera Rubin NVLink 72. Es parte del próximo sistema, en el próximo GTC hablaré más; hoy tenemos mucho más que discutir. Este es el gabinete de la CPU Vera, 256 CPUs, todas refrigeradas por líquido. Presentaré a Vera más adelante. Este es el sistema de procesamiento y almacenamiento Vera BlueField, también el sistema de seguridad. Y, por supuesto, nuestra red Mellanox, la primera CPO del mundo. Este es Vera Rubin, una combinación asombrosa de tecnologías.
Cuando construimos Hopper, fue para el pre-entrenamiento. El pre-entrenamiento era la aplicación más importante entonces, la carga de trabajo más importante que enfrentábamos. Luego, cuando construimos Grace Blackwell, muchos decían: "Jensen, NVIDIA es muy buena en pre-entrenamiento, la inferencia es simple". ¿Se acuerdan? Muchos dijeron: "La inferencia es simple, nosotros también podemos hacerla".
Pero saben, la inferencia equivale a dinero. Los modelos son muy complejos, lograr simultáneamente alta velocidad de respuesta, interacción rápida y alto rendimiento es muy difícil. Por eso creamos NVLink 72.
Hoy, el costo de Token de NVIDIA es el más bajo del mundo. No solo un 10% más bajo, sino varias veces menor, incluso órdenes de magnitud. Todo esto porque realizamos un co-diseño extremo, porque entendemos el modelo de cómputo y el patrón de cómputo de la inferencia, y creamos NVLink 72.
Con Vera Rubin, las cosas han ido más allá de la inferencia. Ahora es inferencia dentro de un sistema de agentes. Este es Vera Rubin. Sin cables, sin mangueras, sin ventiladores. La última vez que se lo mostré, había cables por todas partes.
CPU VERA: La CPU para agentes de IA
Jensen Huang:
La CPU Vera está creada para la era de la IA. Hasta ahora, todas las CPU fueron creadas para humanos. Éramos usuarios, inquilinos. La forma en que los humanos usamos las CPU es vivir en un mundo medido en segundos. Alquilamos CPUs en la nube, cuantos más núcleos de CPU, más recursos podemos alquilar. El caso de uso y la economía de las CPU antiguas son completamente diferentes a los de los agentes.
Los agentes no tienen paciencia. No viven en un mundo de segundos, sino de nanosegundos. Cuando un agente usa una herramienta, quiere una respuesta inmediata; cuando accede a una base de datos, quiere resultados al instante. Cada momento que un agente espera, se retrasa para pasar al siguiente paso, y al siguiente, y al siguiente. Por lo tanto, debemos hacer que la CPU tenga la menor latencia posible, la mayor interactividad posible.
Por eso creamos la CPU Vera para la era de la IA. En nuestro sistema, tiene tres usos. El primero, por supuesto, es para pensar en Vera Rubin. En el gabinete Vera Rubin, ya hay dos CPUs. Saben, estamos fabricando y vendiendo millones de unidades de Vera Rubin, y ya hemos vendido millones de Grace Blackwell. NVIDIA ya es uno de los mayores fabricantes de CPU del mundo.
Las dos CPUs en el gabinete Vera Rubin: una se usa para coordinar y gestionar las GPU, gestionar la caché KV y procesar todo el software que se ejecuta en el gabinete. También tenemos Grace BlueField, para seguridad y aislamiento. La parte de cómputo Vera se usa para el marco de agentes, responsable de coordinar los modelos de IA, el uso de herramientas y el acceso a bases de datos.
El servidor de datos aquí es Vera BlueField, es el servidor y sistema de almacenamiento más rápido del mundo. Es crucial porque los agentes accederán a la memoria a velocidades extremadamente altas. El servidor de almacenamiento y la CPU ahora están en la ruta crítica de la parte más costosa del centro de datos.
Hay una buena razón por la que es la parte más costosa aquí. La economía central de una fábrica de IA es el Token, y el Token se crea aquí. Por supuesto, quieres fabricar y generar la mayor cantidad de Tokens posible. Todo el valor económico se concentra aquí, y la CPU y el sistema de almacenamiento no deben ser un cuello de botella.
Por lo tanto, la CPU Vera ejerce mucha presión sobre la arquitectura de la CPU, y es por eso que construimos una nueva arquitectura desde cero. Es una CPU que el mundo nunca ha visto, la llamamos Vera. Es una CPU creada para agentes. Todas las CPU anteriores fueron creadas para humanos, esta CPU es para agentes.
Primero, las instrucciones por ciclo de Vera deben ser extremadamente fuertes, porque necesitamos reducir la latencia, reducir el tiempo de procesamiento. Queremos rendimiento de un solo hilo, no solo rendimiento bruto. El rendimiento de un solo hilo debe ser de clase mundial, debe ser el mejor. Por lo tanto, el IPC de Vera es extremadamente alto, de nivel mundial: captura, decodifica y ejecuta 10 instrucciones por ciclo de reloj.
Segundo, el ancho de banda necesario para que la CPU mueva datos hacia adentro y hacia afuera debe ser de clase mundial. Esto incluye tanto el ancho de banda por núcleo como el ancho de banda total. Como dije antes, un sistema de agentes es inherentemente desacoplado y distribuido. Cuando el cómputo está desacoplado y distribuido, la red se convierte en un problema. Por lo tanto, debemos mover datos lo más rápido posible entre núcleos de CPU, entre CPU y almacenamiento, entre CPU y GPU.
El ancho de banda alrededor del sistema y dentro de los núcleos de la CPU debe ser de clase mundial, porque los núcleos de la CPU se comunican entre sí con un ancho de banda extremadamente alto. No se alquilan uno por uno, sino que colaboran todos juntos. El ancho de banda transversal de Vera es asombroso. Es el primer sistema que admite PCI Express Gen 6, también es el primero con LPDDR5, alcanzando un ancho de banda de 1.2 a 2 TB por segundo, 2 a 3 veces el de la CPU de mayor rendimiento.
Esta es una CPU creada para agentes. Este mercado será sin duda más grande que el anterior, porque el número de agentes superará con creces al de humanos, y los agentes son muy impacientes. Esta es la CPU NVIDIA Vera.
El modelo de cómputo más importante de la próxima década
Jensen Huang:
Esta es realmente la diapositiva más importante. La conclusión central aquí es: este es el modelo de aplicación de la próxima década, y también el modelo de cómputo de la próxima década. Agente, marco de agente y el modelo de lenguaje grande coordinado por el marco, cada empresa lo ejecutará. Cada empresa se convertirá en una empresa de agentes, dentro de cada empresa operarán agentes, cada empresa descubrirá que los agentes necesitan su propio sistema operativo.
Todas las empresas nos preguntan: ¿cómo ejecutar agentes de forma segura? ¿Cómo construir agentes para sus cargas de trabajo? Por eso, tenemos el Kit de herramientas empresarial de IA de NVIDIA para agentes. De hecho, me han visto construirlo paso a paso públicamente.
Casi todo lo que hace NVIDIA, como saben, si miran mis discursos en GTC de hace 5 o 10 años, verán que he estado hablando de estas cosas durante años, porque siempre nos hemos estado preparando para este momento.
Para que una empresa construya agentes como servicio, o agentes para operaciones, necesita cuatro cosas. Primero, necesita un modelo. Por supuesto, cuanto más inteligente, barato y rápido sea el modelo de lenguaje grande, mejor. Segundo, necesita un marco para coordinar todo el sistema. Tercero, estos modelos quieren usar herramientas, y estas herramientas tienen habilidades. Acabo de mostrar las bibliotecas CUDA-X, se convertirán en herramientas poderosas para los agentes en el futuro. Cuarto, necesita un tiempo de ejecución, es decir, el sistema operativo que conecta todo.
Este es el Kit de herramientas de agentes de NVIDIA. Incluye modelos que pueden modificarse, es decir, los modelos de código abierto de clase mundial de NVIDIA. Me gustaría mostrar más. Puedes ejecutar agentes de cualquier lugar, puedes ejecutar agentes poderosos como Claude Code o Codex. Puedes colocarlos en un marco llamado Open Shell, para ejecutarlos de forma altamente segura dentro de la empresa.
Este Shell protegerá al agente, asegurando que siempre esté sujeto a políticas de seguridad. La privacidad está protegida, los permisos y privilegios están claramente asignados, la identidad está protegida. Por lo tanto, Open Shell está siendo adoptado globalmente. NVIDIA Open Shell es de código abierto, verán que muchas empresas lo adoptan, incluyendo Red Hat, Canonical y Microsoft. Será adoptado en todas partes.
Este es un tiempo de ejecución importante, y este tiempo de ejecución está totalmente optimizado para la plataforma de IA de NVIDIA omnipresente. Puedes ejecutar Open Shell en cualquier nube, localmente, incluso en el dispositivo. Ahora, tienes herramientas y bibliotecas que los agentes pueden usar, tienes modelos que puedes modificar o usar directamente, y tienes marcos de agentes. Estos marcos de agentes ahora pueden ejecutarse localmente o en cualquier otro lugar.
Uno de mis casos de uso favoritos de agentes es el diseñador de chips. Es uno de los trabajos más importantes de NVIDIA. Por supuesto, debemos colaborar con Cadence para construir un superagente de diseño de chips. Está coordinado por Codex o Claude Code, toma como entrada RTL, diagramas de arquitectura, esquemas o especificaciones, y te ayuda a corregir lo que necesita corrección. Hemos creado algunos superagentes juntos, y optimizamos Nemotron para el tiempo de ejecución de NVIDIA.
NVIDIA se compromete a construir modelos abiertos para el mundo, para que ustedes, y todos nosotros, podamos crear nuestros propios agentes. Hoy, anunciamos Nemotron 3 Ultra, nuestro próximo modelo abierto de próxima generación, y es muy inteligente. Los modelos Nemotron no solo te dan el modelo, sino también todos los datos que usamos para entrenarlo.
Porque tenemos una poderosa alianza de socios, pueden ver a todos los socios listados aquí. Colaboramos juntos, contribuimos datos entre nosotros. A través de estas grandes asociaciones, todo, desde el modelo hasta los scripts de entrenamiento y los datos, se abrirá completamente. Esta es la mejor forma de un modelo abierto, y la mejor política de sistema de modelos abiertos del mundo. El objetivo es simple: puedes tomar todo, agregarle más, mejorarlo y convertirlo en tu propio modelo.
Nemotron 3 Ultra es 5 veces más rápido, cuesta un 30% menos y es completamente abierto. Estamos muy comprometidos con esto. Este es Nemotron 3, y ahora también estamos desarrollando Nemotron 4. Es este kit de herramientas completo, compuesto por modelos, marcos, herramientas con habilidades y tiempo de ejecución, lo que permite a cada empresa en el mundo crear sus propios agentes, como Cadence con su superagente.
La nueva generación de computadoras personales de NVIDIA
Jensen Huang:
Microsoft y NVIDIA reinventarán la PC. Esta será la nueva PC. Mañana por la noche, supongo que mañana por la noche aquí, estaré con Satya para hablar más sobre el trabajo que hemos estado haciendo juntos durante los últimos tres años. Microsoft y NVIDIA hemos pasado tanto tiempo repensando completamente cómo funciona la PC, para estar listos para este momento.
Como mencioné antes, este modelo de cómputo de agentes funcionará en la nube de IA, dentro de las empresas y también en tu PC. ¿Qué sucede cuando una PC tiene un agente autónomo? Te ayudará, te entenderá. Puedes hablarle, puede verte. Puedes hacer que lea archivos, te ayude con la investigación. Puede hacer mucho más, lo mostraré más adelante.
El nuevo sistema operativo será, por supuesto, el sistema operativo antiguo más el modelo de lenguaje grande. En muchos sentidos, el modelo de lenguaje grande es la versión moderna de DirectX. Tiene entradas y salidas, entiende indicaciones, entiende visión por computadora, puede generar video, puede generar sonido. Es la extensión inteligente moderna de la PC, de la computadora.
Sobre eso, como dije antes, las aplicaciones serán reemplazadas por tiempos de ejecución de agentes, y la aplicación moderna es un agente.
Señoras y señores, la laptop NVIDIA RTX Spark. Gracias. Tengo demasiadas cosas en los bolsillos. Bien, este es el chip más asombroso del mundo. Es el N1X que construimos en colaboración con MediaTek. Creo que vi a Rick hace un momento. Este es N1X, un chip hermoso. Francamente, es un chip que tomó 33 años construir.
La razón es que el 100% de la pila de software de NVIDIA puede ejecutarse aquí. ¿Quieres hacer biología digital? No hay problema. ¿Procesamiento sísmico? No hay problema. ¿Astrofísica? No hay problema. Todo lo relacionado con CUDA, toda la física, toda la biología, toda la genómica, toda la IA, no hay problema. Todo el gráficos por computadora, tampoco.
Cada aplicación que NVIDIA ha creado, y cada aplicación que Windows ha ejecutado, Microsoft y NVIDIA la han optimizado meticulosamente para que esta computadora realmente pueda ejecutar todo lo que el mundo ha creado. Además, ahora también puede ejecutar agentes. Es una computadora increíble, estoy muy orgulloso de ella.
Esta computadora puede tener localmente el modelo Nemotron 3 Ultra, o el modelo súper Nemotron 3; también puede conectarse a Claude Code, Codex u otros modelos en la nube; o conectarse a modelos en la red. Funcionará y hará cosas asombrosas. RTX Spark es una reinvención de la laptop, pero de hecho, Microsoft y NVIDIA están reinventando toda la PC.
Hoy, anunciamos una nueva línea de productos: tres máquinas Windows revolucionarias, que cubren escritorio, portátil y estación de trabajo. Son 100% compatibles con Windows, 100% compatibles con CUDA, 100% equipadas con NVIDIA AI Tensor Core. Todo lo que pueden ejecutar en las diversas plataformas NVIDIA de todo el mundo, puede ejecutarse aquí.
Tenemos una hoja de ruta para esto. Es una nueva familia de productos. Para cada generación de arquitectura, tendremos escritorio, portátil, estación de trabajo; la próxima generación seguirá teniendo escritorio, portátil, estación de trabajo. Estoy muy feliz y honrado de que el 100% de la industria mundial de PC se haya unido a nosotros para reinventar la PC. Esta es una nueva línea de productos y un nuevo comienzo.
Cosmos 3: El modelo base para IA física
Jensen Huang:
En el escenario de los modelos de lenguaje, los datos en inglés y otros idiomas en los que entrenamos en Internet provienen de la perspectiva humana. Los escribimos nosotros, los leemos nosotros. Sin embargo, si queremos crear datos para robots de IA, deben provenir de la percepción y perspectiva del robot. La gran mayoría de los datos de video en el mundo están en tercera persona, no en primera persona.
Por lo tanto, para los sistemas de agentes, sistemas de robots e IA física, los datos son el problema más difícil. Ya nos han visto avanzar por esta escalera. Comenzamos con teleoperación, que esencialmente es demostración humana. Esto no es diferente del avance en aprendizaje por refuerzo con retroalimentación humana. Luego, usamos simulación, aquí es donde entra Omniverse. Esto también es similar a la recompensa verificable en el aprendizaje por refuerzo.
Usamos estos sistemas para arrancar modelos de IA, para arrancar modelos de IA física. Finalmente, podemos aprender desde una perspectiva en tercera persona y reproyectarlo a una perspectiva en primera persona. A través de este proceso de arranque, finalmente tenemos un modelo base mundial que puede comprender el mundo físico desde cualquier perspectiva que desees. Tercera persona, primera persona, de afuera hacia adentro, de adentro hacia afuera, todo es posible. Este es realmente un gran avance.
Hoy, anunciamos Cosmos 3. Cosmos 3 es la vanguardia de la IA física. Estamos a la vanguardia en modelos de lenguaje, muchas personas también investigan modelos de lenguaje. Pero en IA física, somos definitivamente los más fuertes del mundo. Estoy increíblemente orgulloso de que el equipo haya logrado esto.
Este es el modelo base para todo su trabajo. Ya sea que quieran crear robots, robots de fábrica o robots que trabajen en fábricas, siempre que involucre el mundo físico, ahora tienen un compañero: Cosmos 3. Puede comprender y razonar, puede generar, puede simular en bucle cerrado, incluso puede convertirse en la estrategia misma. Está a la vanguardia en varias clasificaciones globales. Estoy muy orgulloso de Cosmos. Hoy anunciamos Cosmos 3.
Antes eran datos más cómputo igual a IA. Ahora que tenemos IA, el cómputo también se convertirá en datos. Entonces, usando Cosmos 3, entrenen un gran número de modelos de IA. Cosmos es un sistema de modelos abiertos excelente, es exactamente igual que Nemotron. Abrimos el modelo, abrimos los datos, incluso abrimos los métodos de entrenamiento, para que puedas potenciarlo por ti mismo y convertir Cosmos en tu modelo propietario.
Alpamayo 2: Inferencia para conducción autónoma
Jensen Huang:
Hoy anunciamos Alpamayo 2, un modelo abierto para vehículos de conducción autónoma. Estamos colaborando con compañías automotrices globales. Si miran estas marcas que ya se han unido a NVIDIA Hyperion, que están construyendo automóviles NVIDIA Hyperion, representan aproximadamente el 80% de los automóviles a nivel mundial. Es decir, estos fabricantes cubren alrededor del 80% de los automóviles globales.
En el futuro, habrá una gran cantidad de sistemas NVIDIA Hyperion, que podrán ejecutar Alpamayo y cualquier otra pila tecnológica de conducción autónoma. También nos conectamos a servicios de movilidad. Aproximadamente el 97% de los servicios de movilidad globales se están conectando con nosotros. Por lo tanto, cuando desplegamos Alpamayo en el tiempo de ejecución Hyperion y el sistema operativo Halos, podemos conectarnos a estos servicios globales.
Isaac GR00T: Robots humanoides
Jensen Huang:
NVIDIA Isaac GR00T es nuestra pila tecnológica para robots humanoides, que incluye modelo, generación de datos, simulación, tiempo de ejecución y sistema operativo. Representa la plataforma GR00T, es decir, la plataforma Isaac GR00T.
Pueden ver que cada uno de nuestros sistemas sigue exactamente el mismo patrón: ya sea un sistema de agentes en la nube, un sistema de agentes en PC, un sistema robótico para vehículos autónomos o un sistema robótico para robots humanoides, es el mismo patrón.
Por supuesto, en cada caso, construimos todo de manera integral. Hacemos integración vertical, integración completa, empleamos co-diseño y co-diseño extremo, y luego lo abrimos para que todos usen cualquier parte según sus necesidades. Incluso te ayudaremos a modificar lo que quieras usar.
Pero todavía falta algo: los sistemas robóticos necesitan una plataforma de referencia. Estos sistemas robóticos son demasiado complejos, tienen muchos motores y sensores, y también son muy frágiles. Sin embargo, necesitamos una forma de entregar estas plataformas de referencia. Como lo hemos hecho para PC, DGX, la nube y vehículos autónomos, ahora también lo haremos para robots.
Hoy anunciamos NVIDIA Isaac GR00T, una plataforma de referencia para robots humanoides completamente integrada. Tiene 25 grados de libertad por mano, 31 grados de libertad en el cuerpo del robot, mide 6 pies de alto y pesa 150 libras. Como yo, solo que el primer número es más bajo que el mío, el segundo más alto, por lo demás similar.
Esta plataforma ejecuta el nuevo Thor, y nuestra pila de software completa, pila de generación de datos, pila de simulación de datos y tiempo de ejecución. Todo está integrado en una plataforma robótica para que todos la usen. La construimos para la educación superior e investigadores universitarios, porque para ellos es demasiado difícil construir tal plataforma por sí mismos.
Resumen de reflexión
Jensen Huang:
En los últimos seis meses, la industria informática ha cambiado completamente. La razón del cambio es que los agentes finalmente se han realizado y se han fusionado con los últimos modelos de vanguardia, permitiendo que la IA ahora realmente realice trabajo útil.
Este modelo de cómputo se repetirá una y otra vez: un agente está compuesto por un modelo y un marco, usa herramientas con habilidades y se ejecuta sobre algún tiempo de ejecución. El tiempo de ejecución depende de si está en la nube, en un entorno empresarial local, en una PC o en un robot. Pero el modelo de cómputo es exactamente el mismo.
Usarás diferentes marcos según tus preferencias, también usarás diferentes modelos según tus preferencias. Los mejorarás para tu uso propietario. Crearás superagentes, los alquilarás a otros, ayudarás a otros a completar su trabajo. Esta plataforma de agentes, este patrón de agentes, es precisamente lo que el Kit de herramientas empresarial de IA de NVIDIA pretende respaldar. Para ustedes, esta es una gran manera de participar en la IA; para nosotros, también es una gran oportunidad de crecimiento.
Vera Rubin está en plena producción. Grace Blackwell fue construida para procesar IA, especialmente inferencia; Vera Rubin fue construida para ejecutar agentes. Ya está en plena producción. Es mucho más que una GPU, es todo un sistema de procesamiento de agentes desacoplado y distribuido.
NVIDIA realmente se ha convertido en una empresa de infraestructura. No solo una empresa de GPU, no solo una empresa de sistemas, sino una empresa de infraestructura. Nuestro objetivo es ayudarlos a crear los mayores ingresos, las mayores ganancias, y hacerlo lo más rápido posible.
En el mundo de los agentes, esta nueva forma de cómputo significa que la CPU también debe construirse para agentes, no para humanos. Una CPU construida para agentes tiene sus propias necesidades especiales. Nuestra CPU NVIDIA Vera es una revolución. Me complace ver su escalada y situación de pedidos, será el lanzamiento de producto más rápido y exitoso en la historia de NVIDIA.
NVIDIA y Microsoft han creado una nueva línea de productos de PC. Este es un nuevo comienzo. Por supuesto, el mismo patrón de procesamiento de agentes, el mismo modelo de cómputo de agentes que describí, también se ejecutará en varios dispositivos. Mencioné la PC, pero en el futuro aparecerá en robots, satélites, estaciones base, fábricas, la nube, localmente, dispositivos periféricos. Este sistema de IA de agentes y este modelo de cómputo de agentes se replicarán en todo tipo de computadoras. Es probable que nuestra comprensión de la computadora personal cambie.








