Durante los dos últimos años, los fabricantes de PC han mencionado repetidamente un parámetro al promocionar las "PCs con IA": la potencia de cálculo del NPU. Pero ya sea los 45 TOPS del Lunar Lake de Intel o los 50 TOPS del Strix Point de AMD, estas cifras siempre se han mantenido en un nivel relativamente moderado. Pueden hacer desenfoque de fondo, reducción de ruido de voz, ejecutar algunos modelos pequeños en el dispositivo, pero poco más.
El 31 de mayo, en la conferencia GTC 2026, NVIDIA presentó el superchip RTX Spark, elevando esa cifra a 1 petaflop, es decir, 1000 TOPS. No es una mejora del 30% o 50%, es un salto de un orden de magnitud.
En el mismo evento se anunciaron otras noticias: Microsoft, en colaboración con RTX Spark, actualizó el mecanismo de seguridad nativo de Windows e introdujo el tiempo de ejecución de sandbox de código abierto de NVIDIA, OpenShell, en la plataforma Windows; Adobe anunció una reestructuración desde los cimientos de Photoshop y Premiere para adaptarse específicamente a la arquitectura de memoria unificada de RTX Spark; seis fabricantes de equipos originales (OEM) confirmaron el lanzamiento en otoño de este año de portátiles delgados y sobremesa compactos equipados con este chip.
Lo que NVIDIA hizo en esta GTC no fue solo lanzar un nuevo chip. Está intentando establecer un nuevo estándar de hardware para la categoría de "computadora personal con IA".
Cuando la GPU se convierte en el protagonista del PC
Primero, veamos el chip en sí. Según los datos presentados por NVIDIA en la GTC, RTX Spark integra una GPU con arquitectura Blackwell, 6144 núcleos CUDA, junto con una CPU Grace de 20 núcleos con arquitectura Arm diseñada conjuntamente con MediaTek, fabricado con el proceso de 3 nm de TSMC. El cambio clave está en la arquitectura de memoria: hasta 128 GB de memoria unificada, donde la CPU y la GPU comparten el mismo grupo de memoria, sin necesidad de transferir datos entre ellos.
Esto es lo opuesto a la lógica arquitectónica del PC tradicional.
La estructura básica del PC tradicional es "una CPU x86 como procesador principal, con una GPU independiente como componente opcional". Incluso con el concepto reciente de PC con IA, el enfoque de Intel y AMD ha sido integrar un NPU dentro de la CPU como módulo adicional para aceleración de IA, con potencias generalmente entre cuarenta y cincuenta TOPS. La GPU sigue siendo un "accesorio externo".
RTX Spark redistribuye el poder. Este SoC convierte a la GPU en protagonista, relegando a la CPU a un papel secundario. La potencia de IA que NVIDIA anuncia es de 1 petaflop FP4, equivalente a 1000 TOPS, más de 20 veces la potencia del NPU integrado en la generación anterior de PCs con IA. Esto no es acelerar en la misma pista, es comenzar la carrera en otra pista.
La velocidad de adopción de los fabricantes OEM confirma este juicio. Según el anuncio oficial de NVIDIA y reportes posteriores de DIGITIMES, ASUS, Dell, HP, Lenovo, Microsoft Surface y MSI lanzarán en otoño portátiles delgados y sobremesa compactos con RTX Spark; Acer y Gigabyte seguirán después. Prácticamente todas las marcas principales de Windows PC están participando.
RTX Spark no es un producto que nazca de la nada. A principios de 2025, un chip con los mismos núcleos Blackwell y Grace se presentó bajo el nombre de Project DIGITS y DGX Spark, pero en ese momento se posicionaba como una supercomputadora de escritorio Linux para desarrolladores, con un tamaño cercano al de un sobremesa pequeño. Un año después, esta arquitectura se ha comprimido en el espacio de refrigeración de un portátil delgado, el sistema operativo cambió de Linux a Windows, y los usuarios objetivo se expandieron desde desarrolladores de IA hasta consumidores generales y usuarios empresariales. Este es el cambio más notable en el lanzamiento de consumo de la GTC 2026: NVIDIA no está presentando un juguete para desarrolladores, sino abriendo la puerta al mercado de consumo masivo.
Modelos de 120B ejecutándose localmente, ¿son suficientes?
Las cifras de potencia de cálculo y memoria finalmente deben responder a una pregunta: ¿para qué sirve?
La respuesta que NVIDIA dio en la presentación es que RTX Spark permite ejecutar localmente modelos masivos (LLM) de 120 mil millones de parámetros, con una ventana de contexto que puede alcanzar el millón de tokens. ¿Qué significa 120B? Como referencia, la práctica predominante actual para ejecutar modelos locales en hardware de consumo es que una RTX 4090 con 24 GB de VRAM puede ejecutar, mediante compresión por cuantización, modelos de alrededor de 30 a 40 mil millones de parámetros. Modelos más pequeños, como los de 9B, pueden ejecutarse rápidamente en tarjetas gráficas de consumo. El salto de 9B a 120B redefine el estándar de "suficiencia" para la IA en el dispositivo.
Los 128 GB de memoria unificada son la base de todo esto. En la arquitectura tradicional de PC, la CPU tiene su propia memoria del sistema, la GPU tiene su propia VRAM, y existe una barrera física entre ambas. Un modelo masivo que exceda la capacidad de la VRAM o no puede ejecutarse en absoluto, o requiere una compleja división del modelo e intercambio de memoria, lo que ralentiza drásticamente la velocidad. La arquitectura de memoria unificada elimina este cuello de botella; los datos del modelo se colocan directamente en el grupo compartido de 128 GB, accesible tanto por la CPU como por la GPU. Apple demostró primero la viabilidad de consumo de esta ruta tecnológica con Apple Silicon; ahora NVIDIA la lleva al ecosistema Windows.
Además de la inferencia de modelos masivos, los casos de uso que enumera NVIDIA incluyen edición de video 12K, renderizado de escenas 3D de más de 90 GB, y juegos con trazado de rayos a más de 100 fps en resolución 1440p. El punto común de estos escenarios es que la cantidad de datos procesados en una sola vez es enorme; un PC tradicional requeriría tiempos de espera muchas veces superiores al tiempo de procesamiento, o simplemente no podría ejecutarlos.
Hay una distancia entre "soportar la ejecución" y "ser fluido y usable". NVIDIA no ha publicado la velocidad real de inferencia del modelo de 120B en RTX Spark, ni datos sobre la latencia del primer token en escenarios con ventanas de contexto de un millón de tokens. El indicador clave que determina la velocidad de inferencia con contexto largo es el ancho de banda de memoria. Como referencia, el DGX Spark, que también utiliza el núcleo GB10, tiene un ancho de banda de memoria medido de aproximadamente 301 GB/s. Este nivel de ancho de banda es adecuado para ejecutar un modelo de 120B, pero al procesar ventanas de contexto de un millón de tokens, los usuarios podrían necesitar esperar varios segundos para ver el primer token de salida. La versión portátil de RTX Spark podría tener un ancho de banda real ajustado debido a las limitaciones de consumo de energía.
Añadiendo una jaula de seguridad al agente de IA
Otro anuncio central más allá de la potencia de cálculo es la colaboración de NVIDIA y Microsoft a nivel del sistema. Esta parte podría ser la más fácil de pasar por alto en los lanzamientos de consumo de la GTC 2026, pero quizás la de mayor impacto en la industria.
Una computadora capaz de ejecutar un modelo de 120B, si se deja en manos de un agente de IA que puede operar el escritorio de forma autónoma, hacer clic en botones, leer y escribir archivos, el riesgo de seguridad deja de estar en el nivel de "si perderá datos" para pasar a "si el agente hará cosas que no deseas que haga". Sin resolver este problema, ninguna empresa desplegaría este tipo de dispositivos a sus empleados.
La solución de Microsoft y NVIDIA es una doble línea de defensa. La primera: Microsoft actualizó el mecanismo de seguridad nativo de Windows, proporcionando monitoreo y restricción a nivel del sistema operativo para las acciones del agente de IA. La segunda: NVIDIA introdujo oficialmente el tiempo de ejecución OpenShell en la plataforma Windows. Según la documentación oficial de NVIDIA, OpenShell es un tiempo de ejecución de sandbox de código abierto que proporciona aislamiento a nivel de kernel. Define un ámbito de operación controlado para el agente de IA, que puede ejecutar tareas de forma autónoma dentro de este límite, pero sus permisos están estrictamente restringidos, sin poder acceder a archivos centrales del sistema, conexiones de red o datos sensibles del usuario.
La implicación de esta combinación para las compras empresariales es clara. Hasta ahora, el concepto de "agente de IA local" permanecía en la etapa de demostración técnica. El hardware podía ejecutarlo, pero el marco de seguridad estaba vacío. Ningún departamento de TI empresarial se atrevería a incluir dispositivos en ese estado en su lista de compras. NVIDIA y Microsoft insertan una capa de aislamiento estandarizada entre el hardware y la aplicación, transformando lo "usable" en "gestionable".
La sobrecarga de rendimiento de OpenShell en sí es una variable por observar. El aislamiento mediante sandbox suele conllevar cierta pérdida de rendimiento; cuánto afectará a la velocidad de inferencia o la respuesta del sistema son datos que NVIDIA no ha hecho públicos. La complejidad de implementación en la gestión de TI empresarial, la compatibilidad con las políticas de seguridad existentes, estos problemas prácticos de implementación necesitarán ser verificados una vez que los dispositivos OEM salgan al mercado.
¿Por qué Adobe aceptó "reestructurar desde los cimientos"?
El nivel de cooperación de los desarrolladores de software suele ser un indicador para juzgar si una nueva plataforma de hardware puede consolidarse.
Los movimientos anunciados por Adobe durante la GTC son la señal más fuerte del lado del software en esta ronda de lanzamientos. Según confirmaciones del blog oficial de NVIDIA y ejecutivos de Adobe, Adobe inició una reestructuración desde los cimientos de Photoshop y Premiere, específicamente para adaptarse a la arquitectura de memoria unificada de RTX Spark, afirmando que el rendimiento en IA y procesamiento gráfico puede mejorar hasta 2 veces.
"Reestructurar desde los cimientos" no es añadir un plugin o crear una capa de adaptación. En un PC tradicional, la CPU y la GPU tienen sus propios espacios de memoria; al procesar un archivo PSD enorme o una línea de tiempo de video 8K, los datos deben transferirse repetidamente entre los dos conjuntos de memoria, siendo este un punto crítico de desperdicio de rendimiento. La memoria unificada de RTX Spark permite que la CPU y la GPU compartan directamente el mismo espacio de 128 GB; este cambio estructural tiene un valor práctico para el flujo de trabajo de creadores profesionales. Que Adobe modifique el código base por esto indica que reconoce que esta dirección arquitectónica no es un eslogan de marketing puntual.
Sin embargo, ¿cuál es el punto de referencia de esta "aceleración de 2 veces"? Ni NVIDIA ni Adobe lo han publicado. ¿Se compara con procesadores x86 de la misma generación más una GPU discreta, o con la solución NPU de la generación anterior de PCs con IA? Los resultados serían completamente diferentes. Hasta que se hagan públicos los criterios de las pruebas comparativas, el valor real de esta cifra debe tomarse con reservas.
También anunciaron su apoyo Blackmagic Design, ComfyUI, llama.cpp, OTOY y varios desarrolladores de videojuegos. El seguimiento de ComfyUI y llama.cpp es digno de mención, ya que son herramientas de código abierto muy activas en los flujos de trabajo de IA local actuales. El apoyo temprano de la comunidad de desarrolladores a menudo refleja el potencial ecológico de una plataforma de manera más realista que las promesas de los grandes fabricantes.
NVIDIA está utilizando su ecosistema CUDA y la arquitectura de memoria unificada para construir una experiencia similar a la integración hardware-software de Apple dentro del ecosistema Windows. La diferencia es que Apple construyó su propio muro, mientras que NVIDIA necesita convencer a Microsoft y a los ISV (Proveedores de Software Independientes) para construirlo juntos. Que Adobe esté dispuesta a actuar desde los cimientos al menos indica que se ha colocado el primer ladrillo de este muro.
Más allá de las especificaciones en el papel
Volviendo a la pregunta más práctica: ¿realmente se podrán comprar estos dispositivos y cuál será la experiencia al usarlos?
Según la información publicada por NVIDIA, los primeros dispositivos con RTX Spark saldrán al mercado en otoño de este año, abarcando portátiles delgados y sobremesa compactos de ASUS, Dell, HP, Lenovo, Microsoft Surface y MSI. Los modelos de Acer y Gigabyte seguirán después. Ningún OEM ha anunciado precios concretos ni fechas exactas de lanzamiento.
Más crítico que el precio son varias incógnitas a nivel físico. ¿Cómo se equilibra el consumo de energía y la refrigeración al meter un chip de 1 petaflop en un portátil delgado? ¿Cuál es el rendimiento de RTX Spark en tareas de oficina diarias no relacionadas con IA y su autonomía de batería? ¿El ancho de banda real de los 128 GB de memoria unificada en formato portátil se verá significativamente reducido debido a las limitaciones de consumo?
Estas preguntas son la verdadera prueba de la implementación industrial. La potencia máxima de un chip en un prototipo de ingeniería y su rendimiento real durante 8 horas diarias en manos de un consumidor suelen ser dos cosas diferentes. NVIDIA enfatizó la eficiencia energética de RTX Spark en la presentación, pero no proporcionó valores específicos de TDP ni datos de autonomía.
Desde la perspectiva del panorama de la industria del PC, la aparición de RTX Spark marca la formación de un nuevo modelo de división del trabajo. En los últimos treinta años, el poder sobre los chips centrales del PC residía en los fabricantes de procesadores x86; los fabricantes de GPU, aunque cada vez más importantes, siempre fueron "componentes que se conectan a la placa base". Lo que NVIDIA presenta ahora es un SoC completo, que integra desde la CPU y la GPU hasta el controlador de memoria, con la parte de la CPU de arquitectura Arm diseñada por MediaTek. La estructura de poder en la cadena de suministro del PC está pasando de "CPU x86 más una GPU opcional" a "una plataforma SoC centrada en la GPU".
Este cambio no se completará en un día. La estrategia de precios de los OEM, el rendimiento real de eficiencia energética de los productos, el progreso de adaptación del software por parte de los ISV, el ciclo de validación de compra de los clientes empresariales, cada eslabón determina si RTX Spark se convertirá en un nuevo referente para la industria del PC o en otra demostración técnica que empieza fuerte y se desvanece. La respuesta, al menos, deberá esperar hasta este otoño.








