En junio de 2026, AMD confirmó los planes de envío de un nuevo dispositivo en su AI DevDay en San Francisco. Esta máquina, del tamaño aproximado de un Mac mini de Apple, cuenta con 128 GB de memoria unificada y está oficialmente posicionada como una plataforma de desarrollo de IA local. Solo unos meses antes, el DGX Spark de NVIDIA ya había aparecido en los escritorios de los desarrolladores: también una caja metálica del tamaño de una mano, también con 128 GB de memoria unificada, y que igualmente afirmaba poder ejecutar modelos grandes de 200 mil millones de parámetros localmente.
Plataforma de desarrollador AMD Ryzen AI Halo, equipada con el procesador Ryzen AI Max+ 395
El reporte de Tom's Hardware basado en pruebas reales del HP Z2 Mini G1a ofrece un precio de referencia para el bando de AMD: entre $2,949 y $3,999. El sitio web de NVIDIA muestra que el DGX Spark comienza en $3,999, y hubo discusiones en febrero de 2026 sobre que algunas versiones OEM habían aumentado a $4,679. En precio, AMD se impone, pero esto es solo superficial.
Los mismos 128GB, dos rutas diferentes
El corazón del AMD Ryzen AI Halo es un procesador Ryzen AI Max+ 395: 16 núcleos Zen 5, 40 unidades de cómputo GPU basadas en la arquitectura RDNA 3.5, y junto a él, una NPU XDNA 2 con 50 TOPS de potencia. La descripción oficial de hardware de NVIDIA para el DGX Spark sigue otra lógica: el GB10 Grace Blackwell Superchip, un CPU ARM de 20 núcleos combinado con una GPU de arquitectura Blackwell, sin NPU, pero incluye una tarjeta de red ConnectX-7 de 200 Gbps. El dispositivo de AMD ofrece puerto de red 2.5GbE y WiFi 7; NVIDIA ofrece 10GbE más WiFi 7, además de esa valiosa tarjeta de red de alta velocidad.
Las especificaciones de memoria parecen similares. Ambos tienen 128 GB de LPDDR5x. La página del producto de AMD indica un ancho de banda de memoria de 256 GB/s, mientras que NVIDIA da la cifra de 273 GB/s. La diferencia es menor al 7%, casi imperceptible en la mayoría de tareas de inferencia.
La elección del sistema operativo revela una divergencia más fundamental. El AMD Ryzen AI Halo viene con Windows 11 Pro preinstalado, con Ubuntu 24.04 como opción. Al encenderlo, aparece un escritorio de PC estándar, con puertos Thunderbolt y soporte completo para periféricos universales. El DGX Spark ejecuta DGX OS, basado en Ubuntu y personalizado; lo primero al encenderlo es configurar el entorno CUDA y la cadena de herramientas de contenedores de NVIDIA.
The Register realizó una comparativa detallada de pruebas reales en diciembre de 2025. La conclusión: en inferencia de modelos de lenguaje grandes de un solo lote, la velocidad de generación de tokens de ambas máquinas era muy similar. Pero en la fase de procesamiento del "prompt", el DGX Spark era entre 2 y 3 veces más rápido. Esta brecha proviene del soporte de la arquitectura Blackwell para cómputo de baja precisión y de años de optimización de código por parte de NVIDIA en las rutinas de inferencia. La evaluación de ServeTheHome señaló otra dimensión: la tarjeta de red ConnectX-7 del DGX Spark tiene un precio minorista superior a $900 por separado, y su valor potencial en escenarios de clústeres multi-máquina va mucho más allá del ámbito de la inferencia en una sola máquina.
Según pruebas reales de medios como Tom's Hardware, las dimensiones del Ryzen AI Halo son 85 mm de alto, 168 mm de ancho y 200 mm de profundidad, con un peso de 2.3 kg, más cercano al tamaño de una mini estación de trabajo tradicional. La documentación oficial de NVIDIA muestra que el DGX Spark mide 150 mm por lado, 50.5 mm de grosor y pesa 1.2 kg. Uno parece una torre apilada, el otro un router.
La barra de progreso de ROCm, ya no es solo "que funcione"
La nota de lanzamiento oficial de AMD muestra que ROCm 7.2 se lanzó en enero de 2026, y la versión 7.2.4 posterior optimizó específicamente la estabilidad y el rendimiento de las cargas de trabajo de inferencia de IA. Phoronix publicó un reporte detallado el día del lanzamiento.
Para los desarrolladores en entornos Linux, el proceso de instalación de ROCm ahora es mucho más sencillo que hace dos años. En marzo de 2026, el autor de un blog técnico, Kunal Ganglani, escribió en una guía detallada sobre el uso de ROCm que completar todo el proceso, desde la configuración del sistema hasta ejecutar un modelo en PyTorch en una RX 7900 XTX, le tomó solo unos 30 minutos, "mientras que en 2024, hacer lo mismo requería medio día de trabajo". Su blog confirma que ROCm actualmente soporta PyTorch, TensorFlow, JAX, DGL, los cuatro frameworks principales de aprendizaje profundo, y motores de inferencia como vLLM, Ollama, llama.cpp tienen backends disponibles para ROCm.
Pero estos avances no pueden contrarrestar la inercia de CUDA. La pila de software de NVIDIA tiene una acumulación de 17 años; la cantidad de preguntas y respuestas relacionadas con CUDA en Stack Overflow es decenas de veces mayor que las de ROCm. Las nuevas versiones de bibliotecas de vanguardia como FlashAttention o xFormers generalmente salen primero para CUDA, y las versiones portadas a ROCm tardan semanas o meses. Cualquier kernel CUDA personalizado que vaya más allá del API estándar de PyTorch necesita ser adaptado manualmente en plataformas AMD. La matriz de compatibilidad oficial de AMD enumera las combinaciones de frameworks y GPU verificadas, pero "estar verificado" no es lo mismo que "encontrar suficientes posts de discusión en la comunidad cuando surgen problemas".
En el subreddit r/LocalLLaMA, los hilos de discusión sobre qué dispositivo elegir no han cesado desde finales de 2025. La conclusión más citada proviene del final del blog de Ganglani: "Si necesitas que todo funcione perfectamente desde el primer día, compra NVIDIA. Si estás dispuesto a pasar una tarde solucionando problemas para ahorrarte $800, ROCm está listo".
AMD parece tenerlo claro. En el último año, las acciones de la compañía no han sido replicar directamente la fortaleza de NVIDIA, sino construir una alternativa fuera de sus murallas.
En agosto de 2024, AMD anunció la adquisición de ZT Systems por $49 mil millones. The Wall Street Journal confirmó la finalización de la transacción en marzo de 2025. El negocio de ZT Systems es ayudar a clientes de centros de datos a hiperescala a diseñar y ensamblar sistemas de servidores de IA a nivel de bastidor completo, clientes que incluyen gigantes como Microsoft y Meta que compran decenas de miles de GPU anualmente. AMD obtuvo así la capacidad de diseño de sistemas, desde una sola GPU hasta bastidores completos.
Pero AMD pronto tomó una decisión aparentemente contradictoria. En mayo de 2025, según el anuncio oficial de Sanmina, AMD desinversiónó el negocio de fabricación de centros de datos de ZT Systems a esta empresa de servicios de fabricación electrónica, conservando solo el equipo de diseño. La lógica es clara: AMD no quiere convertirse en un competidor de sus propios clientes OEM. Si AMD misma produjera servidores de IA, los fabricantes de servidores que venden sus tarjetas gráficas se alertarían inmediatamente. Conservar la capacidad de diseño y externalizar la fabricación equilibra la adquisición de capacidades y las relaciones en el ecosistema.
Dos cosas más clave ocurrieron en el semestre siguiente.
En octubre de 2025, el comunicado oficial de AMD anunció una asociación estratégica con OpenAI para desplegar 6GW de GPU AMD Instinct. El primer lote de 1GW está programado para enviarse en la segunda mitad de 2026. Este acuerdo contenía una cláusula: OpenAI tiene la opción de comprar hasta un 10% de las acciones de AMD. Reuters y CNBC destacaron este detalle en sus reportes del día. Las GPU que abastecerán a OpenAI serán de la próxima generación Instinct, cuyo modelo específico AMD no ha revelado.
En febrero de 2026, AMD publicó otro comunicado oficial anunciando una colaboración extendida con Meta, también para desplegar 6GW de GPU. Esta vez, los chips son una variante personalizada del MI450 para Meta, programados para comenzar a enviarse en la segunda mitad de 2026. El reporte de CNBC ese día señaló un detalle: justo unos días antes de que se hiciera pública esta colaboración, Meta también había anunciado un acuerdo extendido de compra de chips de IA con NVIDIA.
Que Meta firme pedidos a largo plazo con ambas compañías al mismo tiempo es en sí más convincente que cualquier comparación técnica. Para empresas que invierten decenas de miles de millones de dólares anuales en infraestructura de IA, poner todos los huevos en una sola canasta es un riesgo inaceptable. AMD no necesita superar a NVIDIA en rendimiento de manera integral, solo necesita ofrecer una opción viable fuera de NVIDIA para, bajo la lógica del "doble proveedor", conseguir pedidos. La escala de los dos contratos de 6GW sugiere que al menos OpenAI y Meta ya han incluido a AMD en su lista.
La respuesta de NVIDIA en el mismo período, un conjunto de medidas
En el mismo período, NVIDIA jugó un conjunto de medidas en el mercado empresarial. El DGX Spark se posiciona como un dispositivo de escritorio para desarrolladores, pero su tarjeta ConnectX-7 determina que no es una estación de trabajo aislada. La evaluación de ServeTheHome analizó en detalle el valor de esta tarjeta en la validación de prototipos y la depuración de entrenamiento distribuido, concluyendo que, aunque mucho más lenta que NVLink a nivel de centro de datos, es suficiente para escenarios de clústeres pequeños. Este diseño ancla el DGX Spark en la línea de productos empresariales más amplia de NVIDIA: los desarrolladores usan Spark para prototipos, luego migran el código a DGX Station o instancias DGX en la nube, y finalmente lo despliegan en clústeres de servidores con H200 o B200. Una cadena de herramientas coherente de software y hardware, del escritorio al centro de datos, soldada a CUDA.
NVIDIA también lanzó en ese período el paquete de suscripción de software AI Enterprise, que empaqueta herramientas como TensorRT, RAPIDS y el servidor de inferencia Triton, con cargo por nodo. La página oficial del producto de NVIDIA enumera la lista completa de herramientas incluidas en AI Enterprise. Esto no es vender hardware, es convertir el despliegue y operación a nivel empresarial en un negocio de pago continuo, una vez que los desarrolladores se habitúan a CUDA.
Comparando ambas rutas, la divergencia es lo suficientemente clara.
NVIDIA construye un ciclo completo y cerrado, desde el chip hasta el sistema, el software y los servicios en la nube. Los desarrolladores pueden usar herramientas optimizadas desde el primer día que entran en este ciclo, a costa de quedar vinculados al ecosistema de un solo proveedor. AMD sigue una ruta de alternativa abierta: usa la arquitectura x86 estándar del sector, soporta sistemas duales Windows y Linux, convierte ROCm en una pila de código abierto compatible con los frameworks principales, y compite con precios más bajos por aquellos clientes sensibles al costo o que ya han decidido diversificar el riesgo de proveedores.
El producto Ryzen AI Halo en sí es la expresión de hardware más concisa de esta ruta. No tiene tarjeta de red personalizada, ni sistema operativo dedicado, ni unidad de aceleración de entrenamiento de baja precisión. Es una PC genérica, que simplemente incluye una memoria unificada capaz de ejecutar modelos de 200B parámetros y una GPU aceptable. Puedes usarla para inferencia de modelos grandes, o cerrar la terminal y abrir Photoshop. El precio de $2,949 del HP Z2 Mini G1a citado por Tom's Hardware en su reporte está muy por debajo del precio inicial de $3,999 del DGX Spark; si se consideran otras versiones OEM, la diferencia puede superar los $1,000.
Pero esta flexibilidad tiene su contraparte: la concesión. Los datos de pruebas reales de The Register ya muestran que, una vez que se sale del escenario de inferencia de un solo lote y se entra en escenarios que requieren mucho cómputo paralelo, las ventajas de la arquitectura Blackwell en baja precisión y la pila de software optimizada durante años amplían rápidamente la brecha. Si necesitas una caja de escritorio que pueda ejecutar Stable Diffusion para generar imágenes, en el ecosistema CUDA de NVIDIA hay un conjunto completo de herramientas listas para instalar y usar. La arquitectura RDNA 3.5 de AMD no soporta formatos de baja precisión FP4 y FP8, lo que penaliza el rendimiento en cargas de trabajo como generación de imágenes; esto está determinado por el diseño de la arquitectura RDNA y no se puede resolver con actualizaciones de controladores.
El destino de la caja, no está dentro de la caja
Recuperando la línea de tiempo, las acciones de AMD en el último año constituyen una ruta bastante clara.
A nivel de hardware, Instinct MI300 y MI325X en producción, MI350 y MI450 avanzando según la hoja de ruta, Ryzen AI Max+ 395 pasando de chip para portátiles a APU de escritorio metido en una plataforma de desarrollo. A nivel de sistema, mediante la adquisición de ZT Systems, obtiene capacidad de diseño a nivel de bastidor, y luego desinvierte la fabricación conservando la I+D. A nivel de clientes, con dos contratos a largo plazo de escala de 6GW, vincula a los dos mayores consumidores de potencia de cómputo para IA del mundo, y de paso introduce a OpenAI en la lista de accionistas. A nivel de software, ROCm itera a un ritmo de aproximadamente una versión por trimestre, alcanzando el soporte de frameworks principales, pero la adaptación de bibliotecas de vanguardia y la acumulación de comunidad aún necesitan tiempo.
Cada paso no es aislado. Adquirir ZT Systems es para tener la capacidad de diseñar los clústeres de IA a hiperescala que necesitan OpenAI y Meta, no solo vender GPUs a fabricantes de servidores. La rápida iteración de ROCm es para que los clientes que firman contratos de 6GW tengan una pila de software usable al desplegar, no una entrega de hardware sin más. El lanzamiento del Ryzen AI Halo es para extender ese mismo ecosistema ROCm al extremo del escritorio, permitiendo a los desarrolladores usar una máquina de $3,000 para depuración local y luego desplegar el modelo en clústeres en la nube con MI450.
Pero esto no significa que AMD ya haya alcanzado a NVIDIA. Los dos contratos de 6GW son promesas de despliegue futuro; la capacidad energética medida en gigavatios refleja una escala de planificación de infraestructura, no la cantidad de chips ya enviados. Las especificaciones concretas del MI450 aún no se han hecho públicas; el rendimiento real del chip, el rendimiento de producción, la estabilidad tras despliegues a gran escala son incógnitas. ROCm ha logrado "ser usable" en los frameworks principales, pero el estado de "la comunidad puede ayudarte cuando surgen problemas" necesita más tiempo para acumularse. Y la acumulación de 17 años de CUDA no se disipa con unas pocas iteraciones rápidas en trimestres.
La fortaleza de NVIDIA tampoco está solo en el software. La tarjeta ConnectX-7 del DGX Spark insinúa otra dimensión competitiva: mientras AMD compite por desarrolladores con precio y apertura, NVIDIA está bloqueando a aquellos equipos que necesitan hacer entrenamiento distribuido y grandes tuberías de inferencia con capacidad de escalado de clúster. Comprar un DGX Spark cuesta $3,999, comprar dos con un cable de red permite ejecutar prototipos distribuidos. En este escenario, la ventaja de ROCm en igualar la inferencia en una sola máquina se disuelve.
Cuando la divergencia entre las dos compañías en IA finalmente se materializa en esta caja del tamaño de una mano, se convierte en una elección concreta. Abres la caja de AMD, obtienes un entorno de PC familiar, instalas PyTorch con instrucciones casi idénticas, cargas el modelo, comienzas la inferencia, el proceso es fluido, hasta que necesitas usar una biblioteca que solo tiene backend para CUDA. Abres la caja de NVIDIA, obtienes un entorno especializado optimizado desde el hardware hasta los controladores y la cadena de herramientas de contenedores, todo funciona como se espera al iniciar, solo que la factura tiene más de mil dólares adicionales, y el costo de migración futuro a otro proveedor ya está bloqueado de antemano.
AMD no ha desafiado frontalmente el imperio de pila completa de NVIDIA. Ha elegido un camino más pragmático: ser una opción alternativa suficiente cuando los precios y la capacidad de suministro de NVIDIA no pueden seguir el ritmo de la demanda de todos los clientes. Los dos contratos de 6GW son la evidencia más poderosa de esta estrategia hasta ahora. Ryzen AI Halo es la extensión de esta estrategia en el escritorio; no es seguir la moda de hacer cajas pequeñas de IA, sino dar un paso más en la línea de "usar un ecosistema abierto y ventajas de coste para atraer a desarrolladores que no quieren quedar bloqueados".






