¿Qué anuncios importantes hizo Jensen Huang, CEO de NVIDIA, en su keynote de CES 2026?

Jensen Huang anunció 8 lanzamientos importantes, incluyendo el supercomputador NVIDIA Vera Rubin POD, el dispositivo de óptica integrada NVIDIA Spectrum-X Ethernet, la plataforma de almacenamiento en memoria de contexto para inferencia NVIDIA, y el NVIDIA DGX SuperPOD basado en DGX Vera Rubin NVL72, entre otros.

¿Qué es la plataforma NVIDIA de almacenamiento en memoria de contexto para inferencia y por qué es importante?

Es una infraestructura de almacenamiento nativa de IA a nivel POD diseñada para almacenar KV Cache. Se basa en BlueField-4 y Spectrum-X Ethernet acelerados, y está estrechamente acoplada con NVIDIA Dynamo y NVLink. Es crucial para aplicaciones de contexto largo como conversaciones multiturno, RAG y razonamiento Agentic de múltiples pasos, ya que mejora la eficiencia de la inferencia y reduce la necesidad de recalcular contextos.

¿Qué es el modelo Alpha-Mayo y cómo se aplica en la conducción autónoma?

Alpha-Mayo es un modelo de razonamiento de código abierto que permite a los vehículos autónomos 'pensar'. Descompone problemas en pasos, razona sobre todas las posibilidades y elige la ruta más segura. Es lo suficientemente ligero para ejecutarse en estaciones de trabajo y se utiliza en el sistema NVIDIA DRIVE, que ya está en producción en el nuevo Mercedes-Benz CLA para permitir capacidades de conducción autónoma.

¿Cómo está contribuyendo NVIDIA al ecosistema de código abierto en IA según el discurso?

NVIDIA fue el mayor contribuyente de modelos, datos y 'recetas' de código abierto en Hugging Face en 2025, con 650 modelos y 250 conjuntos de datos de código abierto. También anunció la expansión de su familia de modelos de código abierto Nemotron, añadiendo nuevos modelos de RAG Agentic, modelos de seguridad, modelos de voz y modelos para todo tipo de robots.

Huang Renxun anuncia 8 nuevos productos en 1.5 horas, Nvidia apuesta por la IA de razonamiento y la IA física

Q: ¿Cuáles son las mejoras clave del GPU Rubin en comparación con su predecesor Blackwell?

El GPU Rubin introduce un motor Transformer, ofrece un rendimiento de inferencia NVFP4 de 50 PFLOPS (5 veces más que Blackwell) y un rendimiento de entrenamiento NVFP4 de 35 PFLOPS (3.5 veces más). Además, es la primera plataforma en admitir HBM4 con un ancho de banda de 22 TB/s, 2.8 veces mayor que la generación anterior.

marsbitPublicado a 2026-01-06Actualizado a 2026-01-06

Resumen

NVIDIA presentó 8 novedades clave en el CES 2026, enfocándose en infraestructura de IA para inferencia y robótica física. Jensen Huang anunció el sistema NVIDIA Vera Rubin POD, que integra 6 chips personalizados (CPU Vera, GPU Rubin, NVLink 6 Switch, ConnectX-9 SuperNIC, BlueField-4 DPU y Spectrum-X CPO) en un solo rack, logrando 3.6 EFLOPS en inferencia. También destacó tres productos para optimizar inferencia: Spectrum-X Ethernet CPO (mejora eficiencia energética), una plataforma de almacenamiento de contexto en memoria (reduce recálculos) y DGX SuperPOD basado en Rubin (reduce costos de token para modelos MoE). En IA física, NVIDIA lanzó el modelo abierto Alpha-Mayo para conducción autónoma, ya integrado en el Mercedes-Benz CLA, y herramientas como Alpha-Sim para simulación. Además, expandió su ecosistema de modelos open-source, incluyendo Nemotron y Alpamayo. Rubin estará disponible en 2026, con Microsoft entre los primeros usuarios. NVIDIA combina hardware especializado, software abierto y diseño sistémico para reducir costos y impulsar la IA a escala.

Autor | ZeR0 骏达, 智东西

Editor | 漠影

LAS VEGAS, 5 de enero de 2026 (智东西) — Recién, el fundador y CEO de Nvidia, Huang Renxun, pronunció el primer discurso clave de 2026 en la Consumer Electronics Show (CES) 2026. Huang Renxun, vistiendo como siempre su chaqueta de cuero, anunció 8 lanzamientos importantes en 1.5 horas, desde chips y racks hasta diseño de red, proporcionando una introducción en profundidad de toda la nueva plataforma generacional.

En el campo de la computación acelerada y la infraestructura de IA, Nvidia presentó el supercomputador de IA NVIDIA Vera Rubin POD, el dispositivo de óptica encapsulada conjuntamente (CPO) NVIDIA Spectrum-X Ethernet, la plataforma de almacenamiento de memoria contextual para inferencia NVIDIA, y el NVIDIA DGX SuperPOD basado en DGX Vera Rubin NVL72.

NVIDIA Vera Rubin POD utiliza 6 chips desarrollados internamente por Nvidia, que abarcan CPU, GPU, Scale-up, Scale-out, capacidades de almacenamiento y procesamiento, todas las partes están co-diseñadas para satisfacer las demandas de modelos avanzados y reducir el coste computacional.

Entre ellos, la CPU Vera adopta la arquitectura de núcleo personalizada Olympus, la GPU Rubin introduce un motor Transformer con un rendimiento de inferencia NVFP4 de hasta 50 PFLOPS, un ancho de banda NVLink por GPU de hasta 3.6 TB/s, soporte para la tercera generación de computación confidencial universal (el primer TEE a nivel de rack), logrando un entorno de ejecución confiable completo a través de dominios de CPU y GPU.

Estos chips ya han regresado de la fabricación (taped-out), Nvidia ya ha verificado todo el sistema NVIDIA Vera Rubin NVL72, y los socios también han comenzado a ejecutar sus modelos y algoritmos de IA integrados internamente, todo el ecosistema se está preparando para el despliegue de Vera Rubin.

En otros lanzamientos, el dispositivo de óptica encapsulada conjuntamente NVIDIA Spectrum-X Ethernet optimiza significativamente la eficiencia energética y el tiempo de actividad de las aplicaciones; la plataforma de almacenamiento de memoria contextual para inferencia NVIDIA redefine la pila de almacenamiento para reducir el cómputo repetitivo y mejorar la eficiencia de inferencia; el NVIDIA DGX SuperPOD basado en DGX Vera Rubin NVL72 reduce el coste por token de los grandes modelos MoE a 1/10.

En cuanto a modelos abiertos, Nvidia anunció la expansión de su familia de modelos de código abierto, lanzando nuevos modelos, conjuntos de datos y bibliotecas, incluyendo la serie de modelos de código abierto NVIDIA Nemotron que añade modelos Agentic RAG, modelos de seguridad, modelos de voz, y también lanzó nuevos modelos abiertos para todo tipo de robots. Sin embargo, Huang Renxun no entró en detalles en su discurso.

En cuanto a la IA física, el momento ChatGPT de la IA física ha llegado, la tecnología full-stack de Nvidia permite que el ecosistema global transforme industrias a través de la tecnología robótica impulsada por IA; la amplia biblioteca de herramientas de IA de Nvidia, incluyendo la nueva combinación de modelos de código abierto Alpamayo, permite que la industria global del transporte logre rápidamente una conducción L4 segura; la plataforma de conducción autónoma NVIDIA DRIVE ahora está en producción, equipando todos los nuevos Mercedes-Benz CLA, para una conducción definida por IA L2++.

01. Nuevo supercomputador de IA: 6 chips autodesarrollados, potencia de cálculo por rack de 3.6 EFLOPS

Huang Renxun cree que cada 10 a 15 años, la industria informática experimenta una remodelación completa, pero esta vez, dos transiciones de plataforma ocurren simultáneamente, de CPU a GPU, de "programar software" a "entrenar software", la computación acelerada y la IA están reconstruyendo toda la pila informática. La industria informática de 10 billones de dólares de la última década está experimentando una modernización.

Al mismo tiempo, la demanda de potencia de cálculo también se ha disparado. El tamaño de los modelos crece 10 veces al año, la cantidad de tokens que los modelos usan para pensar crece 5 veces al año, y el precio por token disminuye 10 veces al año.

Para hacer frente a esta demanda, Nvidia ha decidido lanzar nuevo hardware de computación cada año. Huang Renxun reveló que Vera Rubin ya ha entrado plenamente en producción.

El nuevo supercomputador de IA NVIDIA Vera Rubin POD utiliza 6 chips autodesarrollados: CPU Vera, GPU Rubin, conmutador NVLink 6, tarjeta de red inteligente ConnectX-9 (CX9), DPU BlueField-4, CPO Spectrum-X 102.4T.

CPU Vera: Diseñada para el movimiento de datos y el procesamiento de agentes, tiene 88 núcleos Olympus personalizados de Nvidia, 176 hilos de multihilo espacial de Nvidia, 1.8 TB/s de NVLink-C2C soporta memoria unificada CPU:GPU, memoria del sistema de 1.5 TB (3 veces la de la CPU Grace), memoria LPDDR5X SOCAMM con ancho de banda de 1.2 TB/s, y soporta computación confidencial a nivel de rack, duplicando el rendimiento de procesamiento de datos.

GPU Rubin: Introduce el motor Transformer, rendimiento de inferencia NVFP4 de hasta 50 PFLOPS, 5 veces la GPU Blackwell, compatible con versiones anteriores, mejora el rendimiento a nivel BF16/FP4 manteniendo la precisión de inferencia; rendimiento de entrenamiento NVFP4 de 35 PFLOPS, 3.5 veces Blackwell.

Rubin es también la primera plataforma que soporta HBM4, ancho de banda HBM4 de 22 TB/s, 2.8 veces la generación anterior, capaz de proporcionar el rendimiento necesario para exigentes modelos MoE y cargas de trabajo de IA.

Conmutador NVLink 6: Velocidad por lane aumentada a 400 Gbps, utiliza tecnología SerDes para lograr transmisión de señales de alta velocidad; cada GPU puede lograr un ancho de banda de comunicación de interconexión completa de 3.6 TB/s, el doble que la generación anterior, ancho de banda total de 28.8 TB/s, rendimiento de cómputo in-network a precisión FP8 de 14.4 TFLOPS, soporta 100% refrigeración líquida.

NVIDIA ConnectX-9 SuperNIC: Proporciona 1.6 Tb/s de ancho de banda por GPU, optimizada para IA a gran escala, con ruta de datos completamente definida por software, programable y acelerada.

NVIDIA BlueField-4: DPU de 800 Gbps, utilizado para tarjetas de red inteligentes y procesadores de almacenamiento, equipado con 64 núcleos de CPU Grace, combinado con ConnectX-9 SuperNIC, para descargar tareas de computación relacionadas con red y almacenamiento, mientras mejora las capacidades de seguridad de red, rendimiento de computación 6 veces mayor que la generación anterior, ancho de banda de memoria 3 veces mayor, velocidad de acceso de GPU al almacenamiento de datos aumentada al doble.

NVIDIA Vera Rubin NVL72: A nivel de sistema, integra todos estos componentes en un sistema de procesamiento de un solo rack, tiene 2 billones de transistores, rendimiento de inferencia NVFP4 de 3.6 EFLOPS, rendimiento de entrenamiento NVFP4 de 2.5 EFLOPS.

Este sistema tiene una capacidad de memoria LPDDR5X de 54 TB, 2.5 veces la generación anterior; memoria HBM4 total de 20.7 TB, 1.5 veces la generación anterior; ancho de banda HBM4 de 1.6 PB/s, 2.8 veces la generación anterior; ancho de banda total de escala vertical alcanza 260 TB/s, superando la escala total del ancho de banda de Internet global.

Este sistema se basa en el diseño de rack MGX de tercera generación, las bandejas de computación adoptan un diseño modular, sin host, sin cables, sin ventiladores, haciendo que el montaje y mantenimiento sea 18 veces más rápido que el GB200. El trabajo de montaje que originalmente tomaba 2 horas, ahora toma unos 5 minutos, y mientras el sistema original usaba aproximadamente un 80% de refrigeración líquida, ahora usa 100% refrigeración líquida. Un solo sistema en sí pesa 2 toneladas, y con el líquido refrigerante puede alcanzar 2.5 toneladas.

La bandeja del conmutador NVLink puede lograr mantenimiento de tiempo de inactividad cero y tolerancia a fallos, el rack puede seguir funcionando cuando se retira una bandeja o se despliega parcialmente. El motor RAS de segunda generación permite comprobaciones de estado con tiempo de inactividad cero.

Estas características mejoran el tiempo de actividad y el rendimiento del sistema, reduciendo aún más los costes de entrenamiento e inferencia, satisfaciendo los requisitos de alta fiabilidad y alta mantenibilidad de los centros de datos.

Más de 80 socios de MGX están listos para soportar el despliegue de Rubin NVL72 en redes hyperscale.

02. Tres nuevos productos revolucionan la eficiencia de la inferencia de IA: nuevo dispositivo CPO, nueva capa de almacenamiento contextual, nuevo DGX SuperPOD

Al mismo tiempo, Nvidia lanzó 3 productos importantes: el dispositivo de óptica encapsulada conjuntamente NVIDIA Spectrum-X Ethernet, la plataforma de almacenamiento de memoria contextual para inferencia NVIDIA, y el NVIDIA DGX SuperPOD basado en DGX Vera Rubin NVL72.

1. Dispositivo de óptica encapsulada conjuntamente NVIDIA Spectrum-X Ethernet

El dispositivo de óptica encapsulada conjuntamente NVIDIA Spectrum-X Ethernet se basa en la arquitectura Spectrum-X, utiliza un diseño de 2 chips, utiliza SerDes de 200 Gbps, cada ASIC puede proporcionar 102.4 Tb/s de ancho de banda.

Esta plataforma de conmutación incluye un sistema de alta densidad de 512 puertos, y un sistema compacto de 128 puertos, cada puerto tiene una velocidad de 800 Gb/s.

El sistema de conmutación CPO (óptica encapsulada conjuntamente) puede lograr una mejora de 5 veces en eficiencia energética, 10 veces en fiabilidad, 5 veces en tiempo de actividad de la aplicación.

Esto significa que se pueden procesar más tokens por día, reduciendo aún más el coste total de propiedad (TCO) del centro de datos.

2. Plataforma de almacenamiento de memoria contextual para inferencia NVIDIA

La plataforma de almacenamiento de memoria contextual para inferencia NVIDIA es una infraestructura de almacenamiento nativa de IA a nivel de POD, utilizada para almacenar KV Cache, basada en BlueField-4 y aceleración Ethernet Spectrum-X, estrechamente acoplada con NVIDIA Dynamo y NVLink, logrando una planificación contextual cooperativa entre memoria, almacenamiento y red.

Esta plataforma trata el contexto como un tipo de datos de primera clase, puede lograr 5 veces el rendimiento de inferencia, 5 veces mejor eficiencia energética.

Esto es crucial para mejorar aplicaciones de contexto largo como conversaciones de múltiples turnos, RAG, razonamiento multi-paso Agentic, estas cargas de trabajo dependen en gran medida de la capacidad de almacenar, reutilizar y compartir eficientemente el contexto en todo el sistema.

La IA está evolucionando de chatbots a IA Agentic (agente), que razona, invoca herramientas y mantiene estado a largo plazo, las ventanas de contexto se han expandido a millones de tokens. Este contexto se guarda en KV Cache, recalcular cada paso desperdiciaría tiempo de GPU y traería una gran latencia, por lo que es necesario almacenarlo.

Pero la memoria de GPU, aunque rápida, es escasa, el almacenamiento de red tradicional es demasiado ineficiente para el contexto a corto plazo. El cuello de botella de la inferencia de IA está pasando del cómputo al almacenamiento contextual. Por lo tanto, se necesita una nueva capa de memoria entre la GPU y el almacenamiento, optimizada para inferencia.

Esta capa ya no es un parche posterior, sino que debe estar co-diseñada con el almacenamiento de red, para mover datos contextuales con el menor sobrecoste.

Como un nuevo nivel de almacenamiento, la plataforma de almacenamiento de memoria contextual para inferencia NVIDIA no existe directamente en el sistema host, sino que se conecta a través de BlueField-4 fuera del dispositivo de computación. Su ventaja clave es que puede escalar más eficientemente el tamaño del grupo de almacenamiento, evitando así el cómputo repetitivo de KV Cache.

Nvidia está colaborando estrechamente con socios de almacenamiento para introducir la plataforma de almacenamiento de memoria contextual para inferencia NVIDIA en la plataforma Rubin, permitiendo a los clientes desplegarla como parte de una infraestructura de IA completamente integrada.

3. NVIDIA DGX SuperPOD construido sobre Vera Rubin

A nivel de sistema, NVIDIA DGX SuperPOD sirve como plano de despliegue para fábricas de IA a gran escala, utiliza 8 sistemas DGX Vera Rubin NVL72, con red de escala vertical NVLink 6, red de escala horizontal Spectrum-X Ethernet, incorpora la plataforma de almacenamiento de memoria contextual para inferencia NVIDIA, y está validado por ingeniería.

Todo el sistema está gestionado por el software NVIDIA Mission Control, logrando una eficiencia máxima. Los clientes pueden desplegarlo como una plataforma llave en mano, completando tareas de entrenamiento e inferencia con menos GPUs.

Debido al diseño cooperativo extremo a nivel de 6 chips, bandeja, rack, Pod, centro de datos y software, la plataforma Rubin logra una caída significativa en los costes de entrenamiento e inferencia. En comparación con la generación anterior Blackwell, para entrenar un modelo MoE del mismo tamaño, solo se necesita 1/4 del número de GPUs; con la misma latencia, el coste por token de grandes modelos MoE se reduce a 1/10.

También se lanzó el NVIDIA DGX SuperPOD que utiliza sistemas DGX Rubin NVL8.

Con la arquitectura Vera Rubin, Nvidia, junto con socios y clientes, está construyendo los sistemas de IA más grandes, avanzados y de menor coste del mundo, acelerando la adopción generalizada de la IA.

La infraestructura Rubin estará disponible en la segunda mitad de este año a través de CSPs e integradores de sistemas, Microsoft y otros serán los primeros en desplegarla.

03. El universo de modelos abiertos se expande: nuevo modelo, datos, contribuyente importante al ecosistema de código abierto

A nivel de software y modelos, Nvidia continúa aumentando su inversión en código abierto.

Plataformas de desarrollo principales como OpenRouter muestran que en el último año, el uso de modelos de IA creció 20 veces, y aproximadamente 1/4 de los tokens provienen de modelos de código abierto.

<极速6>

En 2025, Nvidia fue el mayor contribuyente de modelos, datos y recetas de código abierto en Hugging Face, lanzando 650 modelos de código abierto y 250 conjuntos de datos de código abierto.

Los modelos de código abierto de Nvidia están en la cima de varias listas de clasificación. Los desarrolladores no solo pueden usar estos modelos de código abierto, sino también aprender de ellos, entrenar continuamente, expandir conjuntos de datos, y usar herramientas de código abierto y técnicas documentadas para construir sistemas de IA.

Inspirado por Perplexity, Huang Renxun observó que los Agents deberían ser multi-modelo, multi-nube e híbridos en la nube, y esta es también la arquitectura básica de los sistemas de IA Agentic, que casi todas las startups están adoptando.

Con los modelos y herramientas de código abierto proporcionados por Nvidia, los desarrolladores ahora también pueden personalizar sistemas de IA, y usar las capacidades de modelos más avanzadas. Actualmente, Nvidia ya ha integrado el marco anterior en "planos", e integrado en plataformas SaaS. Los usuarios pueden lograr un despliegue rápido con los planos.

En el caso demostrado en el sitio, este sistema puede, según la intención del usuario, juzgar automáticamente si la tarea debe ser procesada por un modelo privado local o un modelo avanzado en la nube, también puede invocar herramientas externas (como API de correo, interfaz de control de robots, servicio de calendario, etc.), y lograr fusión multimodal, procesando unificadamente información como texto, voz, imagen, señales de sensores de robots, etc.

Estas capacidades complejas en el pasado eran absolutamente inimaginables, pero ahora se han vuelto insignificantes. En plataformas empresariales como ServiceNow, Snowflake, etc., se pueden usar capacidades similares.

04. Modelo Alpha-Mayo de código abierto, haciendo que los coches autónomos "piensen"

Nvidia cree que la IA física y la robótica eventualmente se convertirán en el mayor segmento de electrónica de consumo del mundo. Todas las cosas que pueden moverse, eventualmente lograrán una autonomía completa, impulsadas por IA física.

La IA ya ha pasado por las etapas de IA de percepción, IA generativa, IA Agentic, ahora está entrando en la era de la IA física, la inteligencia entra en el mundo real, estos modelos pueden entender las leyes físicas, y generar acciones directamente desde la percepción del mundo físico.

Pero para lograr este objetivo, la IA física debe aprender el sentido común del mundo — permanencia del objeto, gravedad, fricción. La adquisición de estas capacidades dependerá de tres computadoras: computadora de entrenamiento (DGX) para crear modelos de IA, computadora de inferencia (chip de robot/vehículo) para ejecutar en tiempo real, computadora de simulación (Omniverse) para generar datos sintéticos, verificar lógica física.

Y el modelo central es el modelo base mundial Cosmos, que alinea lenguaje, imagen, 3D y leyes físicas, apoyando la cadena completa desde la generación de datos de entrenamiento por simulación.

La IA física aparecerá en tres tipos de entidades: edificios (como fábricas, almacenes), robots, coches de conducción autónoma.

Huang Renxun cree que la conducción autónoma será el primer escenario de aplicación a gran escala de la IA física. Tales sistemas necesitan entender el mundo real, tomar decisiones y ejecutar acciones, con requisitos extremadamente altos de seguridad, simulación y datos.

Para esto, Nvidia lanzó Alpha-Mayo, un sistema completo de modelos de código abierto, herramientas de simulación y conjuntos de datos de IA física, utilizado para acelerar el desarrollo de IA física segura y basada en razonamiento.

Su combinación de productos proporciona a los fabricantes de automóviles globales, proveedores, startups e investigadores los módulos básicos para construir sistemas de conducción autónoma de nivel L4.

Alpha-Mayo es el primer modelo que realmente hace que los coches autónomos "piensen", este modelo ya es de código abierto. Descompone el problema en pasos, razona sobre todas las posibilidades, y elige el camino más seguro.

Este modelo de tarea-acción de razonamiento permite que el sistema de conducción autónoma resuelva escenarios de borde complejos que nunca antes había experimentado, como un semáforo fallando en una intersección concurrida.

Alpha-Mayo tiene 10 mil millones de parámetros, escala suficiente para manejar tareas de conducción autónoma, pero lo suficientemente ligero para ejecutarse en estaciones de trabajo creadas para investigadores de conducción autónoma.

Puede recibir entrada de texto, cámaras de visión perimetral, estado histórico del vehículo y navegación, y output trayectoria de conducción y proceso de razonamiento, permitiendo a los pasajeros entender por qué el vehículo tomó una acción.

En el video promocional mostrado en el sitio, impulsado por Alpha-Mayo, el coche de conducción autónoma puede realizar de forma autónoma, con 0 intervención, operaciones como esquivar peatones, prever vehículos que giran a la izquierda y cambiar de carril para evitarlos.

Huang Renxun dijo que el Mercedes-Benz CLA equipado con Alpha-Mayo ya está en producción, y acaba de ser calificado por NCAP como el coche más seguro del mundo. Cada código, chip, sistema está certificado para seguridad. Este sistema se lanzará en el mercado estadounidense, y lanzará capacidades de conducción más fuertes a finales de este año, incluyendo conducción en autopista sin manos, y conducción autónoma de extremo a extremo en entornos urbanos.

Nvidia también lanzó parte del conjunto de datos utilizado para entrenar Alpha-Mayo, el marco de simulación de evaluación de modelos de inferencia de código abierto Alpha-Sim. Los desarrolladores pueden usar sus propios datos para ajustar Alpha-Mayo, también pueden usar Cosmos para generar datos sintéticos, y entrenar y probar aplicaciones de conducción autónoma basadas en la combinación de datos reales y sintéticos. Además, Nvidia anunció que la plataforma NVIDIA DRIVE ahora está en producción.

Nvidia anunció que los líderes globales en robótica como Boston Dynamics, Franka Robotics, Surgical手术机器人, LG Electronics, NEURA, XRLabs, 智元机器人, etc., están construyendo basados en NVIDIA Isaac y GR00T.

Huang Renxun también anunció la última colaboración con Siemens. Siemens está integrando CUDA-X de Nvidia, modelos de IA y Omniverse en su combinación de herramientas y plataformas EDA, CAE y gemelo digital. La IA física se utilizará ampliamente en todo el flujo desde diseño, simulación hasta producción y operación.

05. Conclusión: Abraza el código abierto con la izquierda, hace que el sistema de hardware sea insustituible con la derecha

A medida que el foco de la infraestructura de IA pasa del entrenamiento a la inferencia a gran escala, la competencia de plataformas ha evolucionado desde el poder de cálculo puntual hasta la ingeniería de sistemas que cubre chips, racks, red y software, el objetivo se转向 entregar el máximo rendimiento de inferencia con el menor TCO, la IA está entrando en una nueva etapa de "funcionamiento de fábrica".

Nvidia presta mucha atención al diseño a nivel de sistema, Rubin logra simultáneamente mejoras de rendimiento y economía en entrenamiento e inferencia, y puede servir como una solución de reemplazo plug-and-play para Blackwell, permitiendo una transición perfecta desde Blackwell.

En el posicionamiento de la plataforma, Nvidia todavía cree que el entrenamiento es crucial, porque solo entrenando rápidamente los modelos más avanzados, la plataforma de inferencia puede beneficiarse realmente, por lo tanto introduce el entrenamiento NVFP4 en la GPU Rubin, mejorando aún más el rendimiento, reduciendo el TCO.

Al mismo tiempo, este gigante de la computación de IA continúa fortaleciendo significativamente la capacidad de comunicación de red en arquitecturas de escala vertical y horizontal, y ve el contexto como un cuello de botella clave, logrando un diseño cooperativo de almacenamiento, red, computación.

Nvidia, mientras abre el código abierto a lo grande, por otro lado está haciendo que el hardware, la interconexión, el diseño del sistema sean cada vez más "insustituibles", este bucle estratégico de expandir continuamente la demanda, incentivar el consumo de tokens, impulsar la escalabilidad de la inferencia, proporcionar infraestructura de alto rendimiento y costo-efectividad, está construyendo una fosa más indestructible para Nvidia.

Qué es DUOLINGO AI

DUOLINGO AI: Integrando el Aprendizaje de Idiomas con la Innovación de Web3 y AI En una era donde la tecnología remodela la educación, la integración de la inteligencia artificial (IA) y las redes blockchain anuncia una nueva frontera para el aprendizaje de idiomas. Presentamos DUOLINGO AI y su criptomoneda asociada, $DUOLINGO AI. Este proyecto aspira a fusionar la capacidad educativa de las principales plataformas de aprendizaje de idiomas con los beneficios de la tecnología descentralizada Web3. Este artículo profundiza en los aspectos clave de DUOLINGO AI, explorando sus objetivos, marco tecnológico, desarrollo histórico y potencial futuro, manteniendo la claridad entre el recurso educativo original y esta iniciativa independiente de criptomoneda. Visión General de DUOLINGO AI En su esencia, DUOLINGO AI busca establecer un entorno descentralizado donde los aprendices puedan ganar recompensas criptográficas por alcanzar hitos educativos en la competencia lingüística. Al aplicar contratos inteligentes, el proyecto pretende automatizar los procesos de verificación de habilidades y asignación de tokens, adhiriéndose a los principios de Web3 que enfatizan la transparencia y la propiedad del usuario. El modelo se aparta de los enfoques tradicionales para la adquisición de idiomas al apoyarse en una estructura de gobernanza impulsada por la comunidad, permitiendo a los poseedores de tokens sugerir mejoras al contenido del curso y a la distribución de recompensas. Algunos de los objetivos notables de DUOLINGO AI incluyen: Aprendizaje Gamificado: El proyecto integra logros en blockchain y tokens no fungibles (NFTs) para representar niveles de competencia lingüística, fomentando la motivación a través de recompensas digitales atractivas. Creación de Contenido Descentralizada: Abre caminos para que educadores y entusiastas de los idiomas contribuyan con sus cursos, facilitando un modelo de reparto de ingresos que beneficia a todos los contribuyentes. Personalización Potenciada por IA: Al emplear modelos avanzados de aprendizaje automático, DUOLINGO AI personaliza las lecciones para adaptarse al progreso de aprendizaje individual, similar a las características adaptativas encontradas en plataformas establecidas. Creadores del Proyecto y Gobernanza A partir de abril de 2025, el equipo detrás de $DUOLINGO AI permanece seudónimo, una práctica frecuente en el paisaje descentralizado de criptomonedas. Esta anonimidad está destinada a promover el crecimiento colectivo y la participación de las partes interesadas en lugar de centrarse en desarrolladores individuales. El contrato inteligente desplegado en la blockchain de Solana señala la dirección de la billetera del desarrollador, lo que significa el compromiso con la transparencia en las transacciones a pesar de que la identidad de los creadores sea desconocida. Según su hoja de ruta, DUOLINGO AI tiene como objetivo evolucionar hacia una Organización Autónoma Descentralizada (DAO). Esta estructura de gobernanza permite a los poseedores de tokens votar sobre cuestiones críticas como implementaciones de características y asignaciones de tesorería. Este modelo se alinea con la ética de empoderamiento comunitario que se encuentra en varias aplicaciones descentralizadas, enfatizando la importancia de la toma de decisiones colectiva. Inversores y Alianzas Estratégicas Actualmente, no hay inversores institucionales o capitalistas de riesgo identificables públicamente vinculados a $DUOLINGO AI. En cambio, la liquidez del proyecto proviene principalmente de intercambios descentralizados (DEXs), marcando un contraste marcado con las estrategias de financiación de las empresas tradicionales de tecnología educativa. Este modelo de base indica un enfoque impulsado por la comunidad, reflejando el compromiso del proyecto con la descentralización. En su libro blanco, DUOLINGO AI menciona la formación de colaboraciones con “plataformas de educación blockchain” no especificadas, destinadas a enriquecer su oferta de cursos. Aunque aún no se han divulgado asociaciones específicas, estos esfuerzos colaborativos sugieren una estrategia para combinar la innovación blockchain con iniciativas educativas, ampliando el acceso y la participación de los usuarios en diversas vías de aprendizaje. Arquitectura Tecnológica Integración de IA DUOLINGO AI incorpora dos componentes principales impulsados por IA para mejorar su oferta educativa: Motor de Aprendizaje Adaptativo: Este sofisticado motor aprende de las interacciones del usuario, similar a los modelos propietarios de las principales plataformas educativas. Ajusta dinámicamente la dificultad de las lecciones para abordar desafíos específicos del aprendiz, reforzando áreas débiles a través de ejercicios específicos. Agentes Conversacionales: Al emplear chatbots impulsados por GPT-4, DUOLINGO AI proporciona una plataforma para que los usuarios participen en conversaciones simuladas, fomentando una experiencia de aprendizaje de idiomas más interactiva y práctica. Infraestructura Blockchain Construido sobre la blockchain de Solana, $DUOLINGO AI utiliza un marco tecnológico integral que incluye: Contratos Inteligentes de Verificación de Habilidades: Esta característica otorga automáticamente tokens a los usuarios que superan con éxito las pruebas de competencia, reforzando la estructura de incentivos para resultados de aprendizaje genuinos. Insignias NFT: Estos tokens digitales significan varios hitos que los aprendices logran, como completar una sección de su curso o dominar habilidades específicas, permitiéndoles intercambiar o exhibir sus logros digitalmente. Gobernanza DAO: Los miembros de la comunidad que poseen tokens pueden participar en la gobernanza votando sobre propuestas clave, facilitando una cultura participativa que fomenta la innovación en la oferta de cursos y características de la plataforma. Línea de Tiempo Histórica 2022–2023: Conceptualización Los cimientos de DUOLINGO AI comienzan con la creación de un libro blanco, destacando la sinergia entre los avances de IA en el aprendizaje de idiomas y el potencial descentralizado de la tecnología blockchain. 2024: Lanzamiento Beta Un lanzamiento beta limitado introduce ofertas en idiomas populares, recompensando a los primeros usuarios con incentivos en tokens como parte de la estrategia de participación comunitaria del proyecto. 2025: Transición a DAO En abril, se produce un lanzamiento completo de la mainnet con la circulación de tokens, lo que provoca discusiones comunitarias sobre posibles expansiones a idiomas asiáticos y otros desarrollos de cursos. Desafíos y Direcciones Futuras Obstáculos Técnicos A pesar de sus ambiciosos objetivos, DUOLINGO AI enfrenta desafíos significativos. La escalabilidad sigue siendo una preocupación constante, particularmente en el equilibrio de los costos asociados con el procesamiento de IA y el mantenimiento de una red descentralizada y receptiva. Además, garantizar la creación y moderación de contenido de calidad en medio de una oferta descentralizada plantea complejidades en el mantenimiento de estándares educativos. Oportunidades Estratégicas Mirando hacia adelante, DUOLINGO AI tiene el potencial de aprovechar asociaciones de micro-certificación con instituciones académicas, proporcionando validaciones de habilidades lingüísticas verificadas por blockchain. Además, la expansión entre cadenas podría permitir al proyecto acceder a bases de usuarios más amplias y a ecosistemas blockchain adicionales, mejorando su interoperabilidad y alcance. Conclusión DUOLINGO AI representa una fusión innovadora de inteligencia artificial y tecnología blockchain, presentando una alternativa centrada en la comunidad a los sistemas tradicionales de aprendizaje de idiomas. Aunque su desarrollo seudónimo y su modelo económico emergente traen ciertos riesgos, el compromiso del proyecto con el aprendizaje gamificado, la educación personalizada y la gobernanza descentralizada ilumina un camino hacia adelante para la tecnología educativa en el ámbito de Web3. A medida que la IA continúa avanzando y el ecosistema blockchain evoluciona, iniciativas como DUOLINGO AI podrían redefinir cómo los usuarios se relacionan con la educación lingüística, empoderando a las comunidades y recompensando la participación a través de mecanismos de aprendizaje innovadores.

445 Vistas totalesPublicado en 2025.04.11Actualizado en 2025.04.11

Huang Renxun anuncia 8 nuevos productos en 1.5 horas, Nvidia apuesta por la IA de razonamiento y la IA física

Resumen

01. Nuevo supercomputador de IA: 6 chips autodesarrollados, potencia de cálculo por rack de 3.6 EFLOPS

02. Tres nuevos productos revolucionan la eficiencia de la inferencia de IA: nuevo dispositivo CPO, nueva capa de almacenamiento contextual, nuevo DGX SuperPOD

1. Dispositivo de óptica encapsulada conjuntamente NVIDIA Spectrum-X Ethernet

2. Plataforma de almacenamiento de memoria contextual para inferencia NVIDIA

3. NVIDIA DGX SuperPOD construido sobre Vera Rubin

03. El universo de modelos abiertos se expande: nuevo modelo, datos, contribuyente importante al ecosistema de código abierto

04. Modelo Alpha-Mayo de código abierto, haciendo que los coches autónomos "piensen"

05. Conclusión: Abraza el código abierto con la izquierda, hace que el sistema de hardware sea insustituible con la derecha

Preguntas relacionadas

Lecturas Relacionadas

Polymarket atascado: la verdadera prueba tras el auge de tráfico ha llegado

El obstáculo clave para la designación de Warsh como presidente de la Fed el 15 de mayo ha sido despejado tras la concesión de un legislador clave

Bajando las expectativas para el próximo ciclo alcista de BTC

Los mercados de predicción no pueden prescindir del uso de información privilegiada, pero el uso de información privilegiada los está matando

¿Puede Irán "controlar" el estrecho de Ormuz?

Trading

Artículos destacados

Qué es GROK AI

Qué es ERC AI

Qué es DUOLINGO AI

Discusiones