¿De 55TB a 28TB? Los rumores y el pánico tras la supuesta reducción a la mitad de la memoria de Rubin

marsbitPublicado a 2026-06-05Actualizado a 2026-06-05

Resumen

**Resumen Ejecutivo** El 4 de junio, un informe de SemiAnalysis indicó que las configuraciones predeterminadas de memoria SOCAMM en el sistema de IA Vera Rubin NVL72 de NVIDIA podrían reducirse a la mitad, de 55TB a 28TB por bastidor. Esto generó pánico en el mercado, llevando a una caída del 10% en las acciones de Micron, ya que los inversores interpretaron la noticia como una fuerte reducción de la demanda de memoria. Sin embargo, el análisis revela importantes matices que desmienten esta narrativa simplista: 1. **Arquitectura modular y actualizable**: A diferencia de generaciones anteriores, los módulos SOCAMM en Rubin son extraíbles y reemplazables (estándar JEDEC SOCAMM2). Una configuración inicial más baja no elimina la demanda futura; los clientes pueden actualizar la capacidad fácilmente más adelante. 2. **Un problema de oferta, no de demanda**: La razón principal de la configuración reducida es la **extrema escasez global de chips LPDDR5X** en 2026, con proveedores como Micron operando a plena capacidad. NVIDIA prioriza enviar sistemas funcionales con menos memoria, en lugar de retrasar entregas completas. Esto es señal de una demanda que supera la oferta. 3. **Distribución, no contracción**: Con la misma cantidad de memoria disponible, NVIDIA puede ensamblar **más bastidores** Rubin. El volumen total de pedidos de LPDDR5X puede mantenerse, solo se distribuye entre más unidades. La caída de Micron se atribuye más a una toma de beneficios tras máximos históri...

Autor: Chao Xiang Research

En la madrugada del 4 de junio, SemiAnalysis, la institución de investigación independiente más influyente de la industria de los semiconductores, publicó un boletín matutino.

La información clave era solo una frase: la capacidad de DRAM SOCAMM por bastidor del sistema NVL72 de Vera Rubin de NVIDIA podría reducirse de los aproximadamente 55TB previstos a unos 28TB. La mayoría de los sistemas Rubin adoptarían módulos SOCAMM de 96GB, en lugar de los módulos de 192GB que se esperaban ampliamente en el mercado.

La reacción del mercado fue simple y contundente: la demanda de memoria se reduce a la mitad, malas noticias para Micron. Las acciones de MU cayeron bruscamente más del 10% durante la sesión, desde el máximo histórico de 1089 dólares del día anterior hasta 971 dólares, perdiendo un valor de mercado de más de 100.000 millones de dólares en un solo día.

El pánico era real. La pregunta es: ¿estaba el pánico dirigido en la dirección correcta?

Primero, hagamos las cuentas

El sistema Vera Rubin NVL72 es el próximo bastidor de supercomputación insignia de NVIDIA para IA. Cada bastidor alberga 72 GPUs Rubin y 36 CPUs Vera. Las GPU utilizan HBM4, con 288GB cada una, totalizando aproximadamente 20.7TB por bastidor; esta parte no cambia. Lo que cambia es el lado de las CPU.

Cada CPU Vera tiene 8 ranuras SOCAMM, cada una de las cuales puede albergar módulos de diferentes capacidades. Las especificaciones oficiales anunciadas por NVIDIA en el CES 2026 indicaban "hasta 1.5TB de LPDDR5X por CPU Vera", correspondiente a la configuración con 8 módulos de 192GB completos. 36 CPUs equivalen a 54TB.

El informe de SemiAnalysis dice lo siguiente: Es probable que la configuración de envío real no esté completa. La mayoría de los sistemas utilizarán módulos de 96GB, 8×96GB=768GB por CPU, y 36 CPUs equivalen aproximadamente a 28TB.

De 55TB a 28TB, la capacidad se reduce casi a la mitad, lo que algunos titulares sensacionalistas describen como "la demanda de memoria se reduce a la mitad".

Pero el mercado calculó mal una variable clave en esta ecuación.

Las lagunas en la lógica del pánico

Primero, SOCAMM tiene un diseño modular con ranuras, no está soldado.

Este es el detalle técnico más fácil de pasar por alto en toda la historia. A diferencia de la memoria LPDDR soldada a la placa base en los GB300 Blackwell Ultra, la plataforma Vera Rubin adopta módulos SOCAMM2 estandarizados por JEDEC, extraíbles, reemplazables en caliente y actualizables posteriormente. Hoy se insertan 96GB, mañana, si el cliente lo necesita, se pueden cambiar por módulos de 192GB o incluso 256GB, tan fácil como cambiar módulos de memoria.

NVIDIA enfatizó específicamente este diseño en el CES 2026: el tiempo de ensamblaje del carro de computación completo se redujo de 2 horas a 5 minutos. La modularidad, mantenibilidad y capacidad de actualización son una de las mayores evoluciones arquitectónicas de Vera Rubin respecto a Blackwell.

Reducir la configuración inicial de envío no equivale a una desaparición permanente de la demanda. Se parece más a una estrategia de "subirse primero al tren y pagar el boleto después".

Segundo, la razón de la reducción de capacidad no es la falta de necesidad, sino la "escasez".

Dylan Patel, fundador de SemiAnalysis, tuiteó una frase reveladora: "Me encanta una cosa: que quienes comparten nuestro informe omiten gran parte de su contenido. Esto sucede a menudo."

Los comentarios de los lectores en Digg sobre esta noticia también son ilustrativos: el 77.8% consideró que la transmisión secundaria fue un titular sensacionalista sacado de contexto.

¿Qué se omitió? El contexto.

La oferta global de LPDDR5X en 2026 es extremadamente ajustada. Micron afirmó claramente en la conferencia Wolfe a finales de mayo que la demanda de memoria supera significativamente la capacidad de suministro, una situación que se espera continúe más allá de 2026. Toda la capacidad de producción de HBM para el año fiscal 2026 de Micron ya está agotada, el precio medio del DRAM ha subido más del 110% interanual y el margen bruto se ha disparado al 74%. Samsung y SK Hynix también están produciendo y vendiendo a plena capacidad.

En este contexto, el problema de NVIDIA no es que los clientes no quieran más memoria, sino que "no pueden conseguir suficientes chips de LPDDR5X para llenar cada ranura".

Reducir la configuración SOCAMM por defecto por bastidor es esencialmente una gestión de la cadena de suministro a nivel de ingeniería: En lugar de retrasar la entrega de bastidores completos por escasez de memoria, es mejor enviar con una configuración más baja para que la potencia de cálculo esté operativa lo antes posible.

Esto no es una señal de contracción de la demanda; al contrario, es una señal de que la demanda supera a la oferta.

Tercero, menos memoria ≠ menos bastidores.

El mercado hizo una simple multiplicación: la memoria por bastidor se reduce a la mitad → la demanda total se reduce a la mitad. Pero hay otra variable en esta ecuación: el volumen de envíos.

Si el SOCAMM por bastidor baja de 55TB a 28TB, NVIDIA, con las mismas restricciones de suministro de LPDDR5X, podría ensamblar más bastidores. Un lote de memoria que antes solo permitía ensamblar 100 bastidores, ahora permite ensamblar cerca de 200.

El consumo total de LPDDR5X no se reduce, simplemente se distribuye en más bastidores. Para NVIDIA, es una elección pragmática para llevar Rubin al mercado más rápido; para los fabricantes de memoria, el volumen total de pedidos no necesariamente disminuye.

Además, la demanda de memoria del lado de la CPU en escenarios de inferencia es muy elástica. No todas las cargas de trabajo requieren 1.5TB de LPDDR5X. El entrenamiento de grandes modelos sí consume memoria, pero muchas tareas de inferencia, especialmente en agentic AI e inferencia de contexto largo, el caché KV puede programarse flexiblemente entre la HBM y la LPDDR a través de NVLink-C2C. Para muchos clientes, 768GB de memoria del lado de la CPU es suficiente.

Entonces, ¿por qué Micron cayó un 10%?

Porque SemiAnalysis fue solo la segunda paja que rompió la espalda del camello.

La primera fue Broadcom. El 4 de junio, antes de la apertura del mercado estadounidense, Broadcom publicó sus resultados del Q2. Los números en sí no eran malos: ingresos de 22.19 mil millones de dólares, un aumento del 48% interanual, y EPS no-GAAP de 2.44 dólares, superando las expectativas. Pero el CEO Hock Tan no elevó la guía de ingresos anuales por chips de IA de 100 mil millones de dólares, lo que el mercado consideró "insuficiente". Las acciones de Broadcom cayeron un 15%, arrastrando a todo el sector de semiconductores a la baja.

Micron no tenía ese día ninguna noticia negativa a nivel de empresa. Varios medios como TipRanks, Motley Fool y 24/7 Wall St. señalaron claramente que fue una caída conjunta por "contagio". Micron, como activo clave en la cadena de memoria para IA, está fuertemente vinculado al sentimiento de gasto de capital en IA. La guía de Broadcom hizo que el mercado reevaluara las expectativas de crecimiento de toda la cadena de suministro de chips de IA.

El informe de SemiAnalysis se difundió el mismo día, proporcionando a los traders que ya buscaban razones para vender una narrativa perfecta: no solo el sentimiento general de IA se debilita, sino que incluso las cifras concretas de demanda de memoria se están reduciendo.

Una acción con una capitalización de mercado de un billón de dólares, que subió un 900% en el último año y alcanzó un máximo histórico el día anterior. En esta posición, cualquier titular negativo es un catalizador para tomar ganancias. El pánico no necesita ser correcto, solo necesita una excusa.

Análisis de Chao Xiang

Tres conclusiones.

Primero, el informe de SemiAnalysis en sí es preciso, pero la interpretación del mercado fue incorrecta. Es probable que la configuración SOCAMM por defecto del NVL72 Rubin esté por debajo del máximo teórico; esto está determinado por la realidad de la cadena de suministro y la elasticidad de la demanda del cliente. Pero entre "configuración por defecto reducida" y "demanda de memoria contraída" hay una arquitectura modular actualizable y una realidad industrial donde la demanda supera con creces a la oferta.

Segundo, el riesgo principal para Micron no está en SOCAMM, sino en HBM4. SemiAnalysis ya informó en febrero que, en los pedidos de HBM4 de la plataforma Rubin de NVIDIA, la participación de Micron era cero, con SK Hynix tomando el 70% y Samsung el 30%. Aunque Micron anunció en marzo que comenzaría la producción en volumen de HBM4, se espera que su participación de mercado sea solo del 18%. Por el contrario, la posición de Micron en el campo SOCAMM es muy sólida: fue el primer fabricante en lanzar SOCAMM2 de 256GB y ha sido el socio clave de NVIDIA para la solución SOCAMM durante cinco años. El impacto real en Micron de la reducción de la configuración SOCAMM es mucho menor que su marginación en HBM4.

Tercero, la naturaleza de esta caída es una toma de ganancias tras alcanzar un máximo histórico en una acción de billones de dólares, amplificada por dos catalizadores independientes. Broadcom proporcionó el impacto emocional, SemiAnalysis proporcionó la munición narrativa. Ambos combinados hicieron que una acción que subió un 900% en los últimos 12 meses corrigiera un 10%. Desde una perspectiva de trading, esto no se llama "pánico", se llama "normal".

El tuit de Dylan Patel tenía razón: la mayoría de quienes comparten su informe omiten la parte más importante.

Lo más peligroso en la inversión en semiconductores no es ver mal la dirección, sino acertar en el titular y equivocarse en la fórmula.

Preguntas relacionadas

Q¿Cuál es el principal cambio en la configuración de memoria del sistema Rubin NVL72 de NVIDIA según el informe de SemiAnalysis?

ASegún el informe de SemiAnalysis, la configuración de memoria SOCAMM para la mayoría de los sistemas Rubin NVL72 probablemente se reducirá de aproximadamente 55TB (utilizando módulos de 192GB) a unos 28TB por bastidor, utilizando módulos de 96GB en lugar de los 192GB esperados previamente.

Q¿Por qué el mercado reaccionó de forma negativa a la noticia sobre la reducción de memoria en Rubin, y por qué el artículo sugiere que esa reacción fue errónea?

AEl mercado reaccionó negativamente interpretando la reducción de la configuración de memoria como una caída en la demanda, lo que provocó una fuerte venta de acciones de Micron. El artículo argumenta que esta reacción fue errónea porque: 1) Los módulos SOCAMM son extraíbles y actualizables, por lo que la configuración inicial más baja no significa una demanda perdida. 2) La razón de la reducción es la escasez de oferta, no la falta de demanda. 3) Con la misma oferta limitada de chips, NVIDIA podría ensamblar más bastidores, por lo que el volumen total de pedidos de memoria podría no disminuir.

QSegún el artículo, ¿cuáles son las dos principales razones que explican la caída del 10% en las acciones de Micron (MU) el 4 de junio?

ASegún el artículo, la caída del 10% en las acciones de Micron se debió a dos catalizadores independientes que se combinaron: 1) Los resultados financieros de Broadcom, cuyo CEO no elevó la guía anual de ingresos por chips de IA, lo que generó preocupación en el sector y provocó una venta generalizada. 2) La difusión del informe de SemiAnalysis sobre la reducción de la memoria SOCAMM en Rubin, que proporcionó una narrativa negativa específica para justificar la toma de ganancias en una acción que había subido un 900% en un año.

Q¿Qué característica clave del diseño de memoria en la plataforma Vera Rubin hace que la reducción de la configuración inicial sea menos preocupante para la demanda futura?

ALa característica clave es que los módulos SOCAMM (Memory-on-Memory) utilizan un diseño estandarizado por JEDEC (SOCAMM2) que es extraíble, reemplazable en caliente y actualizable. A diferencia de la memoria soldada, los clientes pueden actualizar fácilmente los módulos de 96GB a 192GB o 256GB en el futuro según sus necesidades, por lo que una configuración inicial más baja no elimina la demanda potencial a largo plazo.

QDe acuerdo con el 'análisis de tendencia' final del artículo, ¿cuál es el riesgo central real para Micron en relación con la plataforma Rubin de NVIDIA?

AEl riesgo central real para Micron en la plataforma Rubin de NVIDIA no está en los módulos SOCAMM, donde tiene una posición sólida como socio clave, sino en la memoria HBM4. Según informes anteriores de SemiAnalysis, Micron tenía inicialmente una participación del 0% en los pedidos de HBM4 para Rubin, con SK Hynix y Samsung acaparando el mercado. Aunque Micron anunció la producción en volumen de HBM4 en marzo, se espera que su cuota de mercado sea de solo alrededor del 18%, lo que representa un desafío mucho mayor que cualquier ajuste en la configuración SOCAMM.

Lecturas Relacionadas

Token no es económico, economía no es Token

La industria de la IA se encuentra en un punto de inflexión, transitando desde una narrativa centrada en la innovación tecnológica hacia un enfoque dominado por la eficiencia del capital. Dos tendencias clave definen este cambio: la escasez de financiación y la escisión de activos por parte de los grandes conglomerados. La competencia actual se ha transformado en una carrera de activos pesados por la potencia de cálculo (compute), con costos operativos que escalan junto con el uso, un modelo "anti-internet" donde más usuarios significan mayores pérdidas. Este problema se ve agravado por prácticas de "contabilidad circular", como los acuerdos de créditos en la nube entre empresas, que inflan los ingresos sin generar flujo de caja real. La desconexión entre las valoraciones y los flujos de efectivo plantea un desafío estructural para el modelo de negocio. Paralelamente, grandes empresas como Baidu, Alibaba, ByteDance y Kuaishou están escindiendo sus unidades de IA (por ejemplo, Kling/Kunlunxin). Estos activos, valorados mucho más alto una vez independientes, pasan de ser vistos como "centros de coste" dentro del grupo a "centros de valor" en el mercado. La lógica cambia: mientras que en los estados financieros consolidados se miden por su impacto en los beneficios, como empresas independientes se valoran por su potencial de crecimiento futuro, su escasez en el mercado y su capacidad para atraer inversión. La industria evoluciona desde la "adoración del modelo" hacia la "realización de valor". Aunque la inversión en infraestructura (con un gasto de capital previsto de 805.000 millones de dólares para 2026 en EE.UU.) es enorme, la comercialización a gran escala aún está en sus inicios. El foco se desplaza de la potencia bruta de la GPU a la eficiencia integral del sistema, donde la CPU y la orquestación determinan la rentabilidad. En 2026, la pregunta central que la industria debe responder es: ¿cuánto vale realmente esta tecnología? La respuesta definirá el panorama del poder en la IA para la próxima década.

marsbitHace 1 hora(s)

Token no es económico, economía no es Token

marsbitHace 1 hora(s)

Más allá del "Muro de la Memoria": La Revolución a Escala de Oblea y la Ruta de la Capacidad Computacional en la Era del Razonamiento de IA

En 2026, el gasto de capital de los grandes proveedores de nube en inferencia de IA superó por primera vez al de entrenamiento, marcando un punto de inflexión hacia el uso de modelos grandes. La inferencia enfrenta la "barrera de memoria", donde el movimiento de datos (pesos del modelo, activaciones, KV Cache) entre la DRAM externa y las GPU consume más energía y tiempo que el cálculo en sí. Empresas como Cerebras abordan esto con un enfoque radical: el Wafer-Scale Engine (WSE). En lugar de cortar una oblea en múltiples chips, usan casi toda la oblea como un solo chip gigante (ej. WSE-3). Esto proporciona 44 GB de SRAM en el chip y un ancho de banda de memoria interno masivo (21 PB/s), miles de veces mayor que el HBM de las GPU, reduciendo drásticamente la latencia para cargar pesos del modelo. En inferencia, esto permite una generación de tokens entre 1.5 y 5 veces más rápida que una GPU NVIDIA B200 en ciertos modelos, con una ventaja notable en el tiempo para el primer token (TTFT) y cargas de trabajo de agentes. Su arquitectura también reduce drásticamente el consumo energético de la interconexión. Sin embargo, este enfoque conlleva desafíos: la capacidad de SRAM ya no escala fácilmente con procesos más avanzados, presenta retos de refrigeración, un ecosistema de software propietario y un ancho de banda de E/S externo limitado (150 GB/s) que dificulta la expansión multi-chip. Mientras tanto, los grandes actores persiguen otras rutas: chips ASIC especializados (Google TPU, Microsoft Maia), tecnologías de empaquetado avanzado estandarizadas (como SoW de TSMC) que podrían democratizar el concepto de "wafer-scale", y la interconexión óptica como solución a largo plazo para la barrera de memoria. Cerebras también enfrenta el reto comercial de cumplir grandes pedidos, teniendo que construir centros de datos especializados para 2026-2028. En última instancia, la arquitectura de computación se trata de equilibrar ventajas: Cerebras optimiza para la latencia extrema en cargas específicas, mientras que NVIDIA prioriza la flexibilidad y el rendimiento agregado del clúster para cargas diversas. El camino hacia la AGI sigue abierto y la incertidumbre tecnológica y comercial es precisamente lo que impulsa la innovación.

marsbitHace 1 hora(s)

Más allá del "Muro de la Memoria": La Revolución a Escala de Oblea y la Ruta de la Capacidad Computacional en la Era del Razonamiento de IA

marsbitHace 1 hora(s)

¿Ha 'terminado la recuperación' de Bitcoin y entra oficialmente en la fase tardía del mercado bajista?

Bitcoin ha caído un 13% esta semana, situándose en una zona intermedia entre su precio realizado y su valor de mercado real. Por primera vez desde enero de 2022, el coste base de los poseedores a corto plazo ha caído por debajo de la media del mercado real, lo que confirma características de una fase avanzada del mercado bajista. El ratio de ganancias/pérdidas realizadas se desplomó a 0.29, mientras que su media a 90 días nunca superó el umbral de 2, confirmando que el rebote a 82k USD fue solo un repunte dentro de la tendencia bajista. Las pérdidas diarias realizadas aumentaron bruscamente a 1350 millones de dólares, con 770 millones procedentes de ventas de poseedores a largo plazo, indicando una aceleración en la redistribución de la oferta. El precio fue rechazado casi exactamente en el coste promedio (83k USD) de los ETF estadounidenses al contado, reforzando ese nivel como resistencia clave. El flujo del mercado spot se ha vuelto marcadamente negativo, mostrando que los vendedores dominan el libro de órdenes. Aunque se produjo una importante liquidación de posiciones largas (más de 400 millones de dólares), la demanda spot no ha regresado para absorber la oferta. El mercado de opciones sigue mostrando una prima de volatilidad alta y un sesgo hacia las opciones de venta (puts), lo que indica una demanda persistente de protección a la baja. En conclusión, la incapacidad de superar el coste de los ETF, la aceleración de las pérdidas realizadas, el dominio de la venta en el mercado spot y la falta de una fuerte demanda de compra sugieren que el mercado sigue siendo frágil y podría enfrentarse a más presión a la baja o a una consolidación prolongada dentro de la estructura bajista.

marsbitHace 1 hora(s)

¿Ha 'terminado la recuperación' de Bitcoin y entra oficialmente en la fase tardía del mercado bajista?

marsbitHace 1 hora(s)

Trading

Spot
Futuros

Artículos destacados

Cómo comprar 4

¡Bienvenido a HTX.com! Hemos hecho que comprar 4 (4) sea simple y conveniente. Sigue nuestra guía paso a paso para iniciar tu viaje de criptos.Paso 1: crea tu cuenta HTXUtiliza tu correo electrónico o número de teléfono para registrarte y obtener una cuenta gratuita en HTX. Experimenta un proceso de registro sin complicaciones y desbloquea todas las funciones.Obtener mi cuentaPaso 2: ve a Comprar cripto y elige tu método de pagoTarjeta de crédito/débito: usa tu Visa o Mastercard para comprar 4 (4) al instante.Saldo: utiliza fondos del saldo de tu cuenta HTX para tradear sin problemas.Terceros: hemos agregado métodos de pago populares como Google Pay y Apple Pay para mejorar la comodidad.P2P: tradear directamente con otros usuarios en HTX.Over-the-Counter (OTC): ofrecemos servicios personalizados y tipos de cambio competitivos para los traders.Paso 3: guarda tu 4 (4)Después de comprar tu 4 (4), guárdalo en tu cuenta HTX. Alternativamente, puedes enviarlo a otro lugar mediante transferencia blockchain o utilizarlo para tradear otras criptomonedas.Paso 4: tradear 4 (4)Tradear fácilmente con 4 (4) en HTX's mercado spot. Simplemente accede a tu cuenta, selecciona tu par de trading, ejecuta tus trades y monitorea en tiempo real. Ofrecemos una experiencia fácil de usar tanto para principiantes como para traders experimentados.

542 Vistas totalesPublicado en 2025.10.20Actualizado en 2026.06.02

Cómo comprar 4

Discusiones

Bienvenido a la comunidad de HTX. Aquí puedes mantenerte informado sobre los últimos desarrollos de la plataforma y acceder a análisis profesionales del mercado. A continuación se presentan las opiniones de los usuarios sobre el precio de 4 (4).

活动图片