Artículos Relacionados con Inferencia

El Centro de Noticias de HTX ofrece los artículos más recientes y un análisis profundo sobre "Inferencia", cubriendo tendencias del mercado, actualizaciones de proyectos, desarrollos tecnológicos y políticas regulatorias en la industria de cripto.

Este carril de chips se ha vuelto extremadamente popular

El mercado global de chips para IA está experimentando un cambio de paradigma, con los ASIC (circuitos integrados de aplicación específica) emergiendo como protagonistas clave a partir de 2025. Este auge está impulsado por la migración del enfoque de la industria, desde la capacitación de modelos hacia la implementación a gran escala de la inferencia, donde los ASIC ofrecen ventajas decisivas en eficiencia energética y coste. Señales claras de este punto de inflexión incluyen el dominio del TPU de Google en servidores, grandes pedidos de ASIC personalizados por parte de OpenAI con Broadcom, y el ingreso agresivo de actores como MediaTek y Qualcomm al campo de los ASIC para centros de datos. En China, empresas como VeriSilicon y ASR también están experimentando un crecimiento explosivo en este segmento. La razón fundamental radica en la economía: para cargas de trabajo de inferencia a escala masiva, usar GPUs de propósito general es estructuralmente ineficiente. Los ASIC, optimizados para cargas específicas como la arquitectura Transformer, logran mejoras de 3 a 5 veces en eficiencia y reducen costes totales entre un 40% y 60%. El panorama competitivo se está reconfigurando. Junto a los líderes tradicionales Broadcom y Marvell, ahora participan gigantes de chips para móviles como MediaTek —que proyecta ingresos por miles de millones— y Qualcomm, que apuesta por una estrategia integral. Además, los principales proveedores de servicios en la nube (CSP) están impulsando activamente el desarrollo de sus propios ASIC para ganar autonomía estratégica y control de costes. La era dorada de los ASIC representa una "democratización" del poder de cálculo de la IA, descentralizando la definición del hardware desde unos pocos actores dominantes hacia un ecosistema más diversificado y especializado, donde se prevé una coexistencia futura: las GPU para entrenamiento y los ASIC para inferencia.

marsbit05/18 00:36

Este carril de chips se ha vuelto extremadamente popular

marsbit05/18 00:36

¡Se dispara un 108% en su primer día! Nace el mayor caballo negro de la IA en 2026, y Altman "gana dinero sin mover un dedo" una vez más

Cerebras, la empresa de chips de IA, debutó en el mercado de valores en 2026 con una salida a bolsa monumental. Su precio de las acciones se disparó un 108% en el primer día, alcanzando una valoración de hasta 100.000 millones de dólares y recaudando 5.550 millones de dólares. Esta exitosa salida a bolsa, una de las más grandes de la historia tecnológica estadounidense, marca el inicio de una oleada de IPOs de empresas de IA. La compañía, fundada en 2015, logró un giro financiero espectacular, pasando de pérdidas a unos beneficios de 238 millones de dólares en 2025, con ingresos de 510 millones. Firmó contratos clave con clientes como OpenAI y AWS. Su tecnología estrella es el chip WSE-3, un procesador del tamaño de una oblea entera, con una potencia de cómputo muy superior a las GPU convencionales para tareas de inferencia de IA. La salida a bolsa generó enormes retornos para los inversores. Sam Altman, de OpenAI, multiplicó por 10 su inversión personal inicial. La propia OpenAI posee una participación significativa gracias a un acuerdo vinculado a la compra futura de capacidad de cálculo, con una ganancia estimada en 1.800 millones de dólares. Esta operación es solo el prólogo. El mercado espera con impaciencia las futuras y gigantescas salidas a bolsa de empresas como SpaceX (con xAI), valorada en 1,75 billones, OpenAI (1 billón) y Anthropic (900.000 millones). En conjunto, podrían movilizar más de 3 billones de dólares, en lo que se interpreta como una apuesta masiva del capital por la infraestructura necesaria para el desarrollo de una inteligencia artificial superinteligente (ASI).

marsbit05/15 11:27

¡Se dispara un 108% en su primer día! Nace el mayor caballo negro de la IA en 2026, y Altman "gana dinero sin mover un dedo" una vez más

marsbit05/15 11:27

Entendiendo en un solo artículo los grupos de beneficio y el panorama industrial de la jerarquía de almacenamiento de IA

Resumen de la jerarquía de almacenamiento de IA y sus cuencos de beneficios La arquitectura de almacenamiento para IA se estructura en seis niveles, desde el más cercano a la unidad de cálculo hacia afuera: 1) SRAM en el chip, 2) HBM, 3) DRAM de placa base, 4) Capa de agrupación CXL, 5) SSD empresarial, 6) NAS y almacenamiento de objetos en la nube. El tamaño total del mercado en 2025 fue de aproximadamente 229.000 millones de dólares, dominado por DRAM (50%), HBM (15%) y SSD (11%). Los cuencos de beneficios se clasifican en tres tipos: - **Grupo oligopólico de alto margen (capa de silicio):** HBM, SRAM embebida y SSD QLC, caracterizados por alta concentración y rentabilidad. - **Grupo emergente de alto margen (capa de interconexión):** Tecnología CXL, un mercado en rápido crecimiento. - **Grupo de intereses compuestos a escala (capa de servicio):** NAS y almacenamiento en la nube, con rentabilidad basada en economías de escala y costos de cambio. **Análisis por capa:** - **SRAM (L0):** Su valor se integra en las obleas de TSMC. - **HBM (L1):** El mayor cuenco de beneficios, con un crecimiento anual compuesto (CAGR) del 40% y márgenes operativos que superan el 70% para líderes como SK Hynix. - **DRAM de placa base (L2):** El segmento más grande en volumen, pero con márgenes menores (~30-40%). - **CXL (L3):** Mercado en auge (CAGR 37%), con componentes como los retimers de Astera Labs logrando márgenes brutos superiores al 76%. - **SSD Empresarial (L4):** Se beneficia de la inferencia de IA (CAGR 24%), impulsado por unidades QLC de alta capacidad. - **NAS/Nube (L5):** Rentabilidad basada en servicios gestionados y retención de datos. **Conclusiones clave:** 1. La rentabilidad es mayor en las capas más cercanas al cálculo (HBM, CXL). 2. El crecimiento principal proviene de HBM, SSD empresarial y CXL. 3. Las barreras varían: tecnología avanzada para HBM, propiedad intelectual para CXL y costos de cambio para los servicios en la nube.

marsbit05/14 04:08

Entendiendo en un solo artículo los grupos de beneficio y el panorama industrial de la jerarquía de almacenamiento de IA

marsbit05/14 04:08

Cerebras IPO: Una valoración de 48.8 mil millones de dólares, ¿el 'desafiante de Nvidia' es una burbuja o el nuevo rey?

El fabricante de chips de IA Cerebras debutará en Nasdaq (CBRS) el 14 de mayo con una valoración de 48.800 millones de dólares, en la mayor OPV del año. Su historia es la de un retador de Nvidia con su chip de oblea completa WSE-3, que supera al B200 de Nvidia en velocidad de inferencia, y un contrato con OpenAI de hasta 20.000 millones. Sin embargo, el prospecto revela tres paradojas clave. 1) Aunque reporta beneficios GAAP, el resultado operativo real (non-GAAP) es una pérdida creciente, enmascarada por ajustes contables. 2) La dependencia del cliente persiste, con el 86% de los ingresos provenientes de dos entidades de los Emiratos Árabes Unidos (G42 y MBZUAI). El contrato con OpenAI está vinculado a un préstamo, warrants y cláusulas de exclusividad. 3) Cerebras domina nichos de inferencia específicos, no el ecosistema general de IA de Nvidia, enfrentándose a la competencia de los gigantes tecnológicos. Con una relación precio-venta de 95x sobre ingresos de 510 millones en 2025, su valoración supone una ejecución perfecta del contrato con OpenAI y un crecimiento exponencial. Sus ventajas técnicas son reales, pero su supervivencia a largo plazo depende de mantener su liderazgo en un nicho que los grandes actores también persiguen. La OPV es un evento clave, pero la inversión es una apuesta de alto riesgo y alta recompensa sobre el futuro de la inferencia de IA y la capacidad de la compañía para escalar más allá de su estrecha base de clientes.

marsbit05/12 09:28

Cerebras IPO: Una valoración de 48.8 mil millones de dólares, ¿el 'desafiante de Nvidia' es una burbuja o el nuevo rey?

marsbit05/12 09:28

La factura de la inferencia de IA se dispara, Shopify y Roblox advierten: los ahorros de los despidos no son suficientes para pagar las GPU

El primer trimestre de 2026 revela que los costes de la IA, especialmente las facturas de inferencia y la depreciación de GPUs, están superando los ahorros por recortes de personal en empresas tecnológicas. Shopify informa que, aunque la IA escribe más del 50% de su código y mantiene estable la plantilla, los costes de los LLM están presionando el margen bruto de sus suscripciones, impulsados por el uso masivo de su asistente Sidekick. Roblox ajustó a la baja su previsión de margen anual, atribuyendo un 25% de ese recorte directamente a mayores inversiones en IA. La compañía maneja millones de inferencias por segundo y planea monetizar funciones avanzadas de IA para compensar costes. A nivel macro, los gastos de capital en IA de Amazon, Meta, Microsoft y Google alcanzarán los 725.000 millones de dólares en 2026. Los ahorros por despidos, como los 24.000 millones estimados en Meta, palidecen frente a estos desembolsos, cubriendo solo una fracción del incremento en depreciación. Mientras proveedores como Nvidia o OpenAI mantienen altos márgenes, las empresas de aplicación enfrentan un dilema: sus ingresos dependen del uso de IA, pero los costes los fijan los proveedores de modelos. Las estrategias ahora se centran en integrar la IA profundamente en la plataforma (Shopify) o hacer pagar al usuario por su uso avanzado (Roblox), admitiendo que los ahorros en personal no son suficientes para cubrir la factura de los chips.

marsbit05/11 06:59

La factura de la inferencia de IA se dispara, Shopify y Roblox advierten: los ahorros de los despidos no son suficientes para pagar las GPU

marsbit05/11 06:59

DeepSeek V4 en gráficos: Tras su lanzamiento, el mercado de capitales reacciona: Zhipu y MiniMax se desploman, NVIDIA se alarma

DeepSeek V4, un modelo de lenguaje de inteligencia artificial de 1 billón de parámetros, se lanzado como código abierto bajo la licencia Apache 2.0, lo que ha provocado reacciones inmediatas en los mercados financieros globales. En China, las acciones relacionadas con la capacidad de computación, como Cambricon y Hygon, experimentaron fuertes alzas, mientras que las empresas de modelos propietarios como Zhipu y MiniMax cayeron significativamente en Hong Kong. NVIDIA también registró una caída inicial, aunque se recuperó al cierre. El lanzamiento de V4 destaca por su adaptación nativa a chips chinos, como el Ascend 950PR de Huawei y el Siyuan 590 de Cambricon, lo que reduce la dependencia de las soluciones de NVIDIA y CUDA. Esto ha llevado a los inversores a reevaluar el ecosistema de IA, favoreciendo a los proveedores de infraestructura local y presionando a las empresas que dependen de modelos cerrados. El modelo no solo iguala el rendimiento de los principales competidores cerrados, sino que también ofrece total apertura comercial y técnica, marcando un punto de inflexión en la industria. La capacidad de China para desarrollar y implementar modelos de IA de clase mundial con hardware local está comenzando a desconectar su demanda de inferencia de la dependencia tecnológica de Occidente, redefiniendo las cadenas de suministro globales de silicio y software.

marsbit04/24 11:40

DeepSeek V4 en gráficos: Tras su lanzamiento, el mercado de capitales reacciona: Zhipu y MiniMax se desploman, NVIDIA se alarma

marsbit04/24 11:40

活动图片