Artículos Relacionados con Inferencia

El Centro de Noticias de HTX ofrece los artículos más recientes y un análisis profundo sobre "Inferencia", cubriendo tendencias del mercado, actualizaciones de proyectos, desarrollos tecnológicos y políticas regulatorias en la industria de cripto.

Este carril de chips se ha vuelto extremadamente popular

El mercado global de chips para IA está experimentando un cambio de paradigma, con los ASIC (circuitos integrados de aplicación específica) emergiendo como protagonistas clave a partir de 2025. Este auge está impulsado por la migración del enfoque de la industria, desde la capacitación de modelos hacia la implementación a gran escala de la inferencia, donde los ASIC ofrecen ventajas decisivas en eficiencia energética y coste. Señales claras de este punto de inflexión incluyen el dominio del TPU de Google en servidores, grandes pedidos de ASIC personalizados por parte de OpenAI con Broadcom, y el ingreso agresivo de actores como MediaTek y Qualcomm al campo de los ASIC para centros de datos. En China, empresas como VeriSilicon y ASR también están experimentando un crecimiento explosivo en este segmento. La razón fundamental radica en la economía: para cargas de trabajo de inferencia a escala masiva, usar GPUs de propósito general es estructuralmente ineficiente. Los ASIC, optimizados para cargas específicas como la arquitectura Transformer, logran mejoras de 3 a 5 veces en eficiencia y reducen costes totales entre un 40% y 60%. El panorama competitivo se está reconfigurando. Junto a los líderes tradicionales Broadcom y Marvell, ahora participan gigantes de chips para móviles como MediaTek —que proyecta ingresos por miles de millones— y Qualcomm, que apuesta por una estrategia integral. Además, los principales proveedores de servicios en la nube (CSP) están impulsando activamente el desarrollo de sus propios ASIC para ganar autonomía estratégica y control de costes. La era dorada de los ASIC representa una "democratización" del poder de cálculo de la IA, descentralizando la definición del hardware desde unos pocos actores dominantes hacia un ecosistema más diversificado y especializado, donde se prevé una coexistencia futura: las GPU para entrenamiento y los ASIC para inferencia.

marsbit05/18 00:36

Este carril de chips se ha vuelto extremadamente popular

marsbit05/18 00:36

¡Se dispara un 108% en su primer día! Nace el mayor caballo negro de la IA en 2026, y Altman "gana dinero sin mover un dedo" una vez más

Cerebras, la empresa de chips de IA, debutó en el mercado de valores en 2026 con una salida a bolsa monumental. Su precio de las acciones se disparó un 108% en el primer día, alcanzando una valoración de hasta 100.000 millones de dólares y recaudando 5.550 millones de dólares. Esta exitosa salida a bolsa, una de las más grandes de la historia tecnológica estadounidense, marca el inicio de una oleada de IPOs de empresas de IA. La compañía, fundada en 2015, logró un giro financiero espectacular, pasando de pérdidas a unos beneficios de 238 millones de dólares en 2025, con ingresos de 510 millones. Firmó contratos clave con clientes como OpenAI y AWS. Su tecnología estrella es el chip WSE-3, un procesador del tamaño de una oblea entera, con una potencia de cómputo muy superior a las GPU convencionales para tareas de inferencia de IA. La salida a bolsa generó enormes retornos para los inversores. Sam Altman, de OpenAI, multiplicó por 10 su inversión personal inicial. La propia OpenAI posee una participación significativa gracias a un acuerdo vinculado a la compra futura de capacidad de cálculo, con una ganancia estimada en 1.800 millones de dólares. Esta operación es solo el prólogo. El mercado espera con impaciencia las futuras y gigantescas salidas a bolsa de empresas como SpaceX (con xAI), valorada en 1,75 billones, OpenAI (1 billón) y Anthropic (900.000 millones). En conjunto, podrían movilizar más de 3 billones de dólares, en lo que se interpreta como una apuesta masiva del capital por la infraestructura necesaria para el desarrollo de una inteligencia artificial superinteligente (ASI).

marsbit05/15 11:27

¡Se dispara un 108% en su primer día! Nace el mayor caballo negro de la IA en 2026, y Altman "gana dinero sin mover un dedo" una vez más

marsbit05/15 11:27

Entendiendo en un solo artículo los grupos de beneficio y el panorama industrial de la jerarquía de almacenamiento de IA

Resumen de la jerarquía de almacenamiento de IA y sus cuencos de beneficios La arquitectura de almacenamiento para IA se estructura en seis niveles, desde el más cercano a la unidad de cálculo hacia afuera: 1) SRAM en el chip, 2) HBM, 3) DRAM de placa base, 4) Capa de agrupación CXL, 5) SSD empresarial, 6) NAS y almacenamiento de objetos en la nube. El tamaño total del mercado en 2025 fue de aproximadamente 229.000 millones de dólares, dominado por DRAM (50%), HBM (15%) y SSD (11%). Los cuencos de beneficios se clasifican en tres tipos: - **Grupo oligopólico de alto margen (capa de silicio):** HBM, SRAM embebida y SSD QLC, caracterizados por alta concentración y rentabilidad. - **Grupo emergente de alto margen (capa de interconexión):** Tecnología CXL, un mercado en rápido crecimiento. - **Grupo de intereses compuestos a escala (capa de servicio):** NAS y almacenamiento en la nube, con rentabilidad basada en economías de escala y costos de cambio. **Análisis por capa:** - **SRAM (L0):** Su valor se integra en las obleas de TSMC. - **HBM (L1):** El mayor cuenco de beneficios, con un crecimiento anual compuesto (CAGR) del 40% y márgenes operativos que superan el 70% para líderes como SK Hynix. - **DRAM de placa base (L2):** El segmento más grande en volumen, pero con márgenes menores (~30-40%). - **CXL (L3):** Mercado en auge (CAGR 37%), con componentes como los retimers de Astera Labs logrando márgenes brutos superiores al 76%. - **SSD Empresarial (L4):** Se beneficia de la inferencia de IA (CAGR 24%), impulsado por unidades QLC de alta capacidad. - **NAS/Nube (L5):** Rentabilidad basada en servicios gestionados y retención de datos. **Conclusiones clave:** 1. La rentabilidad es mayor en las capas más cercanas al cálculo (HBM, CXL). 2. El crecimiento principal proviene de HBM, SSD empresarial y CXL. 3. Las barreras varían: tecnología avanzada para HBM, propiedad intelectual para CXL y costos de cambio para los servicios en la nube.

marsbit05/14 04:08

Entendiendo en un solo artículo los grupos de beneficio y el panorama industrial de la jerarquía de almacenamiento de IA

marsbit05/14 04:08

Cerebras IPO: Una valoración de 48.8 mil millones de dólares, ¿el 'desafiante de Nvidia' es una burbuja o el nuevo rey?

El fabricante de chips de IA Cerebras debutará en Nasdaq (CBRS) el 14 de mayo con una valoración de 48.800 millones de dólares, en la mayor OPV del año. Su historia es la de un retador de Nvidia con su chip de oblea completa WSE-3, que supera al B200 de Nvidia en velocidad de inferencia, y un contrato con OpenAI de hasta 20.000 millones. Sin embargo, el prospecto revela tres paradojas clave. 1) Aunque reporta beneficios GAAP, el resultado operativo real (non-GAAP) es una pérdida creciente, enmascarada por ajustes contables. 2) La dependencia del cliente persiste, con el 86% de los ingresos provenientes de dos entidades de los Emiratos Árabes Unidos (G42 y MBZUAI). El contrato con OpenAI está vinculado a un préstamo, warrants y cláusulas de exclusividad. 3) Cerebras domina nichos de inferencia específicos, no el ecosistema general de IA de Nvidia, enfrentándose a la competencia de los gigantes tecnológicos. Con una relación precio-venta de 95x sobre ingresos de 510 millones en 2025, su valoración supone una ejecución perfecta del contrato con OpenAI y un crecimiento exponencial. Sus ventajas técnicas son reales, pero su supervivencia a largo plazo depende de mantener su liderazgo en un nicho que los grandes actores también persiguen. La OPV es un evento clave, pero la inversión es una apuesta de alto riesgo y alta recompensa sobre el futuro de la inferencia de IA y la capacidad de la compañía para escalar más allá de su estrecha base de clientes.

marsbit05/12 09:28

Cerebras IPO: Una valoración de 48.8 mil millones de dólares, ¿el 'desafiante de Nvidia' es una burbuja o el nuevo rey?

marsbit05/12 09:28

La factura de la inferencia de IA se dispara, Shopify y Roblox advierten: los ahorros de los despidos no son suficientes para pagar las GPU

El primer trimestre de 2026 revela que los costes de la IA, especialmente las facturas de inferencia y la depreciación de GPUs, están superando los ahorros por recortes de personal en empresas tecnológicas. Shopify informa que, aunque la IA escribe más del 50% de su código y mantiene estable la plantilla, los costes de los LLM están presionando el margen bruto de sus suscripciones, impulsados por el uso masivo de su asistente Sidekick. Roblox ajustó a la baja su previsión de margen anual, atribuyendo un 25% de ese recorte directamente a mayores inversiones en IA. La compañía maneja millones de inferencias por segundo y planea monetizar funciones avanzadas de IA para compensar costes. A nivel macro, los gastos de capital en IA de Amazon, Meta, Microsoft y Google alcanzarán los 725.000 millones de dólares en 2026. Los ahorros por despidos, como los 24.000 millones estimados en Meta, palidecen frente a estos desembolsos, cubriendo solo una fracción del incremento en depreciación. Mientras proveedores como Nvidia o OpenAI mantienen altos márgenes, las empresas de aplicación enfrentan un dilema: sus ingresos dependen del uso de IA, pero los costes los fijan los proveedores de modelos. Las estrategias ahora se centran en integrar la IA profundamente en la plataforma (Shopify) o hacer pagar al usuario por su uso avanzado (Roblox), admitiendo que los ahorros en personal no son suficientes para cubrir la factura de los chips.

marsbit05/11 06:59

La factura de la inferencia de IA se dispara, Shopify y Roblox advierten: los ahorros de los despidos no son suficientes para pagar las GPU

marsbit05/11 06:59

El verdadero valor de DeepSeek V4 no está en los parámetros

DeepSeek V4 ha logrado un avance estratégico clave al demostrar que un modelo de lenguaje de gran escala, con billones de parámetros, puede ejecutarse de manera estable y eficiente en hardware de fabricación china, como los chips Ascend 950 de Huawei y las plataformas de Cambricon. Esto representa un paso crucial hacia la independencia del ecosistema de Nvidia, que domina el mercado con sus GPU y el framework CUDA. El modelo utiliza mecanismos de atención híbrida (CSA + HCA) y compresión de caché KV para optimizar el procesamiento de contextos largos (hasta 1 millón de tokens), reduciendo la carga computacional y adaptándose mejor a los chips locales. Además, su arquitectura MoE activa solo una fracción de los parámetros durante la inferencia, lo que hace que el despliegue en entornos productivos sea más viable y económico. En cuanto a precios, DeepSeek V4 ofrece tarifas competitivas, situándose por debajo de otros modelos chinos en contextos largos, lo que facilita su adopción en aplic empresariales como análisis financiero, procesamiento de documentos extensos o agentes de código. Aunque aún hay desafíos en la madurez del ecosistema de chips chinos, este avance supone un impulso significativo para la autonomía tecnológica de China en IA.

marsbit04/25 08:13

El verdadero valor de DeepSeek V4 no está en los parámetros

marsbit04/25 08:13

Fundador de a16z: En la era de los agentes, lo realmente importante ha cambiado

Marc Andreessen, fundador de a16z, analiza la era de los agentes de IA y su impacto transformador. Destaca que la IA no surgió de la nada, sino que es el resultado de 80 años de desarrollo tecnológico, con hitos como AlexNet, Transformer y ChatGPT. Los agentes de IA representan un cambio arquitectónico fundamental, combinando modelos de lenguaje (LLM) con componentes de software tradicionales como shell, sistema de archivos y programación de tareas. Esta estructura permite introspection, automejora y interoperabilidad con herramientas existentes. Andreessen predice que las interfaces de usuario tradicionales serán reemplazadas por interacciones dirigidas por agentes, donde los humanos especifican objetivos y las IA ejecutan tareas. También discute la inversión en IA, comparándola con la burbuja de Internet del 2000 pero destacando diferencias clave en financiación y adopción. Resalta la importancia del código abierto, la inferencia local y los desafíos en seguridad, identidad y adopción institucional. Concluye que, aunque la IA enfrenta resistencias burocráticas y sociales, su potencial para transformar la software y la sociedad es inevitable.

marsbit04/25 02:09

Fundador de a16z: En la era de los agentes, lo realmente importante ha cambiado

marsbit04/25 02:09

La IA derrotó a Intel, y la IA salvó a Intel

En 2024, Intel sufrió una caída histórica del 26% en su valor, perdiendo 320.000 millones de dólares y siendo reemplazada por NVIDIA en el índice Dow Jones. Este declive se debió a su dependencia del mercado de PC y su lenta adaptación a la era móvil y de IA, donde los GPU de NVIDIA dominaron el entrenamiento de modelos. En 2026, bajo el liderazgo del nuevo CEO陈立武, Intel experimentó una recuperación sorprendente con un aumento del 20% en sus acciones tras reportar ganancias.陈立武 implementó tres estrategias clave: recortes de costos, enfoque en procesadores Xeon para centros de datos y mejora de la fabricación de chips. Además, estableció alianzas cruciales con NVIDIA, Google y Elon Musk, quienes invirtieron y colaboraron en proyectos de IA y fabricación. El giro crucial llegó con el cambio de la era de entrenamiento de IA a la de inferencia, donde los CPU recuperaron importancia para gestionar tareas de agentes y coordinación. Intel encontró su nicho en este nuevo panorama, aunque aún enfrenta desafíos como pérdidas contables y la competencia de AMD y ARM. La historia de Intel ilustra cómo una ola tecnológica puede derribar a un gigante y luego ofrecerle una segunda oportunidad, siempre que logre adaptarse a los cambios del mercado.

marsbit04/25 01:40

La IA derrotó a Intel, y la IA salvó a Intel

marsbit04/25 01:40

No solo DeepSeek, las grandes tecnológicas quieren 'abandonar' a NVIDIA

Resumen: El dominio de Nvidia en el mercado de chips de IA, con márgenes de beneficio del 75,2%, está siendo desafiado. Grandes empresas tecnológicas buscan reducir su dependencia. DeepSeek, tras entrenar su modelo V4 probablemente con chips Nvidia, ahora se adapta para inferencia a los chips chinos Ascend de Huawei, prometiendo una bajada de precios. En EE.UU., Google y Meta desarrollan sus propios chips (TPU y MTIA). OpenAI, con grandes pérdidas, apuesta fuerte por Cerebras, firmando un acuerdo de 20.000 millones de dólares para usar sus innovadores chips de obleas enteras, buscando abaratar costes y romper el monopolio de Nvidia. Sin embargo, Cerebras depende en exceso de pocos clientes como OpenAI y G42, y su rentabilidad real es cuestionable. Aunque la competencia es feroz, la demanda de potencia de cálculo sigue creciendo, impulsando un mercado diversificado donde nadie quiere depender únicamente de Nvidia.

marsbit04/24 12:34

No solo DeepSeek, las grandes tecnológicas quieren 'abandonar' a NVIDIA

marsbit04/24 12:34

DeepSeek V4 en gráficos: Tras su lanzamiento, el mercado de capitales reacciona: Zhipu y MiniMax se desploman, NVIDIA se alarma

DeepSeek V4, un modelo de lenguaje de inteligencia artificial de 1 billón de parámetros, se lanzado como código abierto bajo la licencia Apache 2.0, lo que ha provocado reacciones inmediatas en los mercados financieros globales. En China, las acciones relacionadas con la capacidad de computación, como Cambricon y Hygon, experimentaron fuertes alzas, mientras que las empresas de modelos propietarios como Zhipu y MiniMax cayeron significativamente en Hong Kong. NVIDIA también registró una caída inicial, aunque se recuperó al cierre. El lanzamiento de V4 destaca por su adaptación nativa a chips chinos, como el Ascend 950PR de Huawei y el Siyuan 590 de Cambricon, lo que reduce la dependencia de las soluciones de NVIDIA y CUDA. Esto ha llevado a los inversores a reevaluar el ecosistema de IA, favoreciendo a los proveedores de infraestructura local y presionando a las empresas que dependen de modelos cerrados. El modelo no solo iguala el rendimiento de los principales competidores cerrados, sino que también ofrece total apertura comercial y técnica, marcando un punto de inflexión en la industria. La capacidad de China para desarrollar y implementar modelos de IA de clase mundial con hardware local está comenzando a desconectar su demanda de inferencia de la dependencia tecnológica de Occidente, redefiniendo las cadenas de suministro globales de silicio y software.

marsbit04/24 11:40

DeepSeek V4 en gráficos: Tras su lanzamiento, el mercado de capitales reacciona: Zhipu y MiniMax se desploman, NVIDIA se alarma