Tanto OpenAI como Anthropic se proponen "desarrollar sus propios chips": más allá del coste, lo más importante es el control de la capacidad de cálculo

marsbitPublicado a 2026-07-03Actualizado a 2026-07-03

Resumen

Según informes, Anthropic está negociando con Samsung para desarrollar chips de IA personalizados, siguiendo los pasos de OpenAI. Ambas empresas buscan reducir costes y, lo más importante, controlar su infraestructura de cómputo. Actualmente, dependen en gran medida de proveedores como Nvidia, lo que genera incertidumbre y altos costes operativos. El objetivo principal no es solo sustituir a proveedores externos, sino lograr una optimización integral entre el software y el hardware. Los chips personalizados permitirían adaptar el diseño de los modelos de IA a la arquitectura del chip, mejorando la eficiencia energética y el rendimiento. Expertos señalan que la mayor ganancia de eficiencia proviene de este diseño conjunto, no solo de chips más rápidos. Aunque OpenAI y Anthropic avanzan hacia chips propios, esto no reemplazará de inmediato a las GPU de Nvidia, que mantienen ventajas en adaptabilidad y ecosistema. En cambio, los chips personalizados probablemente se usarán para cargas de trabajo específicas, como la inferencia. Esta tendencia refleja una competencia más amplia en la industria por la autonomía en cómputo. Empresas como Google, Amazon, Meta y Microsoft también desarrollan sus propios chips. Para Samsung, obtener el contrato de fabricación de Anthropic supondría un impulso significativo en el competitivo mercado de semiconductores para IA.

Según un informe de The Information del jueves, Anthropic está en conversaciones con Samsung para el desarrollo de chips de inteligencia artificial personalizados y ya ha iniciado los trabajos preliminares para el desarrollo de sus propios chips de IA. Si estos chips de servidor personalizados finalmente entran en producción en masa, supondría un paso importante hacia la autonomía en hardware por parte de la compañía detrás de Claude.

Este movimiento se interpreta como una señal de que Anthropic sigue los pasos de OpenAI.

OpenAI ha avanzado antes en su proyecto de chips de IA personalizados y está colaborando con socios de diseño y fabricación de chips, intentando construir una infraestructura computacional más independiente y eficiente para productos como ChatGPT. Ambas compañías apuntan a la misma tendencia: las empresas de modelos grandes están pasando de competir únicamente en algoritmos a competir en una integración de software y hardware.

El impacto en el mercado afecta primero a tres áreas: el entorno de negociación de proveedores externos de GPU como NVIDIA, las oportunidades para fundiciones como Samsung en los pedidos de chips de IA, y el ritmo futuro de financiación y salida a bolsa de las startups de IA.

Según un informe de Barron's, analistas de Deutsche Bank aconsejaron recientemente que OpenAI y Anthropic no deberían retrasar demasiado su OPV (Oferta Pública de Venta), una de las razones siendo precisamente la necesidad de un enorme capital a largo plazo para el desarrollo de sus propios chips y la infraestructura de capacidad de cálculo.

Desarrollar chips propios es, ante todo, una cuestión de control sobre la capacidad de cálculo

Actualmente, entrenar y ejecutar modelos grandes requiere una gran cantidad de recursos de computación de alto rendimiento. El mercado de la computación de IA depende en gran medida de la arquitectura GPU de NVIDIA, y la tensión entre oferta y demanda mantiene los costes de entrenamiento e inferencia de modelos en niveles elevados. Para empresas de modelos como OpenAI y Anthropic, los chips ya no son solo un artículo de compra, sino un medio de producción central.

La demanda del modelo Claude de Anthropic creció significativamente en 2026. Según informes de TradingKey, ejecutivos de Anthropic habían revelado anteriormente que los ingresos anualizados de la compañía superaban los 300 mil millones de dólares, mientras que a finales de 2025 eran de aproximadamente 90 mil millones. La expansión del negocio impulsa un rápido aumento de la necesidad de capacidad de cálculo, amplificando también el impacto de la incertidumbre en el suministro de chips externos en las operaciones de la empresa.

Anthropic aún depende de múltiples soluciones de chips de terceros, incluidas las TPU diseñadas por Google, propiedad de Alphabet, y los chips propios de Amazon. Los informes indican que Anthropic también ha alcanzado un acuerdo de suministro a largo plazo de TPU con Google y Broadcom, relacionado con su compromiso previo de invertir 500 mil millones de dólares en infraestructura de computación en Estados Unidos.

Esto significa que desarrollar chips propios no equivale a independizarse completamente de proveedores externos. Un objetivo más realista es dominar las capacidades de diseño central, crear opciones técnicas de respaldo y mejorar las cartas de negociación en el futuro.

El coste es solo el punto de entrada; la sinergia software-hardware es la clave

La razón más directa para desarrollar chips propios es reducir costes. Mediante ASICs personalizados, las empresas de IA pueden optimizar el flujo computacional en torno a la arquitectura de sus propios modelos, reduciendo módulos innecesarios en los chips genéricos, mejorando así la eficiencia energética. Si el chip de Anthropic tiene éxito en su fabricación y despliegue, los informes sugieren que podría reducir significativamente el coste de las llamadas a la API y afectar a la estructura de precios en el mercado de aplicaciones empresariales de IA.

Pero el coste no es la única variable. Dylan Patel, fundador de SemiAnalysis, enfatizó en una entrevista que el mayor espacio para la mejora de la eficiencia en IA no proviene solo de chips más rápidos, sino del diseño colaborativo entre el modelo, el núcleo y el silicio. Señaló que la optimización en una sola capa podría aportar una mejora del doble, pero la colaboración entre capas podría lograr un efecto mucho mayor que una simple multiplicación.

Esto explica por qué tanto OpenAI como Anthropic se están adentrando más en la participación en hardware. La arquitectura del modelo no se adapta naturalmente a todos los chips. Dylan Patel afirmó que los modelos de OpenAI son más dispersos (sparse), mientras que los modelos de Anthropic son relativamente más densos (dense). Ambos presentan diferencias significativas en aspectos como el tamaño de las unidades de multiplicación de matrices, la estructura del mecanismo de atención y la forma de las capas expertas (MoE), lo que hace que ambas compañías tiendan naturalmente hacia direcciones diferentes en la elección de hardware. "De hecho, según la dirección de desarrollo del modelo de OpenAI, usar TPU podría ser una mala decisión para ellos; y según la dirección de desarrollo de los modelos de Anthropic y Google, entrenar con GPU podría ser igualmente una mala decisión", dijo.

En otras palabras, desarrollar chips propios no es simplemente reemplazar la GPU de NVIDIA por un chip propio. El verdadero objetivo es que el modelo, desde su concepción, pueda adaptarse al hardware subyacente, mejorando así la velocidad de inferencia, el consumo energético, el rendimiento (throughput) y la economía unitaria.

No es un reemplazo inmediato para NVIDIA, sino un contrapeso a largo plazo

Desarrollar chips de IA propios, desde el diseño y la investigación, pasando por la verificación y fabricación del primer prototipo (tape-out), hasta el despliegue final en producción, suele requerir de 18 a 24 meses. Incluso si Anthropic llega a un acuerdo exitoso con Samsung, es poco probable que sus chips propios reemplacen sustancialmente el suministro actual de capacidad de cálculo en el corto plazo.

OpenAI, por su parte, avanza antes. Según informes de TradingKey, OpenAI ha optado por colaborar con Broadcom y TSMC, planeando desplegar su primer chip de inferencia en la segunda mitad de 2026. En comparación con Anthropic, OpenAI es más proactiva y está más cerca de la fase de implementación en su camino hacia los chips personalizados.

La dirección de las empresas de modelos grandes hacia el desarrollo de chips propios apunta efectivamente a reducir la dependencia de proveedores como NVIDIA. Pero esto no significa que la posición de NVIDIA se verá debilitada rápidamente. Dylan Patel señaló en la entrevista que las GPU de NVIDIA aún mantienen la ventaja de la versatilidad, y muchos modelos y el ecosistema de código abierto están ya optimizados para GPU. También mencionó que la supuesta "muralla" de CUDA no es solo CUDA en sí, sino que gran parte del ecosistema de modelos y software aguas abajo ya está adaptado a la forma del hardware de NVIDIA. Si la estructura de expertos del modelo, las dimensiones ocultas y los modos de comunicación son más adecuados para GPU, entonces, incluso si otros chips tienen ventajas, la migración podría no ser sencilla.

Por lo tanto, desarrollar chips propios se asemeja más a establecer una segunda ruta. OpenAI y Anthropic probablemente seguirán utilizando múltiples recursos de capacidad de cálculo como GPU, TPU, Trainium, etc., mientras destinan sus ASICs propios a cargas de trabajo más definidas, estables y de alta frecuencia, especialmente en escenarios de inferencia.

Se abre por completo la carrera por la "autonomía en capacidad de cálculo" en toda la industria

La lógica común detrás del desarrollo de chips propios por parte de OpenAI y Anthropic se puede resumir en tres puntos: reducir el coste de la capacidad de cálculo a largo plazo, disminuir la dependencia del suministro externo y mejorar la eficiencia del modelo mediante la sinergia software-hardware.

De estos, el tercer punto podría ser el más crítico. A medida que las empresas de modelos escalan, la capacidad de cálculo genérica no puede satisfacer completamente las necesidades de arquitecturas diferenciadas. Los chips propios permiten a las empresas colocar el diseño del modelo, el software del sistema y el silicio subyacente dentro de un mismo marco de optimización.

Pero la dirección ya es clara: la competencia en modelos grandes se está extendiendo de "qué modelo es más potente" a "quién puede controlar mejor la capacidad de cálculo, el capital y la pila de hardware". Esta es también la verdadera razón por la que tanto OpenAI como Anthropic se encaminan hacia el desarrollo de chips propios.

La exploración de Anthropic no es un caso aislado. Desde la serie TPU de Google, cultivada durante más de una década, hasta la serie Trainium de Amazon centrada en entrenamiento, pasando por la serie MTIA de Meta orientada a inferencia y la serie Maia que Microsoft sigue impulsando, las principales compañías tecnológicas ya tienen una presencia profunda en la carrera por desarrollar sus propios chips.

Para Samsung, si logra asegurar el pedido de fabricación de chips de Anthropic, supondría un importante impulso para la influencia de su negocio de fundición (foundry) en el campo de la IA. Samsung compite actualmente intensamente con fabricantes como TSMC por clientes de procesos avanzados, y atraer a un cliente de IA con alto potencial de crecimiento como Anthropic ayudaría a expandir su territorio en el campo de los semiconductores para IA.

Este artículo proviene de la cuenta oficial de WeChat: Wall Street Insights , autor: Zhao Ying

Preguntas relacionadas

Q¿Por qué OpenAI y Anthropic están desarrollando sus propios chips de IA?

ALas principales razones son ganar control sobre el poder de cálculo (reduciendo la dependencia externa), reducir los costos a largo plazo y, lo más importante, lograr una optimización integral mediante la co-diseño de software y hardware para mejorar la eficiencia del modelo.

Q¿Cuál es la diferencia clave en la arquitectura de los modelos de OpenAI y Anthropic que influye en el diseño de hardware?

ASegún Dylan Patel de SemiAnalysis, los modelos de OpenAI son más dispersos (sparse), mientras que los de Anthropic y Google son más densos (dense). Estas diferencias en la estructura de multiplicación de matrices, el mecanismo de atención y la forma de las capas de expertos hacen que cada uno se adapte naturalmente a diferentes tipos de hardware.

Q¿Qué impacto tiene el desarrollo de chips propios en proveedores como NVIDIA?

ANo es un reemplazo inmediato, sino una estrategia de equilibrio a largo plazo. Las empresas continuarán usando GPUs, TPUs y otros recursos, pero los chips personalizados (ASICs) les darán una ruta alternativa, mayor poder de negociación y una opción optimizada para cargas de trabajo específicas, especialmente en inferencia.

Q¿Cuáles son los plazos estimados para que OpenAI y Anthropic desplieguen sus primeros chips?

AOpenAI, que comenzó antes, planea desplegar su primer chip de inferencia en la segunda mitad de 2026 en colaboración con Broadcom y TSMC. Para Anthropic, que está en etapas iniciales con Samsung, el proceso desde el diseño hasta el despliegue masivo normalmente toma de 18 a 24 meses.

Q¿Qué otras grandes empresas tecnológicas han desarrollado sus propios chips de IA y por qué es importante para Samsung conseguir el contrato de Anthropic?

AGoogle (TPU), Amazon (Trainium), Meta (MTIA) y Microsoft (Maia) ya tienen sus propios diseños. Para Samsung, fabricar los chips de Anthropic sería un impulso importante para su negocio de fundición (foundry), ayudándole a competir con TSMC y a expandir su influencia en el sector de semiconductores para IA.

Lecturas Relacionadas

Ballena apuesta $70 millones a la recuperación de Bitcoin y Solana – ¿Arruinarán el miedo a la subida de tasas de la Fed la jugada?

Una ballena aumentó significativamente su exposición alcista en Bitcoin y Solana, apostando más de 70 millones de dólares. Esta movida siguió a un débil informe de empleo en EE.UU., que avivó las esperanzas de un posible recorte de tasas por parte de la Fed y desencadenó un alivio temporal en los mercados. Sin embargo, los temores sobre la política monetaria persisten. Las probabilidades de una nueva subida de tipos bajaron, pero los operadores aún asignan un 83% de probabilidad a que la Fed mantenga las tasas sin cambios. La publicación de las actas de la FOMC la próxima semana podría generar volatilidad. Mientras, los "smart money" aumentaron las compras de Solana, pero se acumulan posiciones cortas en Bitcoin, lo que crea condiciones para un posible "short squeeze". Para una recuperación sostenida, Bitcoin debe superar los niveles de resistencia en 62.300 y 65.000 dólares.

ambcryptoHace 33 min(s)

Ballena apuesta $70 millones a la recuperación de Bitcoin y Solana – ¿Arruinarán el miedo a la subida de tasas de la Fed la jugada?

ambcryptoHace 33 min(s)

77 casos del código sanguinario: cuando la "llave de 5 dólares" destroza el mito de la privacidad de los criptomillonarios franceses

**Resumen: La epidemia de "ataques con llave inglesa" contra criptoinversores en Francia** En la primera mitad de 2026, Francia registró 77 casos graves de secuestro, extorsión, confinamiento ilegal o intentos contra poseedores de criptomonedas, lo que supone un aumento del 71% respecto a todo 2025. Esto significa un ataque violento cada 2.3 días. Los criminales, a menudo vinculados a redes estructuradas, han evolucionado desde la amenaza teórica del "ataque con llave inglesa" (coacción física para robar claves privadas) a métodos brutales, como el secuestro y la mutilación, como en el caso de un cofundador de Ledger en 2025. Francia se ha convertido en un epicentro global de esta ola criminal, impulsada por su gran base de inversores (unos 7.3 millones), la concentración de empresas líderes, una cultura de "ostentación" en el sector y posibles filtraciones de datos. La crisis se extiende por Europa, que concentra más del 40% de estos ataques a nivel mundial, los cuales correlacionan con los picos en el precio del Bitcoin. Frente a esta situación "muy grave", el Ministerio del Interior francés anunció un plan basado en tres pilares: reforzar el intercambio de inteligencia, profundizar la colaboración con la industria y mejorar la coordinación operativa y la cooperación transfronteriza. A los poseedores se les advierte: la seguridad cripto ya no es solo digital. La recomendación clave es la discreción: evitar revelar tenencias en redes sociales y fortalecer las medidas de seguridad física personal.

marsbitHace 51 min(s)

77 casos del código sanguinario: cuando la "llave de 5 dólares" destroza el mito de la privacidad de los criptomillonarios franceses

marsbitHace 51 min(s)

Las reglas sobre cripto ‘no son un favor’, dice la SEC, pero la Ley CLARITY aún espera

El presidente de la SEC, Paul Atkins, defendió la postura de la agencia sobre la necesidad de normas claras para el mercado de criptomonedas, afirmando que no se trata de un "favor" a la industria, sino de un requisito para su funcionamiento. Aunque la SEC ha emitido orientaciones y avanzado en la modernización de reglas, la claridad duradera depende de la aprobación de la Ley CLARITY, un proyecto de ley de estructura del mercado cripto que aún espera votación en el Senado. Mientras, la UE ya implementó su marco MiCA, lo que ha aumentado la presión para que Estados Unidos actúe. Grupos de presión como Stand With Crypto advierten que la incertidumbre regulatoria está impulsando la innovación hacia otros países.

ambcryptoHace 1 hora(s)

Las reglas sobre cripto ‘no son un favor’, dice la SEC, pero la Ley CLARITY aún espera

ambcryptoHace 1 hora(s)

Se acumulan nubes bajistas mientras expiran opciones de Bitcoin y Ethereum por valor de 2.130 millones de dólares

El mercado de criptomonedas enfrentó una sesión crucial el 3 de julio con el vencimiento de opciones por un valor combinado de 2.130 millones de dólares en Bitcoin y Ethereum, lo que ofrece una visión de la posición de los inversores en un entorno desafiante. Vencieron aproximadamente 31.000 opciones de Bitcoin (valor nocional: 1.900 millones de dólares) con un ratio put-call de 0,70 y un "punto máximo de dolor" de 61.000 dólares. Paralelamente, expiraron 135.000 opciones de Ethereum (valor: 230 millones de dólares) con un ratio put-call de 1,29 y un nivel máximo de dolor de 1.650 dólares. El elevado ratio put-call de Ethereum, superior a 1, indica que las opciones de venta superan a las de compra, lo que sugiere que los operadores se cubren ante posibles caídas o mantienen una perspectiva cautelosa. El posicionamiento cerca de niveles clave de exposición a gamma (GEX), alrededor de 60.000 dólares para Bitcoin y 1.700 dólares para Ethereum, refuerza esta actitud defensiva. Aunque Bitcoin recuperó el nivel psicológico de 60.000 dólares, el sentimiento del mercado sigue siendo mixto. Los datos de vencimiento sugieren que los operadores se mantienen prudentes de cara al tercer trimestre, preparándose más para una volatilidad elevada que para un repunte alcista decisivo. Al momento de la información, Bitcoin cotizaba alrededor de 61.932 dólares y Ethereum cerca de 1.738 dólares, ambos con una disminución en el volumen de operaciones y liquidaciones significativas en las últimas 24 horas.

TheNewsCryptoHace 2 hora(s)

Se acumulan nubes bajistas mientras expiran opciones de Bitcoin y Ethereum por valor de 2.130 millones de dólares

TheNewsCryptoHace 2 hora(s)

La nueva tecnología DeepSeek se adapta a los chips Apple, acelerando el modelo local en Mac un 60%

El proyecto de código abierto DSpark de DeepSeek, originalmente diseñado para acelerar modelos de lenguaje en GPUs de centros de datos, ha sido adaptado por el ingeniero Abdur Rahim para funcionar de forma nativa en chips Apple (mlx-dspark). Esta adaptación logra aceleraciones de aproximadamente 1.6x para Gemma-4 12B y 1.4x para Qwen3-4B en un Mac con M4 Pro, manteniendo una precisión de salida idéntica al modelo original (byte por byte), incluso con muestreo por temperatura. La clave de DSpark es el "decodificado especulativo": un modelo pequeño y rápido (draft) genera varios tokens candidatos que luego son verificados de manera eficiente por el modelo principal (target). Rahim optimizó este proceso para la arquitectura Apple Silicon, utilizando cuantización de 4 bits para el modelo draft (1.8 GB) y 8 bits para el target, logrando una tasa de aceptación del 82%. Posteriormente, el proyecto integró también DFlash, una técnica alternativa de decodificación especulativa que genera bloques de tokens en paralelo. DFlash mostró un rendimiento superior (hasta ~2.1x de aceleración) en tareas estructuradas como código y matemáticas, mientras que DSpark es más eficaz en conversaciones abiertas. La versión mlx-dspark v0.0.3 ahora permite elegir entre ambos métodos según la tarea. Este trabajo demuestra la viabilidad de ejecutar eficientemente LLMs avanzados localmente en hardware Apple, combinando velocidad y precisión.

marsbitHace 2 hora(s)

La nueva tecnología DeepSeek se adapta a los chips Apple, acelerando el modelo local en Mac un 60%