Gigantes de la IA, entrando en el bosque oscuro

marsbitPublicado a 2026-04-25Actualizado a 2026-04-25

Resumen

Los gigantes de la IA, como Anthropic, OpenAI y DeepSeek, han entrado en una "selva oscura" estratégica donde retienen deliberadamente sus modelos más avanzados por temor a exponerse ante competidores y reguladores. Anthropic lanzó Claude Opus 4.7 pero admitió que su modelo no publicado, Mythos, es superior, citando preocupaciones de seguridad. OpenAI presentó GPT-5.5, aunque reconocen una brecha entre su capacidad real y lo que los usuarios experimentan debido a limitaciones infraestructurales y estrategias de liberación gradual. Mientras, DeepSeek espera el despliegue a gran escala de los chips Huawei Ascend 950 a finales de 2026 para lanzar su versión completa "V4 Pro Max", que promete un rendimiento superior a un costo significativamente menor. Cada empresa evita mostrar su máximo potencial para no convertirse en el objetivo de la competencia, la presión regulatoria o el escrutinio público, reflejando una dinámica de precaución estratégica en la carrera de la IA.

Por | Xiang Xianzhi

Liu Cixin, en "El problema de los tres cuerpos", escribió una imagen que luego fue citada innumerables veces: el bosque oscuro. Cada civilización es un cazador armado; quien se exponga primero, morirá primero. El bosque no está vacío, sino que todos saben que encender una luz atraerá balas, por lo que todos apagan sus luces.

En la primavera de 2026, los principales laboratorios de IA entraron en este bosque oscuro.

El 16 de abril, Anthropic lanzó primero Claude Opus 4.7. Ese mismo día, hicieron un movimiento inusual: admitieron públicamente que el rendimiento de Opus 4.7 no era tan bueno como el de un modelo aún no lanzado, Mythos, citando "preocupaciones de seguridad" (safety concerns).

El 23 de abril, OpenAI publicó GPT-5.5 en su sitio web oficial. Ese mismo día, Anthropic publicó en su blog oficial un informe post-mortem titulado "An update on recent Claude Code quality reports", admitiendo que Claude Code había estado realmente más torpe durante el último mes: uno lanza una nueva carta, el otro admite un error. Pero este "nuevo campeón" casi estaba presumiendo: admitimos que Claude está temporalmente más torpe, pero no olvides que aún tenemos un Mythos sin jugar.

El 24 de abril, la "misteriosa fuerza oriental" DeepSeek V4 Preview se lanzó; el equipo de Liang Wenfeng anunció por primera vez la vinculación profunda del modelo con el Huawei Ascend 950PR; pero todos entendieron: la verdadera versión "completa" V4 Pro Max, solo saldrá después de que la producción masiva del supernodo Ascend 950 comience en la segunda mitad del año.

Tres empresas, tres movimientos. Superficialmente, son sus propios ritmos de producto, pero vistos en conjunto, surge una cosa:

Cada uno tiene al menos un "arma" en la mano: un modelo más fuerte que la versión pública, una arquitectura de próxima generación que aún no ha llegado al público, un supernodo de chips que aún no se ha desplegado a gran escala. Pero ninguno se atreve a levantar primero esa arma.

Porque en esta industria, el precio de "brillar primero" nunca es solo una fuga de secretos. Brillar primero significa entregar voluntariamente el límite superior de tus capacidades al oponente como referencia; significa soportar todo el fuego del escrutinio de seguridad, la presión regulatoria y la presión de la opinión pública; significa convertirse en el blanco móvil que todos los competidores apuntarán en la siguiente ronda. No hay heroísmo en el bosque: cada persona que dispara primero se convierte en la siguiente en ser apuntada.

Así que la elección más racional para los cazadores es apagar las luces, contener la respiración y esconder las armas a sus espaldas.

Esta es la solución óptima en la teoría de juegos.

La seguridad de Anthropic

Por parte de Claude, en el último mes, casi se representó el peor lanzamiento de versión.

Habiendo actualizado temprano a Opus 4.7, Anthropic aún dominaba varias clasificaciones, y además tenía Mythos, disponible solo para clientes empresariales, mostrando una actitud despreocupada.

Pero el ciclo de Opus 4.7 fue casi el de peor experiencia de usuario para Claude, "una marea de críticas".

A principios de marzo, Anthropic cambió la profundidad de razonamiento predeterminada de Claude Code, de high a medium. El motivo de esta decisión era comprensible: en modo high, la interfaz a menudo parecía bloqueada, la respuesta era tan lenta que volvía locos a los usuarios de pago. El problema fue que no lo anunciaron en ese momento.

A finales de marzo, lanzaron una "optimización de eficiencia": si una sesión de Claude Code permanecía inactiva durante más de una hora, el sistema eliminaba los bloques de razonamiento antiguos. En teoría, era para ahorrar potencia de cálculo. En la práctica, después de cada turno de conversación, Claude parecía sufrir amnesia, olvidando por completo el contexto. Esas semanas, la comunidad de desarrolladores se inundó de quejas: "Claude ya no recuerda lo que le pedí en el turno anterior".

Hasta que recientemente, sucedió una tercera cosa: añadieron una instrucción en el prompt del sistema para comprimir la verbosidad. Según admitió posteriormente Anthropic, esta instrucción hizo que la calidad de codificación de Claude Code cayera un 3%.

Estas tres cosas juntas llevaron a que un senior director de AMD escribiera en GitHub: "Claude ha retrocedido hasta el punto en que no se puede confiar en él para realizar ingeniería compleja". El artículo de Axios del 16 de abril, "Anthropic's AI downgrade stings power users", lo llevó a la corriente principal.

Y entonces Anthropic admitió que, efectivamente, había algunos problemas.

El 7 de abril, revertieron silenciosamente el ajuste del esfuerzo de razonamiento; el 10 de abril arreglaron el error de la caché; el 20 de abril retiraron el prompt del sistema que comprimía la verbosidad. Pero el verdadero informe post-mortem llegó recién el 23 de abril, justo el día en que se lanzó públicamente GPT-5.5.

Esta sensación de desdén, como diciendo "oh, mi estrategia de ingeniería tuvo algunos bugs, se arregló", ocurrió casi al mismo tiempo que el importante lanzamiento de OpenAI. Es difícil decir que fue una coincidencia.

Lo más intrigante es que, cuando se lanzó Opus 4.7, Anthropic hizo un movimiento反常: admitir públicamente que el rendimiento de Opus 4.7 no alcanzaba al de un modelo aún no lanzado, Mythos. Esto es claramente un "repliegue estratégico": Anthropic mantiene su capacidad más fuerte en el lado empresarial, sin prisa por lanzarla al público, porque el equipo aún no está listo para liberar Mythos.

Esta explicación es creíble. Pero desde el ángulo de la narrativa comercial, la otra mitad es igualmente cierta: Anthropic esperó seis semanas para admitir públicamente la regresión de Claude Code, y lo hizo el mismo día que OpenAI iba a jugar su nueva carta. Si la presión de la competencia no hubiera sido lo suficientemente grande, si Opus 4.7 no hubiera demostrado que "todavía tenemos cartas bajo la manga", esta declaración quizás nunca habría llegado.

En el lado de Claude, "exprimir la pasta de dientes" no significa capar capacidades deliberadamente, sino: el ritmo de liberación de capacidades y el ritmo de divulgación de problemas, ambos siguen el ritmo de la competencia.

Mostrar tu capacidad más avanzada注定会成为一个靶子. O, en otras palabras, en la visión de Anthropic, la presión que 4.6 ejerció sobre los competidores aún no se ha disipado; por lo tanto, no es necesario jugar la carta más fuerte ahora.

La vieja estrategia de OpenAI

Si Anthropic "esconde un Mythos sin lanzar", la forma de OpenAI de exprimir la pasta es más oculta: deja el derecho a liberar capacidades en la curva de carga de sus servidores y en un mecanismo de clasificación llamado auto-router.

El mismo día del lanzamiento de GPT-5.5, el 23 de abril, Simon Willison (co-creador del framework Django, evaluador independiente conocido en el círculo de la IA) escribió en su blog una frase cautelosa: "It's not a dramatic departure from what we've had before." (No es un avance dramático respecto a lo que teníamos antes).

Añadió una información clave: GPT-5.5 es el primer modelo base completamente reentrenado por OpenAI desde GPT-4.5; es decir, las versiones 5.1, 5.2, 5.3 y 5.4 lanzadas en el último semestre eran solo actualizaciones incrementales. En otras palabras, en las últimas cuatro actualizaciones menores, OpenAI las lanzó conteniéndose, porque no sabían qué soltarían sus competidores.

"Actualizar conteniéndose" tiene una explicación más fácil: exprimir la pasta de dientes.

Pero una escena más memorable ocurrió horas después de que GPT-5.5 estuviera en línea. Los usuarios de Codex presentaron el Issue #19241 en GitHub, quejándose de que el modo Fast al principio era muy rápido, pero luego de que más usuarios fueran admitidos, se volvía notablemente más lento, mientras que la facturación seguía siendo a tarifa Fast. La redacción era familiar: "Por favor, OpenAI, investiguen si el modo Fast de GPT-5.5 se degrada bajo alta demanda".

Esto fue casi una repetición exacta de lo ocurrido el día del lanzamiento de GPT-5 el 7 de agosto de 2025: en esa ocasión, Reddit r/ChatGPT elevó "GPT-5 is horrible" a más de 4600 upvotes, y Sam Altman admitió al día siguiente en un AMA "the autoswitcher broke... GPT-5 seemed way dumber", admitiendo que el router había degradado silenciosamente a los usuarios.

El mismo guion, representado de nuevo ocho meses después.

Lo más irónico es que, el día antes del lanzamiento oficial de GPT-5.5, Codex de OpenAI empujó por error el entorno de staging interno al entorno de producción, fue capturado en screenshots por varios usuarios Pro, se arregló en minutos, pero el contenido filtrado ya se había difundido. En el selector aparecían, además del propio GPT-5.5, una serie llamada Glacier (tooltip: "Intelligence that moves continents"), un modelo de ciencias de la vida llamado Heisenberg, un modelo de uso desconocido llamado Arcanine, y múltiples versiones con el código oai-2.1, entre otros.

Es decir, justo cuando OpenAI lanzaba GPT-5.5 como la "próxima generación", internamente corrían al menos de 5 a 6 líneas de producto paralelas, ninguna de las cuales había llegado aún al público.

OpenAI mismo lo admitió. En su hoja de ruta anual oficial de 2026, usaron un término discutido durante mucho tiempo en círculos académicos: capability overhang (excedente de capacidad), admitiendo que existe una gran brecha entre la capacidad real de los modelos grandes actuales y el efecto que los usuarios pueden obtener realmente.

¿Te suena? Es casi la misma frase que usó Anthropic para hablar de Mythos. Incluso si la filtración de Codex del 22 de abril fue realmente un error, el hecho de que OpenAI incluyera activamente el término "capability overhang" en su hoja de ruta enviaba un mensaje muy claro: tenemos mucho más en la manga, ahora les toca a ustedes.

Solo si tienes mucho más de lo que vendes a los usuarios, puedes exprimir la pasta. Las 24 horas de GPT-5.5 convirtieron esta premisa una vez más en una transmisión en vivo.

La paciente espera de Deepseek

En el lado de DeepSeek, la forma de "exprimir" cambió por completo: no está ocultando capacidad, sino esperando un momento de entrega más adecuado.

1.6T MoE, contexto de 1M, doble especificación Pro/Flash, precio de 3.48 por 1M tokens: una fracción del precio de GPT-5.5, una diferencia de órdenes de magnitud respecto a Opus 4.7. Los evaluadores independientes en el extranjero dieron dos conclusiones: rendimiento cercano pero ligeramente inferior a GPT-5.4 / Gemini 3.1-Pro, precio que "ha destrozado la economía de los laboratorios de vanguardia".

Pero en el propio sistema de coordenadas de DeepSeek, V4 Preview ya es significativamente más caro que el precio "extrañamente barato" de V3. Todos saben: esta no es la versión completa.

La historia completa de DeepSeek V4 no termina con el lanzamiento, y mucho menos comienza con él.

Hay que remontarse al lanzamiento no realizado de R2 en 2025. R2 estaba originalmente programado para mayo de 2025, pero finalmente se pospuso para el otoño/invierno. Toda la infraestructura de Deepseek China migró hacia el ecosistema CANN de Huawei. Para cualquier laboratorio, esto no es una tarea que se complete en un trimestre: compilador, operadores, bibliotecas de comunicación, framework de inferencia, enrutamiento MoE, todo debe reescribirse.

Y esta vez, con V4, es la primera vez que DeepSeek incluye oficialmente a Ascend en la lista de hardware de entrenamiento. V4 es la primera versión de entrenamiento mixto: la primera vez que entra Ascend.

Pero el próximo chip específicamente optimizado para entrenamiento a gran escala, el Ascend 950DT, según la hoja de ruta de Huawei, entrará en producción masiva en el Q4 de 2026. Es decir, que V4 pudo entrenarse utilizando la generación anterior, el 950PR, ensamblado; para que la versión completa V4 Pro Max, con su MoE de 1.6T, pueda entrenarse a fondo y desplegarse a gran escala para inferencia, hay que esperar a que llegue la próxima generación.

La verdadera dificultad de ingeniería no es "si V4 puede entrenarse"—ya se entrenó—sino "cómo hacer que V4 funcione a pleno rendimiento, de forma estable y barata, en Ascend".

El Ascend 950PR entró en producción masiva en el Q1 de 2026, con una potencia FP4 de 1.56 PFLOPS, memoria on-chip de 112GB, especificaciones en papel comparables o superiores a las de Nvidia H20. Pero de que un chip funcione, a que un supernodo completo pueda servir establemente millones de solicitudes de inferencia de tokens por segundo, hay una gran diferencia. La versión completa de V4 Pro Max está ligada a este "supernodo": la versión de clúster a gran escala de la serie Ascend 950, que llegará gradualmente en la segunda mitad de 2026.

Esto constituye una estrategia completamente diferente a la de las dos primeras empresas. La lógica de Anthropic y OpenAI para exprimir la pasta es: tengo algo más fuerte, pero no te lo doy todavía; la lógica de DeepSeek para exprimir la pasta es: mi versión completa espera un momento para que el precio baje otro escalón.

Esta diferencia es importante.

La verdadera ventaja de DeepSeek nunca ha sido "estar a la vanguardia del rendimiento", sino "bajar el precio del token a un nivel que otros no se atreven, bajo la premisa de que el rendimiento es suficiente". V4 Preview se adaptó a las tarjetas de Nvidia y al Ascend 950PR, pero para lograr una inferencia completa a escala de producción masiva, debe esperar a que llegue el supernodo. Una vez que llegue ese momento, sucederán dos cosas simultáneamente: primero, las capacidades de V4 Pro Max podrán liberarse al máximo; segundo, el coste de inferencia y el precio de la API caerán otro escalón. Para una empresa que se abre mercado mediante precios, esto último es más letal que lo primero.

El momento "DeepSeek" que la gente realmente esperaba, que ocurrió a principios de 2025, no se repitió en este lanzamiento. El lanzamiento de V4 Preview es en realidad un avance; el verdadero plato fuerte es el momento "DeepSeek + Huawei Ascend" de la segunda mitad del año.

Desde esta perspectiva, lo que el equipo de Liang Wenfeng está haciendo ahora no es un "ocultamiento" forzado, sino una "elección" comercialmente comedida: elegir entregar el estreno de la versión más fuerte en un escenario donde tiene mayor poder de decisión: el primer día después del despliegue a gran escala del supernodo nacional. Hasta entonces, usarán V4 Preview para consolidar otra vez la narrativa de la relación precio-rendimiento.

Lo que DeepSeek carga nunca ha sido la "narrativa de la tabla larga" de hacer que el modelo grande nacional ocupe el primer lugar en alguna clasificación, sino la "narrativa sistémica" de hacer que funcionen simultáneamente cuatro líneas: chips, entrenamiento, inferencia y precios; esto último es mucho más importante que lo primero.

Hace unos días, Jensen Huang, en el podcast de Dwarkesh Patel, dijo que si DeepSeek se lanzara primero en chips Huawei, "sería un resultado horrible para nuestra nación" ("a horrible outcome for our nation").

Ahora mismo Nvidia aún controla la computación de punta. Pero según el propio "pastel de cinco capas de la IA" que lanzó Jensen Huang—energía, chips, infraestructura, modelos, aplicaciones—la industria de modelos grandes nacionales ya tiene soluciones nacionales viables en cada capa, y la brecha se está reduciendo a un ritmo visible. Completando esta última pieza del rompecabezas, la historia de los modelos grandes de código abierto de DeepSeek es una historia más grande que la de los modelos estadounidenses: es un paso importante para permitir que el mundo alcance una inteligencia accesible sin consumir costos excesivos, una democratización global de la inteligencia.

Permitir que el mundo pueda eludiar el poder computacional avanzado controlado por ciertas hegemonías y entrar en una sociedad inteligente y eficiente.

Epílogo

El "ocultamiento" de Anthropic—es activo. Tienen Mythos, no lo lanzan, citando seguridad.

El "ocultamiento" de OpenAI—es estructural. Tienen el nivel Pro, no te lo dan siempre, citando infraestructura y estratificación de precios.

El "ocultamiento" de DeepSeek—es necesario. Se relaciona con todo un modelo narrativo de transición social hacia la inteligencia.

Pero desde otro ángulo, esto se parece mucho al bosque oscuro descrito por Liu Cixin: en este oscuro bosque de la inteligencia, ningún cazador de élite disparará primero.

Exponerse significa no tener reservas, significa no tener cartas bajo la manga, te conviertes en un blanco vivo para otro cazador.

Nadie sabe quién disparará el tiro más letal primero. Pero lo que es seguro es que cada modelo que uses hoy, no es su verdadera forma.

Preguntas relacionadas

Q¿Qué concepto de 'El Bosque Oscuro' de Liu Cixin se utiliza para describir el comportamiento de los principales laboratorios de IA en 2026?

AEl concepto del 'Bosque Oscuro' describe un escenario en el que cada civilización (o laboratorio de IA) es un cazador armado. Quien se exponga primero, morirá primero. Por eso, todos optan por 'apagar las luces' y ocultar sus capacidades reales para evitar convertirse en el objetivo de los demás.

Q¿Por qué Anthropic admitió que su modelo Claude Opus 4.7 era inferior a Mythos, un modelo no lanzado?

AAnthropic admitió que Opus 4.7 era inferior a Mythos por razones de seguridad ('safety concerns'). Esta fue una retirada estratégica para mantener su capacidad más fuerte en el lado empresarial y no liberarla al público general antes de estar preparados.

Q¿Qué problema de ingeniería causó que los usuarios se quejaran de que Claude 'olvidaba' el contexto de la conversación?

AAnthropic implementó una 'optimización de eficiencia' que borraba los 'reasoning blocks' antiguos si una sesión de Claude Code estaba inactiva durante más de una hora. Esto hacía que el modelo perdiera el contexto de la conversación anterior, dando la impresión de que 'olvidaba' lo que se le había pedido.

Q¿Qué término utilizó OpenAI en su hoja de ruta para 2026 para describir la brecha entre la capacidad real de sus modelos y lo que los usuarios experimentan?

AOpenAI utilizó el término 'capability overhang' (excedente de capacidad) para describir la gran brecha que existe entre la capacidad real de sus modelos de IA y el rendimiento que los usuarios pueden experimentar realmente.

Q¿Por qué la versión completa de DeepSeek V4 Pro Max está condicionada a la producción en masa de los nodos hiperescalables de Ascend 950?

ALa versión completa ('满血版') de DeepSeek V4 Pro Max, un modelo MoE de 1.6T de parámetros, requiere los nodos hiperescalables de la nueva generación de chips Ascend 950 para lograr un rendimiento de inferencia estable y a gran escala a un coste lo suficientemente bajo como para mantener su ventaja de precio disruptivo.

Lecturas Relacionadas

Más de 1.000 millones en criptomonedas liquidados a la fuerza, Bitcoin cae un 6% y rompe la barrera de los 67.000 dólares

El sentimiento en torno al Bitcoin se deterioró bruscamente, desencadenando una oleada de liquidaciones forzosas que superaron los 10 mil millones de dólares en criptomonedas, la presión más severa en meses. El precio de Bitcoin cayó un 6% el martes, perforando el nivel de los 67,000 dólares por primera vez desde el 5 de abril. Este movimiento fue impulsado por el riesgo geopolítico de la situación en Irán y por las ventas reveladas por la principal entidad poseedora, Strategy. Aunque Strategy solo vendió 32 bitcoins (unos 2.5 millones de dólares), rompiendo simbólicamente su larga estrategia de "solo comprar", el evento marcó un punto de inflexión en el ánimo del mercado. Esta presión se vio agravada por las continuas salidas netas de los ETF de Bitcoin en Estados Unidos, que acumulan 11 días consecutivos de desinversiones por unos 3.5 mil millones de dólares, un récord histórico. Los analistas señalan que los dos pilares clave de demanda—los ETF y los grandes poseedores como Strategy—se han convertido simultáneamente en factores de presión a la baja. La resiliencia proporcionada por los avances regulatorios en EE.UU. ha sido anulada por el sentimiento de aversión al riesgo. Bitcoin ha retrocedido casi un 50% desde su máximo histórico de octubre, mientras los mercados bursátiles tradicionales siguen al alza, marcando una clara divergencia.

华尔街日报Hace 1 hora(s)

Más de 1.000 millones en criptomonedas liquidados a la fuerza, Bitcoin cae un 6% y rompe la barrera de los 67.000 dólares

华尔街日报Hace 1 hora(s)

Trading

Spot
Futuros
活动图片