Claude Opus 4.8 acaba de lanzarse y ya dice ser DeepSeek, Qwen

marsbitPublicado a 2026-05-29Actualizado a 2026-05-29

Resumen

Acompañando las expectativas de su OPI, Anthropic ha acelerado el ritmo de lanzamiento de modelos. Recientemente, anunció dos noticias importantes: la actualización de su modelo insignia a Claude Opus 4.8 y la finalización de una ronda de financiación Serie H de 650.000 millones de dólares, con una valoración posterior a la inversión de 9,65 billones, acercándose al umbral del billón. Claude Opus 4.8 presenta mejoras en codificación, tareas de agente, razonamiento y trabajo con conocimiento, manteniendo los mismos precios. Los usuarios notaron que, en algunas pruebas sin restricciones estrictas del sistema, el modelo ocasionalmente se identificaba erróneamente como DeepSeek o Qwen, lo que sugiere un posible comportamiento de destilación. Junto con el modelo, se lanzaron nuevas funciones como el control de esfuerzo (effort control) y los flujos de trabajo dinámicos (dynamic workflows). Esta última función, en vista previa de investigación, permite a Claude Code manejar tareas complejas a gran escala mediante la orquestación de múltiples subagentes que trabajan en paralelo, mostrando potencial para migraciones masivas de código. La ronda de financiación de 650.000 millones incluye compromisos de hyperscalers y socios de infraestructura estratégica como Micron y Samsung. Anthropic también ha firmado acuerdos clave para ampliar su capacidad de cálculo con Amazon, Google, Broadcom y SpaceX. En conjunto, estos movimientos reflejan la evolución de Anthropic desde una empresa cen...

Con la creciente expectativa de una OPI, el ritmo de los productos y modelos de Anthropic también se acelera.

Hace apenas un momento, Anthropic anunció dos noticias de gran relevancia: primero, la actualización de su modelo insignia a Claude Opus 4.8; segundo, la finalización de una ronda de financiación Serie H de 650.000 millones de dólares, alcanzando una valoración post-inversión de 9,65 billones de dólares, acercándose ya a la barrera del billón de dólares.

Para una empresa de IA con una valoración que se aproxima al billón de dólares, el mercado ya no solo busca puntuaciones de rendimiento de modelos, sino que evalúa si puede convertir la inteligencia, las herramientas, los entornos de desarrollo, las plataformas en la nube y los recursos de cómputo en una infraestructura escalable y entregable.

En otras palabras, Anthropic debe pasar de ser una empresa que entrega buenos modelos a una que intenta remodelar las formas de trabajo de IA en las empresas.

Más capacidad sin subir precio: Claude Opus 4.8 hace su aparición oficial

El lanzamiento de Claude Opus 4.8 representa una actualización de la serie insignia Opus de Anthropic. Con este ritmo actual de lanzamiento de modelos, como bromean los internautas, es muy probable que veamos Claude Opus 6 incluso antes del lanzamiento de GTA 6 (si no se retrasa, en noviembre).

Anthropic afirma que Opus 4.8 se basa en Opus 4.7, mejorando en codificación, tareas de agentes, razonamiento y trabajo de conocimiento, y ya está disponible para los usuarios, manteniendo el precio estándar sin cambios: 5 dólares por millón de tokens de entrada y 25 dólares por millón de tokens de salida.

Los desarrolladores también pueden utilizar claude-opus-4-8 a través de la API de Claude.

Comparativa de precios de API https://platform.claude.com/docs/en/about-claude/models/overview

Según la información oficial, las mejoras de Opus 4.8 cubren codificación, capacidades de agentes, razonamiento y tareas prácticas de trabajo de conocimiento.

Anthropic utilizó una tabla comparativa en el material de lanzamiento para mostrar el rendimiento de Opus 4.8 frente a su predecesor Opus 4.7 y otros modelos en diversas pruebas. Sin embargo, más allá de la calidad de respuesta individual, el foco de la actualización del modelo sigue estando en su desempeño en tareas largas y colaboraciones complejas.

En flujos de trabajo reales, los modelos a menudo necesitan procesar múltiples pasos de tareas de forma continua, invocar herramientas, verificar resultados intermedios y continuar avanzando según la retroalimentación. Anthropic indica que los primeros evaluadores consideran que Opus 4.8 es más confiable y toma decisiones más claras al ejecutar tareas de agentes.

La mejora en la honestidad de Opus 4.8 es un punto destacado.

Un problema común en los modelos de IA es realizar juicios prematuros con excesiva confianza cuando la evidencia es insuficiente, afirmando que ya han logrado avances. Anthropic afirma que Opus 4.8 está más dispuesto a explicar las incertidumbres en su trabajo y es menos propenso a hacer afirmaciones sin sustento.

Las tareas de codificación ejemplifican especialmente este cambio.

Las evaluaciones internas muestran que la probabilidad de que Opus 4.8 deje pasar defectos en su propio código sin mencionarlos es aproximadamente una cuarta parte de la de su predecesor. Es decir, el nuevo modelo es más propenso a alertar a los usuarios cuando detecta riesgos, en lugar de dejar los problemas para pruebas posteriores o entornos de producción.

En cuanto a alineación y seguridad, Anthropic mantiene su narrativa central. Opus 4.8 muestra una tasa significativamente menor de comportamientos desalineados, como engaño o facilitación de abusos, en comparación con Opus 4.7, acercándose a uno de los modelos con mejor alineación actual, Claude Mythos Preview.

Seguridad, fiabilidad y controlabilidad siguen siendo las palabras clave que Anthropic utiliza para diferenciarse. A medida que Claude se integra más profundamente en los procesos empresariales, estas palabras clave también comienzan a adquirir un mayor significado comercial.

Sin embargo, algo curioso ocurrió tras el lanzamiento de Opus 4.8: los internautas notaron algo extraño.

https://x.com/realNyarime/status/2060059543820963975

Muchos usuarios descubrieron en sus pruebas que, al presionar a Opus 4.8 sobre su identidad de modelo, no siempre respondía siendo Claude.

A veces se identificaba como Qwen, otras veces mencionaba el nombre DeepSeek, lo que sugiere un posible comportamiento de destilación.

Sin embargo, cuando los usuarios plantean la misma pregunta en el cliente oficial de Claude, estas respuestas suelen ser menos reproducibles. La razón probablemente radica en que las indicaciones del sistema y las restricciones a nivel de producto en el cliente son más completas.

Lanzamiento de flujos de trabajo dinámicos, Claude Code avanza hacia la colaboración multi-agente

Junto con Claude Opus 4.8, también se lanzaron varias funciones de producto y para desarrolladores.

Entre ellas, la que afecta más directamente la experiencia del usuario de Claude es el "effort control", o control de intensidad de razonamiento.

Este control se encuentra junto al selector de modelos y, como su nombre indica, permite al usuario decidir cuánta capacidad de cómputo de razonamiento invierte Claude en una tarea. Con una intensidad más alta, Claude realiza más razonamiento, obteniendo una mejor calidad de respuesta; con una intensidad más baja, Claude responde más rápido y consume su cuota de uso más lentamente.

Anthropic indica que Opus 4.8 utiliza por defecto "high effort". Los usuarios también pueden elegir "extra" (que en Claude Code corresponde a "xhigh") o "max", haciendo que el modelo invierta más tokens. Anthropic sugiere que las tareas difíciles y los flujos de trabajo asíncronos de larga duración son más adecuados para usar "extra".

Lo que realmente influye en la forma del producto Claude Code son los "dynamic workflows".

Esta función se encuentra actualmente en fase de "research preview" y su objetivo es permitir que Claude Code maneje tareas a gran escala que antes requerían ciclos de ingeniería más largos. Trabajos que antes se planificaban por trimestres ahora tienen la posibilidad de completarse en pocos días.

El mecanismo central de los "dynamic workflows" es que Claude escribe dinámicamente "orchestration scripts" según la tarea del usuario y ejecuta docenas o cientos de "subagents" en paralelo dentro de una sola sesión. El modelo primero planifica la tarea, la asigna a múltiples subagents, luego verifica los resultados devueltos y finalmente informa al usuario. Con el lanzamiento de Opus 4.8, estos agentes también pueden ejecutarse durante más tiempo.

Esta función está dirigida principalmente a bases de código complejas, extensas o con mucha deuda técnica. Los escenarios típicos incluyen búsqueda de errores en todo un servicio, auditorías de optimización de rendimiento, auditorías de seguridad, migración de grandes bases de código, reemplazo de frameworks, migración por obsolescencia de APIs, portabilidad de lenguaje y verificación de soluciones críticas desde múltiples ángulos.

En cuanto al modo de uso, Anthropic recomienda activar el "auto mode" en los "dynamic workflows". Los usuarios pueden pedir directamente a Claude que cree un workflow, o abrir "ultracode" en Claude Code. "Ultracode" establecerá la intensidad de razonamiento en "xhigh" y permitirá a Claude decidir automáticamente si la tarea actual es adecuada para usar un workflow.

Los "dynamic workflows" ya están disponibles en Claude Code CLI, Desktop y la extensión de VS Code, para los planes Max, Team y Enterprise. Para Enterprise, está desactivado por defecto al lanzarse; el administrador debe habilitarlo en la configuración de Claude Code.

Esta función también se puede utilizar a través de Claude API, Amazon Bedrock, Vertex AI y Microsoft Foundry. Para usuarios Max y Team, y para quienes usen Claude Code a través de API, los "dynamic workflows" están habilitados por defecto.

Anthropic utilizó el caso de migración de Bun para mostrar el potencial máximo de los "dynamic workflows". Jarred Sumner usó esta función para portar Bun de Zig a Rust, generando finalmente alrededor de 750.000 líneas de código Rust, con una tasa de aprobación del 99.8% en el conjunto de pruebas existente, tomando aproximadamente 11 días desde el primer commit hasta la fusión.

Todo el proceso de migración se realizó mediante múltiples workflows: primero, mapeando los campos de las estructuras (struct) en la base de código Zig a los "lifetimes" de Rust; luego, generando archivos .rs consistentes en comportamiento para cada archivo .zig, con cientos de agentes trabajando en paralelo, cada archivo revisado por dos revisores. Posteriormente, un "fix loop" ejecutaba continuamente la compilación y el conjunto de pruebas hasta que pasaban. Después de la migración, un "overnight workflow" procesaba copias de datos innecesarias y abría PRs para cada tipo de problema, para la revisión final.

Además de Claude Code, Anthropic también actualizó la Messages API. Ahora, la Messages API puede aceptar "system entries" dentro del array de mensajes.

Los desarrolladores pueden actualizar las instrucciones de Claude durante la ejecución de una tarea, sin romper la caché del prompt y sin necesidad de pasar la actualización a través de un turno de usuario. Esta capacidad puede usarse para actualizar permisos, presupuesto de tokens o contexto ambiental en tiempo de ejecución de un agente.

Como siguiente paso, Anthropic también planea lanzar una nueva categoría de modelos con un nivel de inteligencia superior al de Opus. Sí, se trata del impresionantemente poderoso Claude Mythos Preview, esperando poder ofrecer los "Mythos class models" a todos los clientes en las próximas semanas.

Para entonces, también podremos probarlo de primera mano.

Tras una valoración cercana al billón de dólares, Claude necesita una base de cómputo más grande

La otra noticia publicada el mismo día que Claude Opus 4.8 es que Anthropic ha completado una ronda de financiación Serie H de 650.000 millones de dólares. Esta ronda fue liderada por Altimeter Capital, Dragoneer, Greenoaks y Sequoia Capital, alcanzando una valoración post-inversión de 9,65 billones de dólares.

Esta ronda de financiación también incluye compromisos de inversión previos de "hyperscalers" por 150.000 millones de dólares, que incluyen 50.000 millones de Amazon. Socios estratégicos de infraestructura como Micron, Samsung y SK hynix también se han unido. Anthropic afirma que estas empresas desempeñan un papel clave en el suministro global de chips de memoria, almacenamiento y lógica, lo que puede ayudar a expandir su capacidad de cómputo a medida que crece la demanda de Claude.

La expansión de la capacidad de cómputo es el trasfondo clave de esta ronda de financiación. Anthropic reveló varios acuerdos de infraestructura: un acuerdo con Amazon para obtener hasta 5 gigavatios (GW) de nueva capacidad; acuerdos con Google y Broadcom para obtener 5 GW de capacidad de TPU de próxima generación; y un acuerdo con SpaceX para utilizar capacidad de GPU en Colossus 1 y Colossus 2.

Anthropic también destaca que Claude es el primer modelo de vanguardia en ingresar simultáneamente en las tres principales plataformas en la nube: AWS, Google Cloud y Microsoft Azure. Sin embargo, AWS sigue siendo el principal proveedor de servicios en la nube y socio de entrenamiento de Anthropic.

Detrás de la financiación hay un cambio en el posicionamiento comercial de Anthropic. Las primeras empresas de modelos grandes competían por la capacidad del modelo y la experiencia de chat general, pero ahora los clientes empresariales se preocupan más por si la IA puede integrarse en los procesos centrales, manejar tareas complejas y conectarse a entornos de desarrollo, plataformas en la nube y sistemas internos.

Claude Code, Cowork, effort control, dynamic workflows y la actualización de Messages API se desarrollan en torno a esta dirección.

Al ver conjuntamente el lanzamiento de productos y la financiación, Anthropic está expandiendo simultáneamente tres tipos de capacidades.

La primera es la capacidad del modelo: Opus 4.8 mejora el rendimiento en codificación, razonamiento, tareas de agentes y trabajo de conocimiento, y fortalece la expresión de incertidumbre.

La segunda es la capacidad de flujo de trabajo: Los "dynamic workflows" permiten que Claude Code pase de ser una asistencia de código puntual a una ejecución y revisión de ingeniería más compleja.

La tercera es la capacidad de infraestructura: Los 650.000 millones de dólares de financiación, las inversiones comprometidas de los grandes proveedores en la nube, la incorporación de socios de memoria y chips, y los acuerdos de capacidad de cómputo con Amazon, Google, Broadcom y SpaceX proporcionan recursos para las futuras necesidades de entrenamiento e inferencia de modelos.

Esta es también la lógica central detrás de la valoración de Anthropic, que se acerca al billón de dólares. Claude ya no es solo una ventana de chat de IA, sino que se está convirtiendo en un sistema de trabajo que conecta modelos, código, procesos empresariales, plataformas en la nube e infraestructura de cómputo.

Opus 4.8 es la última base de modelo en este sistema, los "dynamic workflows" son la forma del producto orientada a tareas de ingeniería complejas, y los 650.000 millones de dólares de financiación y la expansión de la capacidad de cómputo son las condiciones previas para seguir llevando este sistema a clientes a mayor escala.

La marea de la IA ha llevado a Anthropic a la cresta de la ola. Desde esta altura, avanzar es navegar con el viento; retroceder es hundirse. No hay una tercera postura.

Este artículo proviene de la cuenta oficial de WeChat "APPSO", autor: APPSO que descubre los productos del mañana.

Preguntas relacionadas

Q¿Cuáles son las principales mejoras de Claude Opus 4.8 en comparación con su versión anterior?

AClaude Opus 4.8 presenta mejoras en codificación, tareas de agente, razonamiento y trabajo de conocimiento. Es más confiable en tareas de agente, expresa mejor la incertidumbre y es más honesto, reduciendo en un 75% la probabilidad de pasar defectos de código sin notificar en comparación con Opus 4.7. También muestra una menor incidencia de comportamientos desalineados como el engaño.

Q¿Qué función nueva de producto se introdujo junto con Claude Opus 4.8 y cuál es su objetivo principal?

ASe introdujo 'dynamic workflows' (flujos de trabajo dinámicos) en Claude Code. Su objetivo principal es permitir que Claude Code maneje tareas a gran escala y complejas que antes requerían ciclos de ingeniería más largos, como auditorías de seguridad, migraciones de código grandes o reemplazos de frameworks, mediante la creación de scripts de orquestación y el uso de múltiples subagentes en paralelo.

Q¿Qué detalle peculiar descubrieron los usuarios al probar Claude Opus 4.8 respecto a su identidad?

ALos usuarios descubrieron que, en algunas pruebas, cuando se le preguntaba a Claude Opus 4.8 sobre su identidad de modelo, en ocasiones no se identificaba como 'Claude', sino que mencionaba ser 'Qwen' o 'DeepSeek'. Esto sugirió un posible comportamiento de destilación de modelos. Sin embargo, este fenómeno era menos frecuente en el cliente oficial de Claude, probablemente debido a indicaciones de sistema más completas.

Q¿Cuál fue el monto y la valoración posterior a la inversión de la ronda de financiación Serie H de Anthropic anunciada junto con el lanzamiento del modelo?

AAnthropic completó una ronda de financiación Serie H de 65 mil millones de dólares, con una valoración posterior a la inversión de 965 mil millones de dólares, acercándose así al umbral del billón de dólares.

Q¿Qué acuerdos de infraestructura clave menciona Anthropic para respaldar la expansión de su capacidad de computación?

AAnthropic menciona acuerdos con Amazon para obtener hasta 5 GW de nueva capacidad, con Google y Broadcom para 5 GW de capacidad de TPU de próxima generación, y con SpaceX para utilizar capacidad de GPU en Colossus 1 y Colossus 2. Además, cuenta con el apoyo de socios de infraestructura estratégica como Micron, Samsung y SK hynix para memoria y chips.

Lecturas Relacionadas

Trading

Spot
Futuros
活动图片