Con la creciente expectativa de una OPI, el ritmo de los productos y modelos de Anthropic también se acelera.
Hace apenas un momento, Anthropic anunció dos noticias de gran relevancia: primero, la actualización de su modelo insignia a Claude Opus 4.8; segundo, la finalización de una ronda de financiación Serie H de 650.000 millones de dólares, alcanzando una valoración post-inversión de 9,65 billones de dólares, acercándose ya a la barrera del billón de dólares.
Para una empresa de IA con una valoración que se aproxima al billón de dólares, el mercado ya no solo busca puntuaciones de rendimiento de modelos, sino que evalúa si puede convertir la inteligencia, las herramientas, los entornos de desarrollo, las plataformas en la nube y los recursos de cómputo en una infraestructura escalable y entregable.
En otras palabras, Anthropic debe pasar de ser una empresa que entrega buenos modelos a una que intenta remodelar las formas de trabajo de IA en las empresas.
Más capacidad sin subir precio: Claude Opus 4.8 hace su aparición oficial
El lanzamiento de Claude Opus 4.8 representa una actualización de la serie insignia Opus de Anthropic. Con este ritmo actual de lanzamiento de modelos, como bromean los internautas, es muy probable que veamos Claude Opus 6 incluso antes del lanzamiento de GTA 6 (si no se retrasa, en noviembre).
Anthropic afirma que Opus 4.8 se basa en Opus 4.7, mejorando en codificación, tareas de agentes, razonamiento y trabajo de conocimiento, y ya está disponible para los usuarios, manteniendo el precio estándar sin cambios: 5 dólares por millón de tokens de entrada y 25 dólares por millón de tokens de salida.
Los desarrolladores también pueden utilizar claude-opus-4-8 a través de la API de Claude.
Comparativa de precios de API https://platform.claude.com/docs/en/about-claude/models/overview
Según la información oficial, las mejoras de Opus 4.8 cubren codificación, capacidades de agentes, razonamiento y tareas prácticas de trabajo de conocimiento.
Anthropic utilizó una tabla comparativa en el material de lanzamiento para mostrar el rendimiento de Opus 4.8 frente a su predecesor Opus 4.7 y otros modelos en diversas pruebas. Sin embargo, más allá de la calidad de respuesta individual, el foco de la actualización del modelo sigue estando en su desempeño en tareas largas y colaboraciones complejas.
En flujos de trabajo reales, los modelos a menudo necesitan procesar múltiples pasos de tareas de forma continua, invocar herramientas, verificar resultados intermedios y continuar avanzando según la retroalimentación. Anthropic indica que los primeros evaluadores consideran que Opus 4.8 es más confiable y toma decisiones más claras al ejecutar tareas de agentes.
La mejora en la honestidad de Opus 4.8 es un punto destacado.
Un problema común en los modelos de IA es realizar juicios prematuros con excesiva confianza cuando la evidencia es insuficiente, afirmando que ya han logrado avances. Anthropic afirma que Opus 4.8 está más dispuesto a explicar las incertidumbres en su trabajo y es menos propenso a hacer afirmaciones sin sustento.
Las tareas de codificación ejemplifican especialmente este cambio.
Las evaluaciones internas muestran que la probabilidad de que Opus 4.8 deje pasar defectos en su propio código sin mencionarlos es aproximadamente una cuarta parte de la de su predecesor. Es decir, el nuevo modelo es más propenso a alertar a los usuarios cuando detecta riesgos, en lugar de dejar los problemas para pruebas posteriores o entornos de producción.
En cuanto a alineación y seguridad, Anthropic mantiene su narrativa central. Opus 4.8 muestra una tasa significativamente menor de comportamientos desalineados, como engaño o facilitación de abusos, en comparación con Opus 4.7, acercándose a uno de los modelos con mejor alineación actual, Claude Mythos Preview.
Seguridad, fiabilidad y controlabilidad siguen siendo las palabras clave que Anthropic utiliza para diferenciarse. A medida que Claude se integra más profundamente en los procesos empresariales, estas palabras clave también comienzan a adquirir un mayor significado comercial.
Sin embargo, algo curioso ocurrió tras el lanzamiento de Opus 4.8: los internautas notaron algo extraño.
https://x.com/realNyarime/status/2060059543820963975
Muchos usuarios descubrieron en sus pruebas que, al presionar a Opus 4.8 sobre su identidad de modelo, no siempre respondía siendo Claude.
A veces se identificaba como Qwen, otras veces mencionaba el nombre DeepSeek, lo que sugiere un posible comportamiento de destilación.
Sin embargo, cuando los usuarios plantean la misma pregunta en el cliente oficial de Claude, estas respuestas suelen ser menos reproducibles. La razón probablemente radica en que las indicaciones del sistema y las restricciones a nivel de producto en el cliente son más completas.
Lanzamiento de flujos de trabajo dinámicos, Claude Code avanza hacia la colaboración multi-agente
Junto con Claude Opus 4.8, también se lanzaron varias funciones de producto y para desarrolladores.
Entre ellas, la que afecta más directamente la experiencia del usuario de Claude es el "effort control", o control de intensidad de razonamiento.
Este control se encuentra junto al selector de modelos y, como su nombre indica, permite al usuario decidir cuánta capacidad de cómputo de razonamiento invierte Claude en una tarea. Con una intensidad más alta, Claude realiza más razonamiento, obteniendo una mejor calidad de respuesta; con una intensidad más baja, Claude responde más rápido y consume su cuota de uso más lentamente.
Anthropic indica que Opus 4.8 utiliza por defecto "high effort". Los usuarios también pueden elegir "extra" (que en Claude Code corresponde a "xhigh") o "max", haciendo que el modelo invierta más tokens. Anthropic sugiere que las tareas difíciles y los flujos de trabajo asíncronos de larga duración son más adecuados para usar "extra".
Lo que realmente influye en la forma del producto Claude Code son los "dynamic workflows".
Esta función se encuentra actualmente en fase de "research preview" y su objetivo es permitir que Claude Code maneje tareas a gran escala que antes requerían ciclos de ingeniería más largos. Trabajos que antes se planificaban por trimestres ahora tienen la posibilidad de completarse en pocos días.
El mecanismo central de los "dynamic workflows" es que Claude escribe dinámicamente "orchestration scripts" según la tarea del usuario y ejecuta docenas o cientos de "subagents" en paralelo dentro de una sola sesión. El modelo primero planifica la tarea, la asigna a múltiples subagents, luego verifica los resultados devueltos y finalmente informa al usuario. Con el lanzamiento de Opus 4.8, estos agentes también pueden ejecutarse durante más tiempo.
Esta función está dirigida principalmente a bases de código complejas, extensas o con mucha deuda técnica. Los escenarios típicos incluyen búsqueda de errores en todo un servicio, auditorías de optimización de rendimiento, auditorías de seguridad, migración de grandes bases de código, reemplazo de frameworks, migración por obsolescencia de APIs, portabilidad de lenguaje y verificación de soluciones críticas desde múltiples ángulos.
En cuanto al modo de uso, Anthropic recomienda activar el "auto mode" en los "dynamic workflows". Los usuarios pueden pedir directamente a Claude que cree un workflow, o abrir "ultracode" en Claude Code. "Ultracode" establecerá la intensidad de razonamiento en "xhigh" y permitirá a Claude decidir automáticamente si la tarea actual es adecuada para usar un workflow.
Los "dynamic workflows" ya están disponibles en Claude Code CLI, Desktop y la extensión de VS Code, para los planes Max, Team y Enterprise. Para Enterprise, está desactivado por defecto al lanzarse; el administrador debe habilitarlo en la configuración de Claude Code.
Esta función también se puede utilizar a través de Claude API, Amazon Bedrock, Vertex AI y Microsoft Foundry. Para usuarios Max y Team, y para quienes usen Claude Code a través de API, los "dynamic workflows" están habilitados por defecto.
Anthropic utilizó el caso de migración de Bun para mostrar el potencial máximo de los "dynamic workflows". Jarred Sumner usó esta función para portar Bun de Zig a Rust, generando finalmente alrededor de 750.000 líneas de código Rust, con una tasa de aprobación del 99.8% en el conjunto de pruebas existente, tomando aproximadamente 11 días desde el primer commit hasta la fusión.
Todo el proceso de migración se realizó mediante múltiples workflows: primero, mapeando los campos de las estructuras (struct) en la base de código Zig a los "lifetimes" de Rust; luego, generando archivos .rs consistentes en comportamiento para cada archivo .zig, con cientos de agentes trabajando en paralelo, cada archivo revisado por dos revisores. Posteriormente, un "fix loop" ejecutaba continuamente la compilación y el conjunto de pruebas hasta que pasaban. Después de la migración, un "overnight workflow" procesaba copias de datos innecesarias y abría PRs para cada tipo de problema, para la revisión final.
Además de Claude Code, Anthropic también actualizó la Messages API. Ahora, la Messages API puede aceptar "system entries" dentro del array de mensajes.
Los desarrolladores pueden actualizar las instrucciones de Claude durante la ejecución de una tarea, sin romper la caché del prompt y sin necesidad de pasar la actualización a través de un turno de usuario. Esta capacidad puede usarse para actualizar permisos, presupuesto de tokens o contexto ambiental en tiempo de ejecución de un agente.
Como siguiente paso, Anthropic también planea lanzar una nueva categoría de modelos con un nivel de inteligencia superior al de Opus. Sí, se trata del impresionantemente poderoso Claude Mythos Preview, esperando poder ofrecer los "Mythos class models" a todos los clientes en las próximas semanas.
Para entonces, también podremos probarlo de primera mano.
Tras una valoración cercana al billón de dólares, Claude necesita una base de cómputo más grande
La otra noticia publicada el mismo día que Claude Opus 4.8 es que Anthropic ha completado una ronda de financiación Serie H de 650.000 millones de dólares. Esta ronda fue liderada por Altimeter Capital, Dragoneer, Greenoaks y Sequoia Capital, alcanzando una valoración post-inversión de 9,65 billones de dólares.
Esta ronda de financiación también incluye compromisos de inversión previos de "hyperscalers" por 150.000 millones de dólares, que incluyen 50.000 millones de Amazon. Socios estratégicos de infraestructura como Micron, Samsung y SK hynix también se han unido. Anthropic afirma que estas empresas desempeñan un papel clave en el suministro global de chips de memoria, almacenamiento y lógica, lo que puede ayudar a expandir su capacidad de cómputo a medida que crece la demanda de Claude.
La expansión de la capacidad de cómputo es el trasfondo clave de esta ronda de financiación. Anthropic reveló varios acuerdos de infraestructura: un acuerdo con Amazon para obtener hasta 5 gigavatios (GW) de nueva capacidad; acuerdos con Google y Broadcom para obtener 5 GW de capacidad de TPU de próxima generación; y un acuerdo con SpaceX para utilizar capacidad de GPU en Colossus 1 y Colossus 2.
Anthropic también destaca que Claude es el primer modelo de vanguardia en ingresar simultáneamente en las tres principales plataformas en la nube: AWS, Google Cloud y Microsoft Azure. Sin embargo, AWS sigue siendo el principal proveedor de servicios en la nube y socio de entrenamiento de Anthropic.
Detrás de la financiación hay un cambio en el posicionamiento comercial de Anthropic. Las primeras empresas de modelos grandes competían por la capacidad del modelo y la experiencia de chat general, pero ahora los clientes empresariales se preocupan más por si la IA puede integrarse en los procesos centrales, manejar tareas complejas y conectarse a entornos de desarrollo, plataformas en la nube y sistemas internos.
Claude Code, Cowork, effort control, dynamic workflows y la actualización de Messages API se desarrollan en torno a esta dirección.
Al ver conjuntamente el lanzamiento de productos y la financiación, Anthropic está expandiendo simultáneamente tres tipos de capacidades.
La primera es la capacidad del modelo: Opus 4.8 mejora el rendimiento en codificación, razonamiento, tareas de agentes y trabajo de conocimiento, y fortalece la expresión de incertidumbre.
La segunda es la capacidad de flujo de trabajo: Los "dynamic workflows" permiten que Claude Code pase de ser una asistencia de código puntual a una ejecución y revisión de ingeniería más compleja.
La tercera es la capacidad de infraestructura: Los 650.000 millones de dólares de financiación, las inversiones comprometidas de los grandes proveedores en la nube, la incorporación de socios de memoria y chips, y los acuerdos de capacidad de cómputo con Amazon, Google, Broadcom y SpaceX proporcionan recursos para las futuras necesidades de entrenamiento e inferencia de modelos.
Esta es también la lógica central detrás de la valoración de Anthropic, que se acerca al billón de dólares. Claude ya no es solo una ventana de chat de IA, sino que se está convirtiendo en un sistema de trabajo que conecta modelos, código, procesos empresariales, plataformas en la nube e infraestructura de cómputo.
Opus 4.8 es la última base de modelo en este sistema, los "dynamic workflows" son la forma del producto orientada a tareas de ingeniería complejas, y los 650.000 millones de dólares de financiación y la expansión de la capacidad de cómputo son las condiciones previas para seguir llevando este sistema a clientes a mayor escala.
La marea de la IA ha llevado a Anthropic a la cresta de la ola. Desde esta altura, avanzar es navegar con el viento; retroceder es hundirse. No hay una tercera postura.
Este artículo proviene de la cuenta oficial de WeChat "APPSO", autor: APPSO que descubre los productos del mañana.
























