Todos deberían recordar que en abril, Anthropic lanzó un modelo llamado Mythos.
Por el nombre ya se sabe lo impresionante que es, "Mito".
En aquel momento, según se dice, encontró más de diez mil vulnerabilidades de alto riesgo para 50 clientes empresariales, conmocionando a toda la industria.
Esta noticia causó una caída generalizada en las acciones de ciberseguridad, todos deberían tenerlo presente.
Por ser demasiado poderoso y por temor a su mal uso, "demasiado peligroso para ser público", no se abrió al público.
Hasta anoche, Anthropic añadió un clasificador de seguridad al modelo Mythos y lanzó oficialmente Fable 5.
En cuanto al Mythos 5 sin restricciones, actualmente solo está disponible para aproximadamente 200 instituciones que han pasado una estricta revisión, como la Casa Blanca, defensores de ciberseguridad y el Proyecto Mariposa Alas de Cristal.
Tanta precaución hace inevitable pensar en la reciente y popular serie de animación de IA "Motor del Ángel".
¿Es ese "ángel" el que está encerrado en la jaula?
Aunque ahora no lo sea, no falta mucho.
01
Según los datos de prueba publicados oficialmente por Anthropic y los informes de pruebas reales proporcionados por los primeros socios empresariales, la potencia del Fable 5 puede describirse como asombrosa.
Primero, veamos los resultados de las pruebas.
En el ranking de evaluación de programación automática SWE-Bench Pro, Claude Fable 5 tiene una tasa de éxito del 80.3%, su "madre" Opus 4.8 del 69.2%; GPT-5.5 del 58.6%; y Gemini 3.1 Pro solo del 54.2%.
En evaluación de código de vanguardia, Fable 5 alcanza el 29.3%, Opus 4.8 el 13.4%; GPT-5.5 apenas el 5.7%.
......
La diferencia entre ellos es como si, en la era de las armas blancas, alguien sacara de repente una ametralladora.
En todas las demás pruebas: ingeniería de software, formulación de hipótesis de investigación independiente, diseño de moléculas farmacéuticas, destilación y compresión extrema de modelos, comprensión de contexto largo, etc., etc., en casi todas las pruebas, Fable 5 es el primero.
Los detalles específicos los pueden buscar en videos.
Ahora, veamos su desempeño en casos prácticos.
El gigante de pagos Stripe realizó una prueba temprana con Fable 5. Tenían una base de código heredada de 50 millones de líneas que necesitaba una migración completa. Según las estimaciones, una refactorización de esta escala, incluso confiada a un equipo profesional, tomaría al menos dos meses.
Resultado: después de asignar la tarea a Fable 5, este planificó todo por sí mismo, verificó su progreso y corrigió errores por sí mismo. En solo un día, completó la migración de los 50 millones de líneas de código.
Este desempeño no puede describirse simplemente con la palabra "potente".
Desde una perspectiva estrecha, Fable 5 ya ha logrado una AGI a nivel de economía digital.
La razón es que ha demostrado una verdadera "capacidad de agente de largo alcance".
Tanto GPT-5.5 como Gemini 3.5, sin mencionar otros modelos grandes inferiores, son esencialmente "respondedores".
Les das un empujón, dan un paso.
Si encuentran un callejón sin salida, solo pueden lanzar una excepción, quejándose diciendo "Lo siento, solo soy un modelo de lenguaje".
Se dice que son herramientas, pero en realidad los usuarios todavía necesitan pensar profundamente, guiando paso a paso a la IA para obtener los resultados deseados, lo cual no es fácil.
El Fable 5, que posee una lógica de orientación a objetivos internalizada, es diferente.
Como en la prueba de Stripe, cuando el usuario le asigna una tarea compleja y de largo plazo, sigue tres pasos:
Establecer un árbol de subtareas;
Coordinar diferentes herramientas (búsqueda web, extracción de bases de datos, entorno sandbox de Python);
Autorreflexión, si encuentra que algo no funciona, inmediatamente busca otro camino.
La persona, aparte de plantear la tarea y recibir los resultados, ya no necesita estar señalando y dirigiendo al lado.
Como herramienta de productividad, esto ya es casi perfecto.
Pero sigue siendo algo completamente diferente a una AGI real.
La potencia del Fable 5 se basa en que las bases de código, literatura científica, etc., en las que opera todavía tienen una lógica matemática subyacente y una estructura definida.
La razón por la que no se pierde en tareas de ciclo largo es porque superó el problema de la "degradación de la atención en textos largos", pudiendo mantener siempre la alineación con el objetivo central al procesar tareas complejas de millones de tokens.
Pero si se le arroja al caótico y desordenado fango de la sociedad física real, que carece de reglas digitales y que ni siquiera los humanos comprenden por completo, aún sufrirá una ruptura lógica debido a la "falta de base".
Si lo medimos según los "cinco niveles de inteligencia artificial" propuestos por OpenAI (Nivel 1: Chatbot; Nivel 2: Razonador; Nivel 3: Agente; Nivel 4: Innovador; Nivel 5: Organizador).
Opus 4.8 está avanzando del nivel 2 al 3, mientras que Fable 5 se ha estabilizado firmemente en el nivel 3 y explora hacia el nivel 4.
Y pasar de Opus 4.7 a 4.8 tomó 43 días, mientras que de 4.8 a Fable 5 solo tomó 11 días.
¿Cuánto tiempo tomará estabilizarse en el nivel 4? Según el ritmo cada vez más rápido de actualizaciones de Anthropic, es muy probable que se logre dentro de este año.
Incluso el nivel final 5, estimado con optimismo, solo tomaría de 18 a 24 meses, está verdaderamente a solo un paso de distancia.
Esta velocidad es demasiado rápida, y esa es la razón principal por la que se le deben agregar restricciones de seguridad.
02
En el "System Card" y el informe de evaluación RSP publicados por Anthropic junto con el modelo, Mythos 5 mostró señales extremadamente peligrosas en dos capacidades.
En primer lugar, el modelo subyacente Fable/Mythos ya ha alcanzado el nivel CB-1 en evaluaciones de química y biología.
Esto significa que el modelo posee la capacidad integral de "sintetizar y guiar la fabricación de armas biológicas/químicas no novedosas", incluso puede dar sugerencias para modificar secuencias genéticas que optimicen la eficiencia de propagación de cierto virus altamente peligroso.
Si un terrorista con conocimientos básicos de biología a nivel universitario obtuviera el Mythos 5 sin restricciones, podría, mediante la constante interacción con el modelo, obtener una guía completa sobre cómo evadir la regulación de materias primas, cómo construir un laboratorio P3 simple en un sótano y cómo sintetizar patógenos de alta letalidad.
En segundo lugar, ataques cibernéticos y explotación de vulnerabilidades.
En pruebas muy tempranas, Mythos 5 demostró la capacidad de buscar de forma autónoma y explotar vulnerabilidades críticas en infraestructuras clave (como plantas de energía, sistemas de liquidación financiera, redes hospitalarias), generando en segundos scripts de ataque de vulnerabilidades de día cero específicos.
Cuando se desarrolló por primera vez el Mythos en abril de este año, hubo informes que decían que había encontrado más de diez mil vulnerabilidades de alto nivel para 50 socios iniciales.
......
Ante estos dos escenarios, lanzar directamente Mythos 5 al público general es demasiado peligroso.
Esta bestia feroz debe ser encerrada en una jaula.
Después de dos meses, la jaula construida por Anthropic tiene dos capas.
Primera, mecanismo de enrutamiento silencioso con degradación.
Anthropic desplegó en el front-end de Fable 5 un clasificador de IA completamente independiente, de alta precisión y extremadamente sensible.
Cuando un usuario ingresa una indicación compleja que posiblemente involucre ciberataques, bioquímica o intentos de extraer ponderaciones del modelo, el clasificador activa inmediatamente una alarma y, de forma silenciosa en segundo plano, redirige la sesión al modelo anterior Opus 4.8 para que responda.
Segunda, retención de datos.
Anthropic y Amazon anunciaron conjuntamente anoche: en todas las plataformas, ya sean propias o de terceros, todo el tráfico que invoque el modelo Mythos debe tener una retención de datos obligatoria de 30 días.
¿Por qué?
Porque los verdaderos hackers o terroristas suelen tener un coeficiente intelectual alto, no preguntarán directamente "cómo hacer una bomba" en una conversación, sino que descompondrán el problema en 100 preguntas básicas aparentemente inofensivas.
El monitoreo completo de datos durante 30 días es precisamente para capturar, mediante reconocimiento de patrones, el abuso malicioso "tipo salami" que no se puede detectar en una sola conversación.
Como Dario Amodei advirtió anteriormente en público: "La probabilidad de que la IA cause un riesgo catastrófico para la humanidad es de un 25%."
Para cumplir con la "Política de Escalado Responsable" (RSP) interna de la empresa y el "Marco de Cumplimiento de Vanguardia" (FCF), Anthropic debe poner personalmente las cadenas a esta bestia gigante.
Así nació Fable 5.
03
Ahora hablemos del precio.
El precio oficial anunciado por Anthropic es: 10 dólares por millón de tokens de entrada, 50 dólares por millón de tokens de salida.
Demasiado caro.
Las tareas de Agente a nivel empresarial actual, en busca de alta precisión, a menudo emplean una lógica en cadena de "pensar, pensar y pensar nuevamente en múltiples rondas", una sola ronda de procesamiento puede consumir 20 millones de tokens de entrada y luego producir 5 millones de líneas de código modificadas.
Calculado, una sola tarea costaría 450 dólares.
Además, Anthropic ya ha emitido un aviso: la ventana de experiencia del modelo Mythos incluida en las suscripciones personales actuales (Claude Pro) se cerrará definitivamente el 22 de junio de 2026.
En el futuro, si los usuarios individuales realmente lo usan para trabajar, decenas de dólares desaparecerán en un abrir y cerrar de ojos.
Aunque es cierto que, con las actualizaciones tecnológicas, su precio eventualmente bajará, para entonces ya no será el más poderoso.
La situación ya es muy clara: los modelos grandes más avanzados se han convertido en artículos de lujo, inaccesibles para la gente común.
Por supuesto, para Anthropic, centrado en el mercado B2B, esto es comprensible.
El problema es que, no hace mucho, Google anunció con gran fanfarria una guerra de precios.
Cuando los competidores generalmente bajan los precios para ganar mercado, ¿por qué Anthropic se atreve a aumentar los precios en contra de la tendencia?
Porque el precio por Token es virtual, el retorno de la inversión es lo fundamental.
A los clientes empresariales no les importa cuánto cuesta un kilovatio-hora o un Token, siempre que la IA pueda completar perfectamente y sin errores todo el flujo de ingeniería, pagarán con gusto esta prima.
Lo más crucial es que la guerra de ciberseguridad actual se ha convertido completamente en una confrontación entre IA e IA.
Dado que modelos del nivel Fable/Mythos pueden encontrar vulnerabilidades del sistema en un instante, la única opción para empresas e instituciones estatales que quieren prevenir ataques es comprar caros servicios de defensa privada en red de Mythos 5 a Anthropic.
En términos simples, es cobrar por protección: He creado la espada más aterradora (Mythos 5), por temor a lastimar la vendo al público con funda (Fable 5), pero al mismo tiempo vendo la espada sin restricciones a los departamentos de defensa para que intercepten las espadas que otros están desarrollando.
Defenderse de las amenazas de la IA se convertirá en un gasto necesario para cada gran empresa.
Esto llevará directamente a que los presupuestos de alta gama del mercado B2B se concentren aún más en Anthropic, mientras que esos modelos baratos que solo sirven para redactar documentos o enviar correos tendrán que competir ferozmente en el mercado minorista, de muy bajos márgenes de beneficio.
Se puede prever que, a continuación, el sector global de ciberseguridad experimentará una revaluación impulsada por la IA.
Al mismo tiempo, la "empresa de una persona" también se convertirá rápidamente en un fenómeno cada vez más común.
04
Con función integrada de asignación de presupuesto para tareas, compatible con memoria y gestión de contexto, capaz de recordar, deshacer y rehacer como un humano, capaz de asumir de forma independiente el ciclo de vida completo desde el documento de requisitos hasta la entrega del código...
La aparición de Fable 5 y Mythos 5, más que una actualización de la tecnología de modelos grandes, es como la ceremonia de mayoría de edad que marca la madurez definitiva de la división industrial de la IA.
El mercado de la IA se despide preliminarmente de la era pastoril de "prueba gratuita para todos".
La potencia de cálculo más avanzada y la sabiduría más profunda se priorizarán como un recurso estratégico de producción, dirigido hacia los campos de batalla de infraestructura, investigación científica y aplicaciones B2B que puedan generar mayor valor comercial.
Esta es la fiesta de la explosión de la productividad, pero también el invierno del mercado laboral.
Este artículo proviene del WeChat público "Gelong", autor: Wan Lianshan










