En abril, Anthropic lanzó la versión preliminar de su modelo Mythos. Este modelo no se abrió al público, ya que durante las pruebas demostró una capacidad extremadamente fuerte en ciberseguridad y descubrimiento de vulnerabilidades, siendo capaz de encontrar de forma autónoma miles de vulnerabilidades críticas de día cero. De haber sido liberado, podría haberse utilizado fácilmente para ataques maliciosos.
Para confinar esta capacidad a escenarios defensivos, Anthropic lanzó el Proyecto Glasswing, otorgando acceso únicamente a 12 socios centrales de seguridad como Apple, Google y Microsoft, y a más de 40 proveedores de infraestructura crítica, con un uso supervisado durante todo el proceso.
Primero restringirlo y luego lanzarlo: esta operación en sí misma generó controversia.
Dos meses después, en la madrugada del 10 de junio, hora de Pekín, Anthropic lanzó oficialmente Fable 5 y Mythos 5.
Según las pruebas de referencia, obtuvieron las puntuaciones más altas en casi todas las pruebas, especialmente en ingeniería de software y ejecución de tareas largas, donde marcaron una clara diferencia con otros modelos.
Sin embargo, la discusión en torno a este modelo pronto dejó de centrarse únicamente en su potencia.
Fable 5 y Mythos 5 comparten en realidad el mismo modelo subyacente. La diferencia es que Fable 5 está dirigido a usuarios generales, mientras que Mythos 5 permanece restringido a socios de seguridad de confianza. Un mismo modelo, dos conjuntos de reglas, dirigido a dos grupos: esto es una primicia en la línea de productos de Anthropic.
Además, los usuarios generales tampoco reciben la versión completa. Anthropic añadió un clasificador de seguridad externo a Fable 5; si una solicitud toca áreas sensibles como ciberseguridad, bioquímica o destilación de modelos, el sistema cambia automáticamente al modelo anterior Opus 4.8, de capacidad inferior, para responder.
El precio también merece atención: 10 dólares de entrada y 50 dólares de salida por millón de tokens, aproximadamente el doble que Opus 4.8, según declaró la empresa. A partir del 23 de junio, Fable 5 también será eliminado de los planes de suscripción Pro, Max, etc. Los usuarios que quieran seguir utilizándolo deberán consumir créditos adicionales.
Analizadas por separado, estas medidas son bastante razonables: capacidad demasiado potente, por lo que se imponen restricciones de seguridad; coste más elevado, por lo que se suben los precios; alta sensibilidad al riesgo, por lo que se lanza de forma escalonada. Pero juntas, la señal que emiten se vuelve más sutil. Esto difiere de la lógica competitiva de los últimos años en la industria de los modelos grandes, que se centraba en la velocidad y la apertura. Mientras que todas las empresas intentan que sus modelos lleguen a más usuarios, Anthropic elige activamente reducir el acceso, convirtiendo las restricciones en parte de su estrategia de producto.
Entonces, ¿este "modelo más potente" sin precedentes está siendo mitificado?
01. Mejora notable de la capacidad, la degradación automática genera controversia
Dejando a un lado la segmentación, primero veamos cuál es su capacidad real.
La ingeniería de software es el punto central de esta actualización de Anthropic. En la prueba SWE-Bench Pro, Fable 5 obtuvo un 80,3%. Esta prueba evalúa principalmente la capacidad del modelo para localizar errores en repositorios reales de GitHub, comprender el contexto y escribir código funcional para corregirlos. Un 80,3% significa que por cada 5 problemas reales de ingeniería, Fable 5 puede resolver 4.
En la lista Terminal-Bench 2.1, Fable 5 obtuvo un 88,0%, superando a Codex CLI de OpenAI. Cabe destacar que Fable 5 es un modelo general, mientras que Codex CLI es una herramienta vertical especializada en programación; la diferencia entre ambos refleja mejor la capacidad de programación de Fable 5.
Pero donde realmente se nota la diferencia es en FrontierCode Diamond, una prueba que evalúa si el código generado por el modelo alcanza los estándares de calidad de un repositorio de código de nivel productivo. Fable 5 obtuvo un 29,3%, Opus 4.8 solo un 13,4% y GPT-5.5 solo un 5,7%. Los tres datos fueron publicados oficialmente por Anthropic; el dato de GPT-5.5 corresponde a sus pruebas internas.
En los últimos años, la capacidad de los modelos de IA para escribir código ha progresado constantemente, pero se ha estancado durante mucho tiempo en un cuello de botella: el código puede funcionar, pero no es fácil de mantener; puede pasar las pruebas de referencia, pero al implementarse en proyectos reales siguen surgiendo problemas.
El avance de Fable 5 en esta dimensión indica que Anthropic no solo ha mejorado la capacidad de resolución de problemas en esta actualización, sino que ha llevado el modelo hacia una verdadera capacidad de entrega en ingeniería.
Li Xia, programador, dijo a AIX Finance que el código generado por IA suele presentar problemas de falta de coherencia contextual. Al principio puede comprender los requisitos con precisión, pero en tareas largas tiende a olvidar información, lo que genera un alto coste de mantenimiento posterior.
En su opinión, Fable 5 muestra una mejora notable en la coherencia lógica en tareas largas, pudiendo completar tareas de codificación similares de una sola vez, con mayor precisión. Sin embargo, en comparación con Opus 4.8, Fable 5 genera código más lentamente, tiene una cadena de pensamiento más larga y su velocidad de respuesta general ha disminuido.
La capacidad visual también ha mejorado. Según Anthropic, Fable 5 puede extraer números precisos de gráficos científicos complejos y reconstruir el código fuente de una aplicación directamente a partir de capturas de pantalla de páginas web. La empresa también mostró un caso práctico: Fable 5 completó "Pokémon Rojo Fuego" utilizando solo capturas de pantalla del juego, sin necesidad de herramientas auxiliares. Los modelos anteriores necesitaban sistemas auxiliares complejos para realizar tareas similares.
En cuanto al contexto largo y la memoria, la versión oficial afirma que cuanto más larga y compleja sea la tarea, más evidente será la ventaja de Fable 5.
Además, las ciencias de la vida son otra dirección mencionada como punto clave. Anthropic reveló que el modelo de análisis de datos de células individuales basado en Mythos 5, que cubre 138 especies, supera en rendimiento a modelos similares publicados recientemente en "Science", aunque su cantidad de parámetros es solo el uno por ciento de los de estos últimos.
Solo en términos de resultados de referencia, la capacidad integral ha dado un paso adelante.
Ahora veamos más allá de las pruebas de referencia.
Fable 5 incorpora un clasificador de seguridad; si la solicitud del usuario involucra ciberseguridad, bioquímica o destilación de modelos, el sistema cambia automáticamente a Opus 4.8 para responder e informa al usuario de que se ha producido una degradación del modelo. La empresa afirma que más del 95% de las conversaciones diarias no la activarán, y que la mayoría de las tareas de escritura, programación y análisis no se verán afectadas. Sin embargo, la experiencia real puede variar según el escenario de uso.
En el uso práctico, este límite se puede activar fácilmente. Li Xia mencionó que, al intentar experimentar con las funciones de la IA de Siri de Apple en un Mac de China, necesitaba modificar algunos parámetros de números de serie a nivel del sistema, y Fable 5 se negó directamente a realizar la operación. Actualmente, la configuración del clasificador es bastante conservadora y puede haber falsos positivos; la empresa afirma que realizará ajustes continuos.
Pero Anthropic también reveló otra restricción: para solicitudes relacionadas con el desarrollo de modelos grandes, como la construcción de pipelines de preentrenamiento o el diseño de infraestructuras de entrenamiento distribuido, el modelo reducirá activamente la calidad de la salida en segundo plano, sin informar al usuario.
En resumen, Fable 5 ha mejorado realmente en varios indicadores clave, pero el mecanismo de degradación automática puede afectar en cierta medida la experiencia de uso.
02. El modelo más potente no está al alcance de todos
En esta actualización de modelos, Anthropic ha empaquetado un mismo modelo subyacente en dos productos diferentes, dirigidos a dos tipos de grupos.
Mythos 5 permanece dentro del marco del Proyecto Glasswing, accesible solo para 12 socios centrales de seguridad como Apple, Google y Microsoft, y más de 40 proveedores de infraestructura crítica, eliminando las restricciones en ciberseguridad y áreas biológicas. Fable 5, por otro lado, está dirigido a usuarios suscriptores individuales.
Posteriormente, Anthropic también planea abrir un canal confiable para investigadores verificados en el área biológica, ofreciendo una versión de Fable 5 sin las restricciones en biología y química.
Esto plantea un problema que la industria de los modelos grandes no había enfrentado antes: cuando la capacidad del modelo es suficiente para descubrir vulnerabilidades de forma autónoma, un lanzamiento completo se convierte en un riesgo.
Fuente de la imagen / pexels
Esto explica por qué Fable 5 y Mythos 5 se dividen en dos versiones. Antes, la segmentación de modelos se basaba en parámetros, y la diferencia entre grande y pequeño era de capacidad. Ahora, incluso modelos con los mismos parámetros se segmentan, pero lo que se divide es el umbral de confianza.
Zhan Bo, desarrollador independiente, cree que, desde una perspectiva de seguridad, esta lógica es razonable. Si la capacidad de descubrimiento de vulnerabilidades de nivel Mythos se abriera sin restricciones a individuos, reduciría drásticamente el coste de los ataques y podría ser fácilmente mal utilizada para ataques maliciosos. Restringir primero y luego abrir gradualmente el acceso de confianza es el camino más seguro en este momento.
Pero la seguridad solo explica por qué es necesario estratificar. Otra pregunta es: ¿se benefician todos los usuarios generales que pueden utilizar Fable 5?
A juzgar por las pruebas de referencia y los casos publicados por Anthropic, esta ronda de actualizaciones prioriza a programadores y equipos de ingeniería.
Zhan Bo utilizó Fable 5 para optimizar su proyecto de lenguaje interpretado escrito en Rust. En el mismo escenario de servicio web, lo comparó con FastAPI basado en Python y Hono basado en Node.js. Utilizando el intérprete de Fable 5, la memoria residente fue de solo 9,8 MB, mientras que FastAPI y Hono fueron de 43,3 MB y 63,0 MB respectivamente, con indicadores de rendimiento y latencia también superiores.
Cree que una misma tarea puede completarse mucho más rápido con Fable 5 y con mejores resultados. Para los desarrolladores, más que el precio, importa la calidad del resultado. Siempre que el modelo pueda mejorar significativamente los resultados del proyecto, un precio alto es aceptable.
Li Xia también mencionó que, para los programadores, la calidad de generación del modelo está directamente relacionada con los ingresos. Cuanto mayor sea la calidad de la producción, más evidente será la mejora en eficiencia y mayor será la retribución. La mejora en la capacidad del modelo se puede traducir directamente en calidad del proyecto y ahorro de tiempo, lo que naturalmente aumenta la voluntad de pago.
Pero en un escenario de uso diferente, la conclusión cambia.
Tomando como ejemplo su uso diario, el bloguero de IA Xu Zilong divide su trabajo diario en escribir código, realizar análisis de datos y redactar artículos. Cree que la capacidad de codificación de los modelos grandes actuales es excesiva, mientras que la capacidad de procesamiento de texto es deficiente. Para grupos como investigadores, creadores de contenido, y profesionales del derecho y las finanzas, las necesidades principales en IA se concentran en la comprensión del chino, la escritura de textos largos y el procesamiento de documentos.
Zhan Bo mencionó que la tendencia actual no es que los usuarios elijan el modelo, sino que el modelo selecciona a los usuarios. Los usuarios intensivos de programación son filtrados por los modelos de alta gama, mientras que los usuarios ocasionales y ligeros son dirigidos hacia alternativas más rentables. Esto indica que la IA ya no es una herramienta universal, sino que va filtrando capa por capa a usuarios con diferentes capacidades de pago e intensidades de uso.
Incluso el modelo más potente solo vale su precio cuando está en manos de quienes lo necesitan.
03. ¿Se acerca la era en que no podremos permitirnos la IA?
El precio API de Fable 5 es de 10 dólares de entrada y 50 dólares de salida por millón de tokens, el doble que Opus 4.8, y también el más caro entre los modelos de vanguardia disponibles públicamente en el mundo.
Comparativa de precios API de los principales modelos grandes
Pero lo que realmente merece atención no es que el precio se haya duplicado, sino el cambio en la forma de pago.
Tras el lanzamiento de Fable 5, los usuarios suscriptores de los planes Pro, Max, Team, etc., pudieron utilizarlo gratuitamente durante dos semanas. A partir del 23 de junio, el modelo será eliminado de los planes de suscripción, y para seguir utilizándolo será necesario comprar créditos adicionales, liquidados según la tarifa API. Durante el período de suscripción, el uso de Fable 5 consumirá el doble de la cuota de uso que Opus 4.8.
Ofrecer una prueba gratuita y luego eliminarlo de la suscripción también envía una señal: dirigir a los usuarios desde una tarifa fija mensual hacia un pago por uso. La ventaja de la suscripción es la certeza, el usuario sabe cuánto gasta al mes; el pago por uso beneficia más a la plataforma, cuanto más se usa, más se cobra, y se amplía el límite de gasto del usuario. En pocas palabras, Anthropic quiere decir a los usuarios: lo más avanzado nunca debería ser parte de un pago mensual fijo.
El momento de este cambio también es digno de mención. El 1 de junio, Anthropic presentó de forma confidencial a la SEC su documento de oferta pública inicial (OPI), con una valoración de 965.000 millones de dólares, con el objetivo de salir a bolsa a más tardar en octubre de este año. Desde principios de año hasta finales de mayo, los ingresos anualizados de Anthropic aumentaron de 9.000 millones de dólares a 47.000 millones de dólares, de los cuales Claude Code contribuyó con más de 2.500 millones de dólares, y los clientes empresariales aportaron la mayor parte de los ingresos.
Una empresa a punto de salir a bolsa necesita demostrar al mercado de capitales su capacidad de crecimiento de ingresos y su poder de fijación de precios. Separar el modelo más potente de la suscripción fija y guiar a los usuarios de alto valor hacia el pago por uso tiene sentido desde la narrativa financiera.
Mientras tanto, los modelos chinos están haciendo exactamente lo contrario.
A finales de mayo, DeepSeek anunció una reducción permanente del 75% en el precio de su API V4-Pro. Xiaomi siguió rápidamente, con una reducción del 99% en MiMo-V2.5-Pro, alineando su precio casi con el de DeepSeek.
Mientras DeepSeek baja los precios al mínimo, Anthropic eleva el techo, mostrando diferentes estrategias entre los actores.
La reducción de precios de los modelos chinos se debe, por un lado, a la liberación de los beneficios tecnológicos; la arquitectura subyacente ha cambiado, y el espacio ahorrado se utiliza para ganar mayor cuota de mercado.
La lógica de Anthropic es justo la contraria. No necesita competir por mercado con precios bajos; el alto precio en sí mismo es un filtro que retiene a los usuarios de alto valor dispuestos a pagar por capacidades de vanguardia.
Xu Zilong cree que la IA será cada vez más cara en el futuro, porque la expansión de la demanda es mucho mayor que la expansión de la oferta. La potencia de cálculo involucra electricidad, chips y entrenamiento de modelos, cuyo crecimiento es demasiado lento. En el futuro, la potencia de cálculo de IA será como la infraestructura 5G, pero a diferencia del 5G, la oferta de potencia de cálculo es mucho más limitada que el ancho de banda, por lo que los precios aumentarán en consecuencia.
Desde el punto de vista del modelo de negocio, la industria de la IA está comenzando a mostrar una estructura estratificada similar a la de la computación en nube en sus inicios. En la base están las capacidades genéricas altamente estandarizadas, cuyo precio tiende a cero, accesibles para todos y monetizadas por volumen; en la cúspide están las capacidades de vanguardia controladas por unos pocos proveedores, con el poder de fijación de precios concentrado y monetizadas por precio por cliente. El precio de las capacidades genéricas seguirá bajando, pero la prima por las capacidades de vanguardia persistirá a largo plazo.
Desde la segmentación por capacidades hasta la estratificación de pagos, la industria de la IA está replicando el camino recorrido por la computación en nube. Los modelos baratos son cada vez más numerosos, y los mejores modelos son cada vez más caros.
*A petición de los entrevistados, Li Xia es un seudónimo.
Este artículo proviene del WeChat public account "AIX财经", autor: Lei Jing, editor: Jin Yufan









