Autor: Xiong Lei
Editor: Xu Qingyang
El 12 de junio, hora local de Estados Unidos, un inusual enfrentamiento directo entre el gobierno y una empresa en la historia de la regulación de la IA estalló abruptamente este viernes.
El gobierno estadounidense, alegando razones de seguridad nacional, emitió una orden de control de exportaciones a Anthropic, exigiendo la suspensión inmediata de todos los accesos de entidades extranjeras a los dos modelos de IA Fable 5 y Mythos 5. La orden tiene un alcance extremadamente amplio, aplicándose no solo a usuarios extranjeros fuera de Estados Unidos, sino también a ciudadanos extranjeros que se encuentren dentro del territorio estadounidense, e incluso incluye a empleados extranjeros dentro de la propia empresa Anthropic.
Como medida de cumplimiento, Anthropic se ha visto obligada a cerrar completamente el punto de acceso a estos dos modelos para todos los usuarios. Esta es la única solución viable actualmente para garantizar el cumplimiento, ya que la empresa no puede diferenciar técnicamente de manera precisa entre los grupos de usuarios "entidades extranjeras" y "ciudadanos estadounidenses". El acceso a otros modelos de la compañía no se ve afectado; los usuarios serán redirigidos automáticamente a Claude Opus 4.8.
Esta suspensión de emergencia llegó de manera inesperada. Fable 5 y Mythos 5 se lanzaron oficialmente el 9 de junio, hace apenas tres días. La repentina retirada de ambos modelos ha causado una conmoción generalizada en la comunidad tecnológica y de IA.
01 ¿Qué son exactamente estos dos modelos?
Para comprender la tensión central de esta controversia, primero es necesario entender qué tipo de modelos son Fable 5 y Mythos 5, y por qué han estado bajo el foco de la regulación desde el principio.
Mythos es una nueva familia de modelos de Anthropic, jerárquicamente superior a la serie Opus, que representa el nivel de capacidad más alto que Anthropic puede desplegar públicamente en la actualidad. El primer modelo de la clase Mythos, Claude Mythos Preview, se lanzó en abril de este año a través del proyecto "Project Glasswing", con acceso estrictamente limitado a un pequeño número de socios. La razón era que sus capacidades en el campo de la ciberseguridad eran demasiado potentes como para abrirlas ampliamente.
Fable 5 es el primer modelo de nivel Mythos lanzado oficialmente al público general. Sus capacidades superan a todos los modelos disponibles publicados previamente por Anthropic, alcanzando un nivel líder en la industria en casi todos los puntos de referencia de prueba: ingeniería de software, trabajo del conocimiento, comprensión visual, investigación científica, etc.
Para lograr el lanzamiento público, Anthropic equipó a Fable 5 con mecanismos de protección de seguridad específicos: en áreas de alto riesgo como ciberseguridad, biología, química, etc., el modelo bloquea automáticamente las respuestas y redirige el procesamiento a Claude Opus 4.8.
Mythos 5 es una versión basada en el mismo modelo subyacente pero con menos protecciones de seguridad, disponible solo para instituciones aprobadas que ya tenían acceso a Project Glasswing. Está posicionado como una herramienta profesional para defensores de ciberseguridad y operadores de infraestructura crítica. Ambos modelos tienen el mismo precio: 10 dólares por millón de tokens de entrada y 50 dólares por millón de tokens de salida.
02 La chispa que activó la orden
Según informes, el Secretario de Comercio de EE.UU., Howard Lutnick, envió una carta el 12 de junio al CEO de Anthropic, Dario Amodei (Dario Amodei), anunciando que Mythos 5 y Fable 5 estarían sujetos a controles de exportación. La causa directa que desencadenó esta decisión fue la afirmación de otra empresa de que podía realizar un "jailbreak" (desbloqueo) a Mythos, lo que alertó al gobierno de Trump sobre los posibles riesgos de seguridad nacional.
Se dice que el gobierno de Trump intentó previamente evitar que Anthropic lanzara estos dos modelos, pero no tuvo éxito, lo que llevó al gobierno a adoptar posteriormente el control de exportaciones como un medio más contundente.
Ante esta orden repentina, Anthropic, al tiempo que cumplía, publicó una extensa declaración con un tono inusualmente enérgico, refutando sistemáticamente los argumentos del gobierno.
Anthropic sostiene que la evidencia de "jailbreak" en manos del gobierno solo involucra un método de ataque de alcance extremadamente limitado y no generalizable, que esencialmente consiste en pedir al modelo que lea un repositorio de código específico y repare las vulnerabilidades de software en él. Este tipo de capacidad también existe en otros modelos disponibles públicamente, incluido GPT-5.5 de OpenAI, y se utiliza a diario por parte del personal de defensa de ciberseguridad en el mantenimiento normal de sistemas.
Anthropic dejó claro en su declaración que si se toma la "existencia de un potencial jailbreak de alcance limitado" como estándar para retirar modelos comerciales ya desplegados, en la práctica se llevaría a un estancamiento total de todos los nuevos despliegues de modelos de vanguardia en toda la industria. La empresa también enfatizó que la acción gubernamental no siguió los procedimientos legales transparentes, justos y basados en hechos técnicos que anteriormente había defendido públicamente.
Anthropic declaró que cumplirá con las órdenes legítimas del gobierno, y al mismo tiempo está trabajando activamente para comunicarse con el gobierno, con el objetivo de restablecer el acceso lo antes posible. Publicarán más detalles técnicos en las próximas 24 horas. La empresa cree que este incidente se debe a un malentendido y se disculpa profundamente por las molestias causadas a los usuarios.
A continuación, el texto completo de la declaración de Anthropic titulada "Declaración sobre la orden del gobierno de EE.UU. de suspender el acceso a Fable 5 y Mythos 5":
El gobierno de los Estados Unidos, en virtud de la autorización de seguridad nacional, ha emitido una orden de control de exportaciones que requiere la suspensión del acceso de todos los ciudadanos extranjeros a Fable 5 y Mythos 5, ya sea que se encuentren dentro o fuera de los Estados Unidos, incluidos los empleados extranjeros de Anthropic. El efecto práctico de esta orden es que debemos cerrar inmediatamente Fable 5 y Mythos 5 para todos los usuarios, para asegurar el cumplimiento. Otros modelos de Anthropic no se ven afectados.
Recibimos esta orden hoy a las 5:21 p.m., hora del Este de EE.UU. La carta no especifica las preocupaciones concretas de seguridad nacional. Según entendemos, el gobierno cree que tiene un método para eludir las protecciones de seguridad de Fable 5, una técnica conocida como "jailbreak". Revisamos la demostración de esta técnica y descubrimos que solo puede identificar una pequeña cantidad de vulnerabilidades previamente conocidas y de menor impacto. Todas estas vulnerabilidades son relativamente simples, y otros modelos disponibles públicamente pueden encontrar los mismos problemas sin necesidad de jailbreak.
Anthropic expuso nuestra postura sobre sus protecciones de seguridad en el artículo del blog de lanzamiento de Fable, de la siguiente manera:
Hemos establecido mecanismos de protección de seguridad robustos que reducen significativamente la probabilidad de que Fable sea mal utilizado para tareas relacionadas con la ciberseguridad, entre otras. De hecho, algunos usuarios han informado de que nuestras medidas de protección son demasiado estrictas.
Semanas antes del lanzamiento de Fable, Anthropic colaboró con el gobierno de EE.UU., el Instituto de Seguridad de IA del Reino Unido, múltiples terceros y equipos internos para realizar pruebas de equipo rojo durante miles de horas acumuladas en las protecciones de seguridad de Fable. Los resultados mostraron que la eficacia de las protecciones de seguridad de Fable es significativamente mejor que la de cualquier modelo desplegado previamente.
Hasta la fecha, ningún probador ha podido encontrar un método de "jailbreak universal", es decir, una forma de eludir completamente las protecciones de seguridad del modelo y desbloquear capacidades de ataque cibernético a gran escala.
Creemos que, actualmente, ningún proveedor de modelos puede lograr una protección perfecta contra jailbreaks. Todos los mecanismos de protección de la industria son susceptibles de ser eludidos por "jailbreaks no universales" (obteniendo información de red parcial en circunstancias específicas), y en el futuro podrían surgir métodos de jailbreak universal. Esto lo dejamos claro en el lanzamiento de Fable 5.
Dado que la protección perfecta contra jailbreaks no es factible actualmente, Anthropic adoptó una estrategia de defensa en profundidad para Fable 5. Nuestro objetivo es que los ataques de jailbreak sean o bien de alcance muy limitado (para jailbreaks no universales) o bien de costo muy alto (para jailbreaks universales), complementado con un monitoreo exhaustivo para detectar y contener rápidamente cualquier ataque exitoso. Esta es también la razón por la que Anthropic requiere que los datos de los clientes se conserven durante 30 días. Aunque esta política tiene un impacto real en nuestras relaciones con los clientes, nos ayuda a investigar y responder a los riesgos de jailbreak.
Mantenemos esta estrategia de defensa en profundidad. Reduce eficazmente los riesgos asociados con Fable, equiparándolos al nivel de riesgo de los modelos ya desplegados en la industria.
Hasta la fecha, ni siquiera hemos recibido ninguna divulgación formal sobre un jailbreak no universal que pueda llevar a consecuencias dañinas. Los casos potenciales de jailbreak que nos han sido divulgados o son completamente inocuos, o son hallazgos menores que no reflejan capacidades exclusivas de Mythos.
Actualmente, el gobierno de EE.UU. solo nos ha proporcionado evidencia verbal relacionada con un potencial método de jailbreak no universal de alcance limitado, que esencialmente consiste en pedir al modelo que lea un repositorio de código específico y repare las vulnerabilidades de software en él. Según entendemos, este potencial método de jailbreak ha sido compartido con el gobierno. Revisamos un informe (creemos que es este informe el que fundamenta la orden del gobierno) y hemos verificado que el nivel de capacidad mostrado en él también existe comúnmente en otros modelos (incluido GPT-5.5 de OpenAI) y es utilizado diariamente por defensores de ciberseguridad para mantener la seguridad de los sistemas. Publicaremos más detalles en las próximas 24 horas.
Cumpliremos con la orden legal del gobierno y cerraremos el acceso a Fable 5 y Mythos 5 para todos los usuarios. Sin embargo, no estamos de acuerdo con que el descubrimiento de un potencial método de jailbreak de alcance limitado sea razón suficiente para retirar un modelo comercial ya desplegado a cientos de millones de usuarios. Aplicar este estándar a toda la industria llevaría, en la práctica, a un estancamiento total de todos los nuevos despliegues de modelos por parte de proveedores de modelos de vanguardia.
Hemos declarado públicamente que el gobierno debería tener la autoridad para impedir el despliegue de modelos inseguros, siguiendo procedimientos legales transparentes, justos, claros y basados en hechos técnicos. Esta acción no siguió los principios anteriores.
Lamentamos profundamente las molestias causadas a los usuarios. Creemos que este incidente se debe a un malentendido y estamos trabajando activamente para restablecer el acceso lo antes posible.





