Autor: Ben Thompson
Compilado por: Deep Tide TechFlow
Introducción de Deep Tide: El nuevo modelo Fable de Anthropic fue suspendido de emergencia por el gobierno de EE. UU. solo dos meses después de su lanzamiento. Superficialmente, se trató de una "filtración de seguridad", pero en realidad expuso la doble guerra de los laboratorios de IA contra el gobierno y la industria del software. Esta empresa, que vende su "seguridad" como valor diferencial, está transformando esa narrativa en una barrera comercial. Y lo que realmente buscan arrebatar son los datos de los usuarios en manos de gigantes como Microsoft.
Entiendo la postura de los escépticos, quienes a menudo creen que las declaraciones públicas de Anthropic, especialmente las que acompañan el lanzamiento de modelos, son tácticas de marketing que difunden miedo. Hace dos meses, Anthropic anunció el lanzamiento de Mythos Preview, afirmando que este modelo era demasiado peligroso para ser público, en particular por sus potentes capacidades en ciberseguridad. Dos meses después, la empresa lanzó públicamente Fable, esencialmente una versión de Mythos con diversos salvaguardas de seguridad.
Según mi limitada experiencia de uso, Fable es realmente un modelo excepcional. Hoy, más allá del rendimiento en programación, es difícil evaluar modelos de manera objetiva, pero las impresiones subjetivas cuentan: la interacción con Fable me pareció extraordinariamente fluida; hace que otros modelos, incluidos GPT 5.5 y Opus 4.8, parezcan pequeños y tontos. Solo he tenido esta sensación en dos ocasiones previas: con GPT-4 y con Grok 4, ambos representando una nueva generación en escala y complejidad de modelos base; creo que Fable proviene de un nuevo pre-entrenamiento, y es el primero de esta nueva generación.
Por lo tanto, me parece totalmente plausible que Fable/Mythos sea realmente más fuerte en identificar y explotar problemas de seguridad, y que la prudencia de Anthropic al lanzarlo tenga sentido. Pero el problema de publicar un modelo es que los salvaguardas pueden ser "saltados", y al parecer esto sucedió poco después del lanzamiento.
Anthropic se enfrenta nuevamente al gobierno de EE. UU.
Lo que sucedió después no está del todo claro. Anthropic escribió en una publicación de blog:
El gobierno de EE. UU., invocando poderes de seguridad nacional, emitió una orden de control de exportaciones que suspende el acceso a Fable 5 y Mythos 5 para todos los ciudadanos extranjeros, tanto dentro como fuera de EE. UU., incluidos los empleados extranjeros de Anthropic. El efecto práctico de esta orden fue que tuvimos que deshabilitar repentinamente Fable 5 y Mythos 5 para todos los clientes para garantizar el cumplimiento. El acceso a todos los demás modelos de Anthropic no se ve afectado.
Recibimos la orden del gobierno hoy a las 5:21 p. m., hora del este de EE. UU. La carta no proporcionaba detalles específicos sobre las preocupaciones de seguridad nacional. Entendemos que el gobierno considera que se ha descubierto un método para eludir o "saltar" las protecciones de Fable 5. Revisamos las demostraciones que utilizan esta técnica específica para identificar una pequeña cantidad de vulnerabilidades conocidas y menores. Estas vulnerabilidades parecen relativamente simples, y encontramos que otros modelos disponibles públicamente también podrían identificarlas sin necesidad de eludir protecciones.
Anthropic luego argumentó que los "jailbreaks" no generales son inevitables y de alcance limitado, sin evidencia de un jailbreak universal; y que el jailbreak descubierto parece haber sido reportado por Amazon, lo que es notable dado que Amazon es tanto inversionista de Anthropic como su principal proveedor de servicios de inferencia. Mientras escribo esto, los ejecutivos de Anthropic están en Washington D. C., intentando resolver lo que ellos insisten es un malentendido, y que los funcionarios de la Casa Blanca insinúan que es indiferencia de la dirección de la empresa hacia legítimas preocupaciones de seguridad nacional.
Dado que hay demasiados hechos en disputa, realmente no tengo mucho que añadir sobre el conflicto actual; pero no me sorprende que el conflicto esté ocurriendo: ya expliqué en mi artículo "Anthropic y la Alineación" que el conflicto entre el gobierno de EE. UU. y Anthropic era inevitable. En este sentido, quienes piensan que Mythos aún no es lo suficientemente poderoso como para justificar una acción tan drástica del gobierno pasan por alto el punto clave: si no lo es ahora, lo será el siguiente, o el siguiente, especialmente ahora que los modelos son cada vez más útiles para crear a sus sucesores.
Sin embargo, esto plantea otra pregunta —una que parece confirmar el punto de vista de los escépticos—: si Mythos es tan peligroso, ¿por qué lanzar Fable en primer lugar, por qué enfrentarse al gobierno haciendo lo que dices que quieres? De hecho, creo que las acciones de Anthropic son totalmente comprensibles; lo distintivo de la empresa es cómo justifica estas acciones, y son precisamente estas justificaciones las que proporcionan tanto combustible a los escépticos como la magia a Anthropic.
Necesidad Económica
En los primeros años de la IA, la mayor parte del valor económico fluyó hacia el poder de cómputo, por una razón obvia: no había suficiente oferta para satisfacer la demanda, lo que hizo que los precios se dispararan; los mayores beneficiarios fueron Nvidia, TSMC y los fabricantes de memoria (SK Hynix, Samsung y Micron). Mientras tanto, Anthropic y OpenAI combinadas perdieron decenas de miles de millones de dólares construyendo modelos de vanguardia que, una vez lanzados, fueron destilados y convertidos en productos básicos por modelos de código abierto, principalmente de China.
Esto representa el escenario pesimista para los laboratorios —que nunca podrían cubrir sus costos porque su diferenciación es efímera y las alternativas gratuitas se vuelven "suficientemente buenas"—, un escenario que considero plausible. En un mundo donde los modelos son intercambiables, los modelos son productos básicos, y la mayor parte del valor fluye a otro lado. Ahora es el poder de cómputo, pero con el tiempo, cuando tengamos suficiente, la posición más valiosa en la cadena será la que siempre lo ha sido: poseer el punto de contacto con el usuario.
Por lo tanto, para los laboratorios de vanguardia existe una necesidad económica de acercarse más al usuario, algo que siempre me ha parecido claro. Si posees el punto de contacto, tienes un bloqueo significativo, y la mejor manera de poseerlo es ser el lienzo para todo lo que los usuarios necesiten hacer. Esto, a su vez, significa que los laboratorios de vanguardia se están encaminando hacia un conflicto con las empresas de software: son estas las que poseen el punto de contacto, y el interés a largo plazo de los laboratorios no es simplemente ser un insumo básico para el software, sino reemplazar directamente al software.
Mientras tanto, las empresas de software están luchando por hacer lo contrario. Satya Nadella expuso en una publicación en X su visión de cómo las empresas deberían construir sobre modelos:
Toda empresa debe construir lo que llamo capital humano y capital en tokens. El capital humano incluye el conocimiento, el juicio, las relaciones, la inventiva y el reconocimiento de patrones de sus empleados, mientras que el capital en tokens son las capacidades de IA que la empresa construye y posee. Es importante que, a medida que crece el capital en tokens, el capital humano no se vuelva menos valioso. ¡Solo se vuelve más valioso! Creo que la iniciativa humana será el motor del crecimiento del capital en tokens. Los humanos establecerán objetivos ambiciosos, conectarán puntos entre campos, construirán relaciones e identificarán los patrones más importantes. Sin orientación humana, tu poder de cómputo está en ralentí.
Esto significa que la verdadera oportunidad no está en elegir el mejor modelo, sino en construir bucles de aprendizaje sobre el modelo que permitan que el capital humano y el capital en tokens crezcan de manera compuesta. Puedes externalizar una tarea, incluso un trabajo, pero nunca puedes externalizar tu aprendizaje. El futuro de una empresa es poder hacer que este aprendizaje crezca de manera compuesta entre personas e IA. Esto requiere un nuevo enfoque arquitectónico que permita a cada negocio construir sistemas de agentes inteligentes que mejoren con el tiempo, mientras mantienen el control sobre su propiedad intelectual. Las empresas deberían poder cambiar modelos "generales" sin perder la experiencia del "veterano corporativo" integrada en su sistema de aprendizaje. Esta es la "prueba" clave de tu control y soberanía en la era venidera.
Nadella inició esta visión con una advertencia:
Lo que ninguno de nosotros quiere ver es un mundo donde cada empresa en cada industria ceda valor a unos pocos modelos que lo devoran todo. Si todo el valor es capturado solo por unos pocos modelos, la economía política simplemente no lo tolerará. La sociedad no otorgará licencia para un futuro de IA que vacíe industrias enteras.
Piensen en lo que sucedió en la primera fase de la globalización, donde economías industriales enteras fueron vaciadas por la externalización. Superficialmente, las cifras del PIB se veían bien, pero el desplazamiento fue real y las consecuencias aún se sienten hoy. No llevemos esta dinámica a la era de la IA, permitiendo que unos pocos sistemas de IA capturen todas las recompensas económicas, mientras industrias enteras ven su conocimiento convertido en producto básico ante sus ojos.
El problema con esta analogía es: la globalización sí ocurrió, las economías industriales sí fueron vaciadas. Es posible que esto no sea una advertencia, sino una profecía; no es de extrañar que Nadella esté haciendo sonar la alarma, ya que Microsoft podría ser una de las víctimas. De manera similar, la necesidad económica de los fabricantes de modelos es precisamente lograr eso.
Necesidad de Datos
Estos modelos —incluso Mythos— aún no están listos. Lo que necesitan, además de más poder de cómputo, son más y mejores datos. Las mejoras en los modelos provienen cada vez más del aprendizaje por refuerzo; parte de esto puede generarse de manera sintética, pero la palanca más poderosa para los laboratorios de vanguardia es el uso en el mundo real.
Creo que esta es la razón principal por la que tanto OpenAI como Anthropic ofrecen planes de suscripción altamente subsidiados. SemiAnalysis estimó recientemente que un plan de $200 otorga token de Claude por valor de $8000 y token de Codex por valor de $14000. Por supuesto, ambos compiten por usuarios y participación de la mente de los desarrolladores, pero también compiten por el acceso a datos de uso real para mejorar sus modelos.
Anthropic apostó fuerte con Fable, anunciando que retendría todos los datos de uso durante 30 días, incluso para planes empresariales que anteriormente prometían cero retención de datos. La empresa afirma que no usará estos datos para entrenar, pero no establece salvaguardas para garantizar que no lo harán en el futuro (como almacenar los datos con un tercero). Si este cambio de política (cuando Fable se restaure) no provoca una fuga masiva de clientes, sospecho que es solo cuestión de tiempo antes de que comiencen a usar los datos: son demasiado valiosos para su objetivo final.
Noten también el ciclo virtuoso de moverse hacia el punto de contacto del usuario: cuantos más flujos de trabajo se completen directamente con Claude o Codex, más datos obtendrá cada empresa para retroalimentar el entrenamiento, lo que hace que sus productos sean más potentes y útiles, ampliando la cantidad de flujos de trabajo que pueden atender y su acceso a datos.
Nadella enfatizó la importancia de estos datos en su artículo, pero naturalmente considera que deberían ser independientes del modelo:
Las empresas necesitan convertir flujos de trabajo, conocimiento del dominio y juicio acumulado en sistemas de IA que mejoren con cada uso. Las evaluaciones privadas deben capturar si el modelo realmente está mejorando en resultados importantes para el negocio (¡no solo en puntos de referencia externos!). Los entornos privados de aprendizaje por refuerzo deben permitir que el modelo se fortalezca en las trayectorias reales dentro de la organización. Su base de conocimiento hace que la memoria institucional sea consultable y el uso de tokens sea más eficiente.
Este ciclo se convierte en la nueva propiedad intelectual de la empresa. Lo veo como una máquina de escalar. A diferencia de la mayoría de los activos, es compuesto. Cada flujo de trabajo mejorado genera una mejor señal de entrenamiento, lo que acelera la acumulación de conocimiento tácito único de la empresa. Las empresas que construyan esto desde el principio tendrán una ventaja difícil de replicar, independientemente de las capacidades de cualquier nuevo modelo individual.
Sin embargo, ¿y si las empresas que se adhieren a la política de datos de Anthropic ya obtienen mejores resultados? ¿O si las empresas existentes resisten, dejando espacio para que nuevas empresas —o los propios fabricantes de modelos— las superen en el mercado? Anthropic realmente está poniendo a prueba la determinación que Nadella exige.
Reivindicación de Poder
La política de retención de datos de Fable/Mythos ni siquiera fue la parte más controvertida del lanzamiento. En cambio, Anthropic declaró en el lanzamiento que, si Fable se usaba para el desarrollo de LLMs, reduciría silenciosamente su rendimiento; la tarjeta del sistema decía:
También añadimos salvaguardas relacionadas con el desarrollo de LLMs de vanguardia. Como discutimos en la Sección 6.1 de nuestro Informe de Riesgos de febrero de 2026, nos preocupan los riesgos de acelerar el ritmo general del desarrollo de IA, aunque seguimos inciertos sobre la gravedad de estos riesgos. En particular, nuestra preocupación es —como escribimos entonces— "acelerar que otros desarrolladores de IA construyan sistemas de IA poderosos con riesgos similares a los nuestros —sin necesariamente contar con las salvaguardas correspondientes."
Dada la reciente capacidad de los modelos para acelerar su propio desarrollo, implementamos nuevas intervenciones que limitan la efectividad de Claude ante solicitudes de desarrollo de LLMs de vanguardia (por ejemplo, construir tuberías de pre-entrenamiento, infraestructura de entrenamiento distribuido o diseño de aceleradores de ML). Usar Claude para desarrollar modelos competidores ya viola nuestros Términos de Servicio, pero hacer cumplir esta limitación a través de salvaguardas evita acelerar a los actores más dispuestos a violar estos términos.
A diferencia de nuestras intervenciones en ciberseguridad, bioquímica e intentos de destilación, estas salvaguardas no son visibles para el usuario. Fable 5 no revertirá a otro modelo. En cambio, las salvaguardas limitarán la efectividad mediante modificación de prompts, vectores guía o métodos de ajuste fino eficiente en parámetros (PEFT). Estas intervenciones no afectarán la gran mayoría del trabajo de programación. Estimamos que afectarán aproximadamente el 0.03% del tráfico, concentrado en menos del 0.1% de las organizaciones. Cuando estas intervenciones se activen, esperamos que su impacto en el comportamiento del modelo sea mínimo, aparte de limitar su efectividad para desarrollar LLMs de vanguardia. Claude seguirá respondiendo de manera útil a las solicitudes del usuario. Continuaremos mejorando la precisión de nuestros métodos de detección después de este lanzamiento del modelo.
Anthropic retractó este cambio —Fable transferirá las solicitudes relacionadas con LLMs a Opus 4.8 y notificará a los usuarios sobre esta transferencia— pero creo que la política original es muy reveladora. Por un lado, realmente no culpo a Anthropic por no querer ayudar a la competencia; por otro lado, debe quedar muy claro que Anthropic cree que nadie más que ellos debería fabricar LLMs de vanguardia.
Lo que hace que esta política sea aún más llamativa es que se promulgó apenas dos meses después de una disputa entre Anthropic y el Departamento de Guerra: este último quería usar Claude para cualquier uso legítimo, mientras que el primero deseaba controles más estrictos sobre vigilancia y armas autónomas. Esta medida de degradación representa tanto la capacidad como la voluntad de Anthropic de alterar silenciosamente su modelo para cumplir con sus preferencias políticas. En otras palabras, Anthropic validó activamente algunas de las mayores preocupaciones de los críticos sobre su papel como riesgo en la cadena de suministro.
Sin embargo, la conclusión más amplia de ese incidente es que Anthropic cree que deberían tener la última palabra sobre cómo se usa Anthropic; dado que creen que solo ellos deberían desarrollar IA de vanguardia, entonces, en efecto, creen que solo ellos deberían tener la última palabra sobre la IA en general. Cuando combinas esta comprensión con la declaración de la empresa de que la IA puede realizar toda actividad económica, te das cuenta de que el liderazgo de Anthropic esencialmente quiere tener poder sobre todo y sobre todos.
Narrativa de Seguridad
Por supuesto, Anthropic nunca lo expresaría tan directamente; en cambio, la historia es sobre seguridad:
Espero que Anthropic exponga cada vez más las capacidades de sus modelos a los usuarios finales a través de endpoints cada vez más personalizados para diferentes flujos de trabajo, incluso mientras comienzan a restringir las API. Esta sustitución del software y restricción del acceso se llevará a cabo en nombre de la seguridad, incluso mientras Anthropic cumple su imperativo económico de acercarse al usuario final.
La explicación de Anthropic para su importante cambio en la política de retención de datos es la seguridad. Específicamente, la empresa afirma que retener todos los datos de usuario durante 30 días es necesario para prevenir los jailbreaks que preocupan al gobierno de EE. UU. Ciertamente puedo imaginar un futuro en el que factores de seguridad los obliguen también a entrenar con estos datos, para defenderse mejor del uso malicioso.
La historia misma de los orígenes de Anthropic está arraigada en la creencia de sus fundadores de que OpenAI no se tomaba la seguridad lo suficientemente en serio; la empresa cree que solo ellos pueden controlar la IA y, dado que se preocupan de manera única por la seguridad, tienen justificación para intentar controlar a todos los demás, incluido el gobierno de EE. UU.
El problema con estas justificaciones de seguridad es este: creo que son efectivas, porque para Anthropic no son meras justificaciones. La empresa realmente cree que son los únicos que creen en la superinteligencia y, por lo tanto, los únicos lo suficientemente preocupados por los peligros. Esto excusa decisión tras decisión, política tras política, confrontación tras confrontación, que para los observadores externos parecen una extraña combinación de cinismo e ingenuidad.
El contraste con OpenAI es enorme: una forma de entender cómo y por qué OpenAI perdió su liderazgo es que, en los años posteriores al lanzamiento de ChatGPT, la empresa estaba en guerra interna, con un laboratorio de investigación de repente cargado con la pesada tarea de convertirse en una inesperada empresa de tecnología de consumo; mientras OpenAI resolvía este conflicto, perdió una enorme cantidad de talento frente a empresas como Anthropic.
Anthropic, por otro lado, posee una perfecta alineación entre talento, misión y negocio. La empresa puede vender a los investigadores la visión de crear un dios máquina, con la aureola de quienes se preocupan por los peligros y son lo suficientemente inteligentes como para representar a la humanidad frente a ellos; y cada cambio de política resultante resulta ser precisamente lo que le conviene al negocio, en la más maravillosa de las coincidencias.
Respeto esta coherencia, y también la temo. La respeto porque es claramente muy efectiva; la analogía más cercana podría ser Apple, una empresa que siempre enmarca cada acción egoísta como hacer lo correcto por el usuario —y a menudo realmente lo es—. Lo mismo ocurre con Anthropic. Sin embargo, lo que me preocupa es que una cosa es que personas convencidas de que saben mejor construyan un teléfono inteligente que puedo aceptar o rechazar; es otra cosa muy diferente que construyan una superinteligencia con el potencial de igualar o superar el poder de los Estados-nación, o simplemente de las grandes empresas. La historia de personas inteligentes convencidas de saber lo que la humanidad necesita es turbia, precisamente porque se convencen a sí mismas de que sus intenciones son buenas, proporcionando excusas para acciones que realmente no lo son.







