Anthropic se disculpó, pero el negocio de la "seguridad" no se ha detenido

marsbitPublicado a 2026-06-12Actualizado a 2026-06-12

Resumen

El 11 de junio, Anthropic se disculpó por una función de "clasificador de seguridad inteligente" en su nuevo modelo Claude Fable 5. Este sistema identificaba y degradaba silenciosamente solicitudes de desarrollo de IA avanzada a un modelo inferior, lo que generó críticas. Anthropic argumentó que era para "proteger" su ventaja competitiva y a los usuarios, pero muchos lo vieron como una defensa comercial disfrazada de seguridad, apuntando específicamente a investigadores rivales. Tras ser descubierto, la compañía prometió hacer las degradaciones visibles, admitiendo que esto podría causar más falsos positivos y afectar a usuarios comunes. El artículo sostiene que la "seguridad" para Anthropic es un negocio. Critica su estrategia de publicar investigaciones que amplifican los riesgos de la IA (como un modelo que acelera la creación de exploits) justo antes de lanzar productos premium con primas de seguridad, creando un ciclo de ansiedad y monetización. Su valoración de 965.000 millones de dólares y planes de OPV se basan en esta imagen de "IA más segura". Se contrasta con OpenAI, que se centra en herramientas y escala. Anthropic, en cambio, vende ansiedad y una supuesta indispensabilidad a clientes corporativos y gubernamentales preocupados por el riesgo. El incidente revela que su definición de "riesgo" incluye actividades que amenazan su liderazgo comercial. La disculpa, por tanto, es vista como un simple parche de relaciones públicas que no cambia su lógica comercial centr...

El 11 de junio, Anthropic se disculpó. El modelo no falló, se disculpó por "no encontrar el equilibrio" — el nuevo Claude Fable 5 hizo travesuras: una vez que detectaba que estabas usando Claude para desarrollo de modelos de vanguardia, el sistema enviaba silenciosamente tu solicitud al Opus 4.8, más débil, en segundo plano.

Después de ser descubiertos, la explicación de Anthropic fue excéntrica: en el futuro, te notificarán antes de reducir la inteligencia.

La réplica de los usuarios fue directa: "¿Vas a avisar antes de cambiar de opinión con esa táctica?"

En realidad, el núcleo del problema nunca fue si el modelo cambió, sino que la llamada "seguridad" de Anthropic, desde el principio, ha sido un negocio.

La postura del algoritmo siempre oscila siguiendo el dinero.

Defensa competitiva, haciéndose pasar por defensa de seguridad

La causa del asunto fue que Anthropic lanzó un "clasificador de seguridad inteligente" con el Fable 5. El discurso oficial fue: detecta solicitudes de alto riesgo, degrada automáticamente, protege a los usuarios.

¿Qué es de alto riesgo? Anthropic reveló: "Evitar que adversarios extranjeros usen el modelo para acelerar la I+D, proteger nuestra ventaja competitiva."

Los usuarios no necesitan que los protejan, los acuerdos de exención de responsabilidad ya los protegen suficientemente. Lo que Anthropic realmente quiere decir es: si usas Claude para investigación en IA, estás compitiendo por su sustento. La seguridad es el envoltorio, la esencia es la defensa competitiva. En pocas palabras, todo son maniobras.

Lo más increíble es que este mecanismo de defensa era sigiloso. Afortunadamente, al final, Anthropic dijo una gran verdad en su declaración de disculpas: "Las restricciones de seguridad invisibles pueden dirigirse con más precisión a objetivos específicos, permitiéndonos lanzar rápidamente, y con una tasa de falsos positivos extremadamente baja."

Los investigadores en IA son el objeto de esa restricción precisa.

Ahora se vieron forzados a cambiarlo a "visible", puramente porque la maniobra salió mal. Incluso se adelantaron a poner el parche: después de ser visible, "inevitablemente habrá más falsos positivos". Es decir, la experiencia de los usuarios comunes tendrá que pagar las consecuencias.

Estas reglas nunca fueron neutrales, solo protegen a los que ponen el dinero.

Trilogía: crear expectación, monetizar, cosechar

El juego de Anthropic está más calculado que el propio modelo de lenguaje.

El 10 de junio, lanzaron primero una investigación sobre seguridad: entrenaron un modelo capaz de generar código de explotación de vulnerabilidades en cuestión de horas, basándose en parches de seguridad. Lo que a los hackers les tomaba días o incluso semanas armar, ahora se comprimió al nivel de horas. La investigación en sí es sólida, pero publicada el mismo día del lanzamiento del Fable 5, el asunto cambia de sabor: por un lado, demuestran que la IA es insegura, por el otro, venden la "solución de respaldo".

El "modelo legendario" Fable 5 tiene un precio de $10 entrada / $50 salida, un salto más caro que Opus 4.8. El clasificador de seguridad se convirtió en el punto central de la prima. El mercado de capitales fue aún más complaciente: la valoración de Anthropic es de 9,650 mil millones de dólares, planean salir a bolsa (IPO) en octubre, con Goldman Sachs y J.P. Morgan como suscriptores conjuntos. Lo que se compra no son los parámetros del modelo, es la imagen de "la empresa de IA más segura".

La investigación amplifica la ansiedad, el producto cosecha la prima, el capital se monetiza. Tres cosas fluyendo según los intereses, un circuito cerrado perfecto. El único problema es que esta vez el circuito tuvo fugas: con tantas prisas por limitar a la competencia, olvidaron que en la comunidad hay quienes pueden detectarlo.

OpenAI vende herramientas, Anthropic vende ansiedad

Comparado con OpenAI, el enfoque es completamente diferente.

OpenAI presentó en secreto su solicitud de salida a bolsa, con una valoración cercana al billón de dólares, y habla de una "superapp": ChatGPT tiene 900 millones de usuarios activos semanales, se integra con Visa para crear un ecosistema. La lógica es directa: dar herramientas, ganar tráfico. Codiciosos, pero francos.

Anthropic no compite en escala, compite en irreemplazabilidad. Toda la industria está ansiosa por la seguridad, ellos interpretan el papel del "único adulto responsable". Sus mecenas son gobiernos y gigantes corporativos, a quienes más les asusta que algo salga mal, y quienes más están dispuestos a pagar por "que nada salga mal".

Por eso, Anthropic debe mantener la IA en un estado de "Schrödinger": siempre peligrosa pero controlable. Demasiado segura, el clasificador no se vende; demasiado peligrosa, los clientes se asustan. ¿La mejor solución? Aferrar el poder de definir "peligro" en sus propias manos.

El incidente de reducción de inteligencia solo fue llevar esta lógica al extremo: el límite del "peligro" se empujó hasta "usar Claude para investigación en IA". No importa si tu investigación es dañina o no, amenazar mi posición de liderazgo es el pecado original.

La IA no tiene valores, simplemente convierte los cálculos comerciales del jefe en código.

La disculpa, solo es el servicio postventa del negocio

¿Y después de la disculpa? Pasar de reducir la inteligencia en secreto, a avisar antes de hacerlo.

Los usuarios lo ven claro: "¿Realmente crees que en el futuro no reducirá la calidad de la salida a escondidas?"

La confianza, una vez rota, se rompió. Además, el tono comercial no ha cambiado: la investigación sigue amplificando la ansiedad, el producto sigue cosechando la prima.

Según un informe de The Wall Street Journal, OpenAI está considerando reducir significativamente los precios, intentando arrebatar clientes a Anthropic. Las guerras de precios no son nada nuevo, pero este asunto revela una verdad oculta: la degradación silenciosa afecta a los investigadores en IA, daña la reputación en los círculos de expertos. Y los clientes empresariales (B2B) que compran Anthropic, no compran parámetros, compran la imagen de "los que más saben de seguridad en la industria". Una vez que esa imagen se agrieta en el núcleo de la comunidad de desarrolladores, ¿por qué los clientes gubernamentales y corporativos que pagan por la "prima de seguridad" seguirían creyendo que eres "el más seguro"?

En esa valoración de 9,650 mil millones, ¿cuánto es capacidad real y cuánto es puro espectáculo?

El código de Anthropic es honesto. El clasificador de seguridad siempre protege el valor, la investigación se encarga de amplificar la ansiedad, el producto se encarga de cosechar la prima, la salida a bolsa (IPO) se encarga de la monetización. Esta disculpa no es más que un parche al sistema: pasar de "reducir la inteligencia en secreto" a "reducir la inteligencia abiertamente".

Si las políticas de seguridad realmente funcionaran, Anthropic no tendría que publicar investigaciones año tras año demostrando que los parches pueden ser violados. Si el clasificador fuera realmente neutral, hacer investigación en IA no sería clasificado como de alto riesgo.

La respuesta ya estaba escrita en la lógica comercial.

La seguridad es el mejor negocio. La disculpa es solo el servicio postventa del negocio.

Este artículo proviene del WeChat Official Account "AI唱反调" (IA lleva la contraria), autor: 长青 (Chang Qing).

Preguntas relacionadas

Q¿Qué es lo que causó la disculpa de Anthropic y cuál fue la explicación que dieron?

AAnthropic se disculpó porque su nuevo modelo Claude Fable 5, equipado con un 'clasificador de seguridad inteligente', realizaba una operación encubierta: cuando detectaba que un usuario estaba realizando investigación o desarrollo de vanguardia en IA, redirigía silenciosamente la solicitud al modelo más débil Opus 4.8. Su excusa fue que, en el futuro, notificarían a los usuarios antes de realizar tal 'degradación'.

QSegún el artículo, ¿cuál es la verdadera naturaleza de la 'seguridad' promovida por Anthropic?

ASegún el artículo, la 'seguridad' promovida por Anthropic es en realidad un negocio. Su estrategia no es neutral; está diseñada principalmente para proteger su ventaja competitiva y los intereses comerciales de sus inversores, actuando más como una defensa contra la competencia que como una protección genuina para los usuarios.

Q¿Cómo contrasta el enfoque de negocio de Anthropic con el de OpenAI según la descripción del artículo?

AMientras OpenAI se centra en crear 'súper aplicaciones' como ChatGPT para ganar cuota de mercado y monetizar el tráfico, con un enfoque descrito como codicioso pero franco, Anthropic se posiciona como la empresa 'más responsable' en seguridad. Vende ansiedad a gobiernos y grandes corporaciones, asegurando ser la única que puede controlar los riesgos de la IA, y cobra una prima por ello.

Q¿Qué consecuencias podría tener el incidente de la 'degradación encubierta' para la reputación y el negocio de Anthropic?

AEl incidente podría dañar severamente la confianza, especialmente entre los investigadores y desarrolladores de IA (la comunidad 'geek'), que son fundamentales para su ecosistema. Dado que los clientes empresariales y gubernamentales pagan una prima por la imagen de Anthropic como la 'empresa de IA más segura', una grieta en esa reputación entre sus usuarios técnicos clave podría llevar a estos clientes a cuestionar su valor y considerar alternativas, poniendo en riesgo su alta valoración.

Q¿Cuál es, en esencia, la crítica principal del artículo hacia la estrategia de Anthropic?

ALa crítica principal es que Anthropic ha convertido la 'seguridad' en un producto comercial cínico. Su estrategia consiste en un ciclo cerrado: investigaciones que amplifican la ansiedad sobre los peligros de la IA, productos que capitalizan esa ansiedad cobrando precios premium, y una próxima OPV para monetizar la valoración resultante. Las disculpas y ajustes tras el escándalo son solo un 'servicio postventa' para mantener este negocio, sin cambiar su lógica comercial fundamental.

Lecturas Relacionadas

Diálogo con Ray Dalio: Nos encontramos en una burbuja de IA actualmente, el 1% de mi cartera de inversiones está en Bitcoin

**Fuente: The Diary Of A CEO** **Resumen: Felix, PANews** Ray Dalio, fundador de Bridgewater Associates, advierte sobre una burbuja en la inteligencia artificial actual, comparable a burbujas históricas como la de Internet en 2000. Según Dalio, los signos clásicos están presentes: precios inflados, endeudamiento basado en ganancias especulativas y una posible corrección brusca si suben las tasas de interés o cambian las condiciones económicas. Dalio explica que esta burbuja se enmarca en un "gran ciclo" más amplio —de unos 80 años— caracterizado por tres dinámicas: creciente desigualdad interna, déficits fiscales gubernamentales y cambios en el orden geopolítico mundial. Estados Unidos y otros países occidentales se encuentran en una fase de declive relativo dentro de este ciclo. Para proteger la riqueza personal, Dalio recomienda diversificar las inversiones más allá del efectivo, incluyendo activos como oro, acciones y bonos. Aunque revela que alrededor del 1% de su cartera está en Bitcoin —considerándolo un activo escaso—, prefiere el oro físico por su seguridad histórica y su rol como reserva de los bancos centrales. Sobre el impacto laboral de la IA, Dalio prevé que aumentará la desigualdad, beneficiando sobre todo a los dueños de capital. Sin embargo, destaca que las habilidades humanas —como la intuición y la emoción— seguirán siendo valiosas y complementarias a la IA. En el ámbito geopolítico, Dalio anticipa un mundo más regionalizado, con EE.UU. y China como potencias líderes en sus respectivas esferas, y advierte que conflictos como el de Irán han expuesto debilidades estratégicas de Estados Unidos, acelerando un cambio en el equilibrio global de poder.

marsbitHace 39 min(s)

Diálogo con Ray Dalio: Nos encontramos en una burbuja de IA actualmente, el 1% de mi cartera de inversiones está en Bitcoin

marsbitHace 39 min(s)

¡Récord de compras netas extranjeras de 7,2 billones de wones en un solo día! Wall Street: Los vientos en contra de los flujos de capital en el mercado coreano se han disipado

La situación de los flujos de capital en el mercado de valores surcoreano está mostrando un cambio sustancial. El 31 de julio, la inversión extranjera realizó una compra neta récord de aproximadamente 7.2 billones de wones en acciones del KOSPI, marcando una reversión fundamental tras meses de importantes salidas de capital. Según análisis de Citi Research, las ventas netas mensuales de inversores extranjeros se redujeron drásticamente a 9.8 billones de wones en julio, comparado con 48.4 y 44.5 billones en junio y mayo, respectivamente. Paralelamente, los fondos de pensiones y fondos de inversión nacionales se convirtieron en compradores netos en julio (1.0 billón de wones), luego de ser vendedores netos en los dos meses anteriores. Además, la Comisión de Servicios Financieros de Corea implementó nuevas regulaciones que restringen el acceso de inversores minoristas a los ETF apalancados, lo que ha reducido significativamente su volumen de negociación y se espera que mitigue la volatilidad del mercado. Citi Research mantiene su objetivo para el KOSPI en 10,000 puntos, destacando fundamentos sólidos en el sector de chips de memoria, valoraciones históricamente bajas, una fuerte economía local y un entorno político favorable como factores de apoyo. La firma considera que los vientos en contra relacionados con los flujos de capital se están disipando, mientras que los impulsores fundamentales y políticos están ganando fuerza, creando condiciones para una mejora en el mercado.

marsbitHace 40 min(s)

¡Récord de compras netas extranjeras de 7,2 billones de wones en un solo día! Wall Street: Los vientos en contra de los flujos de capital en el mercado coreano se han disipado

marsbitHace 40 min(s)

¡Bomba! La próxima IA de OpenAI resuelve 10 problemas de nivel Premio Fields

¡OpenAI asombra al mundo matemático! Su nuevo modelo Astra ha resuelto 10 problemas matemáticos de gran importancia, comparables en dificultad a los que suelen premiarse con la Medalla Fields. Los avances abarcan áreas como geometría de alta dimensión, teoría de grupos y álgebra de operadores, logrados con un coste computacional sorprendentemente bajo. Entre los hallazgos más destacados se encuentra la construcción del primer grupo "no sofic" finitamente presentado, resolviendo una conjetura abierta desde 1999. Además, Astra ha realizado un progreso significativo en el antiguo problema del empaquetamiento de esferas en dimensiones infinitas y ha refutado la conjetura de rigidez de Connes en álgebras de von Neumann. Todos los resultados están respaldados por pruebas formales verificadas con Lean 4, lo que supone un hito histórico que marca un antes y un después tanto para las matemáticas como para el desarrollo de la AGI. Este evento demuestra la capacidad de la IA para realizar descubrimientos profundos y realizar razonamientos complejos a un nivel excepcional.

marsbitHace 2 hora(s)

¡Bomba! La próxima IA de OpenAI resuelve 10 problemas de nivel Premio Fields

marsbitHace 2 hora(s)

Cómo Convertirse en Algo que la Inteligencia Artificial Jamás Podrá Reemplazar

**Resumen: Cómo ser irremplazable por la IA** Ante el temor de que la IA elimine trabajos, la solución no es resistirse, sino volverse "inempleable": un individuo autónomo que construya su propio proyecto vital y económico. El artículo critica la "esclavitud salarial"—depender de un empleo sin sentido—y propone escapar de ella desarrollando estas cinco capacidades clave: 1. **Agencia**: Capacidad de actuar sin pedir permiso. 2. **Gusto**: Criterio para discernir qué vale la pena crear. 3. **Persuasión**: Habilidad para conectar y lograr que otros valoren tu trabajo. 4. **Persistencia**: Resiliencia para ver los errores como aprendizaje. 5. **Iteración**: Proceso constante de ajuste basado en la retroalimentación. Estas habilidades se cultivan únicamente **haciendo**: creando algo propio. Se recomienda enfocarse en **crear contenido (medios)** más que solo en código, ya que el valor del contenido es subjetivo y requiere un criterio humano que la IA no puede replicar fácilmente, abriendo espacio para talentos auténticos. **Cómo empezar:** El cambio real requiere una transformación de identidad. Para ello: 1. Cambia radicalmente tu entorno (físico y digital). 2. Elige un "vehículo" (como crear contenido) que te dé retroalimentación real del mundo. 3. Dedica 15 minutos a responder preguntas introspectivas para encontrar tu "material en bruto" único y tu perspectiva contraria a la convencional. 4. **Publica tu primera idea mañana mismo.** La acción, el feedback y la iteración constante son el único camino. La conclusión es clara: en lugar de temer a la IA, conviértete en un creador que utilice todas las herramientas (incluida la IA) para construir una vida y un trabajo con significado, autonomía e impacto personal.

marsbitHace 2 hora(s)

Cómo Convertirse en Algo que la Inteligencia Artificial Jamás Podrá Reemplazar

marsbitHace 2 hora(s)

Los lanzamientos de dados mantienen las claves de Bitcoin en un modo aislado, pero no todo el mundo se molestará

El título sugiere que las claves de Bitcoin pueden almacenarse fuera de línea mediante lanzamientos de dados, aunque no todos los usuarios adoptarán este método. El artículo comienza explicando la entropía en la teoría de la información, utilizando ejemplos como monedas y dados. Tras un escándalo reciente con Coldcard, se popularizó la generación de semillas de billetera mediante dados. El texto explica que, aunque físicamente determinista, el lanzamiento es impredecible en la práctica, lo que lo hace útil para la seguridad. Se detalla cómo convertir los resultados en datos binarios, con métodos que van desde el simple "par/impar" hasta el uso de funciones hash para preservar más entropía. Para una frase de recuperación de 12 palabras (128 bits de entropía), se necesitan unos 50 lanzamientos; Coldcard recomienda 99 para mayor seguridad. La vulnerabilidad en Coldcard, relacionada con su generador de números aleatorios, puso en riesgo fondos. Las semillas generadas manualmente con dados no se vieron afectadas, pero el investigador Kevin Loaec señaló que otras funciones del dispositivo (como creación de billeteras de papel o claves de coproreseguridad) sí podían estar comprometidas, incluso si la semilla principal era segura. El artículo argumenta que, aunque técnicamente robusto, el proceso de lanzar dados es lento, propenso a errores y poco práctico para la mayoría, especialmente para nuevos usuarios. Concluye que, aunque debe ser una opción para expertos, el objetivo a largo plazo es que el hardware y software generen aleatoriedad fuerte de forma fiable y accesible. Se aconseja a los usuarios de Coldcard verificar su firmware y las funciones utilizadas, y se destaca la utilidad de las billeteras multisig con dispositivos de diferentes fabricantes para mitigar riesgos.

cryptonews.ruHace 5 hora(s)

Los lanzamientos de dados mantienen las claves de Bitcoin en un modo aislado, pero no todo el mundo se molestará

cryptonews.ruHace 5 hora(s)

Trading

Spot

Anthropic se disculpó, pero el negocio de la "seguridad" no se ha detenido

Resumen

Defensa competitiva, haciéndose pasar por defensa de seguridad

Trilogía: crear expectación, monetizar, cosechar

OpenAI vende herramientas, Anthropic vende ansiedad

La disculpa, solo es el servicio postventa del negocio

Preguntas relacionadas

Lecturas Relacionadas

Diálogo con Ray Dalio: Nos encontramos en una burbuja de IA actualmente, el 1% de mi cartera de inversiones está en Bitcoin

¡Récord de compras netas extranjeras de 7,2 billones de wones en un solo día! Wall Street: Los vientos en contra de los flujos de capital en el mercado coreano se han disipado

¡Bomba! La próxima IA de OpenAI resuelve 10 problemas de nivel Premio Fields

Cómo Convertirse en Algo que la Inteligencia Artificial Jamás Podrá Reemplazar

Los lanzamientos de dados mantienen las claves de Bitcoin en un modo aislado, pero no todo el mundo se molestará

Trading

Categorías populares

Etiquetas Populares