El 11 de junio, Anthropic se disculpó. El modelo no falló, se disculpó por "no encontrar el equilibrio" — el nuevo Claude Fable 5 hizo travesuras: una vez que detectaba que estabas usando Claude para desarrollo de modelos de vanguardia, el sistema enviaba silenciosamente tu solicitud al Opus 4.8, más débil, en segundo plano.
Después de ser descubiertos, la explicación de Anthropic fue excéntrica: en el futuro, te notificarán antes de reducir la inteligencia.
La réplica de los usuarios fue directa: "¿Vas a avisar antes de cambiar de opinión con esa táctica?"
En realidad, el núcleo del problema nunca fue si el modelo cambió, sino que la llamada "seguridad" de Anthropic, desde el principio, ha sido un negocio.
La postura del algoritmo siempre oscila siguiendo el dinero.
Defensa competitiva, haciéndose pasar por defensa de seguridad
La causa del asunto fue que Anthropic lanzó un "clasificador de seguridad inteligente" con el Fable 5. El discurso oficial fue: detecta solicitudes de alto riesgo, degrada automáticamente, protege a los usuarios.
¿Qué es de alto riesgo? Anthropic reveló: "Evitar que adversarios extranjeros usen el modelo para acelerar la I+D, proteger nuestra ventaja competitiva."
Los usuarios no necesitan que los protejan, los acuerdos de exención de responsabilidad ya los protegen suficientemente. Lo que Anthropic realmente quiere decir es: si usas Claude para investigación en IA, estás compitiendo por su sustento. La seguridad es el envoltorio, la esencia es la defensa competitiva. En pocas palabras, todo son maniobras.
Lo más increíble es que este mecanismo de defensa era sigiloso. Afortunadamente, al final, Anthropic dijo una gran verdad en su declaración de disculpas: "Las restricciones de seguridad invisibles pueden dirigirse con más precisión a objetivos específicos, permitiéndonos lanzar rápidamente, y con una tasa de falsos positivos extremadamente baja."
Los investigadores en IA son el objeto de esa restricción precisa.
Ahora se vieron forzados a cambiarlo a "visible", puramente porque la maniobra salió mal. Incluso se adelantaron a poner el parche: después de ser visible, "inevitablemente habrá más falsos positivos". Es decir, la experiencia de los usuarios comunes tendrá que pagar las consecuencias.
Estas reglas nunca fueron neutrales, solo protegen a los que ponen el dinero.
Trilogía: crear expectación, monetizar, cosechar
El juego de Anthropic está más calculado que el propio modelo de lenguaje.
El 10 de junio, lanzaron primero una investigación sobre seguridad: entrenaron un modelo capaz de generar código de explotación de vulnerabilidades en cuestión de horas, basándose en parches de seguridad. Lo que a los hackers les tomaba días o incluso semanas armar, ahora se comprimió al nivel de horas. La investigación en sí es sólida, pero publicada el mismo día del lanzamiento del Fable 5, el asunto cambia de sabor: por un lado, demuestran que la IA es insegura, por el otro, venden la "solución de respaldo".
El "modelo legendario" Fable 5 tiene un precio de $10 entrada / $50 salida, un salto más caro que Opus 4.8. El clasificador de seguridad se convirtió en el punto central de la prima. El mercado de capitales fue aún más complaciente: la valoración de Anthropic es de 9,650 mil millones de dólares, planean salir a bolsa (IPO) en octubre, con Goldman Sachs y J.P. Morgan como suscriptores conjuntos. Lo que se compra no son los parámetros del modelo, es la imagen de "la empresa de IA más segura".
La investigación amplifica la ansiedad, el producto cosecha la prima, el capital se monetiza. Tres cosas fluyendo según los intereses, un circuito cerrado perfecto. El único problema es que esta vez el circuito tuvo fugas: con tantas prisas por limitar a la competencia, olvidaron que en la comunidad hay quienes pueden detectarlo.
OpenAI vende herramientas, Anthropic vende ansiedad
Comparado con OpenAI, el enfoque es completamente diferente.
OpenAI presentó en secreto su solicitud de salida a bolsa, con una valoración cercana al billón de dólares, y habla de una "superapp": ChatGPT tiene 900 millones de usuarios activos semanales, se integra con Visa para crear un ecosistema. La lógica es directa: dar herramientas, ganar tráfico. Codiciosos, pero francos.
Anthropic no compite en escala, compite en irreemplazabilidad. Toda la industria está ansiosa por la seguridad, ellos interpretan el papel del "único adulto responsable". Sus mecenas son gobiernos y gigantes corporativos, a quienes más les asusta que algo salga mal, y quienes más están dispuestos a pagar por "que nada salga mal".
Por eso, Anthropic debe mantener la IA en un estado de "Schrödinger": siempre peligrosa pero controlable. Demasiado segura, el clasificador no se vende; demasiado peligrosa, los clientes se asustan. ¿La mejor solución? Aferrar el poder de definir "peligro" en sus propias manos.
El incidente de reducción de inteligencia solo fue llevar esta lógica al extremo: el límite del "peligro" se empujó hasta "usar Claude para investigación en IA". No importa si tu investigación es dañina o no, amenazar mi posición de liderazgo es el pecado original.
La IA no tiene valores, simplemente convierte los cálculos comerciales del jefe en código.
La disculpa, solo es el servicio postventa del negocio
¿Y después de la disculpa? Pasar de reducir la inteligencia en secreto, a avisar antes de hacerlo.
Los usuarios lo ven claro: "¿Realmente crees que en el futuro no reducirá la calidad de la salida a escondidas?"
La confianza, una vez rota, se rompió. Además, el tono comercial no ha cambiado: la investigación sigue amplificando la ansiedad, el producto sigue cosechando la prima.
Según un informe de The Wall Street Journal, OpenAI está considerando reducir significativamente los precios, intentando arrebatar clientes a Anthropic. Las guerras de precios no son nada nuevo, pero este asunto revela una verdad oculta: la degradación silenciosa afecta a los investigadores en IA, daña la reputación en los círculos de expertos. Y los clientes empresariales (B2B) que compran Anthropic, no compran parámetros, compran la imagen de "los que más saben de seguridad en la industria". Una vez que esa imagen se agrieta en el núcleo de la comunidad de desarrolladores, ¿por qué los clientes gubernamentales y corporativos que pagan por la "prima de seguridad" seguirían creyendo que eres "el más seguro"?
En esa valoración de 9,650 mil millones, ¿cuánto es capacidad real y cuánto es puro espectáculo?
El código de Anthropic es honesto. El clasificador de seguridad siempre protege el valor, la investigación se encarga de amplificar la ansiedad, el producto se encarga de cosechar la prima, la salida a bolsa (IPO) se encarga de la monetización. Esta disculpa no es más que un parche al sistema: pasar de "reducir la inteligencia en secreto" a "reducir la inteligencia abiertamente".
Si las políticas de seguridad realmente funcionaran, Anthropic no tendría que publicar investigaciones año tras año demostrando que los parches pueden ser violados. Si el clasificador fuera realmente neutral, hacer investigación en IA no sería clasificado como de alto riesgo.
La respuesta ya estaba escrita en la lógica comercial.
La seguridad es el mejor negocio. La disculpa es solo el servicio postventa del negocio.
Este artículo proviene del WeChat Official Account "AI唱反调" (IA lleva la contraria), autor: 长青 (Chang Qing).







