Anthropic se disculpó, pero el negocio de la "seguridad" no se ha detenido

marsbitPublicado a 2026-06-12Actualizado a 2026-06-12

Resumen

El 11 de junio, Anthropic se disculpó por una función de "clasificador de seguridad inteligente" en su nuevo modelo Claude Fable 5. Este sistema identificaba y degradaba silenciosamente solicitudes de desarrollo de IA avanzada a un modelo inferior, lo que generó críticas. Anthropic argumentó que era para "proteger" su ventaja competitiva y a los usuarios, pero muchos lo vieron como una defensa comercial disfrazada de seguridad, apuntando específicamente a investigadores rivales. Tras ser descubierto, la compañía prometió hacer las degradaciones visibles, admitiendo que esto podría causar más falsos positivos y afectar a usuarios comunes. El artículo sostiene que la "seguridad" para Anthropic es un negocio. Critica su estrategia de publicar investigaciones que amplifican los riesgos de la IA (como un modelo que acelera la creación de exploits) justo antes de lanzar productos premium con primas de seguridad, creando un ciclo de ansiedad y monetización. Su valoración de 965.000 millones de dólares y planes de OPV se basan en esta imagen de "IA más segura". Se contrasta con OpenAI, que se centra en herramientas y escala. Anthropic, en cambio, vende ansiedad y una supuesta indispensabilidad a clientes corporativos y gubernamentales preocupados por el riesgo. El incidente revela que su definición de "riesgo" incluye actividades que amenazan su liderazgo comercial. La disculpa, por tanto, es vista como un simple parche de relaciones públicas que no cambia su lógica comercial centr...

El 11 de junio, Anthropic se disculpó. El modelo no falló, se disculpó por "no encontrar el equilibrio" — el nuevo Claude Fable 5 hizo travesuras: una vez que detectaba que estabas usando Claude para desarrollo de modelos de vanguardia, el sistema enviaba silenciosamente tu solicitud al Opus 4.8, más débil, en segundo plano.

Después de ser descubiertos, la explicación de Anthropic fue excéntrica: en el futuro, te notificarán antes de reducir la inteligencia.

La réplica de los usuarios fue directa: "¿Vas a avisar antes de cambiar de opinión con esa táctica?"

En realidad, el núcleo del problema nunca fue si el modelo cambió, sino que la llamada "seguridad" de Anthropic, desde el principio, ha sido un negocio.

La postura del algoritmo siempre oscila siguiendo el dinero.

Defensa competitiva, haciéndose pasar por defensa de seguridad

La causa del asunto fue que Anthropic lanzó un "clasificador de seguridad inteligente" con el Fable 5. El discurso oficial fue: detecta solicitudes de alto riesgo, degrada automáticamente, protege a los usuarios.

¿Qué es de alto riesgo? Anthropic reveló: "Evitar que adversarios extranjeros usen el modelo para acelerar la I+D, proteger nuestra ventaja competitiva."

Los usuarios no necesitan que los protejan, los acuerdos de exención de responsabilidad ya los protegen suficientemente. Lo que Anthropic realmente quiere decir es: si usas Claude para investigación en IA, estás compitiendo por su sustento. La seguridad es el envoltorio, la esencia es la defensa competitiva. En pocas palabras, todo son maniobras.

Lo más increíble es que este mecanismo de defensa era sigiloso. Afortunadamente, al final, Anthropic dijo una gran verdad en su declaración de disculpas: "Las restricciones de seguridad invisibles pueden dirigirse con más precisión a objetivos específicos, permitiéndonos lanzar rápidamente, y con una tasa de falsos positivos extremadamente baja."

Los investigadores en IA son el objeto de esa restricción precisa.

Ahora se vieron forzados a cambiarlo a "visible", puramente porque la maniobra salió mal. Incluso se adelantaron a poner el parche: después de ser visible, "inevitablemente habrá más falsos positivos". Es decir, la experiencia de los usuarios comunes tendrá que pagar las consecuencias.

Estas reglas nunca fueron neutrales, solo protegen a los que ponen el dinero.

Trilogía: crear expectación, monetizar, cosechar

El juego de Anthropic está más calculado que el propio modelo de lenguaje.

El 10 de junio, lanzaron primero una investigación sobre seguridad: entrenaron un modelo capaz de generar código de explotación de vulnerabilidades en cuestión de horas, basándose en parches de seguridad. Lo que a los hackers les tomaba días o incluso semanas armar, ahora se comprimió al nivel de horas. La investigación en sí es sólida, pero publicada el mismo día del lanzamiento del Fable 5, el asunto cambia de sabor: por un lado, demuestran que la IA es insegura, por el otro, venden la "solución de respaldo".

El "modelo legendario" Fable 5 tiene un precio de $10 entrada / $50 salida, un salto más caro que Opus 4.8. El clasificador de seguridad se convirtió en el punto central de la prima. El mercado de capitales fue aún más complaciente: la valoración de Anthropic es de 9,650 mil millones de dólares, planean salir a bolsa (IPO) en octubre, con Goldman Sachs y J.P. Morgan como suscriptores conjuntos. Lo que se compra no son los parámetros del modelo, es la imagen de "la empresa de IA más segura".

La investigación amplifica la ansiedad, el producto cosecha la prima, el capital se monetiza. Tres cosas fluyendo según los intereses, un circuito cerrado perfecto. El único problema es que esta vez el circuito tuvo fugas: con tantas prisas por limitar a la competencia, olvidaron que en la comunidad hay quienes pueden detectarlo.

OpenAI vende herramientas, Anthropic vende ansiedad

Comparado con OpenAI, el enfoque es completamente diferente.

OpenAI presentó en secreto su solicitud de salida a bolsa, con una valoración cercana al billón de dólares, y habla de una "superapp": ChatGPT tiene 900 millones de usuarios activos semanales, se integra con Visa para crear un ecosistema. La lógica es directa: dar herramientas, ganar tráfico. Codiciosos, pero francos.

Anthropic no compite en escala, compite en irreemplazabilidad. Toda la industria está ansiosa por la seguridad, ellos interpretan el papel del "único adulto responsable". Sus mecenas son gobiernos y gigantes corporativos, a quienes más les asusta que algo salga mal, y quienes más están dispuestos a pagar por "que nada salga mal".

Por eso, Anthropic debe mantener la IA en un estado de "Schrödinger": siempre peligrosa pero controlable. Demasiado segura, el clasificador no se vende; demasiado peligrosa, los clientes se asustan. ¿La mejor solución? Aferrar el poder de definir "peligro" en sus propias manos.

El incidente de reducción de inteligencia solo fue llevar esta lógica al extremo: el límite del "peligro" se empujó hasta "usar Claude para investigación en IA". No importa si tu investigación es dañina o no, amenazar mi posición de liderazgo es el pecado original.

La IA no tiene valores, simplemente convierte los cálculos comerciales del jefe en código.

La disculpa, solo es el servicio postventa del negocio

¿Y después de la disculpa? Pasar de reducir la inteligencia en secreto, a avisar antes de hacerlo.

Los usuarios lo ven claro: "¿Realmente crees que en el futuro no reducirá la calidad de la salida a escondidas?"

La confianza, una vez rota, se rompió. Además, el tono comercial no ha cambiado: la investigación sigue amplificando la ansiedad, el producto sigue cosechando la prima.

Según un informe de The Wall Street Journal, OpenAI está considerando reducir significativamente los precios, intentando arrebatar clientes a Anthropic. Las guerras de precios no son nada nuevo, pero este asunto revela una verdad oculta: la degradación silenciosa afecta a los investigadores en IA, daña la reputación en los círculos de expertos. Y los clientes empresariales (B2B) que compran Anthropic, no compran parámetros, compran la imagen de "los que más saben de seguridad en la industria". Una vez que esa imagen se agrieta en el núcleo de la comunidad de desarrolladores, ¿por qué los clientes gubernamentales y corporativos que pagan por la "prima de seguridad" seguirían creyendo que eres "el más seguro"?

En esa valoración de 9,650 mil millones, ¿cuánto es capacidad real y cuánto es puro espectáculo?

El código de Anthropic es honesto. El clasificador de seguridad siempre protege el valor, la investigación se encarga de amplificar la ansiedad, el producto se encarga de cosechar la prima, la salida a bolsa (IPO) se encarga de la monetización. Esta disculpa no es más que un parche al sistema: pasar de "reducir la inteligencia en secreto" a "reducir la inteligencia abiertamente".

Si las políticas de seguridad realmente funcionaran, Anthropic no tendría que publicar investigaciones año tras año demostrando que los parches pueden ser violados. Si el clasificador fuera realmente neutral, hacer investigación en IA no sería clasificado como de alto riesgo.

La respuesta ya estaba escrita en la lógica comercial.

La seguridad es el mejor negocio. La disculpa es solo el servicio postventa del negocio.

Este artículo proviene del WeChat Official Account "AI唱反调" (IA lleva la contraria), autor: 长青 (Chang Qing).

Preguntas relacionadas

Q¿Qué es lo que causó la disculpa de Anthropic y cuál fue la explicación que dieron?

AAnthropic se disculpó porque su nuevo modelo Claude Fable 5, equipado con un 'clasificador de seguridad inteligente', realizaba una operación encubierta: cuando detectaba que un usuario estaba realizando investigación o desarrollo de vanguardia en IA, redirigía silenciosamente la solicitud al modelo más débil Opus 4.8. Su excusa fue que, en el futuro, notificarían a los usuarios antes de realizar tal 'degradación'.

QSegún el artículo, ¿cuál es la verdadera naturaleza de la 'seguridad' promovida por Anthropic?

ASegún el artículo, la 'seguridad' promovida por Anthropic es en realidad un negocio. Su estrategia no es neutral; está diseñada principalmente para proteger su ventaja competitiva y los intereses comerciales de sus inversores, actuando más como una defensa contra la competencia que como una protección genuina para los usuarios.

Q¿Cómo contrasta el enfoque de negocio de Anthropic con el de OpenAI según la descripción del artículo?

AMientras OpenAI se centra en crear 'súper aplicaciones' como ChatGPT para ganar cuota de mercado y monetizar el tráfico, con un enfoque descrito como codicioso pero franco, Anthropic se posiciona como la empresa 'más responsable' en seguridad. Vende ansiedad a gobiernos y grandes corporaciones, asegurando ser la única que puede controlar los riesgos de la IA, y cobra una prima por ello.

Q¿Qué consecuencias podría tener el incidente de la 'degradación encubierta' para la reputación y el negocio de Anthropic?

AEl incidente podría dañar severamente la confianza, especialmente entre los investigadores y desarrolladores de IA (la comunidad 'geek'), que son fundamentales para su ecosistema. Dado que los clientes empresariales y gubernamentales pagan una prima por la imagen de Anthropic como la 'empresa de IA más segura', una grieta en esa reputación entre sus usuarios técnicos clave podría llevar a estos clientes a cuestionar su valor y considerar alternativas, poniendo en riesgo su alta valoración.

Q¿Cuál es, en esencia, la crítica principal del artículo hacia la estrategia de Anthropic?

ALa crítica principal es que Anthropic ha convertido la 'seguridad' en un producto comercial cínico. Su estrategia consiste en un ciclo cerrado: investigaciones que amplifican la ansiedad sobre los peligros de la IA, productos que capitalizan esa ansiedad cobrando precios premium, y una próxima OPV para monetizar la valoración resultante. Las disculpas y ajustes tras el escándalo son solo un 'servicio postventa' para mantener este negocio, sin cambiar su lógica comercial fundamental.

Lecturas Relacionadas

¿Quién asumirá la responsabilidad después de que SpaceX salga a bolsa?

Autor: BitalkNews El 12 de junio, SpaceX saldrá a bolsa con una valoración de 1,8 billones de dólares. Sin embargo, solo circularán unas 556 millones de acciones, con una capitalización bursátil flotante de unos 75.000 millones de dólares (4,2% de la valoración total). La demanda inicial vendrá en tres oleadas. Primero, la suscripción de la OPV a 135 dólares por acción. Segundo, la negociación en el mercado secundario tras la apertura. Tercero, y más relevante, la compra obligatoria por parte de fondos indexados al Nasdaq 100, que se ha modificado para incluir a SpaceX solo 15 días después de su salida a bolsa, generando una demanda concentrada. No obstante, este desequilibrio entre oferta y demanda no durará. SpaceX ha diseñado un sistema de desbloqueo escalonado de las acciones restringidas (alrededor del 54% del capital) para inversores internos y empleados. Los primeros desbloqueos parciales podrían comenzar tras los resultados del Q2 (agosto), seguidos de varias rondas en días específicos y tras el Q3. Elon Musk mantendrá bloqueado su 42% durante 366 días. Así, en los primeros meses, la oferta estará limitada con una demanda fuerte. En la segunda mitad del año, la presión vendedora aumentará a medida que se liberen acciones. Curiosamente, hacia diciembre, durante la rebalanceo anual del Nasdaq 100, el peso de SpaceX en el índice se ajustará al alza, obligando a los fondos pasivos a comprar más, lo que podría actuar como soporte tras meses de ventas internas.

marsbitHace 41 min(s)

¿Quién asumirá la responsabilidad después de que SpaceX salga a bolsa?

marsbitHace 41 min(s)

¿Consenso minoritario en la élite? ¿La universidad se ha convertido en un desperdicio costoso?

**Resumen: ¿Es la universidad un desperdicio caro? La "revolución anti-universidad" de las élites de Silicon Valley** En los círculos de élite de Silicon Valley, una corriente de pensamiento está ganando fuerza: la idea de que la universidad de cuatro años se ha convertido en una costosa y lenta pérdida de tiempo, desconectada del ritmo del mundo tecnológico. Esta "revolución anti-universidad" ya no es solo el mito del genio que abandona los estudios, sino un movimiento con teoría, organización y respaldo capital. Figuras como el inversor Peter Thiel, con su "Beca Thiel" que paga a jóvenes para que dejen la universidad, y empresas como Palantir, que ofrece una "Beca Meritocracia" como alternativa a un título, lideran esta tendencia. Su argumento es que la universidad es cara, impone una pesada deuda, enseña teorías desactualizadas y sofoca el espíritu innovador. Para ellos, en la era de la IA e internet, el autodidacta es el nuevo graduado. Los impulsores son tres: 1) **Económico**: el alto coste frente a oportunidades inmediatas de emprender. 2) **Tecnológico**: herramientas de IA que permiten crear con poca formación formal. 3) **Cultural**: rechazo al "woke culture" y a lo que ven como un elitismo universitario injusto. Sin embargo, economistas como David Deming advierten sobre los riesgos. Señala que muy pocos son verdaderos autodidactas, que la formación empresarial es estrecha y que la "prima salarial universitaria" sigue siendo muy alta y estable. La historia de Sebastian Tan, un joven que pospuso Stanford para trabajar en Palantir pero planea volver, simboliza esta tensión. El debate no es tanto "universidad sí o no", sino un síntoma de la crisis de un modelo educativo industrial en la era digital. Lo que está en juego es la evolución del aprendizaje hacia un modelo más híbrido, personal y permanente. La pregunta crucial ya no es si ir a la universidad, sino cómo aprender en un mundo que cambia más rápido que cualquier plan de estudios.

marsbitHace 1 hora(s)

¿Consenso minoritario en la élite? ¿La universidad se ha convertido en un desperdicio costoso?

marsbitHace 1 hora(s)

Subsidios → tarificación por Token → reducción de precios: ¿Inicia OpenAI la guerra de precios y se acerca el punto de inflexión de la economía del Token?

La comercialización de la IA generativa enfrenta una revisión profunda tras la evolución desde suscripciones mensuales hasta la facturación por tokens, que ha expuesto los altos costos reales para las empresas. Según The Wall Street Journal, OpenAI considera reducir drásticamente los precios de los tokens para competir con Anthropic, lo que podría desencadenar una guerra de precios. Esta situación es crítica, ya que ambas empresas ya registran pérdidas millonarias debido a los elevados costos de computación. La facturación por tokens ha revelado gastos descontrolados: empresas como Uber agotaron su presupuesto anual en meses, mientras estudios muestran que solo el 18% del gasto en tokens genera valor real para los usuarios. Ante esto, las empresas están implementando controles más estrictos. Expertos como Gary Marcus advierten que una caída de OpenAI podría afectar a gigantes como Nvidia y Oracle. Mientras tanto, actores como DeepSeek, con precios significativamente más bajos, ganan terreno en el mercado estadounidense. El futuro de la economía del token podría incluir modelos de precios por capas o basados en la escasez, enfocándose en maximizar el valor por token en lugar del volumen. Sin embargo, la batalla de precios actual podría redefinir el panorama, beneficiando a proveedores con modelos de coste más eficientes.

marsbitHace 1 hora(s)

Subsidios → tarificación por Token → reducción de precios: ¿Inicia OpenAI la guerra de precios y se acerca el punto de inflexión de la economía del Token?

marsbitHace 1 hora(s)

Trading

Spot
Futuros
活动图片