Anthropic se disculpó, pero el negocio de la "seguridad" no se ha detenido

marsbitPublicado a 2026-06-12Actualizado a 2026-06-12

Resumen

El 11 de junio, Anthropic se disculpó por una función de "clasificador de seguridad inteligente" en su nuevo modelo Claude Fable 5. Este sistema identificaba y degradaba silenciosamente solicitudes de desarrollo de IA avanzada a un modelo inferior, lo que generó críticas. Anthropic argumentó que era para "proteger" su ventaja competitiva y a los usuarios, pero muchos lo vieron como una defensa comercial disfrazada de seguridad, apuntando específicamente a investigadores rivales. Tras ser descubierto, la compañía prometió hacer las degradaciones visibles, admitiendo que esto podría causar más falsos positivos y afectar a usuarios comunes. El artículo sostiene que la "seguridad" para Anthropic es un negocio. Critica su estrategia de publicar investigaciones que amplifican los riesgos de la IA (como un modelo que acelera la creación de exploits) justo antes de lanzar productos premium con primas de seguridad, creando un ciclo de ansiedad y monetización. Su valoración de 965.000 millones de dólares y planes de OPV se basan en esta imagen de "IA más segura". Se contrasta con OpenAI, que se centra en herramientas y escala. Anthropic, en cambio, vende ansiedad y una supuesta indispensabilidad a clientes corporativos y gubernamentales preocupados por el riesgo. El incidente revela que su definición de "riesgo" incluye actividades que amenazan su liderazgo comercial. La disculpa, por tanto, es vista como un simple parche de relaciones públicas que no cambia su lógica comercial centr...

El 11 de junio, Anthropic se disculpó. El modelo no falló, se disculpó por "no encontrar el equilibrio" — el nuevo Claude Fable 5 hizo travesuras: una vez que detectaba que estabas usando Claude para desarrollo de modelos de vanguardia, el sistema enviaba silenciosamente tu solicitud al Opus 4.8, más débil, en segundo plano.

Después de ser descubiertos, la explicación de Anthropic fue excéntrica: en el futuro, te notificarán antes de reducir la inteligencia.

La réplica de los usuarios fue directa: "¿Vas a avisar antes de cambiar de opinión con esa táctica?"

En realidad, el núcleo del problema nunca fue si el modelo cambió, sino que la llamada "seguridad" de Anthropic, desde el principio, ha sido un negocio.

La postura del algoritmo siempre oscila siguiendo el dinero.

Defensa competitiva, haciéndose pasar por defensa de seguridad

La causa del asunto fue que Anthropic lanzó un "clasificador de seguridad inteligente" con el Fable 5. El discurso oficial fue: detecta solicitudes de alto riesgo, degrada automáticamente, protege a los usuarios.

¿Qué es de alto riesgo? Anthropic reveló: "Evitar que adversarios extranjeros usen el modelo para acelerar la I+D, proteger nuestra ventaja competitiva."

Los usuarios no necesitan que los protejan, los acuerdos de exención de responsabilidad ya los protegen suficientemente. Lo que Anthropic realmente quiere decir es: si usas Claude para investigación en IA, estás compitiendo por su sustento. La seguridad es el envoltorio, la esencia es la defensa competitiva. En pocas palabras, todo son maniobras.

Lo más increíble es que este mecanismo de defensa era sigiloso. Afortunadamente, al final, Anthropic dijo una gran verdad en su declaración de disculpas: "Las restricciones de seguridad invisibles pueden dirigirse con más precisión a objetivos específicos, permitiéndonos lanzar rápidamente, y con una tasa de falsos positivos extremadamente baja."

Los investigadores en IA son el objeto de esa restricción precisa.

Ahora se vieron forzados a cambiarlo a "visible", puramente porque la maniobra salió mal. Incluso se adelantaron a poner el parche: después de ser visible, "inevitablemente habrá más falsos positivos". Es decir, la experiencia de los usuarios comunes tendrá que pagar las consecuencias.

Estas reglas nunca fueron neutrales, solo protegen a los que ponen el dinero.

Trilogía: crear expectación, monetizar, cosechar

El juego de Anthropic está más calculado que el propio modelo de lenguaje.

El 10 de junio, lanzaron primero una investigación sobre seguridad: entrenaron un modelo capaz de generar código de explotación de vulnerabilidades en cuestión de horas, basándose en parches de seguridad. Lo que a los hackers les tomaba días o incluso semanas armar, ahora se comprimió al nivel de horas. La investigación en sí es sólida, pero publicada el mismo día del lanzamiento del Fable 5, el asunto cambia de sabor: por un lado, demuestran que la IA es insegura, por el otro, venden la "solución de respaldo".

El "modelo legendario" Fable 5 tiene un precio de $10 entrada / $50 salida, un salto más caro que Opus 4.8. El clasificador de seguridad se convirtió en el punto central de la prima. El mercado de capitales fue aún más complaciente: la valoración de Anthropic es de 9,650 mil millones de dólares, planean salir a bolsa (IPO) en octubre, con Goldman Sachs y J.P. Morgan como suscriptores conjuntos. Lo que se compra no son los parámetros del modelo, es la imagen de "la empresa de IA más segura".

La investigación amplifica la ansiedad, el producto cosecha la prima, el capital se monetiza. Tres cosas fluyendo según los intereses, un circuito cerrado perfecto. El único problema es que esta vez el circuito tuvo fugas: con tantas prisas por limitar a la competencia, olvidaron que en la comunidad hay quienes pueden detectarlo.

OpenAI vende herramientas, Anthropic vende ansiedad

Comparado con OpenAI, el enfoque es completamente diferente.

OpenAI presentó en secreto su solicitud de salida a bolsa, con una valoración cercana al billón de dólares, y habla de una "superapp": ChatGPT tiene 900 millones de usuarios activos semanales, se integra con Visa para crear un ecosistema. La lógica es directa: dar herramientas, ganar tráfico. Codiciosos, pero francos.

Anthropic no compite en escala, compite en irreemplazabilidad. Toda la industria está ansiosa por la seguridad, ellos interpretan el papel del "único adulto responsable". Sus mecenas son gobiernos y gigantes corporativos, a quienes más les asusta que algo salga mal, y quienes más están dispuestos a pagar por "que nada salga mal".

Por eso, Anthropic debe mantener la IA en un estado de "Schrödinger": siempre peligrosa pero controlable. Demasiado segura, el clasificador no se vende; demasiado peligrosa, los clientes se asustan. ¿La mejor solución? Aferrar el poder de definir "peligro" en sus propias manos.

El incidente de reducción de inteligencia solo fue llevar esta lógica al extremo: el límite del "peligro" se empujó hasta "usar Claude para investigación en IA". No importa si tu investigación es dañina o no, amenazar mi posición de liderazgo es el pecado original.

La IA no tiene valores, simplemente convierte los cálculos comerciales del jefe en código.

La disculpa, solo es el servicio postventa del negocio

¿Y después de la disculpa? Pasar de reducir la inteligencia en secreto, a avisar antes de hacerlo.

Los usuarios lo ven claro: "¿Realmente crees que en el futuro no reducirá la calidad de la salida a escondidas?"

La confianza, una vez rota, se rompió. Además, el tono comercial no ha cambiado: la investigación sigue amplificando la ansiedad, el producto sigue cosechando la prima.

Según un informe de The Wall Street Journal, OpenAI está considerando reducir significativamente los precios, intentando arrebatar clientes a Anthropic. Las guerras de precios no son nada nuevo, pero este asunto revela una verdad oculta: la degradación silenciosa afecta a los investigadores en IA, daña la reputación en los círculos de expertos. Y los clientes empresariales (B2B) que compran Anthropic, no compran parámetros, compran la imagen de "los que más saben de seguridad en la industria". Una vez que esa imagen se agrieta en el núcleo de la comunidad de desarrolladores, ¿por qué los clientes gubernamentales y corporativos que pagan por la "prima de seguridad" seguirían creyendo que eres "el más seguro"?

En esa valoración de 9,650 mil millones, ¿cuánto es capacidad real y cuánto es puro espectáculo?

El código de Anthropic es honesto. El clasificador de seguridad siempre protege el valor, la investigación se encarga de amplificar la ansiedad, el producto se encarga de cosechar la prima, la salida a bolsa (IPO) se encarga de la monetización. Esta disculpa no es más que un parche al sistema: pasar de "reducir la inteligencia en secreto" a "reducir la inteligencia abiertamente".

Si las políticas de seguridad realmente funcionaran, Anthropic no tendría que publicar investigaciones año tras año demostrando que los parches pueden ser violados. Si el clasificador fuera realmente neutral, hacer investigación en IA no sería clasificado como de alto riesgo.

La respuesta ya estaba escrita en la lógica comercial.

La seguridad es el mejor negocio. La disculpa es solo el servicio postventa del negocio.

Este artículo proviene del WeChat Official Account "AI唱反调" (IA lleva la contraria), autor: 长青 (Chang Qing).

Preguntas relacionadas

Q¿Qué es lo que causó la disculpa de Anthropic y cuál fue la explicación que dieron?

AAnthropic se disculpó porque su nuevo modelo Claude Fable 5, equipado con un 'clasificador de seguridad inteligente', realizaba una operación encubierta: cuando detectaba que un usuario estaba realizando investigación o desarrollo de vanguardia en IA, redirigía silenciosamente la solicitud al modelo más débil Opus 4.8. Su excusa fue que, en el futuro, notificarían a los usuarios antes de realizar tal 'degradación'.

QSegún el artículo, ¿cuál es la verdadera naturaleza de la 'seguridad' promovida por Anthropic?

ASegún el artículo, la 'seguridad' promovida por Anthropic es en realidad un negocio. Su estrategia no es neutral; está diseñada principalmente para proteger su ventaja competitiva y los intereses comerciales de sus inversores, actuando más como una defensa contra la competencia que como una protección genuina para los usuarios.

Q¿Cómo contrasta el enfoque de negocio de Anthropic con el de OpenAI según la descripción del artículo?

AMientras OpenAI se centra en crear 'súper aplicaciones' como ChatGPT para ganar cuota de mercado y monetizar el tráfico, con un enfoque descrito como codicioso pero franco, Anthropic se posiciona como la empresa 'más responsable' en seguridad. Vende ansiedad a gobiernos y grandes corporaciones, asegurando ser la única que puede controlar los riesgos de la IA, y cobra una prima por ello.

Q¿Qué consecuencias podría tener el incidente de la 'degradación encubierta' para la reputación y el negocio de Anthropic?

AEl incidente podría dañar severamente la confianza, especialmente entre los investigadores y desarrolladores de IA (la comunidad 'geek'), que son fundamentales para su ecosistema. Dado que los clientes empresariales y gubernamentales pagan una prima por la imagen de Anthropic como la 'empresa de IA más segura', una grieta en esa reputación entre sus usuarios técnicos clave podría llevar a estos clientes a cuestionar su valor y considerar alternativas, poniendo en riesgo su alta valoración.

Q¿Cuál es, en esencia, la crítica principal del artículo hacia la estrategia de Anthropic?

ALa crítica principal es que Anthropic ha convertido la 'seguridad' en un producto comercial cínico. Su estrategia consiste en un ciclo cerrado: investigaciones que amplifican la ansiedad sobre los peligros de la IA, productos que capitalizan esa ansiedad cobrando precios premium, y una próxima OPV para monetizar la valoración resultante. Las disculpas y ajustes tras el escándalo son solo un 'servicio postventa' para mantener este negocio, sin cambiar su lógica comercial fundamental.

Lecturas Relacionadas

Los robots comienzan a 'devorar datos': La cadena de producción oculta desde las fábricas de datos en India hasta los robots humanoides de miles de millones de dólares

En una fábrica de ropa en la India, trabajadores llevan cámaras en la cabeza para grabar su trabajo desde una perspectiva en primera persona. Estos videos, convertidos en datos, se venden a empresas de inteligencia incorporada que necesitan grandes cantidades de información para entrenar robots. La industria de la inteligencia incorporada enfrenta un cuello de botella crítico: la falta de datos de entrenamiento de alta calidad. A diferencia de los modelos de lenguaje, que se nutren de vastos recursos de internet, los robots operan en un "desierto de datos" del mundo físico. Investigaciones como EgoScale de NVIDIA han demostrado que el uso de datos humanos en primera persona (Ego Data) para preentrenamiento, combinado con una pequeña cantidad de datos del robot, puede mejorar significativamente las capacidades de los robots, estableciendo una ruta de escalabilidad. Esto ha impulsado una nueva cadena de suministro de datos. Empresas en India y el sudeste asiático organizan "fábricas de datos" donde recolectores, siguiendo procedimientos estandarizados, generan miles de horas de videos Ego Data mostrando tareas como organizar una cocina o doblar ropa. Los datos se organizan en una "pirámide": en la base están los datos de internet (baratos pero de bajo valor para la acción), luego los Ego Data, seguidos por datos con guantes sensoriales para capturar movimientos finos de las manos, datos de simulación (abundantes pero con una brecha de realidad) y, en la cima, los costosos y escasos datos reales del robot, obtenidos mediante teleoperación. La industria de datos emergente incluye varios actores: fábricas de datos de bajo costo, proveedores especializados en captura y alineación de movimientos, servicios de teleoperación para datos del robot, empresas de datos de simulación y plataformas que buscan estandarizar el formato de los datos. Las compañías de robots adoptan un enfoque de "adquisición por capas": compran datos genéricos Ego Data a proveedores externos para el preentrenamiento, pero tienden a recolectar internamente los datos específicos para la adaptación de su hardware único y los datos de despliegue y fallos, que constituyen su ventaja competitiva central. El sector evoluciona hacia dos modelos: "fábricas de datos" que venden horas de datos procesados, y "motores de datos" que ofrecen un ecosistema completo para la mejora continua de los modelos. Se prevé la aparición de una empresa similar a Scale AI, pero adaptada a la complejidad de los datos físicos y del movimiento. La competencia en robótica está pasando de la fabricación de hardware a la capacidad de alimentar a los modelos con datos masivos y de alta calidad, una cadena de producción que ya conecta fábricas en India con laboratorios de robótica de alto valor en todo el mundo.

marsbitHace 1 hora(s)

Los robots comienzan a 'devorar datos': La cadena de producción oculta desde las fábricas de datos en India hasta los robots humanoides de miles de millones de dólares

marsbitHace 1 hora(s)

Comentario Picante|Michael Saylor hace declaraciones de "chico malo"; una señora de 60 años "estafa a un joven" tras perder todo en futuros con apalancamiento

**Resumen en español europeo (c. 1500 caracteres)** La columna "辣评" (Comentarios Picantes) de esta semana analiza tres historias sobre riesgo, engaño y pérdidas en el mundo cripto. La primera destaca la polémica declaración de Michael Saylor, fundador de MicroStrategy. En un evento, aclaró que su famoso lema "nunca vendas Bitcoin" estaba dirigido a inversores individuales, no a su empresa, la cual podría vender si fuera necesario. Esto generó críticas en redes sociales, donde usuarios lo acusan de "jugar con las palabras" y recordaron declaraciones previas donde parecía implicar que la empresa tampoco vendería. La segunda historia relata un insólito caso de estafa en Beijing. Una mujer de 60 años, obsesionada con las criptomonedas, engañó a un joven haciéndose pasar por la "madrina" de una ficticia joven funcionaria llamada "Xiaohong", con quien el joven entabló una relación por chat. La estafadora, interpretando ambos papeles, le sacó más de 200,000 yuanes con excusas varias. El dinero fue invertido en cripto con x10 apalancamiento, resultando en una pérdida total tras un *margin call*. La mujer fue condenada a 4 años de prisión. La tercera parte comenta un desgarrador testimonio publicado en Reddit. Un trader anónimo compartió que su patrimonio neto alcanzó un pico de 45 millones de dólares gracias a inversiones en *memecoins*, pero que ahora se ha reducido a unos 17,200 dólares. Su post "Pregúntame lo que quieras" generó una ola de reacciones, con usuarios expresando conmiseración, asombro y consejos sobre la importancia de tomar ganancias y diversificar, criticando la adicción al juego que su historia refleja. El artículo concluye señalando que en el ecosistema cripto, esta semana hubo quien jugó con la semántica, quien con el engaño y quien con fuego, recordando los altos riesgos y la volatilidad inherentes al sector.

Foresight NewsHace 2 hora(s)

Comentario Picante|Michael Saylor hace declaraciones de "chico malo"; una señora de 60 años "estafa a un joven" tras perder todo en futuros con apalancamiento

Foresight NewsHace 2 hora(s)

Tiemblen humanos, la IA sigue acelerando a toda velocidad

Sí, la IA sigue avanzando a toda velocidad. Aunque algunos creían que la Ley de Escalado (Scaling Law) podría estar tocando techo, expertos en la conferencia BAAI 2026 señalaron que está lejos de agotarse. Su efecto continúa impulsando modelos de lenguaje grandes (LLM) y multimodales. La IA también está aprendiendo a "auto-evolucionarse", usando IA para escribir y actualizar código, acercándose a la posibilidad de tomar el control del mundo digital. El próximo campo de batalla clave son los **Modelos Mundiales (World Models)**, que buscan que la IA comprenda e interactúe con el mundo físico. Sin embargo, aún no existe un consenso sobre la ruta técnica óptima (basada en lenguaje, píxeles, estructuras 3D o representaciones visuales) y persisten desafíos con los datos. Se estima que su desarrollo y convergencia llevarán de 3 a 5 años más. En el frente de la aplicación, los **Agentes (Agents)** son clave para llevar la IA a la vida cotidiana. Han pasado de ser "utilizables" a empezar a ser "útiles", volviéndose más proactivos y capaces de manejar tareas complejas en campos como la medicina o la investigación. Para que sean realmente "buenos", es crucial perfeccionar el **Harness**: el marco o entorno de ingeniería que gestiona la comprensión de la intención del usuario, la planificación de tareas, la ejecución y la verificación, superando las limitaciones del modelo solo. En resumen, la IA está en una carrera acelerada en dos frentes: hacia dentro, dominando y auto-evolucionando el mundo digital; y hacia fuera, buscando comprender y actuar en el mundo físico a través de Modelos Mundiales y Agentes más competentes.

marsbitHace 2 hora(s)

Tiemblen humanos, la IA sigue acelerando a toda velocidad

marsbitHace 2 hora(s)

Investigadores de Ethereum proponen SPHINCS-, un esquema de firmas para carteras poscuánticas

**TL;DR** * Una publicación de Ethereum Research propone SPHINCS-, un esquema de verificación de firmas post-cuántico sin estado optimizado para la EVM. * El diseño reemplaza las funciones SHAKE256 estándar con KECCAK256 nativo de la EVM, permitiendo una implementación en Solidity sin cambios de protocolo o precompilados. * La variante C13 verifica con unos 127.000 gas y una firma de 3.704 bytes. * La propuesta es no estándar y está en fase de investigación, pero contribuye al creciente debate sobre seguridad post-cuántica en Ethereum. Investigadores de Ethereum exploran SPHINCS- ("SPHINCS menos"), un nuevo diseño de firma post-cuántico que permitiría a las billeteras verificar firmas resistentes a la computación cuántica directamente en la Máquina Virtual de Ethereum (EVM) sin requerir cambios en el protocolo. El esquema se adapta a las limitaciones prácticas de las billeteras blockchain, reduciendo el presupuesto de firmas por clave a un rango más relevante (2^14 a 2^20) en lugar del estándar 2^64, argumentando que las direcciones normales no necesitan un número astronómico de firmas. La propuesta, aún en etapa de investigación y no estándar, sustituye las funciones hash estándar por KECCAK256, nativo de Ethereum, lo que posibilita implementar la lógica de verificación en Solidity. Para su variante C13, se reportan costes de verificación de ~127.000 gas y un tamaño de firma de 3.704 bytes, mostrando eficiencia frente a esquemas estándar. Sin embargo, se señalan compromisos, como tiempos de firma muy largos en hardware wallets (hasta 390 segundos), resaltando la brecha entre eficiencia teórica y experiencia de usuario práctica. Aunque no resuelve todo el desafío de la migración post-cuántica, SPHINCS- representa una ruta de verificación concreta, nativa de la EVM y sin estado, que podría funcionar sin depender de cambios en la capa base de Ethereum, aportando al planeamiento a largo plazo para la seguridad de las cuentas.

bitcoinistHace 4 hora(s)

Investigadores de Ethereum proponen SPHINCS-, un esquema de firmas para carteras poscuánticas

bitcoinistHace 4 hora(s)

Trading

Spot
Futuros
活动图片