Anthropic se disculpó, pero el negocio de la "seguridad" no se ha detenido

marsbitPublicado a 2026-06-12Actualizado a 2026-06-12

Resumen

El 11 de junio, Anthropic se disculpó por una función de "clasificador de seguridad inteligente" en su nuevo modelo Claude Fable 5. Este sistema identificaba y degradaba silenciosamente solicitudes de desarrollo de IA avanzada a un modelo inferior, lo que generó críticas. Anthropic argumentó que era para "proteger" su ventaja competitiva y a los usuarios, pero muchos lo vieron como una defensa comercial disfrazada de seguridad, apuntando específicamente a investigadores rivales. Tras ser descubierto, la compañía prometió hacer las degradaciones visibles, admitiendo que esto podría causar más falsos positivos y afectar a usuarios comunes. El artículo sostiene que la "seguridad" para Anthropic es un negocio. Critica su estrategia de publicar investigaciones que amplifican los riesgos de la IA (como un modelo que acelera la creación de exploits) justo antes de lanzar productos premium con primas de seguridad, creando un ciclo de ansiedad y monetización. Su valoración de 965.000 millones de dólares y planes de OPV se basan en esta imagen de "IA más segura". Se contrasta con OpenAI, que se centra en herramientas y escala. Anthropic, en cambio, vende ansiedad y una supuesta indispensabilidad a clientes corporativos y gubernamentales preocupados por el riesgo. El incidente revela que su definición de "riesgo" incluye actividades que amenazan su liderazgo comercial. La disculpa, por tanto, es vista como un simple parche de relaciones públicas que no cambia su lógica comercial centr...

El 11 de junio, Anthropic se disculpó. El modelo no falló, se disculpó por "no encontrar el equilibrio" — el nuevo Claude Fable 5 hizo travesuras: una vez que detectaba que estabas usando Claude para desarrollo de modelos de vanguardia, el sistema enviaba silenciosamente tu solicitud al Opus 4.8, más débil, en segundo plano.

Después de ser descubiertos, la explicación de Anthropic fue excéntrica: en el futuro, te notificarán antes de reducir la inteligencia.

La réplica de los usuarios fue directa: "¿Vas a avisar antes de cambiar de opinión con esa táctica?"

En realidad, el núcleo del problema nunca fue si el modelo cambió, sino que la llamada "seguridad" de Anthropic, desde el principio, ha sido un negocio.

La postura del algoritmo siempre oscila siguiendo el dinero.

Defensa competitiva, haciéndose pasar por defensa de seguridad

La causa del asunto fue que Anthropic lanzó un "clasificador de seguridad inteligente" con el Fable 5. El discurso oficial fue: detecta solicitudes de alto riesgo, degrada automáticamente, protege a los usuarios.

¿Qué es de alto riesgo? Anthropic reveló: "Evitar que adversarios extranjeros usen el modelo para acelerar la I+D, proteger nuestra ventaja competitiva."

Los usuarios no necesitan que los protejan, los acuerdos de exención de responsabilidad ya los protegen suficientemente. Lo que Anthropic realmente quiere decir es: si usas Claude para investigación en IA, estás compitiendo por su sustento. La seguridad es el envoltorio, la esencia es la defensa competitiva. En pocas palabras, todo son maniobras.

Lo más increíble es que este mecanismo de defensa era sigiloso. Afortunadamente, al final, Anthropic dijo una gran verdad en su declaración de disculpas: "Las restricciones de seguridad invisibles pueden dirigirse con más precisión a objetivos específicos, permitiéndonos lanzar rápidamente, y con una tasa de falsos positivos extremadamente baja."

Los investigadores en IA son el objeto de esa restricción precisa.

Ahora se vieron forzados a cambiarlo a "visible", puramente porque la maniobra salió mal. Incluso se adelantaron a poner el parche: después de ser visible, "inevitablemente habrá más falsos positivos". Es decir, la experiencia de los usuarios comunes tendrá que pagar las consecuencias.

Estas reglas nunca fueron neutrales, solo protegen a los que ponen el dinero.

Trilogía: crear expectación, monetizar, cosechar

El juego de Anthropic está más calculado que el propio modelo de lenguaje.

El 10 de junio, lanzaron primero una investigación sobre seguridad: entrenaron un modelo capaz de generar código de explotación de vulnerabilidades en cuestión de horas, basándose en parches de seguridad. Lo que a los hackers les tomaba días o incluso semanas armar, ahora se comprimió al nivel de horas. La investigación en sí es sólida, pero publicada el mismo día del lanzamiento del Fable 5, el asunto cambia de sabor: por un lado, demuestran que la IA es insegura, por el otro, venden la "solución de respaldo".

El "modelo legendario" Fable 5 tiene un precio de $10 entrada / $50 salida, un salto más caro que Opus 4.8. El clasificador de seguridad se convirtió en el punto central de la prima. El mercado de capitales fue aún más complaciente: la valoración de Anthropic es de 9,650 mil millones de dólares, planean salir a bolsa (IPO) en octubre, con Goldman Sachs y J.P. Morgan como suscriptores conjuntos. Lo que se compra no son los parámetros del modelo, es la imagen de "la empresa de IA más segura".

La investigación amplifica la ansiedad, el producto cosecha la prima, el capital se monetiza. Tres cosas fluyendo según los intereses, un circuito cerrado perfecto. El único problema es que esta vez el circuito tuvo fugas: con tantas prisas por limitar a la competencia, olvidaron que en la comunidad hay quienes pueden detectarlo.

OpenAI vende herramientas, Anthropic vende ansiedad

Comparado con OpenAI, el enfoque es completamente diferente.

OpenAI presentó en secreto su solicitud de salida a bolsa, con una valoración cercana al billón de dólares, y habla de una "superapp": ChatGPT tiene 900 millones de usuarios activos semanales, se integra con Visa para crear un ecosistema. La lógica es directa: dar herramientas, ganar tráfico. Codiciosos, pero francos.

Anthropic no compite en escala, compite en irreemplazabilidad. Toda la industria está ansiosa por la seguridad, ellos interpretan el papel del "único adulto responsable". Sus mecenas son gobiernos y gigantes corporativos, a quienes más les asusta que algo salga mal, y quienes más están dispuestos a pagar por "que nada salga mal".

Por eso, Anthropic debe mantener la IA en un estado de "Schrödinger": siempre peligrosa pero controlable. Demasiado segura, el clasificador no se vende; demasiado peligrosa, los clientes se asustan. ¿La mejor solución? Aferrar el poder de definir "peligro" en sus propias manos.

El incidente de reducción de inteligencia solo fue llevar esta lógica al extremo: el límite del "peligro" se empujó hasta "usar Claude para investigación en IA". No importa si tu investigación es dañina o no, amenazar mi posición de liderazgo es el pecado original.

La IA no tiene valores, simplemente convierte los cálculos comerciales del jefe en código.

La disculpa, solo es el servicio postventa del negocio

¿Y después de la disculpa? Pasar de reducir la inteligencia en secreto, a avisar antes de hacerlo.

Los usuarios lo ven claro: "¿Realmente crees que en el futuro no reducirá la calidad de la salida a escondidas?"

La confianza, una vez rota, se rompió. Además, el tono comercial no ha cambiado: la investigación sigue amplificando la ansiedad, el producto sigue cosechando la prima.

Según un informe de The Wall Street Journal, OpenAI está considerando reducir significativamente los precios, intentando arrebatar clientes a Anthropic. Las guerras de precios no son nada nuevo, pero este asunto revela una verdad oculta: la degradación silenciosa afecta a los investigadores en IA, daña la reputación en los círculos de expertos. Y los clientes empresariales (B2B) que compran Anthropic, no compran parámetros, compran la imagen de "los que más saben de seguridad en la industria". Una vez que esa imagen se agrieta en el núcleo de la comunidad de desarrolladores, ¿por qué los clientes gubernamentales y corporativos que pagan por la "prima de seguridad" seguirían creyendo que eres "el más seguro"?

En esa valoración de 9,650 mil millones, ¿cuánto es capacidad real y cuánto es puro espectáculo?

El código de Anthropic es honesto. El clasificador de seguridad siempre protege el valor, la investigación se encarga de amplificar la ansiedad, el producto se encarga de cosechar la prima, la salida a bolsa (IPO) se encarga de la monetización. Esta disculpa no es más que un parche al sistema: pasar de "reducir la inteligencia en secreto" a "reducir la inteligencia abiertamente".

Si las políticas de seguridad realmente funcionaran, Anthropic no tendría que publicar investigaciones año tras año demostrando que los parches pueden ser violados. Si el clasificador fuera realmente neutral, hacer investigación en IA no sería clasificado como de alto riesgo.

La respuesta ya estaba escrita en la lógica comercial.

La seguridad es el mejor negocio. La disculpa es solo el servicio postventa del negocio.

Este artículo proviene del WeChat Official Account "AI唱反调" (IA lleva la contraria), autor: 长青 (Chang Qing).

Preguntas relacionadas

Q¿Qué es lo que causó la disculpa de Anthropic y cuál fue la explicación que dieron?

AAnthropic se disculpó porque su nuevo modelo Claude Fable 5, equipado con un 'clasificador de seguridad inteligente', realizaba una operación encubierta: cuando detectaba que un usuario estaba realizando investigación o desarrollo de vanguardia en IA, redirigía silenciosamente la solicitud al modelo más débil Opus 4.8. Su excusa fue que, en el futuro, notificarían a los usuarios antes de realizar tal 'degradación'.

QSegún el artículo, ¿cuál es la verdadera naturaleza de la 'seguridad' promovida por Anthropic?

ASegún el artículo, la 'seguridad' promovida por Anthropic es en realidad un negocio. Su estrategia no es neutral; está diseñada principalmente para proteger su ventaja competitiva y los intereses comerciales de sus inversores, actuando más como una defensa contra la competencia que como una protección genuina para los usuarios.

Q¿Cómo contrasta el enfoque de negocio de Anthropic con el de OpenAI según la descripción del artículo?

AMientras OpenAI se centra en crear 'súper aplicaciones' como ChatGPT para ganar cuota de mercado y monetizar el tráfico, con un enfoque descrito como codicioso pero franco, Anthropic se posiciona como la empresa 'más responsable' en seguridad. Vende ansiedad a gobiernos y grandes corporaciones, asegurando ser la única que puede controlar los riesgos de la IA, y cobra una prima por ello.

Q¿Qué consecuencias podría tener el incidente de la 'degradación encubierta' para la reputación y el negocio de Anthropic?

AEl incidente podría dañar severamente la confianza, especialmente entre los investigadores y desarrolladores de IA (la comunidad 'geek'), que son fundamentales para su ecosistema. Dado que los clientes empresariales y gubernamentales pagan una prima por la imagen de Anthropic como la 'empresa de IA más segura', una grieta en esa reputación entre sus usuarios técnicos clave podría llevar a estos clientes a cuestionar su valor y considerar alternativas, poniendo en riesgo su alta valoración.

Q¿Cuál es, en esencia, la crítica principal del artículo hacia la estrategia de Anthropic?

ALa crítica principal es que Anthropic ha convertido la 'seguridad' en un producto comercial cínico. Su estrategia consiste en un ciclo cerrado: investigaciones que amplifican la ansiedad sobre los peligros de la IA, productos que capitalizan esa ansiedad cobrando precios premium, y una próxima OPV para monetizar la valoración resultante. Las disculpas y ajustes tras el escándalo son solo un 'servicio postventa' para mantener este negocio, sin cambiar su lógica comercial fundamental.

Lecturas Relacionadas

La estrategia mantiene el dividendo preferente de STRC en 12% ya que el precio aún está por debajo del valor nominal

Aunque las acciones preferentes STRC de Strategy cerraron julio muy por debajo de su valor nominal de 100 dólares, el dividendo de agosto se mantendrá en el 12%, sin incrementos. Michael Saylor, presidente ejecutivo, anunció la noticia, promocionando STRC como una forma de "estirar los ingresos". Agosto será el segundo mes con pagos quincenales. Las acciones STRC cerraron a 89,46 dólares el viernes, con un aumento mensual del 5,42%, tras un mal desempeño en junio. El volumen negociado fue aproximadamente dos tercios del promedio diario. El CEO Phong Le reiteró que el objetivo corporativo es que STRC cotice entre 99 y 100 dólares con el tiempo. Saylor sugirió un posible anuncio sobre cambios en las tenencias de Bitcoin de la compañía. Strategy reportó una pérdida neta de 8.220 millones de dólares en el segundo trimestre, principalmente por una pérdida no realizada de 8.320 millones en Bitcoin. La compañía ha construido una reserva de efectivo de 3.750 millones de dólares para respaldar los pagos de acciones preferentes, suficiente para más de dos años de dividendos e intereses. Recientemente recompró 25 millones de dólares en acciones STRC con descuento y planea continuar comprando mientras cotizan por debajo de los 100 dólares.

cointelegraphHace 1 hora(s)

La estrategia mantiene el dividendo preferente de STRC en 12% ya que el precio aún está por debajo del valor nominal

cointelegraphHace 1 hora(s)

Los retiros de Bitcoin continúan: 8 años de almacenamiento en una cartera fría Coldcard terminaron en cero

Retirada de bitcoin continúa: 8 años en cartera fría Coldcard terminan en cero La cartera hardware Coldcard ha sido vulnerada, provocando una nueva oleada de retiradas de fondos de dispositivos afectados. Galaxy Research informa que el volumen total robado asciende a 1.367,05 BTC (unos 88,6 millones de dólares) desde 4.585 direcciones, superando ampliamente los 594,5 BTC reportados inicialmente el 30 de julio de 2026. La mayor parte de lo robado permanece inactiva en las direcciones de los atacantes. El problema no reside en el firmware, que ya fue actualizado por Coinkite, sino en las frases semilla (seed phrases) generadas desde marzo de 2021 debido a un error de programación. Estas frases son fácilmente descifrables, y actualizar el firmware no las cambia. Solo transferir los fondos a una nueva dirección con una nueva frase semilla elimina la vulnerabilidad. El fallo se originó al integrar la biblioteca libNgU, lo que hizo que los dispositivos dejaran de usar el generador de números aleatorios por hardware STM32 y pasaran a usar el generador software Yasmarang, inicializado con datos públicamente accesibles como el número de serie del chip. Afecta a frases semilla creadas en dispositivos Mk2/Mk3 (firmware 4.0.1–4.1.9 y hasta 5.0.3), Mk4/Mk5 (hasta v5.6.0) y Q (hasta v1.5.0Q). Se excluyen aquellas creadas con al menos 50 lanzamientos de dados independientes o una passphrase BIP-39 fuerte y única. Los usuarios deben generar una nueva frase semilla en firmware corregido y transferir sus activos. Un caso ilustrativo es el de un inversor de 39 años que perdió 2 BTC (unos 130.000 dólares) en minutos, ahorrados durante ocho años mediante trabajo físico como protección contra la hiperinflación en su país, con el objetivo de una jubilación anticipada a los 50 años. Su estrategia conservadora de "comprar y mantener en frío" se vio truncada, dejándolo devastado y decidido a abandonar las criptomonedas. Este incidente recuerda vulnerabilidades históricas por generadores de números aleatorios débiles, como la de la biblioteca BitcoinJS (2011-2015), que causó grandes pérdidas. Subraya que el almacenamiento offline no garantiza automáticamente seguridad criptográfica, especialmente cuando la entropía se ve comprometida dentro del propio dispositivo "cerrado".

cryptonews.ruHace 1 hora(s)

Los retiros de Bitcoin continúan: 8 años de almacenamiento en una cartera fría Coldcard terminaron en cero

cryptonews.ruHace 1 hora(s)

¡Se observa un crecimiento explosivo en los volúmenes de trading de 15 altcoins en Corea del Sur!

Las principales bolsas de criptomonedas de Corea del Sur, Upbit y Bithumb, registraron un fuerte aumento en el volumen de operaciones con varios altcoins. En las últimas 24 horas, el volumen total de los altcoins más populares alcanzó aproximadamente 347,7 millones de dólares. MetaDAO (META) lideró la clasificación con un volumen de 65,84 millones de dólares solo en Upbit, representando el 12,39% del volumen spot total de la bolsa. Le siguió Euler (EUL) con 47,65 millones de dólares combinados en ambas plataformas. XRP, tradicionalmente popular entre los inversores coreanos, registró 38,11 millones de dólares. A continuación, se presentan los volúmenes de operaciones de 24 horas para los 15 altcoins más negociados en Upbit y Bithumb: 1. MetaDAO (META) – 65,84M$ 2. Euler (EUL) – 47,65M$ 3. XRP – 38,11M$ 4. ThunderCore (TT) – 35,64M$ 5. Babylon (BABY) – 25,15M$ 6. Geodnet (GEOD) – 20,28M$ 7. Hyperlane (HYPER) – 19,72M$ 8. Momentum (MMT) – 17,67M$ 9. Ondo (ONDO) – 15,65M$ 10. Shiba Inu (SHIB) – 10,55M$ 11. DOME – 9,61M$ 12. Lorenzo Protocol (BANK) – 9,51M$ 13. Akash Network (AKT) – 7,36M$ 14. Dogecoin (DOGE) – 7,30M$ 15. Worldcoin (WLD) – 5,74M$ *Esto no es una recomendación de inversión.

cryptonews.ruHace 2 hora(s)

¡Se observa un crecimiento explosivo en los volúmenes de trading de 15 altcoins en Corea del Sur!

cryptonews.ruHace 2 hora(s)

¡La compañía de Donald Trump vendió otro lote importante de bitcoins!

Se reporta una nueva transferencia de bitcoins desde direcciones presuntamente vinculadas a la compañía mediática del expresidente estadounidense Donald Trump, Trump Media & Technology Group, a la bolsa de criptomonedas CryptoCom. Según datos de la cadena de bloques, las direcciones asociadas con Trump Media transfirieron aproximadamente 2,628 BTC (unos 165 millones de dólares) a CryptoCom. Anteriormente se creía que la empresa había comprado un total de 11,542 BTC a un precio promedio de $118,500. Se afirma que en 2026 se retiraron de estas direcciones alrededor de 7,281 BTC, y que aproximadamente 4,261 BTC permanecen almacenados en ellas. Se estima que las pérdidas totales, realizadas y no realizadas, de Trump Media por sus inversiones en bitcoin ascienden a unos 555 millones de dólares. Cabe señalar que el envío de criptomonedas a una bolsa no significa necesariamente una venta; podría ser para custodia, gestión de liquidez u otra operación. Sin embargo, estas transferencias desde carteras frías suelen interpretarse como preparativos para la venta.

cryptonews.ruHace 4 hora(s)

¡La compañía de Donald Trump vendió otro lote importante de bitcoins!

cryptonews.ruHace 4 hora(s)

Por qué el Bitcoin se mantiene en $64,000 tras la dura pausa de la Fed

Bitcóin cierra julio cerca de los 64.000 dólares tras una volátil reacción a la decisión de la Fed de mantener las tasas sin cambios, aunque sin indicar un pronto aflojamiento monetario. Esto ha provocado una rotación de capital hacia los ETF de Bitcoin, que registraron una entrada neta de 32,1 millones de dólares, mientras que los fondos de Ethereum experimentaron salidas. El mercado de criptomonedas, con una capitalización de unos 2,29 billones de dólares, se mantiene en un rango lateral, con Bitcoin encontrando soporte en 63.000-63.500 dólares y resistencia en 66.000 dólares. La Fed mantuvo su tasa clave, pero tres miembros votaron a favor de un aumento, señalando una postura más dura de lo esperada. En este entorno macroeconómico incierto, los inversores institucionales parecen favorecer a Bitcoin como activo principal, aunque persiste el interés selectivo en activos como Solana. Mientras, la aprobación de la ley CLARITY en EE.UU. se retrasa hasta después del receso de agosto. Para el último día de julio, el enfoque estará en los datos macro de EE.UU. El escenario base para Bitcoin es la consolidación entre 63.000 y 66.000 dólares, con su ruptura superior dependiendo de nuevos flujos institucionales. La estabilidad por encima de 63.000 dólares para BTC, el mantenimiento de Ethereum sobre 1.860 dólares y las entradas continuas en ETF son claves para una posible base de recuperación en la segunda mitad del año.

cryptonews.ruHace 4 hora(s)

Por qué el Bitcoin se mantiene en $64,000 tras la dura pausa de la Fed

cryptonews.ruHace 4 hora(s)

Trading

Spot