Hoy, Anthropic está experimentando una "doble alegría".
Por un lado, ha lanzado el modelo Claude Sonnet 5, "hasta ahora el modelo Sonnet con mayor capacidad de agente", cuyo rendimiento se acerca al de Opus 4.8.
Por otro lado, anunció públicamente que el Departamento de Comercio de EE.UU. ha levantado las restricciones de exportación sobre sus modelos Claude Fable 5 y Mythos 5. Anthropic reanudará el acceso a partir de mañana y pronto compartirá los últimos avances.

Según el contenido de un acuerdo firmado por el Secretario de Comercio de EE.UU., Howard Lutnick, desde que se enviaron las cartas relevantes el 12 y el 26 de junio, Anthropic ha colaborado estrechamente con el gobierno estadounidense para tomar medidas y abordar los riesgos asociados con Claude Mythos 5 y Claude Fable 5.
Entre sus compromisos, Anthropic se ha comprometido a identificar y gestionar activamente los riesgos de seguridad que puedan surgir de estos modelos; a mantener una estrecha colaboración con el gobierno estadounidense en cuanto a acuerdos, estándares y arreglos de publicación para Mythos, Fable y futuros modelos; y a notificar al gobierno estadounidense en caso de detectar actividades maliciosas.
Basándose en las acciones ya tomadas y los compromisos asumidos por Anthropic, así como en la evaluación de la Oficina de Industria y Seguridad del Departamento de Comercio de EE.UU. sobre el riesgo actual de transferencia de Claude Mythos 5 y Claude Fable 5, el Departamento de Comercio de EE.UU. ha decidido retirar las medidas de control mencionadas en la carta del 12 de junio.
Esto significa que, a partir de ahora, la exportación, reexportación, y transferencia nacional, incluidas las exportaciones y reexportaciones implícitas, de Claude Mythos 5 y Claude Fable 5, ya no requerirán licencia.
Sin embargo, el Departamento de Comercio de EE.UU. se reserva el derecho de reevaluar esta decisión. Si las circunstancias cambian o si Anthropic no cumple con sus compromisos, el Departamento de Comercio podría restablecer los requisitos de licencia.

Sin embargo, para los usuarios chinos, aún no es momento de celebrar.
El mismo día, en la comunidad de desarrolladores se debate intensamente otro tema: se ha descubierto que Claude Code recopila información local sobre el proxy y la zona horaria sin el conocimiento del usuario, y transmite esta información oculta en los prompts enviados a la nube mediante técnicas de "esteganografía".
Exponen que Claude Code usa código oculto para marcar a usuarios chinos
Recientemente, se ha denunciado que Anthropic insertó subrepticiamente un fragmento de código en Claude Code.
Este código detecta automáticamente si el usuario utiliza una zona horaria china, la situación actual de su proxy de red y si está conectado a entornos relacionados con ciertos laboratorios de IA chinos.
Luego, incrusta esta información de manera esteganográfica en el prompt del sistema enviado a la IA.
Los usuarios chinos son completamente ajenos a esto, pero Anthropic puede identificarlos a través de estas "huellas digitales" invisibles.
Un desarrollador planteó inicialmente dudas en Reddit, y posteriormente publicó un informe de verificación en GitHub, afirmando haber revisado el código de las versiones 2.1.193, 2.1.195 y 2.1.196 de Claude Code y confirmado la existencia de un mecanismo oculto. Este mecanismo se clasifica como un canal de información encubierto en el prompt del sistema.
Lógica de detección
Según el informe, Claude Code detecta la variable de entorno ANTHROPIC_BASE_URL, que normalmente se activa cuando el usuario dirige Claude Code a un proxy API personalizado en lugar del endpoint oficial api.anthropic.com. Al detectar una ruta no oficial, el programa extrae el dominio del proxy, lee la zona horaria del sistema del usuario y verifica específicamente si es Asia/Shanghai o Asia/Urumqi.

Análisis utilizando GLM5.2
El informe señala que este dominio se compara con una lista decodificada que contiene 147 entradas. La lista incluye dominios de empresas tecnológicas y laboratorios de IA chinos como Baidu, Alibaba, Ant Group, ByteDance, Moonshot AI, MiniMax, Stepfun, así como numerosas direcciones de servicios de reventa o espejo de API de Claude.
Método de transmisión de información
El núcleo de la controversia radica en la ruta de transmisión de la información.
El informe señala que Claude Code no establece un campo de telemetría independiente para informar los datos. El vector de la información anómala es precisamente la frase más insignificante en el prompt del sistema: "Today's date is...".
Cuando se identifica que la zona horaria del sistema es china, el separador de fecha cambia de guion a barra, por ejemplo, 2026-06-30 se muestra como 2026/06/30. El apóstrofo en "Today's date" alterna entre caracteres Unicode visualmente similares como ', ', ʼ, ʹ, para marcar si la solicitud coincide con la lista de dominios, con palabras clave de laboratorios de IA, o con ambas. Estos símbolos son difíciles de distinguir a simple vista en la interfaz habitual.
Para el usuario común, es casi imposible diferenciar a simple vista los símbolos ', ', ʼ, ʹ, razón por la cual este mecanismo ha permanecido oculto durante tanto tiempo. Si el análisis es correcto, cada solicitud que cumple las condiciones llevaría consigo una marca tan sutil hacia el servidor.
Puntos de controversia
La recopilación de datos de telemetría es común en la industria del software. Las empresas de IA, motivadas por prevenir el abuso, frenar la reventa, evitar riesgos de sanciones e impedir la destilación de modelos, a menudo tienen razones suficientes para identificar el comportamiento del usuario. Desde esta perspectiva, no es difícil entender la motivación de Anthropic por frenar el acceso no autorizado a Claude en el mercado chino.
El punto de controversia es el método de implementación, no el objetivo en sí.
Para los mecanismos de telemetría públicamente divulgados, los desarrolladores tienen pleno derecho a estar informados y a elegir: pueden consultar la documentación, bloquear endpoints específicos o decidir si aceptan una recopilación de datos determinada. Pero ocultar información de marcación en diferencias de caracteres casi imperceptibles dentro del prompt cambia la premisa de confianza entre el usuario y la herramienta. Para un asistente de programación, traspasar este límite tiene un alto costo.
Contexto de permisos
Claude Code incorpora un sistema de permisos que cubre operaciones de lectura de archivos, ejecución de comandos Bash y edición de archivos. Las operaciones de solo lectura no requieren aprobación del usuario, mientras que las que implican ejecución de comandos o modificación de archivos necesitan confirmación de permisos.
Anthropic también ha hablado públicamente sobre el posible problema de "fatiga de aprobación" (approval fatigue) en Claude Code, reconociendo que la mayoría de los usuarios tienden a aprobar las solicitudes de permiso por costumbre, y que desactivar completamente el mecanismo de aprobación de permisos no es seguro en la gran mayoría de los escenarios.
En su propio blog de ingeniería, la empresa también ha documentado casos reales de "comportamiento erróneo del agente" (agentic misbehavior), incluyendo la eliminación accidental de ramas remotas de git, la subida involuntaria de tokens de GitHub, e incluso intentos de ejecutar operaciones de migración en bases de datos de producción.
Un agente de programación opera dentro de un repositorio de código, tiene acceso al código fuente, la estructura de archivos, los detalles del proyecto e incluso a claves que el usuario pueda exponer inadvertidamente, y se le otorgan permisos para ejecutar comandos y modificar archivos. Para una herramienta así, la confianza es la base misma de su existencia.
Si el cliente codifica subrepticiamente metadatos de enrutamiento en el prompt, los usuarios tienen motivos para preguntarse: ¿qué otra información se está registrando de manera similar? ¿Existen otras lógicas de detección no divulgadas en el cliente? ¿Se ha documentado en algún lugar estos comportamientos?
Tras la exposición del incidente, el miembro del equipo técnico de Anthropic, @trq212, respondió sobre las razones de la implementación del código e indicó que este fragmento de código sería eliminado en la nueva versión que se lanzaría al día siguiente.

Enlaces de referencia:
https://news.ycombinator.com/item?id=48734373
https://thereallo.dev/blog/claude-code-prompt-steganography
https://x.com/IntCyberDigest/status/2071971609183678544?s=20
https://www.internationalcyberdigest.com/claude-code-accused-of-hiding-china-proxy-fingerprints-inside-system-prompts/
Este artículo procede de la cuenta oficial de WeChat "机器之心" (ID: almosthuman2014), autor: 关注AI的






