Autor: Langosta Negra, Deep潮 TechFlow
Título original: La exportación de Tokens: Vendiendo la electricidad china al mundo
En el verano de 1858, un cable de cobre atravesó el fondo del océano Atlántico, conectando Londres y Nueva York.
El significado de esto nunca fue la velocidad de transmisión, sino la estructura de poder: quien tendía el cable submarino, podía controlar el flujo de información. El Imperio Británico, con su red global de telégrafos, mantenía en sus manos la inteligencia de las colonias, el precio del algodón y las noticias de guerra.
La grandeza del imperio no solo radicaba en su flota, sino también en ese cable.
Más de 160 años después, esta lógica se está repitiendo de una manera inesperada.
En 2026, los grandes modelos de IA de China están conquistando sigilosamente el mercado global de desarrolladores. Los últimos datos de OpenRouter muestran que, del consumo total de Tokens de los diez principales modelos en la plataforma, los modelos chinos representan el 61%, y los tres primeros son todos de China. Las solicitudes API de desarrolladores en San Francisco, Berlín y Singapur cruzan diariamente los cables submarinos del Pacífico hacia los centros de datos chinos, donde se consume la potencia de cálculo, fluye la electricidad, y los resultados se transmiten de vuelta.
La electricidad nunca abandonó la red eléctrica china, pero su valor se entregó transfronterizamente a través de los Tokens.
La gran migración de modelos de IA
El 24 de febrero de 2026, OpenRouter publicó datos semanales: el consumo total de Tokens de los diez principales modelos fue de aproximadamente 8.7 billones, de los cuales los modelos chinos acapararon 5.3 billones, un 61%. MiniMax M2.5 se situó en el primer lugar con 2.45 billones de Tokens, seguido por Kimi K2.5 y Zhipu GLM-5; los tres primeros eran todos de China.
Datos más recientes del 26 de febrero
Esto no fue casualidad; una chispa encendió todo.
A principios de año, OpenClaw apareció de la nada, una herramienta de código abierto que permite a la IA realmente "trabajar", controlando directamente ordenadores, ejecutando comandos y completando flujos de trabajo complejos. Las estrellas en GitHub superaron las 210,000 en semanas.
John, un profesional financiero, instaló OpenClaw de inmediato y lo conectó a la API de Anthropic para monitorear automáticamente información bursátil y reportar señales de trading. Horas después, miró el saldo de su cuenta y se quedó pasmado por unos segundos: decenas de dólares, desaparecidos.
Esta es la nueva realidad que trae OpenClaw. Antes, charlar con la IA consumía unos miles de Tokens por diálogo, un costo insignificante. Con OpenClaw, la IA ejecuta simultáneamente docenas de subtareas en segundo plano, invocando contexto repetidamente, iterando en ciclos. El consumo de Tokens no es lineal, es exponencial. La factura es como un coche acelerando con el capó abierto, el indicador de combustible cae sin parar.
En la comunidad de desarrolladores comenzó a circular un "truco": usar tokens OAuth para conectar directamente las cuentas de suscripción de Anthropic o Google a OpenClaw, convirtiendo la cuota mensual "ilimitada" en combustible gratuito para el Agente de IA, un método adoptado por muchos desarrolladores.
La contraofensiva oficial no se hizo esperar.
Anthropic actualizó su acuerdo el 19 de febrero, prohibiendo explícitamente el uso de credenciales de suscripción de Claude en herramientas terceras como OpenClaw. Para acceder a las funciones de Claude, había que pasar por el canal de facturación API. Google fue más allá, bloqueando masivamente las cuentas de suscripción que accedían a Antigravity y Gemini AI Ultra through OpenClaw.
"El mundo está cansado del dominio", John se pasó de inmediato a los brazos de los grandes modelos chinos.
En OpenRouter, el modelo chino MiniMax M2.5 tiene una puntuación del 80.2% en tareas de ingeniería de software, mientras que Claude Opus 4.6 tiene un 80.8%, una diferencia casi insignificante. Pero el precio es abismal: el primero cuesta 0.3 dólares por millón de Tokens de entrada, el segundo 5 dólares, una diferencia de aproximadamente 17 veces.
John hizo el cambio, su flujo de trabajo seguía funcionando, y su factura se redujo en un orden de magnitud. Esta migración está ocurriendo simultáneamente a nivel global.
Chris Clark, COO de OpenRouter, lo dijo claramente: la razón por la que los modelos de código abierto chinos han capturado una gran cuota de mercado es su participación anormalmente alta en los flujos de trabajo de agentes ejecutados por desarrolladores estadounidenses.
Exportación de electricidad
Para entender la esencia de la exportación de Tokens, primero hay que comprender la estructura de costos de un Token.
Parece ligero: un Token equivale aproximadamente a 0.75 palabras en inglés; una conversación normal con la IA consume solo unos miles de Tokens. Pero cuando estos Tokens se acumulan por billones, la realidad física subyacente se vuelve abrumadora.
Desglosando el costo de un Token, el núcleo son solo dos elementos: potencia de cálculo (compute) y electricidad.
La potencia de cálculo es la depreciación de las GPU: compras una NVIDIA H100 por unos treinta mil dólares, y su vida útil, calculada por cada inferencia, es el costo de depreciación. La electricidad es el combustible para el funcionamiento continuo del centro de datos: una GPU consume unos 700 vatios a plena carga, y sumando los costos del sistema de refrigeración, la factura eléctrica de un gran centro de datos de IA puede superar fácilmente los cientos de millones de dólares anuales.
Ahora, traza este proceso físico en un mapa.
Un desarrollador estadounidense en San Francisco envía una solicitud API. Los datos viajan desde California, a través de cables submarinos del Pacífico, hasta un centro de datos en algún lugar de China. El clúster de GPU comienza a trabajar, la electricidad fluye desde la red eléctrica china hacia esos chips, se completa la inferencia y los resultados se transmiten de vuelta. Todo el proceso, quizás, toma uno o dos segundos.
La electricidad nunca abandonó la red eléctrica china, pero el valor de la electricidad, a través del Token, se entregó transfronterizamente.
Aquí hay algo maravilloso que el comercio común no puede alcanzar: el Token no tiene forma física, no necesita pasar por aduanas, no está sujeto a aranceles, e incluso está casi invisible en las estadísticas comerciales actuales. China exporta grandes cantidades de servicios de computación y electricidad, pero en los datos oficiales de comercio de mercancías, es casi invisible.
El Token se convierte en un derivado de la electricidad; la exportación de Tokens es esencialmente la exportación de electricidad.
Esto también se beneficia del precio relativamente bajo de la electricidad en China, aproximadamente un 40% más barata que en Estados Unidos, una diferencia de costo a nivel físico que los competidores no pueden replicar fácilmente.
Además, los grandes modelos de IA chinos también tienen ventajas algorítmicas y de "competencia feroz" (内卷).
La arquitectura MoE de DeepSeek V3 activa solo parte de los parámetros durante la inferencia; pruebas independientes muestran que su costo de inferencia es aproximadamente 36 veces menor que el de GPT-4o. MiniMax M2.5 similarly activa solo 10B de sus 229B de parámetros totales.
En la capa superior está la competencia feroz: Alibaba, ByteDance, Baidu, Tencent, Moonshot AI, Zhipu, MiniMax... más de diez empresas compitiendo en la misma pista, los precios ya han caído por debajo del margen de beneficio razonable; perder dinero para ganar participación de mercado es la norma en la industria.
Mirando de cerca, es igual que la exportación de productos manufacturados chinos: aprovechar las ventajas de la cadena de suministro y la competencia interna para reducir drásticamente el precio del Token.
De Bitcoin a Token
Antes del Token, hubo otra exportación de electricidad.
Alrededor de 2015, los administradores de centrales eléctricas en Sichuan, Yunnan y Xinjiang comenzaron a recibir visitantes extraños.
Estas personas alquilaban fábricas abandonadas, las llenaban de máquinas densamente empaquetadas y las hacían funcionar las 24 horas del día. Las máquinas no producían nada, solo resolvían incesantemente un problema matemático y, ocasionalmente, de este problema infinito, calculaban un Bitcoin.
Esta fue la primera forma de exportación de electricidad: convertir la hidroelectricidad y energía eólica baratas, a través del hashing de los mineros, en activos digitales de circulación global, y luego convertirlos en dólares en los exchanges.
La electricidad no cruzó ninguna frontera, pero su valor, con el Bitcoin como vehículo, fluyó hacia el mercado global.
Durante esos años, la potencia de cálculo de China llegó a representar más del 70% de la minería global de Bitcoin. La hidroelectricidad y carbón chinos, de esta manera indirecta, participaron en una redistribución del capital global.
En 2021, todo esto se detuvo abruptamente. Cayó el martillo regulatorio, los mineros se dispersaron, y la potencia de cálculo migró a Kazajistán, Texas (EE.UU.) y Canadá.
Pero esta lógica en sí nunca desapareció, solo esperaba una nueva forma, hasta que irrumpió ChatGPT, los grandes modelos compitieron ferozmente, las antiguas granjas de minería de Bitcoin se transformaron en centros de datos de IA, las máquinas mineras se convirtieron en GPU de computación, lo que antes producía Bitcoin ahora produce Tokens, lo único que permanece igual es la electricidad.
La exportación de Bitcoin y la exportación de Tokens son estructuralmente similares en su lógica subyacente, pero el Token tiene más valor comercial en la actualidad.
La minería con ASICs es un cálculo puramente matemático; el Bitcoin producido es un activo financiero cuyo valor proviene de la escasez y el consenso del mercado, y no tiene nada que ver con "qué se calculó". La potencia de cálculo en sí no es productiva, es más bien un subproducto de un mecanismo de confianza.
La inferencia de grandes modelos es diferente. Las GPU consumen electricidad y producen servicios cognitivos reales: código, análisis, traducción, creatividad. El valor del Token proviene directamente de su utilidad para el usuario. Es una integración más profunda; una vez que el flujo de trabajo de un desarrollador depende de un modelo específico, el costo de migrar crece exponencialmente con el tiempo.
Por supuesto, hay otra diferencia clave: la minería de Bitcoin fue expulsada de China, mientras que la exportación de Tokens está siendo elegida activamente por desarrolladores globales.
La guerra de los Tokens
El cable submarino tendido en 1858 representaba la soberanía del Imperio Británico sobre la autopista de la información; quien poseía la infraestructura, definía las reglas del juego.
La exportación de Tokens es también una guerra no declarada, llena de obstáculos.
La soberanía de datos es el primer muro. Una solicitud API de un desarrollador estadounidense procesada por un centro de datos chino significa que los datos fluyen físicamente a través de China. Para desarrolladores individuales y aplicaciones pequeñas, esto no es un problema, pero en escenarios que involucran datos sensibles, información financiera o cumplimiento gubernamental, es una barrera dura. Por eso la tasa de penetración de los modelos chinos es más alta en herramientas de desarrollo y aplicaciones personales, y casi inexistente en sistemas centrales empresariales.
La prohibición de chips es el segundo muro. El desarrollo de IA en China enfrenta restricciones a la exportación de GPUs high-end de NVIDIA. La arquitectura MoE y la optimización algorítmica solo pueden compensar parcialmente esta desventaja; el techo todavía existe.
Pero la resistencia actual es solo el prólogo; se está formando un campo de batalla mayor.
Los Tokens y los modelos de IA se han convertido en una nueva dimensión de juego estratégico entre China y Estados Unidos, comparable a los semiconductores o Internet del siglo XX, o incluso más cercano a una analogía más antigua: la carrera espacial.
En 1957, la URSS lanzó el Sputnik 1, y Estados Unidos se estremeció, lanzando inmediatamente el programa Apolo, invirtiendo recursos equivalentes a cientos de miles de millones de dólares hoy, para no quedarse atrás en la carrera espacial.
La lógica de la competencia por la IA es sorprendentemente similar, pero su intensidad superará con creces la carrera espacial. El espacio es, después de todo, físico, la gente común no lo siente; la IA se infiltra en los capilares de la economía: detrás de cada línea de código, cada contrato, cada sistema de decisión gubernamental, podría estar funcionando el gran modelo de algún país. El modelo de quién se convierta en la opción por defecto de infraestructura para los desarrolladores globales, obtendrá无形中 (de forma invisible) una influencia estructural sobre la economía digital global.
Esto es precisamente lo que preocupa realmente a Washington sobre la exportación de Tokens china.
Cuando el repositorio de código de un desarrollador, su flujo de trabajo de Agentes, la lógica de su producto, todos se construyen alrededor de la API de un modelo chino, el costo de migración aumentará exponencialmente con el tiempo. Entonces, incluso si Estados Unidos legisla restricciones, los desarrolladores se resistirán con los pies, como hoy ningún programador puede abandonar GitHub.
La exportación de Tokens de hoy quizás sea solo el comienzo de este largo juego. Los grandes modelos chinos no proclaman querer颠覆 (revolucionar) nada, simplemente ofrecen sus servicios a un precio más bajo a cada desarrollador del mundo que tenga una API Key.
Esta vez, quienes tienden el cable son los equipos de ingenieros que escriben código en Hangzhou, Beijing, Shanghai, y los clústeres de GPU que funcionan día y noche en alguna provincia del sur.
Esta competencia no tiene cuenta regresiva, ocurre las 24 horas del día, la unidad es el Token, el campo de batalla es el terminal de cada desarrollador.
Twitter:https://twitter.com/BitpushNewsCN
Grupo de Telegram de Bitpush:https://t.me/BitPushCommunity
Suscripción a Telegram de Bitpush: https://t.me/bitpush






