Artículo | Silicon Quadrant
Cuando los usuarios ya no se debaten sobre si actualizar su paquete de datos cada mes, tal vez empiecen a debatirse sobre cuánto servicio de Tokens comprar al mes.
Los Tokens están a punto de ser empaquetados y vendidos por los operadores como un servicio estandarizado, al igual que los datos móviles, la banda ancha o los SMS.
Recientemente, los tres grandes operadores nacionales de China han lanzado sucesivamente productos de paquetes de Tokens: soluciones de suscripción mensual de Tokens para usuarios individuales, y paquetes de potencia computacional escalonados para desarrolladores y clientes empresariales, anunciando que han integrado docenas o incluso cientos de modelos grandes en sus plataformas, con la modalidad de "compra mensual, invocación de múltiples modelos, pago en la factura telefónica".
China Telecom ya ha lanzado paquetes de Tokens para uso personal y empresarial, con un costo mensual mínimo de 9.9 RMB por 10 millones de Tokens; operadores locales como Shanghai Mobile y Shanghai Telecom han introducido modelos de facturación por puntos de cuota o Tokens genéricos, donde Shanghai Mobile ofrece 400,000 Tokens por 1 RMB.
Con los operadores empezando a vender servicios de Tokens, el costo para que los usuarios cambien entre modelos grandes disminuirá significativamente. Por lo tanto, para las empresas de modelos grandes, la "lealtad del usuario" se verá debilitada, y solo una mayor "competitividad" podrá proteger su mercado.
En el futuro, los fabricantes de modelos grandes como Doubao, Qianwen, DeepSeek, etc., no solo competirán en "precio" y en la "calidad del Token por unidad de energía consumida", sino que incluso se dirigirán hacia la "capacidad de soluciones de aplicaciones de IA de mayor valor".
01 ¿Qué es el servicio de Tokens?
Para entender el servicio de Tokens, primero hay que entender qué es un Token.
Las computadoras no pueden reconocer texto directamente, solo código binario (0s y 1s). Por lo tanto, cada palabra, carácter, sonido o signo de puntuación que ingresamos se convierte en código binario a través de un mecanismo de codificación específico.
En el contexto de los modelos grandes, también se reconocen primero los códigos numéricos, y la longitud de estos códigos para cada carácter puede variar ligeramente.
El Token es la unidad mínima de procesamiento de información para los modelos grandes. La entrada del usuario, la memoria del contexto y la salida del modelo se calculan en Tokens. Cuanto más compleja sea la invocación del modelo, más largo sea el contexto o más profunda sea la cadena de ejecución del Agente, mayor será el consumo de Tokens.
Normalmente: En inglés, un Token equivale aproximadamente a 4 letras; en chino, debido a la mayor densidad de información de los caracteres chinos, un carácter, un signo de puntuación o una frase a menudo corresponden a 1 o 2 Tokens.
Dado que el pensamiento y la salida de los modelos grandes se realizan Token por Token, la industria ha adoptado la práctica de vender y liquidar el costo de invocación y la cuota de uso de los modelos grandes en forma de "por millón de Tokens (Per Million Tokens)" o "puntos de cuota".
Actualmente, las empresas de modelos grandes aplican tarifas escalonadas por Tokens. Los usuarios comunes que utilizan modelos como Doubao o Qianwen en su modo básico, lo hacen de forma gratuita; mientras que para un uso intensivo a nivel empresarial, se pueden adquirir servicios API por paquetes mensuales o de medición en diferentes niveles.
Desde el año pasado, los operadores han comenzado a abrir "supermercados de computación" para modelos grandes. Los fabricantes de modelos son los "comerciantes establecidos", y los operadores cobran "tarifas de plataforma + tarifas de computación + tarifas de canal". Lo que compran los usuarios no es el "modelo del operador", sino: en la plataforma de telecomunicaciones, utilizando la capacidad computacional de la telefónica, invocar cualquier modelo grande, facturado por Token.
En julio de 2025, China Mobile lanzó la plataforma de servicios de modelos MoMA (Mobile Model Access); en abril, China Telecom lanzó la plataforma de operación de servicios Chenxing TokenHub; en mayo, se lanzó la plataforma de servicios de Tokens "Unicom Xingluo". Estas plataformas han integrado a los principales modelos grandes de empresas como Baidu, Alibaba, ByteDance, DeepSeek, etc., con API unificadas, autorización unificada y facturación unificada.
Las plataformas de los operadores adaptan internamente múltiples modelos grandes, permitiendo a los usuarios cambiar suavemente entre ellos simplemente modificando el nombre del modelo (Model ID).
02 ¿Por qué venden Tokens los operadores?
La explosión de los servicios de Tokens no es accidental.
Primero, el cambio en el modelo de facturación. En la era tradicional de la computación en la nube, los usuarios estaban acostumbrados a pagar por el "tiempo de alquiler del servidor" o el "ancho de banda fijo" (es decir, pago por capacidad computacional en la capa IaaS), comprando velocidad de ancho de banda y tiempo. Sin embargo, con el desarrollo de los modelos grandes, las capacidades que ofrecen los diferentes modelos y los costos requeridos para diferentes tareas varían enormemente. Por ejemplo, un modelo más potente es más caro por Token individual; un contexto más largo consume más Tokens; mayor complejidad en el razonamiento implica un costo real más alto. Facturar por Token permite alinear el "grado de inteligencia consumido por el usuario" con el "costo computacional asumido por el fabricante".
En segundo lugar, reduce la barrera tecnológica y el "costo de experimentación". El desarrollo y despliegue de modelos grandes requiere inversiones que van desde decenas de millones hasta varios miles de millones de dólares. Para la gran mayoría de las pequeñas y medianas empresas y desarrolladores individuales, construir su propio modelo no es realista. El servicio de Tokens fragmenta y empaqueta la capacidad de "Inteligencia Artificial General (AGI)"; los desarrolladores no necesitan preocuparse por cuántas decenas de miles de GPUs están consumiendo energía en el fondo, solo necesitan invocar la API según la demanda y pagar la tarifa de Tokens.
Finalmente, la demanda apremiante generada por la explosión de la capa de aplicación. Al adentrarnos en 2026, han estallado escenarios de aplicación como los Agentes de IA, la programación asistida por IA y la generación de contenido multimodal. En su funcionamiento diario, estas aplicaciones necesitan interactuar frecuentemente con los modelos grandes subyacentes para "procesar y producir" información. Una herramienta automatizada de IA para escribir código podría consumir millones de Tokens en una sola noche. Esta interacción de alta frecuencia y gran volumen obliga al mercado a ofrecer servicios de paquetes de Tokens más estandarizados, estables y competitivos en precio.
En las últimas dos décadas, el modelo comercial de los operadores ha experimentado tres cambios fundamentales en su unidad de medición central.
La primera etapa fue la era de la voz, donde los operadores vendían minutos; la segunda etapa fue la era de la internet móvil, vendiendo GB de datos; y al entrar en la era de la IA, los operadores comienzan a intentar vender Tokens.
Los Tokens están experimentando un proceso de evolución similar al de los datos móviles. Inicialmente, eran solo un indicador técnico; luego se convirtieron en una unidad de facturación; y finalmente evolucionaron hacia un producto estandarizado.
La entrada de los operadores marca que los Tokens han comenzado a desprenderse del ámbito técnico para entrar en el sistema de consumo.
En los próximos años, la forma en que los usuarios compran capacidad de IA podría cambiar fundamentalmente: los usuarios individuales comprarán "paquetes mensuales de IA", las empresas adquirirán "pools de recursos de Tokens", la banda ancha doméstica incluirá cuotas de IA, y las líneas dedicadas para empresas y gobiernos integrarán servicios de Agentes. Los Tokens se convertirán en un recurso básico, como la electricidad, el agua o los datos móviles.
Pero esto no significa que los operadores vayan a reemplazar a los fabricantes de modelos grandes.
03 ¿Cómo comprar Tokens de manera adecuada?
¿Es mejor adquirir el servicio de Tokens directamente de los fabricantes nativos de modelos grandes o desde las plataformas de los operadores? Actualmente, ambos modelos comerciales tienen sus ventajas y desventajas.
El primer modelo es el de los fabricantes nativos de modelos, que facturan por millón de Tokens. Empresas como OpenAI, Anthropic, DeepSeek, Qianwen, etc., utilizan comúnmente este sistema. Los usuarios pagan por separado por los Tokens de entrada y los Tokens de salida. Algunas, como Qianwen, pueden emplear un sistema de prepago a principios de mes y liquidación a fin de mes.
El segundo modelo es la suscripción mensual de cuotas de Tokens ofrecida por los operadores. Por ejemplo, Shanghai Telecom ofrece un paquete mínimo de 9.9 RMB por 10 millones de Tokens, con recargas adicionales por exceso, y planea integrar los beneficios de Tokens en el espacio digital familiar "美好家" (Hogar Hermoso), permitiendo el pago directo en la factura telefónica.
Este modelo de "precio único todo incluido" o "integración con la factura" permite a los usuarios chinos comprar potencia computacional para modelos grandes como si compraran un paquete de datos.
Mientras que el mercado internacional se centra principalmente en la tarificación escalonada de API de las empresas nativas de modelos grandes, el mercado nacional ha llevado el servicio de Tokens a una era de "paquetización" similar a la de las tarifas de telefonía móvil.
Por el momento, ambos modelos de tarificación tienen sus ventajas, ya que los usuarios de los paquetes de Tokens se dividen principalmente en tres tipos.
El primero son los desarrolladores independientes y los entusiastas de la tecnología (Geeks). Utilizan las interfaces API proporcionadas por varios fabricantes para construir sus propias aplicaciones de IA personalizadas, como herramientas de productividad, complementos de traducción automática, bases de conocimiento personalizadas, etc.
El segundo tipo son las pequeñas y medianas empresas, las empresas emergentes y los proveedores de software independientes (ISV) del sector B2B, siendo este el grupo central de clientes para los servicios de Tokens. Ya sea para adquirir Tokens para que los empleados los usen en programación, desarrollar Agentes de IA para industrias específicas o integrar funciones de asistencia de IA en sistemas empresariales existentes como ERP o CRM, las pequeñas y medianas empresas necesitan suscribirse a "paquetes de Tokens para equipos" de proveedores de nube u operadores.
El tercer tipo son los profesionales que "dependen en gran medida de la IA" y los hogares comunes, que en entornos domésticos necesitan usar la IA con alta frecuencia para la creación de textos, escritura de código, o para que la IA ayude a los niños con sus tareas escolares.
Para las pequeñas y medianas empresas y las empresas emergentes, desde una perspectiva de economía técnica, el modelo de facturación pura por Tokens de los modelos nativos es más científico.
El modelo de paquetes de los operadores tiene dos ventajas. Por un lado, los desarrolladores independientes no necesitan vincularse a un único modelo grande, sino que pueden elegir entre varios modelos a través de la plataforma del operador. Por otro lado, es probable que el servicio de Tokens llegue más rápidamente al consumo masivo. Porque la mayoría de la gente sabe qué significa 100 GB de datos, pero no puede percibir cuánto representan 10 millones de Tokens.
El enfoque de suscripción mensual de los operadores reduce esencialmente la barrera cognitiva. Los usuarios no necesitan entender los Tokens, solo necesitan comenzar con un paquete básico de 9.9 RMB / 10 millones de Tokens para conocer sus necesidades.
Con los operadores comenzando a vender servicios de Tokens, los "Doubao y similares" están a punto de comenzar a competir internamente en tres niveles.
De "competir por parámetros" a "competir por eficiencia energética": Para las empresas de modelos grandes, ya no podrán perseguir ciegamente modelos con grandes parámetros y alto consumo energético, sino que deberán centrar sus esfuerzos en capacidades como la destilación de modelos (Distillation), la cuantización (Quantization) y la optimización de la inferencia (Inference Optimization), que permitan generar Tokens de mayor calidad con un menor consumo energético.
La competencia de precios se intensificará aún más. Una vez que los operadores agregan cientos de modelos, el costo para que los usuarios cambien disminuye. Si el modelo A sube de precio, se puede reemplazar por el modelo B a través de la plataforma. Cuando las diferencias en la capacidad de los modelos no sean significativas, el precio se convertirá en el factor central de competencia.
El centro de ganancias de las empresas de modelos grandes se desplazará. Vender solo APIs ofrece ganancias limitadas; en el futuro, el enfoque de rentabilidad probablemente se desplace hacia los Agentes, las aplicaciones industriales y las soluciones empresariales. El modelo en sí mismo se convertirá gradualmente en infraestructura, mientras que la capa de aplicación se convertirá en el centro de valor.
Quizás se esté formando un "mercado bilateral": los operadores controlan el punto de entrada, y los fabricantes de modelos controlan la capacidad.






