En los últimos años, con el rápido desarrollo de la IA, los principales gigantes de internet en China han estado desplegando activamente grandes modelos de IA. Especialmente recientemente, la popularidad de Langosta ha hecho que las IA de varias empresas obtengan ganancias sustanciales. Sin embargo, como era de esperar, la ola de aumentos de precios en la IA también ha llegado puntualmente. En un contexto donde gigantes extranjeros como Amazon y Google, así como los gigantes nacionales BAT, han aumentado los precios colectivamente, empresas de modelos grandes nacionales como Zhipu también han seguido subiendo los precios. Esto lleva a preguntarse: ¿ha llegado la ola de aumentos? ¿Los empleados langosta ya no podrán permitírselo?
一、Los gigantes aumentan los precios colectivamente
Según informes de Haibao News, recientemente, las acciones relacionadas con módulos ópticos y hardware de computación han experimentado fuertes alzas en contra de la tendencia del mercado. Detrás de esto está la oleada de OpenClaw (conocido comúnmente en China como "Langosta") que ha barrido desde el extranjero hasta el interior este año, con un aumento explosivo en el volumen de llamadas de Token, lo que directamente impulsa la demanda de capacidad de computación. La materialización de la cadena industrial de Token se ha convertido en un nuevo foco de atención.
Ali Cloud y Baidu Intelligent Cloud han anunciado sucesivamente aumentos en los precios de productos relacionados con la capacidad de computación de IA. El anuncio oficial de Ali Cloud indicó que, debido a la explosión de la demanda global de IA y al aumento de precios en la cadena de suministro, los productos de capacidad de computación de IA y almacenamiento de Ali Cloud han subido hasta un 34%. Según fuentes informadas, la plataforma de negocios MaaS de Ali Cloud, Bailian, registró su mayor crecimiento histórico entre enero y marzo de este año.
Baidu Intelligent Cloud afirmó que, afectado por el rápido desarrollo global de aplicaciones de inteligencia artificial, la demanda de capacidad de computación continúa aumentando, y los costos de hardware central e infraestructura relacionada han experimentado aumentos significativos, por lo que decidió ajustar al alza los precios de productos y servicios relacionados con la capacidad de computación de IA entre un 5% y un 30%, y el almacenamiento de archivos paralelos, entre otros, en aproximadamente un 30%.
A principios de año, Amazon AWS y Google Cloud anunciaron sucesivamente aumentos de precios en algunos de sus servicios. El 22 de enero, AWS anunció un aumento del 15% en el precio de EC2 utilizado para el entrenamiento de grandes modelos. El 27 de enero, Google Cloud realizó ajustes significativos en los precios de servicios de transmisión de datos como CDN Interconnect, Direct Peering y Carrier Peering, con aumentos de hasta el 100% en América del Norte.
En el ámbito nacional, Tencent Cloud anunció el 11 de marzo un aumento en los precios de servicios de grandes modelos, ajustando las estrategias de facturación de algunos modelos. Por ejemplo, el modelo Tencent HY2.0 Instruct vio su precio de entrada aumentar drásticamente de 0.0008 yuanes por mil Tokens a 0.004505 yuanes por mil Tokens, un aumento del 463.13%.
Y la ola de aumentos de precios no ha terminado. El 8 de abril, Zhipu anunció su tercer plan de aumento de precios este año, lanzando el nuevo modelo insignia GLM-5.1 y aumentando los precios en un 10%, apenas un mes después de su último ajuste de al menos un 30%. En contraste con la reducción de precios y las pruebas gratuitas de 2025, la señal clara actual es que los grandes modelos de IA nacionales están entrando en una era de aumentos colectivos de precios.
二、¿Ha llegado la ola de aumentos de la IA? ¿Los empleados langosta no podrán permitírselo?
Recientemente, los principales gigantes de grandes modelos anunciaron colectivamente aumentos en algunos de sus servicios en la nube y productos relacionados, lo que parece dar esperanza a quienes antes temían ser destilados. En comparación con los costosos tokens, nosotros parecemos más baratos. Entonces, ¿qué lógica industrial se esconde detrás de esta ola de aumentos?
En primer lugar, la explosión de agentes de IA provoca un aumento repentino en la demanda de capacidad de computación. Desde la perspectiva de un cambio estructural en el lado de la demanda, la explosión de los nuevos agentes de IA representados por OpenClaw ha reestructurado completamente la lógica subyacente del consumo de capacidad de computación. En las primeras etapas de aplicación de los grandes modelos, el comportamiento del usuario se limitaba principalmente a diálogos de una sola ronda o generación simple de texto, donde el consumo de Tokens era relativamente limitado y predecible. Sin embargo, con la maduración de la tecnología de agentes autónomos, la IA ya no es una máquina de preguntas y respuestas pasiva, sino un empleado digital capaz de planificar de forma autónoma, utilizar herramientas y ejecutar tareas complejas.
El consumo diario per cápita de Tokens de un agente inteligente maduro suele ser decenas o incluso cientos de veces mayor que el de un usuario tradicional de chat. Este aumento exponencial de la demanda no es un crecimiento empresarial lineal, sino un salto dimensional. Cuando una gran cantidad de agentes inteligentes están en línea simultáneamente, realizando razonamientos lógicos e intercambios de datos de alta frecuencia, la infraestructura de capacidad de computación diseñada originalmente para la interacción humana enfrenta instantáneamente una enorme presión de procesamiento.
Este crecimiento explosivo de la demanda rompe directamente el antiguo equilibrio entre oferta y demanda, haciendo que los recursos de capacidad de computación pasen de "relativamente abundantes" a "extremadamente escasos". Cuando la utilidad marginal aumenta drásticamente y la elasticidad de la oferta es insuficiente, el aumento de precios no solo es una manifestación inevitable de las leyes del mercado, sino también un medio necesario para filtrar escenarios de aplicación de alto valor y contener el desperdicio ineficiente de capacidad de computación.
En segundo lugar, la escasez de hardware central provoca tensión en la capacidad de computación. Desde la perspectiva de las restricciones duras del lado de la oferta, la escasez de chips de computación de alto rendimiento y memoria de alto ancho de banda HBM, entre otros componentes de hardware central, constituye la base física de esta ola de aumentos de precios. Aunque los proveedores de nube nacionales han invertido considerablemente en los últimos años en la construcción de un ecosistema de computación nacional, los cuellos de botella en la capacidad de producción a nivel global siguen siendo graves en el campo de los chips de entrenamiento e inferencia de gama alta. Especialmente la memoria HBM, considerada la "sangre" de los grandes modelos, que tiene altas barreras tecnológicas y largos ciclos de expansión de producción, se ha convertido en un cuello de botella clave que restringe la liberación de capacidad de computación.
Actualmente, la capacidad de computación ya no es una mera acumulación de servidores, sino un sistema preciso compuesto por chips de proceso avanzado, redes de interconexión de alta velocidad y almacenamiento de alto ancho de banda. La escasez de hardware central provoca un aumento significativo en el costo marginal de la oferta de capacidad de computación, y los proveedores de nube ya no pueden diluir los costos simplemente mediante economías de escala. Esta restricción rígida del lado de la oferta obliga a la industria a reconsiderar el mecanismo de fijación de precios de la capacidad de computación. Cuando "la capacidad de computación es poder" se convierte en un consenso, los proveedores con capacidad estable y de alto rendimiento para ofrecer capacidad de computación naturalmente tienen un mayor poder de negociación. En este momento, el aumento de precios es en realidad una reevaluación razonable del valor de los recursos de hardware escasos, y un resultado inevitable de la transmisión de la presión de costos de la cadena industrial ascendente a la descendente.
Recientemente, muchos de mis amigos en empresas tecnológicas, especialmente los CTO, se quejan普遍mente de que los precios de los chips de almacenamiento y servidores son realmente inasequibles ahora. La batalla por la capacidad de computación parece haberse convertido instantáneamente en una batalla por los costos, y esto es lo que más merece atención en este momento.
En tercer lugar, la lógica de fijación de precios de la industria de "intercambiar precio por volumen" ha cambiado fundamentalmente. Al repasar la evolución de la industria de la computación en nube en la última década, no es difícil encontrar un círculo vicioso: la guerra de precios maligna. Para competir por cuota de mercado, los principales proveedores desplegaron sucesivamente "tácticas de precios agresivos", que no solo apretaron el espacio de supervivencia de la competencia, sino que también comprimieron enormemente sus propios márgenes de beneficio. En algunos períodos, el precio de los servicios en la nube incluso inferior a sus costos operativos, mostrando un fenómeno típico de "envoltura interna". Este modelo de "intercambiar precio por volumen" podría ser efectivo en la era del internet móvil, porque en ese momento el costo marginal se acercaba a cero y las rutas de monetización del tráfico eran claras.
Sin embargo, la llegada de la era de la IA rompió completamente esta lógica. Ahora la capacidad de computación ya no es una mercancía genérica barata, sino un costoso medio de producción especializado. Si se continúa manteniendo una estrategia de precios bajos, los proveedores de nube no podrán cubrir los altos costos de adquisición de GPU y los costos operativos de electricidad, y mucho menos invertir continuamente enormes fondos en I+D para la iteración de modelos. El desarrollo saludable de la industria debe basarse en un beneficio razonable. Solo cuando el precio regresa al valor, las empresas tienen la capacidad de reproducirse e innovar.
El aumento colectivo de precios de los gigantes tecnológicos es en realidad un "regreso colectivo a la racionalidad" de la industria. Esto marca que el mercado chino de computación en nube se está despidiendo de la era temeraria de "subsidios quemando dinero" y entrando en una era de competencia de valor centrada en la fuerza técnica y la calidad del servicio. Esto es extremadamente beneficioso para la construcción de un ecosistema saludable en toda la industria, ya que traslada el foco de la competencia de "quién es más barato" a "quién es más estable, quién es más inteligente, quién puede resolver mejor los problemas", lo que sin duda es una señal positiva de actualización industrial.
En cuarto lugar, surge la economía del token, y la fijación de precios por niveles se convertirá en la norma. Antes, los centros de datos se consideraban "almacenes" para guardar datos, y su valor se manifestaba principalmente en el alquiler de espacio y la custodia de datos. En la era de la IA, los centros de datos han evolucionado hasta convertirse en "fábricas" que producen inteligencia, y su producto central son los tokens de alto valor. Este cambio de rol directly da lugar a una nueva lógica de fijación de precios. En el futuro, los servicios de IA ya no utilizarán los modelos tradicionales de facturación anual/mensual o por uso, sino que se basarán en dimensiones como el volumen de procesamiento de tokens, la velocidad de respuesta, la complejidad del razonamiento, etc., para una fijación de precios por niveles.
Esta estrategia de precios refinada puede coincidir con mayor precisión con las necesidades de capacidad de computación en diferentes escenarios, permitiendo que las tareas de alta velocidad en tiempo real y alta complejidad paguen una prima más alta, mientras que las tareas por lotes sin conexión disfrutan de costos más bajos. Esto no es solo una innovación en el modelo de negocio, sino también una gran mejora en la eficiencia de asignación de recursos. A través de la palanca de precios, la industria guiará los recursos de capacidad de computación hacia aquellas áreas que crean el mayor valor social, evitando la mala asignación y el desperdicio de recursos.
Es en este contexto que muchas empresas incluso utilizan directamente la cantidad de tokens proporcionados como un nuevo beneficio para los empleados. Por supuesto, siempre hemos estado discutiendo si el token es un medio de producción o una remuneración y beneficio para los empleados, pero sin duda, en la era actual, el token se ha convertido en un cuello de botella importante que restringe el desarrollo de las empresas de IA. Incluso más, un amigo me comentó que, a principios de año, la empresa tecnológica gigante donde trabaja exigió que todos usaran Langosta, con su gemelo digital, pero recientemente, bajo un consumo masivo, se propuso un límite de flujo.
Finalmente, frente a los recursos de computación cada vez más caros, ¿qué debe hacer el futuro de la IA Langosta? ¿Todavía podremos permitírnoslo?
Este artículo proviene del WeChat público "Jianghan Vision Observation", autor: Jianghan Vision Observation











