Texto | Canal Luo Chao
DeepSeek anunció que hará "permanente" el descuento del 75% en la API V4-Pro, efectivo globalmente de manera sincronizada.
El sistema de precios final: el precio básico de entrada se redujo de 1.74 USD / millón de tokens a 0.435 USD / millón de tokens; el precio de salida se redujo de 3.48 USD / millón de tokens a 0.87 USD / millón de tokens. Para todos los aciertos de caché de entrada en la línea de productos API, DeepSeek implementó un mayor margen de beneficio: 0.003625 USD / millón de tokens, todo en el modo de fijación de precios de mínimo estilo Pinduoduo.
Inmediatamente después, en las redes sociales, incluida X, surgió una ola de voces: Liang Wenfeng es el Bodhisattva cibernético del círculo de la IA, el Dios Feng, el Santo Liang. La emoción no proviene solo de lo barato en sí mismo: DeepSeek siempre ha sido llamado el Pinduoduo de la IA, gratuito en el lado C (consumidor), barato en el lado B (negocios), el mundo ya se había acostumbrado a su bajo precio, pero lo difícil de esta ronda de reducción de precios es que: el precio de la IA en todo el mundo está subiendo.
Según informes, en la ronda de financiación Serie A récord que DeepSeek está llevando a cabo, Liang Wenfeng aportará personalmente hasta 20 mil millones de yuanes (RMB), representando el 40% del total de la financiación. La primera cosa que hace la gran mayoría de las empresas al financiarse es fortalecer el flujo de caja, para que los resultados se vean mejor, pero Liang Wenfeng no planea atraer inversores con la promesa de la comercialización, sino que insiste en el código abierto y la búsqueda de la AGI. Esta ronda de reducción de precios realmente cumple lo dicho. La última vez que alguien declaró tan valientemente que no quería ganar dinero fue Pinduoduo. En la llamada con inversionistas en el año 24, su cofundador dijo claramente: "A partir del tercer trimestre, nuestras ganancias disminuirán gradualmente y no se recuperarán a corto plazo. A largo plazo, la disminución de la rentabilidad es inevitable". Las acciones se desplomaron.
Sam Altman habla de democratizar la IA, pero OpenAI se está moviendo rápidamente hacia lo contrario de su nombre: CloseAI. Sin embargo, Liang Wenfeng está trabajando personalmente para que todos, cada individuo y cada empresa, puedan usar la IA de la manera más accesible y económica posible. Pero, ¿es Liang Wenfeng realmente un bodhisattva viviente? No. Es un empresario, y el código abierto y la accesibilidad son solo una elección de modelo de negocio, algo valioso en el presente y cada vez más escaso en el futuro.
Porque: La IA se está volviendo cada vez más cara.
Esta semana, Microsoft canceló las licencias internas de Claude Code, porque la facturación basada en tokens era tan alta que no podía soportarla. Microsoft alguna vez invirtió fuertemente en OpenAI, y también proporcionó servicios en la nube Azure para Anthropic, poseyendo recursos de computación en la nube envidiados por todas las empresas, pero el costo de los tokens aún le duele. Por coincidencia, el CTO de Uber informó a la gerencia en abril de este año una situación embarazosa: el presupuesto de IA preparado por la empresa para todo el año 2026 se agotó en cuatro meses, con el 95% de los ingenieros usando herramientas de programación de IA cada mes y el 70% del código enviado generado por IA. Sus palabras exactas fueron: "I’m back to the drawing board because the budget I thought I would need is blown away already.".
Que las grandes empresas quemen su presupuesto de tokens mucho más rápido de lo esperado se debe, por supuesto, en parte a que los empleados "no cuidan los recursos" y consumen tokens sin mesura, pero la verdadera raíz de la tensión presupuestaria es que la IA se está volviendo más cara. El precio del software de IA en Estados Unidos ha aumentado entre un 20% y un 37% en el último año. Anthropic, OpenAI y Google, los tres grandes, han aumentado silenciosamente en los últimos seis meses el precio real de la misma salida de IA.
(Fuente de la imagen: X)
La opinión popular anterior era "cuanto más a gran escala se aplica la IA, mayor es el grado de industrialización, menores son los costos y mejor lo pasan las empresas". Resulta que fuimos ingenuos.
Y esta tendencia no se revertirá. El precio está determinado por la oferta y la demanda, no por el costo, pero la relación oferta-demanda de la IA en 2026 se ha invertido por completo. Antes, las grandes empresas rogaban a la gente que usara IA, necesitaban educar el mercado, promover la tecnología, y la IA siempre estuvo subsidiada, ¿cuántas tazas de té de boba has tomado con Qianwen? ¿Y ahora? La gente usa cada vez más de manera activa, "no puedes prescindir de ella después de la primera experiencia", la programación con IA, los documentos con IA, la generación de contenido con IA e incluso la búsqueda con IA son cada vez más populares. La era de los subsidios de IA ha terminado por completo.
Cuantas más personas la usen, mayor será la demanda, más escasos serán los recursos de tokens, por lo que la escasez de potencia de cálculo se extiende desde las GPU a las CPU, el almacenamiento e incluso el ancho de banda. Intel, Micron, SK Hynix, Samsung Electronics, SanDisk y las empresas nacionales como Jiangbolong, las dos "Chang" (se refiere a empresas como ChangXin Memory Technologies y Yangtze Memory Technologies) comen junto con Nvidia. ¿De dónde provienen los ingresos multiplicados de los gigantes de los semiconductores en 2026? ¿Acaso no es fundamentalmente del ciclo cerrado de inversión OpenAI-Oracle-Microsoft? El dolor de las empresas apenas comienza. Además, productos de IA como ChatGPT, Claude, Gemini, Doubao, que enfatizan una "jerarquía estricta" entre lo gratuito y lo de pago, también harán que los usuarios individuales se sientan cada vez más en un dilema.
Es como los viajes compartidos: en la locura, podías ir y venir del trabajo en coche privado de forma gratuita, el capital pagaba por ti. Una vez establecido el hábito del usuario, terminan los subsidios, los precios vuelven a niveles normales, y quienes debían tomar el metro vuelven a tomarlo. Con la IA es igual. Por lo tanto, en el contexto general de aumento de precios de tokens en la industria, que DeepSeek insista en reducir los precios ya no es solo una muestra de determinación personal de un "Bodhisattva cibernético", sino que demuestra un poder de fijación de precios inverso: puedo ser tan barato, seguir funcionando normalmente y la calidad no se resiente.
Si Liang Wenfeng quisiera, DeepSeek no tendría por qué ser tan barato. Entonces la gente empieza a preocuparse: ¿Se convertirá DeepSeek en el Linux de la era de la IA? Una influencia enorme, pero sin ganar mucho dinero. La contribución de Linux a la industria de las TI es mucho mayor que la de Windows o Android (que en sí mismo se basa en el kernel de Linux), pero es de código abierto y no ha generado gigantes comerciales como Microsoft o Google. DeepSeek tiene actualmente una gran influencia, pero su capacidad comercial está muy lejos de la de los tres grandes de Silicon Valley, e incluso no puede competir con las tres nacionales: Kimi, MiniMax y Zhipu AI. Ranking de ingresos de los cuatro "dragones" en 2025: Zhipu AI (ingresos de 2025: 724 millones de yuanes) > MiniMax (ingresos de 2025: aprox. 560 millones de yuanes) > Moonshot AI (aprox. 200 millones de yuanes) > DeepSeek (desconocido pero más bajo).
Liang Wenfeng gana dinero haciendo IA cuantitativa, personalmente puede aportar 20 mil millones para invertir en DeepSeek, pero la historia de "funcionar con amor" no puede durar para siempre.
Además, bajo el modelo de código abierto, otros también pueden destilar, implementar y realizar un segundo entrenamiento, por lo que la ventaja tecnológica de DeepSeek se volverá cada vez más delgada. Por eso siempre vemos noticias como estas de "encabezar rankings": después de que Zhipu AI abrió el código de GLM-5.1, estableció un nuevo récord mundial en la prueba de referencia SWE-bench Pro; Xiaomi MiMo-V2.5-Pro encabeza la lista mundial de modelos grandes de código abierto... Un informe conjunto del MIT y Hugging Face muestra que en el último año, los modelos de código abierto desarrollados en China representaron el 17.1% de las descargas globales, superando el 15.8% de Estados Unidos, siendo el número uno mundial.
No es de extrañar que cada vez más voces en Silicon Valley digan: definitivamente debe haber una versión estadounidense de DeepSeek, no podemos quedarnos de brazos cruzados viendo a la industria de la IA repetir la historia de Shein, Temu o TikTok. "Si Estados Unidos no logra que surja un campeón del código abierto, el mundo funcionará con el modelo de código abierto y software de código abierto de cualquier país que pueda producir el más fuerte, más estable, más barato, personalizable, escalable y que se adapte a las necesidades personales y comerciales". Los temas que involucran la competencia entre grandes potencias suelen ser un tanto grandiosos, pero la competencia detrás es real.
Detrás del auge de DeepSeek ya hay una narrativa de sustitución autónoma. El soporte de V4 para Ascend es motivo de alegría, impulsado por la potencia de cálculo nacional, la competitividad de precios que DeepSeek muestra actualmente es solo el aperitivo. En el informe técnico, DeepSeek indicó que en la segunda mitad del año, después de la producción en masa de los supernodos Ascend 950, el precio de V4-Pro bajará significativamente nuevamente. Los buenos tiempos aún están por venir.
Además, está la ventaja en talento avanzado de IA. El talento en IA es caro a niveles "de lujo", pero en China es relativamente más barato. Que Lei Jun ofreciera un salario de 10 millones de yuanes para llevarse a Luo Fuli de DeepSeek se convirtió en noticia, mientras que al mismo tiempo, Mark Zuckerberg quería gastar mil millones de dólares para atraer talento, incluyendo adquisiciones para contratar (Acqui-hire). Pero la diferencia entre lo que produce alguien de mil millones de dólares y alguien con un salario de 10 millones claramente no es 700 veces mayor. La diferencia de precio en el talento de IA en realidad se convertirá en una diferencia sistemática de precio en el sistema de producción de tokens.
Una competitividad aún mayor es el sistema energético, este es el primer nivel del pastel de cinco capas de IA de Jensen Huang.
El fin de la IA es la potencia de cálculo, y el fin de la potencia de cálculo es la energía eléctrica. En abril de 2026, DeepSeek publicó ofertas de trabajo para ingenieros senior de operaciones y mantenimiento y gerentes senior de entrega para centros de datos en Ulanqab, Mongolia Interior, lo que indica que planea construir fábricas de tokens en el oeste, llevando la ventaja de costos desde la capa de software hasta la capa física. La última vez que escribí sobre Ulanqab en un artículo fue cuando Kuaishou construyó allí un centro de datos: cercanía a las centrales eléctricas, clima adecuado para una buena disipación de calor. Además, el precio de la electricidad verde en el oeste de China es de aproximadamente 0.2-0.3 yuanes/kWh, solo una quinta o cuarta parte del de Europa y América.
No solo la electricidad verde del oeste es competitiva. Según datos de la Agencia Internacional de la Energía de 2025, la capacidad total instalada de generación de energía de China ya supera los 2300 GW, representando alrededor del 22% del total mundial, siendo la primera del mundo; Estados Unidos tiene unos 1300 GW. Lo más crucial es que China posee la estructura energética más completa del mundo: energía térmica, hidroeléctrica, eólica, nuclear y fotovoltaica, todas presentes. Los datos muestran que el precio industrial de la electricidad en China se mantiene a largo plazo entre 0.06 y 0.08 USD/kWh, mientras que en California, EE. UU., ya se acerca a 0.18 USD/kWh, y en algunas partes de Alemania incluso supera los 0.25 USD/kWh. Esto significa que entrenar un clúster de diez mil tarjetas en China es naturalmente decenas de puntos porcentuales más barato que en Europa y América.
En los costos operativos de los grandes modelos de IA, el costo de la electricidad representa del 60% al 70% del costo operativo total. No solo es la electricidad para ejecutar el modelo, sino también la gran parte de la disipación de calor. El "monstruo de la infraestructura" incluso construye centros de datos directamente en el fondo del mar, utilizando energía eólica marina cercana y enfriamiento gratuito con agua de mar en circulación. Además, existen grandes proyectos como la "Transmisión de Electricidad de Oeste a Este" y el "Cálculo del Este en el Oeste", con una gran capacidad de regulación regional de energía y potencia de cálculo. Lugares como Guizhou, Mongolia Interior y Ningxia son precisamente los nodos centrales del "Cálculo del Este en el Oeste", el camino para trasladar los centros de potencia de cálculo de IA hacia el oeste ya está preparado.
Usar IA china es esencialmente usar IA entrenada por un sistema energético más competitivo: una IA más económica y accesible. Esta es una de las razones por las que los ingresos en el extranjero de kimi, minimax y otros se dispararon después del Año Nuevo Chino, no solo porque los algoritmos son más fuertes, sino porque tienen una ventaja en el precio de la electricidad.
Nvidia puede definir el precio de la potencia de cálculo de gama alta, pero DeepSeek y otros están tomando el poder de fijación de precios de los tokens. Podrías decir: en IA, lo barato sale caro. La IA realmente tiene lo que pagas, y DeepSeek V4 solo ha reducido la brecha entre código abierto y código cerrado al nivel más pequeño de la historia. La propia empresa admite la diferencia objetiva con los modelos más avanzados como GPT, y además no es multimodal (puede reconocer imágenes, pero no generarlas).
Pero esto no ha impedido que la comunidad acuda a DeepSeek. La razón es: la mayoría de los escenarios comerciales reales no necesitan invocar el modelo más fuerte del mundo cada vez. Consultoría, servicio al cliente, resúmenes, traducción, completado de código, bases de conocimiento empresarial, automatización de procesos, estas cosas no requieren la máxima inteligencia, sino "suficientemente usable + lo suficientemente barato + lo suficientemente estable". Cuando el costo de inferencia de DeepSeek V4 es solo aproximadamente el 1% (Flash) al 11% (Pro) del de GPT-5.5, una empresa con el mismo presupuesto puede invocar decenas de veces más tokens, probar más cadenas de prompts, iterar más flujos de trabajo de agentes, y el trabajo final obtenido incluso podría ser mejor, después de todo, la IA en sí es un juego de "probabilidades", mientras sea lo suficientemente barata, ¿qué hay de malo en conformarse y obtener resultados?
Por lo tanto, cuanto más cara sea la IA, más valiosa será la asequibilidad de DeepSeek, y más valiosa será la empresa DeepSeek. Liang Wenfeng y sus inversores lo tienen más claro que nadie.







