El verdadero valor de DeepSeek V4 no está en los parámetros

marsbitPublicado a 2026-04-25Actualizado a 2026-04-25

Resumen

DeepSeek V4 ha logrado un avance estratégico clave al demostrar que un modelo de lenguaje de gran escala, con billones de parámetros, puede ejecutarse de manera estable y eficiente en hardware de fabricación china, como los chips Ascend 950 de Huawei y las plataformas de Cambricon. Esto representa un paso crucial hacia la independencia del ecosistema de Nvidia, que domina el mercado con sus GPU y el framework CUDA. El modelo utiliza mecanismos de atención híbrida (CSA + HCA) y compresión de caché KV para optimizar el procesamiento de contextos largos (hasta 1 millón de tokens), reduciendo la carga computacional y adaptándose mejor a los chips locales. Además, su arquitectura MoE activa solo una fracción de los parámetros durante la inferencia, lo que hace que el despliegue en entornos productivos sea más viable y económico. En cuanto a precios, DeepSeek V4 ofrece tarifas competitivas, situándose por debajo de otros modelos chinos en contextos largos, lo que facilita su adopción en aplic empresariales como análisis financiero, procesamiento de documentos extensos o agentes de código. Aunque aún hay desafíos en la madurez del ecosistema de chips chinos, este avance supone un impulso significativo para la autonomía tecnológica de China en IA.

Por | Fábrica de Modelos del Mundo

DeepSeek V4 ha vuelto a conmocionar a toda China.

El tamaño de los parámetros, la longitud del contexto, las puntuaciones de referencia... estos indicadores técnicos ya han sido comparados repetidamente en diversos informes.

Pero si nos quedamos solo en los datos superficiales, nos perderemos el núcleo más estratégico de este lanzamiento.

En los últimos tres años, los grandes modelos chinos han estado atrapados en una realidad incómoda: el entrenamiento depende de Nvidia, la inferencia también depende de Nvidia, y los chips nacionales son solo una opción de respaldo.

Si Nvidia deja de suministrar, todo el círculo de modelos chinos se verá sumido en la ansiedad.

Pero hoy, DeepSeek V4 ha demostrado con hechos:

Un gran modelo de vanguardia con billones de parámetros también puede ejecutarse de manera estable y eficiente en la capacidad de computación nacional.

El significado de esto ya ha superado los propios indicadores técnicos del modelo.

La ruptura de la localización

Para comprender realmente la dificultad de esta adaptación local, primero hay que entender el imperio de chips de Nvidia.

Nvidia no solo tiene chips, sino un ecosistema completo y altamente cerrado:

En hardware, tiene la familia de chips GPU, junto con NVLink y NVSwitch para lograr una red de interconexión ultrarrápida entre chips;

En software, CUDA es un sistema operativo de IA cuidadosamente construido por Nvidia durante más de una década.

Es como una fábrica altamente optimizada, desde los operadores más básicos (unidades fundamentales de cálculo del modelo), hasta el cálculo paralelo, la gestión de memoria, la comunicación distribuida, toda la cadena está personalizada para las GPU de Nvidia.

En otras palabras, Nvidia no solo vende motores, sino que también construye las carreteras, estaciones de servicio, talleres de reparación y sistemas de navegación.

Casi todos los grandes modelos globales de primer nivel han crecido en este ecosistema.

Cambiar a la capacidad de computación nacional implica una situación completamente diferente.

Arquitecturas de hardware diferentes, métodos de interconexión diferentes, madurez del stack de software diferente, el ecosistema de herramientas aún en rápido desarrollo.

Que DeepSeek quiera adaptarse a los chips nacionales no es simplemente cambiar el motor, sino cambiar un coche de carreras que ya va a alta velocidad por una autopista, a una carretera de montaña que aún se está construyendo.

El más mínimo error podría provocar vibraciones, pérdida de velocidad, o incluso que el vehículo no pueda avanzar.

Esta vez, DeepSeek V4 no optó por seguir optimizando solo la ruta de CUDA, sino que comenzó a adentrarse simultáneamente en la cadena de adaptación del stack de software de la computación nacional.

Según información pública, V4 ya ha logrado un avance basado en chips de inferencia nacionales, con una adaptación profunda al chip Huawei Ascend 950, y Cambricon pudo ejecutarlo de manera estable el mismo día del lanzamiento del modelo, logrando una verdadera adaptación Day 0.

Esto significa que los modelos de vanguardia comienzan a tener la posibilidad de implementarse dentro del sistema de chips nacionales.

¿Cómo lo logró DeepSeek V4?

El primer paso ocurrió en la capa de arquitectura del modelo.

V4 no optó por hacer que los chips nacionales soporten a la fuerza un contexto de 1M, sino que primero hizo que el modelo en sí fuera más eficiente.

El diseño clave en el informe técnico oficial es el mecanismo de atención mixta CSA + HCA, y la optimización de contexto largo con compresión de KV Cache, entre otros.

En pocas palabras, la inferencia de contexto largo tradicional hace que el modelo, cada vez que responde una pregunta, despliegue una biblioteca completa para hojear, consumiendo rápidamente la memoria, el ancho de banda y la capacidad de cálculo.

El enfoque de V4 es primero reindexar, comprimir y filtrar los materiales de la biblioteca, enviando solo la información más crucial a la cadena de cálculo.

De esta manera, el contexto de 1M ya no depende completamente de la fuerza bruta del hardware, sino que primero reduce la carga de cálculo y memoria mediante algoritmos.

Esto es crucial para los chips nacionales.

Si el modelo siguiera dependiendo en gran medida del ancho de banda de memoria y de las bibliotecas CUDA maduras, incluso si los chips nacionales pudieran ejecutarlo, sería difícil que lo hicieran de manera barata y estable.

V4, al reducir primero la carga de inferencia, esencialmente está aliviando la presión sobre la capacidad de computación nacional.

El segundo paso ocurre en la capa de arquitectura MoE y de parámetros de activación.

Aunque V4-Pro tiene un total de 1.6 billones de parámetros, solo activa unos 49 mil millones de parámetros por inferencia; V4-Flash tiene un total de 284 mil millones de parámetros, activando unos 13 mil millones por inferencia.

Esto significa que no saca todos los parámetros para calcular cada vez, sino que es como un gran equipo de expertos: cuando llega una tarea, solo llama a los expertos relevantes.

Para los chips nacionales, esto también es importante.

Reduce la presión de cálculo que debe soportar cada inferencia y hace que los escenarios de contexto largo y Agent sean más fáciles de manejar para las tarjetas de inferencia.

El tercer paso es la adaptación a nivel de operadores y Kernel.

El punto más fuerte del ecosistema CUDA es que una gran cantidad de cálculos de bajo nivel ya han sido pulidos y madurados por Nvidia, y muchos cálculos de alto rendimiento se pueden llamar directamente.

El significado de V4 radica en que extrae parte del cálculo clave de la caja negra de Nvidia, convirtiéndolo en una ruta de cálculo personalizada más migrable y adaptable.

Dicho de manera más coloquial, V4 es como desmontar las piezas más cruciales del motor, permitiendo que fabricantes como Huawei Ascend y Cambricon puedan recalibrarlas según la estructura de sus propios chips.

El cuarto paso es el marco de inferencia y la capa de servicio.

Si la adaptación a chips nacionales se queda en "ejecutar una demo", su significado industrial no es grande. Lo que realmente merece atención es si puede integrarse en un sistema de servicio invocable y facturable.

Según pruebas internas, en Ascend 950PR, la velocidad de inferencia de V4 ha mejorado significativamente compared to versiones anteriores, y el consumo de energía también ha disminuido notablemente. El rendimiento de una sola tarjeta, en escenarios específicos de baja precisión, alcanza más del doble que el de la H20 especial de Nvidia.

DeepSeek oficialmente menciona que, actualmente, V4-Pro está limitado por la capacidad de computación de gama alta, con un rendimiento de servicio limitado. Se espera que el precio baje significativamente en la segunda mitad del año, una vez que se lancen al mercado en lotes los supernodos Ascend 950.

Esto indica que, con la producción en masa de hardware nacional como Ascend, el rendimiento y la relación calidad-precio de V4 mejorarán aún más en el futuro.

Pero cabe destacar que V4 no reemplaza por completo las GPU y CUDA de Nvidia. El entrenamiento del modelo probablemente aún dependa de Nvidia, pero la inferencia ya puede gradualmente localizarse.

Esta es, de hecho, una ruta comercial muy realista.

El entrenamiento es una inversión puntual: se entrena una vez, se ajusta una vez, se itera una vez. La inferencia es un costo continuo: millones de llamadas de usuarios diarias, cada una consume capacidad de cálculo.

La mayor parte del gasto real de las empresas de modelos, a largo plazo, se inclinará cada vez más hacia la inferencia. Quien pueda承接 (soporte) la demanda de inferencia de manera más barata y estable, obtendrá una ventaja real en las aplicaciones industriales.

DeepSeek V4 permite por primera vez que el despliegue de inferencia de modelos chinos de vanguardia cuente con una ruta que no tiene a CUDA de Nvidia como premisa predeterminada.

Este paso ya tiene suficiente peso.

El impacto de V4 en las aplicaciones industriales

Si la adaptación a chips nacionales responde a si se puede ejecutar, entonces el precio responde a otra pregunta más realista:

¿Pueden las empresas permitírselo?

El punto más fuerte de DeepSeek en el pasado era precisamente su capacidad de ofrecer capacidades cercanas a los modelos de vanguardia a un precio muy bajo.

Así fue en la era V3, R1, y así sigue siendo con V4.

La diferencia es que esta vez no libra una guerra de precios en ventanas de contexto ordinarias, sino que continúa presionando los precios bajo la premisa de contexto 1M + capacidad Agent.

Según el precio oficial de DeepSeek:

V4-Flash: entrada con acierto de caché 0.2 yuanes / millón de tokens, entrada sin acierto de caché 1 yuan / millón de tokens, salida 2 yuanes / millón de tokens;

V4-Pro: entrada con acierto de caché 1 yuan / millón de tokens, entrada sin acierto de caché 12 yuanes / millón de tokens, salida 24 yuanes / millón de tokens.

Comparándolo con modelos nacionales similares:

Frente a Ali Qwen3.6-Plus en el rango de 256K-1M, el precio de salida de V4-Pro es aproximadamente la mitad, y V4-Flash es aún más bajo.

Frente a Xiaomi MiMo Pro Series en el rango de 256K-1M, tanto V4-Flash como V4-Pro son significativamente más baratos.

El contexto de Kimi K2.6 es de 256K. En comparación, V4-Pro tiene un contexto más largo y un precio más bajo; V4-Flash directamente lleva el costo de llamadas de alta frecuencia a otro nivel.

Esto tiene un gran significado para las aplicaciones empresariales.

Porque un contexto de 1M significa que el modelo puede leer de una vez un repositorio de código completo, un grueso paquete de contratos, un prospecto de cientos de páginas, actas de reuniones extensas, o el estado histórico acumulado por un Agent al ejecutar tareas continuamente.

En el pasado, muchas aplicaciones empresariales se estancaban aquí: la capacidad del modelo era suficiente, pero el contexto no; el contexto era suficiente, pero el precio demasiado alto; el precio era aceptable, pero la capacidad del modelo no era lo suficientemente estable.

Por ejemplo, una empresa que desarrolla un Agent de investigación de inversiones quiere que el modelo lea simultáneamente informes anuales, conferencias telefónicas de resultados, informes sectoriales, noticias de la competencia y actas internas.

Con un contexto de solo 128K o 256K, el sistema often tiene que segmentar, recuperar y resumir constantemente, perdiéndose información en múltiples compresiones.

Un contexto de 1M permite al modelo retener más material original, reduciendo omisiones y lapsos.

Otro ejemplo es un Agent de código.

No se trata de escribir unas líneas de código de una vez, sino de leer repositorios, entender dependencias, modificar archivos, ejecutar pruebas, corregir según los errores. Este proceso consume tokens repetidamente.

Si cada paso es muy caro, el Agent solo puede servir para demostraciones, pero si los tokens son lo suficientemente baratos, entonces puede integrarse en flujos de desarrollo reales.

Este es también el valor industrial de V4.

Puede que no sea el modelo más potente, pero podría convertirse en el modelo de mayor frecuencia para las empresas.

DeepSeek vuelve a convertir la IA de un juguete exclusivo de unas pocas grandes empresas, en una herramienta de productividad que miles de industrias pueden desplegar a escala.

El verdadero valor de V4

Cuando el contexto de 1M llega a la primera línea industrial a un precio extremadamente bajo, es cuando el verdadero peso de DeepSeek V4 se revela.

Todo esto se construye sobre una base de capacidad de computación nacional aún inmadura.

Frente a la brecha sistémica del ecosistema de chips nacionales, el equipo de DeepSeek no optó por esperar a que el ecosistema madurara para lanzar.

Retrasaron repetidamente la ventana de lanzamiento, invirtieron meses de tiempo en realizar调试 (debugging) conjunto en profundidad con socios como Huawei. La dificultad de esta ingeniería supera con creces lo imaginable.

Precisamente por eso, que V4 logre en la capacidad de computación nacional una capacidad de inferencia y Agent cercana a los modelos cerrados de primer nivel, es doblemente meritorio.

V4 demuestra por sí mismo que, incluso frente a la brecha temporal del ecosistema de hardware, los equipos chinos aún pueden, mediante una inversión de ingeniería extrema y una innovación colaborativa software-hardware, lograr un rendimiento competitivo.

Por supuesto, aún queda distancia para la madurez total.

La完善度 (grado de perfección) de la cadena de herramientas de la plataforma Ascend, la estabilidad de los clústeres a超大规模 (gran escala), y la optimización profunda para más escenarios verticales, requieren el esfuerzo conjunto continuo de todas las partes de la industria.

Pero el éxito de V4 ha allanado un camino que puede servir de referencia para los modelos posteriores.

Ha inyectado un chute de confianza a la autonomía y control de toda la cadena de suministro de IA.

En el momento actual, lleno de incertidumbre en el entorno externo, esta resiliencia capaz de突破 (romper) limitaciones merece más respeto que los simples indicadores de parámetros.

"No seducido por la alabanza, no intimidado por la calumnia, actuar según el Tao, enderezarse rectamente".

Este texto, procedente de la官方 (oficial) de DeepSeek, es su mejor nota al pie.

Preguntas relacionadas

Q¿Cuál es el verdadero valor estratégico de DeepSeek V4 según el artículo?

AEl verdadero valor estratégico de DeepSeek V4 no reside en sus parámetros técnicos, sino en su capacidad para ejecutarse de manera estable y eficiente en hardware de fabricación china, reduciendo la dependencia de los chips y el ecosistema de Nvidia.

Q¿Qué mecanismo clave permite a DeepSeek V4 optimizar el procesamiento de contexto largo?

ADeepSeek V4 utiliza un mecanismo de atención híbrido CSA + HCA, junto con compresión de KV Cache, para optimizar el procesamiento de contexto largo, reduciendo la carga computacional y de memoria.

Q¿En qué chips chinos se ha adaptado DeepSeek V4 para su inferencia?

ADeepSeek V4 se ha adaptado para funcionar en chips chinos como el Huawei Ascend 950 y los chips de Cambricon, logrando una compatibilidad estable desde el primer día (Day 0).

Q¿Cómo impacta DeepSeek V4 en los costes de inferencia para las empresas?

ADeepSeek V4 ofrece precios significativamente reducidos para inferencia de contexto largo (hasta 1M tokens), haciendo que las aplicaciones de IA sean más asequibles para empresas, especialmente en escenarios de Agent y procesamiento de documentos extensos.

Q¿Qué desafíos implica la adaptación de DeepSeek V4 al hardware chino en comparación con el ecosistema de Nvidia?

ALa adaptación al hardware chino implica superar diferencias en arquitectura, interconexión, madurez del stack de software y herramientas, requiriendo una reingeniería profunda y optimización personalizada para chips como el Ascend 950.

Lecturas Relacionadas

¿Cuándo Es La Próxima Reunión De La FOMC Y Cuáles Son Las Expectativas Para Las Criptomonedas?

El próximo encuentro del Comité Federal de Mercado Abierto (FOMC) está programado para el 29 de abril de 2026, según el sitio web del CME Group. Las reuniones, que se llevan a cabo ocho veces al año, determinan las tasas de interés en Estados Unidos y suelen tener un impacto significativo en el mercado de criptomonedas. Las posturas de la Fed —"halcón" (hawkish) o "paloma" (dovish)— definen si las tasas suben, bajan o se mantienen. Una postura halcón, que implica un aumento de tasas, suele generar cautela entre los inversores y provocar caídas en los mercados, incluyendo las criptomonedas. Por el contrario, una postura de paloma, con recortes en las tasas, suele ser alcista para las criptomonedas, ya que incentiva la inversión en activos de mayor riesgo. En esta ocasión, la herramienta FedWatch indica una probabilidad del 99,5% de que la Fed mantenga las tasas sin cambios en el rango actual del 3,5%–3,75%. Esto sugiere que es poco probable que el resultado de la reunión cause un movimiento significativo en el mercado de criptomonedas, que actualmente tiene una capitalización de 2.570 millones de dólares.

bitcoinistHace 18 min(s)

¿Cuándo Es La Próxima Reunión De La FOMC Y Cuáles Son Las Expectativas Para Las Criptomonedas?

bitcoinistHace 18 min(s)

Informe Mundial de Riqueza 2026: EEUU genera 36 millonarios diarios, India se convierte en el caballo negro de crecimiento más rápido

Resumen del Informe de Riqueza 2026 de Knight Frank: Entre 2021 y 2026, el número de personas con patrimonio ultra alto (UHNWI, con más de 30 millones de dólares) aumentó de 551,435 a 713,626 a nivel mundial, con un promedio de 89 nuevos millonarios diarios. Estados Unidos lidera este crecimiento, representando el 41% de los nuevos UHNWI. China se mantiene como el segundo centro de creación de riqueza, aunque su participación global disminuyó del 18% al 17%. India destaca como la economía de más rápido crecimiento, con un aumento del 63% en su número de UHNWI. Europa cuenta con 183,953 ultra ricos, aproximadamente una cuarta parte del total mundial. Países como Polonia, Suecia y Rumanía muestran un crecimiento notable, con aumentos previstos de más del 60% en los próximos años. A nivel regional, América del Norte domina con el 37% de los UHNWI, seguida de Asia-Pacífico (31%) y Europa (25%). Oriente Medio también muestra un crecimiento significativo, aumentando su participación del 2,4% al 3,1%. La riqueza global se está diversificando, con economías emergentes como Indonesia, Arabia Saudita y Vietnam impulsando el crecimiento futuro.

marsbitHace 46 min(s)

Informe Mundial de Riqueza 2026: EEUU genera 36 millonarios diarios, India se convierte en el caballo negro de crecimiento más rápido

marsbitHace 46 min(s)

Gigantes de la IA, entrando en el bosque oscuro

Los gigantes de la IA, como Anthropic, OpenAI y DeepSeek, han entrado en una "selva oscura" estratégica donde retienen deliberadamente sus modelos más avanzados por temor a exponerse ante competidores y reguladores. Anthropic lanzó Claude Opus 4.7 pero admitió que su modelo no publicado, Mythos, es superior, citando preocupaciones de seguridad. OpenAI presentó GPT-5.5, aunque reconocen una brecha entre su capacidad real y lo que los usuarios experimentan debido a limitaciones infraestructurales y estrategias de liberación gradual. Mientras, DeepSeek espera el despliegue a gran escala de los chips Huawei Ascend 950 a finales de 2026 para lanzar su versión completa "V4 Pro Max", que promete un rendimiento superior a un costo significativamente menor. Cada empresa evita mostrar su máximo potencial para no convertirse en el objetivo de la competencia, la presión regulatoria o el escrutinio público, reflejando una dinámica de precaución estratégica en la carrera de la IA.

marsbitHace 1 hora(s)

Gigantes de la IA, entrando en el bosque oscuro

marsbitHace 1 hora(s)

Naval se involucra directamente: El encuentro histórico entre la gente común y el capital riesgo

Resumen: Naval, cofundador de AngelList, asume un rol activo como presidente del comité de inversiones de USVC, un fondo registrado en la SEC que permite a inversores no acreditados participar con solo 500 dólares en empresas tecnológicas privadas como OpenAI, Anthropic y xAI. Este movimiento democratiza el acceso a capital de riesgo, tradicionalmente reservado a grandes fondos e inversores institucionales, y aborda el problema de que la mayor creación de valor ocurre cada vez más temprano en el mercado privado. Sin embargo, conlleva riesgos: baja liquidez, valuaciones opacas y una tarifa anual del 2.5%. USVC no es un producto especulativo, sino una puerta de entrada regulada al crecimiento tecnológico temprano, aunque requiere conciencia sobre los plazos y estructuras de inversión.

marsbitHace 1 hora(s)

Naval se involucra directamente: El encuentro histórico entre la gente común y el capital riesgo

marsbitHace 1 hora(s)

¿Quién está inyectando dinero en el mercado bajista de las criptomonedas?

**Resumen: ¿Quién sigue invirtiendo en el mercado bajista de las criptomonedas?** A pesar de una corrección significativa en el primer trimestre de 2026 (BTC -25%, ETH -35%), el capital institucional siguió fluyendo hacia el mercado de criptoactivos. Los compradores clave incluyeron: * **Empresas:** Strategy (MSTR) aumentó agresivamente sus tenencias de Bitcoin, compras que representaron el 94% del total neto de las empresas públicas. Metaplanet y otras también acumularon. * **ETF:** Se lanzaron numerosos ETF nuevos, incluyendo el primer ETF de ETH con staking de BlackRock (ETHB) y el primer ETF spot de BTC de un banco (Morgan Stanley, MSBT). Los ETF de XRP tuvieron fuertes entradas. * **Fondos de Riqueza Soberana:** Mubadala (Abu Dabi) aumentó su exposición a Bitcoin en un 46%, impulsando el capital soberano de la región por encima de los $1,000 millones. * **Bancos:** Instituciones como UBS, Morgan Stanley y Citigroup lanzaron servicios de custodia y trading para clientes institucionales y privados. 12 bancos europeos formaron un consorcio para un stablecoin del euro (Qivalis). Por el contrario, algunos fondos de cobertura (Brevan Howard, -85%) y mineros de Bitcoin fueron vendedores netos. La inversión de capital de riesgo mostró una polarización extrema: el volumen total se mantuvo (~$50-68B), pero el número de acuerdos se desplomó un 49%. Tres mega-acuerdos (BVNK, Kalshi, Polymarket) representaron la mitad de la financiación, con un claro enfoque en pagos, mercados de predicción y CeFi, mientras que DeFi y el gaming perdieron protagonismo. En resumen, el dinero inteligente institucional, especialmente los actores con una visión a largo plazo, está utilizando la debilidad de los precios para acumular, preparando el terreno para el próximo ciclo alcista.

marsbitHace 1 hora(s)

¿Quién está inyectando dinero en el mercado bajista de las criptomonedas?

marsbitHace 1 hora(s)

Trading

Spot

Futuros

El verdadero valor de DeepSeek V4 no está en los parámetros

Resumen

La ruptura de la localización

El impacto de V4 en las aplicaciones industriales

El verdadero valor de V4

Preguntas relacionadas

Lecturas Relacionadas

¿Cuándo Es La Próxima Reunión De La FOMC Y Cuáles Son Las Expectativas Para Las Criptomonedas?

Informe Mundial de Riqueza 2026: EEUU genera 36 millonarios diarios, India se convierte en el caballo negro de crecimiento más rápido

Gigantes de la IA, entrando en el bosque oscuro

Naval se involucra directamente: El encuentro histórico entre la gente común y el capital riesgo

¿Quién está inyectando dinero en el mercado bajista de las criptomonedas?

Trading

Categorías populares

Etiquetas Populares