Por | Xiang Xianzhi
Anteayer por la noche, MoonDark lanzó Kimi K2.6 y ajustó el precio de entrada de la API de 0,60 dólares por millón de tokens a 0,95 dólares.
Un aumento del 58%. La primera subida de precio desde el lanzamiento de la serie K2.
Pero parece que nadie está prestando atención a esto.
Hace cuatro meses, en una carta interna del último día de 2025, Yang Zhilin escribió que MoonDark "no tiene prisa por hacer una OPI a corto plazo". En ese momento, los prospectos de Zhipu y MiniMax ya habían sido presentados en la Bolsa de Hong Kong, lo que claramente era una distinción deliberada de posición.
También escribió en esa carta que las reservas de efectivo de la empresa superaban los 1400 millones de dólares y que la ronda de financiación Serie C de 500 millones de dólares estaba sobresuscrita—el mensaje implícito era que el potencial del mercado primario aún no se había explotado por completo y que no había prisa por el mercado secundario.
Tres meses después, Bloomberg informó que había comenzado a contactar con CICC y Goldman Sachs. Tres semanas después, se lanzó K2.6.
Una persona a la que no le gusta "la prisa" hizo en cuatro meses lo que antes dijo que no haría.
K2.6 probablemente no sea el último lanzamiento de producto de MoonDark antes de su salida a bolsa. Pero este lanzamiento de versión es el primer roadshow de Yang Zhilin después de que MoonDark planeara su salida a bolsa.
Kimi nunca había lanzado una versión de modelo así
Kimi tenía un conjunto de acciones fijas para lanzar modelos en el pasado.
Publicar informes técnicos, abrir los pesos (weights), competir en el ranking de HuggingFace, y luego esperar el escrutinio de la comunidad técnica. K1.5 se comparó con o1 en metodología de razonamiento, con más detalles técnicos que números de benchmark; K2 Thinking directamente subió los pesos a HuggingFace para que los desarrolladores ejecutaran sus propias pruebas. Estas acciones estaban dirigidas a desarrolladores e investigadores.
El discurso también era el de la comunidad técnica: qué problema resolvimos, por qué nuestro método es mejor, bienvenidos a replicarlo.
Las acciones de K2.6 son un poco diferentes.
Primero, la subida de precio. En términos de RMB, el precio de entrada de K2.6 por millón de tokens es de 6,5 yuanes (cache miss), frente a los 4 yuanes de K2.5. El precio de salida subió de 21 yuanes a 27 yuanes. El precio por cache hit es de 1,1 yuanes.
Es una subida de precio estructurada. Superficialmente, todos los niveles suben, pero el nivel de cache hit tiene el aumento más pequeño—de 0,7 yuanes a 1,1 yuanes, que en dólares son 0,16 dólares por millón de tokens.
Estos 0,16 dólares son la clave para entender esta subida de precio.
Para los usuarios empresariales que usan el mismo system prompt durante mucho tiempo: asistentes de código, frameworks de orquestación de Agent, servicio al cliente inteligente, su prefix es altamente reutilizable, y la tasa de cache hit puede llegar al 75%-83%. MoonDark les ha mantenido un precio casi igual.
Para los clientes esporádicos que lo usan ocasionalmente, con prompts diferentes cada vez, esta subida de precio les ha afectado plenamente.
Es un ajuste de precio amigable para "empresas ya vinculadas a Kimi" y uno desfavorable para "clientes dispersos que aún comparan precios". Los primeros son los "clientes empresariales cautivos" en la historia de la salida a bolsa, los últimos son los "usuarios de cola larga" que no aparecerán en el PPT del roadshow. MoonDark sabe muy bien quiénes son sus activos de valoración.
La estructura de potencia de cálculo de la era Agent es diferente a la de la era del diálogo. Los modelos de diálogo son decenas de tokens de ida y vuelta, los Agent son miles de llamadas a herramientas y consumo de cientos de miles de tokens. En los casos oficiales de K2.6—implementación local en Mac del modelo Qwen3.5 llamando a herramientas más de 4000 veces, durando 12 horas; reconstrucción del motor de matching open source exchange-core, 13 horas, más de 1000 llamadas a herramientas; más extremo, 5 días de funcionamiento autónomo monitorizando alertas, respondiendo a fallos—el consumo de tokens por tarea individual es cientos o incluso miles de veces mayor que en los escenarios de diálogo de la era K2.5.
Por supuesto, estos casos sirven para hablar de la capacidad de razonamiento de largo alcance, pero sumando los 300 agent clusters de K2.6, el consumo de tokens debe ser asombroso.
Con el precio antiguo de 0,60 dólares, esta tarea de Agent podría perder dinero por llamada. A 0,95 dólares, cubre apenas el coste de inferencia.
Así que la subida de precio no es confianza, es necesaria. MoonDark ha recaudado累计 2500 millones de dólares en total, con 1400 millones de dólares en reservas de efectivo de la Serie C a la C+, pero si la próxima generación K3 es realmente de 3-4 billones de parámetros, un único preentrenamiento podría comerse la mitad de eso.
Sin subir los precios, los datos de margen bruto de los últimos trimestres antes de la salida a bolsa serían feos. El prospecto debe divulgar el margen bruto.
Esto se podría haber explicado abiertamente—la era Agent necesita un nuevo modelo de precios. Pero MoonDark no lo hizo. Porque los usuarios finales (C端) acaban de llegar de la era gratuita de K2 Thinking, y ahora decirles "he subido los precios" no es una buena historia de producto.
Es una historia para otro oyente—Kimi ya tiene un grupo de clientes empresariales que no pueden prescindir de él, y lo usarán incluso si es más caro. (Como yo mismo)
Lo segundo es la comparativa de referencia. Los referentes oficiales elegidos para K2.6 son GPT-5.4, Claude Opus 4.6, Gemini 3.1 Pro. Los tres son flagships de la generación anterior.
La misma semana, Anthropic lanzó Claude Mythos, y Opus 4.7 también acaba de salir—ambos son una generación mejores que Opus 4.6. K2.6 no se comparó con ellos.
Esto es en realidad una elección activa. Comparado con Mythos, K2.6 queda en la posición de "perseguidor"; comparado con Opus 4.6, K2.6 queda en la posición de "primera línea". Una valoración de 18.000 millones de dólares necesita lo segundo.
Kimi no solía hacer este tipo de cosas. Cuando se lanzó K2 Thinking, oficialmente ejecutaron benchmarks completos, con buenos y malos resultados, todos publicados para que los desarrolladores juzgaran. Esa era la forma de jugar de la comunidad técnica—la comunidad entiende dónde eres fuerte y dónde débil, y está dispuesta a aceptar un modelo con debilidades claras pero una ruta clara.
El PPT del roadshow no lo es. El PPT del roadshow necesita una conclusión que un gestor de fondos entienda en 30 segundos: "igual o mejor que los modelos cerrados internacionales de primer nivel". Esta frase es el original del blog oficial de K2.6.
Lo tercero es el clúster de Agents y el doble carril open source. K2.6 actualizó algo llamado Claw Groups—un ecosistema de Agents heterogéneos, donde Agents de diferentes dispositivos, diferentes modelos, diferentes cadenas de herramientas funcionan en un espacio colaborativo, y K2.6 actúa como planificador. 300 sub-Agents en paralelo, 4000 pasos de colaboración, 5 días de funcionamiento autónomo.
Estos números están escritos para clientes empresariales. No para desarrolladores. Para un desarrollador, "300 Agents en paralelo" no tiene sentido práctico—no ejecutará 300 Agents en un proyecto local. Esta configuración solo tiene sentido para un tipo de cliente: grandes empresas que necesitan automatizar procesos operativos completos con una matriz de Agents.
La historia a la que apunta es la de Salesforce, no la de HuggingFace.
Al mismo tiempo, K2.6 es completamente open source. Yang Zhilin dijo en el Foro de Zhongguancun del 26 de marzo que el open source será una victoria absoluta.
Open source + clúster empresarial de Agents, esta es una posición intermedia entre DeepSeek y Anthropic, ocupando la mitad de ambos modos. Suena a buena historia. Pero ocupar ambos lados significa tener que demostrar ambos.
El mercado de capitales en realidad no se preocupa por si estas preguntas tienen respuesta. Solo exige que tengas una historia para cada línea.
Subida de precio, comparativa, clúster de Agents—estas tres cosas juntas tienen un punto anormal en común. Ninguna es para la comunidad técnica.
La lógica subyacente de Kimi al lanzar modelos en el pasado era—si a los desarrolladores les gusto, los clientes empresariales eventualmente seguirán, y el mercado de capitales eventualmente también. Este enfoque tiene un nombre: sinceridad técnica.
K2.6 no espera más. La subida de precio es una declaración directa del poder de fijación de precios para el segmento B2B; compararse con GPT-5.4 es una colocación anticipada de la posición de valoración; el clúster de Agents y Claw Groups son el escaparate de la historia de servicios empresariales.
Cada cosa corresponde a una pregunta en el PPT del roadshow: ¿Cuál es tu capacidad de comercialización? ¿Cuál es tu posición comparativa? ¿Cuáles son tus barreras en el segmento B2B?
Comprimir el tiempo de Preview a GA a 8 días también sigue esta lógica. Las versiones anteriores de la serie K2 pasaron por periodos de preview de 2-3 meses, para que la comunidad probara lo suficiente, diera feedback y iterara. K2.6 no se dio ese espacio. No es que la tecnología haya madurado más rápido, es que la ventana de oportunidad no espera.
Una OPI en la segunda mitad de 2026, según el proceso de la Bolsa de Hong Kong, requiere de 4 a 6 meses para presentar la solicitud, consultas, audiencias, roadshow, fijación de precios, periodo de reflexión. Iniciar el roadshow en septiembre significa tener el producto listo en abril.
Si no se lanza la GA en abril, no habrá ventana después.
K3 es el verdadero plato fuerte
Pero K2.6 tampoco es la carta más fuerte que MoonDark puede sacar.
En el blog oficial hay una frase muy contenida—K2.6 es la "pista de despegue preparada para K3".
12 horas de codificación de largo alcance, clúster de 300 Agents, compresor de contexto—estos no son la forma final de la serie K2, son la infraestructura de capa de ejecución que un modelo base más grande puede soportar. MoonDark no se esforzaría en hacer funcionar esto a menos que esté seguro de que hay un modelo más grande que consumirá estas capacidades.
Reddit filtró antes información sobre K3, con un objetivo de escala de parámetros de 3-4 billones. Comparado con la escala de billones de la serie K2, este es un salto de base.
Si K3 puede lanzarse durante la ventana del roadshow—esa es la verdadera respuesta. La pista allanada por K2.6, K3 despega.
La pregunta es si se puede lograr. ¿Cuánto tiempo se tarda en entrenar un modelo de 3-4 billones de parámetros? GPT-5 y Claude Opus 4.6 tuvieron ciclos de preentrenamiento de unos 6-9 meses, más unos meses adicionales para el post-entrenamiento y la evaluación de seguridad. ¿Puede la capacidad de cálculo existente de MoonDark—según la cooperación con Alibaba Cloud y las actuales reservas de efectivo—comprimir este ciclo a 5-6 meses?
Esta apuesta se ha hecho en K2.6.
Ocho días de Preview a GA, el clúster de Agents expandido de una vez de 100 a 300, la ejecución de largo alcance estirada de cientos de pasos a 4000—cada acción comprime el tiempo, cada una hace espacio para la posibilidad de K3.
Si K3 puede lanzarse antes de agosto o septiembre—esa será la pieza central del roadshow.
Si no se consigue—K3 se convierte en "el modelo que solo se puede lanzar después de la salida a bolsa", y K2.6 tendrá que sostener toda la narrativa de valoración solo.
MoonDark apuesta a que puede hacerlo.
¿A qué está anclada la valoración de 18.000 millones de dólares?
Volvamos a la valoración.
Hace tres meses, MoonDark estaba valorada en 4300 millones de dólares, hace dos meses en 5500 millones, ahora en 18.000 millones.
No es que MoonDark se haya vuelto cuatro veces más fuerte en estos tres meses. Es que Zhipu y MiniMax, después de salir a bolsa, subieron 4 veces, elevando el techo de todo el sector. La capitalización de mercado de Zhipu en Hong Kong es de 305.000 millones de HKD, la de MiniMax de 309.200 millones de HKD—ambas superan el máximo histórico de SenseTime.
La lógica de valoración de estas dos no es "qué puede hacer la próxima generación de tecnología", es "hasta qué punto se puede valorar el activo de IA en el estanque de la Bolsa de Hong Kong".
La valoración de 18.000 millones de dólares de MoonDark se ancla en lo mismo. Ya no está demostrando que es la empresa de IA china más fuerte, está demostrando que es una empresa de IA china que puede ser valorada.
Todas las acciones de K2.6—subida de precio, comparativa, clúster de Agents, doble carril open source—responden a esta proposición.
Pero hay una cosa que K2.6 aún no ha demostrado. ¿Estarán dispuestos los usuarios finales (C端) de Kimi a pagar por K2.6 con el precio subido? ¿Fluirán los usuarios de suscripción de pago hacia DeepSeek o MiniMax? ¿Cuántos de los clientes empresariales están ejecutando realmente Claw Groups y cuántos solo han firmado una POC (Prueba de Concepto)?
Estos números son los que los inversores preguntarán inevitablemente durante el roadshow. K2.6 ahora solo puede presentar el producto. Que se convierta en números depende de los próximos tres meses.
Cuando Zhipu salió a bolsa, presentó un prospecto con beneficios aún no positivos, MiniMax también. Los inversores aceptaron esta historia porque entonces la gran narrativa del "activo de IA chino" acababa de abrirse. MoonDark llega con seis meses de retraso. Para la misma pregunta, Zhipu y MiniMax pueden decir "estamos verificando", MoonDark debe decir "estamos monetizando".
Toda esta presión recae en los tres meses entre K2.6 y K3.
Así que volvemos a la pregunta inicial—¿Es K2.6 el último roadshow de MoonDark antes de su salida a bolsa?
No.
Si K3 llega a la ventana del roadshow, K3 será el verdadero plato fuerte. K2.6 es solo la pista preparada para él. Si K3 no llega a la ventana del roadshow, K2.6 tendrá que aguantar toda la narrativa de la salida a bolsa. Entonces será el primero que Yang Zhilin se vio obligado a comenzar antes de tiempo.
Cualquiera de los dos resultados no era lo que Yang Zhilin quería hace cuatro meses.
Pero todo lo que ha pasado en estos cuatro meses—la salida a bolsa de Zhipu y MiniMax, el techo de valoración elevado, la ventana de oportunidad comprimida—ha hecho que a una persona a la que no le gusta "la prisa" tenga que darse prisa.
Cuando se lance K3, será el segundo.








