¿Cuántos Token le faltan a Yang Zhilin para alcanzar la 'Luna que persigue la luz'?

marsbitPublicado a 2026-04-26Actualizado a 2026-04-26

Resumen

Resumen: En el panorama competitivo de la IA china, Yang Zhilin, fundador de MoonDark (Kimi), enfrenta una "ansiedad existencial" ante la presión técnica, comercial y capitalista. Aunque Kimi ha logrado avances significativos en agentes multiagente y contextos largos, su alto perfil y altas expectativas contrastan con el enfoque silencioso y técnico de DeepSeek, que recientemente lanzó su modelo V4 de código abierto con 1,6 billones de parámetros. Mientras DeepSeek busca una narrativa de innovación disruptiva, Kimi enfrenta desafíos de comercialización y presión por su posible salida a bolsa. A pesar de esto, ambos modelos son cruciales para el ecosistema de IA chino, reduciendo la brecha con EE.UU. a solo un 2,7% en evaluaciones Elo. La competencia entre estas empresas impulsa la innovación y posiciona a China a la vanguardia global de los modelos de código abierto.

Por | Memorándum de Sombras

En las plataformas sociales, este enfrentamiento ha sido titulado con diversos epítetos dramáticos: "El enfrentamiento directo de los dos héroes del código abierto más fuertes", "El momento de escucha de DeepSeek y Kimi", "La canción de hielo y fuego de la pista de IA"... La gente se entusiasma con resumirlo todo en dicotomías, como si solo una narrativa extrema pudiera igualar esta competencia destinada a ser escrita en los anales de la IA china.

Pero bajo esta superficie ruidosa, surge una pregunta más digna de ser planteada: cuando DeepSeek usa 15 meses de silencio para lograr el impacto de V4, ¿realmente Yang Zhilin, sentado al otro lado, tiene la tranquilidad para disfrutar de esta competencia?

Si la ansiedad de DeepSeek es "ansiedad de elección" — ¿elegir mantener el silencio o volver a buscar financiación, elegir profundizar en código cerrado o abrazar el ecosistema — entonces la ansiedad de Yang Zhilin de Dark Side of the Moon se parece más a un estrechamiento del cerco: una "ansiedad de supervivencia" bloqueada simultáneamente por tres fuerzas — tecnológica, comercial y de capital —, en un dilema de avance y retroceso.

Y esta expresión de ansiedad no es solo una inquietud a nivel personal, sino también un reflejo real del dilema estratégico de "querer既要 y querer又要" que enfrenta una startup en una pista de un billón de dólares.

Este no es un artículo para cantar la decadencia de Kimi. Por el contrario, quizás es precisamente porque Kimi se para lo suficientemente alto y carga lo suficientemente pesado, que la ansiedad de Yang Zhilin tiene un significado universal — refleja el dilema colectivo de todas las startups chinas independientes de modelos grandes.

Dos fundadores, dos "techos"

Para entender la ansiedad de Yang Zhilin, no se puede solo mirar a la compañía Dark Side of the Moon, debe colocarse en un marco comparativo con DeepSeek. Estas dos compañías no solo son objetos de competencia y cooperación tecnológica, sino que también forman una relación de espejo en la narrativa.

A principios de 2023, cuando los inversionistas discutían "quién es la persona con más ideal técnico en China", el nombre de Yang Zhilin ocupaba la mitad de las respuestas. Este graduado de pregrado del Departamento de Computación de Tsinghua, el primero de su clase en el Instituto de Tecnología del Lenguaje de la Universidad Carnegie Mellon, que como primer autor o co-primer autor participó en la propuesta de Transformer-XL y XLNet, sigue siendo un nombre ineludible en la historia del desarrollo de modelos de pre-entrenamiento.

En marzo de 2026, Yang Zhilin se paró en el escenario principal de la conferencia GTC de Nvidia, sentado junto a los responsables de OpenAI y DeepMind. Él era el único representante de una startup independiente de modelos grandes en el escenario, los demás eran responsables de proyectos bajo grandes empresas tecnológicas. Cuando esta foto llegó a China, la valoración de Dark Side of the Moon acababa de duplicarse tres veces en tres meses, convirtiéndose en una empresa decacornio.

Yang Zhilin hablando en la conferencia GTC

Este es el halo de Yang Zhilin, pero la otra cara del halo es el "techo".

El fundador de DeepSeek, Liang Wenfeng, tomó un camino completamente diferente. En enero de 2025, el lanzamiento de DeepSeek R1 fue llamado por Wall Street el "momento Sputnik" de la IA: la capitalización de mercado de Nvidia se evaporó casi 600 mil millones de dólares en un día, los ingenieros de Silicon Valley estudiaron el informe técnico toda la noche.

Pero luego, entró en un largo silencio de 15 meses, DeepSeek casi desapareció de la vista principal. Hasta el 24 de abril de 2026, la versión preliminar V4 se lanzó, con 1.6 billones de parámetros, un contexto de un millón de tokens y un precio tan bajo como 0.28 dólares por millón de tokens de salida, remodelando todo el panorama competitivo de los modelos de código abierto.

Liang Wenfeng usó 15 meses de reclusión para cambiar por una narrativa técnica más poderosa. En muy pocas ocasiones públicas dijo una frase: "No hacemos productos para contar historias, hacemos la tecnología misma".

¿Y Yang Zhilin? En él se está formando un halo típico de emprendedor, pero es precisamente este halo lo que le hace soportar una presión única. Esta presión no es la ansiedad de ser ignorado, sino la ansiedad de ser sobrevalorado pero no poder cumplir completamente.

Estética competitiva de mutuo aprendizaje

A nivel técnico, Dark Side of the Moon y DeepSeek pueden ser la relación de competencia y cooperación más interesante en el campo global de modelos grandes.

En la semana de abril de 2026, las dos compañías representaron un casi perfecto "apretón de manos a distancia". El lunes, Kimi lanzó K2.6; el viernes, DeepSeek V4 se puso en línea. Pero bajo esta superficie competitiva, se esconde un hecho más esencial: estas dos compañías están definiendo conjuntamente los límites técnicos de los modelos grandes nacionales compartiendo los resultados de código abierto.

El modelo K2 lanzado por Kimi en julio de 2025, validó por primera vez a gran escala el optimizador de segundo orden Muon en la arquitectura subyacente, y al mismo tiempo adoptó el mecanismo MLA (Atención Latente Multi-Cabeza)首创 por DeepSeek. Para abril de 2026, DeepSeek V4 también adoptó en su arquitectura el optimizador Muon, reemplazando el optimizador Adam que había estado usando durante diez años. Un comentario resumió vívidamente este fenómeno: "Tú usas mi arquitectura, yo uso tu optimizador".

Este mutual aprendizaje no es en absoluto accidental. El código abierto es precisamente la palanca clave para que las empresas chinas de IA aceleren su catch-up con los líderes globales. Los únicos dos modelos en China con más de un billón de parámetros totales y cuyos pesos están公开, son precisamente DeepSeek y Kimi.

Pero sus enfoques técnicos forman una división del trabajo diferenciada.

El avance central de DeepSeek V4 radica en la reconstrucción de costos del contexto de un millón de tokens. Adopta un nuevo mecanismo de atención híbrida, combinando compresión de dimensión Token y atención dispersa DSA (DeepSeek Sparse Attention), comprimiendo el cálculo de inferencia por token al 27% de V3.2, y la Caché KV se reduce al 10%.

Esto no es solo una mejora en los indicadores técnicos, sino también la infraestructura para convertir el contexto de un millón de tokens de una demostración técnica en un "equipo estándar de todos los servicios oficiales". Al mismo tiempo, V4 hizo optimizaciones especiales en la capacidad de Agente, y también construyó su propia plataforma sandbox llamada DSec, donde un solo clúster puede gestionar concurrentemente cientos de miles de instancias sandbox, para soportar el entrenamiento y evaluación de aprendizaje por refuerzo de Agente.

La dirección de Kimi K2.6 se inclina más hacia la codificación de largo alcance y los clústeres de Agentes. Obtuvo una puntuación de 68.2 en la evaluación interna de Kimi Code Bench, un aumento de aproximadamente 20% respecto a 57.4 de K2.5, y puede支持 hasta 300 subagentes en paralelo completando 4000 pasos de colaboración. K2.6 puede ejecutarse de forma autónoma de forma sostenible hasta cinco días, y en una sola ejecución puede completar independientemente la entrega de múltiples productos de extremo a extremo, desde documentos hasta páginas web, PPT y tablas.

Estas dos rutas técnicas son como verter cimientos y colocar ladrillos simultáneamente para un edificio: DeepSeek piensa en cómo hacer los cimientos más anchos y estables (popularización del contexto de un millón de tokens), Kimi piensa en cómo hacer que la casa sea más alta e inteligente (evolución fundamental de la colaboración multiagente). Cada uno tiene sus fortalezas, pero también sus límites.

Vale la pena señalar que este caminar con dos piernas técnicas constituye precisamente el activo más valioso de los modelos grandes nacionales.

¿Quemar dinero para comprar volumen o造血 técnica?

Si el mutual aprendizaje técnico ha establecido un cierto "respeto entre héroes" para ambas partes, entonces la competencia comercial desgarra todas estas fantasías románticas.

Kimi es el producto estrella con el halo más brillante entre las empresas independientes de modelos grandes, pero esto en sí mismo es también su mayor carga. Según información透露 por personas del sector, Dark Side of the Moon tiene en sus manos fondos y talento que pertenecen a la primera梯队 en el país, pero su producto central es solo el asistente Kimi, lo que hace que sus fuentes de ingresos sean extremadamente limitadas, los usuarios gratuitos constituyen la gran mayoría, la tasa de conversión de suscripciones pagas es baja, y el volumen de llamadas API está muy lejos de las empresas专注于 B2B.

En 2025, Dark Side of the Moon hizo un gran ajuste estratégico: se retiró de la carrera armamentista de quemar dinero para comprar volumen, los gastos en flujo de inversión se redujeron abruptamente de 700 millones de yuanes del año anterior a menos de 100,000 yuanes,转而 enfocándose en la iteración del modelo base y el desarrollo de productos Agente, lanzando tres versiones principales K2, K2 Thinking, K2.5 en medio año. Este giro "cortarse un brazo" es esencialmente una respuesta directa al dilema comercial. Cuando el crecimiento de usuarios no se convierte en ingresos, solo queda demostrar su valor real a través de la造血 técnica.

Pero la "造血 técnica" no es algo que se logre en un día. Yang Zhilin admitió en una carta interna de noviembre de 2025 que los ingresos por API en el extranjero de Kimi crecieron 4 veces, y la velocidad de crecimiento mensual de usuarios pagos dentro y fuera de China superó el 170% — pero incluso así, desde la valoración, Dark Side of the Moon aún enfrenta una gran尴尬: una vez que los inversionistas sienten que no puede convertirse rápidamente en una máquina de ingresos, si el mercado secundario puede aceptarlo se convierte en una gran incógnita.

Más棘手的是, las empresas de modelos grandes enfrentan en el segmento C2C un golpe dimensional descendente de los gigantes. Personas del sector透露 que Dark Side of the Moon se enredó en la competencia con las grandes empresas tecnológicas, y el resultado fue que en China no pudo vencer a Doubao, bajo ByteDance, y al mismo tiempo perdió el momento de expansión del mercado exterior.

En el extranjero todavía es un mercado相对 de competencia plena, no solo GPT y Gemini. Si hay una gran cantidad de clientes globales dispuestos a pagar por modelos grandes nacionales, aún existe una enorme oportunidad de mercado, pero actualmente las áreas de出海 efectiva se concentran en el campo de video con IA, y Dark Side of the Moon no tiene una ventaja突出 en esta pista.

Aunque DeepSeek teóricamente enfrenta problemas similares, su situación es completamente diferente. Liang Wenfeng en el pasado mantuvo una postura克制 hacia el capital externo, incluso被视为 como arte de行为 deliberadamente alejado del mercado de capitales. Pero esta "escasez" pasiva反而 le ganó poder de negociación.

Según消息, DeepSeek正在 buscar financiación, y su objetivo de valoración se ha ajustado desde al menos 10 mil millones de dólares iniciales a más de 20 mil millones de dólares, superando la valoración de 18 mil millones de Dark Side of the Moon.

La balanza de la valoración se está balanceando悄无声息地 — en 2023 Yang Zhilin被视为 "la persona más digna de invertir", en menos de tres años, el orden de prioridad de atención de los capitalistas ya ha mostrado un移动 significativo.

Espejo en el juego internacional

Al ampliar la mirada, toda la historia de DeepSeek y Kimi está anidada en un sistema de coordenadas más grande — la competencia de IA entre China y EE.UU. y el juego ecológico de código abierto y cerrado en China.

En abril de 2026, el "Informe del Índice de IA 2026" publicado por HAI de la Universidad de Stanford, destacó en casi todos los resúmenes de los medios chinos un conjunto de números: la diferencia en la puntuación Elo entre los mejores modelos de China y los mejores modelos de EE.UU. es de solo 2.7%. Esto significa que la brecha de rendimiento de los modelos de IA entre China y EE.UU. casi ha desaparecido, y los modelos grandes de China ya han alcanzado a los productos más fuertes de EE.UU. en múltiples dimensiones.

Y en el proceso de catch-up entre China y EE.UU., DeepSeek y Kimi han jugado un papel clave. La empresa con mayor capitalización bursátil del mundo, Nvidia, al mostrar el rendimiento de la próxima generación de chips, eligió modelos precisamente de DeepSeek y Kimi. Modelos de código abierto representados por Kimi K2.5 se han convertido en el "estándar de referencia" para que los fabricantes de hardware prueben el rendimiento del hardware — después del lanzamiento de nuevos chips, es necesario evaluar la mejora de rendimiento a través de modelos como Kimi.

Yendo más allá, DeepSeek还有 una historia sobre "autonomía ecológica". DeepSeek V4 rompió el patrón de dependencia a largo plazo de chips de Nvidia, eligiendo全面 los últimos chips Ascend de Huawei como base central de potencia de cálculo. Al respecto, el CEO de Nvidia, Jensen Huang,直言 en una entrevista que el nuevo modelo de DeepSeek basado en la plataforma Huawei "será un mal resultado para Estados Unidos".

Así, la industria china de IA正在 formando dos líneas principales entrelazadas: una es la "ruta de salida al mar técnica" de Kimi — influir en la comunidad global de investigación a través de modelos de código abierto; la otra es la "ruta de autonomía de potencia de cálculo" de DeepSeek — impulsar la sustitución de chips y la madurez del ecosistema de potencia de cálculo nacional. Ambas llegan al mismo destino por diferentes caminos, pero las fuerzas impulsoras detrás son diferentes.

Sistema discursivo del fundador

En la narrativa macro del fundador, los estilos de Yang Zhilin y Liang Wenfeng forman un interesante contraste.

Yang Zhilin habló密集mente en 2026, casi每一次 pudo convertirse en el foco de la industria.

En la conferencia GTC de Nvidia,披露系统áticamente la hoja de ruta técnica de Kimi, resumiendo su estrategia de Scalín con tres palabras clave: eficiencia de Token, contexto largo, clúster de Agentes. Enfatizó que para impulsar el avance continuo del límite superior de inteligencia de los modelos grandes, es necesario重构 los cimientos subyacentes como el optimizador, el mecanismo de atención y las conexiones residuales.

En el Foro de Zhongguancun, apostó por dos命题 más macro: "código abierto" y "investigación autónoma de IA". Propuso que los modelos de código abierto se están convirtiendo en el nuevo "estándar" de la industria global de IA, y dio un juicio极具争议 — "finalmente, si la capacidad del modelo alcanza el mismo nivel, el código abierto será el绝对 ganador". También dividió el desarrollo de IA en tres etapas: la etapa de datos naturales y anotación人工 de 2023-2024, la etapa de tareas verificables seleccionadas人工mente de 2025, y la etapa de investigación主导 por IA a partir de 2026.

En la carta a todos los empleados a finales de 2025, también aclaró el objetivo para 2026: enfocarse en el Agente en producto y comercialización, no tomar la cantidad absoluta de usuarios como único objetivo, buscar持续mente el límite superior de inteligencia, crear mayor valor de productividad, y lograr un crecimiento数量级 en la escala de ingresos.

La expresión pública de Liang Wenfeng es mucho más escasa. Pero cada vez que habla, es contundente.

A finales del año pasado, ante la追问 sobre la brecha de IA entre China y EE.UU.,坦言 así: "superficialmente la IA de China frente a EE.UU. puede tener solo una brecha tecnológica de uno o dos años, pero la brecha real es la diferencia entre originalidad e imitación, si esta brecha no cambia, nuestro país永远 solo podrá ser perseguidor, no disruptor..." Y en otra讨论 sobre la memoria de IA, propuso que el momento en que el aprendizaje de contexto y la memoria se vuelvan confiables, quizás sea el tema central de 2026.

La diferencia detrás también revela precisamente: Liang Wenfeng puede elegir "desaparecer" para换取 innovación de cero a uno más profunda, mientras que Yang Zhilin, como timonel de una startup independiente, cada giro estratégico, cada discurso público, se convierte en una señal消化 por el mercado de capitales.

Por qué Yang Zhilin不得不 estar ansioso

La "ansiedad" no es solo un problema metafísico. En el campo de batalla real del capital, la situación de Yang Zhilin se está volviendo cada vez más微妙.

Según los datos, la trayectoria de financiación de Dark Side of the Moon es lo suficientemente impresionante — desde una valoración de 300 millones de dólares en la ronda ángel de junio de 2023, hasta 4.3 mil millones de dólares (ronda C) a principios de 2026, luego 10 mil millones de dólares en febrero, y进一步 escalando a 18 mil millones de dólares tres meses después, en marzo. El aumento es sorprendente, la valoración ya se acerca al nivel de 20 mil millones de dólares.

Pero la otra cara de la moneda es que la接受度 de la alta valoración del mercado primario cuando se transmite al mercado secundario tiene una巨大 incertidumbre. Personas del sector表示 que a finales del año pasado dentro de Dark Side of the Moon se弥漫 una ansiedad — frente a la上市 consecutiva de智谱 y MiniMax en Hong Kong, los empleados del departamento难免 se desmoralizaron, muchos sintieron que la ventana de oportunidad de los modelos grandes es corta, y la oportunidad de上市 es fugaz.

Yang Zhilin a finales de 2025还 mostró interiormente una坦然 de no apresurarse a salir a bolsa, pero solo tres meses después, la风向 del mercado dio un giro de 180 grados — Dark Side of the Moon紧接着 fue爆料 con el rumor de "considerar una IPO en Hong Kong".

El cambio tan rápido, la respuesta tiene casi solo una posibilidad: el capital no da suficiente tiempo para "esperar".

Y lo más关键 es que上市 no es un simple "变现 de salida", significa más restricciones, más追问 de informes financieros, cada trimestre hay que rendir cuentas de desempeño a los accionistas. Y el modo de变现 de Kimi actualmente仍处于 una difícil阶段 de ascenso. Desde la estructura de ingresos, se estima que los ingresos anuales de Dark Side of the Moon en C2C son de aproximadamente 200 millones, los ingresos por API aunque crecen parecen una gota en el océano frente a una alta valoración de 18 mil millones de dólares. Incluso si K2.5 en menos de 20 días desde su lanzamiento creó más ingresos que todo el año anterior, todavía no es suficiente para llevarla a un camino健康 de盈利.

Si comparamos Dark Side of the Moon con una empresa que está construyendo un rascacielos — los cimientos en大肆宣传 son vistos como los más sólidos, pero en realidad dentro del edificio hay极缺 inquilinos.上市 es abrir la muestra al mercado de inversión, pero en el hall solo hay零星 visitantes, no "inquilinos" dispuestos a pagar a largo plazo. Entonces, ¿cuánto tiempo puede维持 la paciencia del mercado de capitales?

Aunque las dos compañías toman caminos diferentes, desde la视角 de los inversionistas, la forma narrativa de valoración de DeepSeek ya ha formado una restricción para Dark Side of the Moon. Aunque Dark Side of the Moon en algunos escenarios es visto como el fabricante independiente de modelos más competitivo técnicamente de China, el capital开始 buscar un referente — el efecto detonante de DeepSeek R1 hizo ver otra lógica: el ciclo perfecto (modelo explosivo → influencia global → atracción ecológica → regreso de financiación) puede ser completado por una empresa相对低调.

Según消息, DeepSeek actualmente正在 tomando parte de la valoración de Dark Side of the Moon como基准 de referencia, pero el objetivo de valoración se ha ajustado a más de 20 mil millones de dólares, superando los 18 mil millones de Dark Side of the Moon. Esto en sí mismo说明 un fenómeno: el mercado de capitales está dispuesto a pagar un mayor溢价 por DeepSeek, quizás porque后者 está más cerca de la narrativa de "disruptor de cero a uno".

El mercado chino de modelos grandes de 2026 ya no es una era donde Kimi独占 el discurso. En cierto sentido, DeepSeek se ha convertido en el oponente精神 natural de Dark Side of the Moon en la narrativa de financiación y valoración — aunque los modelos de negocio y direcciones estratégicas de las dos compañías no son完全相同.

Y un "terremoto de valoración"无声 no se puede消除 solo porque双方 en lo básico tengan各有长处. Cuando Kimi se prepara para la IPO y DeepSeek también planea financiación, es más probable que este orden de asientos sea讨论 públicamente. Si hay una ansiedad que Yang Zhilin no puede evitar, es en esta carrera, después de perder la etiqueta de "único e inigualable", cómo establecer su punto de anclaje de valor insustituible.

Conclusión

Aunque se ha usado tanto espacio para analizar la ansiedad de Yang Zhilin — la追赶 de V4 de DeepSeek, la presión de变现 comercial, la逼迫 de la ventana de上市 — pero al final del artículo,必须表明 firmemente una actitud: la competencia nunca es algo malo. Por el contrario, en el actual格局 de competencia internacional de IA, lo que más necesita China es la持续 "persecución mutua" de DeepSeek y Kimi.

Repasando los últimos años, desde que Kimi comenzó con texto largo, hasta los últimos dos años corriendo juntos hacia la innovación de arquitectura subyacente, ambos han llevado hoy los modelos de código abierto de China al frente mundial. Según datos de la investigación de OpenRouter 2025, aproximadamente un tercio del uso global de modelos de IA proviene de China, los datos de OpenRouter表明 que hace solo dos años esta participación era impensable, y DeepSeek处于领先位置 en esta participación.

La industria china de modelos grandes正在 experimentar un "格局 multipolar" sin precedentes. Algunas empresas eligen profundizar en código cerrado, otras elegir colaborar en código abierto; algunas atacan超级应用 C2C, otras se enfocan en el desarrollo de herramientas B2B; algunas desarrollan inteligencia de clúster con marcos de Agente自研, otras toman la memoria, el contexto como campo de batalla principal para los próximos tres años.

Un专家曾言: en los próximos cinco años la proporción de modelos de código abierto puede alcanzar el 80%, y los modelos de código cerrado alrededor del 20% — China está全球领先 en modelos de código abierto. Más报告 de la industria指出, los fabricantes independientes chinos de modelos grandes,凭借 flexibilidad de decisión,有望 presentar con las grandes empresas de internet un格局 de competencia estratificada y simbiosis complementaria, las grandes empresas主导 la base通用 y los escenarios C2C con potencia de cálculo, datos, ecosistema, mientras que los fabricantes independientes se enfocan en突破 técnicos verticales e innovación de código abierto.

Ahora, la代表性 de DeepSeek y Kimi已经 trascendido el ámbito nacional — Nvidia los usa para probar la próxima generación de chips, la comunidad global OpenClaw投票 configuró Kimi K2.5 como su modelo principal oficial, los productos de código cerrado de primer nivel también son奋起直追 en las evaluaciones de rendimiento por parte de ambas. Pero, la关键 del futuro es: solo con dos empresas corriendo en la primera fila de la ola de IA china todavía no es suficiente. Para que los modelos grandes nacionales reduzcan持续mente la distancia con los modelos顶尖 internacionales,需要 que emerjan más productores de modelos excelentes, para que el rendimiento del modelo base se vuelva más diverso.

Desde una视角 más amplia, la diferencia en la puntuación Elo entre los mejores modelos de China y EE.UU. es de solo 2.7%. Una brecha tan pequeña significa que la ventana de oportunidad para que cualquier empresa china de modelos llegue primero a la siguiente meseta de rendimiento está abierta. La historia de los modelos grandes de China, en realidad, se escribe精彩 precisamente porque es催生 por una diversidad competitiva — la guerra de los cien modelos no es una palabra贬义, sino un mensajero de la maduración industrial.

En este sentido, la ansiedad de Yang Zhilin quizás sea un paso necesario para que Dark Side of the Moon madure en el futuro. Pero no debería ser una razón para que el público cante la decadencia de Kimi. Por el contrario, deberíamos致敬 el espíritu técnico de estos dos fundadores de no buscar beneficio私利 y correr一心 hacia adelante — Liang Wenfeng así, Yang Zhilin también.

Abril de 2026 ya llega a su fin. Yang Zhilin, regresando del GTC de Silicon Valley al Foro de Zhongguancun, quizás ya no tiene tiempo para preocuparse por la interminable guerra de口水 sobre "quién es más fuerte, DeepSeek o Kimi".

Porque él很清楚 que lo que最终决定 qué hierba率先迎来 la luz del sol, no es si llega o no la tormenta, sino qué tan profunda y amplia están las raíces.

En esta carrera并肩 en la oscuridad de los modelos grandes nacionales, Yang Zhilin ha trazado un camino de磨砺实战 desde élite académico hasta líder empresarial. Tener capital para financiar, personas para usar, productos para iterar, un futuro panorama de Agente para disfrutar — Kimi no está lejos de ello ahora. Y desde la "luna oscura" hasta la "luna que persigue la luz", quizás solo necesita dar el primer paso después de recorrer un túnel oscuro lleno de ansiedad y质疑.

La luz al final del túnel proviene de los DeepSeek, de los Kimi, y también de los llegados后发 posteriores de más modelos grandes locales.

Preguntas relacionadas

Q¿Cuál es la principal diferencia entre las estrategias de DeepSeek y Kimi en el desarrollo de modelos de IA?

ADeepSeek se centra en hacer que el contexto de un millón de tokens sea accesible y económico, con avances en mecanismos de atención híbrida y reducción de costes, mientras que Kimi se orienta hacia la inteligencia multi-agente y la codificación de largo alcance, buscando una evolución fundamental en la colaboración entre agentes.

Q¿Qué desafíos comerciales enfrenta Yang Zhilin con Kimi según el artículo?

AKimi tiene una base de usuarios mayoritariamente gratuita, baja tasa de suscripciones pagadas, ingresos limitados por API y compite con gigantes tecnológicos como Doubao de ByteDance. Además, su alta valoración en el mercado primario no se traduce fácilmente en aceptación en el mercado secundario, lo que genera presión para demostrar un camino rentable.

Q¿Cómo contribuyen DeepSeek y Kimi a la competencia global en IA entre China y EE.UU.?

AAmbas empresas han ayudado a reducir la brecha de rendimiento de IA entre China y EE.UU. a solo un 2.7% en la evaluación Elo. Son utilizadas por NVIDIA para probar nuevos chips y Kimi K2.5 se ha convertido en un estándar de rendimiento en la comunidad global de código abierto, demostrando el avance técnico de China.

Q¿Qué papel juega la filosofía de código abierto en las estrategias de DeepSeek y Kimi?

AEl código abierto es fundamental para ambas. DeepSeek y Kimi comparten abiertamente avances técnicos, como optimizadores y mecanismos de atención, lo que acelera la innovación colectiva. Yang Zhilin incluso declaró que si los modelos tienen capacidades similares, el código abierto será el ganador absoluto.

Q¿Por qué el artículo sugiere que Yang Zhilin está experimentando 'ansiedad'?

AYang Zhilin enfrenta presión por las altas expectativas de capital, la necesidad de demostrar un modelo comercial viable para Kimi, la competencia con DeepSeek y otros gigantes, y la urgencia de una posible OPI en un entorno donde la valoración puede no sostenerse sin ingresos sólidos.

Lecturas Relacionadas

Polymarket atascado: la verdadera prueba tras el auge de tráfico ha llegado

Polymarket, el principal mercado de predicciones, enfrenta problemas de rendimiento que afectan la experiencia del usuario, como retrasos en transacciones y fallos en órdenes. Su vicepresidente de ingeniería, Josh Stevens, reconoció que el crecimiento ha superado la capacidad de la infraestructura actual y anunció un plan de mejora que incluye una migración de cadena ("chain migration"). La plataforma, que opera actualmente en Polygon, ya no considera esta blockchain suficiente para su operación similar a un exchange, necesitando más espacio de bloques, gas más bajo y tiempos de confirmación más rápidos. El cambio no es una simple migración; implica reconstruir su sistema central de órdenes (CLOB), mejorar la API y el rendimiento del sitio, y lanzar contratos perpetuos (Perps). Varias cadenas como Solana, Sui y Algorand han mostrado interés en albergar la plataforma. Para Polygon, perder Polymarket sería un golpe significativo, ya que es una fuente importante de tarifas. El verdadero desafío para Polymarket no es solo elegir una nueva cadena, sino transformarse en una infraestructura de trading estable y confiable para retener a sus usuarios.

Odaily星球日报Hace 20 hora(s)

Polymarket atascado: la verdadera prueba tras el auge de tráfico ha llegado

Odaily星球日报Hace 20 hora(s)

El obstáculo clave para la designación de Warsh como presidente de la Fed el 15 de mayo ha sido despejado tras la concesión de un legislador clave

El obstáculo clave para la confirmación de Kevin Warsh como presidente de la Reserva Federal fue eliminado después de que el senador republicano Thom Tillis retirara su oposición. Tillis había bloqueado la nominación debido a una investigación penal contra el actual presidente, Jerome Powell, que consideraba una amenaza a la independencia de la Fed. Tras la retirada de la investigación por parte del Departamento de Justicia, Tillis acordó permitir la votación en el Comité Bancario del Senado, programada para el 29 de abril. Se espera que Warsh, quien cuenta con amplio apoyo republicano, sea confirmado cerca del fin del mandato de Powell el 15 de mayo. Su posible llegada podría significar reformas significativas, incluida la eliminación del "dot plot" (mapa de proyecciones de tasas) y una revisión de la orientación prospectiva de la Fed, lo que podría alterar los marcos de valoración de activos globales. Aunque la investigación penal contra Powell fue cerrada, persiste cierta incertidumbre sobre su futuro en la Junta de la Fed.

marsbitHace 21 hora(s)

El obstáculo clave para la designación de Warsh como presidente de la Fed el 15 de mayo ha sido despejado tras la concesión de un legislador clave

marsbitHace 21 hora(s)

Bajando las expectativas para el próximo ciclo alcista de BTC

**Resumen del artículo: "Bajar las expectativas para el próximo ciclo alcista de BTC" por Alex Xu** El autor, que tenía a Bitcoin como su mayor activo, ha reducido progresivamente su exposición durante el actual ciclo alcista: eliminó el apalancamiento a 70k y redujo su posición de un 100% a un 30% entre 100k-120k. Recientemente, vendió más a 78k-79k, argumentando una revisión a la baja de las expectativas para el próximo máximo alcista. Las razones principales son: 1. **Narrativa de adopción agotada:** El impulso de adopción masiva (de minorista a institucional vía ETFs) parece agotado. El siguiente paso, la adopción por bancos centrales o fondos soberanos importantes, se ve muy difícil a corto plazo. 2. **Coste de oportunidad:** El autor ha identificado otras oportunidades de inversión en empresas atractivas. 3. **Contracción del ecosistema crypto:** La mayoría de modelos de negocio Web3 (SocialFi, GameFi, DePIN) no han funcionado. Solo DeFi genera valor, pero se contrae por la falta de activos nativos de calidad, lo que reduce la base de usuarios y holders de BTC. 4. **Problemas del mayor comprador:** MicroStrategy, el mayor tenedor corporativo, enfrenta un coste de financiación creciente (11.5% para su préstamo perpetuo), lo que podría ralentizar su ritmo de compra y ejercer presión vendedora. 5. **Competencia del oro tokenizado:** El oro tokenizado ha cerrado la brecha en portabilidad y divisibilidad, erosionando la ventaja competitiva de BTC como "oro digital". 6. **Problema de seguridad:** La reducción de la recompensa por minado (halving) amenaza la seguridad de la red, ya que las nuevas fuentes de ingresos por fees (como las inscripciones) no han podido dar solución. Conclusión: El autor mantiene una posición significativa en BTC y espera que suba, pero es menos optimista sobre su potencial alcista. Vender en la reciente subida fue una decisión táctica. Si sus razones para ser bajista se invalidan, estaría abierto a recomprar, aceptando si se equivoca y el precio sube.

marsbitHace 21 hora(s)

Bajando las expectativas para el próximo ciclo alcista de BTC

marsbitHace 21 hora(s)

Los mercados de predicción no pueden prescindir del uso de información privilegiada, pero el uso de información privilegiada los está matando

El mercado de predicciones enfrenta una paradoja fundamental: depende de la información privilegiada (insider trading) para generar precios precisos, pero esta práctica aleja a los pequeños inversores al percibir el mercado como manipulado. Recientemente, un soldado estadounidense ganó 400.000 dólares en Polymarket usando información clasificada, lo que destaca el problema. Aunque plataformas como Polymarket y Kalshi prohíben el uso de información no pública, su valor social radica en incentivar a quienes poseen conocimientos exclusivos a compartirlos. Sin embargo, esto crea un ciclo destructivo: cuanta más información privilegiada hay, menos confianza tienen los pequeños inversores, reduciendo la liquidez. El desafío es encontrar un equilibrio entre eficiencia informativa y equidad percibida para que estos mercados sobrevivan a largo plazo.

marsbitHace 21 hora(s)

Los mercados de predicción no pueden prescindir del uso de información privilegiada, pero el uso de información privilegiada los está matando

marsbitHace 21 hora(s)

¿Puede Irán "controlar" el estrecho de Ormuz?

Según la agencia iraní Mehr, Irán ha elaborado un plan integral para gestionar el estrecho de Ormuz, que incluye exigir permisos y tarifas de paso a los buques, prohibir el acceso a barcos israelíes y de países "hostiles", y priorizar el pago en riales. Analistas señalan que el objetivo de Irán es presionar a EE.UU. e Israel, obtener nuevos ingresos y mantener abierta la posibilidad de negociaciones. Sin embargo, la implementación enfrenta obstáculos: dificultades operativas en un estrecho muy transitado, controversias legales internacionales, oposición global y las contramedidas de EE.UU., que bloquea puertos iraníes y amenaza con interceptar buques que paguen las tarifas. Por ello, aún es incierto si el plan se aplicará plenamente o servirá solo como moneda de cambio en las negociaciones.

marsbitHace 22 hora(s)

¿Puede Irán "controlar" el estrecho de Ormuz?

marsbitHace 22 hora(s)

Trading

Spot

Futuros