Los 88 días de Yao Shunyu

marsbitPublicado a 2026-04-23Actualizado a 2026-04-23

Resumen

Resumen: En solo 88 días, Yao Shunyu, un científico de IA de 27 años recién incorporado a Tencent, lideró el lanzamiento de Hunyuan Hy3 Preview, un modelo MoE con 295B de parámetros y soporte de contexto de 256K. Tras una crítica interna por el retraso de Hunyuan, Tencent reorganizó por completo su estructura: desmanteló el antiguo AI Lab, creó nuevos departamentos de infraestructura y datos, y adoptó un enfoque de "co-diseño" donde el modelo se entrena y utiliza simultáneamente en productos reales como Yuanbao y QQ. Este cambio refleja una transformación profunda en la estrategia de IA de Tencent, priorizando la aplicabilidad práctica sobre los benchmarks, y utilizando asociaciones temporales con DeepSeek y OpenClaw para ganar tiempo mientras reconstruía su base tecnológica. El verdadero desafío no es técnico, sino organizacional: alinear el modelo con el ecosistema interno de Tencent para competir en un mercado cada vez más saturado.

Por | Fuera de la Página, Escrito por|Huahua

Tencent Hunyuan Hy3 preview ha sido lanzado.Este es el primer producto entregado por Yao Shunyu después de unirse a Tencent.

Arquitectura MoE, 295B parámetros totales, 21B parámetros activados, soporta una longitud de contexto máxima de 256K. El entrenamiento comenzó a finales de enero y se lanzó en menos de tres meses.

Un modelo de este calibre hoy en día puede pasar fácilmente desapercibido.

Pero si se mira esto en el contexto de hace tres meses, se vuelve interesante.

Este lanzamiento parece una actualización del modelo, pero el verdadero cambio ocurre fuera del modelo: Tencent ha comenzado a usar la IA para reescribir su propia forma de organización.

El 26 de enero de este año, en el evento anual de Tencent, el presidente Martin Lau (Liu Chiping) hizo algo que los altos ejecutivos rara vez hacen: una revisión pública de por qué el modelo grande Hunyuan no funcionaba.

Usó una analogía: un estudiante de secundaria que memoriza preguntas para un examen. Las calificaciones se ven bien, pero en el examen real se descubre la verdad. Tras la revisión, descubrieron que faltaba cada módulo clave.

Las palabras de Pony Ma (Ma Huateng) fueron más directas: Demasiado lento. Entre 9 meses y un año de retraso.

Desde ese evento anual hasta el lanzamiento de Hy3 preview hoy, 88 días.

I. Memorizar no da puntos reales

La historia de Tencent Hunyuan comienza en septiembre de 2023, cuando Tencent lanzó oficialmente el modelo grande Hunyuan en la Global Digital Ecosystem Conference. Una gran empresa entraba en escena, con gran fanfarria.

Y luego entró en una lógica de autojustificación.

No fue falta de inversión, ni falta de personal. El problema estuvo en el camino.

La revisión de Martin Lau en el evento anual dio el diagnóstico más claro. La capacidad del modelo base era limitada, el equipo eligió un atajo: usar SFT (Fine-Tuning Supervisado) para escalar rankings. El efecto fue inmediato, el reporte de calificaciones era bonito, pero al entrar en escenarios de negocio reales, se expuso: pobre capacidad de generalización, la capacidad del modelo no se podía reutilizar en los productos.

Excavando más, cada capa tenía grietas. No se hicieron suficientes datos, el pre-entrenamiento era inestable, la Infraestructura de IA (AI Infra) no podía escalar, el aprendizaje por refuerzo carecía de factores y objetivos, el modelo base no podía soportar las aplicaciones superiores.

Esto llevó directamente a un dilema en el lado del producto. Yuanbao, la aplicación de asistente de IA de Tencent, tuvo unos 57 millones de usuarios activos mensuales (MAU) en el primer trimestre de este año. Suena como si estuviera creciendo, pero en el mismo período, Doubao tenía 345 millones de MAU, Qianwen 166 millones; la brecha no se estaba reduciendo, sino ampliando.

La brecha ya no está a nivel de escala, sino en el poder de definir la entrada.

Peor aún fue internamente. Las líneas de negocio dentro del sistema de Tencent —WeChat, juegos, publicidad, servicios empresariales— necesitaban capacidad de IA, pero el Hunyuan anterior no podía manejarlo. No es que el negocio no quisiera usarlo, es que usarlo no cumplía con los estándares. Algunos negocios centrales ni siquiera se atrevían a conectar con Hunyuan, preferían buscar su propia solución.

Un modelo grande de investigación y desarrollo propio de una gran empresa, que ni siquiera en su propia casa podía sentarse a la mesa principal, esta es la descripción más directa de la difícil situación pasada de Hunyuan.

En ese entonces, la organización de Tencent tampoco había seguido el ritmo del desarrollo de los modelos grandes. Tencent durante mucho tiempo tuvo como núcleo la ingeniería de productos, el equipo de IA era un actor secundario. Primero se hacía el producto, luego se adaptaba la IA. En palabras de Martin Lau, el desarrollo de IA de Tencent era como si un producto no tuviera gerente de producto, el equipo de desarrollo nadie controlaba la dirección, mucho trabajo se hacía en vano.

Y durante el mismo período, ByteDance solo en compras de chips de IA gastó unos 90 mil millones de yuanes, DeepSeek con un equipo pequeño de eficiencia extrema sorprendió al mundo con R1, las llamadas API globales de Alibaba Qianwen escalaron a los primeros puestos.

Hunyuan no perdió contra un oponente en particular, fue la estructura organizativa misma la que no lo dejó entrar en el campo de batalla.

II. Pedir prestada una vida primero

Alrededor del Año Nuevo Chino 2025, DeepSeek R1 explotó en popularidad, la atención de la industria global de IA fue secuestrada por esta empresa de Hangzhou.

Tencent tomó una decisión extremadamente pragmática y astuta. El 13 de febrero, Yuanbao se conectó completamente a DeepSeek-R1 Full Version, abriéndolo gratuitamente.

Los usuarios activos diarios (DAU) de Yuanbao se dispararon más de 20 veces en un mes, el 22 de febrero superó a Doubao subiendo al segundo lugar en la lista de descargas gratuitas de aplicaciones de Apple China, e incluso llegó a ser número uno en la lista.

La velocidad de reacción de Tencent en esa ventana, toda la industria la estaba observando. Búsqueda de WeChat, QQ Browser, Sogou Input Method, ima, toda una matriz de productos se conectó intensivamente a DeepSeek. Incluso el juego móvil "Peace Elite" metió a DeepSeek en su portavoz digital.

Mientras toda la industria observaba a DeepSeek, Tencent fue la primera gran empresa en conectarla completamente a su ecosistema.

Pero Tencent sabía mejor que nadie que esta oportunidad era prestada.

DeepSeek ayudó a Yuanbao a atraer usuarios, pero la retención era otra cosa. La cadena de búsqueda estaba fragmentada, una parte iba a Hunyuan, otra a DeepSeek, la experiencia no era uniforme.

En pocas palabras, la esencia de abrazar a DeepSeek era, cuando Hunyuan mismo no estaba listo, usar capacidad externa para primero atrapar a los usuarios, primero sostener los escenarios.

Pero el problema era que el ecosistema de WeChat de Tencent, los servicios empresariales, la IA para juegos, la publicidad inteligente, estos negocios centrales necesitan capacidad de IA profundamente personalizada, controlable y ajustable, una API genérica no lo resuelve.

Hunyuan tenía que ponerse de pie por sí mismo. La pregunta era cómo.

III. El que derriba la casa

En septiembre de 2025, un joven de 27 años se unió discretamente a Tencent.

Yao Shunyu, licenciado por Yao Class de Tsinghua, doctor por Princeton, discípulo de Karthik Narasimhan, uno de los autores centrales del artículo fundacional de GPT. Durante su doctorado, propuso el marco ReAct y el Árbol de Pensamientos (Tree of Thoughts), ambos trabajos fundacionales en el campo global de Agentes de IA.

Después de doctorarse en 2024, se unió a OpenAI, participando profundamente en el desarrollo de dos proyectos centrales de agentes inteligentes: Operator y Deep Research.

Pero el currículum no era lo clave, más importante fue el cambio a nivel de arquitectura que trajo después de unirse.

En diciembre de 2025, Tencent publicó un anuncio de ajuste de la estructura organizativa interna, nombrando oficialmente a Yao Shunyu como Científico Jefe de IA de la Oficina del CEO/Presidente,同时兼任 el recién establecido Departamento de Infraestructura de IA (AI Infra Dept.) y el Departamento de Modelos de Lenguaje Grande (Large Language Model Dept.) como responsable de ambos departamentos, con reporting dual, reportando directamente al presidente de Tencent, Martin Lau, y al responsable del grupo de negocios de ingeniería técnica TEG, Lu Shan.

27 años, acceso directo al número dos de Tencent, al mando de dos departamentos centrales de IA, tal ascenso y permisos son extremadamente raros en la historia de Tencent.

Medios informaron que lo primero que hizo después de unirse fue investigar módulo por módulo las razones del bajo rendimiento prolongado de Hunyuan, a menudo comunicándose con colegas y becarios hasta altas horas de la noche. Los resultados del diagnóstico reportados a Martin Lau impulsaron directamente una serie posterior de cirugías organizativas.

No接手ó una tarea de optimización de modelo, sino una forma de trabajo completa que necesitaba ser derribada.

En diciembre de 2025, Tencent de un golpe estableció tres nuevos departamentos centrales: Departamento de Infraestructura de IA (AI Infra Dept.), Departamento de Datos de IA (AI Data Dept.) y Departamento de Plataforma de Cómputo de Datos (Data Computing Platform Dept.), primero infraestructura, derribar y reconstruir los cimientos tecnológicos subyacentes. Al mismo tiempo, la empresa aceleró globalmente la introducción de talento顶尖 de IA,补齐短板 tecnológicos.

El 20 de marzo de este año, el腾讯 AI Lab, con diez años de existencia, fue正式撤销正式撤销 (oficialmente disuelto). Todo el personal central de I+D se incorporó al Departamento de Modelos de Lenguaje Grande, integrado en la línea principal de I+D del modelo grande Hunyuan, reportando uniformemente a Yao Shunyu.

A partir de entonces, Tencent ya no conserva instituciones de investigación de IA independientes fuera del sistema de modelos grandes, todas las fuerzas de investigación de IA se reúnen, enfocándose en la única línea principal de Hunyuan.

Esta fue una reconstrucción de toda la cadena, desde la Infraestructura subyacente hasta la tubería de datos, el flujo de entrenamiento y la estructura organizativa, no fue reparar el sistema antiguo, fue derribar y rehacer, construir desde cero un ciclo cerrado completo de I+D.

En palabras del equipo de Yao Shunyu, Hy3 preview es el comienzo del viaje del modelo de lenguaje grande Hunyuan de leer miles de libros a recorrer miles de millas.

Frente a la realidad de los últimos dos años donde Hunyuan leyó libros pero no pudo resolver problemas, la dirección de esta frase es muy clara: ya no autoengañarse en conjuntos de prueba, ir al mundo real a hacer cosas.

IV. Preview, no Answer

Volviendo al producto en sí.

Arquitectura MoE con fusión de pensamiento rápido y lento, 295B parámetros totales, 21B parámetros activados, soporta una longitud de contexto máxima de 256K. El entrenamiento comenzó a finales de enero de 2026, lanzado en abril.

Menos de tres meses, de cero a usable. Esto en sí es una señal importante de la evolución acelerada de I+D de Hunyuan.

El desarrollo de modelos en la industria generalmente incluye preparación de datos de alta calidad, pre-entrenamiento, post-entrenamiento y aprendizaje por refuerzo/ajuste fino, si se cuenta la exploración arquitectónica previa y la optimización de evaluación posterior, el ciclo de una versión completa de 0 a 1 toma大约 6-12 meses.

Tencent fue en contra de la corriente, no se amontonó persiguiendo modelos homogéneos, combinó las necesidades de escenarios de negocio centrales de Tencent en redes sociales, juegos, publicidad, etc., para un diseño Co-design, el beneficio es que la enorme inversión de Tencent en IA puede ser validada rápidamente por el mercado.

Completamente al revés que el Hunyuan.Antes era primero rankings luego buscar escenarios, al encontrar escenarios descubrían que no servía. Ahora es primero entrar en escenarios, luego mostrarlo al exterior.

Y antes del lanzamiento, Hy3 preview ya había completado pruebas reales y adaptación coordinada en Yuanbao, WorkBuddy, CodeBuddy, ima, QQ y otros productos centrales de Tencent, el modelo y el producto avanzaron同步 desde la fase de diseño.

Esto es Co-design, entrenar y usar simultáneamente, dejar que la retroalimentación del producto impulse la iteración del modelo.

En cierto sentido, esto es una respuesta directa a esa frase de Martin Lau: "el producto no tenía gerente de producto".

Para Tencent internamente, los cambios traídos por Hy3 preview pueden ser mayores de lo que se percibe externamente. El Hunyuan anterior, las líneas de negocio no se atrevían, no querían conectarse, cada una buscaba su propia salida, había un muro entre el equipo del modelo y el equipo del producto.

Esta vez Hunyuan se convirtió verdaderamente en la base del modelo para los negocios internos de Tencent, ya no un proyecto de apariencia que necesitaba la cooperación de las líneas de negocio para escalar rankings.

Cuando los negocios internos están dispuestos a apostar la experiencia de su producto en Hunyuan, esto en sí es una señal.

Pero Preview es Preview. El significado es muy sincero, esta es la primera versión, llevarla a usuarios reales y negocios para pulir, usar la retroalimentación para iterar.

La actitud es correcta, la dirección está clara, el producto está lanzado. En cuanto al resultado, el examen acaba de comenzar.

V. La langosta es el puente, Hunyuan es el cimiento

De hecho, antes del lanzamiento de Hy3 preview, Tencent hizo algo que fácilmente se pasa por alto.

A principios de este año, OpenClaw爆火爆火 (explotó en popularidad), la fiebre de la langosta barrió toda la industria de la IA. La velocidad de reacción de Tencent una vez más sorprendió, fue casi la primera gran empresa en abrazar la langosta de la manera más completa.

WorkBuddy, QClaw, Lighthouse, una serie de productos basados en el protocolo Langosta se lanzaron intensivamente, la matriz de productos de Tencent se conectó completamente en poco tiempo.

Mirando hacia atrás ahora, aunque la fiebre de la langosta慢慢退烧慢慢退烧 (poco a poco se enfría). Pero para Tencent, el valor de esto no estuvo en la langosta本身本身 (en sí misma), sino más bien como un dispositivo de transición.

Hizo dos cosas. Una fue permitir que el poder de producto de Tencent, disperso en varias líneas de negocio, volviera a formar sinergia, WeChat, Yuanbao, servicios empresariales, herramientas de desarrollo, por primera vez真正协同真正协同 (realmente协同)起来 en esta capa de protocolo público que es la langosta. La segunda, y más关键关键 (crucial), fue que le ganó tiempo a Hunyuan.

Cuando los usuarios entraban a través de varias entradas de Agente, Tencent usó el ecosistema Langosta para首先接住首先接住 (primero atraparlos), mientras Hunyuan tras bambalinas completaba la reconstrucción desde la Infraestructura hasta el modelo.

Puede haber muchas entradas de Agente. Pero lo que最终决定最终决定 (finalmente决定) si el usuario se queda o no, es la capacidad del modelo subyacente. La langosta es el puente, Hunyuan es el cimiento. El puente está construido, el cimiento finalmente también ha seguido el ritmo.

VI. La ventana no espera a nadie

Abril de este año, probablemente sea el mes más拥挤拥挤 (abarrotado) en la historia de la IA china.

Alibaba en 72 horas lanzó接连三款接连三款 (tres seguidos) modelos estratégicos, Kimi lanzó y abrió el código de su modelo Kimi K2.6, capacidad integral de Agente general, código, comprensión visual, etc.,全面提升全面提升, ByteDance Seed iteró continuamente, la expansión del ecosistema Doubao no se detuvo. También se rumorea que DeepSeek V4 se lanzará a finales de abril.(Lectura de referencia: Liang Wenfeng y Yao Shunyu, entregan en abril)

Hunyuan eligió entregar en esta ventana, lo que enfrenta no es solo una competencia tecnológica, sino un problema real: ¿Cuánto tiempo queda en la ventana?

Tencent tiene el mayor ecosistema social de China, los最多的用户触点最多的用户触点 (puntos de contacto de usuario), los escenarios de aplicación más ricos. WeChat tiene más de 1400 millones de MAU, QQ, Tencent Meeting, Tencent Docs, Enterprise WeChat,都是都是 (todos son) entradas naturales para el despliegue de IA.

Pero para que estos recursos funcionen, el前提前提 (prerrequisito) es que el modelo subyacente pueda aguantar.

Durante más de un año, la capacidad de producto de Hunyuan fue débil, Tencent tuvo que pedir prestado el calor y la fuerza de DeepSeek, tuvo que ver cómo Doubao se alejaba en el lado del usuario.

Hy3 preview muestra que Yao Shunyu escuchó las críticas de Pony Ma. Escuchó, y actuó.

Menos de 90 días, derribar la antigua línea de montaje, reconstruir la Infraestructura, disolver AI Lab, incorporar equipos, traer talento central, Co-design con productos, entregar una versión usable.

Esta velocidad en sí es evidencia de un cambio en la eficiencia organizativa.

Pero entre escuchar y hacer, hay distancia.

Que tan rápido Hunyuan se ponga al día,最终不取决于最终不取决于 (finalmente no depende de) la cantidad de parámetros de un Preview, depende de si la eficiencia organizativa de esta reconstrucción puede sostenerse.

Esta vez, la hoja de respuestas de Yao Shunyu dice Preview. Evidentemente,后面还有大招后面还有大招 (detrás hay más grandes movimientos).

Palabras de 【Fuera de la Página】:

El mayor problema de Hunyuan en el pasado no fue que el modelo no fuera lo suficientemente grande, fue que la organización no era la correcta.

Un modelo grande que ni siquiera sus propios negocios querían conectar, por muchos parámetros que tuviera, era autoengaño.

El cambio más importante de Hy3 preview no es que cambiaron los parámetros, es que derribaron el muro, el muro entre el modelo y el producto, entre investigación e ingeniería, el muro entre Hunyuan y el ecosistema de Tencent.

Derribar muros es mucho más difícil que apilar parámetros.

Pero el significado de esto tampoco está solo en Tencent. En esta competencia de modelos grandes, los parámetros, los algoritmos, el talento pueden ser alcanzados.

Lo realmente difícil de replicar es si una empresa tiene la determinación de reescribirse a sí misma para la IA.

Preguntas relacionadas

Q¿Qué problemas clave identificó Liu Chiping en el evento anual de Tencent sobre el modelo Hunyuan?

ALiu Chiping señaló que el modelo base tenía capacidades limitadas y el equipo optó por un atajo utilizando SFT (fine-tuning supervisado) para competir en rankings. Esto generó resultados inmediatos y una hoja de resultados atractiva, pero en escenarios reales se expusieron problemas de capacidad de generalización, imposibilitando la reutilización del modelo en productos. Además, había deficiencias en datos, preentrenamiento inestable, infraestructura de IA no escalable y falta de factores y objetivos en el aprendizaje por refuerzo.

Q¿Qué cambios organizacionales implementó Tencent tras la llegada de Yao Shunyu?

ATencent realizó ajustes organizativos en diciembre de 2025, nombrando a Yao Shunyu como Científico Jefe de IA de la Oficina del CEO/Presidente y responsable de los departamentos de Infraestructura de IA y Modelos de Lenguaje Grande, reportando directamente a Liu Chiping y Lu Shan. Se crearon nuevos departamentos clave: Infraestructura de IA, Datos de IA y Plataforma de Computación de Datos. En marzo de 2026, se disolvió el laboratorio de IA de Tencent, integrando todo el personal en el departamento de modelos de lenguaje grande bajo la dirección de Yao Shunyu, unificando así todos los esfuerzos de investigación en IA en el desarrollo del modelo Hunyuan.

Q¿Cuáles son las características técnicas principales del Hy3 preview de Hunyuan?

AEl Hy3 preview de Hunyuan utiliza una arquitectura MoE (Mixture of Experts) con 295B de parámetros totales y 21B de parámetros activados. Soporta una longitud de contexto máxima de 256K tokens. El entrenamiento comenzó a finales de enero de 2026 y el modelo se lanzó en abril, completándose en menos de tres meses.

Q¿Cómo aprovechó Tencent el éxito de DeepSeek R1 a principios de 2025?

AEl 13 de febrero de 2025, Tencent integró completamente DeepSeek-R1 en su asistente de IA Yuanbao, ofreciéndolo gratuitamente. Esto resultó en un aumento de más de 20 veces en los usuarios activos diarios de Yuanbao en un mes, llegando a ocupar el segundo puesto en la lista de descargas gratuitas de aplicaciones de Apple en China e incluso alcanzando el primer puesto temporalmente. Productos como WeChat Search, QQ Browser, Sogou Input Method e ima también se integraron intensivamente con DeepSeek.

QSegún el artículo, ¿cuál es el significado más profundo del lanzamiento de Hy3 preview para Tencent?

AEl lanzamiento de Hy3 preview simboliza que Tencent comenzó a utilizar la IA para reescribir fundamentalmente su propia organización. El cambio más importante no está en el modelo en sí, sino en la demolición de los muros entre el modelo y los productos, entre la investigación y la ingeniería, y entre Hunyuan y el ecosistema de Tencent. Significa una transición de buscar aprobación en benchmarks a operar en el mundo real, con un diseño conjunto (Co-design) donde el feedback de los productos impulsa la iteración del modelo, integrando finalmente el modelo Hunyuan como base real para los negocios internos de Tencent.

Lecturas Relacionadas

Trading

Spot
Futuros
活动图片