Les 88 jours de Yao Shunyu

marsbitPublié le 2026-04-23Dernière mise à jour le 2026-04-23

Résumé

Le modèle Hy3 preview de Tencent Hunyuan, dirigé par Yao Shunyu, a été lancé 88 jours après une autocritique interne sévère. Avec 295B de paramètres totaux et 21B activés, ce modèle MoE à 256K de contexte représente un changement stratégique pour Tencent. Précédemment, Hunyuan souffrait d’un manque de capacités généralisables et d’une inadéquation avec les produits internes, poussant même certaines divisions à chercher des solutions externes. Une restructuration organisationnelle majeure a suivi, incluant la nomination de Yao Shunyu (27 ans, ancien d’OpenAI et expert en IA), la création de nouveaux départements techniques (AI Infra, AI Data), et la dissolution du AI Lab pour recentrer tous les efforts sur Hunyuan. Contrairement à l’approche précédente axée sur les benchmarks, Hy3 preview a été conçu en co-design avec les produits phares de Tencent (WeChat, jeux, publicité), visant une intégration rapide et des retours utilisateurs en temps réel. Bien qu’encore en preview, il symbolise une refonte profonde de la culture technique et organisationnelle de Tencent pour l’IA. Dans un contexte de compétition intense (DeepSeek, Alibaba, ByteDance), Tencent parie sur son écosystème massif et une agilité retrouvée pour regagner du terrain. Le vrai défi n’est pas technique, mais structurel : adapter l’organisation aux exigences de l’IA.

Texte | Hors de la page, Rédaction|Dessin

Tencent Hunyuan Hy3 preview est sorti.C'est le premier produit livré par Yao Shunyu après avoir rejoint Tencent.

Architecture MoE, 295B paramètres totaux, 21B paramètres activés, prend en charge jusqu'à 256K de contexte, entraînement commencé fin janvier, publié en moins de trois mois.

Un modèle de cette envergure aujourd'hui pourrait facilement passer inaperçu.

Mais si on replace cela dans le contexte d'il y a trois mois, cela devient intéressant.

Cette sortie semble être une mise à niveau de modèle, le vrai changement se produit en dehors du modèle, Tencent commence à utiliser l'IA pour réécrire sa propre organisation.

Le 26 janvier de cette année, lors de la conférence annuelle de Tencent, le président Martin Lau (Liu Chiping) a fait quelque chose que les cadres font rarement : une analyse publique des raisons de l'échec du modèle Hunyuan.

Il a utilisé une métaphore : un lycéen qui mémorise des questions pour un examen. Les résultats sembl bons, mais il est démasqué lors du vrai examen. Après analyse, il s'est avéré que chaque module clé avait des lacunes.

Les termes de Pony Ma (Ma Huateng) étaient plus directs : Trop lent. Neuf mois à un an de retard.

De cette conférence annuelle à la sortie de Hy3 preview aujourd'hui, 88 jours.

I. Mémoriser les questions ne rapporte pas de vrais points

L'histoire de Tencent Hunyuan remonte à septembre 2023, lorsque Tencent a officiellement lancé le modèle Hunyuan lors de la conférence mondiale sur l'écosystème numérique. Une grande entreprise entrait dans la course, avec un battage médiatique important.

Puis elle est entrée dans une logique d'auto-justification.

Ce n'était pas un manque d'investissement ou de personnel. Le problème était la voie choisie.

L'analyse de Martin Lau lors de la conférence annuelle a donné le diagnostic le plus clair. Les capacités de base du modèle étaient limitées, l'équipe a choisi la voie rapide, utilisant SFT (Fine-Tuning Supervisé) pour monter dans les classements. L'effet était immédiat, les résultats étaient beaux, mais une fois dans les scénarios réels, cela a exposé un manque de capacité de généralisation, l'incapacité du modèle à être réutilisé sur les produits.

En creusant plus profondément, chaque couche avait des fissures. Pas assez de données, pré-entraînement instable, l'Infra IA incapable de passer à l'échelle, manque de facteurs et d'objectifs pour l'apprentissage par renforcement, le modèle de base ne pouvait pas supporter les applications supérieures.

Cela a directement conduit à une impasse côté produit. Yuanbao, l'assistant IA de Tencent, avait environ 57 millions d'utilisateurs actifs mensuels au premier trimestre de cette année. Cela semble augmenter, mais pendant la même période, Doubao avait 345 millions, Qianwen 166 millions. L'écart ne se réduisait pas, il s'agrandissait.

L'écart n'était plus au niveau de l'échelle, mais dans la définition de l'accès.

Pire encore en interne. Les lignes métier de l'écosystème Tencent - WeChat, jeux, publicité, services aux entreprises - avaient besoin de capacités IA, mais le Hunyuan de l'époque ne pouvait pas les satisfaire. Ce n'est pas que les métiers ne voulaient pas l'utiliser, c'est que les résultats n'étaient pas à la hauteur. Certains métiers core n'osaient même pas utiliser Hunyuan, préférant trouver leur propre solution.

Un grand modèle auto-développé par une grande entreprise qui ne pouvait même pas avoir sa place à la table principale dans sa propre maison, c'est l'image la plus directe des difficultés passées de Hunyuan.

À l'époque, l'organisation de Tencent n'avait pas non plus suivi le rythme du développement des grands modèles. Tencent était longtemps centré sur l'ingénierie produit, les équipes IA étaient des acteurs secondaires. D'abord faire le produit, puis adapter l'IA. Selon les mots de Martin Lau, le développement IA de Tencent était comme un produit sans chef de produit, l'équipe R&D personne ne contrôlait la direction, beaucoup de travail était fait pour rien.

Pendant la même période, ByteDance a dépensé environ 90 milliards de yuans rien que pour l'achat de puces IA, DeepSeek a impressionné le monde avec l'efficacité ultime d'une petite équipe pour créer R1, les appels d'API mondiaux d'Alibaba Qianwen grimpaient en tête.

Hunyuan n'a pas perdu contre un adversaire particulier, c'est la structure organisationnelle elle-même qui l'a empêché d'aller sur le champ de bataille.

II. Emprunter d'abord une vie

Autour du Nouvel An chinois 2025, DeepSeek R1 a explosé, capturant l'attention de l'industrie mondiale de l'IA.

Tencent a pris une décision extrêmement pragmatique et astucieuse. Le 13 février, Yuanbao a pleinement intégré DeepSeek-R1 version complète, gratuitement.

Les utilisateurs actifs quotidiens de Yuanbao ont explosé de plus de 20 fois en un mois, dépassant Doubao le 22 février pour atteindre la deuxième place du classement des applications gratuites téléchargées sur l'App Store en Chine, et même brièvement la première place.

La vitesse de réaction de Tencent pendant cette fenêtre, toute l'industrie regardait. Recherche WeChat, navigateur QQ, saisie Sogou, ima, toute une suite de produits a intégré DeepSeek de manière intensive. Même le jeu mobile "Peace Elite" a intégré DeepSeek dans son porte-parole numérique.

Alors que toute l'industrie observait DeepSeek, Tencent a été la première grande entreprise à l'intégrer pleinement dans son écosystème.

Mais Tencent savait mieux que quiconque que cette opportunité était empruntée.

DeepSeek a aidé Yuanbao à attirer des utilisateurs, mais la rétention était une autre histoire. Le parcours de recherche était fragmenté, une partie passant par Hunyuan, une partie par DeepSeek, l'expérience n'était pas uniforme.

En simple, embrasser DeepSeek consistait essentiellement, alors que Hunyuan n'était pas encore prêt, à utiliser une capacité externe pour d'abord capter les utilisateurs et soutenir les scénarios.

Mais le problème était que l'écosystème WeChat de Tencent, les services aux entreprises, l'IA pour les jeux, le ciblage publicitaire intelligent, ces métiers core nécessitent des capacités IA profondément personnalisées, contrôlables et ajustables, qu'une API générique ne peut pas résoudre.

Hunyuan devait se lever tout seul. La question était comment.

III. Le démolisseur

En septembre 2025, un jeune homme de 27 ans rejoint discrètement Tencent.

Yao Shunyu, licence de la Yao Class de Tsinghua, doctorat de Princeton, encadré par Karthik Narasimhan, l'un des auteurs principaux de l'article fondateur du GPT. Pendant son doctorat, il a proposé le framework ReAct et l'Arbre de Pensées (Tree of Thoughts), deux travaux fondateurs dans le domaine des agents IA globaux.

Après son doctorat en 2024, il a rejoint OpenAI, participant profondément au développement de deux projets core d'agents intelligents : Operator et Deep Research.

Mais le CV n'est pas la clé, plus important encore est le changement architectural qu'il a apporté après son arrivée.

En décembre 2025, Tencent a publié un avis d'ajustement de la structure organisationnelle interne, nommant officiellement Yao Shunyu scientifique en chef de l'IA au bureau du PDG/Président, et responsable simultané des deux nouveaux départements Département AI Infra et Département des grands modèles de langage, avec une double reporting, directement au président de Tencent Martin Lau et au responsable du groupe d'affaires d'ingénierie technique TEG Lu Shan.

27 ans, accès direct au numéro deux de Tencent, aux commandes de deux départements core de l'IA, une telle promotion et de telles autorités sont extrêmement rares dans l'histoire de Tencent.

Selon des reportages, la première chose qu'il a faite après son arrivée a été d'inspecter module par module les raisons des mauvaises performances de Hunyuan, discutant souvent avec des collègues et des stagiaires jusqu'au milieu de la nuit. Les résultats du diagnostic rapportés à Martin Lau ont directement conduit à une série d'opérations organisationnelles.

Il n'a pas repris une tâche d'optimisation de modèle, mais un ensemble de méthodes de travail qui devaient être renversées.

En décembre 2025, Tencent a créé d'un coup trois départements core : Département AI Infra, Département AI Data, Département de plateforme de calcul de données, les infrastructures d'abord, démolir et reconstruire les fondations techniques sous-jacentes. Simultanément, l'entreprise a accéléré le recrutement mondial de talents IA de premier plan pour combler les lacunes techniques.

Le 20 mars de cette année, le Tencent AI Lab, vieux de dix ans, a été officiellement dissous. Tout le personnel core R&D a été intégré au Département des grands modèles de langage, rattaché à la ligne principale de développement de Hunyuan, reportant统一ment à Yao Shunyu.

Désormais, Tencent ne conserve plus d'organisme de recherche IA专属 indépendant du système de grands modèles, toutes les forces de recherche IA sont regroupées, se concentrant sur la ligne principale unique de Hunyuan.

C'était une reconstruction complète de la chaîne, de l'Infra sous-jacente aux pipelines de données en passant par les processus d'entraînement et la structure organisationnelle, pas une réparation de l'ancien système, mais une démolition et une reconstruction, construisant une boucle de développement complète depuis le début.

Selon les mots de l'équipe de Yao Shunyu, Hy3 preview est le début du passage du grand modèle de langage Hunyuan de "lire dix mille livres" à "parcourir dix mille lieues".

Face à la réalité des deux dernières années où Hunyuan lisait mais ne pouvait pas résoudre les problèmes, la direction de cette phrase est claire : ne pas se faire plaisir sur les jeux de test, aller faire les choses dans le monde réel.

IV. Preview, pas Answer

Revenons au produit lui-même.

Architecture MoE融合pensée rapide et lente, 295B paramètres totaux, 21B paramètres activés, prend en charge jusqu'à 256K de contexte. Entraînement commencé fin janvier 2026, mise en ligne en avril.

Moins de trois mois, de zéro à utilisable. C'est en soi un signal important de l'accélération du développement de Hunyuan.

Le développement de modèles dans l'industrie comprend généralement la préparation de données de haute qualité, le pré-entraînement, le post-entraînement et l'apprentissage par renforcement/ajustement fin. Si on inclut l'exploration architecturale préalable et l'optimisation post-évaluation, le cycle complet d'une version majeure from scratch prend environ 6 à 12 mois.

Tencent fait l'inverse, n'a pas cherché à suivre la foule pour des modèles homogènes, a conçu en Co-design en combinant les besoins des scénarios métier core de Tencent comme les réseaux sociaux, les jeux, la publicité. L'avantage est que les énormes investissements de Tencent dans l'IA peuvent être rapidement validés par le marché.

L'inverse total du Hunyuan passé.Avant : d'abord monter dans les classements, puis chercher des scénarios, trouver des scénarios et découvrir que c'est inutilisable. Maintenant : d'abord entrer dans les scénarios, puis montrer au monde.

Et avant sa publication, Hy3 preview avait déjà terminé les tests et l'adaptation协同 dans des produits core de Tencent comme Yuanbao, WorkBuddy, CodeBuddy, ima, QQ, le modèle et le produit avançant de pair dès la phase de conception.

C'est le Co-design, entraîner et utiliser simultanément, laisser les retours produits forcer l'itération du modèle.

Dans un sens, c'est une réponse directe à la phrase de Martin Lau "pas de chef de produit dans le produit".

Pour l'interne de Tencent, les changements apportés par Hy3 preview pourraient être plus importants que ce que perçoit l'extérieur. Le Hunyuan passé, les lignes métier n'osaient pas, ne voulaient pas l'utiliser, cherchaient chacune leur issue, un mur séparait l'équipe modèle et l'équipe produit.

Cette fois, Hunyuan est vraiment devenu la fondation modèle des métiers internes de Tencent, plus un projet de prestige nécessitant la cooperation des lignes métier pour monter dans les classements.

Quand les métiers internes sont prêts à miser l'expérience de leur produit sur Hunyuan, c'est en soi un signal.

Mais Preview signifie Preview. Le sens est franc, c'est la première version, à affiner avec les vrais utilisateurs et métiers, itérer avec les retours.

L'attitude est correcte, la direction est là, le produit est en ligne. Quant au résultat, l'examen vient juste de commencer.

V. La langouste est le pont, Hunyuan est la fondation

En fait, avant la mise en ligne de Hy3 preview, Tencent a fait autre chose facile à忽略.

Début de cette année, OpenClaw a explosé, la fièvre de la langouste a balayé toute l'industrie de l'IA. La vitesse de réaction de Tencent a une fois de plus surpris,几乎是 la première et la plus complète grande entreprise à embrasser la langouste.

WorkBuddy, QClaw, Lighthouse, une série de produits basés sur le protocole langouste mis en ligne密集, la matrice de produits de Tencent intégrée de manière globale en peu de temps.

Maintenant, en regardant en arrière, la fièvre de la langouste s'est calmée. Mais pour Tencent, la valeur de cela n'était pas la langouste elle-même,更像 un dispositif de transition.

Elle a fait deux choses. Premièrement,让 la force produit分散ée de Tencent sur les différentes lignes métier se reformer en synergie, WeChat, Yuanbao, services aux entreprises, outils développeurs,协同起来 pour la première fois sur cette couche de protocole public qu'est la langouste. Deuxièmement, et plus crucial, elle a gagné du temps pour Hunyuan.

Quand les utilisateurs affluaient via les diverses entrées d'agents, Tencent utilisait d'abord l'écosystème de la langouste pour les accueillir, tandis que Hunyuan reconstruisait dans l'ombre, de l'Infra au modèle.

Les entrées d'Agent peuvent être nombreuses. Mais ce qui détermine in fine si l'utilisateur reste ou non, c'est la capacité du modèle sous-jacent. La langouste est le pont, Hunyuan est la fondation. Le pont est construit, la fondation a finalement suivi.

VI. La fenêtre n'attendra personne

Avril de cette année est probablement le mois le plus encombré de l'histoire de l'IA en Chine.

Alibaba a publié trois modèles stratégiques en 72 heures, Kimi a publié et open-source le modèle Kimi K2.6, capacités综合comprehension d'agents généraux, code, vision considérablement améliorées, ByteDance Seed continue d'itérer, l'expansion de l'écosystème Doubao ne s'arrête pas. DeepSeek V4 serait également annoncé pour fin avril.(Lecture参考: Liang Wenfeng et Yao Shunyu, rendent copie en avril)

Hunyuan a choisi de rendre copie pendant cette fenêtre, doit faire face non seulement à une compétition technique, mais à une question现实: Combien de temps reste-t-il à la fenêtre ?

Tencent a le plus grand écosystème social de Chine, le plus de points de contact utilisateurs, les scénarios d'application les plus riches. WeChat a plus de 1,4 milliard d'utilisateurs actifs mensuels, QQ, Tencent Meeting, Tencent Docs, Enterprise WeChat, sont des points d'entrée naturels pour l'IA.

Mais pour que ces ressources fonctionnent, il faut que le modèle sous-jacent puisse supporter.

Pendant plus d'un an, les capacités produit de Hunyuan étaient faibles, Tencent a dû emprunter la popularité et la force de DeepSeek, a dû regarder Doubao le distancer côté utilisateurs.

Hy3 preview montre que Yao Shunyu a entendu la critique de Pony Ma. Entendu, et a agi.

Moins de 90 jours, démonter l'ancienne ligne, reconstruire l'Infra, supprimer AI Lab, intégrer l'équipe, recruter des talents core, Co-design avec les produits, livrer une version utilisable.

Cette vitesse est elle-même la preuve d'un changement d'efficacité organisationnelle.

Mais il y a une distance entre entendre et faire.

La vitesse à laquelle Hunyuan rattrape ne dépend pas in fine du nombre de paramètres d'une Preview, mais de si l'efficacité organisationnelle de cette reconstruction peut durer.

Cette fois, la copie de Yao Shunyu porte l'inscription Preview. Visiblement, il y a d'autres grosses annonces à venir.

Les mots de 【Hors de la page】 :

Le plus gros problème de Hunyuan par le passé n'était pas que le modèle n'était pas assez gros, c'était que l'organisation n'était pas adaptée.

Un grand modèle que ses propres métiers ne voulaient pas utiliser, peu importe le nombre de paramètres, c'était de l'auto-satisfaction.

Le changement le plus important de Hy3 preview n'est pas que les paramètres ont changé, c'est que le mur a été démoli, le mur entre le modèle et le produit, entre la recherche et l'ingénierie, entre Hunyuan et l'écosystème Tencent.

Démolir ce mur est bien plus difficile qu'empiler des paramètres.

Mais la signification de cela ne réside pas seulement chez Tencent. Dans cette course aux grands modèles, les paramètres, les algorithmes, les talents peuvent tous être rattrapés.

Ce qui est vraiment difficile à reproduire, c'est si une entreprise a la détermination de se réécrire pour l'IA.

Questions liées

QQuel était le principal problème identifié avec le modèle Hunyuan de Tencent avant la réorganisation ?

ALe principal problème était que le modèle avait une capacité de généralisation limitée. Il excellait dans les tests de référence (benchmarks) grâce au réglage fin supervisé (SFT), mais échouait dans les scénarios réels, ce qui le rendait inutilisable pour les produits internes. L'organisation était également inadéquate, l'équipe IA manquait de direction et agissait comme un acteur de soutien plutôt que central.

QQui est Yao Shunyu et quel rôle a-t-il joué dans la transformation du modèle Hunyuan ?

AYao Shunyu est un scientifique en IA de 27 ans, diplômé de Yao Class (Tsinghua) et titulaire d'un doctorat de Princeton. Il a rejoint Tencent en septembre 2025 et a été nommé scientifique en chef de l'IA, responsable des départements AI Infra et du Grand Modèle de Langage. Il a diagnostiqué les problèmes de Hunyuan, a poussé à une réorganisation majeure (y compris la suppression du AI Lab) et a supervisé le développement rapide du nouveau modèle Hy3 preview en 88 jours.

QQuelle stratégie Tencent a-t-elle utilisée pour maintenir ses produits IA compétitifs pendant que Hunyuan était en développement ?

ATencent a adopté une stratégie pragmatique en intégrant massivement et rapidement le modèle externe DeepSeek-R1 dans sa suite de produits (comme Yuanbao, WeChat Search, QQ Browser) en février 2025. Cela a permis à des applications comme Yuanbao de voir leur audience quotidienne multipliée par 20 et de gagner en popularité, maintenant ainsi la compétitivité de Tencent pendant que Hunyuan était restructuré en interne.

QQu'est-ce que la 'Co-conception' (Co-design) mentionnée dans le développement de Hy3 preview ?

ALa 'Co-conception' signifie que le modèle Hy3 preview a été conçu et développé en étroite collaboration avec les équipes produits de Tencent (comme Yuanbao, WorkBuddy, CodeBuddy). Au lieu de former d'abord un modèle puis de chercher des applications, le modèle et les produits ont été développés simultanément. Les retours des produits réels ont été utilisés pour itérer et améliorer le modèle, garantissant ainsi son utilité pratique dès le départ.

QQuel est le signification symbolique de la 'preview' dans le nom 'Hy3 preview' ?

ALe terme 'preview' indique que cette version est une première itération, une préversion. Il souligne une approche humble et pragmatique : le modèle est délibérément publié pour être testé et affiné grâce aux retours des utilisateurs réels et des scénarios business de Tencent. C'est le début d'un processus d'apprentissage continu ('parcourir des milliers de lieues') plutôt qu'une réponse définitive.

Lectures associées

Trading

Spot
Futures
活动图片