Auteur : Florian Brand
Compilation : Deep TechFlow
Introduction de Deep TechFlow : Le contexte de cet article est que SAIL (une alliance médiatique regroupant les meilleurs rédacteurs spécialisés en IA sur Substack, incluant Nathan Lambert, Sebastian Raschka, ChinaTalk, etc.) a organisé une délégation pour visiter des laboratoires chinois d'IA. L'auteur Florian a fait partie du groupe qui s'est rendu chez Moonshot AI, Xiaomi, MiniMax, Zhipu AI, Meituan, Alibaba, Ant Group, ModelScope, 01.AI, Unitree et une dizaine d'autres entreprises, et a écrit ces impressions.
Florian Brand est doctorant à l'Université de Trèves (Allemagne) et au Centre allemand de recherche sur l'intelligence artificielle (DFKI). Ses recherches portent sur les applications et l'évaluation des grands modèles de langage.
Il n'est pas "très célèbre", mais il a une certaine visibilité dans le cercle de l'IA open source. Il est intéressant d'avoir le point de vue d'un professionnel étranger de l'IA sur l'écosystème chinois d'IA.
Article principal
Ces dix derniers jours, j'ai eu le privilège de visiter des laboratoires d'IA en Chine avec les partenaires de SAIL. En tant que personne ayant visité la Chine et les États-Unis pour la première fois en six mois, j'ai trouvé les différences entre les deux endroits fascinantes, mais encore plus fascinantes sont les similitudes.
Ce qui m'a le plus marqué, c'est l'humilité remarquable des chercheurs en IA que j'ai rencontrés.
Ils portent une grande estime aux autres laboratoires et à leurs pairs. DeepSeek a été fréquemment mentionné, probablement parce qu'ils venaient de publier un modèle quelques jours avant notre visite. Les gens parlaient de l'article de recherche de DeepSeek avec une véritable admiration.
De nombreux chercheurs sont des amis proches, venant de la même université ou partageant la même ville natale. Ils discutent ouvertement de leur travail, et les résultats de leurs recherches sont publiés sous forme d'articles quelques mois plus tard.
C'est l'une des plus grandes différences avec le cercle occidental de l'IA. Aux États-Unis, l'ambiance ressemble souvent davantage à un jeu à somme nulle. Les laboratoires sont prudents quant à leur positionnement. Les chercheurs pensent à la concurrence, et certains ont une haute opinion d'eux-mêmes. Les dirigeants s'insultent et s'attaquent dans des mémos divulgués. Cette différence peut s'expliquer par le fait que les principaux laboratoires américains sont fermés (closed-source), tandis que de nombreux laboratoires chinois sont ouverts (open-source). Les laboratoires chinois gardent un œil sur Doubao de ByteDance, le chatbot le plus utilisé, qui est fermé et possède une avance considérable.
Dans le même temps, l'ambiance globale est étonnamment similaire à celle de San Francisco. Les chercheurs sont extrêmement connectés, lisant abondamment sur Twitter et Xiaohongshu (Little Red Book), ce dernier gagnant en popularité. Ils utilisent tous Claude Code ou leurs propres interfaces en ligne de commande pour construire le prochain modèle. Certains surveillaient les entraînements en cours pendant nos réunions, observant les courbes de récompense monter. Ils réfléchissent à l'augmentation de l'échelle, se plaignant du manque de puissance de calcul. Ils sont frustrés par l'état actuel des benchmarks.
Leur principal objectif est d'entraîner de meilleurs modèles. Cela diffère de San Francisco, où les chercheurs réfléchissent aux implications politiques ou philosophiques de l'IA. Ils ne pensent pas au chômage de masse, à une classe inférieure permanente, ou à savoir si leurs modèles sont conscients. Ils veulent juste entraîner des modèles excellents.
Leurs yeux s'illuminent quand ils apprennent que vous avez utilisé leur modèle. Ils ont hâte de corriger tous les défauts du modèle actuel dans la prochaine génération. Ils travaillent nuit et jour pour sortir un modèle, et restent ensuite présents au bureau.
La plupart des chercheurs que j'ai rencontrés étaient jeunes, beaucoup avaient la vingtaine ou environ 25 ans. Certains étaient étudiants de premier cycle, mais plus souvent des doctorants travaillant simultanément dans l'industrie. Leur consensus est que l'industrie est plus intéressante que le monde académique maintenant, un point de vue que je partage pleinement, ayant fait exactement la même chose. Les laboratoires accordent une grande importance au recrutement de ces talents, embauchant activement des stagiaires et des étudiants diplômés ; c'est quelque chose que les laboratoires occidentaux ne font pas.
L'optimisme des chercheurs s'étend aussi au grand public, qui semble plus optimiste quant à la technologie et aux perspectives de l'IA et des robots. Pendant le voyage, on m'a raconté des histoires sur la façon dont les parents et grands-parents utilisent Doubao et DeepSeek pour diverses choses, y compris discuter de théorèmes mathématiques. C'est en contraste frappant avec l'Occident, où le grand public a une aversion pour l'IA.
Globalement, ce voyage m'a permis d'entrevoir un peu cet écosystème. Il est impossible de comprendre la culture d'une civilisation aussi vaste en quelques jours. En tant que fervent partisan des écosystèmes d'IA ouverts et de la recherche ouverte, je suis très optimiste quant à l'avenir des deux et j'espère qu'il y aura une vaste collaboration internationale à l'avenir.
Je tiens à remercier toutes les personnes formidables rencontrées chez Moonshot AI, Xiaomi, MiniMax, Zhipu AI, Meituan, Alibaba, Ant Group Lingxi, ModelScope, 01.AI, Unitree et ailleurs. Merci pour votre temps et votre accueil chaleureux. Merci également à SAIL d'avoir organisé ce voyage, et à tous les écrivains et journalistes participants. Je suis très reconnaissant d'avoir pu rencontrer tant de personnes remarquables et ambitieuses en si peu de temps.







