Auteur | Huàlín Wǔwáng
Éditeur | Jing Yu
Si quelqu'un m'avait dit il y a quelques années que l'un des cofondateurs d'OpenAI irait chez Anthropic pour aider un concurrent dans la recherche sur le pré-entraînement, j'aurais probablement pensé qu'il racontait un scénario de science-fiction.
Mais cette chose, aujourd'hui, s'est réellement produite.
Andrej Karpathy, ce nom n'a presque pas besoin d'être présenté dans le monde de l'IA. Conférencier principal du cours CS231n de Stanford, vulgarisateur le plus populaire dans le domaine de l'apprentissage profond, cofondateur d'OpenAI, ancien responsable de l'équipe de conduite autonome de Tesla. Un seul de ses tweets peut faire exploser la popularité d'une orientation technologique ; s'il met en ligne une vidéo expliquant les Transformers sur YouTube, le nombre de vues dépasse facilement le million.
C'est une telle personne qui annonce aujourd'hui rejoindre Anthropic.
L'annonce officielle de Karpathy sur X | Source de l'image : X
En rejoignant Anthropic, Karpathy se concentrera sur la recherche en pré-entraînement et dirigera une nouvelle équipe, dont la tâche centrale est d'utiliser Claude pour accélérer l'exploration dans le domaine du pré-entraînement.
Le pré-entraînement est la fondation des capacités des grands modèles. Celui qui fait une percée à ce niveau a un avantage décisif dans la compétition des prochaines années. Le fait qu'Anthropic place Karpathy ici est une intention très claire.
Mais si l'on ne comprend cet événement que comme « une personne compétente change de travail », on le sous-estime grandement.
Karpathy incarne quelque chose d'extrêmement rare dans le milieu de l'IA : la double superposition de crédibilité technique et d'influence auprès du grand public. Il n'est pas seulement un chercheur capable d'écrire du bon code et de publier de bons articles, il est du genre à pouvoir faire suivre volontiers d'autres chercheurs de haut niveau.
Il existe dans l'industrie une expression : l'arrivée d'un chercheur prestigieux conduit souvent un groupe de personnes à réévaluer leurs propres choix de carrière. L'arrivée de Karpathy pourrait être le signal d'une vague imminente d'afflux de talents chez Anthropic.
Ce qui est encore plus intéressant à déchiffrer, c'est sa motivation. En 2015, il était l'un des cofondateurs d'OpenAI, ayant vécu personnellement tout le processus de transformation de cette entreprise, partie d'un idéal à but non lucratif. Plus tard, il est allé chez Tesla, puis est brièvement retourné chez OpenAI, avant de partir pour créer sa propre entreprise.
Ce choix d'Anthropic cette fois-ci porte, dans une certaine mesure, une signification de « prise de position ».
01 Anthropic, qui ne cesse de gagner
Regarder l'arrivée de Karpathy de manière isolée négligerait un contexte important : Anthropic se trouve récemment dans une phase de montée en puissance peu commune.
Il y a deux semaines, des données du Ramp AI Index ont discrètement envahi les cercles des médias technologiques.
Les données montrent que le taux d'adoption d'Anthropic par les entreprises a augmenté de 3,8 points de pourcentage en avril, atteignant 34,4 %, tandis que celui d'OpenAI a baissé de 2,9 points de pourcentage sur la même période, tombant à 32,3 %. C'est la première fois dans l'histoire qu'Anthropic dépasse OpenAI en termes de taux d'adoption par les entreprises. Bien que l'écart ne soit pas encore considérable, la signification directionnelle est forte.
La même semaine, Anthropic a lancé une version de Claude destinée aux petites entreprises, intégrant un ensemble d'outils quotidiens essentiels pour les PME comme QuickBooks, PayPal, HubSpot, Canva, DocuSign, intégrant directement les capacités d'IA dans les flux de travail de ces utilisateurs. C'est un signal évident de descente vers le bas du marché ; Anthropic ne vise plus seulement les grands clients entreprises, il s'oriente vers un marché plus large.
La veille, Anthropic annonçait un partenariat avec la Fondation Gates, s'engageant à investir 200 millions de dollars sur quatre ans, ainsi que des quotas d'utilisation de Claude et un support technique, couvrant des domaines comme la santé mondiale, l'éducation et le développement économique. Le montant de ce partenariat n'est pas le plus éclatant, mais sa valeur narrative est élevée. Une entreprise initialement axée sur la « sécurité de l'IA » consolide de plus en plus l'image de « l'IA responsable ».
À un moment où le financement et l'évaluation se rapprochent du billion de dollars et où le taux d'adoption par les entreprises vient juste de dépasser celui de son rival, l'arrivée de Karpathy est le point d'orgue de tout cela.
Le titre du commentaire du magazine Fortune est direct : « Anthropic ne semble pas pouvoir arrêter de gagner ».
02 Pourquoi ne pas être retourné chez OpenAI ?
Quand quelqu'un gagne, d'autres subissent nécessairement la pression.
Karpathy n'est pas le premier à quitter l'écosystème OpenAI pour se diriger vers Anthropic.
L'équipe fondatrice d'Anthropic elle-même, Dario Amodei, Daniela Amodei, ainsi qu'un groupe de chercheurs clés de l'époque, ont quitté collectivement OpenAI en 2021 pour fonder cette entreprise. D'une certaine manière, depuis le jour de sa naissance, Anthropic est le produit d'une divergence de trajectoire au sein d'OpenAI.
Au cours des années suivantes, alors qu'OpenAI avançait de plus en plus vite sur la voie de la commercialisation et de la productisation, accélérant les sorties, poursuivant les revenus et se rapprochant progressivement de Microsoft, certains chercheurs plus attachés à la « recherche pure » ou à la « priorité à la sécurité » ont commencé à voter avec leurs pieds.
Le choix de Karpathy pour Anthropic cette fois-ci tombe à un moment sensible. OpenAI récemment, dans son récit externe, est assez dense, avec les séries GPT, o, Sora, Operator progressant simultanément sur plusieurs fronts ; le rythme interne est si rapide que certains dans l'industrie décrivent en privé « comme courir trois marathons en même temps ». Face à une expansion aussi rapide, comment retenir ceux qui se soucient vraiment de la profondeur de la recherche et ne veulent pas seulement une valorisation, est une question très difficile à résoudre.
Bien sûr, OpenAI possède toujours une densité de talents et une échelle de ressources extrêmement fortes ; un départ ne saurait ébranler ses fondations. Mais si ce genre de flux devenait une tendance, ce qu'il faudrait vraiment surveiller, c'est le changement d'attentes du secteur qu'il transmettrait.
Un analyste technologique l'a dit très directement : « Le développement de l'IA n'est plus seulement une course technologique, mais une guerre de leadership intellectuel. La mobilité d'un chercheur influent peut remodeler les priorités de recherche de toute une industrie. »
L'influence de Karpathy lui-même au sein de la communauté de l'apprentissage profond correspond parfaitement à ce jugement. Ses conférences de Stanford et ses vidéos YouTube sont des lectures d'introduction pour beaucoup de chercheurs travaillant aujourd'hui dans les meilleurs laboratoires d'IA. Là où il va, il apporte dans une certaine mesure une sorte d'approbation : « Cette direction mérite qu'on y investisse ».
03 Le pré-entraînement, pour jouer l'avenir
Revenons à l'orientation spécifique de cette arrivée de Karpathy chez Anthropic : le pré-entraînement.
Ces deux dernières années, l'attention de l'industrie s'est largement concentrée sur des orientations relativement « proches de la couche application » comme l'inférence, le multimodal, les agents, le RAG. Les percées dans les capacités des modèles de base sont considérées par certains comme étant déjà entrées dans une phase de « réglage fin et d'optimisation », plutôt qu'un saut fondamental.
Anthropic ne voit manifestement pas les choses ainsi. Confier à Karpathy la création d'une équipe spécialement pour explorer « l'utilisation de Claude pour accélérer la recherche sur le pré-entraînement », c'est parier sur une direction plus fondamentale, au cycle plus long, mais au retour potentiel aussi plus grand.
Il y a là une logique intéressante : utiliser les modèles de langage existants pour aider au pré-entraînement de la prochaine génération de modèles est une approche de « l'IA aidant l'IA à évoluer ». Cette voie est encore très nouvelle, sans feuille de route mature, mais si elle peut aboutir, cela signifie que l'efficacité de l'entraînement et les limites des capacités pourraient toutes deux connaître une amélioration non linéaire.
Confier cette tâche à Karpathy est un pari audacieux d'Anthropic sur une orientation technologique.
La guerre des talents dans l'industrie de l'IA, menée jusqu'à aujourd'hui, n'est plus du niveau où l'on décrit en recrutant quelques ingénieurs. Elle ressemble plus à une lutte pour le « droit à la narration » ; celui qui attire les personnes capables de définir les orientations de recherche envoie un signal à toute l'industrie : nous sommes les futurs acteurs principaux de ce jeu.
Le choix de Karpathy est peut-être un tel signal.







