Article | Lettres IA
Anthropic a publié hier soir un long article intitulé "When AI builds itself" (Quand l'IA se construit elle-même), qui ressemble au titre d'un roman de science-fiction d'Asimov. Le sujet est effectivement un concept très science-fictionnel : l'auto-amélioration récursive (recursive self-improvement).
Pour faire simple, par le passé, les chercheurs humains écrivaient le code, faisaient tourner les expériences, entraînaient les modèles, puis rendaient l'IA plus puissante. Mais si l'IA elle-même commence à participer à la conception, l'entraînement, les tests et l'optimisation de ses versions successives, alors la vitesse de progrès de l'IA ne sera plus uniquement pilotée par les humains, elle pourrait commencer à "s'auto-évoluer".
À cet égard, Anthropic lance un appel :
« Nous pensons que le monde tirerait grand bénéfice de pouvoir choisir de ralentir ou de suspendre temporairement le développement de l'IA de pointe, afin de laisser les structures sociales et la recherche sur l'alignement rattraper le progrès technologique. »
Cette phrase ressemble à un avertissement de sécurité, mais placée à l'époque où Anthropic se prépare à son introduction en bourse (IPO), elle peut difficilement ne pas être perçue comme un autre pré-narratif : Claude est tellement efficace qu'il commence même à créer lui-même la prochaine génération de Claude.
Une nouvelle tempête est apparue
Pour illustrer le fait que l'IA participe de plus en plus à la R&D de l'IA elle-même, Anthropic présente de nombreuses données internes.
Par exemple, jusqu'en mai 2026, plus de 80 % du code fusionné dans le référentiel d'Anthropic a été écrit par Claude. Avant la sortie de Claude Code, ce chiffre n'était que d'un seul chiffre.
Au deuxième trimestre 2026, selon les statistiques d'Anthropic, la quantité de code fusionnée quotidiennement par les ingénieurs était déjà environ 8 fois supérieure à celle de 2024.
Plus notable que la quantité de code, c'est que Claude s'attaque à des problèmes d'ingénierie plus ouverts.
Anthropic déclare dans l'article qu'au cours de l'année écoulée, la fréquence à laquelle les employés corrigent Claude, le remettent sur la bonne voie ou reprennent une tâche en cours a constamment diminué. Ce changement ne se produit pas seulement sur des tâches simples, mais aussi sur les tâches ouvertes les plus complexes.
Les tâches ouvertes sont des problèmes sans manuel d'instructions clair. Par exemple, un système plante, une tâche d'entraînement échoue, l'ingénieur ne sait pas non plus au début à quoi ressemble la solution et doit enquêter et juger en même temps.
Ce type de tâche dépendait le plus de l'expérience humaine, et dans ces tâches les plus ouvertes, le taux de réussite de Claude a atteint 76 % en mai 2026, une augmentation de 50 points de pourcentage en six mois.
Non seulement il écrit du code, mais Anthropic utilise également Claude pour la revue de code, vérifiant les bugs, les failles de sécurité et autres défauts. Leur analyse rétrospective révèle que si chaque modification de code avait été automatiquement examinée par Claude par le passé, environ un tiers des bugs ayant entraîné des incidents en ligne sur claude.ai auraient pu être bloqués avant leur mise en production.
Allant plus loin, Claude a commencé à participer au processus de recherche.
Anthropic a un test fixe : donner à Claude un code pour entraîner un petit modèle, et lui demander de trouver un moyen d'exécuter le code plus rapidement sans altérer les résultats. En mai 2025, Claude Opus 4 pouvait obtenir une accélération d'environ 3x ; en avril 2026, Claude Mythos Preview a poussé ce chiffre à environ 52x.
Anthropic mentionne également un cas de recherche ouverte en sécurité de l'IA. Ils ont confié un problème à un agent piloté par Claude : un modèle plus faible peut-il superviser de manière fiable un modèle plus fort ?
Ce processus nécessite de formuler des hypothèses, de les tester, de partager les découvertes avec des agents parallèles et d'itérer.
Deux chercheurs humains ont passé une semaine à combler environ 23 % de l'écart ; tandis que Claude, avec environ 800 heures cumulées et une consommation de calcul d'environ 18 000 dollars, en a comblé 97 %.
Ce résultat a bien sûr ses limites : le problème a été choisi par des humains, les critères d'évaluation ont été définis par des humains, et le résultat n'a pas été entièrement transféré à des modèles à l'échelle de production. Mais il montre tout de même que Claude peut déjà, dans un cadre de recherche défini par l'homme, concevoir ses propres expériences, les exécuter et itérer lui-même.
De plus, lorsque les chercheurs humains "prennent une mauvaise direction", Claude peut également suggérer de meilleures prochaines étapes.
Anthropic a sélectionné 129 sessions de recherche internes de Claude Code, où des chercheurs humains et Claude résolvaient ensemble des problèmes de recherche ouverts. Anthropic a identifié certains nœuds où "les humains se sont par la suite avérés avoir pris des détours", puis a donné le contexte précédant ce nœud à différentes versions de Claude pour voir ce qu'elle suggérerait comme prochaine étape. Ensuite, un autre "Claude judge", connaissant l'issue complète de la session, a évalué : la suggestion du modèle ou le choix humain à l'époque, lequel était meilleur.
Les résultats montrent que, sur ces nœuds où les chercheurs humains se sont par la suite avérés avoir une marge d'amélioration, Claude est de plus en plus capable de proposer de meilleures prochaines étapes.
Par le passé, les progrès des modèles d'IA dépendaient principalement des chercheurs et ingénieurs humains. Les humains décidaient des expériences à mener, écrivaient le code, entraînaient les modèles et faisaient évoluer les fonctionnalités de l'IA.
Désormais, de plus en plus de maillons de cette chaîne sont repris par Claude.
Anthropic présente un tableau de phase très intuitif :
De 2021 à 2023, Anthropic ne différait pas d'une entreprise technologique ordinaire, les humains écrivaient du code et de la documentation sur leurs ordinateurs portables.
De 2023 à 2025, les chatbots ont commencé à entrer dans le flux de travail. Les ingénieurs demandaient au modèle de générer des fragments de code, puis les copiaient dans l'éditeur.
De 2025 à 2026, des agents de programmation sont apparus, Claude a commencé à pouvoir écrire et modifier du code de manière autonome, réalisant parfois même des fichiers entiers de manière indépendante.
Aujourd'hui, les agents peuvent déjà exécuter du code par eux-mêmes, et déléguer des tâches de plusieurs heures à d'autres agents.
Ensuite vient la phase qui préoccupe vraiment Anthropic : la boucle fermée (closed loop).
Si ce jour arrive, les versions successives de Claude pourraient être continuellement améliorées par Claude lui-même — c'est cela, l'auto-amélioration récursive.
Anthropic est très prudent dans son article : nous n'en sommes pas encore là, et l'auto-amélioration récursive n'est pas inévitable. Mais il souligne néanmoins que le chemin vers cette étape commence à devenir visible.
C'est pourquoi Anthropic parle de ralentissement, voire de pause, à la fin de l'article. Il ne s'agit pas que toutes les entreprises d'IA cessent immédiatement leurs activités, mais plutôt que si les risques d'auto-amélioration de l'IA continuent d'augmenter à l'avenir, les laboratoires de pointe auront besoin d'un mécanisme de ralentissement coordonné et vérifiable.
En d'autres termes, la "singularité" approche, et l'humanité doit la contrôler.
Claude, irrésistible
Si l'on ne regarde que la surface, il s'agit d'un document de sécurité très prospectif. Anthropic parle d'auto-amélioration récursive, du fait que l'IA pourrait s'améliorer elle-même de plus en plus vite, et du besoin pour la société humaine de se préparer à des mécanismes de ralentissement et de pause.
Mais placé à l'époque où Anthropic se prépare à son IPO, cet article prend une autre signification.
D'une certaine manière, les récentes actions d'Anthropic ressemblent à celles d'un excellent élève un peu prétentieux — il a vraiment des capacités, mais il fait aussi le malin.
Ce qu'il veut dire, ce n'est pas seulement "nous avons un Claude très puissant", mais un pas plus loin : il veut dire "Claude nous aide à fabriquer un Claude encore plus puissant".
Si Anthropic se contentait de vendre un modèle ou un outil, il lui serait difficile d'échapper complètement aux comparaisons horizontales : Anthropic a Claude, OpenAI a GPT ; Anthropic a Claude Code, OpenAI a Codex ; Anthropic courtise les clients entreprises, OpenAI aussi. La concurrence entre les deux entreprises est très serrée, tout dépend de qui peut raconter la plus grande histoire au marché.
Il est à noter qu'il y a seulement 3 jours, OpenAI écrivait dans un document sur la gouvernance de l'IA de pointe :
« Nous voyons également des signes précoces d'auto-amélioration récursive dans les systèmes actuels : le développement de l'IA lui-même est accéléré par l'IA.
Cela intensifiera la pression concurrentielle entre développeurs et nations, et posera des défis de gouvernance que les institutions existantes ne pourront relever. »
Trois jours plus tard, Anthropic déclare : le chemin de Claude vers l'auto-amélioration récursive commence à devenir visible.
Si Claude se développe vraiment comme il l'espère, ce n'est plus une simple narration produit, cela deviendra une roue de développement (flywheel).
Claude écrit du code, exécute des expériences, optimise les flux d'entraînement, réduit en retour les incidents dans ses propres produits... Une fois que ce système tourne, Claude n'est plus seulement un produit d'Anthropic, mais aussi un outil de production important pour Anthropic.
Les utilisateurs voient le produit Claude, les clients entreprises achètent les capacités de Claude, mais ce qu'Anthropic veut vraiment que le marché financier remarque, c'est que Claude est déjà intégré au processus sous-jacent de développement des modèles de pointe, il a été placé dans la salle des machines d'Anthropic.
Les marchés financiers adorent les histoires de roues, comme des cornes d'abondance générant des richesses sans fin : un Claude plus puissant permet aux ingénieurs d'Anthropic de fusionner plus de code, plus de code accélère l'itération des produits et de l'infrastructure, une itération plus rapide permet aux chercheurs d'exécuter plus d'expériences, plus d'expériences aident à leur tour la prochaine génération de Claude à devenir plus puissante. Une fois la prochaine génération de Claude plus puissante, elle continue d'accélérer la R&D d'Anthropic.
La vitesse d'itération de Claude soutient également cette roue. En se basant sur les dates de publication, de 2023 à début 2025, les mises à jour majeures des modèles Claude se faisaient principalement tous les trois ou quatre mois. Mais après l'arrivée de Claude 4, les mises à jour des modèles d'Anthropic sont clairement devenues plus rapprochées.
Claude 4 est sorti en mai 2025, Opus 4.1 en août, Sonnet 4.5 en septembre, Haiku 4.5 en octobre, Opus 4.5 en novembre.
En 2026, Opus 4.6 est sorti le 5 février, Sonnet 4.6 le 17 février, Opus 4.7 le 15 avril, Opus 4.8 le 28 mai. Il n'y a que 42 jours entre Opus 4.7 et Opus 4.8.
Anthropic, en surface, dit "cela pourrait être dangereux, nous devons préparer les freins à l'avance", mais il suggère également : "nous avons vu ce qui se passe lorsque l'accélérateur est enfoncé".
C'est là toute la subtilité de la narration pour l'IPO. D'un côté, il présente les risques comme très sérieux, de l'autre, il rehausse aussi sa position technologique.
Toutes les entreprises d'IA n'ont pas le droit de parler d'auto-amélioration récursive, vous devez d'abord convaincre le monde extérieur que votre IA est déjà intégrée dans le processus de développement de l'IA, avant d'avoir le droit de dire que cela pourrait nécessiter une coordination mondiale.
OpenAI : Comment peut-on faire ça ?
Comme mentionné précédemment, juste avant qu'Anthropic ne publie cet article, OpenAI venait de placer l'auto-amélioration récursive sur la table.
Mais les approches des deux entreprises sont très différentes.
Le document d'OpenAI "Democratic Governance of Frontier AI" est un plan politique adressé à Washington. Il ne s'intéresse pas à "comment le modèle devient plus fort", mais à la manière de contraindre l'IA de pointe si elle continue de progresser à toute vitesse.
La plupart du contenu de ce rapport ne convient pas pour être détaillé ici, une seule phrase est clé : OpenAI déclare que des signes précoces d'auto-amélioration récursive sont déjà visibles dans les systèmes actuels.
Cette phrase et cet article d'Anthropic pointent en fait dans la même direction.
Sauf qu'OpenAI parle de systèmes institutionnels, et Anthropic parle de lui-même.
OpenAI veut dire : l'IA progresse trop vite, les structures de gouvernance existantes pourraient ne pas suivre, donc un nouvel ensemble de règles est nécessaire.
Tandis qu'Anthropic expose directement ce système, disant au marché : Claude est déjà dans notre processus de R&D, donc nous voyons la voie de l'auto-accélération de l'IA.
C'est un coup très habile, on a l'impression qu'OpenAI commence sûrement à ronchonner en interne — c'est du plagiat d'idées ! C'est nous qui sommes arrivés les premiers !
Je plaisante, mais OpenAI doit vraiment redoubler d'efforts, et vite sortir GPT 5.6.












