Jay depuis Temple de la Moitié
QuantumBit | Compte officiel QbitAI
Découverte majeure : l'auto-évolution de l'IA a commencé.
C’est la déclaration fracassante qu’Anthropic vient de publier dans un long billet de blog.
Nos données internes montrent que Claude accélère le développement de l'IA, ce qui pourrait être une voie vers l'amélioration récursive de soi (RSI).
Ce n'est pas de l'« alarmisme ». Après avoir lu l'article, il semble qu'Anthropic s'appuie sur des données concrètes pour étayer ses propos—
Fin mai de cette année, plus de 80 % du code d'Anthropic a été écrit par Claude.
Avant la sortie de Claude Code, ce chiffre n'était encore que de quelques pour cent.
Dans le même temps, la quantité de code livrée en moyenne chaque trimestre par un ingénieur d'Anthropic est 8 fois supérieure à celle de 2021-2025.
Plus important encore, la qualité—
Sur les tâches de programmation les plus ouvertes, les plus floues, où même la forme de la réponse est incertaine, le taux de réussite de Claude est maintenant de 76 %, contre seulement 26 % il y a six mois.
Un bond de 50 points de pourcentage. En six mois.
Au sein d'Anthropic, de nombreux ingénieurs estiment déjà que la qualité du code écrit par Claude est équivalente à celle des humains.
Elle devrait la dépasser d'ici la fin de l'année.
Anthropic souligne également que si cette tendance se poursuit, il est tout à fait possible que l'IA conçoive et construise elle-même la prochaine génération d'IA.
Cela pourrait transformer radicalement la société, apportant d'immenses bénéfices dans les domaines de la santé, de la technologie et de l'économie. Mais cela pourrait aussi exacerber et cumuler les problèmes d'alignement, menant finalement à une perte de contrôle.
C'est pourquoi Anthropic lance un appel en tête :
S'il existe un mécanisme vérifiable garantissant que les laboratoires d'IA ne font pas réellement de concurrence cachée, nous sommes prêts à ralentir, voire à faire une pause.
En dehors de cela, ce billet de blog d'Anthropic présente également de nombreuses opinions et faits intéressants.
Voici une version réorganisée, plus facile à lire.
Enjoy。
Le long article d'Anthropic fixe le ton
La loi de Moore du monde de l'IA est arrivée
Anthropic a créé une nouvelle dimension de mesure appelée « durée de tâches que l'IA peut accomplir de manière autonome ».
En mars 2024, Claude Opus 3 pouvait gérer des tâches logicielles qui prendraient environ 4 minutes à un humain.
Un an plus tard, Claude Sonnet 3.7, 1,5 heure.
Encore un an plus tard, Claude Opus 4.6, 12 heures.
Et le dernier modèle, Mythos, lors des tests internes, montre qu'il peut travailler de manière continue « au moins » 16 heures, atteignant déjà la limite supérieure du cadre de test METR.
Ce taux de doublement est passé d'un doublement tous les 7 mois à un doublement tous les 4 mois.
Si la tendance se maintient, en 2027, ce pourrait être plusieurs semaines.
Claude a écrit la majorité du code d'Anthropic
En mai 2026, plus de 80 % du code de mon référentiel Anthropic a été écrit par Claude.
Avant la sortie de Claude Code, ce chiffre n'était que d'un seul chiffre.
Ce changement se reflète également dans la façon de travailler des ingénieurs.
Au cours des quatre premières années d'Anthropic, le nombre de lignes de code fusionnées par les ingénieurs chaque jour est resté fondamentalement constant.
En 2025, Claude a commencé à écrire son propre code, et le nombre de fusions a soudainement commencé à exploser.
Aujourd'hui, au deuxième trimestre 2026, la quantité de code fusionné par les ingénieurs chaque jour est 8 fois supérieure à celle de 2024.
Cependant, la quantité de code a augmenté, mais la qualité du code n'est-elle pas diluée ?
Anthropic dit qu'au cours de l'année écoulée, les ingénieurs ont de moins en moins corrigé Claude.
Cela se reflète dans les benchmarks, comme le montre le graphique ci-dessous.
Dans tous les types de tâches, quel que soit leur niveau de difficulté, le taux de réussite de Claude a, sans exception, considérablement augmenté.
C'est pourquoi Anthropic utilise maintenant Claude pour examiner le code.
Oui, toutes les modifications soumises au référentiel de code passent d'abord par un examen automatique de Claude, vérifiant les bugs, les vulnérabilités de sécurité et autres défauts.
Leur analyse rétrospective a révélé que si cet examen automatique avait été en place pour chaque modification, environ un tiers des bogues ayant provoqué des incidents en ligne sur claude.ai auraient été bloqués avant leur mise en production.
Il faut savoir que les ingénieurs qui écrivent ce code sont déjà parmi les meilleurs au monde dans la création de systèmes d'IA.
Claude détecte leurs erreurs.
La loupe de la créativité
Vient ensuite le degré d'implication de Claude dans la recherche.
Anthropic a une habitude : à chaque lancement d'un nouveau modèle, ils donnent à Claude un code pour entraîner un petit modèle d'IA, en lui demandant de l'optimiser pour une vitesse d'exécution maximale, tout en garantissant sa justesse.
En mai 2025, la réponse de Claude Opus 4 était : une accélération de 3 fois.
En avril 2026, Claude Mythos Preview a réalisé 52 fois.
À titre de référence, un chercheur humain expérimenté a besoin de 4 à 8 heures pour atteindre difficilement un facteur 4.
En moins d'un an, Claude a surpassé l'humain.
En avril 2026, Anthropic a confié à Claude une recherche sur la sécurité de l'IA, portant essentiellement sur « si un modèle faible peut superviser de manière fiable un modèle fort », puis a demandé à Claude de formuler lui-même des hypothèses, de mener des expériences...
Parlons d'abord de la performance humaine : deux chercheurs humains ont passé environ une semaine à réduire l'écart de 23 %.
Quant à Claude, après environ 800 heures et une dépense de calcul d'environ 18 000 dollars—
Réduction de 97 %.
Où allons-nous ?
Jusqu'à présent, la conclusion est claire.
Le rôle de l'humain dans le processus de développement de l'IA se réduit à chaque étape.
Le code, Claude l'écrit. La revue de code, Claude la fait. L'exécution des expériences, Claude est un ordre de grandeur plus rapide que l'humain. La conception des expériences, Claude commence à le faire lui-même...
Le dernier avantage comparatif de l'humain actuel réside dans le discernement et le jugement de recherche.
Mais combien de temps cet avantage pourra-t-il être maintenu ?
Anthropic dit dans le blog qu'ils n'en sont pas sûrs non plus.
Une possibilité est que le « discernement de recherche » soit comme toutes les autres choses que l'IA ne savait pas faire auparavant : d'abord incapable, puis soudainement capable.
Comme la compréhension de l'humour par l'IA, la démonstration de la théorie de l'esprit, la résolution d'énigmes linguistiques, toutes ont suivi la même courbe.
Une autre possibilité est que, même si Claude n'apprend jamais un véritable discernement de recherche, la tendance actuelle à l'accélération signifie déjà que la quantité de travail que chaque chercheur humain peut superviser simultanément a été multipliée par plusieurs.
Vous n'avez pas besoin que l'IA pense entièrement à votre place, il suffit qu'elle fasse tout le travail « d'exécution », et vous n'avez plus qu'à faire les 5 % de choix d'orientation.
Trois futurs possibles pour la RSI
À la fin du billet, Anthropic décrit trois directions d'évolution possibles pour cette tendance à « l'auto-évolution ».
1. Stagnation.
Ces courbes exponentielles sont en fait des courbes en S.
Peut-être que le discernement de recherche est quelque chose qui ne peut pas être résolu par la mise à l'échelle (scale), et nécessite une percée architecturale entièrement nouvelle.
Ou bien, le goulot d'étranglement se situe dans l'énergie, les puces, la chaîne d'approvisionnement physique de la puissance de calcul.
Cependant, même si les capacités de l'IA stagnent au niveau d'aujourd'hui, cela entraînera déjà des changements importants pour le monde.
Le récent Project Glasswing, où Mythos Preview a découvert plus de dix mille vulnérabilités logicielles de niveau élevé et critique dans les premières semaines suivant son lancement, touchant les systèmes les plus critiques dans le monde.
2. L'IA continue de s'accélérer, mais l'humain garde le volant.
L'efficacité organisationnelle augmentera de façon exponentielle, une entreprise de 100 personnes fera le travail de 10 000 voire 100 000 personnes.
Anthropic pense que nous entrons probablement dans ce scénario.
Mais ils ont également observé un phénomène intéressant, à savoir la manifestation de la loi d'Amdahl dans les organisations—
Claude écrit le code beaucoup plus vite, et la revue de code devient le nouveau goulot d'étranglement. Les nouvelles idées, les nouveaux outils, les nouvelles expériences émergent de manière explosive, dépassant de loin la capacité d'absorption de l'organisation.
Les goulots d'étranglement ne disparaissent pas, ils se déplacent simplement vers le maillon suivant.
3. L'IA réalise une amélioration récursive de soi complète, commençant à construire elle-même la génération suivante.
Dans ce scénario, la vitesse de développement de l'IA dépend entièrement de la puissance de calcul. L'humain recule à une position de supervision, de vérification, d'audit.
Si cela se produit réellement, cette capacité migrera probablement vers d'autres domaines scientifiques : médecine, matériaux, énergie, décollage généralisé.
Bien sûr, un autre avenir possible est l'échec de l'alignement.
Dans ce cas, les biais s'accumuleraient progressivement au cours du processus d'itération autonome de l'IA, pour finalement—perdre complètement le contrôle.
OMT
Voilà, ce sont les points de vue les plus cruciaux d'Anthropic concernant cette auto-évolution.
Pour être honnête, au début, je n'y ai pas vraiment prêté attention, surtout qu'Anthropic est sur le point d'entrer en bourse, est-ce que ce n'est pas une opération de relations publiques typique du style « Anthropic » ?
Dites-le, cette fois, c'est peut-être vraiment différent.
Parce que, il y a quelques jours seulement, OpenAI a également publié un billet de blog similaire :
Nous voyons également des signes précoces d'auto-évolution dans les systèmes actuels : le développement de l'IA lui-même est accéléré par l'IA. Nous prévoyons que cela intensifiera les pressions concurrentielles entre les développeurs et les nations, et posera des défis de gouvernance que les institutions existantes ne pourront pas relever. Avec l'émergence de la RSI, la société aura besoin de méthodes pour façonner la trajectoire de développement de l'IA, pour s'assurer qu'elle sert les intérêts humains.
La singularité semble arriver plus vite que tout le monde ne le pensait.
Blog : https://www.anthropic.com/institute/recursive-self-improvement
Liens de référence :[1]https://x.com/kimmonismus/status/2062517474277675102[2]https://x.com/anthropicai/status/2062568873321513443
Cet article provient du compte officiel WeChat « QuantumBit », auteur : Suivre les technologies de pointe














