Anthropic annonce l'arrivée de l'AGI, pour l'humanité ou pour l'introduction en bourse ?

marsbitPublicado a 2026-06-05Actualizado a 2026-06-05

Resumen

Anthropic publie un article intitulé "When AI builds itself", évoquant le concept de l'auto-amélioration récursive : la capacité d'une IA à participer activement à la conception, à la formation et à l'optimisation de ses propres versions futures. La société souligne que plus de 80% du code intégré dans ses dépôts est désormais écrit par Claude, et que l'IA gère de mieux en mieux des tâches de recherche et d'ingénierie complexes, avec un taux de réussite de 76% sur les problèmes ouverts. Anthropic met en garde contre les risques potentiels d'une accélération incontrôlée, appelant à une réflexion mondiale sur des mécanismes de ralentissement ou de pause du développement de l'IA frontalière pour permettre à la sécurité et à la gouvernance de suivre. Cependant, le timing de cette publication, alors qu'Anthropic se prépare à son introduction en bourse (IPO), laisse également voir une stratégie de communication : démontrer que Claude n'est pas seulement un produit, mais un moteur intégré au processus de R&D de l'entreprise, créant ainsi un "cercle vertueux" (flywheel) pour une innovation plus rapide. Cette position contraste avec l'approche d'OpenAI, qui a récemment abordé le même thème sous l'angle de la gouvernance politique plutôt que de la démonstration technique.

Article | Lettres IA

Anthropic a publié hier soir un long article intitulé "When AI builds itself" (Quand l'IA se construit elle-même), qui ressemble au titre d'un roman de science-fiction d'Asimov. Le sujet est effectivement un concept très science-fictionnel : l'auto-amélioration récursive (recursive self-improvement).

Pour faire simple, par le passé, les chercheurs humains écrivaient le code, faisaient tourner les expériences, entraînaient les modèles, puis rendaient l'IA plus puissante. Mais si l'IA elle-même commence à participer à la conception, l'entraînement, les tests et l'optimisation de ses versions successives, alors la vitesse de progrès de l'IA ne sera plus uniquement pilotée par les humains, elle pourrait commencer à "s'auto-évoluer".

À cet égard, Anthropic lance un appel :

« Nous pensons que le monde tirerait grand bénéfice de pouvoir choisir de ralentir ou de suspendre temporairement le développement de l'IA de pointe, afin de laisser les structures sociales et la recherche sur l'alignement rattraper le progrès technologique. »

Cette phrase ressemble à un avertissement de sécurité, mais placée à l'époque où Anthropic se prépare à son introduction en bourse (IPO), elle peut difficilement ne pas être perçue comme un autre pré-narratif : Claude est tellement efficace qu'il commence même à créer lui-même la prochaine génération de Claude.

Une nouvelle tempête est apparue

Pour illustrer le fait que l'IA participe de plus en plus à la R&D de l'IA elle-même, Anthropic présente de nombreuses données internes.

Par exemple, jusqu'en mai 2026, plus de 80 % du code fusionné dans le référentiel d'Anthropic a été écrit par Claude. Avant la sortie de Claude Code, ce chiffre n'était que d'un seul chiffre.

Au deuxième trimestre 2026, selon les statistiques d'Anthropic, la quantité de code fusionnée quotidiennement par les ingénieurs était déjà environ 8 fois supérieure à celle de 2024.

Plus notable que la quantité de code, c'est que Claude s'attaque à des problèmes d'ingénierie plus ouverts.

Anthropic déclare dans l'article qu'au cours de l'année écoulée, la fréquence à laquelle les employés corrigent Claude, le remettent sur la bonne voie ou reprennent une tâche en cours a constamment diminué. Ce changement ne se produit pas seulement sur des tâches simples, mais aussi sur les tâches ouvertes les plus complexes.

Les tâches ouvertes sont des problèmes sans manuel d'instructions clair. Par exemple, un système plante, une tâche d'entraînement échoue, l'ingénieur ne sait pas non plus au début à quoi ressemble la solution et doit enquêter et juger en même temps.

Ce type de tâche dépendait le plus de l'expérience humaine, et dans ces tâches les plus ouvertes, le taux de réussite de Claude a atteint 76 % en mai 2026, une augmentation de 50 points de pourcentage en six mois.

Non seulement il écrit du code, mais Anthropic utilise également Claude pour la revue de code, vérifiant les bugs, les failles de sécurité et autres défauts. Leur analyse rétrospective révèle que si chaque modification de code avait été automatiquement examinée par Claude par le passé, environ un tiers des bugs ayant entraîné des incidents en ligne sur claude.ai auraient pu être bloqués avant leur mise en production.

Allant plus loin, Claude a commencé à participer au processus de recherche.

Anthropic a un test fixe : donner à Claude un code pour entraîner un petit modèle, et lui demander de trouver un moyen d'exécuter le code plus rapidement sans altérer les résultats. En mai 2025, Claude Opus 4 pouvait obtenir une accélération d'environ 3x ; en avril 2026, Claude Mythos Preview a poussé ce chiffre à environ 52x.

Anthropic mentionne également un cas de recherche ouverte en sécurité de l'IA. Ils ont confié un problème à un agent piloté par Claude : un modèle plus faible peut-il superviser de manière fiable un modèle plus fort ?

Ce processus nécessite de formuler des hypothèses, de les tester, de partager les découvertes avec des agents parallèles et d'itérer.

Deux chercheurs humains ont passé une semaine à combler environ 23 % de l'écart ; tandis que Claude, avec environ 800 heures cumulées et une consommation de calcul d'environ 18 000 dollars, en a comblé 97 %.

Ce résultat a bien sûr ses limites : le problème a été choisi par des humains, les critères d'évaluation ont été définis par des humains, et le résultat n'a pas été entièrement transféré à des modèles à l'échelle de production. Mais il montre tout de même que Claude peut déjà, dans un cadre de recherche défini par l'homme, concevoir ses propres expériences, les exécuter et itérer lui-même.

De plus, lorsque les chercheurs humains "prennent une mauvaise direction", Claude peut également suggérer de meilleures prochaines étapes.

Anthropic a sélectionné 129 sessions de recherche internes de Claude Code, où des chercheurs humains et Claude résolvaient ensemble des problèmes de recherche ouverts. Anthropic a identifié certains nœuds où "les humains se sont par la suite avérés avoir pris des détours", puis a donné le contexte précédant ce nœud à différentes versions de Claude pour voir ce qu'elle suggérerait comme prochaine étape. Ensuite, un autre "Claude judge", connaissant l'issue complète de la session, a évalué : la suggestion du modèle ou le choix humain à l'époque, lequel était meilleur.

Les résultats montrent que, sur ces nœuds où les chercheurs humains se sont par la suite avérés avoir une marge d'amélioration, Claude est de plus en plus capable de proposer de meilleures prochaines étapes.

Par le passé, les progrès des modèles d'IA dépendaient principalement des chercheurs et ingénieurs humains. Les humains décidaient des expériences à mener, écrivaient le code, entraînaient les modèles et faisaient évoluer les fonctionnalités de l'IA.

Désormais, de plus en plus de maillons de cette chaîne sont repris par Claude.

Anthropic présente un tableau de phase très intuitif :

De 2021 à 2023, Anthropic ne différait pas d'une entreprise technologique ordinaire, les humains écrivaient du code et de la documentation sur leurs ordinateurs portables.

De 2023 à 2025, les chatbots ont commencé à entrer dans le flux de travail. Les ingénieurs demandaient au modèle de générer des fragments de code, puis les copiaient dans l'éditeur.

De 2025 à 2026, des agents de programmation sont apparus, Claude a commencé à pouvoir écrire et modifier du code de manière autonome, réalisant parfois même des fichiers entiers de manière indépendante.

Aujourd'hui, les agents peuvent déjà exécuter du code par eux-mêmes, et déléguer des tâches de plusieurs heures à d'autres agents.

Ensuite vient la phase qui préoccupe vraiment Anthropic : la boucle fermée (closed loop).

Si ce jour arrive, les versions successives de Claude pourraient être continuellement améliorées par Claude lui-même — c'est cela, l'auto-amélioration récursive.

Anthropic est très prudent dans son article : nous n'en sommes pas encore là, et l'auto-amélioration récursive n'est pas inévitable. Mais il souligne néanmoins que le chemin vers cette étape commence à devenir visible.

C'est pourquoi Anthropic parle de ralentissement, voire de pause, à la fin de l'article. Il ne s'agit pas que toutes les entreprises d'IA cessent immédiatement leurs activités, mais plutôt que si les risques d'auto-amélioration de l'IA continuent d'augmenter à l'avenir, les laboratoires de pointe auront besoin d'un mécanisme de ralentissement coordonné et vérifiable.

En d'autres termes, la "singularité" approche, et l'humanité doit la contrôler.

Claude, irrésistible

Si l'on ne regarde que la surface, il s'agit d'un document de sécurité très prospectif. Anthropic parle d'auto-amélioration récursive, du fait que l'IA pourrait s'améliorer elle-même de plus en plus vite, et du besoin pour la société humaine de se préparer à des mécanismes de ralentissement et de pause.

Mais placé à l'époque où Anthropic se prépare à son IPO, cet article prend une autre signification.

D'une certaine manière, les récentes actions d'Anthropic ressemblent à celles d'un excellent élève un peu prétentieux — il a vraiment des capacités, mais il fait aussi le malin.

Ce qu'il veut dire, ce n'est pas seulement "nous avons un Claude très puissant", mais un pas plus loin : il veut dire "Claude nous aide à fabriquer un Claude encore plus puissant".

Si Anthropic se contentait de vendre un modèle ou un outil, il lui serait difficile d'échapper complètement aux comparaisons horizontales : Anthropic a Claude, OpenAI a GPT ; Anthropic a Claude Code, OpenAI a Codex ; Anthropic courtise les clients entreprises, OpenAI aussi. La concurrence entre les deux entreprises est très serrée, tout dépend de qui peut raconter la plus grande histoire au marché.

Il est à noter qu'il y a seulement 3 jours, OpenAI écrivait dans un document sur la gouvernance de l'IA de pointe :

« Nous voyons également des signes précoces d'auto-amélioration récursive dans les systèmes actuels : le développement de l'IA lui-même est accéléré par l'IA.

Cela intensifiera la pression concurrentielle entre développeurs et nations, et posera des défis de gouvernance que les institutions existantes ne pourront relever. »

Trois jours plus tard, Anthropic déclare : le chemin de Claude vers l'auto-amélioration récursive commence à devenir visible.

Si Claude se développe vraiment comme il l'espère, ce n'est plus une simple narration produit, cela deviendra une roue de développement (flywheel).

Claude écrit du code, exécute des expériences, optimise les flux d'entraînement, réduit en retour les incidents dans ses propres produits... Une fois que ce système tourne, Claude n'est plus seulement un produit d'Anthropic, mais aussi un outil de production important pour Anthropic.

Les utilisateurs voient le produit Claude, les clients entreprises achètent les capacités de Claude, mais ce qu'Anthropic veut vraiment que le marché financier remarque, c'est que Claude est déjà intégré au processus sous-jacent de développement des modèles de pointe, il a été placé dans la salle des machines d'Anthropic.

Les marchés financiers adorent les histoires de roues, comme des cornes d'abondance générant des richesses sans fin : un Claude plus puissant permet aux ingénieurs d'Anthropic de fusionner plus de code, plus de code accélère l'itération des produits et de l'infrastructure, une itération plus rapide permet aux chercheurs d'exécuter plus d'expériences, plus d'expériences aident à leur tour la prochaine génération de Claude à devenir plus puissante. Une fois la prochaine génération de Claude plus puissante, elle continue d'accélérer la R&D d'Anthropic.

La vitesse d'itération de Claude soutient également cette roue. En se basant sur les dates de publication, de 2023 à début 2025, les mises à jour majeures des modèles Claude se faisaient principalement tous les trois ou quatre mois. Mais après l'arrivée de Claude 4, les mises à jour des modèles d'Anthropic sont clairement devenues plus rapprochées.

Claude 4 est sorti en mai 2025, Opus 4.1 en août, Sonnet 4.5 en septembre, Haiku 4.5 en octobre, Opus 4.5 en novembre.

En 2026, Opus 4.6 est sorti le 5 février, Sonnet 4.6 le 17 février, Opus 4.7 le 15 avril, Opus 4.8 le 28 mai. Il n'y a que 42 jours entre Opus 4.7 et Opus 4.8.

Anthropic, en surface, dit "cela pourrait être dangereux, nous devons préparer les freins à l'avance", mais il suggère également : "nous avons vu ce qui se passe lorsque l'accélérateur est enfoncé".

C'est là toute la subtilité de la narration pour l'IPO. D'un côté, il présente les risques comme très sérieux, de l'autre, il rehausse aussi sa position technologique.

Toutes les entreprises d'IA n'ont pas le droit de parler d'auto-amélioration récursive, vous devez d'abord convaincre le monde extérieur que votre IA est déjà intégrée dans le processus de développement de l'IA, avant d'avoir le droit de dire que cela pourrait nécessiter une coordination mondiale.

OpenAI : Comment peut-on faire ça ?

Comme mentionné précédemment, juste avant qu'Anthropic ne publie cet article, OpenAI venait de placer l'auto-amélioration récursive sur la table.

Mais les approches des deux entreprises sont très différentes.

Le document d'OpenAI "Democratic Governance of Frontier AI" est un plan politique adressé à Washington. Il ne s'intéresse pas à "comment le modèle devient plus fort", mais à la manière de contraindre l'IA de pointe si elle continue de progresser à toute vitesse.

La plupart du contenu de ce rapport ne convient pas pour être détaillé ici, une seule phrase est clé : OpenAI déclare que des signes précoces d'auto-amélioration récursive sont déjà visibles dans les systèmes actuels.

Cette phrase et cet article d'Anthropic pointent en fait dans la même direction.

Sauf qu'OpenAI parle de systèmes institutionnels, et Anthropic parle de lui-même.

OpenAI veut dire : l'IA progresse trop vite, les structures de gouvernance existantes pourraient ne pas suivre, donc un nouvel ensemble de règles est nécessaire.

Tandis qu'Anthropic expose directement ce système, disant au marché : Claude est déjà dans notre processus de R&D, donc nous voyons la voie de l'auto-accélération de l'IA.

C'est un coup très habile, on a l'impression qu'OpenAI commence sûrement à ronchonner en interne — c'est du plagiat d'idées ! C'est nous qui sommes arrivés les premiers !

Je plaisante, mais OpenAI doit vraiment redoubler d'efforts, et vite sortir GPT 5.6.

Preguntas relacionadas

QQuelle est la principale préoccupation d'Anthropic concernant l'IA selon l'article ?

AL'inquiétude principale d'Anthropic concerne le potentiel d'auto-amélioration récursive de l'IA, où l'IA pourrait elle-même concevoir et améliorer ses versions successives, ce qui pourrait accélérer ses progrès au-delà du contrôle humain.

QQuels exemples concrets l'article donne-t-il pour illustrer la participation de Claude au développement de l'IA chez Anthropic ?

AL'article cite plusieurs exemples : plus de 80% du code intégré par Anthropic est écrit par Claude ; le taux de réussite de Claude sur les tâches de recherche ouvertes est passé à 76% ; Claude a contribué à une accélération 52 fois plus rapide d'un code de formation de modèle ; et un agent piloté par Claude a obtenu de meilleurs résultats de recherche en matière de sécurité que des chercheurs humains.

QQuelle différence l'article souligne-t-il entre la communication d'Anthropic et celle d'OpenAI sur le sujet de l'auto-amélioration récursive ?

AL'article souligne qu'OpenAI aborde le sujet sous l'angle de la gouvernance et des politiques, en appelant à de nouvelles règles. Anthropic, quant à lui, présente des données internes détaillées pour démontrer que Claude est déjà profondément intégré dans son propre processus de R&D, montrant ainsi le chemin vers cette auto-amélioration et positionnant cela dans le contexte de son prochain IPO.

QComment l'article interprète-t-il le timing de la publication d'Anthropic par rapport à son projet d'IPO ?

AL'article suggère que le timing de la publication, proche de l'IPO prévue d'Anthropic, sert également une narration stratégique. En évoquant les risques de l'auto-amélioration récursive, Anthropic positionne implicitement sa technologie (Claude) comme étant si avancée qu'elle touche à ces questions critiques, ce qui pourrait valoriser son potentiel et son avantage concurrentiel auprès des investisseurs.

QQue signifie le terme 'boucle fermée' (closed loop) utilisé par Anthropic dans l'article ?

ADans le contexte de l'article, une 'boucle fermée' désigne le stade ultime où les futures versions de Claude pourraient être continuellement améliorées par Claude lui-même, sans intervention humaine significative, réalisant ainsi une 'auto-amélioration récursive' complète.

Lecturas Relacionadas

Los 43 minutos de Trump: la narrativa del hombre fuerte se descontrola y la guerra mediática se intensifica

**Resumen del artículo en español:** Tras más de una semana sin aparecer en público, el presidente Donald Trump celebró una conferencia de prensa de 43 minutos que se alejó de los temas centrales (su salud, la acción militar en Irán, las fracturas en su partido) y derivó en un espectáculo político errático y lleno de quejas. La intervención comenzó hablando extensamente sobre la renovación de un estanque reflejante, comparó el tamaño de sus mítines con los de Martin Luther King, atacó a ciudades estadounidenses y a sus adversarios políticos, y culminó con un ataque personal a una periodista de CNN, a quien criticó por "nunca sonreír" y tener "odio en los ojos". El artículo subraya dos dimensiones clave. Primero, revela un estado presidencial que parece fuera de control, defensivo y volátil, evidenciado por el abrupto final del acto y el rápido desalojo del lugar por su equipo. Segundo, analiza cambios institucionales: Trump firmó una orden ejecutiva que elimina protecciones laborales para miles de altos funcionarios federales, priorizando la lealtad política sobre la experiencia y la independencia. El texto amplía el análisis al panorama mediático, señalando cómo la presión política y los intereses comerciales están erosionando la independencia periodística, citando el caso de la destitución de un veterano periodista en la CBS. Argumenta que, ante la captura de los grandes medios, el periodismo independiente se vuelve crucial para mantener los hechos. El autor hace un llamado a apoyar económicamente a las voces independientes como forma de resistencia, enfatizando que el ataque de Trump a la prensa es un ataque al derecho del público a estar informado. El artículo concluye notando que, el mismo día de este episodio, la Cámara de Representantes (con el voto a favor de cuatro republicanos) aprobó una resolución para poner fin a la guerra en Irán, mostrando grietas en su partido y sugiriendo que su comportamiento extremo está empezando a alienar a sus propios aliados.

marsbitHace 37 min(s)

Los 43 minutos de Trump: la narrativa del hombre fuerte se descontrola y la guerra mediática se intensifica

marsbitHace 37 min(s)

El giro global de a16z: El capital riesgo se está convirtiendo en el "impulsor" de la alianza tecnológica estadounidense

En a16z, creemos que la mejor oportunidad que puede ofrecer una sociedad es dar a sus ciudadanos una posibilidad. Creemos firmemente que Estados Unidos y sus aliados lo hacen de manera más constante y exitosa que cualquier otro lugar del mundo. Hoy, con las naciones reconstruyendo, rearmándose y replanteando su participación en la competencia global, tenemos la oportunidad de transmitir ese regalo. Nuestra estrategia global evoluciona más allá de simplemente buscar proyectos en el extranjero. Nos estamos integrando en un marco más amplio de competencia tecnológica y cooperación entre aliados. La innovación ya no es solo una cuestión comercial, sino que es crucial para la seguridad nacional, la capacidad industrial y la competencia internacional. Anunciamos nuevos planes globales: establecer cooperación tecnológica con aliados en áreas clave como IA, robótica, defensa moderna, ciberseguridad y resiliencia de la cadena de suministro. Anne Neuberger, nueva socia responsable de asuntos globales, liderará esta labor, aportando su vasta experiencia gubernamental en seguridad y tecnologías emergentes. También ayudaremos a nuestras empresas en etapa de crecimiento a expandirse internacionalmente, aprovechando la poderosa red de contactos de a16z, desde líderes políticos hasta grandes compradores. Además, buscaremos nuevas asociaciones estratégicas en el extranjero, renombrando nuestro equipo de relaciones con inversores como Equipo de Socios Globales. Nuestro trabajo fundamental sigue siendo invertir en las mejores empresas tecnológicas donde sea que las encontremos, con más de 100 inversiones internacionales realizadas. Nuestra misión siempre ha sido ayudar a los fundadores a construir empresas excepcionales. Hoy, esa misión adquiere un nuevo significado: no solo ayudar a los fundadores, sino también a Estados Unidos y sus aliados. Estamos respondiendo a ese llamado.

marsbitHace 2 hora(s)

El giro global de a16z: El capital riesgo se está convirtiendo en el "impulsor" de la alianza tecnológica estadounidense

marsbitHace 2 hora(s)

Trading

Spot
Futuros

Artículos destacados

Cómo comprar NIGHT

¡Bienvenido a HTX.com! Hemos hecho que comprar Midnight (NIGHT) sea simple y conveniente. Sigue nuestra guía paso a paso para iniciar tu viaje de criptos.Paso 1: crea tu cuenta HTXUtiliza tu correo electrónico o número de teléfono para registrarte y obtener una cuenta gratuita en HTX. Experimenta un proceso de registro sin complicaciones y desbloquea todas las funciones.Obtener mi cuentaPaso 2: ve a Comprar cripto y elige tu método de pagoTarjeta de crédito/débito: usa tu Visa o Mastercard para comprar Midnight (NIGHT) al instante.Saldo: utiliza fondos del saldo de tu cuenta HTX para tradear sin problemas.Terceros: hemos agregado métodos de pago populares como Google Pay y Apple Pay para mejorar la comodidad.P2P: tradear directamente con otros usuarios en HTX.Over-the-Counter (OTC): ofrecemos servicios personalizados y tipos de cambio competitivos para los traders.Paso 3: guarda tu Midnight (NIGHT)Después de comprar tu Midnight (NIGHT), guárdalo en tu cuenta HTX. Alternativamente, puedes enviarlo a otro lugar mediante transferencia blockchain o utilizarlo para tradear otras criptomonedas.Paso 4: tradear Midnight (NIGHT)Tradear fácilmente con Midnight (NIGHT) en HTX's mercado spot. Simplemente accede a tu cuenta, selecciona tu par de trading, ejecuta tus trades y monitorea en tiempo real. Ofrecemos una experiencia fácil de usar tanto para principiantes como para traders experimentados.

525 Vistas totalesPublicado en 2025.12.08Actualizado en 2026.06.02

Cómo comprar NIGHT

Discusiones

Bienvenido a la comunidad de HTX. Aquí puedes mantenerte informado sobre los últimos desarrollos de la plataforma y acceder a análisis profesionales del mercado. A continuación se presentan las opiniones de los usuarios sobre el precio de NIGHT (NIGHT).

活动图片