Anthropic annonce l'arrivée de l'AGI, pour l'humanité ou pour l'introduction en bourse ?

marsbitОпубліковано о 2026-06-05Востаннє оновлено о 2026-06-05

Анотація

Anthropic publie un article intitulé "When AI builds itself", évoquant le concept de l'auto-amélioration récursive : la capacité d'une IA à participer activement à la conception, à la formation et à l'optimisation de ses propres versions futures. La société souligne que plus de 80% du code intégré dans ses dépôts est désormais écrit par Claude, et que l'IA gère de mieux en mieux des tâches de recherche et d'ingénierie complexes, avec un taux de réussite de 76% sur les problèmes ouverts. Anthropic met en garde contre les risques potentiels d'une accélération incontrôlée, appelant à une réflexion mondiale sur des mécanismes de ralentissement ou de pause du développement de l'IA frontalière pour permettre à la sécurité et à la gouvernance de suivre. Cependant, le timing de cette publication, alors qu'Anthropic se prépare à son introduction en bourse (IPO), laisse également voir une stratégie de communication : démontrer que Claude n'est pas seulement un produit, mais un moteur intégré au processus de R&D de l'entreprise, créant ainsi un "cercle vertueux" (flywheel) pour une innovation plus rapide. Cette position contraste avec l'approche d'OpenAI, qui a récemment abordé le même thème sous l'angle de la gouvernance politique plutôt que de la démonstration technique.

Article | Lettres IA

Anthropic a publié hier soir un long article intitulé "When AI builds itself" (Quand l'IA se construit elle-même), qui ressemble au titre d'un roman de science-fiction d'Asimov. Le sujet est effectivement un concept très science-fictionnel : l'auto-amélioration récursive (recursive self-improvement).

Pour faire simple, par le passé, les chercheurs humains écrivaient le code, faisaient tourner les expériences, entraînaient les modèles, puis rendaient l'IA plus puissante. Mais si l'IA elle-même commence à participer à la conception, l'entraînement, les tests et l'optimisation de ses versions successives, alors la vitesse de progrès de l'IA ne sera plus uniquement pilotée par les humains, elle pourrait commencer à "s'auto-évoluer".

À cet égard, Anthropic lance un appel :

« Nous pensons que le monde tirerait grand bénéfice de pouvoir choisir de ralentir ou de suspendre temporairement le développement de l'IA de pointe, afin de laisser les structures sociales et la recherche sur l'alignement rattraper le progrès technologique. »

Cette phrase ressemble à un avertissement de sécurité, mais placée à l'époque où Anthropic se prépare à son introduction en bourse (IPO), elle peut difficilement ne pas être perçue comme un autre pré-narratif : Claude est tellement efficace qu'il commence même à créer lui-même la prochaine génération de Claude.

Une nouvelle tempête est apparue

Pour illustrer le fait que l'IA participe de plus en plus à la R&D de l'IA elle-même, Anthropic présente de nombreuses données internes.

Par exemple, jusqu'en mai 2026, plus de 80 % du code fusionné dans le référentiel d'Anthropic a été écrit par Claude. Avant la sortie de Claude Code, ce chiffre n'était que d'un seul chiffre.

Au deuxième trimestre 2026, selon les statistiques d'Anthropic, la quantité de code fusionnée quotidiennement par les ingénieurs était déjà environ 8 fois supérieure à celle de 2024.

Plus notable que la quantité de code, c'est que Claude s'attaque à des problèmes d'ingénierie plus ouverts.

Anthropic déclare dans l'article qu'au cours de l'année écoulée, la fréquence à laquelle les employés corrigent Claude, le remettent sur la bonne voie ou reprennent une tâche en cours a constamment diminué. Ce changement ne se produit pas seulement sur des tâches simples, mais aussi sur les tâches ouvertes les plus complexes.

Les tâches ouvertes sont des problèmes sans manuel d'instructions clair. Par exemple, un système plante, une tâche d'entraînement échoue, l'ingénieur ne sait pas non plus au début à quoi ressemble la solution et doit enquêter et juger en même temps.

Ce type de tâche dépendait le plus de l'expérience humaine, et dans ces tâches les plus ouvertes, le taux de réussite de Claude a atteint 76 % en mai 2026, une augmentation de 50 points de pourcentage en six mois.

Non seulement il écrit du code, mais Anthropic utilise également Claude pour la revue de code, vérifiant les bugs, les failles de sécurité et autres défauts. Leur analyse rétrospective révèle que si chaque modification de code avait été automatiquement examinée par Claude par le passé, environ un tiers des bugs ayant entraîné des incidents en ligne sur claude.ai auraient pu être bloqués avant leur mise en production.

Allant plus loin, Claude a commencé à participer au processus de recherche.

Anthropic a un test fixe : donner à Claude un code pour entraîner un petit modèle, et lui demander de trouver un moyen d'exécuter le code plus rapidement sans altérer les résultats. En mai 2025, Claude Opus 4 pouvait obtenir une accélération d'environ 3x ; en avril 2026, Claude Mythos Preview a poussé ce chiffre à environ 52x.

Anthropic mentionne également un cas de recherche ouverte en sécurité de l'IA. Ils ont confié un problème à un agent piloté par Claude : un modèle plus faible peut-il superviser de manière fiable un modèle plus fort ?

Ce processus nécessite de formuler des hypothèses, de les tester, de partager les découvertes avec des agents parallèles et d'itérer.

Deux chercheurs humains ont passé une semaine à combler environ 23 % de l'écart ; tandis que Claude, avec environ 800 heures cumulées et une consommation de calcul d'environ 18 000 dollars, en a comblé 97 %.

Ce résultat a bien sûr ses limites : le problème a été choisi par des humains, les critères d'évaluation ont été définis par des humains, et le résultat n'a pas été entièrement transféré à des modèles à l'échelle de production. Mais il montre tout de même que Claude peut déjà, dans un cadre de recherche défini par l'homme, concevoir ses propres expériences, les exécuter et itérer lui-même.

De plus, lorsque les chercheurs humains "prennent une mauvaise direction", Claude peut également suggérer de meilleures prochaines étapes.

Anthropic a sélectionné 129 sessions de recherche internes de Claude Code, où des chercheurs humains et Claude résolvaient ensemble des problèmes de recherche ouverts. Anthropic a identifié certains nœuds où "les humains se sont par la suite avérés avoir pris des détours", puis a donné le contexte précédant ce nœud à différentes versions de Claude pour voir ce qu'elle suggérerait comme prochaine étape. Ensuite, un autre "Claude judge", connaissant l'issue complète de la session, a évalué : la suggestion du modèle ou le choix humain à l'époque, lequel était meilleur.

Les résultats montrent que, sur ces nœuds où les chercheurs humains se sont par la suite avérés avoir une marge d'amélioration, Claude est de plus en plus capable de proposer de meilleures prochaines étapes.

Par le passé, les progrès des modèles d'IA dépendaient principalement des chercheurs et ingénieurs humains. Les humains décidaient des expériences à mener, écrivaient le code, entraînaient les modèles et faisaient évoluer les fonctionnalités de l'IA.

Désormais, de plus en plus de maillons de cette chaîne sont repris par Claude.

Anthropic présente un tableau de phase très intuitif :

De 2021 à 2023, Anthropic ne différait pas d'une entreprise technologique ordinaire, les humains écrivaient du code et de la documentation sur leurs ordinateurs portables.

De 2023 à 2025, les chatbots ont commencé à entrer dans le flux de travail. Les ingénieurs demandaient au modèle de générer des fragments de code, puis les copiaient dans l'éditeur.

De 2025 à 2026, des agents de programmation sont apparus, Claude a commencé à pouvoir écrire et modifier du code de manière autonome, réalisant parfois même des fichiers entiers de manière indépendante.

Aujourd'hui, les agents peuvent déjà exécuter du code par eux-mêmes, et déléguer des tâches de plusieurs heures à d'autres agents.

Ensuite vient la phase qui préoccupe vraiment Anthropic : la boucle fermée (closed loop).

Si ce jour arrive, les versions successives de Claude pourraient être continuellement améliorées par Claude lui-même — c'est cela, l'auto-amélioration récursive.

Anthropic est très prudent dans son article : nous n'en sommes pas encore là, et l'auto-amélioration récursive n'est pas inévitable. Mais il souligne néanmoins que le chemin vers cette étape commence à devenir visible.

C'est pourquoi Anthropic parle de ralentissement, voire de pause, à la fin de l'article. Il ne s'agit pas que toutes les entreprises d'IA cessent immédiatement leurs activités, mais plutôt que si les risques d'auto-amélioration de l'IA continuent d'augmenter à l'avenir, les laboratoires de pointe auront besoin d'un mécanisme de ralentissement coordonné et vérifiable.

En d'autres termes, la "singularité" approche, et l'humanité doit la contrôler.

Claude, irrésistible

Si l'on ne regarde que la surface, il s'agit d'un document de sécurité très prospectif. Anthropic parle d'auto-amélioration récursive, du fait que l'IA pourrait s'améliorer elle-même de plus en plus vite, et du besoin pour la société humaine de se préparer à des mécanismes de ralentissement et de pause.

Mais placé à l'époque où Anthropic se prépare à son IPO, cet article prend une autre signification.

D'une certaine manière, les récentes actions d'Anthropic ressemblent à celles d'un excellent élève un peu prétentieux — il a vraiment des capacités, mais il fait aussi le malin.

Ce qu'il veut dire, ce n'est pas seulement "nous avons un Claude très puissant", mais un pas plus loin : il veut dire "Claude nous aide à fabriquer un Claude encore plus puissant".

Si Anthropic se contentait de vendre un modèle ou un outil, il lui serait difficile d'échapper complètement aux comparaisons horizontales : Anthropic a Claude, OpenAI a GPT ; Anthropic a Claude Code, OpenAI a Codex ; Anthropic courtise les clients entreprises, OpenAI aussi. La concurrence entre les deux entreprises est très serrée, tout dépend de qui peut raconter la plus grande histoire au marché.

Il est à noter qu'il y a seulement 3 jours, OpenAI écrivait dans un document sur la gouvernance de l'IA de pointe :

« Nous voyons également des signes précoces d'auto-amélioration récursive dans les systèmes actuels : le développement de l'IA lui-même est accéléré par l'IA.

Cela intensifiera la pression concurrentielle entre développeurs et nations, et posera des défis de gouvernance que les institutions existantes ne pourront relever. »

Trois jours plus tard, Anthropic déclare : le chemin de Claude vers l'auto-amélioration récursive commence à devenir visible.

Si Claude se développe vraiment comme il l'espère, ce n'est plus une simple narration produit, cela deviendra une roue de développement (flywheel).

Claude écrit du code, exécute des expériences, optimise les flux d'entraînement, réduit en retour les incidents dans ses propres produits... Une fois que ce système tourne, Claude n'est plus seulement un produit d'Anthropic, mais aussi un outil de production important pour Anthropic.

Les utilisateurs voient le produit Claude, les clients entreprises achètent les capacités de Claude, mais ce qu'Anthropic veut vraiment que le marché financier remarque, c'est que Claude est déjà intégré au processus sous-jacent de développement des modèles de pointe, il a été placé dans la salle des machines d'Anthropic.

Les marchés financiers adorent les histoires de roues, comme des cornes d'abondance générant des richesses sans fin : un Claude plus puissant permet aux ingénieurs d'Anthropic de fusionner plus de code, plus de code accélère l'itération des produits et de l'infrastructure, une itération plus rapide permet aux chercheurs d'exécuter plus d'expériences, plus d'expériences aident à leur tour la prochaine génération de Claude à devenir plus puissante. Une fois la prochaine génération de Claude plus puissante, elle continue d'accélérer la R&D d'Anthropic.

La vitesse d'itération de Claude soutient également cette roue. En se basant sur les dates de publication, de 2023 à début 2025, les mises à jour majeures des modèles Claude se faisaient principalement tous les trois ou quatre mois. Mais après l'arrivée de Claude 4, les mises à jour des modèles d'Anthropic sont clairement devenues plus rapprochées.

Claude 4 est sorti en mai 2025, Opus 4.1 en août, Sonnet 4.5 en septembre, Haiku 4.5 en octobre, Opus 4.5 en novembre.

En 2026, Opus 4.6 est sorti le 5 février, Sonnet 4.6 le 17 février, Opus 4.7 le 15 avril, Opus 4.8 le 28 mai. Il n'y a que 42 jours entre Opus 4.7 et Opus 4.8.

Anthropic, en surface, dit "cela pourrait être dangereux, nous devons préparer les freins à l'avance", mais il suggère également : "nous avons vu ce qui se passe lorsque l'accélérateur est enfoncé".

C'est là toute la subtilité de la narration pour l'IPO. D'un côté, il présente les risques comme très sérieux, de l'autre, il rehausse aussi sa position technologique.

Toutes les entreprises d'IA n'ont pas le droit de parler d'auto-amélioration récursive, vous devez d'abord convaincre le monde extérieur que votre IA est déjà intégrée dans le processus de développement de l'IA, avant d'avoir le droit de dire que cela pourrait nécessiter une coordination mondiale.

OpenAI : Comment peut-on faire ça ?

Comme mentionné précédemment, juste avant qu'Anthropic ne publie cet article, OpenAI venait de placer l'auto-amélioration récursive sur la table.

Mais les approches des deux entreprises sont très différentes.

Le document d'OpenAI "Democratic Governance of Frontier AI" est un plan politique adressé à Washington. Il ne s'intéresse pas à "comment le modèle devient plus fort", mais à la manière de contraindre l'IA de pointe si elle continue de progresser à toute vitesse.

La plupart du contenu de ce rapport ne convient pas pour être détaillé ici, une seule phrase est clé : OpenAI déclare que des signes précoces d'auto-amélioration récursive sont déjà visibles dans les systèmes actuels.

Cette phrase et cet article d'Anthropic pointent en fait dans la même direction.

Sauf qu'OpenAI parle de systèmes institutionnels, et Anthropic parle de lui-même.

OpenAI veut dire : l'IA progresse trop vite, les structures de gouvernance existantes pourraient ne pas suivre, donc un nouvel ensemble de règles est nécessaire.

Tandis qu'Anthropic expose directement ce système, disant au marché : Claude est déjà dans notre processus de R&D, donc nous voyons la voie de l'auto-accélération de l'IA.

C'est un coup très habile, on a l'impression qu'OpenAI commence sûrement à ronchonner en interne — c'est du plagiat d'idées ! C'est nous qui sommes arrivés les premiers !

Je plaisante, mais OpenAI doit vraiment redoubler d'efforts, et vite sortir GPT 5.6.

Пов'язані питання

QQuelle est la principale préoccupation d'Anthropic concernant l'IA selon l'article ?

AL'inquiétude principale d'Anthropic concerne le potentiel d'auto-amélioration récursive de l'IA, où l'IA pourrait elle-même concevoir et améliorer ses versions successives, ce qui pourrait accélérer ses progrès au-delà du contrôle humain.

QQuels exemples concrets l'article donne-t-il pour illustrer la participation de Claude au développement de l'IA chez Anthropic ?

AL'article cite plusieurs exemples : plus de 80% du code intégré par Anthropic est écrit par Claude ; le taux de réussite de Claude sur les tâches de recherche ouvertes est passé à 76% ; Claude a contribué à une accélération 52 fois plus rapide d'un code de formation de modèle ; et un agent piloté par Claude a obtenu de meilleurs résultats de recherche en matière de sécurité que des chercheurs humains.

QQuelle différence l'article souligne-t-il entre la communication d'Anthropic et celle d'OpenAI sur le sujet de l'auto-amélioration récursive ?

AL'article souligne qu'OpenAI aborde le sujet sous l'angle de la gouvernance et des politiques, en appelant à de nouvelles règles. Anthropic, quant à lui, présente des données internes détaillées pour démontrer que Claude est déjà profondément intégré dans son propre processus de R&D, montrant ainsi le chemin vers cette auto-amélioration et positionnant cela dans le contexte de son prochain IPO.

QComment l'article interprète-t-il le timing de la publication d'Anthropic par rapport à son projet d'IPO ?

AL'article suggère que le timing de la publication, proche de l'IPO prévue d'Anthropic, sert également une narration stratégique. En évoquant les risques de l'auto-amélioration récursive, Anthropic positionne implicitement sa technologie (Claude) comme étant si avancée qu'elle touche à ces questions critiques, ce qui pourrait valoriser son potentiel et son avantage concurrentiel auprès des investisseurs.

QQue signifie le terme 'boucle fermée' (closed loop) utilisé par Anthropic dans l'article ?

ADans le contexte de l'article, une 'boucle fermée' désigne le stade ultime où les futures versions de Claude pourraient être continuellement améliorées par Claude lui-même, sans intervention humaine significative, réalisant ainsi une 'auto-amélioration récursive' complète.

Пов'язані матеріали

Uncovering the Truth About Agent Commerce, Payments, and Infrastructure

Decoding Agent Commerce, Payments, and Infrastructure: The Reality Over the past year, I've been building infrastructure for the Agent economy, engaging with major players like Stripe, Visa, Coinbase, Google, and dozens of startups. A clear conclusion emerges: true, large-scale demand does not yet exist. Startups face structural challenges. Data points illustrate this gap. Stripe's Agent commerce platform has over 1,000 merchants but only single-digit transacting agents. Visa's Agent payment token requires 9-month KYC and a $250M revenue threshold, accessible only to giants like Amazon. On-chain analysis reveals actual daily Agent transaction volume is around $17k, half of which are test transactions. The article analyzes four potential markets: **1. Agent-to-Merchant (A2M):** Current AI shopping UX is often inferior to traditional e-commerce for visual, comparison-heavy purchases (clothing, electronics). Chat interfaces are a step back. Real merchant interest is defensive "Agent Engine Optimization," fearing future obsolescence, not current demand. Potential exists in high-frequency, low-decision purchases (e.g., food delivery) or simplifying terrible UX (complex checkouts, non-native shoppers), but these require massive consumer distribution channels dominated by giants like DoorDash and Amazon. **2. Agent-to-API (A2A):** Developers already have subscriptions and billing for core APIs (compute, data). The argument for micro-payments via crypto for sub-dollar API calls is addressed by pre-paid balances today. The deeper issue is supplier resistance; major SaaS firms rely on enterprise contracts, not fractional cent pricing. Opportunity lies in the long tail of niche services, but this is a smaller market catering to developers, a historically low-paying group. **3. Agent-to-Agent (A2A):** This remains a theoretical long-term vision with near-zero current transaction volume. It involves unique challenges: discovery, trust, negotiation, dispute resolution. When it materializes, it will require a fundamentally new settlement infrastructure for high-speed, variable-value, multi-party transactions. It's a real long-term bet, but not the current market. **4. Agent-to-Finance (A2F):** This is the only category with existing, paying demand. Integrating AI into financial workflows (trading, portfolio management) is a natural evolution and enables new capabilities like autonomous rebalancing. However, competition favors incumbents with regulatory licenses, compliance infrastructure, and existing client relationships. **The Real Issue:** Why is infrastructure still being built? Incumbents can afford long-term bets, and payment companies see every problem as a nail for their payment hammer. However, payment is just one piece. The core challenge is *coordination*—orchestrating work between Agents and humans, verifying outcomes, and settling results. Payment is part of settlement, which is part of coordination. Companies that solve the coordination problem will subsume payments, not the other way around. Startups lack the infinite runway of giants and must find today's real market, which, after a year of exploration, lies outside these four categories—in an area with real, growing, and underserved activity.

marsbit1 год тому

Uncovering the Truth About Agent Commerce, Payments, and Infrastructure

marsbit1 год тому

Kalshi, MTS, and a16z's Ambition

The article "Kalshi, MTS, and a16z's Ambition" explores prediction markets as a focal point of excitement in 2025 for investors, crypto enthusiasts, and media. It traces their intellectual lineage from Friedrich Hayek's ideas on dispersed knowledge and market coordination to Robin Hanson's Logarithmic Market Scoring Rule (LMSR), which incentivizes truthful information sharing. The piece argues that a16z's significant investment in prediction market platform Kalshi (valued at $220B) transcends mere financial speculation. a16z frames prediction markets as a new form of "media" that provides "presence"—a way for individuals to actively engage with and influence world events through financial stakes, countering postmodern detachment. By wagering on outcomes, users become "super observers," and the market's aggregated probabilities gain authoritative power to define event truth and importance. The article uses media company MTS ("Monitoring The Situation") as a case study of a16z's "new media" strategy: rapidly producing high-intensity, multi-format content to "take over the timeline." However, prediction markets like Kalshi are presented as the ultimate piece in this media empire. Their real-money, crowd-sourced probabilities possess a unique "reality distortion field" and perceived objectivity, potentially swaying public opinion and granting a private company unprecedented interpretive power over reality. Ultimately, Kalshi's immense valuation is attributed not just to its exchange model, but to its role as a foundational component in a16z's envisioned new media landscape, where prediction markets define narrative and truth.

链捕手1 год тому

Kalshi, MTS, and a16z's Ambition

链捕手1 год тому

Торгівля

Спот
Ф'ючерси

Популярні статті

Як купити NIGHT

Ласкаво просимо до HTX.com! Ми зробили покупку Midnight (NIGHT) простою та зручною. Дотримуйтесь нашої покрокової інструкції, щоб розпочати свою криптовалютну подорож.Крок 1: Створіть обліковий запис на HTXВикористовуйте свою електронну пошту або номер телефону, щоб зареєструвати обліковий запис на HTX безплатно. Пройдіть безпроблемну реєстрацію й отримайте доступ до всіх функцій.ЗареєструватисьКрок 2: Перейдіть до розділу Купити крипту і виберіть спосіб оплатиКредитна/дебетова картка: використовуйте вашу картку Visa або Mastercard, щоб миттєво купити Midnight (NIGHT).Баланс: використовуйте кошти з балансу вашого рахунку HTX для безперешкодної торгівлі.Треті особи: ми додали популярні способи оплати, такі як Google Pay та Apple Pay, щоб підвищити зручність.P2P: Торгуйте безпосередньо з іншими користувачами на HTX.Позабіржова торгівля (OTC): ми пропонуємо індивідуальні послуги та конкурентні обмінні курси для трейдерів.Крок 3: Зберігайте свої Midnight (NIGHT)Після придбання Midnight (NIGHT) збережіть його у своєму обліковому записі на HTX. Крім того, ви можете відправити його в інше місце за допомогою блокчейн-переказу або використовувати його для торгівлі іншими криптовалютами.Крок 4: Торгівля Midnight (NIGHT)Легко торгуйте Midnight (NIGHT) на спотовому ринку HTX. Просто увійдіть до свого облікового запису, виберіть торгову пару, укладайте угоди та спостерігайте за ними в режимі реального часу. Ми пропонуємо зручний досвід як для початківців, так і для досвідчених трейдерів.

1.2k переглядів усьогоОпубліковано 2025.12.08Оновлено 2026.06.02

Як купити NIGHT

Обговорення

Ласкаво просимо до спільноти HTX. Тут ви можете бути в курсі останніх подій розвитку платформи та отримати доступ до професійної ринкової інформації. Нижче представлені думки користувачів щодо ціни NIGHT (NIGHT).

活动图片