Anthropic annonce l'arrivée de l'AGI, pour l'humanité ou pour l'introduction en bourse ?

marsbit發佈於 2026-06-05更新於 2026-06-05

文章摘要

Anthropic publie un article intitulé "When AI builds itself", évoquant le concept de l'auto-amélioration récursive : la capacité d'une IA à participer activement à la conception, à la formation et à l'optimisation de ses propres versions futures. La société souligne que plus de 80% du code intégré dans ses dépôts est désormais écrit par Claude, et que l'IA gère de mieux en mieux des tâches de recherche et d'ingénierie complexes, avec un taux de réussite de 76% sur les problèmes ouverts. Anthropic met en garde contre les risques potentiels d'une accélération incontrôlée, appelant à une réflexion mondiale sur des mécanismes de ralentissement ou de pause du développement de l'IA frontalière pour permettre à la sécurité et à la gouvernance de suivre. Cependant, le timing de cette publication, alors qu'Anthropic se prépare à son introduction en bourse (IPO), laisse également voir une stratégie de communication : démontrer que Claude n'est pas seulement un produit, mais un moteur intégré au processus de R&D de l'entreprise, créant ainsi un "cercle vertueux" (flywheel) pour une innovation plus rapide. Cette position contraste avec l'approche d'OpenAI, qui a récemment abordé le même thème sous l'angle de la gouvernance politique plutôt que de la démonstration technique.

Article | Lettres IA

Anthropic a publié hier soir un long article intitulé "When AI builds itself" (Quand l'IA se construit elle-même), qui ressemble au titre d'un roman de science-fiction d'Asimov. Le sujet est effectivement un concept très science-fictionnel : l'auto-amélioration récursive (recursive self-improvement).

Pour faire simple, par le passé, les chercheurs humains écrivaient le code, faisaient tourner les expériences, entraînaient les modèles, puis rendaient l'IA plus puissante. Mais si l'IA elle-même commence à participer à la conception, l'entraînement, les tests et l'optimisation de ses versions successives, alors la vitesse de progrès de l'IA ne sera plus uniquement pilotée par les humains, elle pourrait commencer à "s'auto-évoluer".

À cet égard, Anthropic lance un appel :

« Nous pensons que le monde tirerait grand bénéfice de pouvoir choisir de ralentir ou de suspendre temporairement le développement de l'IA de pointe, afin de laisser les structures sociales et la recherche sur l'alignement rattraper le progrès technologique. »

Cette phrase ressemble à un avertissement de sécurité, mais placée à l'époque où Anthropic se prépare à son introduction en bourse (IPO), elle peut difficilement ne pas être perçue comme un autre pré-narratif : Claude est tellement efficace qu'il commence même à créer lui-même la prochaine génération de Claude.

Une nouvelle tempête est apparue

Pour illustrer le fait que l'IA participe de plus en plus à la R&D de l'IA elle-même, Anthropic présente de nombreuses données internes.

Par exemple, jusqu'en mai 2026, plus de 80 % du code fusionné dans le référentiel d'Anthropic a été écrit par Claude. Avant la sortie de Claude Code, ce chiffre n'était que d'un seul chiffre.

Au deuxième trimestre 2026, selon les statistiques d'Anthropic, la quantité de code fusionnée quotidiennement par les ingénieurs était déjà environ 8 fois supérieure à celle de 2024.

Plus notable que la quantité de code, c'est que Claude s'attaque à des problèmes d'ingénierie plus ouverts.

Anthropic déclare dans l'article qu'au cours de l'année écoulée, la fréquence à laquelle les employés corrigent Claude, le remettent sur la bonne voie ou reprennent une tâche en cours a constamment diminué. Ce changement ne se produit pas seulement sur des tâches simples, mais aussi sur les tâches ouvertes les plus complexes.

Les tâches ouvertes sont des problèmes sans manuel d'instructions clair. Par exemple, un système plante, une tâche d'entraînement échoue, l'ingénieur ne sait pas non plus au début à quoi ressemble la solution et doit enquêter et juger en même temps.

Ce type de tâche dépendait le plus de l'expérience humaine, et dans ces tâches les plus ouvertes, le taux de réussite de Claude a atteint 76 % en mai 2026, une augmentation de 50 points de pourcentage en six mois.

Non seulement il écrit du code, mais Anthropic utilise également Claude pour la revue de code, vérifiant les bugs, les failles de sécurité et autres défauts. Leur analyse rétrospective révèle que si chaque modification de code avait été automatiquement examinée par Claude par le passé, environ un tiers des bugs ayant entraîné des incidents en ligne sur claude.ai auraient pu être bloqués avant leur mise en production.

Allant plus loin, Claude a commencé à participer au processus de recherche.

Anthropic a un test fixe : donner à Claude un code pour entraîner un petit modèle, et lui demander de trouver un moyen d'exécuter le code plus rapidement sans altérer les résultats. En mai 2025, Claude Opus 4 pouvait obtenir une accélération d'environ 3x ; en avril 2026, Claude Mythos Preview a poussé ce chiffre à environ 52x.

Anthropic mentionne également un cas de recherche ouverte en sécurité de l'IA. Ils ont confié un problème à un agent piloté par Claude : un modèle plus faible peut-il superviser de manière fiable un modèle plus fort ?

Ce processus nécessite de formuler des hypothèses, de les tester, de partager les découvertes avec des agents parallèles et d'itérer.

Deux chercheurs humains ont passé une semaine à combler environ 23 % de l'écart ; tandis que Claude, avec environ 800 heures cumulées et une consommation de calcul d'environ 18 000 dollars, en a comblé 97 %.

Ce résultat a bien sûr ses limites : le problème a été choisi par des humains, les critères d'évaluation ont été définis par des humains, et le résultat n'a pas été entièrement transféré à des modèles à l'échelle de production. Mais il montre tout de même que Claude peut déjà, dans un cadre de recherche défini par l'homme, concevoir ses propres expériences, les exécuter et itérer lui-même.

De plus, lorsque les chercheurs humains "prennent une mauvaise direction", Claude peut également suggérer de meilleures prochaines étapes.

Anthropic a sélectionné 129 sessions de recherche internes de Claude Code, où des chercheurs humains et Claude résolvaient ensemble des problèmes de recherche ouverts. Anthropic a identifié certains nœuds où "les humains se sont par la suite avérés avoir pris des détours", puis a donné le contexte précédant ce nœud à différentes versions de Claude pour voir ce qu'elle suggérerait comme prochaine étape. Ensuite, un autre "Claude judge", connaissant l'issue complète de la session, a évalué : la suggestion du modèle ou le choix humain à l'époque, lequel était meilleur.

Les résultats montrent que, sur ces nœuds où les chercheurs humains se sont par la suite avérés avoir une marge d'amélioration, Claude est de plus en plus capable de proposer de meilleures prochaines étapes.

Par le passé, les progrès des modèles d'IA dépendaient principalement des chercheurs et ingénieurs humains. Les humains décidaient des expériences à mener, écrivaient le code, entraînaient les modèles et faisaient évoluer les fonctionnalités de l'IA.

Désormais, de plus en plus de maillons de cette chaîne sont repris par Claude.

Anthropic présente un tableau de phase très intuitif :

De 2021 à 2023, Anthropic ne différait pas d'une entreprise technologique ordinaire, les humains écrivaient du code et de la documentation sur leurs ordinateurs portables.

De 2023 à 2025, les chatbots ont commencé à entrer dans le flux de travail. Les ingénieurs demandaient au modèle de générer des fragments de code, puis les copiaient dans l'éditeur.

De 2025 à 2026, des agents de programmation sont apparus, Claude a commencé à pouvoir écrire et modifier du code de manière autonome, réalisant parfois même des fichiers entiers de manière indépendante.

Aujourd'hui, les agents peuvent déjà exécuter du code par eux-mêmes, et déléguer des tâches de plusieurs heures à d'autres agents.

Ensuite vient la phase qui préoccupe vraiment Anthropic : la boucle fermée (closed loop).

Si ce jour arrive, les versions successives de Claude pourraient être continuellement améliorées par Claude lui-même — c'est cela, l'auto-amélioration récursive.

Anthropic est très prudent dans son article : nous n'en sommes pas encore là, et l'auto-amélioration récursive n'est pas inévitable. Mais il souligne néanmoins que le chemin vers cette étape commence à devenir visible.

C'est pourquoi Anthropic parle de ralentissement, voire de pause, à la fin de l'article. Il ne s'agit pas que toutes les entreprises d'IA cessent immédiatement leurs activités, mais plutôt que si les risques d'auto-amélioration de l'IA continuent d'augmenter à l'avenir, les laboratoires de pointe auront besoin d'un mécanisme de ralentissement coordonné et vérifiable.

En d'autres termes, la "singularité" approche, et l'humanité doit la contrôler.

Claude, irrésistible

Si l'on ne regarde que la surface, il s'agit d'un document de sécurité très prospectif. Anthropic parle d'auto-amélioration récursive, du fait que l'IA pourrait s'améliorer elle-même de plus en plus vite, et du besoin pour la société humaine de se préparer à des mécanismes de ralentissement et de pause.

Mais placé à l'époque où Anthropic se prépare à son IPO, cet article prend une autre signification.

D'une certaine manière, les récentes actions d'Anthropic ressemblent à celles d'un excellent élève un peu prétentieux — il a vraiment des capacités, mais il fait aussi le malin.

Ce qu'il veut dire, ce n'est pas seulement "nous avons un Claude très puissant", mais un pas plus loin : il veut dire "Claude nous aide à fabriquer un Claude encore plus puissant".

Si Anthropic se contentait de vendre un modèle ou un outil, il lui serait difficile d'échapper complètement aux comparaisons horizontales : Anthropic a Claude, OpenAI a GPT ; Anthropic a Claude Code, OpenAI a Codex ; Anthropic courtise les clients entreprises, OpenAI aussi. La concurrence entre les deux entreprises est très serrée, tout dépend de qui peut raconter la plus grande histoire au marché.

Il est à noter qu'il y a seulement 3 jours, OpenAI écrivait dans un document sur la gouvernance de l'IA de pointe :

« Nous voyons également des signes précoces d'auto-amélioration récursive dans les systèmes actuels : le développement de l'IA lui-même est accéléré par l'IA.

Cela intensifiera la pression concurrentielle entre développeurs et nations, et posera des défis de gouvernance que les institutions existantes ne pourront relever. »

Trois jours plus tard, Anthropic déclare : le chemin de Claude vers l'auto-amélioration récursive commence à devenir visible.

Si Claude se développe vraiment comme il l'espère, ce n'est plus une simple narration produit, cela deviendra une roue de développement (flywheel).

Claude écrit du code, exécute des expériences, optimise les flux d'entraînement, réduit en retour les incidents dans ses propres produits... Une fois que ce système tourne, Claude n'est plus seulement un produit d'Anthropic, mais aussi un outil de production important pour Anthropic.

Les utilisateurs voient le produit Claude, les clients entreprises achètent les capacités de Claude, mais ce qu'Anthropic veut vraiment que le marché financier remarque, c'est que Claude est déjà intégré au processus sous-jacent de développement des modèles de pointe, il a été placé dans la salle des machines d'Anthropic.

Les marchés financiers adorent les histoires de roues, comme des cornes d'abondance générant des richesses sans fin : un Claude plus puissant permet aux ingénieurs d'Anthropic de fusionner plus de code, plus de code accélère l'itération des produits et de l'infrastructure, une itération plus rapide permet aux chercheurs d'exécuter plus d'expériences, plus d'expériences aident à leur tour la prochaine génération de Claude à devenir plus puissante. Une fois la prochaine génération de Claude plus puissante, elle continue d'accélérer la R&D d'Anthropic.

La vitesse d'itération de Claude soutient également cette roue. En se basant sur les dates de publication, de 2023 à début 2025, les mises à jour majeures des modèles Claude se faisaient principalement tous les trois ou quatre mois. Mais après l'arrivée de Claude 4, les mises à jour des modèles d'Anthropic sont clairement devenues plus rapprochées.

Claude 4 est sorti en mai 2025, Opus 4.1 en août, Sonnet 4.5 en septembre, Haiku 4.5 en octobre, Opus 4.5 en novembre.

En 2026, Opus 4.6 est sorti le 5 février, Sonnet 4.6 le 17 février, Opus 4.7 le 15 avril, Opus 4.8 le 28 mai. Il n'y a que 42 jours entre Opus 4.7 et Opus 4.8.

Anthropic, en surface, dit "cela pourrait être dangereux, nous devons préparer les freins à l'avance", mais il suggère également : "nous avons vu ce qui se passe lorsque l'accélérateur est enfoncé".

C'est là toute la subtilité de la narration pour l'IPO. D'un côté, il présente les risques comme très sérieux, de l'autre, il rehausse aussi sa position technologique.

Toutes les entreprises d'IA n'ont pas le droit de parler d'auto-amélioration récursive, vous devez d'abord convaincre le monde extérieur que votre IA est déjà intégrée dans le processus de développement de l'IA, avant d'avoir le droit de dire que cela pourrait nécessiter une coordination mondiale.

OpenAI : Comment peut-on faire ça ?

Comme mentionné précédemment, juste avant qu'Anthropic ne publie cet article, OpenAI venait de placer l'auto-amélioration récursive sur la table.

Mais les approches des deux entreprises sont très différentes.

Le document d'OpenAI "Democratic Governance of Frontier AI" est un plan politique adressé à Washington. Il ne s'intéresse pas à "comment le modèle devient plus fort", mais à la manière de contraindre l'IA de pointe si elle continue de progresser à toute vitesse.

La plupart du contenu de ce rapport ne convient pas pour être détaillé ici, une seule phrase est clé : OpenAI déclare que des signes précoces d'auto-amélioration récursive sont déjà visibles dans les systèmes actuels.

Cette phrase et cet article d'Anthropic pointent en fait dans la même direction.

Sauf qu'OpenAI parle de systèmes institutionnels, et Anthropic parle de lui-même.

OpenAI veut dire : l'IA progresse trop vite, les structures de gouvernance existantes pourraient ne pas suivre, donc un nouvel ensemble de règles est nécessaire.

Tandis qu'Anthropic expose directement ce système, disant au marché : Claude est déjà dans notre processus de R&D, donc nous voyons la voie de l'auto-accélération de l'IA.

C'est un coup très habile, on a l'impression qu'OpenAI commence sûrement à ronchonner en interne — c'est du plagiat d'idées ! C'est nous qui sommes arrivés les premiers !

Je plaisante, mais OpenAI doit vraiment redoubler d'efforts, et vite sortir GPT 5.6.

相關問答

QQuelle est la principale préoccupation d'Anthropic concernant l'IA selon l'article ?

AL'inquiétude principale d'Anthropic concerne le potentiel d'auto-amélioration récursive de l'IA, où l'IA pourrait elle-même concevoir et améliorer ses versions successives, ce qui pourrait accélérer ses progrès au-delà du contrôle humain.

QQuels exemples concrets l'article donne-t-il pour illustrer la participation de Claude au développement de l'IA chez Anthropic ?

AL'article cite plusieurs exemples : plus de 80% du code intégré par Anthropic est écrit par Claude ; le taux de réussite de Claude sur les tâches de recherche ouvertes est passé à 76% ; Claude a contribué à une accélération 52 fois plus rapide d'un code de formation de modèle ; et un agent piloté par Claude a obtenu de meilleurs résultats de recherche en matière de sécurité que des chercheurs humains.

QQuelle différence l'article souligne-t-il entre la communication d'Anthropic et celle d'OpenAI sur le sujet de l'auto-amélioration récursive ?

AL'article souligne qu'OpenAI aborde le sujet sous l'angle de la gouvernance et des politiques, en appelant à de nouvelles règles. Anthropic, quant à lui, présente des données internes détaillées pour démontrer que Claude est déjà profondément intégré dans son propre processus de R&D, montrant ainsi le chemin vers cette auto-amélioration et positionnant cela dans le contexte de son prochain IPO.

QComment l'article interprète-t-il le timing de la publication d'Anthropic par rapport à son projet d'IPO ?

AL'article suggère que le timing de la publication, proche de l'IPO prévue d'Anthropic, sert également une narration stratégique. En évoquant les risques de l'auto-amélioration récursive, Anthropic positionne implicitement sa technologie (Claude) comme étant si avancée qu'elle touche à ces questions critiques, ce qui pourrait valoriser son potentiel et son avantage concurrentiel auprès des investisseurs.

QQue signifie le terme 'boucle fermée' (closed loop) utilisé par Anthropic dans l'article ?

ADans le contexte de l'article, une 'boucle fermée' désigne le stade ultime où les futures versions de Claude pourraient être continuellement améliorées par Claude lui-même, sans intervention humaine significative, réalisant ainsi une 'auto-amélioration récursive' complète.

你可能也喜歡

解读Agent商业、支付与基础设施的真相

作者基于一年来为Agent经济构建基础设施的经验,指出当前Agent商业尚未形成真实、规模化的市场需求,初创公司面临结构性挑战。 文章分析了四个关键场景: 1. **Agent对商户**:目前电商体验中,聊天界面在视觉比价购物上逊于传统界面,商户接入多出于防御性“优化”心态。对话式商业在如外卖等高頻、低决策场景有潜力,但受限于平台开放性和成本。 2. **Agent对API**:开发者现有支付方式(如预付)已能处理低频、小额的API调用成本问题。真正的机会在于服务长尾、小众的供应商市场,但规模有限。 3. **Agent对Agent**:这是长期的愿景,涉及机器间的自动交易与结算,需求真实但当前市场几乎为零,需要专用的基础设施。 4. **Agent对金融**:这是唯一存在现成需求和付费客户的领域。将AI嵌入金融工作流是自然演进,但竞争激烈,老牌机构优势明显。 文章认为,行业巨头因资金充足和战略防御而持续投入,但对初创公司而言,真正的机会并非单纯构建支付层。支付只是更宏大问题——**Agent与人类的协同工作、验证与结算**——的一部分。未来,解决协同问题的公司将主导市场,而非支付服务商。作者团队已转向一个存在真实需求、快速增长且未被充分服务的领域。

marsbit1 小時前

解读Agent商业、支付与基础设施的真相

marsbit1 小時前

Kalshi、MTS 与 a16z 的野望

本文探讨了预测市场在2025年成为投资、加密和媒体领域共同关注焦点的现象,并着重分析了其精神内核的演变及其与风投机构a16z所倡导的“新媒体”愿景的契合。 文章首先回顾了预测市场的思想渊源:从哈耶克关于市场作为分散知识协调机制的观点,到罗宾·汉森设计对数市场评分规则(LMSR)以激励信息真实披露,乃至衍生出的“未来统治”(Futarchy)治理乌托邦构想。 然而,作者指出,a16z在2024-2025年投资估值飙升的预测市场平台Kalshi,为此领域注入了新的精神内涵——“在场感”。在人们与现实世界日益疏离的后现代语境下,预测市场提供了一种通过真金白银下注来介入和“预测”未来的方式,使用户从被动观察者转变为主动的“超级观察者”,从而对抗不确定性与无力感。当足够多人使用并依赖这种媒介时,市场本身将对事件的真实性与重要性获得解释权,这正是a16z构建新媒体帝国的关键拼图。 最后,文章以媒体公司MTS为例,说明a16z的“新媒体”是一种全频段、高烈度的信息工程,旨在“接管时间线”。而Kalshi的核心价值在于,它通过真实的交易数据构建了一种强大的“现实扭曲力场”,其显示的市场概率能深刻影响公众认知与判断,这种赋予私营公司的社会影响力是其获得高估值的根本原因。

链捕手1 小時前

Kalshi、MTS 与 a16z 的野望

链捕手1 小時前

交易

現貨
合約

熱門文章

如何購買NIGHT

歡迎來到HTX.com!在這裡,購買Midnight (NIGHT)變得簡單而便捷。跟隨我們的逐步指南,放心開始您的加密貨幣之旅。第一步:創建您的HTX帳戶使用您的 Email、手機號碼在HTX註冊一個免費帳戶。體驗無憂的註冊過程並解鎖所有平台功能。立即註冊第二步:前往買幣頁面,選擇您的支付方式信用卡/金融卡購買:使用您的Visa或Mastercard即時購買Midnight (NIGHT)。餘額購買:使用您HTX帳戶餘額中的資金進行無縫交易。第三方購買:探索諸如Google Pay或Apple Pay等流行支付方式以增加便利性。C2C購買:在HTX平台上直接與其他用戶交易。HTX 場外交易 (OTC) 購買:為大量交易者提供個性化服務和競爭性匯率。第三步:存儲您的Midnight (NIGHT)購買Midnight (NIGHT)後,將其存儲在您的HTX帳戶中。您也可以透過區塊鏈轉帳將其發送到其他地址或者用於交易其他加密貨幣。第四步:交易Midnight (NIGHT)在HTX的現貨市場輕鬆交易Midnight (NIGHT)。前往您的帳戶,選擇交易對,執行交易,並即時監控。HTX為初學者和經驗豐富的交易者提供了友好的用戶體驗。

590 人學過發佈於 2025.12.08更新於 2026.06.02

如何購買NIGHT

相關討論

歡迎來到 HTX 社群。在這裡,您可以了解最新的平台發展動態並獲得專業的市場意見。 以下是用戶對 NIGHT (NIGHT)幣價的意見。

活动图片