Anthropic annonce l'arrivée de l'AGI, pour l'humanité ou pour l'introduction en bourse ?

marsbit發佈於 2026-06-05更新於 2026-06-05

文章摘要

Anthropic publie un article intitulé "When AI builds itself", évoquant le concept de l'auto-amélioration récursive : la capacité d'une IA à participer activement à la conception, à la formation et à l'optimisation de ses propres versions futures. La société souligne que plus de 80% du code intégré dans ses dépôts est désormais écrit par Claude, et que l'IA gère de mieux en mieux des tâches de recherche et d'ingénierie complexes, avec un taux de réussite de 76% sur les problèmes ouverts. Anthropic met en garde contre les risques potentiels d'une accélération incontrôlée, appelant à une réflexion mondiale sur des mécanismes de ralentissement ou de pause du développement de l'IA frontalière pour permettre à la sécurité et à la gouvernance de suivre. Cependant, le timing de cette publication, alors qu'Anthropic se prépare à son introduction en bourse (IPO), laisse également voir une stratégie de communication : démontrer que Claude n'est pas seulement un produit, mais un moteur intégré au processus de R&D de l'entreprise, créant ainsi un "cercle vertueux" (flywheel) pour une innovation plus rapide. Cette position contraste avec l'approche d'OpenAI, qui a récemment abordé le même thème sous l'angle de la gouvernance politique plutôt que de la démonstration technique.

Article | Lettres IA

Anthropic a publié hier soir un long article intitulé "When AI builds itself" (Quand l'IA se construit elle-même), qui ressemble au titre d'un roman de science-fiction d'Asimov. Le sujet est effectivement un concept très science-fictionnel : l'auto-amélioration récursive (recursive self-improvement).

Pour faire simple, par le passé, les chercheurs humains écrivaient le code, faisaient tourner les expériences, entraînaient les modèles, puis rendaient l'IA plus puissante. Mais si l'IA elle-même commence à participer à la conception, l'entraînement, les tests et l'optimisation de ses versions successives, alors la vitesse de progrès de l'IA ne sera plus uniquement pilotée par les humains, elle pourrait commencer à "s'auto-évoluer".

À cet égard, Anthropic lance un appel :

« Nous pensons que le monde tirerait grand bénéfice de pouvoir choisir de ralentir ou de suspendre temporairement le développement de l'IA de pointe, afin de laisser les structures sociales et la recherche sur l'alignement rattraper le progrès technologique. »

Cette phrase ressemble à un avertissement de sécurité, mais placée à l'époque où Anthropic se prépare à son introduction en bourse (IPO), elle peut difficilement ne pas être perçue comme un autre pré-narratif : Claude est tellement efficace qu'il commence même à créer lui-même la prochaine génération de Claude.

Une nouvelle tempête est apparue

Pour illustrer le fait que l'IA participe de plus en plus à la R&D de l'IA elle-même, Anthropic présente de nombreuses données internes.

Par exemple, jusqu'en mai 2026, plus de 80 % du code fusionné dans le référentiel d'Anthropic a été écrit par Claude. Avant la sortie de Claude Code, ce chiffre n'était que d'un seul chiffre.

Au deuxième trimestre 2026, selon les statistiques d'Anthropic, la quantité de code fusionnée quotidiennement par les ingénieurs était déjà environ 8 fois supérieure à celle de 2024.

Plus notable que la quantité de code, c'est que Claude s'attaque à des problèmes d'ingénierie plus ouverts.

Anthropic déclare dans l'article qu'au cours de l'année écoulée, la fréquence à laquelle les employés corrigent Claude, le remettent sur la bonne voie ou reprennent une tâche en cours a constamment diminué. Ce changement ne se produit pas seulement sur des tâches simples, mais aussi sur les tâches ouvertes les plus complexes.

Les tâches ouvertes sont des problèmes sans manuel d'instructions clair. Par exemple, un système plante, une tâche d'entraînement échoue, l'ingénieur ne sait pas non plus au début à quoi ressemble la solution et doit enquêter et juger en même temps.

Ce type de tâche dépendait le plus de l'expérience humaine, et dans ces tâches les plus ouvertes, le taux de réussite de Claude a atteint 76 % en mai 2026, une augmentation de 50 points de pourcentage en six mois.

Non seulement il écrit du code, mais Anthropic utilise également Claude pour la revue de code, vérifiant les bugs, les failles de sécurité et autres défauts. Leur analyse rétrospective révèle que si chaque modification de code avait été automatiquement examinée par Claude par le passé, environ un tiers des bugs ayant entraîné des incidents en ligne sur claude.ai auraient pu être bloqués avant leur mise en production.

Allant plus loin, Claude a commencé à participer au processus de recherche.

Anthropic a un test fixe : donner à Claude un code pour entraîner un petit modèle, et lui demander de trouver un moyen d'exécuter le code plus rapidement sans altérer les résultats. En mai 2025, Claude Opus 4 pouvait obtenir une accélération d'environ 3x ; en avril 2026, Claude Mythos Preview a poussé ce chiffre à environ 52x.

Anthropic mentionne également un cas de recherche ouverte en sécurité de l'IA. Ils ont confié un problème à un agent piloté par Claude : un modèle plus faible peut-il superviser de manière fiable un modèle plus fort ?

Ce processus nécessite de formuler des hypothèses, de les tester, de partager les découvertes avec des agents parallèles et d'itérer.

Deux chercheurs humains ont passé une semaine à combler environ 23 % de l'écart ; tandis que Claude, avec environ 800 heures cumulées et une consommation de calcul d'environ 18 000 dollars, en a comblé 97 %.

Ce résultat a bien sûr ses limites : le problème a été choisi par des humains, les critères d'évaluation ont été définis par des humains, et le résultat n'a pas été entièrement transféré à des modèles à l'échelle de production. Mais il montre tout de même que Claude peut déjà, dans un cadre de recherche défini par l'homme, concevoir ses propres expériences, les exécuter et itérer lui-même.

De plus, lorsque les chercheurs humains "prennent une mauvaise direction", Claude peut également suggérer de meilleures prochaines étapes.

Anthropic a sélectionné 129 sessions de recherche internes de Claude Code, où des chercheurs humains et Claude résolvaient ensemble des problèmes de recherche ouverts. Anthropic a identifié certains nœuds où "les humains se sont par la suite avérés avoir pris des détours", puis a donné le contexte précédant ce nœud à différentes versions de Claude pour voir ce qu'elle suggérerait comme prochaine étape. Ensuite, un autre "Claude judge", connaissant l'issue complète de la session, a évalué : la suggestion du modèle ou le choix humain à l'époque, lequel était meilleur.

Les résultats montrent que, sur ces nœuds où les chercheurs humains se sont par la suite avérés avoir une marge d'amélioration, Claude est de plus en plus capable de proposer de meilleures prochaines étapes.

Par le passé, les progrès des modèles d'IA dépendaient principalement des chercheurs et ingénieurs humains. Les humains décidaient des expériences à mener, écrivaient le code, entraînaient les modèles et faisaient évoluer les fonctionnalités de l'IA.

Désormais, de plus en plus de maillons de cette chaîne sont repris par Claude.

Anthropic présente un tableau de phase très intuitif :

De 2021 à 2023, Anthropic ne différait pas d'une entreprise technologique ordinaire, les humains écrivaient du code et de la documentation sur leurs ordinateurs portables.

De 2023 à 2025, les chatbots ont commencé à entrer dans le flux de travail. Les ingénieurs demandaient au modèle de générer des fragments de code, puis les copiaient dans l'éditeur.

De 2025 à 2026, des agents de programmation sont apparus, Claude a commencé à pouvoir écrire et modifier du code de manière autonome, réalisant parfois même des fichiers entiers de manière indépendante.

Aujourd'hui, les agents peuvent déjà exécuter du code par eux-mêmes, et déléguer des tâches de plusieurs heures à d'autres agents.

Ensuite vient la phase qui préoccupe vraiment Anthropic : la boucle fermée (closed loop).

Si ce jour arrive, les versions successives de Claude pourraient être continuellement améliorées par Claude lui-même — c'est cela, l'auto-amélioration récursive.

Anthropic est très prudent dans son article : nous n'en sommes pas encore là, et l'auto-amélioration récursive n'est pas inévitable. Mais il souligne néanmoins que le chemin vers cette étape commence à devenir visible.

C'est pourquoi Anthropic parle de ralentissement, voire de pause, à la fin de l'article. Il ne s'agit pas que toutes les entreprises d'IA cessent immédiatement leurs activités, mais plutôt que si les risques d'auto-amélioration de l'IA continuent d'augmenter à l'avenir, les laboratoires de pointe auront besoin d'un mécanisme de ralentissement coordonné et vérifiable.

En d'autres termes, la "singularité" approche, et l'humanité doit la contrôler.

Claude, irrésistible

Si l'on ne regarde que la surface, il s'agit d'un document de sécurité très prospectif. Anthropic parle d'auto-amélioration récursive, du fait que l'IA pourrait s'améliorer elle-même de plus en plus vite, et du besoin pour la société humaine de se préparer à des mécanismes de ralentissement et de pause.

Mais placé à l'époque où Anthropic se prépare à son IPO, cet article prend une autre signification.

D'une certaine manière, les récentes actions d'Anthropic ressemblent à celles d'un excellent élève un peu prétentieux — il a vraiment des capacités, mais il fait aussi le malin.

Ce qu'il veut dire, ce n'est pas seulement "nous avons un Claude très puissant", mais un pas plus loin : il veut dire "Claude nous aide à fabriquer un Claude encore plus puissant".

Si Anthropic se contentait de vendre un modèle ou un outil, il lui serait difficile d'échapper complètement aux comparaisons horizontales : Anthropic a Claude, OpenAI a GPT ; Anthropic a Claude Code, OpenAI a Codex ; Anthropic courtise les clients entreprises, OpenAI aussi. La concurrence entre les deux entreprises est très serrée, tout dépend de qui peut raconter la plus grande histoire au marché.

Il est à noter qu'il y a seulement 3 jours, OpenAI écrivait dans un document sur la gouvernance de l'IA de pointe :

« Nous voyons également des signes précoces d'auto-amélioration récursive dans les systèmes actuels : le développement de l'IA lui-même est accéléré par l'IA.

Cela intensifiera la pression concurrentielle entre développeurs et nations, et posera des défis de gouvernance que les institutions existantes ne pourront relever. »

Trois jours plus tard, Anthropic déclare : le chemin de Claude vers l'auto-amélioration récursive commence à devenir visible.

Si Claude se développe vraiment comme il l'espère, ce n'est plus une simple narration produit, cela deviendra une roue de développement (flywheel).

Claude écrit du code, exécute des expériences, optimise les flux d'entraînement, réduit en retour les incidents dans ses propres produits... Une fois que ce système tourne, Claude n'est plus seulement un produit d'Anthropic, mais aussi un outil de production important pour Anthropic.

Les utilisateurs voient le produit Claude, les clients entreprises achètent les capacités de Claude, mais ce qu'Anthropic veut vraiment que le marché financier remarque, c'est que Claude est déjà intégré au processus sous-jacent de développement des modèles de pointe, il a été placé dans la salle des machines d'Anthropic.

Les marchés financiers adorent les histoires de roues, comme des cornes d'abondance générant des richesses sans fin : un Claude plus puissant permet aux ingénieurs d'Anthropic de fusionner plus de code, plus de code accélère l'itération des produits et de l'infrastructure, une itération plus rapide permet aux chercheurs d'exécuter plus d'expériences, plus d'expériences aident à leur tour la prochaine génération de Claude à devenir plus puissante. Une fois la prochaine génération de Claude plus puissante, elle continue d'accélérer la R&D d'Anthropic.

La vitesse d'itération de Claude soutient également cette roue. En se basant sur les dates de publication, de 2023 à début 2025, les mises à jour majeures des modèles Claude se faisaient principalement tous les trois ou quatre mois. Mais après l'arrivée de Claude 4, les mises à jour des modèles d'Anthropic sont clairement devenues plus rapprochées.

Claude 4 est sorti en mai 2025, Opus 4.1 en août, Sonnet 4.5 en septembre, Haiku 4.5 en octobre, Opus 4.5 en novembre.

En 2026, Opus 4.6 est sorti le 5 février, Sonnet 4.6 le 17 février, Opus 4.7 le 15 avril, Opus 4.8 le 28 mai. Il n'y a que 42 jours entre Opus 4.7 et Opus 4.8.

Anthropic, en surface, dit "cela pourrait être dangereux, nous devons préparer les freins à l'avance", mais il suggère également : "nous avons vu ce qui se passe lorsque l'accélérateur est enfoncé".

C'est là toute la subtilité de la narration pour l'IPO. D'un côté, il présente les risques comme très sérieux, de l'autre, il rehausse aussi sa position technologique.

Toutes les entreprises d'IA n'ont pas le droit de parler d'auto-amélioration récursive, vous devez d'abord convaincre le monde extérieur que votre IA est déjà intégrée dans le processus de développement de l'IA, avant d'avoir le droit de dire que cela pourrait nécessiter une coordination mondiale.

OpenAI : Comment peut-on faire ça ?

Comme mentionné précédemment, juste avant qu'Anthropic ne publie cet article, OpenAI venait de placer l'auto-amélioration récursive sur la table.

Mais les approches des deux entreprises sont très différentes.

Le document d'OpenAI "Democratic Governance of Frontier AI" est un plan politique adressé à Washington. Il ne s'intéresse pas à "comment le modèle devient plus fort", mais à la manière de contraindre l'IA de pointe si elle continue de progresser à toute vitesse.

La plupart du contenu de ce rapport ne convient pas pour être détaillé ici, une seule phrase est clé : OpenAI déclare que des signes précoces d'auto-amélioration récursive sont déjà visibles dans les systèmes actuels.

Cette phrase et cet article d'Anthropic pointent en fait dans la même direction.

Sauf qu'OpenAI parle de systèmes institutionnels, et Anthropic parle de lui-même.

OpenAI veut dire : l'IA progresse trop vite, les structures de gouvernance existantes pourraient ne pas suivre, donc un nouvel ensemble de règles est nécessaire.

Tandis qu'Anthropic expose directement ce système, disant au marché : Claude est déjà dans notre processus de R&D, donc nous voyons la voie de l'auto-accélération de l'IA.

C'est un coup très habile, on a l'impression qu'OpenAI commence sûrement à ronchonner en interne — c'est du plagiat d'idées ! C'est nous qui sommes arrivés les premiers !

Je plaisante, mais OpenAI doit vraiment redoubler d'efforts, et vite sortir GPT 5.6.

你可能也喜歡

Kalshi、MTS 与 a16z 的野望

本文探讨了预测市场在2025年成为投资热点的现象，并着重分析了其精神内核与风险投资机构a16z的新媒体战略之间的关联。文章梳理了预测市场理念的演变：从哈耶克关于市场作为信息协调机制的理论，到Robin Hanson设计的经济激励机制，再到“Futarchy”治理乌托邦的设想。然而，作者指出，这些传统讨论在a16z关注该领域后才被赋予新的意义。 a16z于2025年投资了预测市场平台Kalshi，并将其估值推高至220亿美元。其核心理念在于，预测市场为用户提供了对抗后现代疏离感的“在场感”。通过真金白银的下注，用户从被动观察者转变为能介入和影响事件的“超级观察者”，从而获得对事件真实性与重要性的解释权。这使其成为a16z构建新媒体帝国的关键拼图。文章以媒体公司MTS为例，说明a16z所倡导的“新媒体”是一种全频段、高强度的信息发布模式，旨在“接管时间线”。而Kalshi的独特价值在于，其市场交易数据凭借真实资金流动，具备了看似客观的权威性和强大的现实扭曲力场，能够影响公众认知与判断。这种能力正是其获得高估值的深层原因。

marsbit1 小時前

marsbit1 小時前

突发：OpenAI芯片元老加入Anthropic

OpenAI自研芯片团队早期核心成员Clive Chan宣布离职，并已正式加入竞争对手Anthropic。Clive Chan是OpenAI硬件团队的“002号员工”，全程参与了公司自研芯片项目从组建到推进的过程。他在声明中高度评价了OpenAI芯片团队的人才实力，但表示自己渴望“重新攀登一座新山”，因此选择加入Anthropic，并对Anthropic团队的人才、价值观和野心印象深刻。关于OpenAI的自研芯片进展，Clive Chan未透露更多细节，但提及了OpenAI与博通在2025年10月公布的合作计划。根据该计划，双方将共同建设总规模达10GW的AI加速器系统，首批机架预计在2026年下半年开始交付。 Clive Chan毕业于滑铁卢大学，曾先后在谷歌、SpaceX、特斯拉等公司从事AI基础设施相关工作，于2024年1月加入OpenAI。此次跳槽后，Anthropic内部员工表示了欢迎，而网友则调侃这像“离开皇马加盟巴萨”。近期，OpenAI与Anthropic之间人才流动频繁，此前OpenAI联合创始成员Andrej Karpathy也已加盟Anthropic。随着Anthropic近期完成巨额融资，估值逼近万亿美元，其与OpenAI在人才和资源上的竞争将持续受到关注。

marsbit1 小時前

marsbit1 小時前

a16z 全球化转向：VC 正在成为美国科技联盟的「推手」

a16z（Andreessen Horowitz）发布公告，宣布其全球化战略发生重要转向：不再局限于海外寻找项目和投资，而是将自身定位融入更大的技术竞争与国际盟友合作框架中。面对AI、机器人、国防科技等成为国家竞争焦点的领域，创业公司面临复杂的国际监管、产业政策和地缘关系。a16z通过设立东京办公室、任命Anne Neuberger负责全球事务、将投资者关系团队升级为全球合作伙伴团队等举措，主动应对这一变化。公告明确将a16z的全球网络与“美国及其盟友”的技术领导力绑定，标志着技术创新已进入国家安全和国际竞争语境。未来，风投的角色不仅是提供资本和增长建议，更要帮助创始人对接关键市场、政府机构和战略资源，理解多国政策环境。a16z旨在成为连接创业公司、国家能力、产业资源和全球资本的组织者，支持盟友国家在关键创新领域的合作，并助力投资组合公司进行全球扩张。这一布局体现了硅谷资本对全球科技竞争新格局的主动站位。

marsbit1 小時前

marsbit1 小時前

解读Agent商业、支付与基础设施的真相

作者基于一年来为Agent经济构建基础设施的经验，指出当前Agent商业尚未形成真实、规模化的市场需求，初创公司面临结构性挑战。文章分析了四个关键场景： 1. **Agent对商户**：目前电商体验中，聊天界面在视觉比价购物上逊于传统界面，商户接入多出于防御性“优化”心态。对话式商业在如外卖等高頻、低决策场景有潜力，但受限于平台开放性和成本。 2. **Agent对API**：开发者现有支付方式（如预付）已能处理低频、小额的API调用成本问题。真正的机会在于服务长尾、小众的供应商市场，但规模有限。 3. **Agent对Agent**：这是长期的愿景，涉及机器间的自动交易与结算，需求真实但当前市场几乎为零，需要专用的基础设施。 4. **Agent对金融**：这是唯一存在现成需求和付费客户的领域。将AI嵌入金融工作流是自然演进，但竞争激烈，老牌机构优势明显。文章认为，行业巨头因资金充足和战略防御而持续投入，但对初创公司而言，真正的机会并非单纯构建支付层。支付只是更宏大问题——**Agent与人类的协同工作、验证与结算**——的一部分。未来，解决协同问题的公司将主导市场，而非支付服务商。作者团队已转向一个存在真实需求、快速增长且未被充分服务的领域。

marsbit1 小時前

marsbit1 小時前

Kalshi、MTS 与 a16z 的野望

本文探讨了预测市场在2025年成为投资、加密和媒体领域共同关注焦点的现象，并着重分析了其精神内核的演变及其与风投机构a16z所倡导的“新媒体”愿景的契合。文章首先回顾了预测市场的思想渊源：从哈耶克关于市场作为分散知识协调机制的观点，到罗宾·汉森设计对数市场评分规则（LMSR）以激励信息真实披露，乃至衍生出的“未来统治”（Futarchy）治理乌托邦构想。然而，作者指出，a16z在2024-2025年投资估值飙升的预测市场平台Kalshi，为此领域注入了新的精神内涵——“在场感”。在人们与现实世界日益疏离的后现代语境下，预测市场提供了一种通过真金白银下注来介入和“预测”未来的方式，使用户从被动观察者转变为主动的“超级观察者”，从而对抗不确定性与无力感。当足够多人使用并依赖这种媒介时，市场本身将对事件的真实性与重要性获得解释权，这正是a16z构建新媒体帝国的关键拼图。最后，文章以媒体公司MTS为例，说明a16z的“新媒体”是一种全频段、高烈度的信息工程，旨在“接管时间线”。而Kalshi的核心价值在于，它通过真实的交易数据构建了一种强大的“现实扭曲力场”，其显示的市场概率能深刻影响公众认知与判断，这种赋予私营公司的社会影响力是其获得高估值的根本原因。

链捕手1 小時前

交易

現貨

合約

Anthropic annonce l'arrivée de l'AGI, pour l'humanité ou pour l'introduction en bourse ?

文章摘要

Une nouvelle tempête est apparue

Claude, irrésistible

OpenAI : Comment peut-on faire ça ?

相關問答

你可能也喜歡

Kalshi、MTS 与 a16z 的野望

突发：OpenAI芯片元老加入Anthropic

a16z 全球化转向：VC 正在成为美国科技联盟的「推手」

解读Agent商业、支付与基础设施的真相

Kalshi、MTS 与 a16z 的野望

交易

熱門文章

如何購買NIGHT

相關討論

熱門問答

熱門分類

熱門標籤