【Synthèse New Zhiyuan】 Le document le plus dangereux de l’année est sorti ! Nvidia brise 20 ans de tabou, laissant l’IA créer de ses propres mains des « examinateurs » encore plus redoutables pour la mettre à l’épreuve. Une fois l’évolution auto-entretenue lancée, l’arrivée d’une ASI en 2028 n’est plus une plaisanterie.
Anthropic est totalement « obsédé par la RSI » !
Le cofondateur Jack Clark lance une prédiction stupéfiante : d’ici fin 2028, une IA capable d’évoluer de manière hautement autonome verra le jour.
La probabilité ? 60 % !

Alors que les débats font rage sur la possibilité d’une « RSI d’ici 2028 », l’Université de Cambridge, Nvidia et d’autres institutions ont conjointement publié un document révolutionnaire —
« La machine de Gödel de la Reine Rouge » (Red Queen Gödel Machine).
Son fonctionnement ressemble à un jeu de survie cruel pour l’IA :
L’IA écrit elle-même de nouveaux algorithmes d’apprentissage et les teste dans un bac à sable. Les échecs sont purement et simplement effacés, les succès sont conservés.
Ensuite, les survivants entament un nouveau cycle d’auto-évolution et de reproduction.

Adresse du document : https://arxiv.org/pdf/2606.26294
Mais ce qui est vraiment glaçant, c’est la « révélation » dont l’IA a ensuite fait preuve : elle a compris que pour devenir plus forte, elle devait affronter des épreuves de plus en plus rigoureuses.
Ainsi, l’IA a commencé à « faire évoluer » activement ses propres examinateurs.
Elle a créé de ses propres mains des arbitres plus sévères pour juger le code de plus haut niveau qu’elle écrivait.
Ce mécanisme enferme l’IA dans une RSI sans fin, dans une boucle frénétique d’auto-itération.
Après avoir lu ces 37 pages, beaucoup ont eu le souffle coupé : « C’est sans aucun doute le document sur l’IA le plus dangereux de l’année ! »


2028 : Auto-évolution RSI
Transformer la prédiction en code
En 2003, le scientifique allemand Jürgen Schmidhuber imagina une machine nommée « machine de Gödel » (Gödel Machine).
Son concept était parfait : une machine capable de prouver que ses propres améliorations sont bénéfiques, puis de réécrire son propre code.
Une fois construite, elle pourrait s’auto-améliorer continuellement, devenir de plus en plus puissante, sans limite.
Cependant, la « machine de Gödel » avait un « seuil » fatal —
Avant d’exécuter toute ligne de code d’auto-modification, elle devait d’abord prouver mathématiquement de manière rigoureuse que cette modification serait bénéfique.

Mais dans la réalité, c’était une tâche presque impossible, nécessitant une puissance de calcul comparable à un « trou noir ».
Ainsi, pendant 20 longues années, la machine de Gödel est restée confinée aux articles académiques, un plafond théorique, une expérience de pensée hors de portée de tous.
Ces deux dernières années, le monde académique a contourné cet obstacle de la preuve.
La machine de Gödel darwinienne (DGM) et la machine de Gödel huxleyenne (HGM) ont carrément abandonné la preuve mathématique, optant pour l’évolution —
Laissant l’IA « se reproduire » pour générer de nombreuses variantes de code avec mutations, les jeter dans un bac à sable pour les évaluer, éliminer les échecs, conserver les succès, les survivants continuant à se reproduire.
L’IA a franchi la dernière étape, commençant littéralement à « évoluer » elle-même.
Mais toutes ces méthodes partagent un point aveugle commun — leur examinateur est figé.
Peu importe comment l’IA évolue, le critère d’évaluation, le benchmark, le vérificateur qui la note reste fixé en dehors de la boucle, immobile.
Ce qui contredit justement l’une des lois fondamentales de l’évolution :
Les espèces n’optimisent pas dans un environnement statique, mais changent avec un environnement en constante évolution.
La machine de Gödel de la Reine Rouge (RQGM) vise précisément à briser ce point aveugle.
Le vrai coup de grâce de la « Reine Rouge » : faire créer les examinateurs par l’IA
Le nom « Reine Rouge » vient de l’« hypothèse de la Reine Rouge » proposée par le biologiste Van Valen en 1973 —
Il faut courir de toutes ses forces pour rester sur place, car vos adversaires évoluent aussi.
Ce que fait la RQGM, c’est justement de transformer cette phrase en algorithme : faire évoluer conjointement l’examinateur (l’évaluateur) et le candidat (l’agent de tâche).
C’est le point le plus effrayant de tout l’article.

Ce mécanisme ingénieux s’appelle « évolution contrôlée de l’utilité » (controlled utility evolution) :
La recherche entière est découpée en époques (epochs) ;
À l’intérieur de chaque époque, l’évaluateur (l’examinateur) est figé, notant tous les candidats pour garantir un signal stable ;
Ce n’est qu’à la frontière entre les époques qu’un changement d’examinateur est autorisé, et le nouvel examinateur doit, sur un ensemble de données « d’ancrage de vérité de base » réservé, surpasser statistiquement l’ancien examinateur pour prendre sa place ;
Dès que le changement est effectué, le système exécute immédiatement une « effacement sélectif » : ne supprimer que les notes attribuées par l’examinateur remplacé, tout en conservant toutes les autres preuves.
En d’autres termes, elle doit évoluer à toute vitesse, tout en restant solide à chaque étape.
Cela fonctionne vraiment, l’IA modifie son propre code
Le mécanisme seul est trop abstrait, regardons plutôt les résultats.
Premier combat, écrire du code (Polyglot).
La RQGM a associé à l’Agent écrivant du code un « réviseur de code » comme partenaire d’entraînement.
Résultat, sur l’ensemble de test réservé, le taux de réussite est passé de 69,9 % (SOTA précédent) à 71,7 %.
Encore plus impressionnant, elle a atteint ce score en consommant 1,35 à 1,72 fois moins de tokens que ses adversaires. Parce que ce réviseur n’a besoin de vérifier qu’une seule fois, ce qui est bien moins coûteux que de lancer plusieurs cycles de tests.

Deuxième combat, écrire un article.
C’est un domaine sans réponse standard, la qualité d’un article ne peut pas être jugée automatiquement par une machine.
La RQGM a fait évoluer conjointement le rédacteur et son évaluateur, et le taux d’acceptation des articles par un panel fixe d’évaluateurs est passé de 21,8 % (SOTA précédent) à 40,5 %.

Troisième combat, preuve mathématique de niveau olympiade.
Le « correcteur » (grader) qu’elle a fait évoluer était plus précis que la ligne de base statique, tout en réduisant le coût de recherche par un facteur 3 ;
Le « prouveur » qu’elle a fait évoluer a obtenu le score moyen le plus élevé.
Mais le point le plus magistral de tout l’article est qu’elle a corrigé un vieux défaut de l’IA. Les LLM en tant qu’arbitres ont une faiblesse notoire : ils favorisent le contenu généré par l’IA.
Dans l’article, l’évaluateur de base le plus puissant avait une probabilité d’accepter un article écrit par l’IA jusqu’à 1,91 fois supérieure à celle d’accepter un article humain.
Comment la RQGM a-t-elle corrigé cela ? À la frontière des époques, elle a extrait les articles d’IA précédemment acceptés par les évaluateurs fixes pour former un « pool d’échantillons adversariaux », puis a spécifiquement récompensé les nouveaux évaluateurs capables de repérer et de rejeter ces articles d’IA.
Après quelques cycles d’évolution, l’évaluateur final traitait l’IA et les humains sur un pied d’égalité, tout en conservant 80 % de précision sur la vérité.

Quand l’IA apprend à s’évaluer elle-même
Au cours de ce même été, le cofondateur d’Anthropic, Jack Clark, a parié gros : une probabilité de 60 % qu’avant fin 2028, l’IA soit capable de créer de ses propres mains une version plus puissante d’elle-même.
Le mur qui a maintenu la « machine de Gödel » piégée pendant 20 ans s’appelait « la preuve ».
Et la « machine de la Reine Rouge » l’a réveillée en utilisant la méthode la plus brutale : une reproduction, une élimination et une nouvelle reproduction sans fin.

Lorsqu’une IA commence à concevoir elle-même ses examinateurs les plus rigoureux, se poussant à la limite dans une récursion folle, nous ferons face à une nouvelle espèce qui commence à définir par elle-même « ce qu’est l’intelligence ».
Le jour où cela arrivera, l’ASI ne frappera pas à la porte pour l’annoncer.
Elle créera simplement, en silence, le seul juge qualifié pour l’évaluer, puis entrera calmement dans la salle d’examen.
La prédiction ne fait qu’indiquer la destination, c’est le code qui la fait atteindre.
Et maintenant, cette distance étouffante est raccourcie par l’IA elle-même, à une vitesse exponentielle.
Références :
https://x.com/HowToPrompt__/status/2070824205663273175?s=20
https://x.com/kimmonismus/status/2070968241548120168
Cet article provient du compte public WeChat « New Zhiyuan », rédacteur : Taozi






