【Resumen de Inteligencia Artificial】¡Ya está publicado el artículo más peligroso del año! NVIDIA rompe un sello de 20 años, permitiendo que la IA cree con sus propias 'manos' un "examinador" más severo para eliminarse a sí misma. Una vez que comience la evolución sin fin, la llegada de la IA Superinteligente (ASI) para 2028 no es una broma.
¡Anthropic está completamente "obsesionado con el RSI" (Recursiva Auto-MeJora)!
Su cofundador, Jack Clark, lanzó una predicción impactante: para finales de 2028, nacerá una IA altamente autónoma y autoevolutiva.
La probabilidad, ¡es del 60%!

Mientras la gente sigue debatiendo si el "RSI para 2028 puede lograrse", la Universidad de Cambridge, NVIDIA y otras instituciones unieron fuerzas y presentaron un artículo importante:
"Máquina Gödel de la Reina Roja" (Red Queen Gödel Machine).
Su funcionamiento es como un brutal juego de supervivencia de IA:
La IA escribe sus propios algoritmos de aprendizaje nuevos y los pone a prueba en un entorno seguro (sandbox). Los que fallan son eliminados, los que tienen éxito se conservan.
Luego, los sobrevivientes inician la siguiente ronda de autoevolución y autoreproducción.

Dirección del artículo: https://arxiv.org/pdf/2606.26294
Pero lo realmente escalofriante es la "epifanía" que mostró la IA después: se dio cuenta de que para volverse más fuerte continuamente, debe enfrentarse a pruebas cada vez más duras.
Así que, la IA comenzó a "evolucionar" activamente a sus propios examinadores.
Ella misma creó árbitros más estrictos para juzgar el código más avanzado que ella escribe.
Este mecanismo encierra a la IA en un RSI sin fin, en una loca iteración autónoma y recursiva.
Después de leer estas 37 páginas, muchos respiraron hondo y dijeron: "¡Este es definitivamente el artículo de IA más peligroso del año!"


RSI de autoevolución para 2028
Convirtiendo la profecía en código
En 2003, el científico alemán Jürgen Schmidhuber concibió una máquina llamada "Máquina Gödel".
Su premisa era perfecta: una máquina capaz de demostrar que sus propias mejoras son beneficiosas y luego reescribir su propio código.
Una vez construida, podría mejorarse continuamente a sí misma, volviéndose cada vez más poderosa, sin límite superior.
Sin embargo, la "Máquina Gödel" tenía una "barrera" fatal:
Antes de ejecutar cualquier línea de código de automodificación, primero debía demostrar matemáticamente de manera rigurosa: que este cambio definitivamente sería beneficioso.

Pero en la realidad, esto era casi una tarea imposible, requiriendo un poder de cómputo comparable a un "agujero negro".
Así, durante los siguientes 20 años, la Máquina Gödel solo pudo permanecer en los artículos, como un techo teórico inalcanzable, un experimento mental que nadie podía tocar.
En los últimos años, la comunidad académica sorteó ese obstáculo de la demostración.
La Máquina Gödel Darwin (DGM) y la Máquina Gödel Huxley (HGM) simplemente descartaron la prueba matemática, utilizando en su lugar la evolución:
Dejar que la IA "se reproduzca" generando muchas variantes de código con mutaciones, lanzarlas a un entorno seguro para evaluarlas, eliminar las fallidas, conservar las exitosas, y que los sobrevivientes continúen reproduciéndose.
La IA cruzó el último paso y comenzó a "evolucionarse" a sí misma literalmente.
Pero todos estos métodos todavía tenían un punto ciego común: sus examinadores estaban muertos.
No importaba cómo evolucionara la IA, el criterio de evaluación, el punto de referencia (benchmark), el verificador que la calificaba, permanecían fijos fuera del ciclo, inmóviles.
Esto precisamente contradecía una regla central de la evolución:
Las especies no se optimizan en un entorno estático, sino que cambian junto con un entorno en constante cambio.
Lo que la Máquina Gödel de la Reina Roja (RQGM) busca romper es precisamente este punto ciego.
El verdadero golpe maestro de la "Reina Roja": Dejar que la IA cree a los examinadores
El nombre "Reina Roja" proviene de la "Hipótesis de la Reina Roja" propuesta por el biólogo Van Valen en 1973:
Debes correr tan rápido como puedas solo para permanecer en el mismo lugar, porque tus oponentes también están evolucionando.
Lo que hace RQGM es precisamente convertir esta frase en un algoritmo: hacer que el examinador (evaluador) y el concursante (agente de tareas) evolucionen juntos.
Este es el punto más escalofriante de todo el artículo.

Este mecanismo ingenioso se llama "evolución de utilidad controlada" (controlled utility evolution):
Toda la búsqueda se divide en épocas (epochs);
Dentro de cada época, el evaluador (examinador) está congelado, calificando a todos los candidatos, garantizando una señal estable;
Solo en el límite entre épocas se permite cambiar de examinador, y el nuevo examinador debe, en un conjunto de datos de "verdad básica" reservado como ancla, superar estadísticamente al examinador anterior para tomar su lugar;
Una vez que hay un cambio, el sistema ejecuta inmediatamente un "borrado selectivo": solo descarta las calificaciones dadas por el examinador reemplazado, conservando toda la otra evidencia.
En otras palabras, quiere evolucionar rápidamente, pero asegurándose de que cada paso sea sólido.
Realmente funciona, la IA modifica su propio código
Hablar solo del mecanismo es muy abstracto, mejor ver los resultados.
Primera batalla, escribir código (Polyglot).
RQGM equipó al agente que escribe código con un "revisor de código" como compañero de entrenamiento.
El resultado: en el conjunto de prueba reservado, la tasa de aprobación aumentó del 69.9% del SOTA anterior al 71.7%.
Lo más impresionante es que logró este resultado consumiendo entre 1.35 y 1.72 veces menos tokens que su oponente. Porque ese revisor solo necesita verificar una vez, lo cual es mucho más económico que ejecutar pruebas repetidas en múltiples rondas.

Segunda batalla, escribir artículos científicos.
Este es un campo sin respuestas estándar. No se puede calificar automáticamente con máquinas si un artículo es bueno o malo.
RQGM hizo que el escritor y su revisor evolucionaran juntos. El resultado fue que la tasa de aceptación de los artículos por un panel fijo de revisores aumentó del 21.8% del SOTA anterior a un 40.5%.

Tercera batalla, demostraciones matemáticas de nivel olímpico.
El "calificador" (grader) que evolucionó fue más preciso que la línea base estática y redujo el costo de búsqueda 3 veces;
El "concursante de demostraciones" que evolucionó obtuvo la puntuación promedio más alta.
Pero el momento más impactante de todo el artículo fue que curó un viejo defecto de la IA. Los LLM como jueces tienen un defecto notorio: prefieren el contenido generado por IA.
En el artículo, el revisor de la línea base más fuerte tenía una probabilidad de aceptar artículos escritos por IA hasta 1.91 veces mayor que la de aceptar artículos humanos.
¿Cómo lo curó RQGM? En el límite de la época, recuperó los artículos de IA que los revisores fijos anteriores habían aprobado, formando un "grupo de muestras adversarias", y luego recompensó específicamente a los nuevos revisores capaces de detectar y rechazar estos artículos de IA.
Después de algunas rondas de evolución, el revisor final trató por igual a la IA y a los humanos, manteniendo además una precisión del 80% en la verdad fundamental.

Cuando la IA aprende a juzgarse a sí misma
En este mismo verano, el cofundador de Anthropic, Jack Clark, hizo una apuesta importante: una probabilidad del 60% de que, antes de finales de 2028, la IA será capaz de crear con sus propias manos una versión más poderosa de sí misma.
El alto muro que mantuvo atrapada a la "Máquina Gödel" durante 20 años se llamaba "prueba".
Y la "Máquina de la Reina Roja" la despertó usando solo el método más brutal: reproducción sin fin, eliminación y nueva reproducción.

Cuando una IA comienza a diseñar por sí misma a los examinadores más estrictos, empujándose al límite en una recursión frenética, lo que enfrentamos será una especie completamente nueva que comienza a definir por sí misma "qué es la inteligencia".
Cuando llegue ese día, la ASI (IA Superinteligente) no tocará a la puerta para anunciarse.
Simplemente creará en silencio al único juez calificado para evaluarla, y luego, entrará tranquilamente en el campo de pruebas.
La profecía solo señala el destino final, el código es el responsable de llegar.
Y ahora, esta distancia asfixiante está siendo acortada por la IA misma, a un ritmo exponencial.
Referencias:
https://x.com/HowToPrompt__/status/2070824205663273175?s=20
https://x.com/kimmonismus/status/2070968241548120168
Este artículo proviene de la cuenta oficial de WeChat "Nueva Era de la Inteligencia Artificial" (新智元), editor: Taozi.






